设置 Spark 上下文
在 R 中设置 Spark 上下文
要开始使用 Sparks 分布式数据帧,必须将 R 程序与现有 Spark Cluster 连接。
library(SparkR)
sc <- sparkR.init() # connection to Spark context
sqlContext <- sparkRSQL.init(sc) # connection to SQL context
以下是如何将 IDE 连接到 Spark 群集的信息。
获取 Spark Cluster
有一个带有安装说明的 Apache Spark 介绍主题 。基本上,你可以通过 java 本地使用 Spark Cluster( 请参阅说明 )或使用(非免费)云应用程序(例如 Microsoft Azure [topic site] , IBM )。