设置 Spark 上下文

在 R 中设置 Spark 上下文

要开始使用 Sparks 分布式数据帧,必须将 R 程序与现有 Spark Cluster 连接。

library(SparkR)
sc <- sparkR.init() # connection to Spark context
sqlContext <- sparkRSQL.init(sc) # connection to SQL context

以下是如何将 IDE 连接到 Spark 群集的信息。

获取 Spark Cluster

有一个带有安装说明的 Apache Spark 介绍主题 。基本上,你可以通过 java 本地使用 Spark Cluster( 请参阅说明 )或使用(非免费)云应用程序(例如 Microsoft Azure [topic site]IBM )。