設定 Spark 上下文

Created: November-22, 2018

在 R 中設定 Spark 上下文

要開始使用 Sparks 分散式資料幀，必須將 R 程式與現有 Spark Cluster 連線。

library(SparkR)
sc <- sparkR.init() # connection to Spark context
sqlContext <- sparkRSQL.init(sc) # connection to SQL context

以下是如何將 IDE 連線到 Spark 群集的資訊。

有一個帶有安裝說明的 Apache Spark 介紹主題。基本上，你可以通過 java 本地使用 Spark Cluster（請參閱說明）或使用（非免費）雲應用程式（例如 Microsoft Azure [topic site] ， IBM ）。