加入兩個用 textFile() 讀取的檔案
加入 Spark:
-
閱讀 textFile 1
val txt1=sc.textFile(path="/path/to/input/file1")
例如:
A B 1 2 3 4
-
閱讀 textFile 2
val txt2=sc.textFile(path="/path/to/input/file2")
例如:
A C 1 5 3 6
-
加入並列印結果。
txt1.join(txt2).foreach(println)
例如:
A B C 1 2 5 3 4 6
上面的連線基於第一列。