加入两个用 textFile() 读取的文件
加入 Spark:
-
阅读 textFile 1
val txt1=sc.textFile(path="/path/to/input/file1")
例如:
A B 1 2 3 4
-
阅读 textFile 2
val txt2=sc.textFile(path="/path/to/input/file2")
例如:
A C 1 5 3 6
-
加入并打印结果。
txt1.join(txt2).foreach(println)
例如:
A B C 1 2 5 3 4 6
上面的连接基于第一列。