加入两个用 textFile() 读取的文件

加入 Spark:

  • 阅读 textFile 1

     placeholderCopyval txt1=sc.textFile(path="/path/to/input/file1")

    例如:

     placeholderCopyA B
      1 2
      3 4
  • 阅读 textFile 2

     placeholderCopyval txt2=sc.textFile(path="/path/to/input/file2")

    例如:

     placeholderCopyA C
      1 5
      3 6
  • 加入并打印结果。

     placeholderCopytxt1.join(txt2).foreach(println)

    例如:

     placeholderCopyA B C
      1 2 5
      3 4 6

上面的连接基于第一列。