加入两个用 textFile() 读取的文件

加入 Spark:

  • 阅读 textFile 1

    val txt1=sc.textFile(path="/path/to/input/file1") 
    

    例如:

      A B
      1 2
      3 4
    
  • 阅读 textFile 2

    val txt2=sc.textFile(path="/path/to/input/file2") 
    

    例如:

      A C
      1 5
      3 6
    
  • 加入并打印结果。

    txt1.join(txt2).foreach(println)
    

    例如:

      A B C
      1 2 5
      3 4 6
    

上面的连接基于第一列。