创建接收 python RDD 的 Scala 函数

创建一个接收 python RDD 的 Scala 函数很简单。你需要构建的是一个获得 JavaRDD [Any]的函数

import org.apache.spark.api.java.JavaRDD

def doSomethingByPythonRDD(rdd :JavaRDD[Any]) = {
    //do something
    rdd.map { x => ??? }
}