标签:apache-spark-mllib
-
apache spark MLLib:如何为字符串特征建立标记点? - java
我正在尝试使用Spark的MLLib构建NaiveBayes分类器,该分类器将一组文档作为输入。 我想将一些东西作为特征(即作者,显式标签,隐式关键字,类别),但查看the documentation似乎LabeledPoint仅包含双精度字,即看起来像LabeledPoint[Double, List[Pair[Double,Double]]。 相反,我从 […]