标签:random-forest
-
使用r2PMML将10Mb Rdata文件转换为PMML会产生350Mb PMML文件。如何缩小尺寸? - python
我有一个RData文件,它是一个随机森林模型,大小为10Mb。我想将其转换为PMML,但是当使用R2PMML库时,这将创建一个350Mb的PMML文件,该文件远远不能使用。知道如何缩小尺寸吗?然后,我希望能够在python生产环境中使用PMML,因此需要将文件大大减小。 参考方案 通过指定compact = TRUE转换选项,可以重新排列决策树数据结构: l […]
-
使用超网格搜索和10倍CV调整参数后,随机森林模型的AUC较低 - python
我未调整超参数而收到的AUC值较高。我使用了相同的培训数据,可能会在此处丢失某些内容或一些有效的解释。 数据是使用50个维度的推文的预训练GLoVE向量计算出的推文单词嵌入的平均值 无需调整: RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini' […]