标签:scikit-learn
-
scikit-learn中的目标转换和特征选择 - python
我在scikit-learn中使用RFECV进行功能选择。我想将简单线性模型(X,y)的结果与对数转换模型(使用X, log(y))的结果进行比较 简单模型:RFECV和cross_val_score提供相同的结果(我们需要比较所有特征交叉验证的平均得分与所有功能的RFECV得分:0.66 = 0.66,没问题,结果是可靠) 日志模型:问题:RFECV似乎没 […]
-
带有来自pandas数据帧的输入的sklearn分类_报告将产生:“TypeError:在字符串格式化期间并非所有参数都已转换” - python
我正在尝试将sklearn.metrics.classification_report运行在Pandas数据框中。数据帧df_joined看起来像这样,有100行: Timestamp Label Pred 2016-10-05 29.75 30.781430 2016-10-06 30.35 31.379146 2016-10-07 31.59 31.17 […]
-
scikit-学习LogisticRegression.predict_proba的返回值 - python
LogisticRegression.predict_proba函数究竟返回什么? 在我的示例中,我得到这样的结果: [[ 4.65761066e-03 9.95342389e-01] [ 9.75851270e-01 2.41487300e-02] [ 9.99983374e-01 1.66258341e-05]] 根据其他计算,使用S形函数,我知道第二列 […]
-
如何使用Python timeit模块捕获返回值? - python
我在for循环中使用sklearn运行了几种机器学习算法,并希望了解每种算法花费的时间。问题是我还需要返回一个值,并且DONT希望多次运行它,因为每种算法都花很长时间。有没有一种方法可以使用python的timeit模块或具有类似功能的类似模块捕获返回值'clf'... def RandomForest(train_input, train_output): […]
-
如何从scikit-learn解释决策树 - python
从scikit-learn了解决策树的结果时,我遇到两个问题。例如,这是我的决策树之一: 我的问题是我如何使用树? 第一个问题是:如果样本满足条件,则转到 LEFT 分支(如果存在),否则转到 RIGHT 。就我而言,如果样本的X [7]> 63521.3984。然后样品将进入绿色框。正确? 第二个问题是:当样本到达叶节点时,我怎么知道它属于哪个类别? […]
-
pip:从远程git存储库中提取更新 - python
我几周前从GitHub安装了scikit-learn: pip install git+git://github.com/scikit-learn/scikit-learn@master 我去了GitHub,从那以后对master分支进行了几处更改。 如何更新scikit-learn的本地安装? 我尝试了pip install scikit-learn -- […]
-
将字典传递给scikit学习估算器 - python
我试图将模型参数作为字典传递给Scikit-learn估计器,但没有运气。它似乎只是将我的字典嵌套到其中一个参数中。例如: params = { 'copy_X': True, 'fit_intercept': False, 'normalize': True } lr = LinearRegres […]
-
如何绘制scikit学习分类报告? - python
是否可以使用matplotlib scikit-learn分类报告进行绘图?假设我这样打印分类报告: print '\n*Classification Report:\n', classification_report(y_test, predictions) confusion_matrix_graph = confusion_matr […]
-
想知道pd.factorize,pd.get_dummies,sklearn.preprocessing.LableEncoder和OneHotEncoder之间的区别。 - python
Improve this question 这四个功能似乎真的与我相似。在某些情况下,其中一些可能会给出相同的结果,而有些则不会。任何帮助将不胜感激! 现在我知道了,并且我认为factorize和LabelEncoder在内部是相同的,并且在结果方面没有太大的区别。我不确定它们是否会在大量数据上占用相似的时间。get_dummies和OneHotEncode […]
-
向scikit-learn CountVectorizer停止列表添加单词 - python
Scikit-learn的CountVectorizer类使您可以将字符串“english”传递给参数stop_words。我想在此预定义列表中添加一些内容。谁能告诉我该怎么做? 参考方案 根据sklearn.feature_extraction.text的source code,通过frozenset公开了stop_words的完整列表(实际上是 ENGL […]