scikit-learn

标签：scikit-learn

scikit-learn中的目标转换和特征选择 - python

时间：2020-9-3

我在scikit-learn中使用RFECV进行功能选择。我想将简单线性模型（X,y）的结果与对数转换模型（使用X, log(y)）的结果进行比较简单模型：RFECV和cross_val_score提供相同的结果（我们需要比较所有特征交叉验证的平均得分与所有功能的RFECV得分：0.66 = 0.66，没问题，结果是可靠）日志模型：问题：RFECV似乎没 […]

标签：cross-validation, feature-selection, python, rfe, scikit-learn
带有来自pandas数据帧的输入的sklearn分类_报告将产生:“TypeError:在字符串格式化期间并非所有参数都已转换” - python

时间：2020-8-31

我正在尝试将sklearn.metrics.classification_report运行在Pandas数据框中。数据帧df_joined看起来像这样，有100行: Timestamp Label Pred 2016-10-05 29.75 30.781430 2016-10-06 30.35 31.379146 2016-10-07 31.59 31.17 […]

标签：pandas, python, python-2.7, scikit-learn
scikit-学习LogisticRegression.predict_proba的返回值 - python

时间：2020-8-29

LogisticRegression.predict_proba函数究竟返回什么？在我的示例中，我得到这样的结果: [[ 4.65761066e-03 9.95342389e-01] [ 9.75851270e-01 2.41487300e-02] [ 9.99983374e-01 1.66258341e-05]] 根据其他计算，使用S形函数，我知道第二列 […]

标签：logistic-regression, machine-learning, probability, python, scikit-learn
如何使用Python timeit模块捕获返回值？ - python

时间：2020-8-29

我在for循环中使用sklearn运行了几种机器学习算法，并希望了解每种算法花费的时间。问题是我还需要返回一个值，并且DONT希望多次运行它，因为每种算法都花很长时间。有没有一种方法可以使用python的timeit模块或具有类似功能的类似模块捕获返回值'clf'... def RandomForest(train_input, train_output): […]

标签：python, python-2.7, scikit-learn, timeit
如何从scikit-learn解释决策树 - python

时间：2020-8-27

从scikit-learn了解决策树的结果时，我遇到两个问题。例如，这是我的决策树之一: 我的问题是我如何使用树？第一个问题是:如果样本满足条件，则转到 LEFT 分支(如果存在)，否则转到 RIGHT 。就我而言，如果样本的X [7]> 63521.3984。然后样品将进入绿色框。正确？第二个问题是:当样本到达叶节点时，我怎么知道它属于哪个类别？ […]

标签：decision-tree, numpy, python, scikit-learn, scipy
pip:从远程git存储库中提取更新 - python

时间：2020-8-27

我几周前从GitHub安装了scikit-learn: pip install git+git://github.com/scikit-learn/scikit-learn@master 我去了GitHub，从那以后对master分支进行了几处更改。如何更新scikit-learn的本地安装？我尝试了pip install scikit-learn -- […]

标签：git, github, pip, python, scikit-learn
将字典传递给scikit学习估算器 - python

时间：2020-8-26

我试图将模型参数作为字典传递给Scikit-learn估计器，但没有运气。它似乎只是将我的字典嵌套到其中一个参数中。例如: params = { 'copy_X': True, 'fit_intercept': False, 'normalize': True } lr = LinearRegres […]

标签：dictionary, python, scikit-learn
如何绘制scikit学习分类报告？ - python

时间：2020-8-26

是否可以使用matplotlib scikit-learn分类报告进行绘图？假设我这样打印分类报告: print '\n*Classification Report:\n', classification_report(y_test, predictions) confusion_matrix_graph = confusion_matr […]

标签：matplotlib, numpy, python, scikit-learn
想知道pd.factorize，pd.get_dummies，sklearn.preprocessing.LableEncoder和OneHotEncoder之间的区别。 - python

时间：2020-8-25

Improve this question 这四个功能似乎真的与我相似。在某些情况下，其中一些可能会给出相同的结果，而有些则不会。任何帮助将不胜感激! 现在我知道了，并且我认为factorize和LabelEncoder在内部是相同的，并且在结果方面没有太大的区别。我不确定它们是否会在大量数据上占用相似的时间。get_dummies和OneHotEncode […]

标签：encoding, machine-learning, pandas, python, scikit-learn
向scikit-learn CountVectorizer停止列表添加单词 - python

时间：2020-8-22

Scikit-learn的CountVectorizer类使您可以将字符串“english”传递给参数stop_words。我想在此预定义列表中添加一些内容。谁能告诉我该怎么做？参考方案根据sklearn.feature_extraction.text的source code，通过frozenset公开了stop_words的完整列表(实际上是 ENGL […]

标签：python, scikit-learn, stop-words