scikit-学习LogisticRegression.predict_proba的返回值 - python

LogisticRegression.predict_proba函数究竟返回什么?

在我的示例中,我得到这样的结果:

[[  4.65761066e-03   9.95342389e-01]
 [  9.75851270e-01   2.41487300e-02]
 [  9.99983374e-01   1.66258341e-05]]

根据其他计算,使用S形函数,我知道第二列是概率。 documentation说,第一列是n_samples,但是不能,因为我的示例是评论,是文本而不是数字。该文档还说,第二列是n_classes。那肯定不是,因为我只有两个类(即+1-1),并且该函数应该用于计算实际上属于某个类的样本的概率,而不是有关类本身的概率。

第一列到底是什么?为什么在那?

参考方案

4.65761066e-03 + 9.95342389e-01 = 1
9.75851270e-01 + 2.41487300e-02 = 1
9.99983374e-01 + 1.66258341e-05 = 1

第一列是条目具有-1标签的概率,第二列是条目具有+1标签的概率。请注意,类的顺序与self.classes_中的顺序相同。
如果您只想获取肯定标签的预测概率,则可以使用logistic_model.predict_proba(data)[:,1]。这将产生[9.95342389e-01, 2.41487300e-02, 1.66258341e-05]结果。

Python-scikit_learn中的克里金(高斯过程) - python

我正在考虑使用此方法对我拥有的3D点进行插值。作为输入,我在一个区域中的各个高度具有大气浓度的气体。我所获得的数据显示为垂直高度每隔几英尺延伸几十英尺,但水平分开数百英尺的值(因此,“列”紧密堆积)。假定在任何给定时间点,值在垂直方向上的变化比在水平方向上的变化大得多。我想在考虑到这一假设的情况下执行3D克里金法(作为我可以调整的参数,或者是经过统计定义的参…

scikit-learn中继承的意外结果 - python

尝试创建类KNeighborsClassifier的简单修改时,出现意外结果:import numpy as np from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import …

没有正则化的sklearn LogisticRegression - python

sklearn中的逻辑回归类带有L1和L2正则化。如何关闭正则化以获得“原始”逻辑拟合,例如在Matlab中的glmfit?我想我可以设置C =大数,但我认为这不是明智的。有关更多详细信息,请参见文档 http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticR…

pip:从远程git存储库中提取更新 - python

我几周前从GitHub安装了scikit-learn:pip install git+git://github.com/scikit-learn/scikit-learn@master 我去了GitHub,从那以后对master分支进行了几处更改。如何更新scikit-learn的本地安装?我尝试了pip install scikit-learn --upg…

Python GPU资源利用 - python

我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…