带有来自pandas数据帧的输入的sklearn分类_报告将产生:“TypeError:在字符串格式化期间并非所有参数都已转换” - python

我正在尝试将sklearn.metrics.classification_report运行在Pandas数据框中。
数据帧df_joined看起来像这样,有100行:

Timestamp    Label       Pred
2016-10-05   29.75  30.781430
2016-10-06   30.35  31.379146
2016-10-07   31.59  31.174824
2017-02-13   29.63  29.875497
2017-02-14   29.60  29.923161
2017-02-15   30.22  30.257284
2017-02-16   30.12  30.374257
2017-02-17   30.09  30.357196
2017-02-20   31.03  30.971070
2017-02-21   31.05  30.930189

我现在正在尝试通过以下方式打印category_report

print 'Classification Report:', '\n', sklearn.metrics.classification_report(df_joined[label],df_joined['Pred'] )

我收到错误:

文件
“\ Python \ WinPython-32bit-2.7.10.3 \ python-2.7.10 \ lib \ site-packages \ sklearn \ utils \ multiclass.py”,第106行,在unique_labels中
引发ValueError(“未知标签类型:%r”%ys)

TypeError:并非在字符串格式化期间转换了所有参数

我一直在尝试使用sklearn.metrics.classification_report(df_joined[label].values, df_joined['Pred'].values)代替,但它会产生相同的错误。

有人知道这是从哪里来的吗?

参考方案

我相信classification_report可以量化您对数据点标签的分类/预测程度,而不是其实际值。标签不能是浮点数,sklearn documentation和sklearn user guide中的所有示例都使用整数作为标签。

这些参数也暗示了这一点,因为传递1-d数组的替代方法是仅针对标签使用特定的数组构造。

sklearn.metrics.classification_report(y_true, y_pred, labels=None,target_names=None, sample_weight=None, digits=2)

y_true : 1d array-like, or label indicator array / sparse matrix

    Ground truth (correct) target values.

y_pred : 1d array-like, or label indicator array / sparse matrix

    Estimated targets as returned by a classifier.

...

如果您的数据将是整数标签,则您传递的确切数据框格式会正常工作:

# Does not raise an error 
classification_report(df_joined['Label'].astype(int), df_joined['Pred'].astype(int))

您可以在Model evaluation: quantifying the quality of predictions中阅读有关sklearn的不同模型评估工具的更多信息,然后选择一种适合评估分类器的工具。

Python GPU资源利用 - python

我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…

Python:图像处理可产生皱纹纸效果 - python

也许很难描述我的问题。我正在寻找Python中的算法,以在带有某些文本的白色图像上创建皱纹纸效果。我的第一个尝试是在带有文字的图像上添加一些真实的皱纹纸图像(具有透明度)。看起来不错,但副作用是文本没有真正起皱。所以我正在寻找更好的解决方案,有什么想法吗?谢谢 参考方案 除了使用透明性之外,假设您有两张相同尺寸的图像,一张在皱纹纸上明亮,一张在白色背景上有深…

Python uuid4,如何限制唯一字符的长度 - python

在Python中,我正在使用uuid4()方法创建唯一的字符集。但是我找不到将其限制为10或8个字符的方法。有什么办法吗?uuid4()ffc69c1b-9d87-4c19-8dac-c09ca857e3fc谢谢。 参考方案 尝试:x = uuid4() str(x)[:8] 输出:"ffc69c1b" Is there a way to…

Python:无法识别Pip命令 - python

这是我拍摄的屏幕截图。当我尝试在命令提示符下使用pip时,出现以下错误消息:pip无法识别为内部或外部命令,可操作程序或批处理文件。我已经检查了这个线程:How do I install pip on Windows?我所能找到的就是我必须将"C:\PythonX\Scripts"添加到我的类路径中,其中X代表python版本。如您在我的…

Python sqlite3数据库已锁定 - python

我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…