我正在尝试将sklearn.metrics.classification_report运行在Pandas数据框中。
数据帧df_joined看起来像这样,有100行:
Timestamp Label Pred
2016-10-05 29.75 30.781430
2016-10-06 30.35 31.379146
2016-10-07 31.59 31.174824
2017-02-13 29.63 29.875497
2017-02-14 29.60 29.923161
2017-02-15 30.22 30.257284
2017-02-16 30.12 30.374257
2017-02-17 30.09 30.357196
2017-02-20 31.03 30.971070
2017-02-21 31.05 30.930189
我现在正在尝试通过以下方式打印category_report
print 'Classification Report:', '\n', sklearn.metrics.classification_report(df_joined[label],df_joined['Pred'] )
我收到错误:
文件
“\ Python \ WinPython-32bit-2.7.10.3 \ python-2.7.10 \ lib \ site-packages \ sklearn \ utils \ multiclass.py”,第106行,在unique_labels中
引发ValueError(“未知标签类型:%r”%ys)
TypeError:并非在字符串格式化期间转换了所有参数
我一直在尝试使用sklearn.metrics.classification_report(df_joined[label].values, df_joined['Pred'].values)
代替,但它会产生相同的错误。
有人知道这是从哪里来的吗?
参考方案
我相信classification_report
可以量化您对数据点标签的分类/预测程度,而不是其实际值。标签不能是浮点数,sklearn documentation和sklearn user guide中的所有示例都使用整数作为标签。
这些参数也暗示了这一点,因为传递1-d数组的替代方法是仅针对标签使用特定的数组构造。
sklearn.metrics.classification_report(y_true, y_pred, labels=None,target_names=None, sample_weight=None, digits=2)
y_true : 1d array-like, or label indicator array / sparse matrix
Ground truth (correct) target values.
y_pred : 1d array-like, or label indicator array / sparse matrix
Estimated targets as returned by a classifier.
...
如果您的数据将是整数标签,则您传递的确切数据框格式会正常工作:
# Does not raise an error
classification_report(df_joined['Label'].astype(int), df_joined['Pred'].astype(int))
您可以在Model evaluation: quantifying the quality of predictions中阅读有关sklearn的不同模型评估工具的更多信息,然后选择一种适合评估分类器的工具。
Python GPU资源利用 - python我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…
Python:图像处理可产生皱纹纸效果 - python也许很难描述我的问题。我正在寻找Python中的算法,以在带有某些文本的白色图像上创建皱纹纸效果。我的第一个尝试是在带有文字的图像上添加一些真实的皱纹纸图像(具有透明度)。看起来不错,但副作用是文本没有真正起皱。所以我正在寻找更好的解决方案,有什么想法吗?谢谢 参考方案 除了使用透明性之外,假设您有两张相同尺寸的图像,一张在皱纹纸上明亮,一张在白色背景上有深…
Python uuid4,如何限制唯一字符的长度 - python在Python中,我正在使用uuid4()方法创建唯一的字符集。但是我找不到将其限制为10或8个字符的方法。有什么办法吗?uuid4()ffc69c1b-9d87-4c19-8dac-c09ca857e3fc谢谢。 参考方案 尝试:x = uuid4() str(x)[:8] 输出:"ffc69c1b" Is there a way to…
Python:无法识别Pip命令 - python这是我拍摄的屏幕截图。当我尝试在命令提示符下使用pip时,出现以下错误消息:pip无法识别为内部或外部命令,可操作程序或批处理文件。我已经检查了这个线程:How do I install pip on Windows?我所能找到的就是我必须将"C:\PythonX\Scripts"添加到我的类路径中,其中X代表python版本。如您在我的…
Python sqlite3数据库已锁定 - python我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…