使用sklearn的PCA - python

我有一个大输入矩阵,大小为(20,20000),并且正在尝试使用sklearn Python软件包执行PCA。在这里,20代表20个主题,20,000代表20,000个特征。下面是示例代码:

import numpy as np
from sklearn.decomposition import PCA

rng = np.random.RandomState(1)
X = rng.randn(20, 20000)
pca.fit(X)
X.shape = 

>> (20, 20000)

pca = PCA(n_components=21)
pca.fit(X)
X_pca = pca.transform(X)
print("Original shape: ", X.shape)
print("Transformed shape: ", X_pca.shape)

>> Original shape: (20, 20000)
>> Transformed shape: (20, 20)

使用PCA,我是否不能获得比我的x值数量更多的组件(为什么在获得pca组件时为什么要受限于x值的长度)?

参考方案

与sklearn相比,这与PCA的实现更多有关,但是:

if n_samples <= n_features:
    maxn_pc = n_samples - 1
else:
    maxn_pc = n_features

即,如果样本数(n)小于或等于特征数(f),则可以提取的最大非平凡分量的最大数目为n-1。否则,非平凡分量的最大数量为n。

Python GPU资源利用 - python

我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…

Python:图像处理可产生皱纹纸效果 - python

也许很难描述我的问题。我正在寻找Python中的算法,以在带有某些文本的白色图像上创建皱纹纸效果。我的第一个尝试是在带有文字的图像上添加一些真实的皱纹纸图像(具有透明度)。看起来不错,但副作用是文本没有真正起皱。所以我正在寻找更好的解决方案,有什么想法吗?谢谢 参考方案 除了使用透明性之外,假设您有两张相同尺寸的图像,一张在皱纹纸上明亮,一张在白色背景上有深…

Python uuid4,如何限制唯一字符的长度 - python

在Python中,我正在使用uuid4()方法创建唯一的字符集。但是我找不到将其限制为10或8个字符的方法。有什么办法吗?uuid4()ffc69c1b-9d87-4c19-8dac-c09ca857e3fc谢谢。 参考方案 尝试:x = uuid4() str(x)[:8] 输出:"ffc69c1b" Is there a way to…

Python sqlite3数据库已锁定 - python

我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…

Python-scikit_learn中的克里金(高斯过程) - python

我正在考虑使用此方法对我拥有的3D点进行插值。作为输入,我在一个区域中的各个高度具有大气浓度的气体。我所获得的数据显示为垂直高度每隔几英尺延伸几十英尺,但水平分开数百英尺的值(因此,“列”紧密堆积)。假定在任何给定时间点,值在垂直方向上的变化比在水平方向上的变化大得多。我想在考虑到这一假设的情况下执行3D克里金法(作为我可以调整的参数,或者是经过统计定义的参…