我们得到了一个列表(ndarray
)的numpy数组(dtype=object
),并希望返回一个类似的列表数组,其中每个列表都经过排序。有没有一种有效的方法可以做到这一点(即没有for循环等)?
请不要提供np.vectorize()
作为解决方案,因为它被实现为for循环,因此效率低下。
例如:
a=np.array([[5,4],[6,7,2],[8,1,9]],dtype=object)
所以是:
array([list([5, 4]), list([6, 7, 2]), list([8, 1, 9])], dtype=object)
我们希望函数对它进行排序,这样我们将获得:
array([list([4, 5]), list([2, 6, 7]), list([1, 8, 9])], dtype=object)
参考方案
您的示例以及用于时间测试的扩展版本:
In [202]: a=np.array([[5,4],[6,7,2],[8,1,9]],dtype=object)
In [203]: A = a.repeat(100)
将Python列表排序应用于每个元素:
In [204]: np.array([sorted(i) for i in a])
Out[204]: array([list([4, 5]), list([2, 6, 7]), list([1, 8, 9])], dtype=object)
使用frompyfunc
进行相同的操作:
In [205]: np.frompyfunc(sorted,1,1)(a)
Out[205]: array([list([4, 5]), list([2, 6, 7]), list([1, 8, 9])], dtype=object)
一些时间:
In [206]: timeit np.array(list(map(sorted, A)))
168 µs ± 221 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
In [207]: timeit np.array([sorted(i) for i in A])
181 µs ± 249 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
map
比列表理解要快一点。我更喜欢理解的可读性。
纯列表版本要快很多:
In [208]: %%timeit temp=A.tolist()
...: list(map(sorted, temp))
...:
...:
88.3 µs ± 70.8 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
frompyfunc
比数组映射更快,并且几乎与纯列表版本一样好:
In [209]: timeit np.frompyfunc(sorted,1,1)(A)
97.3 µs ± 1.93 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
这就是我以前见过的模式。 frompyfunc
是将函数应用于对象dtype数组的元素的最快方法,但是它很少比基于列表的迭代好。
我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…
Python sqlite3数据库已锁定 - python我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…
python-docx应该在空单元格已满时返回空单元格 - python我试图遍历文档中的所有表并从中提取文本。作为中间步骤,我只是尝试将文本打印到控制台。我在类似的帖子中已经看过scanny提供的其他代码,但是由于某种原因,它并没有提供我正在解析的文档的预期输出可以在https://www.ontario.ca/laws/regulation/140300中找到该文档from docx import Document from…
Python ThreadPoolExecutor抑制异常 - pythonfrom concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED def div_zero(x): print('In div_zero') return x / 0 with ThreadPoolExecutor(max_workers=4) as execut…
Python:集群作业管理 - python我在具有两个阶段的计算群集(Slurm)上运行python脚本,它们是顺序的。我编写了两个python脚本,一个用于阶段1,另一个用于阶段2。每天早上,我检查所有第1阶段的工作是否都以视觉方式完成。只有这样,我才开始第二阶段。通过在单个python脚本中组合所有阶段和作业管理,是否有一种更优雅/自动化的方法?我如何知道工作是否完成?工作流程类似于以下内容:w…