Pandas Dataframe:在越来越多的列上循环并计算均值和标准差 - python

基本上，我有一个包含20个属性和一个值的表。我想找到std = 0-（即粒度级别完美允许1：1）所需的最少数量的属性。

我想建立一个循环如果使用列名进行硬编码，则看起来像这样：

for iter in range(1,21):
  dfcalc = df.groupby("LINE_NUM")["RATIO"].agg([np.mean, np.std])
  dfcalc = df.groupby("LINE_NUM","TYPE")["RATIO"].agg([np.mean, np.std])

如何在循环中使用iter变量定义要分组的列？

参考方案

如果我正确理解您想要的内容，则可以执行以下操作：

for i in range(1, len(df.columns) + 1):
    df.groupby(df.columns[:i].tolist()).agg([np.mean, np.std])

（iter是内置函数的名称）

您也可以将.iloc用于integer-based indexing。

pandas DataFrame:根据另一列中的布尔值计算总和 - python

我对Python相当陌生，我尝试在pandas中模拟以下逻辑我目前正在循环抛出行，并希望对前几行的AMOUNT列中的值求和，但只求和最后一次看到的“ TRUE”值。实际数据似乎效率低下（我的数据框大约有500万行）？想知道用Python处理这种逻辑的有效方法是什么？逻辑：逻辑是，如果FLAG为TRUE，我想对前几行的AMOUNT列中的值求和，但只求和最后一次…

pandas.DataFrame.replace更改列的dtype - python

因此，我试图用np.nan替换数据框中的None值，并注意到在此过程中，即使数据框中的float列的数据类型不包含任何丢失的数据，它们也都更改为object。举个例子：import pandas as pd import numpy as np data = pd.DataFrame({'A':np.nan,'B':1…

重命名默认ID python - python

我想连接两个dataFrames，但是两个数据具有不同的ID，所以结果是错误的这是我的代码data=pd.DataFrame(df.columns) data1=data.drop(axis=1,index=[0,1,2,3]).transpose() data1 这是dataframe1另一个数据框：y=sma_algo(df.loc['H+L&…

Python:如何根据另一列元素明智地查找一列中的空单元格计数？ - python

df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice','Jane', 'Alice','Bob', 'Alice'], 'income…

连续获取所有唯一值 - python

我有一个DataFrame df1看起来像这样：A B C ----------------- 1 1 2 2 2 3 5 4 9 我想连续获取所有唯一值。例如第一行的1和2。第二行中的2、3。第三排分别是4、5和9。结果可能会有所不同，我可以想象一个新列包含一个具有唯一值的列表，或者用None替换重复的列也是可以的（或者，在这种情况下，可能还有更多的Pyt…

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在…

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在看。自己强行看了两个月，全部给看完了。感觉这文笔也就我读初中的水平……而且写着国内的一些情况，外国人能理解吗？这书为什么会这么火？这水平我也可以去写呀[笑哭][笑哭][笑哭] 招商银行员工：可以写赶紧写一个啊，能拿科幻文学雨果奖。包清白：哦楼主：pei ！tui ！你也配姓龙楼主：@赵龙王呵呵 […]