我有df;
ID YEART Commdate Cat Category
0 LVI6AE2 1993 2017-03-24 LVI6AE2_1 56
1 LVI6BE2 1994 2017-03-24 LVI6BE2_1 67
2 APJ5LEV 1975 2017-03-13 APJ5LEV_1 78
3 LQL0AE3 1986 2017-03-16 LQL0AE3_1 87
4 BLR3UEV 1982 2017-03-15 BLR3UEV_1 90
5 BRL1NEV 1981 2017-03-15 BRL1NEV_1 90
6 BRL1NEV 1981 2017-03-16 BRL1NEV_1 90
7 BRL1NEV 1981 2017-03-22 Ungrouped 190
8 BRL1NEV 1981 2017-03-17 Ungrouped 190
9 BRL1NEV 1981 2017-03-17 Ungrouped 190
10 BRL1NEV 1981 2017-03-22 Ungrouped 190
11 BRL1NEV 1981 2017-03-20 BRL1NEV_1 90
12 BRL1NEV 1981 2017-02-01 BRL1NEV_1 90
13 UEE6JSV 2000 2017-03-15 UEE6JSV_1 34
14 UGQ4VE2 1993 2014-07-25 UGQ4VE2_1 45
15 UTU6BE1 1986 2017-03-13 UTU6BE1_1 12
16 NVT 1999 2017-03-10 NVT_1 12
17 OTL3JE1 2001 2017-02-01 OTL3JE1_1 12
18 OTL5XS1 2003 2017-03-01 OTL5XS1_1 12
19 OTL6AE1 2001 2017-03-01 OTL6AE1_1 12
20 JVU6AE1 1999 2017-03-31 JVU6AE1_1 12
21 JVU6AE2 1993 2017-03-31 Ungrouped 120
我想仅在它们属于未分组的“猫”或类别> 100的情况下,计算每个组中具有相似的“ ID”和“ YEART”的最早的“提交”
我想出了以下几行
#To Datetime
df['Commdate'] =pd.to_datetime(df['Commdate'])
#groupby
df["EarliestD"] =df.groupby(['ID', 'YEART']).filter(lambda x : x['Category'].count()>=90)['Commdate'].min()
结果为“ EarliestD”返回“ NaT”
ID YEART Commdate Cat Category EarliestD
0 LVI6AE2 1993 2017-03-24 LVI6AE2_1 56 NaT
1 LVI6BE2 1994 2017-03-24 LVI6BE2_1 67 NaT
2 APJ5LEV 1975 2017-03-13 APJ5LEV_1 78 NaT
3 LQL0AE3 1986 2017-03-16 LQL0AE3_1 87 NaT
4 BLR3UEV 1982 2017-03-15 BLR3UEV_1 90 NaT
题;
1.如果满足不同列中的条件,是否可以有条件地使用多个列进行分组?
2.是否可以在def
函数中调用多个条件groupby?
谢谢
参考方案
您可以使用布尔过滤器和groupby
+ transform
:
# convert Commdate to datetime if necessary
df['Commdate'] = pd.to_datetime(df['Commdate'])
# calculate mask for splitting dataframe
cat_mask = (df['Cat'] == 'Ungrouped') | (df['Category'] > 100)
# groupby uncategorised / category > 100
df.loc[cat_mask, 'Commdate'] = df.loc[cat_mask].groupby(['ID', 'YEART'])['Commdate'].transform('min')
结果:
print(df)
ID YEART Commdate Cat Category
0 LVI6AE2 1993 2017-03-24 LVI6AE2_1 56
1 LVI6BE2 1994 2017-03-24 LVI6BE2_1 67
2 APJ5LEV 1975 2017-03-13 APJ5LEV_1 78
3 LQL0AE3 1986 2017-03-16 LQL0AE3_1 87
4 BLR3UEV 1982 2017-03-15 BLR3UEV_1 90
5 BRL1NEV 1981 2017-03-15 BRL1NEV_1 90
6 BRL1NEV 1981 2017-03-16 BRL1NEV_1 90
7 BRL1NEV 1981 2017-03-17 Ungrouped 190
8 BRL1NEV 1981 2017-03-17 Ungrouped 190
9 BRL1NEV 1981 2017-03-17 Ungrouped 190
10 BRL1NEV 1981 2017-03-17 Ungrouped 190
11 BRL1NEV 1981 2017-03-20 BRL1NEV_1 90
12 BRL1NEV 1981 2017-02-01 BRL1NEV_1 90
13 UEE6JSV 2000 2017-03-15 UEE6JSV_1 34
14 UGQ4VE2 1993 2014-07-25 UGQ4VE2_1 45
15 UTU6BE1 1986 2017-03-13 UTU6BE1_1 12
16 NVT 1999 2017-03-10 NVT_1 12
17 OTL3JE1 2001 2017-02-01 OTL3JE1_1 12
18 OTL5XS1 2003 2017-03-01 OTL5XS1_1 12
19 OTL6AE1 2001 2017-03-01 OTL6AE1_1 12
20 JVU6AE1 1999 2017-03-31 JVU6AE1_1 12
21 JVU6AE2 1993 2017-03-31 Ungrouped 120
在返回'Response'(Python)中传递多个参数 - python我在Angular工作,正在使用Http请求和响应。是否可以在“响应”中发送多个参数。角度文件:this.http.get("api/agent/applicationaware").subscribe((data:any)... python文件:def get(request): ... return Response(seriali…
Python exchangelib在子文件夹中读取邮件 - python我想从Outlook邮箱的子文件夹中读取邮件。Inbox ├──myfolder 我可以使用account.inbox.all()阅读收件箱,但我想阅读myfolder中的邮件我尝试了此页面folder部分中的内容,但无法正确完成https://pypi.python.org/pypi/exchangelib/ 参考方案 您需要首先掌握Folder的myfo…
R'relaimpo'软件包的Python端口 - python我需要计算Lindeman-Merenda-Gold(LMG)分数,以进行回归分析。我发现R语言的relaimpo包下有该文件。不幸的是,我对R没有任何经验。我检查了互联网,但找不到。这个程序包有python端口吗?如果不存在,是否可以通过python使用该包? python参考方案 最近,我遇到了pingouin库。
如何用'-'解析字符串到节点js本地脚本? - python我正在使用本地节点js脚本来处理字符串。我陷入了将'-'字符串解析为本地节点js脚本的问题。render.js:#! /usr/bin/env -S node -r esm let argv = require('yargs') .usage('$0 [string]') .argv; console.log(argv…
TypeError:'str'对象不支持项目分配,带有json文件的python - python以下是我的代码import json with open('johns.json', 'r') as q: l = q.read() data = json.loads(l) data['john'] = '{}' data['john']['use…