我在不同的列中有数据,但是我不知道如何提取数据以将其保存在另一个变量中。
index a b c
1 2 3 4
2 3 4 5
如何选择'a'
,'b'
并将其保存到df1?
我试过了
df1 = df['a':'b']
df1 = df.ix[:, 'a':'b']
似乎没有任何工作。
参考方案
列名(字符串)无法按照您尝试的方式进行切片。
在这里,您有两个选择。如果您从上下文中知道要切出哪些变量,则可以通过将列表传递到 __getitem__
syntax([])中而仅返回那些列的视图。
df1 = df[['a', 'b']]
或者,如果需要对它们进行数字索引而不是按其名称进行索引(例如,您的代码应在不知道前两列的名称的情况下自动执行此操作),则可以执行以下操作:
df1 = df.iloc[:, 0:2] # Remember that Python does not slice inclusive of the ending index.
另外,您应该熟悉Pandas对象与该对象副本的视图概念。上述方法中的第一种将在内存中返回所需子对象(所需切片)的新副本。
但是,有时熊猫中有一些索引约定不执行此操作,而是给您一个新变量,该变量仅引用与原始对象中的子对象或切片相同的内存块。第二种索引编制方式会发生这种情况,因此您可以使用copy()
函数对其进行修改以获得常规副本。发生这种情况时,更改您认为是切片对象的内容有时会更改原始对象。始终对此保持警惕。
df1 = df.iloc[0, 0:2].copy() # To avoid the case where changing df1 also changes df
要使用iloc
,您需要知道列位置(或索引)。由于列位置可能会发生变化,因此可以使用iloc
以及数据帧对象的get_loc
方法的columns
函数来代替列索引,以获得列索引。
{df.columns.get_loc(c): c for idx, c in enumerate(df.columns)}
现在,您可以使用此字典通过名称和使用iloc
来访问列。
我有一个大的pandas数据框,试图从中形成一些行的对。我的df如下所示:object_id increment location event 0 1 d A 0 2 d B 0 3 z C 0 4 g A 0 5 g B 0 6 i C 1 1 k A 1 2 k B ... ... ... ... 对象ID描述特定的对象。增量是每次发生某事(跟踪订单)时…
在返回'Response'(Python)中传递多个参数 - python我在Angular工作,正在使用Http请求和响应。是否可以在“响应”中发送多个参数。角度文件:this.http.get("api/agent/applicationaware").subscribe((data:any)... python文件:def get(request): ... return Response(seriali…
Python-Excel导出 - python我有以下代码:import pandas as pd import requests from bs4 import BeautifulSoup res = requests.get("https://www.bankier.pl/gielda/notowania/akcje") soup = BeautifulSoup(res.cont…
pandas DataFrame:根据另一列中的布尔值计算总和 - python我对Python相当陌生,我尝试在pandas中模拟以下逻辑我目前正在循环抛出行,并希望对前几行的AMOUNT列中的值求和,但只求和最后一次看到的“ TRUE”值。实际数据似乎效率低下(我的数据框大约有500万行)?想知道用Python处理这种逻辑的有效方法是什么?逻辑:逻辑是,如果FLAG为TRUE,我想对前几行的AMOUNT列中的值求和,但只求和最后一次…
Python exchangelib在子文件夹中读取邮件 - python我想从Outlook邮箱的子文件夹中读取邮件。Inbox ├──myfolder 我可以使用account.inbox.all()阅读收件箱,但我想阅读myfolder中的邮件我尝试了此页面folder部分中的内容,但无法正确完成https://pypi.python.org/pypi/exchangelib/ 参考方案 您需要首先掌握Folder的myfo…