是否有库功能或正确的方法将两个Pandas数据框列彼此堆叠?
例如,将4列变成2:
a1 b1 a2 b2
1 2 3 4
5 6 7 8
至
c d
1 2
5 6
3 4
7 8
我阅读的有关Pandas Data Frames的文档大部分只涉及串联行和进行行操作,但是我敢肯定必须有一种方法来完成我所描述的事情,并且我相信它非常简单。
任何帮助都会很棒。
python大神给出的解决方案
您可以使用pandas.DataFrame.iloc
选择前两列和后两列。然后,将两个部分的列名称更改为c
和d
。之后,您可以使用pandas.concat
加入他们。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
columns=["a1", "b1", "a2", "b2"])
part1 = df.iloc[:,0:2]
part2 = df.iloc[:,2:4]
new_columns = ["c", "d"]
part1.columns = new_columns
part2.columns = new_columns
print pd.concat([part1, part2], ignore_index=True)
这给您:
c d
0 1 2
1 5 6
2 3 4
3 7 8