使用熊猫读取定界文件 - python

我收到了一个无界数据文件，数据看起来像这样:

$ head usa_00002.dat
20120500000001000000200010001000000200021111147870057729
20120500000001000000200010002000000160022101010000000000
20120500000001000000200010003000000130002010160000999999
20120500000001000000200010004000000200001010120000999999
20120500000002000000240010001000000240001111146870075959

我有一个密码本文件，解释了如何实际设置数据(YEAR columns 1–4, DATANUM columns 5–6等)

对我来说，将这些数据导入Pandas的最佳方法是什么？我可以使用read_table或类似功能直接读取此文件的标准方法吗？我是否应该编写脚本以在所有分行符所在的位置插入逗号，然后以CSV格式读取？ (我只是愿意做后者，但我也想与Pandas一起变得更好，所以如果有一种我想知道的开箱即用的方式。)

python大神给出的解决方案

您可以为此使用pandas.io.parsers.read_fwf()函数:

from cStringIO import StringIO

s = """20120500000001000000200010001000000200021111147870057729
       20120500000001000000200010002000000160022101010000000000
       20120500000001000000200010003000000130002010160000999999
       20120500000001000000200010004000000200001010120000999999
       20120500000002000000240010001000000240001111146870075959"""

colspecs = [(0, 4), (5, 6), ...]
df = pd.read_fwf(StringIO(s), colspecs=colspecs, header=None)

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在…

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在看。自己强行看了两个月，全部给看完了。感觉这文笔也就我读初中的水平……而且写着国内的一些情况，外国人能理解吗？这书为什么会这么火？这水平我也可以去写呀[笑哭][笑哭][笑哭] 招商银行员工：可以写赶紧写一个啊，能拿科幻文学雨果奖。包清白：哦楼主：pei ！tui ！你也配姓龙楼主：@赵龙王呵呵 […]