尝试从nyc Wiki页面中的高中列表中获取所有高中名称。
我已经写了足够多的脚本,可以让我获取包含在高中,学业和入学条件列表的表的<tr>
标记中的所有信息-但是我如何才能缩小到我认为的范围内在td[0]
内休息(会弹出KeyError
)-只是学校的名称?
到目前为止我写的代码:
from bs4 import BeautifulSoup
from urllib2 import urlopen
NYC = 'https://en.wikipedia.org/wiki/List_of_high_schools_in_New_York_City'
html = urlopen(NYC)
soup = BeautifulSoup(html.read(), 'lxml')
schooltable = soup.find('table')
for td in schooltable:
print(td)
我收到的输出:
<tr>
<td><a href="/wiki/The_Beacon_School" title="The Beacon School">The Beacon School</a></td>
<td>Humanities & interdisciplinary</td>
<td>Academic record, interview</td>
</tr>
我正在寻找的输出:
The Beacon School
参考方案
如何获得页面上的第一个table
,遍历除第一个标题之外的所有行,并为每一行获取第一个td
元素。为我工作:
for row in soup.table.find_all('tr')[1:]:
print(row.td.text)
Python numpy数据指针地址无需更改即可更改 - python编辑经过一些摆弄之后,到目前为止,我已经隔离了以下状态:一维数组在直接输入变量时提供两个不同的地址,而在使用print()时仅提供一个地址2D数组(或矩阵)在直接输入变量时提供三个不同的地址,在使用print()时提供两个地址3D数组在直接输入变量时提供两个不同的地址,而在使用print()时仅给出一个(显然与一维数组相同)像这样:>>> …
Python Pandas导出数据 - python我正在使用python pandas处理一些数据。我已使用以下代码将数据导出到excel文件。writer = pd.ExcelWriter('Data.xlsx'); wrong_data.to_excel(writer,"Names which are wrong", index = False); writer.…
Python ElementTree:在循环中替换元素 - python我正在尝试创建一个脚本,该脚本循环创建一个xml文件,并为两个元素增加值。 (使用netaddr的IP地址,以及递增的tag / member元素,tag01-tag10)from netaddr import IPNetwork import xml.dom.minidom import lxml.etree as etree import xml.etr…
在节点有数据的地方绘制图形 - python我有一个包含一些复杂数据的有向图。我想绘制此图并将每个节点表示为一个表。有没有办法做到这一点?我发现的所有绘图示例都只有一个标签或一些简单地绘制到节点中的示例。仅供参考:我目前正在使用networkx 参考方案 使用graphviz时,标签可以代表更复杂的东西,例如表格。Graphviz提供两种变体:Record based nodes基于记录的节点提供了一…
如何使用WTForms制作具有唯一ID的多个复选框,以便可以将其存储在货架上? - python如何使用WTForms制作多个复选框并将其呈现到我的html页面?这是我使用WTForms提出的内容,但有人告诉我使用Boolean(True,False)它将仅应用于一个复选框,而不是多个复选框。我如何将所选的复选框附加到字典中有唯一的ID吗?我对python,flask和WTForms相当陌生。感谢您抽出宝贵的时间来帮助我。也可以给我一些建议/指南来帮助…