标签:beautifulsoup
-
抓取网站时,如何获取读取所有表的代码? - python
我是python的新手,这个网站在学期对我有很大帮助,我希望你们能再次帮助我。 我需要从https://money.cnn.com/data/hotstocks/抓取表格。 这些表是最活跃,最成功和最失败的人。 现在我可以使这段代码对我有用 import requests from bs4 import BeautifulSoup url = 'h […]
-
无法使用Beautifulsoup从网站读取表格 - python
我正在尝试使用以下代码阅读网站的内容。 import requests from bs4 import BeautifulSoup url = "https://chartink.com/screener/test-121377" r = requests.get(url) data = r.text soup = BeautifulSo […]
-
如何在没有额外信息的情况下有效地从一堆网页中提取文本 - java
我有大约一百万个网页列表,我想高效地从这些页面中提取文本。目前,我正在使用Python中的BeautifulSoup库从HTML获取文本,并使用request命令获取网页的html。这种方法除了提取文本之外还提取了一些额外的信息,例如正文中是否列出了任何javascript。 您能否建议我任何合适且有效的方式来完成任务。我看着草木,但看起来像是在爬特定的网站 […]
-
自定义缩进宽度的BeautifulSoup .prettify() - python
有什么方法可以为.prettify()函数定义自定义缩进宽度吗?从我能从中得到的 def prettify(self, encoding=None, formatter="minimal"): if encoding is None: return self.decode(True, formatter=formatter) else: […]
-
美丽的汤:“ResultSet”对象没有属性“find_all”吗? - python
我正在尝试使用Beautiful Soup刮擦一张简单的桌子。这是我的代码: import requests from bs4 import BeautifulSoup url = 'https://gist.githubusercontent.com/anonymous/c8eedd8bf41098a8940b/raw/c7e01a76d753f […]
-
BeautifulSoup-通过标签内的文本搜索 - python
观察以下问题: import re from bs4 import BeautifulSoup as BS soup = BS(""" <a href="/customer-menu/1/accounts/1/update"> Edit </a> """) […]
-
Python:BeautifulSoup-根据名称属性获取属性值 - python
我想根据属性名称打印属性值,例如 <META NAME="City" content="Austin"> 我想做这样的事情 soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup( […]
-
Web Scraping无法获得所有表格 - python
我编写的代码使用BeautifulSoup和Selenium取得了表格。 但是,仅获得表的一部分。汤对象不会获得访问website时未出现的行和列。 我确定问题出在摘录WebDriverWait(driver, 10).until (EC.visibility_of_element_located((By.ID,"contenttabledivjq […]
-
如何将bs4.element.ResultSet转换为字符串?蟒蛇 - python
我有一个简单的代码,例如: p = soup.find_all("p") paragraphs = [] for x in p: paragraphs.append(str(x)) 我正在尝试转换从xml获取的列表并将其转换为字符串。我想保留它的原始标签,以便我可以重用一些文本,这就是为什么我要这样附加它。但是该列表包含6000多个观察值 […]
-
从页面获取所有链接Beautiful Soup - python
我正在使用beautifulsoup从页面获取所有链接。我的代码是: import requests from bs4 import BeautifulSoup url = 'http://www.acontecaeventos.com.br/marketing-promocional-sao-paulo' r = requests.ge […]