从JavaScript(Python Scraper)提取数据 - javascript

我目前正在使用urllib2,pyquery和json的融合来抓取网站,现在我发现我需要从JavaScript中提取一些数据。一种想法是使用JavaScript引擎(如V8),但这似乎对我所需的功能来说太过分了。我会使用正则表达式,但是这种表达式似乎很复杂。

JavaScript:

(function(){DOM.appendContent(this, HTML("<html>"));;})

我需要提取<html>,但是我不完全确定该怎么做。 <html>本身基本上可以包含阳光下的每个字符,因此[^"]将不起作用。

有什么想法吗?

参考方案

为什么要使用正则表达式?您是否不能只使用两个子字符串,因为您知道要删掉开头和结尾的多少个字符?

string[42:-7]

除了比正则表达式快外,<html>中的引号是否转义也没有关系。

Javascript + Python:将数组发送到Python脚本,将结果返回给Javascript - javascript

我想建立一个网页,该网页通过Javascript API进行许多Facebook状态更新,并将它们分类到一个数组中。然后,我想将此数组发送到Python脚本,该脚本可以专门使用NLTK.进行语言分析。在Python中获得合适的结果后,我想将结果从该脚本返回到Javascript,以显示给用户等。听起来可能吗? javascript大神给出的解决方案 是的,完…

如何根据手势滚动网页 - javascript

如何使用pyhton / javascript使用手势向上/向下或向左/向右滚动页面。我尝试了很多找到解决方案,但无法解决。 参考方案 Javascript手势插件(JSHG)是一个很棒的插件,它使您可以通过现有网站或Web应用程序中的网络摄像头来支持用户的手势识别。您无需具有计算机视觉的任何背景即可使用此插件。当前,它提供了一组基本的手势,其中包括手的位置…

什么是最好的免费JavaScript模糊处理程序,可以作为javascript库或python库使用 - javascript

我关注这篇文章:Free JavaScript obfuscators?找到一个JavaScript混淆器,可以帮助我在客户端混淆一些JavaScript数据。但我发现这些选择都不是python或javascript lib,they use java,我使用django,所以我想知道,最好的免费JavaScript混淆器是javascript库或pytho…

Python:可以使用JSON将消息发送到包含加密部分的Python Server吗? - javascript

我对JSON的了解不多,我刚刚开始学习本教程,所以请多多包涵:http://pymotw.com/2/json/我的问题是我可以使用JSON发送包含已加密的部分的消息到Python服务器,以便它可以将其转发到另一台服务器吗?该消息将来自通过SSL的Javascript客户端,其中包含有关Python Server的一些信息,以及将被加密的消息转发到另一个Py…

查找我的浏览器生成的javascript变量的当前值 - javascript

我正在尝试训练神经网络使用进化计算来玩基于浏览器的游戏,为此,我需要跟踪游戏得分。仅使用html,css和javascript创建游戏,并且游戏得分保存在我的浏览器运行的js脚本中的特定变量中。播放时,该变量的值当然会发生变化,并且在我的浏览器中是本地的。有什么方法可以在Python脚本中跟踪该变量的值? (如果我需要使用其他编程语言,我也愿意尝试一下!)编…