替代服务器端脚本语言进行抓取 - javascript

我的大学托管着一个小网站。该政策是未启用服务器端脚本语言(例如PHP等),因此网站是静态的或可以使用客户端脚本(例如javascript等)。我也无法触摸服务器/对其进行配置/安装。

无论如何,我想从其他网站(即Google Scholar引用)中添加一些数据,这些数据我可以使用Python + lxml动态地进行抓取。
有什么办法可以动态查询这些数据-当然是在客户端?

我尝试使用IronPython将我的Python代码嵌入到我的网页中,但是它抱怨无法找到lxml导入的库。但是类似的解决方案将是很好的。
还是纯JavaScript的库,它允许打开和解析外部网页...?

谢谢!

参考方案

否。same origin policy阻止它。

使用第三方代理将数据转码为JSON-P,或者使用其他主机。

或者,在您控制的服务器上运行一个cron作业,该作业会定期生成新的静态HTML并上传到您的主机。

Python vs JavaScript-顺序时间的UTC时间 - javascript

在Python中:>>> import datetime >>> datetime.datetime.fromtimestamp(1329429600) datetime.datetime(2012, 2, 17, 0, 0) 在JavaScript中:>>> (new Date(132942960000…

Javascript-Python:将动态生成的图像提供给客户端浏览器? - php

场景:用户加载页面,正在生成图像,显示加载栏,通知事件已发送到浏览器。我正在使用python代码生成图像。拥有启动脚本或将Web服务器代码嵌入python脚本的Web服务器是否理想?图像完成渲染后,客户端应收到一条消息,说明图像成功并显示图像。如何设计它以同时支持并发用户?是否只需为每个导航到该网页的新用户启动python脚本就足够了?在这种情况下拥有实时W…

Python Selenium:无法单击按钮 - javascript

我是python的新手,并且想编写一个网络抓取工具,其中涉及在弹出窗口中单击鼠标“确定”按钮。其他一切都进行得很好,但是我无法单击最终按钮,导致数据下载。javascript如下:我尝试通过ID查找元素,但出现以下错误消息: 参考方案 find_elements_by_id返回元素列表。遍历find_elements_by_id返回的列表,或使用find_e…

Javascript + Python:将数组发送到Python脚本,将结果返回给Javascript - javascript

我想建立一个网页,该网页通过Javascript API进行许多Facebook状态更新,并将它们分类到一个数组中。然后,我想将此数组发送到Python脚本,该脚本可以专门使用NLTK.进行语言分析。在Python中获得合适的结果后,我想将结果从该脚本返回到Javascript,以显示给用户等。听起来可能吗? javascript大神给出的解决方案 是的,完…

javascript popupwindow之后的行如何工作? - javascript

好的,我有一个来自后面代码的方法,可以创建一个popupwindow。然后有一行代码要在那之后执行,我想知道那行代码何时执行,是在使用popupwindow之后执行还是在创建popupwindow之后执行?例如:void exPopupWindowMethod() { string scr = "window.open('exampleP…