开发爬虫,或者使用Selenium操纵浏览器,离不开对网页上各元素的定位。 元素定位,分析网页源代码是个基本的途径,但需要对html语言以及java script有比较深入的了解,熟悉xpath,这恐怕不是大部分开发Python程序的业余爱好者所能搞定的,就算能力够,可是人生苦短,学无止境,何必浪费时间在这上面,何必把有限的生命投入到无限的知识海洋中。 您需要辅助工具,能够根据您的操作,捕获网页上目标元素的定位。比如下面这款SelectorGadget: 如果想定位文章标题,则点击网页上的标题,它相应的能捕获给出xpath定位信息://*[(@id = “articleContentId”)]
是不是很省力! 然而我今天要推荐的是Katalon,它用来对付弹窗最好用。 网页弹窗有JavaScript的alert、confirm、prompt类型弹框,也有比较简单的divt弹窗以及新标签页弹窗,不管哪种,用Katalon是没跑了! Katalon Studio是免费自动化测试工具,功能强大,基于 Selenium 和 Appium 框架。 但我们想用的Katalon出品的chrome插件,是九牛身上的一毛,就这一毛,足够用了! 安装过程啥的就省略了,启动以后,您会看到以下界面: Katalon Recorder 5.9.0,用它来试试北大法宝网站www.pkulaw.cn 进入网站之后会有个弹窗: 点击‘留在法宝v6’试试看,看看katalon捕获到了什么: 点击的xpath被记录下来了:xpath=(.//*[normalize-space(text()) and normalize-space(.)=‘返回法宝V5’])[1]/following::span[1] 精准!犀利! 你通过网页源代码是找不到的。
|