主页 > 编程资料 > Python >
发布时间:2016-10-22 作者:apizl 阅读:248次

XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。 XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。 起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。

在网络爬虫中使用XPath来解析网页数据是一个不错的选择.


在Python中使用XPath需要安装lxml库.(windows下Python安装lxml模块)

Python使用XPath简单的例子,遍历网页链接:

sp20161022_233117.png

结果:

http://www.apizl.com/category/list-89.html

http://www.apizl.com/category/list-72.html

http://www.apizl.com/category/list-185.html

http://www.apizl.com/category/list-186.html

http://www.apizl.com/category/list-78.html

http://www.apizl.com/category/list-79.html

http://www.apizl.com/category/list-223.html

http://www.apizl.com/category/list-337.html

http://www.apizl.com/category/list-301.html

http://www.apizl.com/category/list-206.html

http://www.apizl.com/category/list-321.html

http://www.apizl.com/category/list-317.html

http://www.apizl.com/category/list-336.html

http://www.apizl.com/category/list-334.html

http://www.apizl.com/category/list-335.html

http://www.apizl.com/category/list-343.html

http://www.apizl.com/category/list-43.html

......


文章由爱资料原创本文地址:https://www.apizl.com/archives/view-132900-1.html,转载请以链接形式标明本文地址!
关键字词:python  爬虫  XPath  lxml  etree