在Python中使用xpath需要先安装一个解析库,常用的解析库有lxml和html.parser,下面分别介绍它们的安装和使用方法。
-
安装lxml库: 使用pip命令在命令行中安装lxml库:
pip install lxml
-
使用lxml解析库进行xpath解析:
from lxml import etree # 创建一个XML解析器 parser = etree.XMLParser() # 解析XML字符串 xmlstr = """
foo bar -
安装html.parser库: 使用pip命令在命令行中安装html.parser库:
pip install html5lib
-
使用html.parser解析库进行xpath解析:
from html.parser import HTMLParser # 创建一个HTML解析器 parser = HTMLParser() # 解析HTML字符串 htmlstr = """
Heading
Paragraph
""" parser.feed(htmlstr) # 获取解析结果 root = parser.close() # 使用xpath选择节点 headings = root.xpath('//h1') # 遍历选择的节点 for heading in headings: print(heading.text)
注意:以上示例代码中的XPath表达式是简单的示例,实际中可以根据具体需求编写更复杂的XPath表达式。