爬虫之xpath语法-基础节点选择语法
发布日期:2021-05-07 08:22:50 浏览次数:27 分类:精选文章

本文共 492 字,大约阅读时间需要 1 分钟。

爬虫之xpath语法-基础节点选择语法

  1. XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。
  2. 这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
  3. 使用chrome插件选择标签时候,选中时,选中的标签会添加属性class="xh-highlight"

1.1 xpath定位节点以及提取属性或文本内容的语法

1.2 语法练习

接下来我们通过itcast的页面来练习上述语法:

  • 选择所有的h2下的文本
    • //h2/text()
  • 获取所有的a标签的href
    • //a/@href
  • 获取html下的head下的title的文本
    • /html/head/title/text()
  • 获取html下的head下的link标签的href
    • /html/head/link/@href

        xpath:节点选择语法

        html

        /html/head/title

        /html//title

        //title

        //title/../..//title    斜杠隔开的是节点

        //title/text()  从开闭标签之间取文本内容

        //link/@href  从选中的节点标签中获取指定属性的值

上一篇:爬虫之xpath语法-节点修饰语法
下一篇:爬虫之 xpath的节点关系

发表评论

最新留言

哈哈,博客排版真的漂亮呢~
[***.90.31.176]2025年04月16日 20时40分00秒