Xpath - 琳尼克斯 - ITeye博客

`

killeraction

浏览: 238918 次
性别:
来自: 深圳

最近访客更多访客>>

payaoxing

song_in_china

guogongjun

话说不能说

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hello_yunyun：咋不上线啊哥们上线后看到留言回复一下吧等后着啊
mysql协议实现
hello_yunyun：做的很不错很想看一下能否发一个完整的啊下载后跑不起来 ...
mysql协议实现

Xpath

阅读更多

XPath使用路径表达式去确定XML文档中的节点。

我们将利用下面的XML文档描述XPath语法

<?xml version="1.0" encoding="GB2312"?>

<order>
<item catalog="parts">
    <itemNumber>C2688-67037</itemNumber>
    <description>LCD液晶显示器</description>
    <quantity>1</quantity>
    <price>358.00</price>
</item>
    <item catalog="parts">
    <itemNumber>C2688-67061</itemNumber>
    <description>音箱</description>
    <quantity>1</quantity>
    <price>16.50</price>
</item>
    <item catalog="parts">
    <itemNumber>C2688-67010</itemNumber>
    <description>鼠标</description>
    <quantity>1</quantity>
    <price>8.50</price>
</item>
</order>

节点定位：

XML文挡可以表示为树结构节点形式
XPath使用模式表达式识别XML文档的节点。

一个XPath的模式是使用反斜杠“/”分开子元素名称描述路径

下面的XPath表达式选择元素order下元素item中的所有price元素
/order/item/price

注释：用“/”路径开始代表元素的绝对路径.

不用“/”路径开始代表元素的相对路径

item/price

用“//”路径开始代表整个文档满足条件的所有元素

下面的XPath表达式选择文档中所有的item元素
//item

选择未知元素

通配符 “*”可用于选择未知XML元素

下面的XPath表达式选择元素order中的所有item元素所属的子元素

/order/item/*

下面的XPath表达式选择元素order下所有孙子辈的price元素
/order/*/price

下面的XPath表达式选择所有具有两个祖先的price元素
/*/*/price

下面的XPath表达式选择文档所有元素
//*

选择分支

使用方括号[]可以指定特定的元素

下面的XPath表达式选择元素order中的第一个item的子元素

/order/item[1]

下面的XPath表达式选择元素order中的最后一个item的子元素
/order/item[last()]

下面的XPath表达式选择元素order中具有price元素的item元素
/order/item[price]

下面的XPath表达式,从元素order中选择具有price等于12.60元素的item元素
/order/item[price=16.50]

下面的XPath表达式,从隶属于元素order的item元素中选择具有price等于12.60元素的price元素
/order/item[price=16.50]/price

选择几个路径

在XPath表达式中，使用 "|" 运算符可以选择几个路径。实质上是逻辑“与”操作

下面的XPath表达式,从隶属于order的item元素中选择所有itemNumber 和description 元素
/order/item/itemNumber | /order/item/description

下面的XPath表达式,从文档中选择所有itemNumber 和description 元素
//itemNumber | //description

下面的XPath表达式,从文档中选择所有itemNumber ，description和price 元素
//itemNumber | //description | //price

下面的XPath表达式,选取属于order中item下所有itemNumber元素和从文档中选择所有description元素
/order/item/itemnumber | //description

选择属性
在XPath中，所有属性使用@前缀

下面的XPath表达式,选取所有名为catalog的属性
//@catalog

下面的XPath表达式,选取所有具有catalog属性的item元素
//item[@catalog]

下面的XPath表达式,选取所有具有任何属性的item元素
//item[@*]

下面的XPath表达式,选取所有具有catalog等于"parts"属性的item元素
//item[@catalog="parts"]

分享到：

使用 Google Web 工具箱进行 XML 开发 | w3c文档

2010-12-05 22:47
浏览 1325
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Xpath生成器，自动生成XPATH，C#版: Xpath生成器，自动生成可用的Xpath

经典xpath教材打包: 经典xpath教材打包， XPath是W3C定义的语言和正式的W3C推荐的语言，W3C拥有XML Path Language (XPath) Version 1.0规范。XPath诞生于1999年，作为对XSLT和XPointer语言的补充，但近来已成为流行的独立语言，因为单个...

Xpath生成器，自动生成可用的Xpath。: Xpath生成器,可以通过输入的文件，进行匹配，生成全部可用的Xpath，犹豫HTML中部分标签允许无结束，如：（"LINK" ，"META"，"SCRIPT"，"IMG" ，"INPUT"， "FORM"）故已经被忽略，如有朋友发现其中有问题，请告诉我哦...

javascript-xpath-latest.js: 1. 更换默认的xpath库除了ie，其他主要浏览器都是内置对xpath的支持的，但ie不行，所以selenium 使用了javascript库，默认使用的是ajaxslt，这个会比较慢，可以换成 javascript-xpath，虽然比firefox还是慢...

xpath-helper.zip: xpath-helper

XPath教程（描述XPath的用法）: XPath：描述了XPath的用法，XPath多应用于XML文件的解析，这是一个非常棒的文档！

XPathHelper插件forChrome(爬虫网页解析工具)v1.0.13官方免费安装版: XPath Helper插件是一款可以安装到谷歌浏览器上使用并且支持所有chrome内核浏览器的爬虫网页解析工具,使用XPath Helper可以让你轻松获取HTML元素的xPath,不用再手动获取捕捉，极大地提高了我们的工作效率。...

xpath-helper for MAC: Xpath helper 2.0.2，适用于MAC版，提供的了压缩包，下载后，解压缩-打开chrome->更多工具->扩展程序->加载已经解压的扩展程序->找到解压的文件夹选中，此时会发现地址栏后面多了一个“X”的图标，此时F12，点击...

IE下获取XPATH小工具源码_xpath_: C#小工具箱 IE下获取XPATH小工具源码

xpath实例语法教程及IBM使用的xpath路径观察器: 不可多得的xpath实例语法教程，里面有详细的实例，是学习xpath的好助手。同时还提供了IBM等大公司都在使用的xpath操作选择路径的观察器及验证器，该观察器及验证器功能很强大，你只要输入xpath查找路径，验证器会...

自动解析HTML代码，生成所有可用Xpath: 由于最近需要对网站进行数据提取，故是用Xpath，在网上并没有找到可以自动生成Xpath。所以抽出一点时间，赶出来一个可以自动生成Xpath的小工具，并支持在生成好的Xpath中进行匹配自己需要的内容，并输入对应的Xpath...

XpathDemo.zip: 现在常用的网页解析工具有：Jsoup，JsoupXpath，HtmlCleaner。 jsoup 是一款Java 的XML、HTML解析器，可直接解析某个URL地址、HTML文本内容和已经存在的文件。 JsoupXPath是基于Jsoup的拓展，使用路径的形式解析XML...

XPath路径表达式详解: 经常在工作中会使用到XPath的相关知识，但每次总会在一些关键的地方不记得或不太清楚，所以免不了每次总要查一些零碎的知识，感觉即很烦又浪费时间，所以对XPath归纳及总结一下

XPath教程.rar: XPath 将一个 XML 文档建模成为一棵节点树，有不同类型的节点，包括元素节点，属性节点和正文节点。XPath 定义了一种方法来计算每类的节点的字串值。一些节点的类型也有名字。XPath 充分支持 XML 命名空间［XML ...

谷歌浏览器XPath2.0插件: XPath Helper插件是一款可以安装到谷歌浏览器上使用支持所有chrome内核浏览器的爬虫网页解析工具,使用XPath Helper可以让你轻松获取HTML元素的xPath,不用再手动获取捕捉。

XPathUtil,根据Xpath解析xml文件: 之前找了好多感觉和自己的需求不太一样,这个可以根据Xpath解析出来xml里所有的信息,十分好用举个例子 xmlPath = "E://upload/xml/1580242.163.xml"; XPathUtil util = XPathUtil.newInstance(xmlPath); Product ...

XPath Helper 2.0.2网页插件: xpath

xpath定位，xpath定位，xpath定位: Selenium xpath,

XPath Helper.crx: xpath helper插件是一款免费的chrome爬虫网页解析工具。可以帮助用户解决在获取xpath路径时无法正常定位等问题。该插件主要能帮助你在各类网站上通过按shift键选择想要查看的页面元素来提取查询其代码，同时你还能对...

XPath Helper插件是一款Chrome爬虫网页解析工具: XPath Helper插件是一款免费的Chrome爬虫网页解析工具，可以帮助用户解决在获取XPath路径时无法正常定位等问题安装了XPath Helper后就能轻松获取HTML元素的XPath，该插件主要能帮助我们在各类网站上查看的页面元素...

Global site tag (gtag.js) - Google Analytics