XPath 表达式语法详解

XPath 路径表达式

XPath 即为 XML 路径语言,它是一种用来确定 XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath 基于 XML 的树状结构,提供在数据结构树中找寻节点的能力。XPath 使用路径表达式去确定 XML 文档中的节点。

示例 XML 文档

我们将利用下面的 XML 文档描述 XPath 语法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<?xml version="1.0" encoding="GB2312"?>

<order>
  <item catalog="parts">
    <itemNumber>C2688-67037</itemNumber>
    <description>LCD液晶显示器</description>
    <quantity>1</quantity>
    <price>358.00</price>
  </item>
 <item catalog="parts">
    <itemNumber>C2688-67061</itemNumber>
    <description>音箱</description>
    <quantity>1</quantity>
    <price>16.50</price>
  </item>
  <item catalog="parts">
    <itemNumber>C2688-67010</itemNumber>
    <description>鼠标</description>
    <quantity>1</quantity>
    <price>8.50</price>
  </item>
</order>

从根节点选取 “/”

XML 文挡可以表示为树结构节点形式 XPath 使用模式表达式识别 XML 文档的节点。 一个 XPath 的模式是使用反斜杠 “/” 分开子元素名称描述路径 下面的 XPath 表达式选择元素 order 下元素 item 中的所有 price 元素

/order/item/price

注释:用 “/” 路径开始代表元素的绝对路径,不用 “/” 路径开始代表元素的相对路径

item/price

从整个文档选取 “//”

用 “//” 路径开始代表整个文档满足条件的所有元素,不考虑它们的位置 下面的 XPath 表达式选择文档中所有的 item 元素

//item

选择未知元素 “*”

通配符 “*” 可用于选择未知 XML 元素 下面的 XPath 表达式选择元素 order 中的所有 item 元素所属的子元素

/order/item/*

下面的 XPath 表达式选择元素 order 下所有孙子辈的 price 元素

/order/*/price

下面的 XPath 表达式选择所有具有两个祖先的 price 元素

///price

下面的 XPath 表达式选择文档所有元素

//*

选择分支 “[]”(谓语)

使用方括号 [] 可以指定特定的元素 下面的 XPath 表达式选择元素 order 中的第一个 item 的子元素

/order/item[1]

下面的 XPath 表达式选择元素 order 中的最后一个 item 的子元素

/order/item[last()]

下面的 XPath 表达式选择元素 order 中具有 price 元素的 item 元素

/order/item[price]

下面的 XPath 表达式,从元素 order 中选择具有 price 等于 12.60 元素的 item 元素

/order/item[price=16.50]

下面的 XPath 表达式,从隶属于元素 order 的 item 元素中选择具有 price 等于 12.60 元素的 price 元素

/order/item[price=16.50]/price

选择几个路径 “|”

在 XPath 表达式中,使用 “|” 运算符可以选择几个路径 。实质上是逻辑 “与” 操作 下面的 XPath 表达式,从隶属于 order 的 item 元素中选择所有 itemNumber 和 description 元素

/order/item/itemNumber | /order/item/description

下面的 XPath 表达式,从文档中选择所有 itemNumber 和 description 元素

//itemNumber | //description

下面的 XPath 表达式,从文档中选择所有 itemNumber ,description 和 price 元素

//itemNumber | //description | //price

下面的 XPath 表达式,选取属于 order 中 item 下所有 itemNumber 元素和从文档中选择所有 description 元素

/order/item/itemnumber | //description

选择属性 “@”

在 XPath 中,所有属性使用 @前缀 下面的 XPath 表达式,选取所有名为 catalog 的属性

//@catalog

下面的 XPath 表达式,选取所有具有 catalog 属性的 item 元素

//item[@catalog]

下面的 XPath 表达式,选取所有具有任何属性的 item 元素

//item[@*]

下面的 XPath 表达式,选取所有具有 catalog 等于”parts” 属性的 item 元素

//item[@catalog=”parts”]

总结

(1)选取节点 下面列出了最有用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

(2)谓语(Predicates) 谓语用来查找某个特定的节点或者包含某个指定的值的节点。 谓语被嵌在方括号 [] 中。 (3)选取未知节点 XPath 通配符可用来选取未知的 XML 元素。

通配符 描述
* 匹配任何元素节点。
@* 匹配任何属性节点。
node() 匹配任何类型的节点。

(4)选取若干路径 通过在路径表达式中使用 “|” 运算符,您可以选取若干个路径。 更多有关 XPath 语法规则请访问 W3CSchool