xml

用于数据管理,显示和组织等方面

目录

  1. xpath
  2. dom
  3. schema
  4. dtd

dtd

内部声明

DTD 被包含在您的 XML 源文件中,它应当通过下面的语法包装在一个 DOCTYPE 声明中.文档实例如下:

<?xml version="1.0"?>
<!DOCTYPE note [
    <!ELEMENT note (to,from,heading,body)>
    <!ELEMENT to (#PCDATA)>
    <!ELEMENT from (#PCDATA)>
    <!ELEMENT heading (#PCDATA)>
    <!ELEMENT body (#PCDATA)>
]>
<note>
    <to>George</to>
    <from>John</from>
    <heading>Reminder</heading>
    <body>Don't forget the meeting!</body>
</note>

以上 DTD 解释如下:

  • !DOCTYPE note (第二行)定义此文档是 note 类型的文档。
  • !ELEMENT note (第三行)定义 note 元素有四个元素:"to、from、heading,、body"
  • !ELEMENT to (第四行)定义 to 元素为 "#PCDATA" 类型
  • !ELEMENT from (第五行)定义 frome 元素为 "#PCDATA" 类型
  • !ELEMENT heading (第六行)定义 heading 元素为 "#PCDATA" 类型
  • !ELEMENT body (第七行)定义 body 元素为 "#PCDATA" 类型

外部声明

假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:<!DOCTYPE 根元素 SYSTEM "文件名">

这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD

声明属性

  • ATTLIST
  • 语法:<!ATTLIST 元素名称 属性名称 属性类型 默认值>
  • DTD:<!ATTLIST payment type CDATA "check">
  • XML:<payment type="check" />

属性类型的选项

  • CDATA 值为字符数据 (character data)
  • (en1|en2|..) 此值是枚举列表中的一个值
  • ID 值为唯一的 id
  • IDREF 值为另外一个元素的 id
  • IDREFS 值为其他 id 的列表
  • NMTOKEN 值为合法的 XML 名称
  • NMTOKENS 值为合法的 XML 名称的列表
  • ENTITY 值是一个实体
  • ENTITIES 值是一个实体列表
  • NOTATION 此值是符号的名称
  • xml: 值是一个预定义的 XML 值

xsd 与 dtd

xsd的前景更好一些,dtd拥有的功能xsd全都有,xsd又比dtd丰富了一些功能。

xsd跟dtd比较有如下优点:

  1. xsd基于xml编辑,遵守xml语法
  2. xsd大大扩充了数据类型
  3. xsd支持命名空间
  4. xsd支持扩展
  5. xsd支持元素的继承
  6. xsd支持元素组、属性组

schema


xpath

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

  1. 路径表过式
  • nodename #选取此节点的所有子节点

  • / #从根节点选取

  • // #从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置

  • . #选取当前节点

  • .. #选取当前节点的父节点

  • @ #选取属性

  • 谓语用来查找某个特定的节点或者包含某个指定的值的节点,谓语被嵌在方括号中.

  • /bookstore/book[1]

    选取属于 bookstore 子元素的第一个 book 元素。

  • /bookstore/book[last()]

    选取属于 bookstore 子元素的最后一个 book 元素。

  • /bookstore/book[last()-1]

    选取属于 bookstore 子元素的倒数第二个 book 元素。

  • /bookstore/book[position()<3]

    选取最前面的两个属于 bookstore 元素的子元素的 book 元素。

  • //title[@lang]

    选取所有拥有名为 lang 的属性的 title 元素。

  • //title[@lang='eng']

    选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。

  • /bookstore/book[price>35.00]

    选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。

  • /bookstore/book[price>35.00]/title

    选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00

  • 选取未知节点,可用通配符来选取未知的 XML 元素

  • * #匹配任何元素节点。

  • @* #匹配任何属性节点。

  • node() 匹配任何类型的节点。

  • 选取若干路径,通过在路径表达式中使用“|”运算符,您可以选取若干个路径

  • //title | //price #选取文档中的所有 title 和 price 元素。

  • /bookstore/book/title | //price #选取属于 bookstore 元素的 book 元素的所有 title 元素,以及文档中所有的 price 元素。