XML基础XML概念XML (EXtensible Markup Language)指可扩展标记语言,XML 被设计用来传输和存储数据没有任何行为的 XML也许这有点难以理解,但是 XML 不会做任何事情。
XML 被设计用来结构化、存储以及传输信息下面是 John 写给 George 的便签,存储为 XML:GeorgeJohnReminder
Dont forget the meeting!上面的这条便签具有自我描述性它拥有标题以及留言,同时包含了发送者和接受者的信息,XML 标签没有被预定义,需要自行定义标签。
这个 XML 文档仍然没有做任何事情它仅仅是包装在 XML 标签中的纯粹的信息我们需要编写软件或者程序,才能传送、接收和显示出这个文档用途(作用)XML 应用于 web 开发的许多方面,常用于简化数据的存储和共享。
· XML 把数据从 HTML 分离· XML 简化数据共享· 简化数据传输· 简化平台的变更· 使您的数据更有用语法(规则)所有 XML 元素都须有关闭标签
标签对大小写敏感XML 标签对大小写敏感在 XML 中,标签 与标签 是不同的必须使用相同的大小写来编写打开标签和关闭标签:这是错误的。
这是正确的XML 必须正确地嵌套在 HTML 中,常会看到没有正确嵌套的元素,下述语句是错误的This text is bold and italic。
在 XML 中,所有元素都必须彼此正确地嵌套:This text is bold and italicXML 文档必须有根元素XML 文档必须有一个元素是所有其他元素的父元素。
该元素称为根元素.....XML 的属性值须加引号与 HTML 类似,XML 也可拥有属性(名称/值的对)。
在 XML 中,XML 的属性值须加引号请研究下面的两个 XML 文档第一个是错误的,第二个是正确的:GeorgeJohn。
GeorgeJohn在第一个文档中的错误是,note 元素中的 date 属性没有加引号。
XML 中的注释在 XML 中编写注释的语法与 HTML 的语法很相似:XML树结构XML 文档形成一种树结构XML 文档必须包含根元素该元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。所有元素均可拥有子元素。
上图表示下面的 XML 中的一本书:
例子中的根元素是 文档中的所有 元素都被包含在 中 元素有 4 个子元素:、、、。
XML元素XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。元素可包含其他元素、文本或者两者的混合物。元素也可以拥有属性。
在上例中, 和 都拥有元素内容,因为它们包含了其他元素 只有文本内容,因为它仅包含文本在上例中,只有 元素拥有属性 (category="CHILDREN")。
XML 属性属性通常提供不属于数据组成部分的信息在下面的例子中,文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:computer.gif元素与属性的选择和应用
下面的三个 XML 文档包含完全相同的信息:方法一:使用 date 属性GeorgeJohnReminder
Dont forget the meeting!方法二:使用了date 元素08/08/2008George
JohnReminderDont forget the meeting!方法三:使用扩展的 date 元素
08082008GeorgeJohnReminder
Dont forget the meeting!形式良好的 XML 文档"形式良好"或"结构良好"的 XML 文档拥有正确的语法"形式良好"(Well Formed)的 XML 文档会遵守前几章介绍过的 XML 语法规则:。
· XML 文档必须有根元素· XML 文档必须有关闭标签· XML 标签对大小写敏感· XML 元素必须被正确的嵌套· XML 属性必须加引号
GeorgeJohnReminder
Dont forget the meeting!查看 XML 文件通过右击浏览器,查看页面源代码的方式,查看XML文件。
XML实例1. 用XML表示中国部分省市数据
源码: 中国 黑龙江
哈尔滨 大庆 广东 广州
深圳 珠海 台湾 台北
高雄 新疆 乌鲁木齐
XML高级所有 XML 文档中的文本均会被解析器解析只有 CDATA 区段(CDATA section)中的文本会被解析器忽略1. PCDATAPCDATA 指的是被解析的字符数据(Parsed Character Data)。
XML 解析器通常会解析 XML 文档中所有的文本当某个 XML 元素被解析时,其标签之间的文本也会被解析:此文本也会被解析解析器之所以这么做是因为 XML 元素可包含其他元素,就像这个例子中,其中的 元素包含着另外的两个元素(first 和 last):。
BillGates而解析器会把它分解为像这样的子元素:BillGates
CDATA术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)在 XML 元素中,"<" 和 "&" 是非法的"<" 会产生错误,因为解析器会把该字符解释为新元素的开始。
"&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始某些文本,比如 JavaScript 代码,包含大量 "<" 或 "&" 字符为了避免错误,可以将脚本代码定义为 CDATACDATA 部分中的所有内容都会被解析器忽略。
CDATA 部分由 "" 结束:
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。