原创 XML文件--学习笔记

2017-7-11 19:32 1113 19 19 分类: 软件与OS

什么是XML文件?

在软件的配置选项中,经常可以看到XML文件的身影。XML文件的全称是:Extensible Markup Language(可扩展标记语言),它定义了代码文件的一系列规则,它的格式既方便人阅读,也方便机器阅读。XML文件的规格全部是开源的。


XML文件的设计规则是简单、通用、易用。它的规格和解析工具都在不断完善。


关键术语:

Character:XML文件里面几乎可以出现任意字符。

Processor和Application:处理器会分析标签,将结构信息传送给应用。XML的规格要求了处理器必须执行和禁止执行的操作,但是应用不受此限制。Processor通常被称为parse(解析器)。


Markup和content:标记和内容。标记通常以" < "开始,以" > "结束,或者以" & "开始,以" ; "结束。

Tag:标签。标签采用了标记的结构,它分为三种:

起始标签:



结束标签:


空白标签:


Element:元素。元素由一组起始标签和结束标签(或者一个空白标签)构成。元素可以包含元素,被包含的元素称为子元素。

Attribute:属性。属性也采用标记结构,属性的名称和值放置在起始标签或者空白标签中,比如:

或者:





一个属性只能包含一个值,任一属性只能在一个元素里出现一次。如果值需要表示为一个列表,则在值本身定义,比如:

Welcome!


XML Declaration:XML声明,比如:


另外,可以使用预定义的字符串表示特殊的标记字符:

&lt,表示" < "

&gt,表示" > "

&amp,表示" & "

&apos,表示" ' "

&quot,表示" " "




有关注释:

XML文件的注释可以出现在Markup外的任何地方。注释以" "结束,同时" -- "不允许出现在注释中,因此注释不可嵌套。

------------------------------

有关错误处理:

XML解析器解析XML文件时,遇到错误的语法就会停下来。这种策略被称为"draconian error handleing"。与之相反的是HTML,HTML是即使遇到错误,也会给出尽可能多的结果,这种策略被称为" Postel's law"。

------------------------------

以上是XML文件的基础。基础中的基础知识。XML的规格有很多种,解析工具也有很多,程序使用它的接口也有很多,这些以后用到的时候再学习。本次笔记就到这里。


PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
我要评论
0
19
关闭 站长推荐上一条 /3 下一条