什么是XML文件?
在软件的配置选项中,经常可以看到XML文件的身影。XML文件的全称是:Extensible Markup Language(可扩展标记语言),它定义了代码文件的一系列规则,它的格式既方便人阅读,也方便机器阅读。XML文件的规格全部是开源的。
关键术语:
Character:XML文件里面几乎可以出现任意字符。
Processor和Application:处理器会分析标签,将结构信息传送给应用。XML的规格要求了处理器必须执行和禁止执行的操作,但是应用不受此限制。Processor通常被称为parse(解析器)。
Markup和content:标记和内容。标记通常以" < "开始,以" > "结束,或者以" & "开始,以" ; "结束。
Tag:标签。标签采用了标记的结构,它分为三种:
起始标签:
结束标签:
空白标签:
Element:元素。元素由一组起始标签和结束标签(或者一个空白标签)构成。元素可以包含元素,被包含的元素称为子元素。
Attribute:属性。属性也采用标记结构,属性的名称和值放置在起始标签或者空白标签中,比如:
一个属性只能包含一个值,任一属性只能在一个元素里出现一次。如果值需要表示为一个列表,则在值本身定义,比如:
XML Declaration:XML声明,比如:
另外,可以使用预定义的字符串表示特殊的标记字符:
<,表示" < "
>,表示" > "
&,表示" & "
&apos,表示" ' "
",表示" " "
有关注释:
XML文件的注释可以出现在Markup外的任何地方。注释以" "结束,同时" -- "不允许出现在注释中,因此注释不可嵌套。
------------------------------
有关错误处理:
XML解析器解析XML文件时,遇到错误的语法就会停下来。这种策略被称为"draconian error handleing"。与之相反的是HTML,HTML是即使遇到错误,也会给出尽可能多的结果,这种策略被称为" Postel's law"。
------------------------------
以上是XML文件的基础。基础中的基础知识。XML的规格有很多种,解析工具也有很多,程序使用它的接口也有很多,这些以后用到的时候再学习。本次笔记就到这里。
文章评论(0条评论)
登录后参与讨论