和HTML一样,可扩展的标记语言XML也起源于SGML,是SGML的一个子集。XML 1.0标准于1998年2月10日公布。它的公布引起了人们的广泛关注,XML被认为是继HTML和Java编程语言之后的又一个里程碑式的Internet技术。
XML开发者会告诉你XML不是一种语言,而是一个定义其他语言的系统. 你可能已经听说过, 或使用过这些语言中的一种,--如Microsoft支持"推技术"的 Channel Definition Format(CDF).
正从事于XML相关建议工作的W3C, 称XML为"表达数据中结构 的共同语法". 结构化的数据指的是其内容,意义或应用被标记的数据. 例如, HTML中<H1>标记指定文本为某一字体和大小, XML的标记将明确确定信息的种类: <BYLINE>标记可以识别文档的作者, <PRICE>标记可以在一个存货清单中包含某一项目的成本 .
通过将结构,内容和表现分离, 同一个XML源文档只写一次, 可以用不同的方法表现出来: 在计算机屏幕上, 在手提电话显示屏上, 在为盲人服务的设备上翻译成语音, 等等. 它可以在可能开发的任何通讯产品上工作. 一个XML文档因此可以比其书写时的作者和显示技术生存得更久.
所以, XML将不仅限于Internet, 例如, 可以服务于整个出版业, 特别是对于想制作可出现在多种媒体上的文档的人. 一些使用Standard Generalized Markup Language (SGML)多年的大型文档出版商将转向XML. 还有, 独立于平台的XML是为Web开发的, 这是它将最具影响的地方.
XML在Web的真正实力在于它是如何与文档对象模型(Document Object Model,DOM)交互的. DOM定义了访问XML文档数据的接口.
程序员利用DOM可以用标准的方法编写动态的内容. 换句话说, 他们可以使用它来使浏览器文档树中的一部分特定内容按照一定的方式表现, 例如, 当用户将鼠标移至文字上时, 这些文字变成蓝色. Netscape Navigator 和 Microsoft Internet Explorer浏览器都有各自的DOM, 但是他们都称将在其下一版本的浏览器中支持W3C 的标准DOM.
XML将帮助解决以上问题, 因为网站建设者不用再指明在哪里显示什么, 而是指明文档 的结构. 例如, 你可以说明文档的标题, 作者, 关联文档的清单, 等等. 然后, 任何一个有XML浏览器的设备都可以给出最适合它的文档版本, 这样的设备可以是一个掌上型计算机, 置顶盒, 或高速的工作站.
但是, 也许XML的最佳特性是其内在的可扩展性. 公司和组织能够扩展XML来满足新的挑战和应用. 一个基于XML的语言已经在使用--微软的Channel Definition Format (CDF)-- 还有更多将出现, 包括 Resource Definition Format (RDF) 和 Open Software Description (OSD).
XML 也允诺成为交换数据 和文档的标准机制. 例如, XML可能成为不同厂商的数据库在Internet上交换信息的一种方法.现在准确地决定XML的方向还有一些早. 但是, 其各种可能性是令人敬畏的,这就是为什么围绕着XML有如此多的激动的一个重要原因.
HTML,SGML和XML将继续用于其合适的地方, 它们中的任何一个不会使其他一个废弃. HTML仍是在Web上快速出版数据的最简单的方法, 大部分短期的数据, 如会议议程或广告宣传册. 如果数据会长期使用, 并且需要更多的一些结构, Web建造者将愿意使用XML. 不同于HTML和XML, SGML可能永远不会在Internet上被广泛接受, 因为它从来没有为某个网络协议的需求而设计或优化过. 对于高端的, 复杂结构的出版应用, SGML将继续适用.
XML是用来存放数据的;
XML不是HTML的替代品,XML和HTML是两种不同用途的语言。
XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。
HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。
HTML是与显示信息相关的, XML则是与描述信息相关的。
在这些情况下, 你都可能需要三层架构: 后端数据库, 针对数据的处理逻辑的中间层服务器, 以及数据进一步显示和处理的客户端. 数据库可以从多个数据来源接收信息, 可能已经是XML格式的数据. 中间层然后收集数据并在最终的表现层上输出和表现..
现在, 网页有时候以这种方法传送 --CNET的NEWS.COM从一个数据库中发表数据.但是要获得一页的新的视图,如NEWS.COM的新的“打印机友好”选项, 服务器必须产生一个新的页面. 一份适当格式化的XML文档将允许客户端的应用为不同的媒体修改文档的表现形式, 比如为打印机.
一些供应商, 包括微软, 已经提议了替代DTD的一个方法, 称为schema. 他们已经将其以XML数据提交给了W3C. 就象DTD, Schema提供了文档的规则, 并指出用什么标记符, 标记符的属性, 之间的联系, 等等.但是,不同于DTD, schema可以定义数据类型. 例如, DTD可能有一个标记符 <PRICE>, 而标记符之间的内容可以是数字或字符串. Schema 可以规定只输入数字.这个方法显然有其优点, 特别是用于应用,对象,或数据库之间的数据传输. 唯一的问题是它将成为DTD规范, 还是XML的一个扩展.
有效的XML文档遵守某个特定的DTD.确认XML文档正确性的工作主要由制作出版工具承担,而XML浏览器为读取XML文档,只需要检查其构造的良好性. 这样, 制作工具中的解析器得要检查构造良好性 和 有效性, 而浏览器仅要考虑寻找已经构造良好的XML.
XML开发者团体提供免费的XML阅读器和解析器, 来应用到应用软件或XML制作软件:
Textuality的 Lark, 来自XML标准的作者之一.
Microstar的 AElfred, 一个基于Java的解析器.
DataChannel的 DXP, 前身为著名的NXP, 或已经增加了API的Norbert的 (Mikula) XML 解析器.
RDF是一种描述和访问数据方法. 这意味着RDF是关于数据的数据, 或者说元数据. 在Web中, 这些元数据将被用于建立标准的站点地图, 更精确的搜索结果, 和分层次的主题索引. RDF也允许智能书签, 当被索引的网页变化时, 书签随之发生变化. 如果你跟踪内容定期更新的站点, 比如CNET的 NEWS.COM, 将很有用.对于网站建设者,建立可被搜索引擎引用的其网站内容的元数据并不困难. 我们很快就会有商业化的软件, 来自动产生给定站点的RDF文件.
XML元数据也将活跃数据描述和评估的市场. 有许多评级机构在网上出现, 他们评估一切数据, 从保护孩子安全的站点到最佳电影或葡萄酒站点. RDF可以使用的等级的语法来描述评级机构.人们将选择有他们感觉最合适的词汇表的评级机构,词汇表指的是评级机构给不同类型内容评级使用的特别的一套术语 -- 从性和暴力到葡萄酒酸度.
Aurora在网络、桌面和数据库之间查找和管理信息.它将在桌面上以"窗口"菜单的界面出现,会聚指向当前项目, 研究主题或日常活动等资源的指针.RDF使Aurora的导航条指向不同数据类型(文字处理文档、表格数据、电子邮件消息、数据库内容)的本地文件, 也指向Internet 或Intranet 服务器上的资源(搜索和查询的结果、书签链接等).
Netscape 5.0 版浏览器中提供了一个读取RDF的XML解析器,在产品最终交付前会以beta版出现.除了该RDF的实现, Netscape正计划将一个通用的XML解析器包含在浏览器中, 而其浏览器可以和其他的XML应用软件一起工作, 比如化学标记语言(CML)和数学标记语言(MathML).
"我们要使Navigator成为一个XML平台,"Netscape原理工程师R.V. Guha这样说.Guha 原来开发过MCF (Meta Content Format), MCF 后来加入了RDF规范.
据微软的产品经理Steve Sklepowich称, 这两个解析器都是"通用的", 因为它们不依靠特定的XML应用, 如CDF.由于XML数据和其表现分离, 在一个浏览器本身实际显示XML的能力需要样式表,例如XSL.
同时, 微软使用了它所称的XML数据源对象(XML Data Source Object,XML DSO).它应用了动态HTML的数据捆绑能力, 将一端的XML数据和另一端的HTML数据相链接.IE 4.0访问XML文档,从中查询数据, 然后作为HTML显示出来.
微软也使用了 XML对象模型来让开发者与浏览器中的XML数据进行交互. 它的实现是通过将HTML作为基于文档对象模型(DOM)的对象显现, 尽管HTML 和 DOM 并非直接兼容. DOM 让脚本和程序访问结构化的XML数据.
Sklepowich说, 虽然目前在微软, XML的重心在浏览器, XML将最终出现在"任何HTML已经出现了的地方".Bill Gates 已经公开宣布微软Office 未来的版本将支持 XML, 而且公司也计划支持电子邮件包和制作XML工具的标准.
Open Software Description 是用于描述软件部件的词汇表, 带有语法如从属, 版本和平台. OSD 描述如何表现一个部件的特性, 以及如何将该部件安装到计算机上. 它可以用于下载一个完整的软件包, 但是它主要设计用于不断增加的更新. OSD 单独工作或和CDF一起工作, 来定义应用频道. OSD建议由微软和Marimba领导的一组销售商于1997年8月提供给W3C.
内容定义:CommerceNet 正在定义通用于多种商业事务的数据元素. 这个称作商务核心(Commerce Core)的东西将定义如何给诸如公司名称、地址、价格、条款和数量等事物作标识.
信息交换:开放,基于文本的XML用于服务器之间交换事务信息很理想.CommerceNet 提议用基于XML的通用商务语言(Common Business Language,CBL)来描述产品和服务目录软件, 关于商业规则和系统的元数据, 以及表格和消息的软件. 许多CBL 取自已经存在的 Electronic Data Interchange (EDI) 辞典, EDI辞典识别公认的术语, 如发票和采购订单. 但是CBL超越EDI的商业-到-商业的重点, 包含了零售事务和横向的供应链 -- 从供应商到批发商到零售商.
这样的一个CBL应用是为使目录互用的产品信息互换( Product Information Exchange,PIX)规范. CommerceNet设计PIX, 以帮助供应商和他们的分销商更容易地交换产品数据. 长远的目标是工业组织--而非 CommerceNet--来将CBL作为特定的DTD的一个共同基础使用. 一些着重于工业的初步尝试已经宣布了:
Internt开放支付(OBI): 一个在Internet上进行国际性的商业间购物的标准.OBI基于目前的Internet标准, 如SSL(安全性)、SET(信用卡交易)和X.509(数字认证). OBI的支持者有Commerce One、Connect、Intelisys、InterWorld、Microsoft、Netscape、Open Market、和Oracle.
开放贸易协议(OTP): 一个在Web上向消费者售物的一致的, 可共同操作的环境. 规则将包括从如何降价促销, 付款选择, 到产品运输, 接收和问题解决. OTP由MasterCard International, DigiCash, CyberCash, Hewlett-Packard, IBM, AT&T Universal Card, Netscape, Royal Bank of Canada, 和一些 其他金融机构和技术公司支持.
Internet内容交换标准(ICE): Vignette, Firefly Network, 和 一些其他公司--包括微软--正在开发一个叫作ICE的规范, 使能够在站点之间交换在线资产, 无论那是内容, 应用程序, 或是元数据. ICE将利用现有的标准, 包括 OPS/P3P (使个人数据可靠交换), CDF,OSD和RDF.
(14) XML中的层叠样式?
因为XML将内容和表现分离, Web建造者需要新的方法来控制设计, 显示和输出. Style sheet 是问题的答案. 目前, 有三种可用于XML的 样式表:
Cascading Style Sheets (CSS)
Extensible Style Language (XSL)
Document Style Semantics and Specification Language (DSSSL).
如果5.0版的浏览器支持XML, XML对现有的CSS标准的支持将会处理大部分基本的风格和页面问题. 但是CSS对于专业出版商可能不够强大. 所以, 另一端存在着DSSSL, 一个在使用SGML的高端出版商中流行的ISO (国际标准组织)标准. 然而, DSSSL是复杂的, 它处理的打印文档管理在Web上很少有用.
现在剩下了XSL,特别为XML而写的样式表.XSL目前上交给了W3C作为一个建议标准,其中的XSL转换部分(XSLT)已经于1999年11月成为正式的规范. 它给了Web开发者和用户较HTML更多的表现灵活性. 例如, HTML的<H2>标识符在所有浏览器上的表现是基本一样的, 但是XSL让开发者指定他们的页面元素如何表现(尽管用户可以在个人设置中重载它).
XSL较CSS更强大, 因为它使Web建造者创建可以动态改变其表现的文档. 例如, 你可以包含这样的程序语句, "如果一个XML元素的属性为数值10, 显示为绿色, 否则为黑色." 或者你可以将"仅供内部使用"作为属性给一个段落标上, 这样它在某些情况下不会出现. XSL被设计用于脚本语言如JavaScript.
XPointer: 在HTML, 要链接到一个页面的中间, 页面作者必须在那儿加上定位标识符. 使用XPointer, 你可以"取址到" (不是"连接到")其他人的文本的任何部分. 显而易见, 这样将有助于工作于法律文件, 科学和学术论文, 甚至W3C规范!
XLink: 当用户点击一个HTML超链接时, 当前的网页被连接到的文件替代. XLink令Web建立者给链接增加行为. 例如, 现在, 你必须用一些JavaScript, 使在链接处弹出一个独立的窗口, 但是XLink让Web建立者对链接进行编码来执行一系列动作, 包括弹出一个链接选择的菜单.
另一个应用可以是弹出一个对话框, 可能是一个提醒用户它们正要更新数据库的警告. 链接弹出菜单可能需要用户点击一个框来表示在进一步处理前他们接受义务. 现在, 实现这样的功能要写许多的脚本代码.
XML也让Web建立者创建类似Web环工作的Extended Link, Web环是通过"下一个/前一个"行进来导航的自己选择出来的关于相同主题的网站组. 对于弹出菜单太长的相关链接站点表, Web建立者可以创建一个链接表, 这个表在不同的站点, 页面时会有变化. 用户可以点击一个图标来自动转移到环中的下一个成员. 现在这样的功能需要 CGI scripts, 而Extended Links 提供了一个标准的, 非私有的建立资源间联系的方法.
仍然有更多的问题需要解决, 特别是在行为政策方面. 必须由一种方法来协调以下三方面的关系: 文档作者对链接所建议的行为, 用户所喜好的显示链接信息的方式, 以及是否和何时忽视用户的意愿的政策.
服务器软件供应商已正在支持XML:
Enigma, Insight 4.0
这是一个提供给出版商处理大型文档的专业电子出版软件解决方案. 目前和Insight捆绑在一起的Enigma SGML/XML Style Sheet Editor, 也可以作为一个独立产品提供.
Hynet Technologies, Digital Library System
Digital Library System (DLS) 将文档和文档部件作为标准软件对象进行管理, 允许引入在Adobe FrameMaker和Microsoft Word中创建的文档, 或者SGML/XML文件.
Inso, DynaText Professional Publishing System
这是一个进行索引, 搜索和制作脚本的软件, 它可以工作于运行在Windows NT 3.51 或 4.0, 或 Sun Solaris 2.5上的Microsoft的 IIS和 Netscape的 Enterprise and FastTrack servers.
Open Market, Folio
Open Market的 Folio 4 信息管理和发送产品将XML文档引入带索引的数据库, 以在IP网络上传递内容, 或将内容送至CD-ROM. 在一月份, Open Market宣布增强对XML的支持, 允许文档以它们的本身格式进行索引和保证安全. 同时, Folio产品也将可以和其它基于标准的制作, 解析和生成XML文档的解决方案相互操作. 它的产品包括 Folio siteDirector (分发信息), Folio SecurePublish (事务管理软件), 和 Folio Publisher (电子出版).
WebMethods, Web Automation Server
Web Automation Server 帮助公司将基于浏览器的应用软件和其它应用软件的数据相结合. 它是基于XML的服务器, 使用 WebMethods自己的在机器间进行Web数据交换的WIDL (Web Interface Definition Language). (该公司已经将WIDL作为标准提议上交给 World Wide Web Consortium.)
开发者不需要学习任何脚本语言, 以使Unicode在XML文档中生效, 文档在用户的浏览器中用合适的字符集显示出来.
在短期内, XML将可能出现在元数据应用上,如RDF.下一个大的影响将随着文档对象模型规范的批准而到来.Bray声称"XML和DOM的结合确实是给Web带来活力的神奇子弹."
XML也应该会帮助电子商务.XML将使电子商务供应商以共同的方法给产品和其相关信息(价格,尺寸,颜色,特性)进行标识, 使用户在Web上对不同的商店进行比较.
同时, Netscape和Microsoft会继续扩大对XML浏览器的支持, 包括有效的和构造良好的XML文档, 更多的XML应用, 为XML设计的style-sheet支持, 和XML超连接协议. 请关注这两个公司以及其它软件供应商在XML制作和出版工具上的进展.
万维网联盟(W3C):
XML规范.
关于XML规范的讨论.
Extensible Style Language (XSL) W3C注释.
Document Object Model 规范.
参与W3C规范开发的XML开发者的邮件地址清单.
XML常见问题解答:
1.ArborText的 XML链接和资源.
微软的XML 站点提供了XML如何在一个天气预报和拍卖中工作的演示.
Textuality收集了XML规范合作者Tim Bray的关于XML的FAQ和到其它资源的一些链接.
由爱尔兰Cork University College的Peter Flynn代表W3C的XML特别兴趣组维护的XML FAQ.
XML信息页面, 达拉斯Summer Institute of Linguistics 的Robin Cover创建的SGML/XML Web页面的一部分.','XML',



希望大家互相配合,回答得更漂亮!!