欢迎来到学术参考网

HTML的缺陷和XML发展历程及优点分析

发布时间:2015-12-12 12:06

摘 要:HTML作为SGML的一种应用,成为了Internet上最主要的标示语言,但是随着Internet的发展也出现了许多缺陷。本文分析了HTML语言的在Web中的应用以及XML的出现及其优点。

关键词:HTML;Web;XML
1、 HTML的起源
  HTML是SGML(Standard Generalized Markup Language)的一个应用。SGML的中文名称是“标准通用标示语言”。它是国际上定义电子文件结构和内容描述的标准语言。SGML提供了描述文档和创建新的一致性衡量标准所必要的公共框架。它是一个严格而复杂的系统,并且已经被国际标准化组织(ISO)正式批准。早在Web未发明之前,SGML就早已存在。SGML作为一种用标记来描述文档资料的通用语言,它包含了一系列的文档类型定义(简称DTD),DTD定义了文档的语法规则,因而SGML的语法是可以扩展的。可以使用SGML来定义新的标示语言,因此它是一种定义语言的元语言。SGML十分庞大,既不容易学习,又不容易使用,在计算机上实现也比较困难。鉴于这些因素,Web的发明者—欧洲核子物理研究中心的研究人员根据当时(1989年)计算机技术的能力,提出了HTML语言。
  HTML作为SGML的一种应用,定义了自己的标记和语法规则,例如HTML3.2定义了70种标记。为了便于在计算机上实现,HTML规定的标记是固定的,即HTML语法是不可扩展的。HTML这种固定的语法使它易学易用,在计算机上开发HTML的浏览器也十分容易。正是由于HTML的简单性,使Web技术从计算机界走向全社会,走向千家万户,使Web的发展如日中天。
2、HTML的缺陷
  当前,在Intemet上信息的表示使用的主要标示语言是HTML语言。HTML语言由于其简单易学、表现力强等许多优点成为了Internet上最主要的标示语言,并极大的推进了Internet的发展。但是,在Internet的发展过程中,HTML也暴露出它的一些固有弱点:
  2.1、功能有限。HTML语言仅仅是一种标示语言,其中的众多标记仅仅是一种显示标记,而不是一种内容标记。标记本身不能揭示所包含内容的含义,计算机只能根据文档中各种标记在网络浏览器上产生特定的显示,却不能提取出文档所包含的内容信息。这一缺陷限制了网上的信息搜索向着更精确和更有意义的方向发展。
  2.2、可扩展性差。标准的HTML规定了固定的标记集合,普通用户不能定义自己的标记。这使得HTML语言很难扩展。这严重的限制了HTML语言的处理能力,许多比较特殊和具有专门格式的信息,例如化学方程式、数学公式采用HTML语言都是无法表达的。
  2.3、标准性差。各个浏览器厂商为增强自己浏览器的功能和方便用户的使用,一再地在自己的浏览器产品上增加新的功能,使自己的浏览器产品具有更强大的处理能力,甚至允许当用户使用不完全标准的HTML标记时浏览器不会发生错误。浏览器厂商对功能的扩展使得文档的兼容性下降,在一种浏览器上能够正常显示的HTML文件不一定能在另一种浏览器上正常显示,这种状况使得信息的传播和共享受到了极大的限制。网页的编辑人员必须使用Microsoft Internet Explorer和Netsecape Navigator都支持的标记,否则同一个HTML文件在这两种主流浏览器上就会得到不同的页面效果,甚至会发生错误。网络浏览器这种非标准的发展趋势,给HTML文件的编辑者和使用者带来越来越多的问题。
  但是近年来,随着Web的应用越来越广泛和深人,人们渐渐觉得HTML的局限性。HTML过于简单的语法严重地阻碍了用它来表现复杂的内容。尽管HTML推出了一个又一个新版本,已经有了脚本、表格、帧等表达功能,但始终满足不了不断增长的需求。另一方面,这几年来计算机技术的发展也十分迅速,已经可以实现比当初创造HTML时复杂得多的Web浏览器,所以开发一种新的Web页面语言既是必要的,也是可能的。
3、XML简介
  如果直接使用SGML作为新的Web语言,这固然能够解决HTML遇到的困难。但是SGML太庞大了,用户学习和使用都不方便,而且要全面实现SGML的浏览器也非常困难,于是自然会想到仅使用SGML的子集,使新的语言既功能强大又方便使用。正是在这种形势下,Web技术的标准化组织W3C推出了一种精简的SGML版本—XML。
  XML是一个精简的SGML,是SGML的一个子集。它将SGML的丰富功能与HTML的易用性结合到Web应用中。XML保留了SGML的可扩展功能,这使XML从根本上有别于HTML。XML要比HTML强大得多,它不再使用固定的标记,而是允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构。HTML只是Web显示数据的通用方法,而XML提供了一个直接处理Web数据的通用方法。
4、XML的优点
  XML用结构化的文档来描述信息,给开发者和用户带来了许多好处。
  更有意义的搜索,数据可被XML唯一的标识。没有XML,搜索软件必须了解每个异构的数据库是如何构建的。这实际上是很困难的,因为每个数据库描述数据的方式都是不同的。XML使我们能够方便的定义任何行业的数据,而且它们具有很强的可扩展性。用户可以定义自己的有内容含义的标记,使得数据的搜索变得更加容易。
  开发灵活的Web应用软件,数据一旦建立,XML能被发送到其他应用软件、对象或者中间层服务器做进一步地处理。或者它可以发送到桌面用浏览器浏览。XML和HTML、脚本、COM(Computer Object Model组件对象模型)一起为灵活的三层Web应用软件的开发提供了所需的技术。

上一篇:火电机组虚拟DCS仿真机的实现

下一篇:虚拟化技术在企业中的应用研究