简析一种快速解析XML的网络应用架构
发布时间:2015-07-02 14:37
【论文关键词】xml;网络架构;硬件加速
【论文摘要】由于xml的灵活性和自我描述复杂性,在基于web的服务器应用中往往会消耗大部分服务器处理能力.本文提出一种采用专用硬件加速xml处理速度的网络架构,可以极大地减少服务器解析xml的负担.
1xml简介
xml,extensiblemarkuplanguage(可扩展标识语言),是当代最热门的网络技术之一,被称为“第二代web语言”,“一代网络应用的基石”.自从它被提出来,几乎得到了业界所有大公司的支持,丝毫不逊于当年html被提出来的热度.
xml是1986年国际标准组织(iso)公布的一个名为“标准通用标识语言”(standardgeneralizedmark-uplanguage,sgml)的子集.它是由成立于1994年10月的w3c(worldwidewebconsoutium)所开发研制的.1998年2月,w3c正式公布了xml的recommendation1.0版语法标准.xml掌握了sgml的扩展性,文件自我描述特性,以及强大的文件结构化功能,但却摒除了sgml过于庞大复杂以及不易普及化的缺点.xml和sgml一样,是一种”元语言”(meta一language).换言之,xml是一样用来定义其他语言的语法系统.这正是xml功能强大的主要原因.
xml使用documenttypedefinition(dtd)或xmlschema来描述数据结构.它具有自我描述的特性,例如xmlschema本身就是的上述特性使得:
①数据和数据的表示得以分开.
②互不兼容的系统之间传递数据有了一种标准化的模式.
③在互联网上进行企业之间的数据存储和共享更加方便.
下面的图1表示了xml在网络应用中的作用
2阻碍xml应用的瓶颈
xml正在成为web服务的通用语言.但是,xml的灵活性对网络基础设施提出了很高的要求,执行转换、压缩和xmlweb服务安全等cpu密集型任务可消耗多达80%的服务器处理能力.据统计,由于xml的自我描述复杂性,计算机处理描述相同信息量的xml文档要比相应二进制文档多消耗25倍的计算资源.图2显示了结构化信息进展组织(organizationfortheadvancementofstructuredinformationstandards)统计的xml在网络信息流中所占的比重。
由图2可知,在网络传输世界中,xml正在逐渐得到广泛的应用.在今后几年中将超过所有其他种类的信息流,占据统制地位.现今,xml加速作为一种为应用服务器以降低xml处理负荷的关键技术问世了,尤其是以硬件的专用设备面目出现的xml加速技术.除了处理xml数据外,xml加速还帮助执行安全数据交换和提供服务质量(qos).
3xml网络应用架构
一台加速专用设备一般由现成的主板和现成的商用操作系统构成.由于专用设备是为执行特定任务而定制的并且可以更高效率地利用操作系统和硬件,因此它们在执行xml的解析、验证、转换和压缩时,比应用服务器速度更快.图3给出了这种xml网络应用模式的架构图.
此外,xml专用设备可以加快xml数据的加密和压缩,它也是通过配置负载平衡器和服务器实现的.专用设备常常可以以线速度运行,而这是应用服务器所达不到的.负责部署xm’安全性的设计人员遇到了满足xml安全要求的管理与处理问题.xml专用设备可作为安全网关,解密、认证和批准输人数据流,执行输出数据流的加密和签名.加速也是实现qos所不可缺少的.为了确保qos,必须高效率地区分优先级.检查输人和输出xml数据并将内容及规则应用于xml数据,然后再决定哪台服务器处理.提供这种区分传输流的途径是必须的.xml加速专用设备将许多需要大量cpu资源的功能从应用服务器转移到网络上.
4小结
xml正在成为数据组织和交换的实施标准,大量的xml数据已经出现在web上,同时,xml作为一种基础技术在知识管理、通信管理和数据传送、数据处理领域起着一种重要的角色.基于xml的应用覆盖到了内容计算(处理和管理系统)、分布计算环境下的应用、半结构化信息处理、移动计算平台和xml存储等方面.采用专用硬件加速xml处理速度的网络架构,将许多需要大量cpu资源的功能从应用服务器转移到网络上,极大地减少了服务器解析xml的负担,显著的提高了在执行xml的解析、验证、转换、加密和压缩时的速度,从而提供了比应用服务器速度更高效、更安全的服务能力.
【论文摘要】由于xml的灵活性和自我描述复杂性,在基于web的服务器应用中往往会消耗大部分服务器处理能力.本文提出一种采用专用硬件加速xml处理速度的网络架构,可以极大地减少服务器解析xml的负担.
1xml简介
xml,extensiblemarkuplanguage(可扩展标识语言),是当代最热门的网络技术之一,被称为“第二代web语言”,“一代网络应用的基石”.自从它被提出来,几乎得到了业界所有大公司的支持,丝毫不逊于当年html被提出来的热度.
xml是1986年国际标准组织(iso)公布的一个名为“标准通用标识语言”(standardgeneralizedmark-uplanguage,sgml)的子集.它是由成立于1994年10月的w3c(worldwidewebconsoutium)所开发研制的.1998年2月,w3c正式公布了xml的recommendation1.0版语法标准.xml掌握了sgml的扩展性,文件自我描述特性,以及强大的文件结构化功能,但却摒除了sgml过于庞大复杂以及不易普及化的缺点.xml和sgml一样,是一种”元语言”(meta一language).换言之,xml是一样用来定义其他语言的语法系统.这正是xml功能强大的主要原因.
xml使用documenttypedefinition(dtd)或xmlschema来描述数据结构.它具有自我描述的特性,例如xmlschema本身就是的上述特性使得:
①数据和数据的表示得以分开.
②互不兼容的系统之间传递数据有了一种标准化的模式.
③在互联网上进行企业之间的数据存储和共享更加方便.
下面的图1表示了xml在网络应用中的作用
2阻碍xml应用的瓶颈
xml正在成为web服务的通用语言.但是,xml的灵活性对网络基础设施提出了很高的要求,执行转换、压缩和xmlweb服务安全等cpu密集型任务可消耗多达80%的服务器处理能力.据统计,由于xml的自我描述复杂性,计算机处理描述相同信息量的xml文档要比相应二进制文档多消耗25倍的计算资源.图2显示了结构化信息进展组织(organizationfortheadvancementofstructuredinformationstandards)统计的xml在网络信息流中所占的比重。
由图2可知,在网络传输世界中,xml正在逐渐得到广泛的应用.在今后几年中将超过所有其他种类的信息流,占据统制地位.现今,xml加速作为一种为应用服务器以降低xml处理负荷的关键技术问世了,尤其是以硬件的专用设备面目出现的xml加速技术.除了处理xml数据外,xml加速还帮助执行安全数据交换和提供服务质量(qos).
3xml网络应用架构
一台加速专用设备一般由现成的主板和现成的商用操作系统构成.由于专用设备是为执行特定任务而定制的并且可以更高效率地利用操作系统和硬件,因此它们在执行xml的解析、验证、转换和压缩时,比应用服务器速度更快.图3给出了这种xml网络应用模式的架构图.
加速专用设备一般部署在数据中心的三层架构中.它们一般安装在防火墙背后,处在负载平衡器与应用服务器或一台同时具有应用服务器和web服务器功能的设备之间.负载平衡器同在web服务器或应用服务器之间分配负载一样,在加速专用设备之间分配负载.应用服务器是xml数据的主要生产者和消费者,因而从这些专用设备提供的加速中受益最大.xml数据流可分为输人或输出数据流.输人xml加速功能解压缩、解密、验证和传送数据来提供专用设备处理http或简单对象访问协议(soap)包头或xml内容,并且利用配置信息决定如何转换、验证或解压缩内容.输人负载平衡器被配置为选择将恰当的数据传送到加速专用设备上.例如,从负载平衡器到应用服务器的传送途中的附http包头告诉专用设备数据被压缩了.专用设备可被配置为对数据解压缩,从而解脱应用服务器执行占用大量cpu资源的解压缩功能的负担.同样,在处理输出传输流时,专用设备被配置为转换从应用服务器到负载平衡器途中的内容.当xml内容流经专用设备时,文档中或配置中的格式表单引用被解析并被应用于文档,以将xml内容转换为html、无线标记语言(wml)或其他类型的xml.
此外,xml专用设备可以加快xml数据的加密和压缩,它也是通过配置负载平衡器和服务器实现的.专用设备常常可以以线速度运行,而这是应用服务器所达不到的.负责部署xm’安全性的设计人员遇到了满足xml安全要求的管理与处理问题.xml专用设备可作为安全网关,解密、认证和批准输人数据流,执行输出数据流的加密和签名.加速也是实现qos所不可缺少的.为了确保qos,必须高效率地区分优先级.检查输人和输出xml数据并将内容及规则应用于xml数据,然后再决定哪台服务器处理.提供这种区分传输流的途径是必须的.xml加速专用设备将许多需要大量cpu资源的功能从应用服务器转移到网络上.
4小结
xml正在成为数据组织和交换的实施标准,大量的xml数据已经出现在web上,同时,xml作为一种基础技术在知识管理、通信管理和数据传送、数据处理领域起着一种重要的角色.基于xml的应用覆盖到了内容计算(处理和管理系统)、分布计算环境下的应用、半结构化信息处理、移动计算平台和xml存储等方面.采用专用硬件加速xml处理速度的网络架构,将许多需要大量cpu资源的功能从应用服务器转移到网络上,极大地减少了服务器解析xml的负担,显著的提高了在执行xml的解析、验证、转换、加密和压缩时的速度,从而提供了比应用服务器速度更高效、更安全的服务能力.
上一篇:浅析浙江省三级网络应用技术考试