基于语义Web的旅游信息服务的研究与应用
发布时间:2015-07-13 09:47
摘 要 本文提出了一种基于语义Web的旅游信息服务应用的新架构,并给出了实现此服务应用的构建方法。该方法通过本体来增强服务描述语义,利用OWL本体描述语言来表示旅游本体的语义信息,通过基于本体的描述逻辑的推理有效地实现旅游信息的语义化查询和智能化服务。
关键词 语义Web;本体;OWL;推理
1 引言
近年来,Web的发展日新月异,已经成为一个巨大的全球化信息资源库。网络信息资源数量飞速增长,网络信息资源组织呈现多种模式并存的局面。专家学者们在尝试了多种提高网络信息资源组织质量,改进检索效率的措施之后,正尝试综合运用不同层次的元数据模型来构建语义Web,使Web文档的语义能清晰地体现出来,并为检索程序所理解。而传统的旅游信息系统是在数据库系统的基础上发展起来的,欧洲在这方面有许多成功的例子,比较着名的有奥地利帝罗尔信息系统,瑞士阿彭策尔信息系统等[1]。这些系统功能强大,涵盖了旅游业的食、宿、行、导、购游等各项服务功能,但随着旅游服务信息和服务需求信息的几何级数的速度增长,基于传统的旅游信息查询已不能适应当前旅游者对旅游信息的快速多变化的需求增长,在此基础上,本文结合目前语义Web技术的新发展,提出了一种基于语义web的旅游信息服务的新构建,其在Web系统中增加机器可理解的语义内容,实现了语义信息的推理查询,有效地提高了旅游信息查询的广度和准确度。
2 语义Web的相关技术
2000年Berners_Lee在XML2000会议上正式提出Sematic Web,它的基本思想就是通过在Web信息的创作和发布中嵌入机器可阅读的、代表某类知识的标注,使Web上的数据不仅被机器显示,而且能够被机器理解,使网络中尽可能多的信息都具有语义的表达。语义Web的体系结构 包括有七层,自下而上各层功能逐渐增强。
2.1语义Web中的本体
本体是对共享的概念化进行形式的显式规范说明。通俗地讲,本体是用来描述某个领域甚至更广范围内的概念以及概念之间的关系,使得这些概念和关系在共享的范围内具有大家共同认可的、明确的、唯一的定义。通过构造领域本体知识库为信息源提供必要的语义信息,使系统对领域的概念、概念之间的联系及领域内的基本公理知识有一个统一的认识,进一步实现Web信息的智能化推理,提高系统的智能性和精确性。目前本体已经被广泛应用于语义Web 、智能检索、信息集成等领域。
2.2 语义Web的本体建模语言
2004年,W3C提出OWL作为对本体描述的语言。它有三个表达能力递增的子语言:OWL Lite、OWL DL和OWL Full 。考虑到实际应用在知识表达能力和推理能力较强和保证推理的可判定性两个方面的要求,选择OWL DL作为本应用的本体表示语言。
2.3 本体的构建工具
目前的本体构建工具有Ontolingua,WebOnto,OntoSaurus,Protege_2000,WebODE,OntoEdit[10]等。借助这些工具,可以把精力集中在旅游本体信息的组织上,而不必了解本体描述语言的复杂语法细节,避免了很多错误的发生,更方便我们对本体的构建。本应用中,我们采用Protege2000作为该旅游信息本体的构建工具。Protege2000是美国Stanford大学开发的本体编辑器,它用Java开发是一个开源的项目,以OWL插件的形式支持OWL格式的本体,此OWL插件用Jena包支持OWL文档的读取。
2.4 推理的应用
Jena是一个为语义网应用设计的一个Java API,专门用来构建语义网的应用软件,它为RDF、RDFS和OWL提供了一个可编程实现的环境。推理功能是Jena中的一个重要子系统,用来实现本体信息的智能推理。
3 语义Web的旅游服务应用实例
图1的本体信息中,实箭头表示实例,虚箭头表示属性关系,其中有部门机构、省市、旅游景点、旅店等四个本体的部分信息,当有一游客需要了解桂林的景点名山时,传统的做法是建立数据库系统进行管理,但基于关键字的查询有时是不能满足的,此时系统可能通过旅游景点的实例信息七星公园和象山公园来找到骆驼山和象鼻山,由于独秀峰并不存在于景点的具体实例中,此时就查询不到独秀峰。然而我们知道广西师大内有一座独秀峰,同时独秀峰也是旅游景点的一个子类,则可以认为广西师大也作为一景点实例。通过语义Web,利用Jena推理机进行语义查询,返回独秀峰作为查询结果提交给用户。同时,当要查找桂林市内旅店时,不仅可以通过旅店的实例查询到帝苑酒店和桂林宾馆,此外,广西师大内设有学校招待所,而招待所同时也是旅店的一个子类,所以认为广西师大也可作为旅店实例,并把学校招待所也作为查询结果返回给用户。而且当我们要统计桂林市区内的旅游景点时由于广西师大和旅游景点并无直接实例关系,借助传统的数据库系统无法得出独秀峰也是秀峰区的一个旅游景点。而通过构建语义Web,我们知道广西师大内独秀峰是一旅游景点子类,自然也认为广西师大属于旅游景点,同时广西师大又位于秀峰区,通过本体和Jena推理机的应用可以方便的查找到秀峰区下有一景点为广西师范大学,这样利用语义Web可以更全面更准确的查找到系统包括如图2所示7个基本功能模块。
信息统计分析:如指定范围的旅游景点数,旅游景区的分布,各旅游景区的旅游流情况,旅游景区的分类等。
语义描述模块:负责对指定的信息资源(如非结构化、半结构化、结构化)将相关领域的本体类、语义属性、语义关系以及语义规则用OWL进行旅游信息的语义描述。
语义提取模块:本应用选取指定的几个有名的旅游信息网站作为辅助信息源,结合语义描述模块对其中旅游信息进行语义提取,将最终结果转化为OWL格式文件。
语义存储模块:主要负责将OWL所描述的信息资源与Protege构建的旅游本体库一起存储到MySql数据库中。
语义查询模块:主要负责基于语义的旅游信息查询。
语义输出模块:主要负责将旅游信息本体类、语义属性、语义关系及由此推理得到的隐藏信息以一定的方式呈现给用户。可通过与本体类、语义属性定义的子系统的接口以及推理查询子系统的接口来获得。
系统维护管理模块:主要是系统本体数据库建立、编辑与更新,以及系统的界面修改和文件管理等。
4.2 基于语义的推理查询
基于语义Web的旅游信息服务应用最重要的一个功能就是在系统中使用了基于本体的语义推理查询,由于使用本体作为检索系统的语义核心,充分利用其在知识表示和语义描述上的特性和优点,将语义处理结合到应用模型中去,利用Jena推理机结合自定义的规则库进行更广泛的推理,很好的实现信息查询的智能化。基于语义的推理查询可实现如下子查询:
周边信息查询:查询从指定地点周边指定距离内的旅游资源、公共服务设施及企事业单位。用户可以对某一地点对其周边指定范围内的指定资源类别进行查询分析,如对桂林市区“漓江”周边“2000米”范围内的“四星级的景点”进行查询分析,得到了七星公园、象山公园、伏波山、叠彩山等4条查询结果,点击其中一条即可显示出其相关旅游信息。
最近信息查找:查询离指定地点最近的旅游资源、公共服务设施及企事业单位。用户可对某一地点查询距离其最近的一类指定资源类别,并显示其查询结果和相关旅游信息。如我们要查询距离“广西师大”最近的“四星级景点”,推理查询后得到“伏波山”1条查询结果。
高级查询:系统提供给用户多种选择信息进行自动匹配并推理查找出条件相符的各类信息。由于本应用中的各种查询都要利用部署在接口与本体之间的推理机,通过推理机对查询的语言进行规范统一的处理后,根据本体中内容之间的逻辑关系推理出备选的答案。
4.3 系统实现
4.3.1系统模型架构
本系统采用B/S模式,所用软件包均是基于 Java环境的开源项目,具有很好的移植性和开放性。该系统利用“旅游信息本体库”为用户提供基于本体的语义信息检索,采用可视化的界面和多种方式的查询入口,实现基于语义的智能信息查询。系统模型架构如图3所示。
用户端界面作为系统的门户,包括信息录入、显示和查询等操作,它为用户通过浏览器访问信息系统提供了一个基于Web的接口。用户通过浏览窗口提交服务请求给HTTP服务器,HTTP服务器从消息中解析出查询请求,转发请求给服务器端的Web服务器,Web服务器把请求交给Servlet服务器组件,调用javaBean通过内部推理机,搜索本体数据库中的信息。Web服务器把推理查询的结果递交给HTTP服务器,再由HTTP服务器把结果包装成SOAP消息发送给用户。
4.3.2本体信息数据库
本体数据库中存储的是相关的旅游本体信息,是整个系统的基石。
图4中对旅游领域相关的非结构化、半结构化和结构化信息进行语义实体和语义关系的抽取,结合构建好的领域本体库一并置入语义本体数据库中。我们将语义本体库存储在MySql关系数据库中,使用关系数据库的表结构来存储本体库中的三元数据。由于“旅游本体库”是用Protege作为工具开发的,因此本体库最初的存储方式是OWL文件,这里需要利用OwlFile2DB类来将本体数据库装载到数据库中去。基于数据库的本体存储方式比文件存储方式能处理更大的本体库模型,而且不需要显式的保存数据模型,效率更高,但是需要复杂的数据库配置。但对于大多数应用来说,数据库方式是必要的。所以本应用采用了这种方式。
4.3.3推理查询模块
应用中的本体信息查询是基于语义Web技术的发展,考虑到查询用户的特性以控制查询过程,通过使用一些描述逻辑语言,对大量的领域信息和网络资源使用逻辑表述进行唯一规范化的合理解析,并使用语义精确方法与本体数据库中的术语相关联,利用本体库中的术语及术语之间的关系来建立用户查询界面,系统将用户的选择包含到查询串中,对本体数据库中的旅游信息进行语义查询我们还需要利用Jena推理机来实现此功能。首先,把图1中所有用到的与旅游相关的概念、关系和实例用Protege工具构建好,以OWL的形式存储到MySql数据库中。对于选定的一些辅助网络资源,通过本体发现、本体映射等方法进行语义实体及语义关系的发现和抽取并将结果以OWL的形式存储到语义本体数据库中。第二,根据查询需要构造本体规则库:如:
Rule1:(?x hasHill ?y),(?y isSubClassOf ?z) (?x isSubClass ?z)
Rule2:(?x hasHill ?y),(?x locateIn ?z) (?Y locateIn ?z)
Rule3:(?x hasHotel ?y),(?y isSubClassOf ?z) (?x isSubClassOf ?z)
Rule1说明如果某部门机构x内有一座山y,而y属于旅游景点z,则x也属于旅游景点z的子类。Rule2说明如果某部门机构x内有一座山y,x位于城区z,则y也位于城区z。Rule3说明如果某部门机构x设有招待所y,而y属于旅店z,则x也属于旅店z。第三,把建立好的规则库放入Jena推理机中,基于前面建立的本体信息数据库进行推理,可以很方便的推理查询出基于语义Web的系统构建是未来网络发展的必然趋势。我们知道本体是语义Web中最关键的技术,它使得Web上的信息共享和重用成为可能。但当前的本体编辑工具发展得还不成熟。要使得本体编辑工具得到更广泛的应用,还应在界面化、功能完善、推理支持和与其它的开发工具结合上更进一步。同时本体集成、映射方法还很不成熟。虽然语义Web技术的研究取得了很大的发展,但是Intenet上基于本体的语义的应用却不能得到很好的实现,使得信息的共享查询不能很好的在各个领域中得以交融,这些都有待我们做更进一步的深入研究。
参考文献
[1] 黄怡然,黄杏元.基于Internet的旅游信息系统研究[J].计算机应用研究,2000,15(1):114-117
Lee T B,Hendler J,Lassila semantic Web[J].Scientific A merican,2001,284(5)
Gruber T.A translation approach to portable ontology specifications[J].Knowledge Acquisition Acquisition,1993,5:199-200
Deng ZH,Tang SW,Zhang M,Yang DQ,Chen ewof ontoloty[M].Acta Scientiarrum Naturalium Universitatis Pekinensis,2002,38(5):730-738
Farquhar A,Fikes R,Rice J. The Ontoling server:A tool for collaborative ontology construction[J]. Int’l Journal ofHuman-Computer Studies,1997,46(6):707-727
Duineveld AJ,Stoter R,Weiden MR. Wonder tools? A comparative study of ontological engineering tools[J]. Int’l Journal of Human-Computer Studies,2000,52(6):1111-1133
Swartout B,Ramesh distributed use of large scale ontologies[C].In: the AAAI Symp. on OntologicalEngineering. :// KAW /
Noy NF,Fergerson RW,Musen MA. The knowledge model of protégé-2000:Combinining interoperability and flexibility[C]. In:Dieng R,Corby O,eds. Proc. of the EKAW2000. Heidelberg:Springer-Verlag,2000. 17-32
Arpirez JC,Corcho O,. WebODE:A scalable ontological engineering workbench[C]. In:Gil Y,MusenM,Shavlik J,eds. Proc. of the K-CAP York:ACM Press,2001. 6-13
[10] Sure Y,Angele J,Erdmann M,Staab S,Studer R,Wenke D. OntoEdit:Collaborative ontolo-gy engineering for the semantic Web[C].In:Horrocks I,Hendler JA,eds. Proc. of the ISWC 2002. Heidelberg:Springer-Verlag,2002. 221-235