基于本体模型的移动知识服务系统
技术领域
本发明属于知识服务领域,具体涉及基于本体模型的移动知识服务系统。
背景技术
现有相关技术介绍:
1)本体构建技术
本体构建是一项复杂的系统工程,需要领域专家和知识工作人员以及系统分析人员等各方人员按照一定的方法、采用适当的工具协作完成,目前本体构建大都针对某一特定领域,对于不同的领域,对本体研究的侧重点也有所不同。
从构建方式上看,现在的本体构建大多是手工构造的。目前,大量的个人和学术团体正专注于本体自动构建工具的研究。本体工具主要有本体的编辑管理工具、本体解析工具和推理机,现在最常用的本体构建工具是Protégé。
比较成功的本体构建大多借鉴软件工程方法,产生了一系列诸如面向对象思想(基于UML)、原型化思想等的本体构建方法,并从系统需求分析出发,明确需求、规范文档、实时评价等方面规范领域本体的构建,再根据项目自身的特点和专家经验进行。
以本体模型来组织资源,容易发现资源之间的关系,也很方便地通过各种关系查找到相关的资源,资源和关系从而构成知识。
2)自然语言理解和语义匹配技术
自然语言理解是一门新兴的边缘学科,内容涉及语言学、心理学、认知科学、逻辑学、声学、数学和计算机科学,以语言学为基础中和运用语音学、语义学、语法学、语用学等知识,是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
在知识服务系统中,用户在计算机中输入或录入的内容往往是不连续的一句话(或文本),同样意义的内容,不同的人往往使用不同的词汇或表达方式,而本体知识库中的本体也仅是概念的一般形式,这样就需要把自然语言的句子精确匹配到知识库中的基于本体表达的知识,这种处理方式往往涉及到音字转换技术、模式匹配技术、语义分析等技术进行语义上的匹配,从而在知识库中快速匹配精确的知识。从这方面来讲,这是和搜索引擎与信息检索不同的地方。
3)图挖掘算法
基于本体的知识服务系统,其领域知识库在逻辑结构上是一张网,这张网是有本体以及本体之间的关系构成的,在数据结构上可以用一个有向图来表示,图中的节点是知识库中的本体,本体之间的关系构成两个节点间的有向边。在自然语言理解与语义分析匹配到图中的某个本体节点后,可以通过本体之间的关系抽取出一个以此节点为顶点的子图,然后在此子图上分析此本体所具有的特性。这些内容都涉及到图的子图挖掘技术及其相同的图算法,这也是体现知识服务智能性、个性化的一种方式。
4)移动互联网技术
移动互联网是移动通信技术与互联网技术相融合的产物,其本质是一种新型的数字通信模式。广义的移动互联网是用户使用移动电话、PDA或其他手持设备,通过各种无线网络,包括移动无线网络(2G、3G移动通信网络)和固定无线接入网(Wifi)等接入到互联网中,进行语音、数据和视频等通信业务。
使用移动互联网技术支持全球漫游,提供用户指定信息可以进行个性化服务,保证各用户通信地址的唯一性可以全球定位提供服务。
最近几年,移动通信和互联网是当今世界发展最快、市场潜力最大、前景最诱人的两大业务,移动互联网正渗透到我们生活工作的各个领域,应用手机服务的领域也越来越多。未来几年,随着移动互联网技术的进一步发展,加强与计算机技术的融合,将是知识服务在移动化、智能化、个性化等方面取得进一步突破,为用户提供更多更好的服务。
工业和信息化部与2012年8月公布了2012年7月通信业运行状况,1-7月份,全国移动电话用户累计净增7577.5万户,达到106202.8万户。移动电话用户中,3G用户净增5533.8万户,达到18376.1万户。
Google与IPSOSResearch(益普索)在谷歌中国北京总部对外发布2012年第一季度中国智能手机使用情况的调查结果。报告结果显示,中国智能手机普及率达33%,位居亚太地区第三,仅次于新加坡62%和澳大利亚37%,与中国香港并列第三。此外,53%的中国智能手机用户打算投入更多的时间使用移动互联网,该比例为全球第三高。移动互联网已经成为人们的基本生活条件,用户的使用习惯已经基本养成。通过移动互联网进行移动知识服务的条件已经具备。
5)物联网技术
物联网是一种技术,也是一种文化载体和传播文化的媒介,它不断以技术的创新来创造文化的附加值,在更新人们的生活方式中更新着思想文化的内容和传播方式。
物联网与互联网。物联网是一种基于互联网传播、通过传感器、GPS(全球定位系统)、移动终端设备等将物与物相互连结以感知信息的传播方式,它与互联网有着密不可分的关系,或者说,物联网就是一种“物物相连的互联网”,是互联网在新技术上的延伸和扩展,其用户端可以延伸和扩展到任何物品与物品之间,能够在不同物品之间进行信息交换和通讯,从而实现对相关信息的有效处理和掌控。当然,物联网和互联网又有所不同,其最大的区别就在于,互联网是在虚拟世界中达成的人与人之间的信息交互,而物联网则是借助于互联网和传感器对现实物理世界各种物体(当然也包括人)的一种感知和互联,其最显著的特征是“物物互联,感知世界”。
物联网技术下的知识服务是一个新的研究课题,物联网激发的消费文化将加大主流意识传播难度,物联网还是丰富人们精神文化生活的新空间,物联网的出现,给我国改变知识服务方式带来了一次难得的机遇。物联网解决了信息传播和社会交往的虚拟性难题,在传播行为里增设了“物”的维度和“真”的依托。
物联网通过红外感应器、GPS(全球定位系统)、移动终端等信息设备将知识库中的各种资源与互联网连接起来,实现智能化识别、定位、管理和信息通讯及交换。物联网真正将手机等移动终端作为信息交互平台,有效提升移动知识服务水平。
6)个性化信息推荐技术
知识服务有着非常广泛的应用,是一个涵盖社会各个领域的应用系统,每个不同的领域都会构建很多的领域本体,这样本体知识库将拥有非常庞大的知识,我们可以尽情享受海量的本体知识库所带来的方便,但是也会遇到知识“过载”的问题,用户无法从海量的知识中快速提取自己所需要的信息。简单的方式就是设置一些关键词来获取自己指定的内容,但是这样会缺乏很多用户感兴趣的知识,会把与所设置关键词相关的内容全部呈现给用户,不能过滤掉用户不感兴趣的知识。个性化信息推荐技术就是记录下注册用户的每次访问日志,在对用户日志进行分析处理的基础上,挖掘出用户感兴趣的访问模式,然后系统自动地向用户推荐其感兴趣的知识。
现有技术的缺点:
近十几年来,知识服务开始向纵深扩展,向计算机、人工智能领域扩展,但绝大多数的研究还停留在理论探讨阶段,且缺乏原创性成果,实用化的系统多为智能问答系统,基本都是基于一问一答的形式,都是基于知识库的问答系统,后面的支撑都是知识库,一问题一答案进行组织,前台是用户输入问题后,根据用户输入的问题去匹配知识库中的问题,最后将最相似的问题的答案推出。存在技术实现单一,可扩展性差等特点.
到目前为止,基于移动智能终端的知识服务系统在各领域的应用依然非常稀少。
发明内容
本发明针对现有技术的不足,提供了一种基于本体模型的移动知识服务系统,本系统按本体模型组织相关资源,通过互联网上的移动终端,随时随地对用户提供各种服务。
为解决以上问题,本发明采用的技术方案如下,一种基于本体模型的移动知识服务系统,本体构建平台体系架构如下:
资源层:用于对不同领域进行资源整理,数据抽象,实现企业中不同用户、不同任务和不同系统间的语义集成,建立分布异构信息的集成视图,并提供知识的组织结构;
本体层:用于对资源进行基于本体的知识整合,形成本体知识库;
模型技术层:用于设计本体模型的架构、本体知识库技术、自然语言处理技术、语义匹配技术、图挖掘技术、物联网技术、移动互联网技术、个性化信息推荐技术以及相关的技术的综合利用;
应用层:用于在不同领域展开应用;
功能层:用于不同领域的应用具有不同的功能展示;
终端展示层:用于不同设备的展示。
作为优选,本体构建平台采用了三层架构,依次包括本体层、实例层和应用层,并嵌入了模块化支持和外部系统扩展支持;本体构建平台以本体层为底层,用来创建各种业务体系、属性体系、概念体系和关系的约束体系,用来定义对象、定义属性、定义体系以及约束关系、实体联系的定义及相关信息;实例层用来创建各种业务实例、知识实例和控制策略,用来定制业务流、编辑与维护知识和实例的导入导出;应用层用来提供业务应用、知识服务、知识地图及分类树。
作为优选,所述的模型技术层中基于自然语言处理技术及语义匹配技术的实现如下:将自然语言处理相关技术引入到知识服务体系中来,采用自行设计的语义匹配算法进行知识的快速匹配与查询,也就是在语义相似度的计算中引入了词形相似度、句长相似度、词序相似度以及距离相似度的相关概念;
词形相似度:从词的形状以及句子形态上来标注句子的相似性,反映句子形态上的相似性;
句长相似度:从句子长度上来标注句子的相似性,在一定程度上也反映句子形态上的相似性;
词序相似度:从关键词的顺序上来标注句子的相似性,反映两个句子中所含相同词或同义词在位置关系上的相似程度;
距离相似度:从相同关键词的距离上来标注句子的相似性。
作为优选,所述的模型技术层中图挖掘技术的实现如下:对用户日志进行分析处理,进行日志挖掘,提出一种基于最大频繁子图挖掘的用户个性化信息推荐算法,从而挖掘出用户感兴趣的模式,该算法的核心思想就是将用户的每一次访问记录下来,然后以本体形式的图描述出来,用户所有的访问记录就构成了一个用户访问图集,用户感性的模式,实质上就是用户频繁访问的模式,从用户访问图集上体现的就是用户访问的频繁子图,从而采用频繁子图挖掘算法就可以得到用户感兴趣的模式。
本发明的有益效果如下:
(1)本体构建平台体系的实现,提出并设计了一种新的本体模型架构;
(2)基于自然语言理解的语义匹配的实现:将自然语言处理相关技术引入到知识服务体系中来,采用自行设计的语义匹配算法进行知识的快速匹配与查询,在语义相似度的计算中引入了词形相似度、句长相似度、词序相似度以及距离相似度的相关概念,从而提高了语义相似度的准确度;
(3)智能化知识服务系统的实现:基于本体模型架构,形成基于本体的知识库,进而进行知识的组织与管理,并采用可视化方式进行操作;
(4)基于智能移动终端的知识服务系统的实现:本系统对多种手机操作系统提供支持,支持当前主流的手机操作系统,并可在手机上进行可视化展示;
(5)基于日志挖掘的个性化知识服务系统的实现:对用户日志进行分析处理,进行日志挖掘,提出了一种基于最大频繁子图挖掘的用户个性化信息推荐算法,从而挖掘出用户感兴趣的模式;
(6)以旅游领域为范例进行智能化、个性化知识服务系统的推广应用。
本发明按本体模型组织相关资源,通过互联网上的移动终端,随时随地对用户提供各种服务。本发明的技术主要应用领域有(但不局限于如下领域):培训与客服、辅助教学、文化传播、导航、导游、科普演示、休闲娱乐、交通出行、餐饮住宿等,将产生可观的经济效益与社会效益。
附图说明
图1为基于本体模型的移动知识服务系统结构图;
图2为本体构建平台体系架构。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明做进一步详细说明。
一种基于本体模型的移动知识服务系统,包括以下部分:
(1)本体构建平台的实现
该平台主要用于解决本体构建的方法、以及本体之间约束关系的组织与管理等种种问题,同时可以大幅度提高企业内部管理效率,减少人为因素造成的各种失误,能带来良好的时间效率和成本效益。
本体构建平台的目标是实现企业中不同用户、不同任务和不同系统间的语义集成,建立分布异构信息的集成视图,并提供了知识的组织结构。支持企业知识的获取、表示、处理、共享和重用。企业知识本体同时也是企业知识词典,显式定义了企业相关概念的语义、概念间的关系以及应用于概念的约束,实现本体推理。
本体构建平台为企业创建完备的本体知识库,达到企业级的知识表示、服务、共享和重用。
(2)基于自然语言理解的语义匹配技术的实现
采用自然语言理解技术,进一步完善语义相似度计算算法进行语义匹配,快速在海量知识库中精确匹配到具体的知识。需要实现的主要内容有:
①音字转换算法:将语音转化成文本
②分词与词性标注
③语义相似度计算
(3)智能化知识服务系统的实现
开发基于Web的智能化知识服务系统,实现系统的整体功能,并采用友好的可视化方式把各种关系所关联的知识本体展示出来。需要实现的主要内容:
①图挖掘与子图抽取算法
②可视化方式
(4)基于智能移动终端的知识服务系统的实现
开发基于智能移动终端的知识服务系统,在智能移动终端上实现系统的整体功能,并采用友好的可视化方式把各种关系所关联的知识本体展示出来。需要实现的主要内容:
①多种手机操作系统的支持,支持当前主流的手机操作系统,如:iOS,android等。
②手机可视化展示,在手机上友好的用户界面,操作简单、便捷。
(5)基于日志挖掘的个性化知识服务系统的实现
在知识服务系统具有智能性的基础上,增加知识服务系统个性化的方面,从而完成智能化、个性化的知识服务系统。需要完成的主要内容有:
①用户日志进行分析处理,进行日志挖掘,挖掘出用户感兴趣的模式。
②推荐用户的个性化信息
(6)以特定领域为范例进行智能化、个性化知识服务系统的推广应用
以演艺(涉及演艺场所(影剧院、文化宫、体育馆)、出演任务(演员、导演、其他人员等)、节目信息等)、旅游(涉及城市、旅游景点、旅游方式、旅游路线、交通、餐饮住宿等)为范例建立智能化、个性化的移动知识服务系统,然后向各个领域进行推广。
如图1所示,本体构建平台体系架构如下:
(1)资源层:对不同领域进行资源整理,数据抽象,实现企业中不同用户、不同任务和不同系统间的语义集成,建立分布异构信息的集成视图,并提供了知识的组织结构。
(2)知识层(本体层):对资源进行基于本体的知识整合,形成本体知识库。
(3)模型技术层:本发明的技术核心部分,设计本体模型的架构(采用图2中的本体构建平台体系架构)、本体知识库技术(按照图2给出的本体平台架构,形成基于本体的知识库,进而进行知识的组织与管理)、自然语言处理技术(将自然语言处理相关技术引入到知识服务体系中来)、语义匹配技术(采用自行设计的语义匹配算法进行知识的快速匹配与查询,在语义相似度的计算中引入了词形相似度、句长相似度、词序相似度以及距离相似度的相关概念,从而提高了语义相似度的准确度)、图挖掘技术、物联网技术、移动互联网技术、个性化信息推荐技术(提出了一种基于最大频繁子图挖掘的用户个性化信息推荐技术)以及相关的技术。
(4)应用层:本发明产品的应用领域,可在不同领域展开应用
(5)功能层:不同领域的应用具有不同的功能展示
(6)终端展示层:不同的展示方式,PC终端、智能手机、PDA类型的移动终端应用产品提供的各种知识检索与服务。
为了将上述资源以合理的方式组织起来,本发明中采用的基于本体的架构方式,通过本体模型来构建资源体系。
本体构建平台的体系架构如下(图2):
本体构建平台采用了三层架构,依次包括本体层、实例层和应用层,并嵌入了模块化支持和外部系统扩展支持;本体构建平台以本体层为底层,用来创建各种业务体系、属性体系、概念体系和关系的约束体系,用来定义对象、定义属性、定义体系以及约束关系、实体联系的定义及相关信息;实例层用来创建各种业务实例、知识实例和控制策略,用来定制业务流、编辑与维护知识和实例的导入导出;应用层用来提供业务应用、知识服务、知识地图及分类树。
主要是构建领域的体系、属性和实体概念以及关系。
以旅游的知识服务为例示例:
在图1中资源层涉及旅游的吃、住、行、游、购、娱六方面的资源,包括:餐馆、宾馆、酒店、旅游景点、旅游线路、交通设施、商场、购物中心、休闲娱乐中心相关的资源,将这些资源按照本体的架构组织起来,每一类资源以及资源之间都有相关的属性以及关系,按照图2中的架构组织起来,如:酒店(包含属性体系:名称、连锁或星级、房间类型、数量以及其他;客户住宿业务体系:预订→入住→交流→结算→离开→反馈;概念体系:星级、房型、人员、洗漱用具;关系约束:游客和酒店之间的居住关系),然后按此组织的旅游相关的业务、旅游线路、导游图、购物流程、休闲活动安排以及和旅游相关的所有信息。
自助游客可以根据事先通过电脑、手机类移动设备下载各地旅游APP,查询相关的旅游景点、交通路线、旅游线路、附近酒店、附件餐馆、购物中心、娱乐场所相关的信息,以及各相关实例的最新公告、通知、当前状态信息。游客从APP获取资源信息,资源主题通过发布旅游资源相关信息以通过APP对外提供知识服务。用户在多次使用本产品后,系统会自动记录用户信息,进一步挖掘用户模式,从而提供更个性化的知识服务。