一种针对车载应用的知识图谱生成方法和服务器
技术领域
本发明涉及车辆技术领域,特别是涉及一种针对车载应用的知识图谱生成方法方法和一种服务器。
背景技术
随着智能汽车发展,车载系统互联网化、车载系统应用功能丰富化,车载系统可以利用知识图谱识别用户语义,根据用户语义完成交互。
但是目前车载系统使用的是通用型汽车知识图谱,通用型汽车知识图谱大都只记载通用的配置信息、销售门店等信息,缺乏对需要经常更新的信息,或个性化信息的适配。如,不能准确匹配安装在车载系统的车载应用,使得无法准确完成用户交互。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种针对车载应用的知识图谱生成方法和一种服务器。
为了解决上述问题,本发明实施例公开了一种针对车载应用的知识图谱生成方法,包括:
获取针对车载应用的原始资源数据;
获取针对车载应用的语音交互知识图谱配置的本体;所述本体包括概念类型、实体、关系、属性和规则;所述概念类型包括针对车载应用配置的类型;所述实体包括针对所述概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;所述概念实体包括业务类实体和控件类实体;所述关系包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;所述属性包括针对所述实体和所述关系的属性,包括业务规则和约束条件;
根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例;
根据所述本体和对应的实例,生成语音交互知识图谱。
可选地,还包括:
将至少两个基于车载应用的语音交互知识图谱中的本体、实体、属性、关系分别进行融合,得到融合后的语音交互知识图谱;所述至少两个基于车载应用的语音交互知识图谱包括任务型知识图谱和问答型知识图谱。
可选地,还包括:
对所述语音交互知识图谱中的进行检验,根据检验结果调整所述语音交互知识图谱。
可选地,还包括:
以图数据形式存储所述语音交互知识图谱;
对按照图数据形式存储的所述语音交互知识图谱中的实体节点,建立对应的索引。
可选地,所述针对实体的约束条件包括:场景化交互约束条件和全局化交互约束条件;
所述场景化交互约束条件为限定车载应用处在当前场景页面下进行的用户意图交互的约束条件;
所述全局化交互约束条件为限定车载应用不处在功能元素所在场景下进行的用户意图交互的约束条件。
可选地,所述针对实体的约束条件包括针对车载系统版本、知识图谱版本、车载应用版本中的至少一种的约束条件。
可选地,所述原始资源数据包括结构化资源数据;所述结构化资源数据包括针对车辆业务的关系型数据;
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例,包括:
根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关系型数据中,查找匹配的目标数据;
将所述目标数据转换为三元组数据。
可选地,所述原始资源数据包括半结构化资源数据;所述半结构化资源数据包括从车载应用客户端上传到服务器的场景数据;所述场景数据包括场景内的功能元素、层次关系和属性;
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例,包括:
根据所述场景数据中的功能元素、层次关系和属性,生成树形结构的数据;
根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述树形结构的数据中,查找匹配的目标数据;
将所述目标数据转换为三元组数据。
可选地,所述半结构化资源数据还包括针对语音交互功能的设置文档;所述设置文档包括业务类实体、关系和属性;
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例,包括:
根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述设置文档的业务类实体、关系和属性中,查找匹配的目标数据;
将所述目标数据转换为三元组数据。
可选地,所述原始资源数据包括非结构化资源数据;所述非结构化资源数据包括非结构化的文本数据,用户针对车载应用的查询语句的文本数据和其他文本数据;
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例,包括:
从所述非结构化的文本数据中,抽取关键词;
根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关键词中选取匹配的目标数据;
将所述目标数据转换为三元组数据。
本发明实施例还公开了一种服务器,包括:
原始资源数据获取模块,用于获取针对车载应用的原始资源数据;
本体获取模块,用于获取针对车载应用的语音交互知识图谱配置的本体;所述本体包括概念类型、实体、关系、属性和规则;所述概念类型包括针对车载应用配置的类型;所述实体包括针对所述概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;所述概念实体包括业务类实体和控件类实体;所述关系包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;所述属性包括针对所述实体和所述关系的属性,包括业务规则和约束条件;
数据抽取模块,用于根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例;
知识图谱生成模块,用于根据所述本体和对应的实例,生成语音交互知识图谱。
可选地,还包括:
融合模块,用于将至少两个基于车载应用的语音交互知识图谱中的本体、实体、属性、关系分别进行融合,得到融合后的语音交互知识图谱;所述至少两个基于车载应用的语音交互知识图谱包括任务型知识图谱和问答型知识图谱。
可选地,还包括:
检验模块,用于对所述语音交互知识图谱中的进行检验,根据检验结果调整所述语音交互知识图谱。
可选地,还包括:
存储模块,用于以图数据形式存储所述语音交互知识图谱;
索引建立模块,用于对按照图数据形式存储的所述语音交互知识图谱中的实体节点,建立对应的索引。
可选地,所述针对实体的约束条件包括:场景化交互约束条件和全局化交互约束条件;
所述场景化交互约束条件为限定车载应用处在当前场景页面下进行的用户意图交互的约束条件;
所述全局化交互约束条件为限定车载应用不处在功能元素所在场景下进行的用户意图交互的约束条件。
可选地,所述针对实体的约束条件包括针对车载系统版本、知识图谱版本、车载应用版本中的至少一种的约束条件。
可选地,所述原始资源数据包括结构化资源数据;所述结构化资源数据包括针对车辆业务的关系型数据;
所述数据抽取模块包括:
第一目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关系型数据中,查找匹配的目标数据;
第一数据转换子模块,用于将所述目标数据转换为三元组数据。
可选地,所述原始资源数据包括半结构化资源数据;所述半结构化资源数据包括从车载应用客户端上传到服务器的场景数据;所述场景数据包括场景内的功能元素、层次关系和属性;
所述数据抽取模块包括:
场景数据提取子模块,用于根据所述场景数据中的功能元素、层次关系和属性,生成树形结构的数据;
第二目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述树形结构的数据中,查找匹配的目标数据;
第二数据转换子模块,用于将所述目标数据转换为三元组数据。
可选地,所述半结构化资源数据还包括针对语音交互功能的设置文档;所述设置文档包括业务类实体、关系和属性;
所述数据抽取模块包括:
第三目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述设置文档的业务类实体、关系和属性中,查找匹配的目标数据;
第三数据转换子模块,用于将所述目标数据转换为三元组数据。
可选地,所述原始资源数据包括非结构化资源数据;所述非结构化资源数据包括非结构化的文本数据,用户针对车载应用的查询语句的文本数据和其他文本数据;
所述数据抽取模块包括:
关键词抽取模块,用于从所述非结构化的文本数据中,抽取关键词;
第四目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关键词中选取匹配的目标数据;
第四数据转换子模块,用于将所述目标数据转换为三元组数据。
本发明实施例还公开了一种服务器,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的针对车载应用的知识图谱生成方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的针对车载应用的知识图谱生成方法的步骤。
本发明实施例包括以下优点:
本发明实施例中,针对车载应用的知识图谱,通过构建细粒度层次化本体、抽象实体节点、丰富的功能实体关联、属性以及规则约束。其中本体可以包括概念类型、实体、关系、属性和规则;概念类型可以包括针对车载应用配置的类型;实体可以包括针对概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;概念实体可以包括业务类实体和控件类实体;关系可以包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;属性可以包括针对实体和关系的属性,业务规则和约束条件;可以根据定义的本体,从原始资源数据中抽取三元组数据作为本体的实例;根据本体和对应的实例,生成语音交互知识图谱。本发明实施例可以为车载应用的语音交互服务提供深层次的、领域完备的知识图谱。
附图说明
图1是本发明的一种针对车载应用的知识图谱生成方法实施例的步骤流程图;
图2是本发明实施例中知识图谱融合的示意图;
图3是本发明的一种服务器的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
车载应用即安装在车载系统的应用程序,对于不同车型的车辆,其所支持的车载应用各自有差异,每个车载应用随着版本的不同,也各自有功能上的差异。因此通用的知识图谱无法准确对车载应用进行匹配。
本发明实施例提出了针对车载应用的知识图谱构建方法,通过构建细粒度层次化本体、抽象实体节点、丰富的功能实体关联、属性以及规则约束等,为车载语音交互服务提供深层次的、领域完备的知识图谱。
参照图1,示出了本发明的一种针对车载应用的知识图谱生成方法实施例的步骤流程图,所述方法具体可以包括如下步骤:
步骤101,获取针对车载应用的原始资源数据。
本发明实施例的方法可以应用于服务器,由服务器获取针对车载应用的原始资源数据。
针对车载应用的原始资源数据可以包括多种数据类型的数据,原始资源数据可以从多个数据源获得。
原始资源数据可以包括通用的车辆配置数据、车辆远程维修记录信息、销售门店信息等业务数据。还可以包括针对车载应用的个性化数据,例如,车载应用的图形用户界面GUI(Graphical User Interface)上传到服务器的数据,针对车载应用的设计文档,使用手册,真实的用户查询语句,以及其他相关数据。
步骤102,获取针对车载应用的语音交互知识图谱配置的本体;所述本体包括概念类型、实体、关系、属性和规则;所述概念类型包括针对车载应用配置的类型;所述实体包括针对所述概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;所述概念实体包括业务类实体和控件类实体;所述关系包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;所述属性包括针对所述实体和所述关系的属性,包括业务规则和约束条件。
知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。
为知识图谱构建提纲schema相当于为其建立本体(Ontology),本体是对知识最为抽象的定义。最基本的本体包括概念、概念层次、属性、属性值类型、关系、关系定义域(Domain)概念集以及关系值域(Range)概念集。在此基础上,可以额外添加规则(Rules)或公理(Axioms)来表示模式层更复杂的约束关系。
实体(Entity)是对客观个体的抽象,是本体的实例。类型(Type)是对具有相同特点或属性的实体集合的抽象。属性(Property)是对实体与实体之间关系的抽象。关系(Relation)是实体与实体之间关系的抽象。
知识图谱结构以三元组数据表示形式定义,主要包括<实体,关系,实体>和<实体,属性,属性值>两类结构。<实体,关系,实体>结构的三元组数据,描述实体之间的关系。例如,<导航路线,has,推荐方案>,<推荐方案,Action,NavigateAction>,<媒体音量,instanceOf,Volume>。<实体,属性,属性值>结构的三元组数据,描述实体具有的属性。例如,<空调温度,minRange,18档>,<Action,needActionValue,true>,<Action,reverseAction,SetCheckOff>等为后者结构。
在本发明实施例中,按照细粒度层次化原则构建知识本体,本体可以包括概念类型、实体、关系、属性和规则。
概念类型的定义采用细粒度、层次化原则。首先挖掘知识的细粒度概念,尽可能对概念类别进行细类划分。
实体可以按定义区分为针对概念类型(ConceptType)的概念实体、针对共性的动作(Action)和值(Value)的抽象类(AbstractType)实体和针对车载应用的功能元素的元素实体。
概念实体包括业务类实体和控件类实体,业务类实体针对的是车载应用的业务,控件类实体针对的是指车载应用具有的控件。业务类实体和控件类实体的定义可以根据实际情况设置内容。
在一种示例中,控件类实体的定义可以包括:
名字 |
标签 |
描述 |
Control |
ConceptType |
控件 |
App |
ConceptType |
应用 |
Page |
ConceptType |
页面 |
Button |
ConceptType |
按钮 |
ImageButton |
ConceptType |
图像按钮 |
ImageView |
ConceptType |
图片视图 |
Slider |
ConceptType |
滑动条 |
SearchView |
ConceptType |
搜索框 |
在一种示例中,业务类实体的定义可以包括:
抽象类实体包括动作实体和值实体。动作实体是用户期望车辆执行的动作实体,值是某个参数的数值。动作实体和值实体的定义可以根据实际情况设置内容。在一种示例中,动作实体的定义可以包括:
名字 |
标签 |
描述 |
SwitchToAction |
Action |
切换为 |
OpenAction |
Action |
打开 |
CloseAction |
Action |
关闭 |
CancelAction |
Action |
取消 |
SelectAction |
Action |
选择 |
EnterAction |
Action |
进入 |
BackToAction |
Action |
返回到 |
SetToAction |
Action |
设为 |
SetUpAction |
Action |
调大 |
SetDownAction |
Action |
调小 |
SlideUpAction |
Action |
向右滑 |
SlideDownAction |
Action |
向左滑 |
在一种示例中,值实体的定义可以包括:
名字 |
标签 |
描述 |
NumberValue |
Value |
数字值 |
RatioValue |
Value |
比例值 |
MinValue |
Value |
最小值 |
MaxValue |
Value |
最大值 |
LittleValue |
Value |
一点值 |
DynamicValue |
Value |
动态内容值 |
本发明实施例中,可以基于车载应用的业务要求定义关系,关系至少可以包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系,用于精准语义理解、知识继承或模糊意图语义理解等任务。
在一种示例中,关系的定义可以包括:
对于关系的属性定义对于车载应用的语义理解作用较大,包含很多业务规则和约束条件,在一种示例中,对关系的约束可以包括:
在实际中,车载应用的交互可以包括场景化交互和全局化交互。场景化交互是指在系统应用处在当前场景页面下进行的用户意图交互,例如“连接第一个蓝牙设备”,“收藏第一条地址”,“导航去第一条路线”等;全局化交互是指不处在功能元素所在场景下进行的用户意图交互,例如在导航页面下“主驾的空调风量调到最大”,“打开调节字体大小的界面”等。
在本发明实施例中,针对实体的约束条件包括:场景化交互约束条件和全局化交互约束条件;场景化交互约束条件为限定车载应用处在当前场景页面下进行的用户意图交互的约束条件;全局化交互约束条件为限定车载应用不处在功能元素所在场景下进行的用户意图交互的约束条件。
例如,场景化下的实体属性集约束包括:sceneId-场景ID,appName-应用名称,sceneName-场景名称,elementLabel-场景元素GUI标识等。全局化下的实体属性集约束包括:direct_flag-页面直达标志,direct_loss_action_flag-直达丢失动作标志,direct_tts-直达tts话术播报等。
考虑汽车配置的不同版本以及车载系统OTA升级的版本迭代,对实体进行版本的属性定义,用于区分不同版本的知识图谱逻辑。
在本发明实施例中,针对实体的约束条件可以包括针对车载系统版本、知识图谱版本、车载应用版本中的至少一种的约束条件。
例如,版本属性包括:kgVersion-知识图谱版本号,OTAVersion-OTA系统版本号,appVersion-应用版本号等。
步骤103,根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例。
在本发明实施例中,原始资源数据可以包括结构化资源数据;结构化资源数据包括存储在数据库的针对车辆业务的关系型数据,例如,通用的车辆配置数据、车辆远程维修记录信息、销售门店信息等业务数据等都是预先整理好的存量业务的数据。
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例的步骤可以包括:根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关系型数据中,查找匹配的目标数据;将所述目标数据转换为三元组数据。
具体的,可以使用数据库处理工具并添加业务规则处理,实现从关系型数据库到资源描述框架RDF(Resource Description Framework)三元组的快速转化。数据库表名直接映射到RDF中的类,字段映射到类的属性,类之间的关系可以从表示关系的表中得出。
在本发明实施例中,原始资源数据还可以包括半结构化资源数据;半结构化资源数据包括从车载应用客户端上传到服务器的场景数据;例如,例如,车载应用的图形用户界面GUI(Graphical User Interface)上传到服务器的数据。场景数据可以包括场景内的功能元素、层次关系和属性;
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例的步骤可以包括:根据所述场景数据中的功能元素、层次关系和属性,生成树形结构的数据;根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述树形结构的数据中,查找匹配的目标数据;将所述目标数据转换为三元组数据。
具体的,车载应用的图形用户界面GUI(Graphical User Interface)上传到服务器的数据为JSON数据。JSON数据中含有场景内功能元素、层次关系和属性,通过构建GUI-JSON数据规则解析器,能够快速高效的获取到场景内的知识,并且能适配到车载应用的其他领域,包括导航、车控、系统设置、空调、音乐等领域。
GUI-JSON规则解析器,可以通过层次遍历父子元素的结构及元素属性信息,转化为树形结构的形态。然后,将树形结构的数据和属性信息,最终转化为三元组的形态。
例如,从GUI-JSON结构中提取到关系三元组可以为:<显示配置,has,亮度调节>,<亮度调节,has,中控亮度>,<亮度调节,has,仪表亮度>,<中控亮度,instanceOf,XSlider>,<中控亮度,action,SetAction>,<亮度调节,has,仪表亮度>等;属性三元组:<中控亮度,minValue,1>,<中控亮度,maxValue,100>,<中控亮度,interval,10>等。
半结构化资源数据还可以包括针对语音交互功能的设置文档;设置文档可以包括业务类实体、关系和属性。所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例的步骤可以包括:根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述设置文档的业务类实体、关系和属性中,查找匹配的目标数据;将所述目标数据转换为三元组数据。
在本发明实施例中,原始资源数据还可以包括非结构化资源数据;非结构化资源数据可以包括非结构化的文本数据,用户针对车载应用的查询语句的文本数据和其他文本数据。例如,车载系统设计文档或用户使用手册、线上用户真实查询语句、离线爬取的领域相关文本数据等,其中隐含着领域任务相关的知识实体、关系及属性信息。
所述根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例的步骤可以包括:从所述非结构化的文本数据中,抽取关键词;根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关键词中选取匹配的目标数据;将所述目标数据转换为三元组数据。
具体的,可以首选对非结构化的文本数据进行分词,得到多个词语以及对应的词性。根据句法依存分析,从文本数据中获取关键词,并基于本体定义和业务规则利用共现关系对知识三元组进行提取。
例如,文本数据为“帮我把副驾的车窗关上”,中文分词结果为“帮我/把/副驾/的/车窗/关上”,词性分析结果为“'d','p','n','uj','n','v'”,句法依存分析结果为'ADV','ADV','ATT','RAD','POB','HED'。
通过利用词性和句法结构分析的结果,如,名词,动词,形容词,定中关系,主谓关系,动宾关系,动补关系等,并共现关系的关键词“副驾”,“车窗”,“关上”等进行提取,可以得到以下知识三元组:<副驾,has,车窗>,<车窗,action,关上>。
步骤104,根据所述本体和对应的实例,生成语音交互知识图谱。
以实体为构建语音交互知识图谱的节点,以实体之间的关系构建节点之间的边,得到语音交互知识图谱。
本发明实施例中,针对车载应用的知识图谱,通过构建细粒度层次化本体、抽象实体节点、丰富的功能实体关联、属性以及规则约束。其中本体可以包括概念类型、实体、关系、属性和规则;概念类型可以包括针对车载应用配置的类型;实体可以包括针对概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;概念实体可以包括业务类实体和控件类实体;关系可以包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;属性可以包括针对实体和关系的属性,业务规则和约束条件;可以根据定义的本体,从原始资源数据中抽取三元组数据作为本体的实例;根据本体和对应的实例,生成语音交互知识图谱。本发明实施例可以为车载应用的语音交互服务提供深层次的、领域完备的知识图谱。
对于车载应用,可以针对多个业务需求构建多个语音交互知识图谱,例如,基于任务型对话任务和问答型对话任务分别构建语音交互知识图谱。在构建不同的语音交互知识图谱时,可以根据需要定义不同的本体、实体、属性、关系,这样可能导致出现不同的语义空间,存在知识的孤立。
在本发明实施例中,可以将至少两个基于车载应用的语音交互知识图谱中的本体、实体、属性、关系分别进行融合,得到融合后的语音交互知识图谱;所述至少两个基于车载应用的语音交互知识图谱包括任务型知识图谱和问答型知识图谱。
本体对齐侧重发现任务型知识图谱和问答型知识图谱的概念层之间等价或相似的类、属性或关系;实体对齐侧重发现知识图谱之间代表相同含义的不同描述实例。
具体的,可以使用基于编辑距离、语义向量表示、近邻网络集合相似度计算方法,完成对相似本体或实体的对齐。特征1:计算基于动态规划思想的实体词最小编辑距离。特征2:通过预训练词向量和双向编码器表征量模型BERT(Bidirectional EncoderRepresentations from Transformers)输出的特征向量表示层对实体或短语语义向量表示,计算余弦相似度。特征3:计算实体节点具有近邻关系的实体集合的相似度。通过整合3类特征做加权的相似度计算,指定相似度阈值,筛选出相似实体的候选集合。通过规则映射,将相似的实体和差异化关系进行融合。
参照图2所示为本发明实施例中知识图谱融合的示意图。其中,任务型知识图谱和问答型知识图谱都存在空调温度,其instanceOf/action/minValue/MaxValue等关系可以融合到一起。“极速降温模式”和“急速降温”两个相似实体可以对齐,并且instanceOf/action/behavior/OperateMethod等关系也可以融合到一起。
在本发明实施例中,可以对语音交互知识图谱中的进行检验,根据检验结果调整语音交互知识图谱。具体的,可以使用校验工具依据业务知识对候选知识进行质检、对知识结构进行再编辑。
在本发明实施例中,可以以图数据形式存储所述语音交互知识图谱;对按照图数据形式存储的所述语音交互知识图谱中的实体节点,建立对应的索引。通过对实体节点构建索引,可以提升图的查询效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种服务器,具体可以包括如下模块:
原始资源数据获取模块301,用于获取针对车载应用的原始资源数据;
本体获取模块302,用于获取针对车载应用的语音交互知识图谱配置的本体;所述本体包括概念类型、实体、关系、属性和规则;所述概念类型包括针对车载应用配置的类型;所述实体包括针对所述概念类型的概念实体、针对动作和值的抽象类实体和针对车载应用的功能元素的元素实体;所述概念实体包括业务类实体和控件类实体;所述关系包括概念类型之间的层次关系、功能元素与概念类型之间的关系、功能元素的上下位拥有关系、功能元素与动作之间的关系、动作与数值之间的关系;所述属性包括针对所述实体和所述关系的属性,包括业务规则和约束条件;
数据抽取模块303,用于根据所述本体,从所述原始资源数据中抽取三元组数据作为所述本体的实例;
知识图谱生成模块304,用于根据所述本体和对应的实例,生成语音交互知识图谱。
在本发明实施例中,所述的服务器还可以包括:
融合模块,用于将至少两个基于车载应用的语音交互知识图谱中的本体、实体、属性、关系分别进行融合,得到融合后的语音交互知识图谱;所述至少两个基于车载应用的语音交互知识图谱包括任务型知识图谱和问答型知识图谱。
在本发明实施例中,所述的服务器还可以包括:
检验模块,用于对所述语音交互知识图谱中的进行检验,根据检验结果调整所述语音交互知识图谱。
在本发明实施例中,所述的服务器还可以包括:
存储模块,用于以图数据形式存储所述语音交互知识图谱;
索引建立模块,用于对按照图数据形式存储的所述语音交互知识图谱中的实体节点,建立对应的索引。
在本发明实施例中,所述针对实体的约束条件包括:场景化交互约束条件和全局化交互约束条件;
所述场景化交互约束条件为限定车载应用处在当前场景页面下进行的用户意图交互的约束条件;
所述全局化交互约束条件为限定车载应用不处在功能元素所在场景下进行的用户意图交互的约束条件。
在本发明实施例中,所述针对实体的约束条件包括针对车载系统版本、知识图谱版本、车载应用版本中的至少一种的约束条件。
在本发明实施例中,所述原始资源数据包括结构化资源数据;所述结构化资源数据包括针对车辆业务的关系型数据;
所述数据抽取模块303可以包括:
第一目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关系型数据中,查找匹配的目标数据;
第一数据转换子模块,用于将所述目标数据转换为三元组数据。
在本发明实施例中,所述原始资源数据包括半结构化资源数据;所述半结构化资源数据包括从车载应用客户端上传到服务器的场景数据;所述场景数据包括场景内的功能元素、层次关系和属性;
所述数据抽取模块303可以包括:
场景数据提取子模块,用于根据所述场景数据中的功能元素、层次关系和属性,生成树形结构的数据;
第二目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述树形结构的数据中,查找匹配的目标数据;
第二数据转换子模块,用于将所述目标数据转换为三元组数据。
在本发明实施例中,所述半结构化资源数据还包括针对语音交互功能的设置文档;所述设置文档包括业务类实体、关系和属性;
所述数据抽取模块303可以包括:
第三目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述设置文档的业务类实体、关系和属性中,查找匹配的目标数据;
第三数据转换子模块,用于将所述目标数据转换为三元组数据。
在本发明实施例中,所述原始资源数据包括非结构化资源数据;所述非结构化资源数据包括非结构化的文本数据,用户针对车载应用的查询语句的文本数据和其他文本数据;
所述数据抽取模块303可以包括:
关键词抽取模块,用于从所述非结构化的文本数据中,抽取关键词;
第四目标数据查找子模块,用于根据所述概念类型、实体、关系、属性和规则中的一种或多种本体,从所述关键词中选取匹配的目标数据;
第四数据转换子模块,用于将所述目标数据转换为三元组数据。
对于服务器实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种服务器,包括:
包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述针对车载应用的知识图谱生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述针对车载应用的知识图谱生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种针对车载应用的知识图谱生成方法和一种服务器,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。