发明内容
有鉴于此,本发明提供了一种基于知识图谱的签约方法、装置、计算机设备及计算机存储介质,主要目的在于解决目前签约过程繁琐的问题。
依据本发明一个方面,提供了一种基于知识图谱的签约方法,该方法包括:
当接收到签约请求时,从所述签约请求中提取出用户信息,确定用户信息的签约协议场景;
基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,所述签约规则中记录有协议书在签约过程中所涉及的各个业务对象;
按照所述签约规则将所述协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理。
进一步地,在所述基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则之前,所述方法还包括:
通过抽取签约过程中的相关数据,组成知识库中的实体;
对所述知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照所述实体之间的关联关系构建知识图谱。
进一步地,所述对所述知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照所述实体之间的关联关系构建知识图谱,具体包括:
从预先收集不同来源的数据中抽取词的上下位关系,利用模式匹配生成包含有上下位词的数据对;
基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系;
采用并列相似度算法计算具有关联关系的各个实体之间的相似度,并按照所述具有关联关系的各个实体之间的相似度构建知识图谱。
进一步地,所述采用并列相似度算法计算具有关联关系的各个实体之间的并列相似度,并按照所述具有关联关系的各个实体之间的并列相似度构建知识图谱,具体包括:
基于语义类抽取的对象,定义包含实体的上下文以及实体相对于上下文的权重;
以所述实体的上下文作为特征向量的维度,以所述实体相对于上下文的权重作为特征向量的值,将具有关联关系的各个实体表示为特征向量;
采用分布相似度算法计算各个特征向量之间的并列相似度,按照所述各个特征向量之间的并列相似度构建知识图谱。
进一步地,在所述基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系之后,所述方法还包括:
利用节点连接技术,形成围绕节点的多种类型数据的关联存储;
所述利用节点连接技术,形成围绕节点的多种类型数据的关联存储,具体包括:
通过对预先收集不同来源的数据进行映射和合并,确定以主体为目标的节点;
利用所述节点表示不同数据源中针对节点的描述,形成对节点的全方位描述,确定节点属性和标签;
根据所述节点属性和标签来描述各类抽象建模成节点的数据之间的关联关系,形成围绕节点的多种类型数据的关联存储。
进一步地,所述基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,具体包括:
通过解析用户信息的签约协议场景,获取用户信息中涉及签约流程的数据实体;
基于预先构建的知识图谱,查询与所述涉及签约流程的数据实体相匹配的签约协议场景,并生成适用于签约协议场景的协议书以及签约规则。
进一步地,所述签约规则中还记录有协议书在各个业务对象的事件机制描述以及签约时序描述,所述按照所述签约规则将所述协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理,具体包括:
根据所述协议书在各个业务对象的事件机制描述,触发所述协议书在各个业务对象之间的流转操作;
按照所述协议书在各个业务对象的签约时序描述,将所述协议书流转至各个业务对象,以便于各个业务对象对协议书进行处理。
依据本发明另一个方面,提供了一种基于知识图谱的签约装置,所述装置包括:
提取单元,用于当接收到签约请求时,从所述签约请求中提取出用户信息,确定用户信息的签约协议场景;
生成单元,用于基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,所述签约规则中记录有协议书在签约过程中所涉及的各个业务对象;
流转单元,用于按照所述签约规则将所述协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理。
进一步地,所述装置还包括:
抽取单元,用于在所述基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则之前,通过抽取签约过程中的相关数据,组成知识库中的实体;
构建单元,用于对所述知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照所述实体之间的关联关系构建知识图谱。
进一步地,所述构建单元包括:
抽取模块,用于从预先收集不同来源的数据中抽取词的上下位关系,利用模式匹配生成包含有上下位词的数据对;
标定模块,用于基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系;
计算模块,用于采用分布相似度算法计算具有关联关系的各个实体之间的并列相似度,并按照所述具有关联关系的各个实体之间的并列相似度构建知识图谱。
进一步地,所述计算模块,具体用于基于语义类抽取的对象,定义包含实体的上下文以及实体相对于上下文的权重;
所述计算模块,具体还用于以所述实体的上下文作为特征向量的维度,以所述实体相对于上下文的权重作为特征向量的值,将具有关联关系的各个实体表示为特征向量;
所述计算模块,具体还用于采用分布相似度算法计算各个特征向量之间的并列相似度,按照所述各个特征向量之间的并列相似度构建知识图谱。
进一步地,所述构建单元还包括:
存储模块,用于在所述基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系之后,利用节点连接技术,形成围绕节点的多种类型数据的关联存储。
所述存储模块,具体用于通过对预先收集不同来源的数据进行映射和合并,确定以主体为目标的节点;
所述存储模块,具体还用于利用所述节点表示不同数据源中针对节点的描述,形成对节点的全方位描述,确定节点属性和标签;
所述存储模块,具体还用于根据所述节点属性和标签来描述各类抽象建模成节点的数据之间的关联关系,形成围绕节点的多种类型数据的关联存储。
进一步地,所述生成单元包括:
获取模块,用于通过解析用户信息的签约协议场景,获取用户信息中涉及签约流程的数据实体;
生成模块,用于基于预先构建的知识图谱,查询与所述涉及签约流程的数据实体相匹配的签约协议场景,并生成适用于签约协议场景的协议书以及签约规则。
进一步地,所述签约规则中还记录有协议书在各个业务对象的事件机制描述以及签约时序描述,所述流转单元包括:
触发模块,用于根据所述协议书在各个业务对象的事件机制描述,触发所述协议书在各个业务对象之间的流转操作;
流转模块,用于按照所述协议书在各个业务对象的签约时序描述,将所述协议书流转至各个业务对象,以便于各个业务对象对协议书进行处理。
依据本发明又一个方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于知识图谱的签约方法的步骤。
依据本发明再一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于知识图谱的签约方法的步骤。
借由上述技术方案,本发明提供一种基于知识图谱的签约方法及装置,当接收到签约请求时,从签约请求中提取用户信息,确定用户信息的签约协议场景,并基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,按照签约规则将协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理。与现有技术中通过电子签约的方式来完成签约相比,本申请通过预先构建知识图谱,将不同签约协议场景分开,形成不同的元组,供后续签约过程中不同协议业务的使用,解决了协议制定、下发、签约、变更以及管理等人共耗时的问题,并在协议书下发后,能够根据知识图谱在签约过程中所涉及的各个业务对象之间进行流转,极大地缩短了签约时间。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种基于知识图谱的签约方法,可以应用于医疗、银行、保险等领域,下述围绕医疗领域作为应用场景来展开具体描述,考虑到现有医保所涉及电子签约的过程,医保管理部门需要与为数众多的医院、药店进行协议拟定、协议签约,该过程耗时费力,提出基于知识图谱的签约方式,可以缩短医保签约时间,如图1所示,该方法包括:
101、当接收到医保签约请求时,从所述医保签约请求中提取出医保用户信息,确定医保用户信息的签约协议场景。
其中,医保签约请求为医保用户请求与医疗机构签约协议的过程,例如,医保用户请求;医保用户信息可以包括请求用户的姓名、性别、医保编号、医保类型等信息。医保用户信息的签约协议场景可以包括协议双方,协议目的等信息,当医保管理人员登录系统后,可以结合医保用户信息选择想要签约的协议场景。
102、基于预先构建的知识图谱,生成适用于签约协议场景的医保协议书以及医保签约规则。
其中,预先构建的知识图谱采用的是自顶向下的构建方式,即先为知识图谱定义好本体与数据模式,再将实体加入到知识库。该构建方式利用一些现有的结构化知识库作为基础知识库,例如,医疗机构数据库、医院数据库以及医保数据库等。
在该步骤中,医保签约规则中记录有医保协议书在医保签约过程中所涉及的各个业务对象,例如,医疗机构、证书授权中心、甲方、乙方等,并且医保签约规则中设置有各个业务对象针对医保协议书的处理逻辑规则,例如,审核材料信息是否已在CA认证机构(证书授权中心)做过证书与账户绑定,机构类型是市机构还是区机构等。
具体应用场景中,在医保管理人员登录系统后,会选择签约协议场景,而在预先构建的知识图谱中,不同签约协议场景会配置有不同的医保协议书,从而智能生成适用于签约协议场景的医保协议书,该医保协议书中可以记录有乙方机构、乙方医疗机构的审核材料信息。当然用户还可以根据自身需求在医保协议书的基础上自定义协议条款、期限等内容。同时自定义新增的内容会与预先构建的知识图谱中的数据进行比对,如果知识图谱中的数据不存在相应内容,该自定义新增的内容会相应更新到预先构建的知识图谱中,并在此过程中不断丰富预先构建的知识图谱。
103、按照所述医保签约规则将所述医保协议书流转至医保协议书在医保签约过程中所涉及的各个业务对象,以便于各个业务对象对医保协议书进行处理。
由于医保签约规则中设置有各个业务对象针对医保协议书的处理逻辑规则,并且该处理逻辑规则适用于签约协议场景的医保协议书,使得在执行医保签约过程中,医保协议书会按照处理规则在各个业务对象之间流转,例如,在医疗机构业务对象接收上传材料,在市医保业务对象审核材料,以便各个业务对象对医保协议书进行处理,完成医保签约过程。
本发明实施例提供的一种基于知识图谱的签约方法,当接收到签约请求时,从医保签约请求中提取医保用户信息,确定医保用户信息的签约协议场景,并基于预先构建的知识图谱,生成适用于签约协议场景的医保协议书以及医保签约规则,按照医保签约规则将医保协议书流转至医保协议书在医保签约过程中所涉及的各个业务对象,以便于各个业务对象对医保协议书进行处理。与现有技术中通过电子签约的方式来完成医保签约相比,本申请通过预先构建知识图谱,将不同签约协议场景分开,形成不同的元组,供后续签约过程中不同医保协议业务的使用,解决了医保协议制定、下发、签约、变更以及管理等人共耗时的问题,并在医保协议书下发后,能够根据知识图谱在医保签约过程中所涉及的各个业务对象之间进行流转,极大地缩短了医保签约时间。
本发明实施例提供了另一种基于知识图谱的签约方法,在基于知识图谱的签约过程中,能自动生成医保协议书,极大缩短了协议签署时间,如图2所示,所述方法包括:
201、当接收到医保签约请求时,从所述医保签约请求中提取出医保用户信息,确定医保用户信息的签约协议场景。
在该步骤中,医保用户在请求与医疗机构签约协议的过程中,通常需要上传签约所需资料,例如,医保用户信息、协议模板所需的信息,以及签约协议场景下所需要的机构资质信息等,从而确定医保用户信息的签约协议场景。
202、通过解析医保用户信息的签约协议场景,获取医保用户信息中涉及签约流程的数据实体。
由于医保签约协议场景中记录有描述医保用户在签约过程中所需要审核对象以及签约的业务对象,通过解析医保用户信息的签约协议场景,从而获取医保用户信息中涉及签约流程的数据实体。
203、基于预先构建的知识图谱,查询与所述涉及签约流程的数据实体相匹配的签约协议场景,并生成适用于签约协议场景的医保协议书以及医保签约规则。
可以理解的是,通过预先构建的知识图谱,将不同签约协议场景分开,形成不同的原则,从而查询与涉及签约流程的数据实体相匹配的签约协议场景,并生成适用于签约协议场景的医保协议书以及医保签约规则。
204、根据所述医保协议书在各个业务对象的事件机制描述,触发所述医保协议书在各个业务对象之间的流转操作。
在该步骤中,根据医保协议书在各个业务对象的事件机制描述,能够体现医保签约事件与数据实体之间的关联,从而按照事件机制描述来触发医保协议书在各个业务对象之间的流转操作。
205、按照所述医保协议书在各个业务对象的签约时序描述,将所述医保协议书流转至各个业务对象,以便于各个业务对象对医保协议书进行处理。
在该步骤中,利用签约流程时序描述来确认每次医保签约事件的发展状况,了解医保签约事件的流转顺序,例如,上传材料-材料审1-修改材料-材料审核2-甲方签约-材料审核2-乙方签约-完成签约过程。
应说明的是,在医保签约过程中,各个业务对象根据签约流程走向,可能需要进行缺失材料的补充,补充的业务数据同样会纳入预先构建的知识图谱,完成知识图谱的自我完善。当然,预先构建的知识图谱可以但不限于支持1-to-1、1-to-N、N-to-1、N-to-N这4种实体关系类型,从而迅速完成多份医保协议书的医保签约。
可以理解的是,知识图谱的构建涉及医保签约相关数据的抽取,利用医保关系来描述各类抽象建模成节点的数据之间的关联,从而支持关联分析;通过节点链接技术,实现围绕节点的多种类型数据的关联存储;使用时间技术描述来客观分析签约流程的动态发展,体现医保签约事件与节点间的关联,并利用签约流程时序描述来实现签约协议在各个业务对象中的跳转。因此,在使用预先构建的知识图谱之前,知识图谱的构建尤为重要,通常情况下知识图谱都是预先在医保签约过程之前就构建好的,因此,在步骤201之前,还应包括具体构建知识图谱的过程,如图3中的骤301-步骤302。
301、通过抽取医保签约过程中的相关数据,组成知识库中的实体。
其中,医保签约过程中的相关数据可以为医保协议书生成所需的协议目的、协议期限、协议责任、协议条款、履行条款期限、违反条款的责任处理、落款元素等。具体可以从以构建的医保知识信息数据库中,借助ETL工具,将签约相关的数据提取到医保签约系统的基础业务数据库中。
可以理解的是,在通过抽取医保签约过程中的相关数据,组成知识库中的实体过程中,具体可以有业务方根据医保签约业务的实际意义确定业务数据,组成知识库中的实体。
302、对所述知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照所述实体之间的关联关系构建知识图谱。
在该步骤中,知识库中实体之间的关联关系能决定医保协议书在医保签约过程中的流向,根据实体之间的关联关系不断丰富知识图谱,进而形成一个网络关系图,直观立体展示医保签约各环节的关联和流转。
具体对知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照实体之间的关联关系构建知识图谱的过程,如图4所示,包括下述步骤3021-步骤3023。
3021、从预先收集不同来源的数据中抽取词的上下位关系,利用模式匹配生成包含有上下位词的数据对。
其中,预先收集的不同来源的数据可以是已有的医保协议文本、网上公开的医保签约的协议信息,通常情况下,当出现包含、包括、有等关系词时,表明数据中存在上下位关系,具体可以利用Hearst模式和IsA模式进行模式匹配,生成包含有上下位词的数据对。
这里的匹配模式有(其中,NPC表示上位词,NP表示下位词)
NPC{包括|包含|有}{NP、}*[等|等等]
NPC{如|比如|像|象}{NP、}*
{NP、}*[{以及|和|与}NP]等NPC
{NP、}*{以及|和|与}{其它|其他}NPC
NP是{一个|一种|一类}NPC
例如,提取对象为“厦门市定点零售药店服务协议包含条款1(条款1)”,上位词是“厦门市定点零售药店服务协议”,下位词是条款1的内容。
应说明的是,不同上下位词在后续医保签约过程中可能需要不同医保协议业务使用,包括医保管理部门与医院、与药店的签约条款有所区分,例如,根据签约对象实体来区分签约协议场景,上位词是“厦门市医保局”,下位词是“医院A”,签约协议场景可能涉及的就是“厦门市定点医院服务协议”,上位词是“北京市医保局”,下位词是“药店B”,签约协议场景可能涉及的就是“北京市定点零售药店服务协议”。
3022、基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系。
在该步骤中,语义类生成过程具体可以包括聚类和语义标定的过程,聚类的结果决定了要生成哪些语义类以及每个语义类包含哪些实体,而语义标定的任务是给一个语义类附加一个或者多个上位词作为其成员的公共上位词。
应说明的是,语义类生成的过程依赖于并列相似性和上下位关系信息来进行聚类和标定。例如,通过上下位关系提取了“厦门市定点零售药店服务协议”的违约主体是“药店A”,违约责任是“责任1”和“责任2”那么语义类标定就将“药店A”作为“责任1”和“责任2”的公共上位词。
为了便于相关数据的抽取,在对包含有上下位词的数据对进行语义标定,得到实体之间的关联关系之后,可以利用节点连接技术,形成围绕节点的多种类型数据的关联存储。具体可以通过对预先收集不同来源的数据进行映射和合并,确定以主体为目标的节点,并利用节点表示不同数据源中针对节点的描述,形成对节点的全方位描述,确定节点属性和标签,根据节点属性和标签来描述各类抽象建模成节点的数据之间的关联关系,形成围绕节点的多类型数据的关联存储。
3023、采用分布相似度算法计算具有关联关系的各个实体之间的并列相似度,并按照所述具有关联关系的各个实体之间的并列相似度构建知识图谱。
在该步骤中,具体采用并列相似度算法计算具有关联关系的各个实体之间的并列相似度的步骤包括:首先基于语义抽取对象,定义包含实体的上下文以及实体相对于上下文的权重,然后以实体的上下文作为特征向量的维度,以实体相对于上下文的权重作为特征向量的值,将具有关联关系的各个实体表示为特征向量,最后采用分布相似度算法计算各个特征向量之间的并列相似度,按照各个特征向量之间的并列相似度构建知识图谱。
上述将各个实体表示为特征向量的过程举例进行说明,假设有三段话:我爱中国;爸爸妈妈爱我;爸爸妈妈爱中国;首先对语料分离并获取其中所有的词,然后对每个词进行编号:1我;2爱;3爸爸;4妈妈;5中国;然后使用one-hot编码对每段话提取特征向量:
得到了最终的特征向量为:
我爱中国->1,1,0,0,1
爸爸妈妈爱我->1,1,1,1,0
爸爸妈妈爱中国->0,1,1,1,1
上述并列相似度表示的是词与词之间的相似性信息,例如,三元组(苹果,梨,S1),表示苹果和梨的相似度是S1。两个词具有较高的并列相似度的条件是他们具有并列关系(即同属于一个语义类),并且具有较大的关联度。按照这样的标准,北京和上海具有较高的并列相似度,而北京和汽车的并列相似度很低(因为它们不属于同一个语义类)。对于海淀、朝阳、闵行三个市辖区来说,海淀和朝阳的并列相似度大于海淀和闵行的并列相似度(因为前两者的关联度更高)。
通常情况下,一个主实体周围会分布多个并列的关联实体,并列相似度越大,说明两个关联实体与主实体之间具有较高的并列相似度,属于同一语义类。具体可以根据各个特征向量之间并列相似度大小,确定实体与所属语义类之间的关联程度,进而刻画各个实体之间的关系架构,形成知识图谱。
上述知识图谱可以为三元组形式即G=(E,R,S),其中,E={e
1,e
2,…,e
|E|}是知识图谱中的实体集合,共包含|E|种不同实体;R={r
1,r
2,…,r
|R|}是知识图谱中的关系集合,共包含|R|种不同关系;
是知识图谱中的三元组集合。三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。例如,中国是一个实体,北京是一个实体,中国-首都-北京是构成一个(实体-关系-实体)的三元组形式,人口是一个中属性2069.3万的属性值,那么北京-人口-2069.3万构成另一个(实体-属性-属性值)的三元组形式。
具体医保签约过程可以如图5所示,医保签约过程中所涉及的各个业务对象包括市医保、区医保、医疗机构、后台以及电子用印等,通过各个对象针对医保协议书的处理规则可以包括如下步骤:市医保在新增协议模板后发起协议,并上传材料至医疗机构,医疗机构通过后台判断是否绑定证书,若是,则将材料流转至市机构或者区机构以及市医保进行审核后通过后,流转乙方签署,若否,通过电子用印生成证书后返回后台绑定ID和账户后流转乙方签署,在乙方签署后经过电子用印进行协议查询,通过后台更新医保协议书,再经过市机构或区机构的电子用印后,流转至甲方签署,并通过电子用印将更新后的医保协议书流转至电子用印的市机构/区机构,根据市机构/区机构流转至相应的机构执行甲方签署,最后流转至电子用印进行协议查询后完成医保签约过程。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种基于知识图谱的签约装置,如图6所示,所述装置包括提取单元41、生成单元42、流转单元43。
提取单元41,可以用于当接收到签约请求时,从所述签约请求中提取出用户信息,确定用户信息的签约协议场景;
生成单元42,可以用于基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,所述签约规则中记录有协议书在签约过程中所涉及的各个业务对象;
流转单元43,可以用于按照所述签约规则将所述协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理。
本发明实施例提供的一种基于知识图谱的签约装置,当接收到签约请求时,从签约请求中提取用户信息,确定用户信息的签约协议场景,并基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则,按照签约规则将协议书流转至协议书在签约过程中所涉及的各个业务对象,以便于各个业务对象对协议书进行处理。与现有技术中通过电子签约的方式来完成签约相比,本申请通过预先构建知识图谱,将不同签约协议场景分开,形成不同的元组,供后续签约过程中不同协议业务的使用,解决了协议制定、下发、签约、变更以及管理等人共耗时的问题,并在协议书下发后,能够根据知识图谱在签约过程中所涉及的各个业务对象之间进行流转,极大地缩短了签约时间。
作为图6中所示基于知识图谱的签约装置的进一步说明,图7是根据本发明实施例另一种基于知识图谱的签约装置的结构示意图,如图7所示,所述装置还包括:
抽取单元44,可以用于在所述基于预先构建的知识图谱,生成适用于签约协议场景的协议书以及签约规则之前,通过抽取签约过程中的相关数据,组成知识库中的实体;
构建单元45,可以用于对所述知识库中的实体进行语义抽取,得到实体之间的关联关系,并按照所述实体之间的关联关系构建知识图谱。
进一步地,所述构建单元45包括:
抽取模块451,可以用于从预先收集不同来源的数据中抽取词的上下位关系,利用模式匹配生成包含有上下位词的数据对;
标定模块452,可以用于基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系;
计算模块453,可以用于采用分布相似度算法计算具有关联关系的各个实体之间的并列相似度,并按照所述具有关联关系的各个实体之间的并列相似度构建知识图谱。
进一步地,所述计算模块453,具体可以用于基于语义类抽取的对象,定义包含实体的上下文以及实体相对于上下文的权重;
所述计算模块453,具体还可以用于以所述实体的上下文作为特征向量的维度,以所述实体相对于上下文的权重作为特征向量的值,将具有关联关系的各个实体表示为特征向量;
所述计算模块453,具体还可以用于采用分布相似度算法计算各个特征向量之间的并列相似度,按照所述各个特征向量之间的并列相似度构建知识图谱。
进一步地,所述构建单元45还包括:
存储模块454,可以用于在所述基于语义类生成过程中的并列相似性以及词的上下位关系,对所述包含有上下位词的数据对进行语义标定,得到实体之间的关联关系之后,利用节点连接技术,形成围绕节点的多种类型数据的关联存储。
所述存储模块454,具体可以用于通过对预先收集不同来源的数据进行映射和合并,确定以主体为目标的节点;
所述存储模块454,具体还可以用于利用所述节点表示不同数据源中针对节点的描述,形成对节点的全方位描述,确定节点属性和标签;
所述存储模块454,具体还可以用于根据所述节点属性和标签来描述各类抽象建模成节点的数据之间的关联关系,形成围绕节点的多种类型数据的关联存储。
进一步地,所述生成单元42包括:
获取模块421,可以用于通过解析用户信息的签约协议场景,获取用户信息中涉及签约流程的数据实体;
生成模块422,可以用于基于预先构建的知识图谱,查询与所述涉及签约流程的数据实体相匹配的签约协议场景,并生成适用于签约协议场景的协议书以及签约规则。
进一步地,所述签约规则中还记录有协议书在各个业务对象的事件机制描述以及签约时序描述,所述流转单元43包括:
触发模块431,可以用于根据所述协议书在各个业务对象的事件机制描述,触发所述协议书在各个业务对象之间的流转操作;
流转模块432,可以用于按照所述协议书在各个业务对象的签约时序描述,将所述协议书流转至各个业务对象,以便于各个业务对象对协议书进行处理。
需要说明的是,本实施例提供的一种基于知识图谱的签约装置所涉及各功能单元的其他相应描述,可以参考图1-图4中的对应描述,在此不再赘述。
基于上述如图1-图4所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1-图4所示的基于知识图谱的签约方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1-图4所示的方法,以及图6、图7所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1-图4所示的基于知识图谱的签约方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的基于知识图谱的签约装置的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有技术相比,本申请通过预先构建知识图谱,将不同签约协议场景分开,形成不同的元组,供后续签约过程中不同协议业务的使用,解决了协议制定、下发、签约、变更以及管理等人共耗时的问题,并在协议书下发后,能够根据知识图谱在签约过程中所涉及的各个业务对象之间进行流转,极大地缩短了签约时间。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。