CN111522963A - 一种基于公安知识图谱引擎的智能助理应用交互方法 - Google Patents

一种基于公安知识图谱引擎的智能助理应用交互方法 Download PDF

Info

Publication number
CN111522963A
CN111522963A CN202010288761.7A CN202010288761A CN111522963A CN 111522963 A CN111522963 A CN 111522963A CN 202010288761 A CN202010288761 A CN 202010288761A CN 111522963 A CN111522963 A CN 111522963A
Authority
CN
China
Prior art keywords
entity
knowledge
public security
alignment
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010288761.7A
Other languages
English (en)
Inventor
刘宇
李维
吴珺
耿鑫
刘生元
牛金良
何宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Fiberhome Telecommunication Technologies Co ltd
Original Assignee
Nanjing Fiberhome Telecommunication Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Fiberhome Telecommunication Technologies Co ltd filed Critical Nanjing Fiberhome Telecommunication Technologies Co ltd
Priority to CN202010288761.7A priority Critical patent/CN111522963A/zh
Publication of CN111522963A publication Critical patent/CN111522963A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Animal Behavior & Ethology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于公安知识图谱引擎的智能助理应用交互方法,属互联网信息技术领域,通过构建公安知识图谱,设计完成智能编排和推理引擎,基于该引擎完成警务智能助理,对于提升警务工作效率具有极大的作用;在构建公安知识图谱的过程中,提出了一些新的训练模型并应用于智能助理;JTMEA训练模型对获取的知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,从而形成一个更加丰富全面的知识图谱;本发明提出了一种全新的嵌入式模型TRNG,利用TRNG算法,生成公安知识图谱中实体与关系的向量表示。通过构建公安知识图谱,设计完成智能编排和推理引擎,基于该引擎完成警务智能助理,对于提升警务工作效率具有极大的作用。

Description

一种基于公安知识图谱引擎的智能助理应用交互方法
技术领域
本发明属于互联网信息技术领域,尤其涉及一种基于公安知识图谱引擎的智能助理应用交互方法。
背景技术
当前公安数据具有维度多,类型全,数据量大等特点;且警务人员仍停留在使用查询和简单分析等应用场景,数据使用不够充分,致相关公安知识的信息挖掘不够充分,通过构建公安知识图谱打造相关公安领域知识库,从而进一步挖掘隐藏的知识信息。
另一方面,公安业务系统较多且业务复杂,流程操作繁琐,对警务人员操作要求较高,无法做到随数据进行深度挖掘和推理。需要设计一种特殊的推理引擎完成该项工作,引擎中除了将公安领域知识数据集加入本体(实体、关系、词林)外,将相关的业务接口和业务能力也进行抽象化加入,实现警务人员无需通过操作多个复杂的系统应用,通过可视化的人机交互对话的形式实现解决数据的深入挖掘应用和分析
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供一种基于公安知识图谱引擎的智能助理应用交互方法,其通过构建公安知识图谱,设计完成智能编排和推理引擎,基于该引擎完成警务智能助理,对于提升警务工作效率具有极大的作用。
本发明为解决上述技术问题采用以下技术方案:
一种基于公安知识图谱引擎的智能助理应用交互方法,具体包含如下步骤:
步骤1,按照领域词汇,从公安系统案件、警情、快报各维度文本中提取人物固有自然属性,生成结构化数据并抽取作为知识图谱当中的实体;其中,领域词汇包含人、案、事、物、地;
步骤2,对特定业务功能处理接口进行定义和封装,形成单独的实体,并建立实体和实体,以及实体和属性之间的关系;
步骤3,对于获取到的实体进行校验:判断获取的信息中必要字段是否有值且格式正确,若无值或非格式正确则舍弃该条数据,对于地址机构及单位类数据基于实体对齐技术进行处理,对轨迹中涉及到的地址信息进行归一化处理,进而得到标准化的地址;其中,实体对齐技术是指将不同实体指向同一个现实对象;
步骤4,针对特定的业务功能处理服务进行抽象并知识图谱化;具体如下:
将现有业务服务归并为本体和关系两大类别,其中本体是对系统、功能的抽象,是组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则;
关系是系统、功能以及操作之间的隶属、业务关系;本体定义系统、功能的类别、操作、输入/输出参数;进而通过这样的抽象化,将系统功能、业务行为、业务数据纳入了统一理论框架;
步骤5,采用CloseIE工具与自训练深度学习模型相结合的方式抽取实体关系,包括DeepDive的抽取和基于深度学习模型的抽取两个模块;
步骤6,公安分布式图存储引擎FitGraph完成对实体属性和实体关系存储;
步骤7,利用JTMEA模型对知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,进而形成一个公安知识图谱;
步骤8,基于公安知识图谱实现推理引擎。
作为本发明一种基于公安知识图谱引擎的智能助理应用交互方法的进一步优选方案,在步骤7中:整个JTMEA训练和迭代对齐过程为:
步骤7.1,利用已有的知识图谱三元组、先验对齐实体以及实体类型对模型进行训练。每经过一定批次的训练后进行一次迭代实体对齐,即执行步骤7.2到步骤7.4;
步骤7.2,依次选择实体集中的一个未对齐实体e1,然后利用公式:
Figure BDA0002449587340000021
选择另一个知识图谱中匹配评分值小于ε的实体,将它们标记为新对齐实体;其中,知识图谱中的未对齐实体e1,可得到另一个知识图谱中使φ(e1,e2)达到最小值的实体e2,参数∈为匹配程度阈值;
步骤7.3,如果标记的对齐实体与之前迭代中产生的对齐结果产生冲突,则利用公式:SD(e1,ex,ey)=s(e1,ex)-s(e1,ey)计算当前参数下实体对的匹配评分差异,选择更可靠的实体;其中,实体e1,候选对齐实体ex和ey,若SD<0,则表明ex是具有更大对齐可能性的候选者,则选择(e1,ex)为对齐实体;
步骤7.4,将新标记的对齐实体添加到对齐实体训练集中,作为下一轮迭代的训练数据;
步骤7.5,直到达到最大迭代对齐次数则终止。
作为本发明一种基于公安知识图谱引擎的智能助理应用交互方法的进一步优选方案,所述步骤8具体包含如下步骤:
步骤8.1,公安自然语言处理引擎对交互内容进行词法分析、句法分析、情感分析文本处理,完成语义解析;
步骤8.2,公安知识图谱引擎完成数据的整合、处理、分析和计算;
步骤8.3,通过水波网络包含图谱结构信息的TRNG训练算法,利用TRNG算法,来生成公安知识图谱中N个实体与N个关系的向量表示,之后则根据知识表示来完成推理分析,并应用于智能助理系统中。
作为本发明一种基于公安知识图谱引擎的智能助理应用交互方法的进一步优选方案,在步骤8.2中,所述TRNG训练算法具体如下:采用最大间隔方法即合页损失,定义如下目标优化函数:
Figure BDA0002449587340000031
其中,h代表头部实体;t代表尾部实体,r代表了两者之间的关系;FF代表实体h和t的综合相似度特征,G为知识图谱中的事实三元组,也就是正样本集合,G′是负样本集合,γ是正参数,是合法三元组与负样本三元组之间的间隔距离,并且能够给模型增加一些容错率。
发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明通过构建公安知识图谱,设计完成智能编排和推理引擎,基于该引擎完成警务智能助理,对于提升警务工作效率具有极大的作用;
2、本发明在构建公安知识图谱的过程中,提出了一些新的训练模型并应用于智能助理;JTMEA训练模型对获取的知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,从而形成一个更加丰富全面的知识图谱;提出了一种全新的嵌入式模型TRNG,利用TRNG算法,生成公安知识图谱中实体与关系的向量表示;之后则根据这些知识表示来完成智能助理推理模块;
3、本发明将公安系统内部现有的一些系统应用功能,做了信息提取,融合到公安知识图谱中,然后基于公安知识图谱设计了智能助理,极大的提高了警务工作者的效率。
附图说明
图1是本发明的方法流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于公安知识图谱引擎的智能助理应用交互方法,具体包含如下步骤:
步骤1,按照领域词汇,从公安系统案件、警情、快报各维度文本中提取人物固有自然属性以及其附属其它相关联属性信息,生成结构化数据并抽取作为知识图谱当中的实体;其中,领域词汇包含人、案、事、物、地;
步骤2,对特定业务功能处理接口进行定义和封装,形成单独的实体,并建立与其它实体和属性的关联关系;实体和实体,实体和属性之间存在多种多样的关系,如:实体父亲和实体儿子之间的关系,实体人和属性年龄之间的关系。
步骤3,对于获取到的实体进行校验:判断获取的信息中必要字段是否有值且格式正确,若无值或非格式正确则舍弃该条数据,对于地址机构及单位类数据基于实体对齐技术进行处理,对于轨迹类数据进行关联标准化处理;实体对齐技术是指将不同实体指向同一个现实对象,是构建知识图谱的必备和重要过程;对于轨迹类数据进行关联标准化处理具体指:轨迹中涉及到的地址信息进行归一化处理,得到标准化的地址,不是本专利具体的讨论内容。
步骤4,针对特定的业务功能处理服务进行抽象并知识图谱化;
具体来说,可以将现有业务服务归并为本体和关系两大类别。
其中,本体是对系统、功能的抽象,是组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则。简单说本体是对一个特定领域概念化的明确表示。
关系是系统、功能以及操作之间的隶属、业务关系;本体定义系统、功能的类别、操作、输入/输出参数;进而通过这样的抽象化,将系统功能、业务行为、业务数据纳入了统一理论框架;
步骤5,采用CloseIE工具与自训练深度学习模型相结合的方式抽取实体关系,包括DeepDive的抽取和基于深度学习模型的抽取两个模块;DeepDive是ClosIE的典型工具,一个开源的知识抽取系统,它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据。
随着深度学习的不断发展,越来越多的深度学习模型被应用于解决关系抽取问题,如循环神经网络、卷积神经网络和递归神经网络等。
此处DeepDive和深度学习模型采用领域内常见方法,并未过多的引入自己特色。
步骤6,公安分布式图存储引擎FitGraph完成对实体属性和关系存储;
步骤7,利用JTMEA模型对知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,进而形成一个公安知识图谱;
步骤8,基于公安知识图谱实现推理引擎。
所述步骤8具体包含如下步骤:
步骤8.1,公安自然语言处理引擎对交互内容进行词法分析、句法分析、情感分析文本处理,完成语义解析;
步骤8.2,公安知识图谱引擎完成数据的整合、处理、分析和计算;
步骤8.3,通过水波网络包含图谱结构信息的TRNG训练算法,利用TRNG算法,来生成公安知识图谱中N个实体与N个关系的向量表示,之后则根据知识表示来完成推理分析,并应用于智能助理系统中。
JTMEA训练和迭代对齐过程:
输入:两个知识图谱的三元组集合TA,TB,实体类型标签集ZA,ZB,先验对齐实体集Itrain,匹配阈值ε,总训练轮次epoch,迭代对齐间隔次数k;
输出:JTMEA的参数θ,新对齐实体集A;
Initialize:
θAttKE←AttKE//依照AttKE模型初始化知识嵌入部分的参数
Figure BDA0002449587340000051
foreachZ∈{ZA∪ZA}
W←I
Train:
for epo in range(epoch/k)do//最大迭代对齐次数
for i in range(k)do
optimize w.r.tLJTMEA//在TA,TB,ZA,ZB和Itrain上交替训练JTMEA模型
end for
for e1∈EA do
CAe1=Neighbors(EB,k)//利用KNN计算另一个知识图谱中的候选实体
Figure BDA0002449587340000052
//选取匹配评分达到最小的实体
Figure BDA0002449587340000053
if
Figure BDA0002449587340000054
then//e1不在Itrain中或者新候选实体
Figure BDA0002449587340000055
比冲突对齐实体更匹配
if
Figure BDA0002449587340000056
then
Figure BDA0002449587340000057
Figure BDA0002449587340000061
end if
end if
end for
end for
整个训练和迭代对齐过程为:
(1)利用已有的知识图谱三元组、先验对齐实体以及实体类型对模型进行训练。每经过一定批次的训练后进行一次迭代实体对齐,即执行第(2)到(4)步;
(2)依次选择实体集中的一个未对齐实体e1,然后利用公式
Figure BDA0002449587340000062
选择另一个知识图谱中匹配评分值小于ε的实体,将它们标记为新对齐实体;其中,知识图谱中的未对齐实体e1,可得到另一个知识图谱中使φ(e1,e2)达到最小值的实体e2,参数∈为匹配程度阈值;
(3)如果标记的对齐实体与之前迭代中产生的对齐结果产生冲突,则利用公式SD(e1,ex,ey)=s(e1,ex)-s(e1,ey)
计算当前参数下实体对的匹配评分差异,选择更可靠的实体;其中,实体e1,候选对齐实体ex和ey,若SD<0,则表明ex是具有更大对齐可能性的候选者,则选择(e1,ex)为对齐实体;
(4)将新标记的对齐实体添加到对齐实体训练集中,作为下一轮迭代的训练数据;
(5)直到达到最大迭代对齐次数则终止。
TRNG训练算法:
知识图谱:用有向图G=(V,E)表示知识图谱,其中,V是知识图谱中所有实体的集合,E则是知识图谱中所有边的集合;而这样一个有向边e=(vi,vj)则表示从实体vi到实体vj之间的关系。接下来则是通过给定的大量三元组数据来构建知识图谱的方法:在每个三元组(h,r,t)中,h代表头部实体;t代表尾部实体。首先在知识图谱中进行搜索,看是否知识图谱中已经存在这两个实体或其中之一。假设h不存在,则在知识图谱中创建一点vi,其中i是h的唯一索引。当h和t所代表的两个节点都创建完毕或被寻找到时,再从h所代表的节点向t所代表的节点建立一个有向边e,代表了两者之间的关系r,另外,同时建立一条反向的边,代表了关系r的反向关系r-1。对于每个三元组都重复以上的操作,直到所有的实体和关系都被包含在知识图谱之内。
所述TRNG训练算法具体如下:采用最大间隔方法即合页损失,定义如下目标优化函数:
Figure BDA0002449587340000071
其中,h代表头部实体;t代表尾部实体,r代表了两者之间的关系;FF代表实体h和t的综合相似度特征,G为知识图谱中的事实三元组,也就是正样本集合,G′是负样本集合,γ是正参数,是合法三元组与负样本三元组之间的间隔距离,并且能够给模型增加一些容错率。
其中,负样本的选取采用非波浪区随机替换法,设随机一个实体x,若
Figure BDA0002449587340000072
and
Figure BDA0002449587340000073
Figure BDA0002449587340000074
其中,k=1,2,...,n,将随机替换两个实体h或者t中的一个,加入到负样本集合;
其中,TRNG模型的训练算法:模型需要的数据有图谱G,训练数据S=(h,r,t),实体集合V,关系集合E,变量α,γ,嵌入维度m;模型训练完毕后会输出三元组的向量表示;对三元组的向量表示进行初始化,使用SGD算法来进行优化,对每一个batch,对batch中的实体集合和关系集合进行归一化,之后找出它的负样本,再用上述目标优化函数来计算损失。
Data:图谱G,训练数据S=(h,r,t),实体集合V,关系集合E,变量α,γ,m
Result:三元组(h,r,t)的向量表示
initialization e∈E and v∈V;
repeat
Batchi(S)←S;
Batchi(A)←Φ;
v=normalization(V);
e=normalization(E);
foreach(h,r,t)∈Batchi(S)do
(h′,r,t′)=negative((h,r,t));
Batchi(A)=Batchi(A)∪{((h,r,t),((h′,r,t′)))};
end
L′=L′+∑Batchi(A)L((h,r,t),((h′,r,t′)));
until end
本发明为了屏蔽众多警务应用的复杂性,让民警专注业务,让数据发挥能量,基于公安知识图谱引擎的新一代智能警务助理应用能够很好的实现业务对数据的不感知。此处,针对某预警场景应用进行详细描述:
警务智能助理支持通过多轮对话,智能语义识别,理解民警业务意图;将业务意图通过融合推理引擎进行处理,基于构建的公安领域知识图谱进行自动推理和分析,编排转换为底层业务功能进行处理。底层业务功能基于引擎编码的处理流程进行自动处理,生成结果推送至交互界面。整个处理流程均通过可视化交互方式进行,以互动交互方式完成整个业务场景的处理。
本发明通过构建公安知识图谱,设计完成智能编排和推理引擎,基于该引擎完成警务智能助理,对于提升警务工作效率具有极大的作用;本发明在构建公安知识图谱的过程中,提出了一些新的训练模型并应用于智能助理;本发明的JTMEA训练模型对获取的知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,从而形成一个更加丰富全面的知识图谱;本发明提出了一种全新的嵌入式模型TRNG(TranswithRippleNeton Graph),利用TRNG算法,生成公安知识图谱中XXXX个实体与XXX个关系的向量表示。之后则根据这些知识表示来完成智能助理推理模块;
本发明将公安系统内部现有的一些系统应用功能,做了信息提取,融合到公安知识图谱中,然后基于公安知识图谱设计了智能助理,极大的提高了警务工作者的效率。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (4)

1.一种基于公安知识图谱引擎的智能助理应用交互方法,其特征在于:具体包含如下步骤:
步骤1,按照领域词汇,从公安系统案件、警情、快报各维度文本中提取人物固有自然属性,生成结构化数据并抽取作为知识图谱当中的实体;其中,领域词汇包含人、案、事、物、地;
步骤2,对特定业务功能处理接口进行定义和封装,形成单独的实体,并建立实体和实体,以及实体和属性之间的关系;
步骤3,对于获取到的实体进行校验:判断获取的信息中必要字段是否有值且格式正确,若无值或非格式正确则舍弃该条数据,对于地址机构及单位类数据基于实体对齐技术进行处理,对轨迹中涉及到的地址信息进行归一化处理,进而得到标准化的地址;其中,实体对齐技术是指将不同实体指向同一个现实对象;
步骤4,针对特定的业务功能处理服务进行抽象并知识图谱化;具体如下:
将现有业务服务归并为本体和关系两大类别,其中本体是对系统、功能的抽象,是组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则;
关系是系统、功能以及操作之间的隶属、业务关系;本体定义系统、功能的类别、操作、输入/输出参数;进而通过这样的抽象化,将系统功能、业务行为、业务数据纳入了统一理论框架;
步骤5,采用CloseIE工具与自训练深度学习模型相结合的方式抽取实体关系,包括DeepDive的抽取和基于深度学习模型的抽取两个模块;
步骤6,公安分布式图存储引擎FitGraph完成对实体属性和实体关系存储;
步骤7,利用JTMEA模型对知识进行加工处理,通过跨知识图谱实体对齐合并其他高质量知识库中的实体关系,进而形成一个公安知识图谱;
步骤8,基于公安知识图谱实现推理引擎。
2.根据权利要求1所述的一种基于公安知识图谱引擎的智能助理应用交互方法,其特征在于:在步骤7中:整个JTMEA训练和迭代对齐过程为:
步骤7.1,利用已有的知识图谱三元组、先验对齐实体以及实体类型对模型进行训练。每经过一定批次的训练后进行一次迭代实体对齐,即执行步骤7.2到步骤7.4;
步骤7.2,依次选择实体集中的一个未对齐实体e1,然后利用公式:
Figure FDA0002449587330000011
选择另一个知识图谱中匹配评分值小于ε的实体,将它们标记为新对齐实体;其中,知识图谱中的未对齐实体e1,可得到另一个知识图谱中使φ(e1,e2)达到最小值的实体e2,参数∈为匹配程度阈值;
步骤7.3,如果标记的对齐实体与之前迭代中产生的对齐结果产生冲突,则利用公式:SD(e1,ex,ey)=s(e1,ex)-s(e1,ey)计算当前参数下实体对的匹配评分差异,选择更可靠的实体;其中,实体e1,候选对齐实体ex和ey,若SD<0,则表明ex是具有更大对齐可能性的候选者,则选择(e1,ex)为对齐实体;
步骤7.4,将新标记的对齐实体添加到对齐实体训练集中,作为下一轮迭代的训练数据;
步骤7.5,直到达到最大迭代对齐次数则终止。
3.根据权利要求1所述的一种基于公安知识图谱引擎的智能助理应用交互方法,其特征在于:所述步骤8具体包含如下步骤:
步骤8.1,公安自然语言处理引擎对交互内容进行词法分析、句法分析、情感分析文本处理,完成语义解析;
步骤8.2,公安知识图谱引擎完成数据的整合、处理、分析和计算;
步骤8.3,通过水波网络包含图谱结构信息的TRNG训练算法,利用TRNG算法,来生成公安知识图谱中N个实体与N个关系的向量表示,之后则根据知识表示来完成推理分析,并应用于智能助理系统中。
4.根据权利要求3所述的一种基于公安知识图谱引擎的智能助理应用方法,其特征在于:在步骤8.2中,所述TRNG训练算法具体如下:采用最大间隔方法即合页损失,定义如下目标优化函数:
Figure FDA0002449587330000021
其中,h代表头部实体;t代表尾部实体,r代表了两者之间的关系;FF代表实体h和t的综合相似度特征,G为知识图谱中的事实三元组,也就是正样本集合,G′是负样本集合,γ是正参数,是合法三元组与负样本三元组之间的间隔距离,并且能够给模型增加一些容错率。
CN202010288761.7A 2020-04-14 2020-04-14 一种基于公安知识图谱引擎的智能助理应用交互方法 Pending CN111522963A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010288761.7A CN111522963A (zh) 2020-04-14 2020-04-14 一种基于公安知识图谱引擎的智能助理应用交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010288761.7A CN111522963A (zh) 2020-04-14 2020-04-14 一种基于公安知识图谱引擎的智能助理应用交互方法

Publications (1)

Publication Number Publication Date
CN111522963A true CN111522963A (zh) 2020-08-11

Family

ID=71902174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010288761.7A Pending CN111522963A (zh) 2020-04-14 2020-04-14 一种基于公安知识图谱引擎的智能助理应用交互方法

Country Status (1)

Country Link
CN (1) CN111522963A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948417A (zh) * 2021-01-29 2021-06-11 上海维外科技有限公司 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
CN116595328A (zh) * 2023-04-17 2023-08-15 京信数据科技有限公司 一种基于知识图谱的数据评分卡模型智能构建装置及方法
CN117131944A (zh) * 2023-10-24 2023-11-28 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法
CN110378824A (zh) * 2019-06-26 2019-10-25 公安部交通管理科学研究所 一种公安交管数据大脑及构建方法
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法
CN110378824A (zh) * 2019-06-26 2019-10-25 公安部交通管理科学研究所 一种公安交管数据大脑及构建方法
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘振宇: "面向公安情报分析的知识图谱推理技术研究与实现", 《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》 *
李攀成: "公共安全领域知识图谱的知识融合技术研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948417A (zh) * 2021-01-29 2021-06-11 上海维外科技有限公司 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
CN112948417B (zh) * 2021-01-29 2023-01-13 上海维外科技有限公司 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
CN116595328A (zh) * 2023-04-17 2023-08-15 京信数据科技有限公司 一种基于知识图谱的数据评分卡模型智能构建装置及方法
CN116595328B (zh) * 2023-04-17 2024-02-20 京信数据科技有限公司 一种基于知识图谱的数据评分卡模型智能构建装置及方法
CN117131944A (zh) * 2023-10-24 2023-11-28 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统
CN117131944B (zh) * 2023-10-24 2024-01-12 中国电子科技集团公司第十研究所 面向多领域的交互式危机事件动态预警方法及系统

Similar Documents

Publication Publication Date Title
CN111488734B (zh) 基于全局交互和句法依赖的情感特征表示学习系统及方法
Zhang et al. A gru-based encoder-decoder approach with attention for online handwritten mathematical expression recognition
Zhang et al. Multi-scale attention with dense encoder for handwritten mathematical expression recognition
CN110825881B (zh) 一种建立电力知识图谱的方法
CN108984724B (zh) 利用高维表示提高特定属性情感分类准确率方法
US20220147836A1 (en) Method and device for text-enhanced knowledge graph joint representation learning
CN106933804B (zh) 一种基于深度学习的结构化信息抽取方法
CN111753024B (zh) 一种面向公共安全领域的多源异构数据实体对齐方法
CN111931506B (zh) 一种基于图信息增强的实体关系抽取方法
CN111782768B (zh) 基于双曲空间表示和标签文本互动的细粒度实体识别方法
CN111522963A (zh) 一种基于公安知识图谱引擎的智能助理应用交互方法
CN109783666A (zh) 一种基于迭代精细化的图像场景图谱生成方法
CN113901229B (zh) 基于句法图卷积的汉越双语新闻事件因果关系抽取方法
Julca-Aguilar et al. A general framework for the recognition of online handwritten graphics
CN111931505A (zh) 一种基于子图嵌入的跨语言实体对齐方法
CN111178085B (zh) 文本翻译器训练方法、专业领域文本语义解析方法和装置
CN113761893A (zh) 一种基于模式预训练的关系抽取方法
CN110245349A (zh) 一种句法依存分析方法、装置及一种电子设备
CN111914555A (zh) 基于Transformer结构的自动化关系抽取系统
CN116932661A (zh) 一种面向网络安全的事件知识图谱构建方法
Peng et al. Image to LaTeX with graph neural network for mathematical formula recognition
CN115860152A (zh) 一种面向人物军事知识发现的跨模态联合学习方法
CN112069825B (zh) 面向警情笔录数据的实体关系联合抽取方法
CN116663539A (zh) 基于RoBERTa和指针网络的中文实体与关系联合抽取方法及系统
CN115422945A (zh) 一种融合情感挖掘的谣言检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200811