CN114048325A - 基于知识图谱的案件处理方法及装置、存储介质 - Google Patents

基于知识图谱的案件处理方法及装置、存储介质 Download PDF

Info

Publication number
CN114048325A
CN114048325A CN202111330027.3A CN202111330027A CN114048325A CN 114048325 A CN114048325 A CN 114048325A CN 202111330027 A CN202111330027 A CN 202111330027A CN 114048325 A CN114048325 A CN 114048325A
Authority
CN
China
Prior art keywords
case
target
matching
matched
vector representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111330027.3A
Other languages
English (en)
Inventor
钟彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Pension Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202111330027.3A priority Critical patent/CN114048325A/zh
Publication of CN114048325A publication Critical patent/CN114048325A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及计算机技术领域,涉及了一种基于知识图谱的案件处理方法及装置、存储介质和电子设备。方法包括:提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;将所述目标关键词输入至预先构建的知识图谱案件索引中,搜索得到所述当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示,其中所述案件索引中的案件已预存对应的向量表示;基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。本公开能提高案件检索准确性,确保后续业务流程的高效执行。

Description

基于知识图谱的案件处理方法及装置、存储介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种基于知识图谱的案件处理方法、基于知识图谱的案件处理装置、计算机存储介质和电子设备。
背景技术
随着计算机技术领域的发展,许多行业已经逐渐由计算机替代人工来处理业务,实现高效的自动化业务处理流程。在很多场景下,计算机也可辅助人工来完成工作,例如协助用户进行相关案件信息的索引查找,以便用户根据查找内容高效完成作业。
相关技术中,对案件信息的检索主要通过关键词匹配的方式,将检索请求进行分词并在已建立的索引中执行检索,并对检索结果进行评分、排序并反馈至用户,然而该方式缺少案件语义层面的匹配,导致检索准确率不高,影响业务处理效率。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于知识图谱的案件处理方法及装置、计算机存储介质和电子设备,进而至少在一定程度上避免因案件检索准确率低而影响业务处理效率等问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种基于知识图谱的案件处理方法,包括:提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;将所述目标关键词输入至预先构建的案件索引中,搜索得到所述当前案件的候选匹配案件;将各所述候选匹配案件对应的第二关键词与所述知识图谱进行匹配,得到各所述候选匹配案件的第二向量表示;基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。
在本公开的一种示例性实施例中,所述提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示,包括:获取所述知识图谱中与所述目标关键词具有映射关系的目标实体节点、所述目标实体节点对应的实体属性以及所述目标实体节点具有的实体间关系,其中所述知识图谱中的实体节点具有对应的向量表示;根据所述实体属性和所述实体间关系,将所述目标实体节点对应的向量表示进行融合,得到所述当前案件的第一向量表示。
在本公开的一种示例性实施例中,所述基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,包括:将所述第一向量表示和第二向量表示输入至所述预设相似度模型,得到所述相似度,其中所述预设相似度模型是通过采用预先构建的业务案件向量表示对一相似度模型进行训练得到;获取所述相似度大于预设相似度阈值对应的目标第二向量表示,根据所述目标第二向量表示对应的候选匹配案件,生成所述匹配案件集。
在本公开的一种示例性实施例中,在根据所述相似度从所述候选匹配案件中确定匹配案件集后,所述方法还包括:从所述匹配案件集对应的匹配案件数据中,获取所述匹配案件集中各匹配案件的业务类型和对应的业务处理决策;根据所述业务类型和业务处理决策,向用户推送所述匹配案件集中的目标匹配案件。
在本公开的一种示例性实施例中,所述根据所述业务类型和业务处理决策,向用户推送所述匹配案件集中的目标匹配案件,包括:判断所述匹配案件集中是否存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件;若存在,则将所述第一目标匹配案件推送至所述用户;若不存在,则按照预设风险评估规则,根据所述匹配案件集中各匹配案件的业务类型和业务处理决策,计算各所述匹配案件的风险值,并根据所述风险值确定并向所述用户推送第二目标匹配案件。
在本公开的一种示例性实施例中,所述按照预设风险评估规则,根据所述匹配案件集中各匹配案件的业务类型和业务处理决策,计算各所述匹配案件的风险值,并根据所述风险值确定并向所述用户推送第二目标匹配案件,包括:根据所述预设风险评估规则,获取各所述匹配案件所属业务类型对应的类型权重因子,和各所述匹配案件的业务处理决策对应的决策权重因子;针对每个所述匹配案件,根据对应的所述类型权重因子、决策权重因子、所述目标业务类型对应的类型权重因子和决策权重因子,计算每个所述匹配案件的风险值;获取所述风险值小于预设风险阈值的第二目标匹配案件推送至所述用户;或者获取所述风险值大于预设风险阈值的第二目标匹配案件推送至所述用户。
在本公开的一种示例性实施例中,所述预先构建的知识图谱的构建过程,包括:获取业务案件数据,确定所述业务案件数据中的业务实体,并为各所述业务实体构建实体属性;建立各所述业务实体之间的映射关系,得到实体间关系;根据各所述业务实体、所述业务实体对应的实体属性以及实体间关系确定至少一个三元组;基于所述至少一个三元组构建所述知识图谱。
在本公开的一种示例性实施例中,所述构建过程还包括:将所述知识图谱输入至预先训练的图卷积神经网络,以得到所述知识图谱中的业务实体节点对应的向量表示。
根据本公开的一个方面,提供一种基于知识图谱的案件处理装置,所述装置包括:第一向量表示模块,用于提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;案件索引模块,用于将所述目标关键词输入至预先构建的案件索引中,搜索得到所述当前案件的候选匹配案件;第二向量表示模块,用于将各所述候选匹配案件对应的第二关键词与所述知识图谱进行匹配,得到各所述候选匹配案件的第二向量表示;案件处理模块,用于基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。
根据本公开的一个方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于知识图谱的案件处理方法。
根据本公开的一个方面,提供一种电子设备,包括:一个或多个处理器;以及存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任一项所述的基于知识图谱的案件处理方法。
本公开的示例性实施例中的基于知识图谱的案件处理方法,将当前案件数据中的目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示,随后将目标关键词输入至预先构建的案件索引搜索得到当前案件的候选匹配案件以及得到候选匹配案件的第二向量表示,最后计算第一向量表示与第二向量表示的相似度,以根据相似度从候选匹配案件中确定匹配案件集反馈至用户用以处理当前案件。
一方面,基于预先构建的知识图谱,将案件向量化表示,并基于与预先存储的已有案件的向量表示的相似度确定匹配案件集,实现案件的语义化检索,提高案件检索的准确性;同时,通过目标关键词输入至预先构建的知识图谱案件索引先进行初筛,得到候选匹配案件,并在候选匹配案件的基础上通过预设相似度模型确定得到匹配案件集,通过两步筛选法提高获得匹配案件集的准确性;另一方面,将得到的匹配案件集自动推送至用户以用于处理当前案件,避免人工查找带来的人力资源消耗,减少用户的工作负担,提高用户的业务办理效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示出了根据本公开示例性实施例的基于知识图谱的案件处理方法的流程图;
图2示出了根据本公开示例性实施例的知识图谱构建流程图;
图3示出了根据本公开示例性实施例的根据目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示的流程图;
图4示出了根据本公开示例性实施例的相似度模型构建流程图;
图5示出了根据本公开示例性实施例的获取目标匹配案件的流程图;
图6示出了根据本公开示例性实施例的根据业务类型和业务处理决策确定目标匹配案件推送至用户的流程图;
图7示出了根据本公开示例性实施例的获取第二目标匹配案件并推送至用户得流程图;
图8示出了根据本公开示例性实施例的基于知识图谱的案件处理装置的结构示意图;
图9示出了根据本公开示例性实施例的存储介质的示意图;以及
图10示出了根据本公开示例性实施例的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
现在将参考附图更全面地描述示例性实施方式。然而,示例性实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施例使得本公开将更加全面和完整,并将示例性实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
很多行业,例如银行、证券公司、保险公司、信托投资公司和基金管理公司等,在业务处理工作中往往涉及很多相关或相似案件,而这些相关或相似案件往往对用户处理当前业务具有辅助作用,以保险行业为例,当接收客户向公司提供的保险索赔时,理赔人员可以查找相关案件的案件信息或处理决策等作为该保险索赔的参考,即可以辅助理赔人员加快当前业务的处理效率。目前针对相关或相似案件的查找过程包括:首先理赔人员使用关键词进行案件检索,然后进行人工核实,不仅耗时费力,且仅通过关键词检索缺少案件语义层面上的匹配,案件查找的准确性低,从而影响业务的处理效率和处理效果。
基于此,在本公开示例性实施例中,首先提供了一种基于知识图谱的案件处理方法。参考图1所示,该基于知识图谱的案件处理方法包括以下步骤:
步骤S110:提取当前案件数据中的目标关键词,根据目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;
步骤S120:将目标关键词输入至预先构建的案件索引中,搜索得到当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示,其中案件索引中的案件已预存对应的向量表示;
步骤S130:基于预设相似度模型,获取第一向量表示与各第二向量表示的相似度,并根据所述相似度从候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理当前案件。
根据本示例实施例中的基于知识图谱的案件处理方法,基于预先构建的知识图谱,将案件向量化表示,并基于与预先存储的已有案件的向量表示的相似度确定匹配案件集,实现案件的语义化检索,提高案件检索的准确性;同时,通过目标关键词输入至预先构建的知识图谱案件索引先进行初筛,得到候选匹配案件,并在候选匹配案件的基础上通过预设相似度模型确定得到匹配案件集,通过两步筛选法提高获得匹配案件集的准确性;将得到的匹配案件集自动推送至用户以用于处理当前案件,避免人工查找带来的人力资源消耗,减少用户的工作负担,提高用户的业务办理效率。
下面结合图1对本公开示例性实施例中的基于知识图谱的案件处理方法进行说明。
在步骤S110中,提取当前案件数据中的目标关键词,根据该目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示。
在本公开的示例性实施例中,当前案件数据为当前案件的描述信息;目标关键词为当前案件具有可区别性且独立存在的词语。通过关键词提取算法对当前案件数据中的目标关键词进行提取,关键词提取算法包括但不限于TF-IDF(term frequency-inversedocument frequency,词频-逆文本频率指数)算法、基于pyhanlp算法(一种分词工具)的关键词提取;或者,通过抽取当前案件数据中实体的方式来确定目标关键词,实体抽取即命名实体识别,包括但不限于CRF(Conditional Random Fields,条件随机场)、CNN+CRF(卷积神经网络+条件随机场)、BiLSTM+CRF(双向长短期记忆模型+条件随机场)等,本公开对提取关键词的方法不做特殊限定。
知识图谱是结构化的语义知识库,用于迅速描述案件概念(实体)及其相互关系,即知识图谱是一个由许多概念(实体)节点和边组成的网络图结构,图谱中的边标识相连的两个节点之间的关系,基于三元组的知识图谱为通用表示方式,三元组的基本形式包括(实体-实体关系-实体)和(实体-属性-属性值)等,其中通过对概念(实体)定义属性来对概念(实体)进行进一步描述,实体关系连接不同的实体,通过实体关系节点把知识图谱中的节点连接起来形成一张图谱。例如,中国的首都是北京,其中中国和北京就是实体,而首都则是实体中国和北京之间的关系。
在本公开的示例性实施例中,预先构建的知识图谱的构建过程包括:首先,获取业务案件数据,确定业务案件数据中的业务实体,并为各业务实体构建实体属性;其次,建立各业务实体之间的映射关系,得到实体间关系;接着,根据业务实体、业务实体对应的实体属性以及实体间关系确定至少一个三元组;最后,基于至少一个三元组构建知识图谱。以保险行业为例,业务实体包括保单、理赔案件、人员、机构等;实体属性如理赔报案的处理状态、投保人的姓名、年龄和身份证号等用于进一步细化业务实体描述的信息;实体间关系如保单投保人、受益人和保单的理赔报案等。形成的三元组例如为(保单-受益人-人员)或(人员-年龄-29),等等,然后基于得到的各个三元组,构建知识图谱。
在一些可能的实施方式中,可以建立知识图谱中业务实体节点、实体属性节点及实体间关系节点与数据库表之间的映射关系,基于此,可以按照设定周期从数据库表中抽取实体(概念),以按照设定周期根据数据库表构建且更新知识图谱,也就是说,可以从业务处理的数据库中获取结构化的案件数据,并确定结构化的案件数据对应的业务实体。
在一些可能的实施方式中,为了使得构建的知识图谱足够庞大,除了获取业务处理数据库中的结构化案件数据外,还可以从网络或其它平台等获取业务处理的相关数据。具体而言,可以获取网页中业务处理相关数据,得到非结构化案件数据,并基于自然语言处理算法对非结构化的案件数据进行处理,以用于构建知识图谱。需要说明的是,在获得的结构化业务实体和非结构化业务实体中可能存在重复的业务实体,还可以对重复的业务实体进行去重处理。
在本公开的示例性实施例中,在根据至少一个三元组构建知识图谱后,还可以将知识图谱输入至预先训练好的图卷积神经网络,以得到知识图谱中的业务实体节点对应的向量表示。
具体的,首先,基于预先构建的知识图谱,知识图谱中的业务实体节点数量为N,且每个业务实体节点具有对应的实体属性D,则知识图谱中的业务实体节点以及对应的实体属性组成一个N×D维的矩阵V;其次,根据各个业务实体节点之间的实体间关系组成一个N×N维的矩阵E,也称为邻接矩阵,则知识图谱可表示为G(V,E);最后,将知识图谱G(V,E)输入至图卷积神经网络,即将矩阵V和矩阵E作为图卷积神经网络的输入进行训练。其中,在训练过程中,针对每个业务实体节点,从该业务实体节点的邻居节点处获取特征信息(包括该业务实体节点自身的特征),以利用邻居节点的特征返回一个结果向量作为业务实体节点的向量表示,其中,在每一次迭代过程中,基于无监督损失函数逐渐训练误差降低,且根据业务实体节点对应的实体属性更新业务实体节点对应的向量权重,持续训练直到迭代次数达到预设迭代阈值,则输出知识图谱中每个业务实体节点的向量表示。
进一步的,在获得知识图谱中每个业务实体节点的向量表示后,对已有案件进行构建业务案件向量表示,具体的,基于知识图谱中每个业务实体节点的向量表示,根据已有案件的案件数据中提取概念(实体)的属性以及实体间关系,将已有案件中提取的概念(实体)节点对应的向量表示融合,得到已有案件对应的业务案件向量表示。进一步的,在为每一个已有案件生成对应的业务案件向量表示后,在已构建的知识图谱案件索引中存入各个已有案件的向量表示,至此完成知识图谱的构建。也就是说,参见如图2所示的知识图谱构建流程图,知识图谱的构建过程包括:业务案件数据的获取、业务案件数据中概念(实体)抽取以及实体间关系建立、知识图谱构建、业务案件向量表示以及知识图谱案件索引建立的过程。
通过本公开的示例性实施例,建立基于处理业务的知识图谱,并为图谱建立案件索引,以及对已有案件进行业务案件向量表示并存入索引,实现知识图谱的构建,以用于后续基于知识图谱进行案件处理。
进一步的,本公开的示例性实施例中,在提取当前案件数据中的目标关键词后,根据目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示。图3示出了根据本公开的示例性实施例的根据目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示的流程图,如图3所示,该过程包括如下步骤:
在步骤S310中,获取知识图谱中与目标关键词具有映射关系的目标实体节点、目标实体节点对应的实体属性以及目标实体节点具有的实体间关系。
在本公开的示例性实施例中,由上述构建知识图谱的过程可知,知识图谱中的实体节点具有对应的向量表示,因此可以利用得到的目标关键词与知识图谱进行匹配,得到具有映射关系的目标实体节点,该映射关系是与目标关键词具有相同关系或者与目标关键词具有词义相似关系,例如,理赔与赔偿具有词义相似关系。在获得与目标关键词具有映射关系的目标实体节点后,相应的,获取该目标实体节点对应的实体属性以及具有的实体间关系。
在步骤S320中,根据实体属性和实体间关系,将目标实体节点对应的向量表示进行融合,得到当前案件的第一向量表示。
在本公开的示例性实施例中,根据目标实体对应的实体属性和实体间关系将目标实体节点的向量表示进行融合,得到当前案件的第一向量表示。具体的,可以根据实体属性和实体间关系,将目标实体节点进行组合,以得到当前案件的第一向量表示。
根据本示例性实施例,可以基于提取到的当前案件的目标关键词,以及基于预先构建的知识图谱,得到当前案件对应的包含语义的第一向量表示,从而提高后续基于该第一向量表示进行案件查询的准确性。
在步骤S120中,将目标关键词输入至预先构建的知识图谱案件索引中,搜索得到当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示。
在本公开的示例性实施例中,由上述建立知识图谱的过程可知,已构建的案件索引中的案件已预存对应的向量表示,因此在基于目标关键词搜索得到当前案件的候选匹配案件后,相应的,得到候选匹配案件对应的第二向量表示。其中,已构建的案件索引为基于已有案件构建的倒排索引。倒排索引是实现“关键词-文档矩阵”的一种具体存储形式,通过倒排索引可以根据关键词快速获取包含该关键词的文档列表,即关键词到文件id(identity document,身份标识号)的映射。
在步骤S130中,基于预设相似度模型,获取第一向量表示与各第二向量表示的相似度,并根据相似度从候选匹配案件中确定匹配案件集,以基于匹配案件集处理当前案件。
在本公开的示例性实施例中,预设的相似度模型是通过采用预先构建的业务案件向量表示对一相似度模型进行训练得到。首先,通过将第一向量表示和第二向量表示输入至预设相似度模型,得到第一向量表示与第二向量表示的相似度,其次,获取相似度大于预设相似度阈值对应的目标第二向量表示,根据目标第二向量表示对应的候选匹配案件生成匹配案件集。
下面结合图4对本公开示例性实施例的相似度模型构建过程进行说明,其中,以相似度模型采用余弦相似度模型为例进行说明,如图4所示,相似度模型构建过程包括:
在步骤S410中,对已有案件进行信息标注,并构建对应的业务案件向量表示,得到类案数据集;在步骤S420中,将类案数据集划分为训练集、验证集和测试集,划分比例可以为70%-15%-15%,80%-10%-10%等,本公开对此不做特殊限定;在步骤S430中,设置相似度模型的超参数等训练参数;在步骤S440中,对相似度模型进行训练与评估,并根据训练结果对类案数据集进行调整、对超参数进行调整,直到得到在验证集上表现最好的模型作为训练好的预设相似度模型。
在本公开的示例性实施例中,在根据相似度从候选匹配案件中确定匹配案件集后,还可以从候选匹配案件中获取目标匹配案件并推送至用户,以使用户根据目标匹配案件对当前案件进行处理。
图5示出了根据本公开的示例性实施例的获取目标匹配案件的流程图,如图5所示,该过程包括:
在步骤S510中,从匹配案件集对应的匹配案件数据中,获取匹配案件集中各匹配案件的业务类型和对应的业务处理决策。
在本公开的示例性实施例中,在获得匹配案件集后,获取匹配案件集中每个匹配案件的业务类型和对应的业务处理决策;其中,业务类型用于标识匹配案件所属的业务种类,以保险行业为例,业务类型可以包括意外险、健康险、人寿险等,业务处理决策用于标识对应的匹配案件的处理结果,同样以保险行业为例,业务处理决策可以包括理赔、不同等级理赔金额、拒绝理赔等。
通过本示例性实施例,由于获得的匹配案件集中可能存在大量匹配案件,每个匹配案件的业务类型、业务处理决策可能存在差异,通过获取匹配案件集中每个匹配案件的业务类型和业务处理决策,从业务维度把控每个匹配案件的信息,以用于案件分析。
在步骤S520中,根据业务类型和业务处理决策,向用户推送匹配案件集中的目标匹配案件。
在本公开的示例性实施例中,可以根据每个匹配案件的业务类型和业务处理决策,从匹配案件集中确定目标匹配案件推送至用户。
图6示出了根据本公开示例性实施例的根据业务类型和业务处理决策确定目标匹配案件推送至用户的流程图,如图6所示,该过程包括:
在步骤S610中,判断匹配案件集中是否存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件。
在本公开的示例性实施例中,目标业务类型可根据处理业务的实际情况确定。以处理保险理赔业务为例,目标业务类型可以为客户提出理赔请求的当前案件的业务类型,若客户提出意外险的理赔,则目标业务类型可以为意外险。目标业务处理决策可以根据业务处理的结果需求确定,仍以处理保险理赔业务为例,对于理赔工作人员,能够快速获得与当前理赔案件的业务类型相同,且,业务处理决策为拒绝理赔的案件,就能够为处理当前案件提供参考,因此,对于处理保险理赔业务来说,目标业务处理决策可以为理赔、拒绝理赔、理赔金额等。
在步骤S620中,若匹配案件集中存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件,则将第一目标匹配案件推送至用户。
在本公开的示例性实施例中,第一目标匹配案件为具有目标业务类型且同时具有目标业务处理决策的匹配案件,将该第一目标匹配案件推送至用户,以便用户以该第一目标匹配案件为参考处理当前业务,以提高用户对当前业务的处理效率。
在步骤S630中,若匹配案件集中不存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件,则照预设风险评估规则,根据匹配案件集中各匹配案件的业务类型和业务处理决策,计算各匹配案件的风险值,并根据风险值确定并向用户推送第二目标匹配案件。
在本公开的示例性实施例中,匹配案件的风险值用于标识匹配案件与当前案件的目标处理决策的偏差程度,匹配案件的风险值越高,则该匹配案件与当前案件的目标处理决策的偏差程度越大,相反,匹配案件的风险值越低,则与当前案件的目标处理决策的偏差程度越小。类型权重因子可用于标识不同匹配案件的业务类型的相似程度,也就是说,类型权重因子越接近,则表明对应的匹配案件的业务类型相似程度越高,而若类型权重因子相同,则表明对应的匹配案件的业务类型相同。
在一些可能的实施方式中,根据实际处理业务需求,匹配案件的风险值越高,则表明该具有高风险的匹配案件更适合作为当前案件的参考案件。
在一些可能的实施方式中,根据实际处理业务需求,匹配案件的风险值越低,则表明该具有低风险的匹配案件更适合作为当前案件的参考案件。
在本公开的示例性实施例中,图7示出了根据本公开示例性实施例的获取第二目标匹配案件并推送至用户得流程图,如图7所示,该过程包括:
在步骤S710中,根据预设风险评估规则,获取各匹配案件所属业务类型对应的类型权重因子,和各匹配案件的业务处理决策对应的决策权重因子。
在本公开的示例性实施例中,预设风险评估因子为根据业务处理需求预先配置且规定了各种业务类型对应的类型权重因子、以及业务处理决策对应的决策权重因子。基于此,根据预设风险评估规则,可以获取各匹配案件所属的业务类型对应的类型权重因子,以及各匹配案件的业务处理决策对应的决策权重因子。
在步骤S720中,针对每个匹配案件,根据对应的类型权重因子、决策权重因子、目标业务类型对应的类型权重因子和决策权重因子,计算每个匹配案件的风险值。
在本公开的示例性实施例中,可针对每个匹配案件,根据对应的类型权重因子、决策权重因子、目标业务类型对应的类型权重因子和决策权重因子,计算每个匹配案件的风险值。
在一些可能的实施方式中,分别获取每个匹配案件与目标业务类型对应的类型权重因子的第一差距值,且,获取每个匹配案件与目标业务处理决策对应的决策权重因子的第二差距值;然后获取第一差距值与第二差距值的加权和,其中第一差距值与第二差距值的权重分别由预设的业务类型权重和业务处理决策的权重确定,可根据实际业务需求调整业务类型与业务处理决策的权重倾向性,从而实现风险值的倾向可配置性。
可选地,第一差距值可以分别为每个匹配案件与目标业务类型对应的类型权重因子作差的绝对值,第二差距值可以分别为每个匹配案件与目标业务类型对应的决策权重因子作差的绝对值。
可选地,第一差距值可以分别为每个匹配案件与目标业务类型对应的类型权重因子作差的绝对值,与目标业务类型对应的类型权重因子作比得到,第二差距值可以分别为每个匹配案件与目标业务类型对应的决策权重因子作差的绝对值,与目标业务类型对应的决策权重因子作比得到,当然,还可以通过其它方式计算第一差距值和第二差距值,本公开包括但不限于上述第一差距值和第二差距值的计算方式。
下面以处理保险理赔业务为例,对根据对应的类型权重因子、决策权重因子、目标业务类型对应的类型权重因子和决策权重因子,计算每个匹配案件的风险值进行说明,其中若某客户A投保意外险,在某次滑冰游玩期间,因滑倒导致手腕骨折,产生一定医疗费用,购买滑冰场门票包含意外保险费用,且医疗费用并未超出保额范围,从而滑冰场支付了该客户的医疗费用,但该客户进一步向保险公司提出意外险索赔。
首先,确定该理赔业务的目标业务类型为“意外险”,根据处理业务需求,目标业务处理决策为“拒绝理赔”。根据预设风险评估规则,获得目标业务类型“意外险”对应的目标类型权重因子为7,目标业务处理决策“拒绝理赔”对应的目标决策权重因子为10,且,业务类型与业务处理决策的倾向性权重分别为70%和30%。
其次,在根据当前理赔案件数据确定匹配案件集后,判断匹配案件集中不存在具有“意外险”且“拒绝理赔”的第一目标匹配案件,则按照预设风险评估规则,获取匹配案件集中各匹配案件所属业务类型对应的权重因子分别为:匹配案件1的类型权重因子为6、匹配案件2的类型权重因子为4和匹配案件3的类型权重因子为2;相应的,获取匹配案件集中各匹配案件对应的决策权重因子分别为:匹配案件1的决策权重因子为6、匹配案件2的决策权重因子为10、匹配案件3的决策权重因子为8,则计算匹配案件1、匹配案件2和匹配案件3的风险值分别为:1.9=|7-6|×70%+|10-6|×30%、2.1=|7-4|×70%+|10-10|×30%、和4.1=|7-2|×70%+|10-8|×30%,当然,本示例性实施例中的类型权重因子和决策权重因子仅是示例性的,还可以根据实际业务处理需求进行调整。
通过本示例性实施例,可以根据每个匹配案件的类型权重因子和决策权重因子计算每个匹配案件的风险值,该计算过程结合每个匹配案件的业务类型以及对应的业务处理决策,与目标业务类型和对应的目标业务处理决策的差距值,以案件业务类型和业务处理决策维度考量每个匹配案件的风险值,以便后续根据风险值从匹配案件集中确定第二目标匹配案件,从案件业务类型和业务处理决策维度进一步提高第二目标匹配案件与当前案件的相似程度。
在步骤S730中,获取风险值小于预设风险阈值或风险值大于预设风险阈值的第二目标匹配案件推送至用户。
在本公开的示例性实施例中,可以获取风险值小于预设风险阈值的第二目标匹配案件推送至用户;或者,可以获取风险值大于预设风险阈值的第二目标匹配案件推送至用户。
需要说明的是,选择哪种判别方式来确定第二目标匹配案件推送至用户,可根据风险值的具体计算方式以及实际业务处理需求确定。
以上述处理保险理赔业务为例,在获得匹配案件1、匹配案件2和匹配案件3的风险值分别为1.9、2.1和4.1时,在预设风险阈值为3的情况下,获取风险值小于预设风险阈值的第二目标匹配案件为匹配案件1、匹配案件2,并将匹配案件1、匹配案件2推送至用户。其中,风险值小于预设风险阈值的,表明对应的匹配案件与当前案件在业务类型与业务处理决策更相符,比如,匹配案件1的类型权重因子为6,表明该匹配案件1与当前案件(类型权重因子为7)在案件类型上具有极高相似度,同时匹配案件1的决策权重因子为6,说明该匹配案件1的业务处理决策与“拒绝理赔”可能存在一定差距;相应的,匹配案件2的类型权重因子为4,表明该匹配案件1与当前案件(类型权重因子为7)在案件类型上具有一定相似度,且匹配案件2的决策权重因子为10,说明该匹配案件2的业务处理决策与“拒绝理赔”的业务处理决策相同。而匹配案件3的类型权重因子为2,匹配案件3的决策权重因子为8,由于该匹配案件3的类型权重因子与目标类型权重因子7相差较大,且业务类型对应的倾向性权重为70%,即业务类型在风险值的计算中占比较大,因此,即使匹配案件3的决策权重因子为8,与目标决策权重因子10相差不大,但最终得到的匹配案件3的风险值为4.1大于预设风险阈值,即匹配案件3不作为第二目标匹配案件推送至用户;相反,由于匹配案件1、匹配案件2与当前案件的类型权重因子接近,则将匹配案件1、匹配案件2推送至用户。
根据本示例性实施例,风险值小于或大于预设风险阈值的第二目标匹配案件是与当前案件在案件类型和业务处理决策最相符的案件,通过将第二目标匹配案件推荐至用户,可以辅助用户进行当前案件的处理,从而提高当前案件的处理效果,在具有相似案件参考的情况下,一定程度上,也可以提高当前案件处理结果的说服力。
根据本示例实施例中的基于知识图谱的案件处理方法,基于预先构建的知识图谱,将案件向量化表示,并基于与预先存储案件的向量表示的相似度确定匹配案件集,实现案件的语义化检索,提高案件检索的准确性;同时,通过目标关键词输入至预先构建的知识图谱案件索引先进行初筛,得到候选匹配案件,并在候选匹配案件的基础上通过预设相似度模型确定得到匹配案件集,通过两步筛选法提高获得匹配案件集的准确性;将得到的匹配案件集自动推送至用户以用于处理当前案件,避免人工查找带来的人力资源消耗,减少用户的工作负担,提高用户的业务办理效率。
此外,在本公开的示例性实施例中,还提供了一种基于知识图谱的案件处理装置。参考图8所示,该基于知识图谱的案件处理装置800可以包括向量表示模块810、案件索引模块820以及案件处理模块830。具体地,
向量表示模块810,用于提取当前案件数据中的目标关键词,根据目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;
案件索引模块820,用于将目标关键词输入至预先构建的案件索引中,搜索得到所述当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示,其中所述案件索引中的案件已预存对应的向量表示;
案件处理模块830,用于基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。
在本公开的一示例性实施例中,向量表示模块810可以包括:节点获取单元,用于获取所述知识图谱中与所述目标关键词具有映射关系的目标实体节点、所述目标实体节点对应的实体属性以及所述目标实体节点具有的实体间关系,其中所述知识图谱中的实体节点具有对应的向量表示;向量融合单元,用于根据所述实体属性和所述实体间关系,将所述目标实体节点对应的向量表示进行融合,得到所述当前案件的第一向量表示。
在本公开的一示例性实施例中,案件处理模块830可以包括:相似度获取单元,用于将所述第一向量表示和第二向量表示输入至所述预设相似度模型,得到所述相似度,其中所述预设相似度模型是通过采用预先构建的业务案件向量表示对一相似度模型进行训练得到;比较单元,用于获取所述相似度大于预设相似度阈值对应的目标第二向量表示,根据所述目标第二向量表示对应的候选匹配案件,生成所述匹配案件集。
在本公开的一示例性实施例中,基于知识图谱的案件处理装置800还可以包括:获取模块,用于从所述匹配案件集对应的匹配案件数据中,获取所述匹配案件集中各匹配案件的业务类型和对应的业务处理决策;推荐模块,用于根据所述业务类型和业务处理决策,向用户推送所述匹配案件集中的目标匹配案件。
在本公开的一示例性实施例中,推荐模块可以包括:判断单元,用于判断所述匹配案件集中是否存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件;第一推送单元,用于若存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件,则将所述第一目标匹配案件推送至所述用户;第二推送单元,用于若不存在第一目标匹配案件,则按照预设风险评估规则,根据所述匹配案件集中各匹配案件的业务类型和业务处理决策,计算各所述匹配案件的风险值,并根据所述风险值确定并向所述用户推送第二目标匹配案件。
在本公开的一示例性实施例中,推荐模块还可以包括:权重因子获取单元,用于根据所述预设风险评估规则,获取各所述匹配案件所属业务类型对应的类型权重因子,和各所述匹配案件的业务处理决策对应的决策权重因子;风险值计算单元,用于针对每个所述匹配案件,根据对应的所述类型权重因子、决策权重因子、所述目标业务类型对应的类型权重因子和决策权重因子,计算每个所述匹配案件的风险值;第二目标匹配案件获取单元,用于获取所述风险值小于预设风险阈值的第二目标匹配案件推送至所述用户;或者获取所述风险值大于预设风险阈值的第二目标匹配案件推送至所述用户。
在本公开的一示例性实施例中,基于知识图谱的案件处理装置800还可以包括:信息抽取模块,用于获取业务案件数据,确定所述业务案件数据中的业务实体,并为各所述业务实体构建实体属性;关系建立模块,用于建立各所述业务实体之间的映射关系,得到实体间关系;所述关系建立模块还用于根据各所述业务实体、所述业务实体对应的实体属性以及实体间关系确定至少一个三元组;图谱构建模块,用于基于所述至少一个三元组构建所述知识图谱。
在本公开的一示例性实施例中,基于知识图谱的案件处理装置800还可以包括:实体节点向量表示模块,用于将所述知识图谱输入至预先训练的图卷积神经网络,以得到所述知识图谱中的业务实体节点对应的向量表示。
由于本公开的示例性实施例的基于知识图谱的案件处理装置的各个功能模块与上述基于知识图谱的案件处理方法的发明实施例中相同,因此在此不再赘述。
应当注意,尽管在上文详细描述中提及了基于知识图谱的案件处理装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
参考图8所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图10来描述根据本公开的这种实施例的电子设备1000。图10显示的电子设备1000仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于:上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030、显示单元1040。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1010执行,使得所述处理单元1010执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
存储单元1020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1021和/或高速缓存存储单元1022,还可以进一步包括只读存储单元(ROM)1023。
存储单元1020还可以包括具有一组(至少一个)程序模块1025的程序/实用工具1024,这样的程序模块1025包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1000也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且,电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims (10)

1.一种基于知识图谱的案件处理方法,其特征在于,包括:
提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;
将所述目标关键词输入至预先构建的知识图谱案件索引中,搜索得到所述当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示,其中所述案件索引中的案件已预存对应的向量表示;
基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。
2.根据权利要求1所述的方法,其特征在于,所述提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示,包括:
获取所述知识图谱中与所述目标关键词具有映射关系的目标实体节点、所述目标实体节点对应的实体属性以及所述目标实体节点具有的实体间关系,其中所述知识图谱中的实体节点具有对应的向量表示;
根据所述实体属性和所述实体间关系,将所述目标实体节点对应的向量表示进行融合,得到所述当前案件的第一向量表示。
3.根据权利要求1所述的方法,其特征在于,所述基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,包括:
将所述第一向量表示和第二向量表示输入至所述预设相似度模型,得到所述相似度,其中所述预设相似度模型是通过采用预先构建的业务案件向量表示对一相似度模型进行训练得到;
获取所述相似度大于预设相似度阈值对应的目标第二向量表示,根据所述目标第二向量表示对应的候选匹配案件,生成所述匹配案件集。
4.根据权利要求1所述的方法,其特征在于,在根据所述相似度从所述候选匹配案件中确定匹配案件集后,所述方法还包括:
从所述匹配案件集对应的匹配案件数据中,获取所述匹配案件集中各匹配案件的业务类型和对应的业务处理决策;
根据所述业务类型和业务处理决策,向用户推送所述匹配案件集中的目标匹配案件。
5.根据权利要求4所述的方法,其特征在于,所述根据所述业务类型和业务处理决策,向用户推送所述匹配案件集中的目标匹配案件,包括:
判断所述匹配案件集中是否存在具有目标业务类型且同时具有目标业务处理决策的第一目标匹配案件;
若存在,则将所述第一目标匹配案件推送至所述用户;
若不存在,则按照预设风险评估规则,根据所述匹配案件集中各匹配案件的业务类型和业务处理决策,计算各所述匹配案件的风险值,并根据所述风险值确定并向所述用户推送第二目标匹配案件。
6.根据权利要求5所述的方法,其特征在于,所述按照预设风险评估规则,根据所述匹配案件集中各匹配案件的业务类型和业务处理决策,计算各所述匹配案件的风险值,并根据所述风险值确定并向所述用户推送第二目标匹配案件,包括:
根据所述预设风险评估规则,获取各所述匹配案件所属业务类型对应的类型权重因子,和各所述匹配案件的业务处理决策对应的决策权重因子;
针对每个所述匹配案件,根据对应的所述类型权重因子、决策权重因子、所述目标业务类型对应的类型权重因子和决策权重因子,计算每个所述匹配案件的风险值;
获取所述风险值小于预设风险阈值的第二目标匹配案件推送至所述用户;或者获取所述风险值大于预设风险阈值的第二目标匹配案件推送至所述用户。
7.根据权利要求1~6任一项所述的方法,其特征在于,所述预先构建的知识图谱的构建过程,包括:
获取业务案件数据,确定所述业务案件数据中的业务实体,并为各所述业务实体构建实体属性;
建立各所述业务实体之间的映射关系,得到实体间关系;
根据各所述业务实体、所述业务实体对应的实体属性以及实体间关系确定至少一个三元组;
基于所述至少一个三元组构建所述知识图谱。
8.根据权利要求7所述的方法,其特征在于,所述构建过程还包括:
将所述知识图谱输入至预先训练的图卷积神经网络,以得到所述知识图谱中的业务实体节点对应的向量表示。
9.一种基于知识图谱的案件处理装置,其特征在于,包括:
向量表示模块,用于提取当前案件数据中的目标关键词,根据所述目标关键词与预先构建的知识图谱进行匹配,得到当前案件的第一向量表示;
案件索引模块,用于将所述目标关键词输入至预先构建的案件索引中,搜索得到所述当前案件的候选匹配案件以及候选匹配案件对应的第二向量表示,其中所述案件索引中的案件已预存对应的向量表示;
案件处理模块,用于基于预设相似度模型,获取所述第一向量表示与各所述第二向量表示的相似度,并根据所述相似度从所述候选匹配案件中确定匹配案件集,以基于所述匹配案件集处理所述当前案件。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的基于知识图谱的案件处理方法。
CN202111330027.3A 2021-11-11 2021-11-11 基于知识图谱的案件处理方法及装置、存储介质 Pending CN114048325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111330027.3A CN114048325A (zh) 2021-11-11 2021-11-11 基于知识图谱的案件处理方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111330027.3A CN114048325A (zh) 2021-11-11 2021-11-11 基于知识图谱的案件处理方法及装置、存储介质

Publications (1)

Publication Number Publication Date
CN114048325A true CN114048325A (zh) 2022-02-15

Family

ID=80208298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111330027.3A Pending CN114048325A (zh) 2021-11-11 2021-11-11 基于知识图谱的案件处理方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN114048325A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226541A (zh) * 2023-05-11 2023-06-06 湖南工商大学 一种基于知识图谱的网络热点信息推荐方法、系统及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226541A (zh) * 2023-05-11 2023-06-06 湖南工商大学 一种基于知识图谱的网络热点信息推荐方法、系统及设备

Similar Documents

Publication Publication Date Title
CN111143226B (zh) 自动化测试方法及装置、计算机可读存储介质、电子设备
CN111144723A (zh) 人岗匹配推荐方法及系统、存储介质
CN109918653B (zh) 确定文本数据的关联话题及模型的训练方法、装置和设备
US11238132B2 (en) Method and system for using existing models in connection with new model development
CN115878904B (zh) 基于深度学习的知识产权个性化推荐方法、系统及介质
US11620453B2 (en) System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations
CN110704803A (zh) 目标对象的评估值计算方法及装置、存储介质、电子设备
CN114048325A (zh) 基于知识图谱的案件处理方法及装置、存储介质
CN117112775A (zh) 自动填写输入表单以生成列表的技术
CN116049376A (zh) 一种信创知识检索回复的方法、装置和系统
CN108733702B (zh) 用户查询上下位关系提取的方法、装置、电子设备和介质
KR101658890B1 (ko) 온라인 특허 평가 방법
CN115618264A (zh) 数据资产的主题分类方法、装置、设备和介质
CN113641903B (zh) 基于人工智能的业务匹配方法及服务器
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
KR101456187B1 (ko) 복합 평가 요소에 기초한 특허 평가 방법
CN115660695A (zh) 客服人员标签画像构建方法、装置、电子设备及存储介质
CN115292506A (zh) 应用于办公领域的知识图谱本体构建方法和装置
CN115238676A (zh) 招标需求热点识别方法、装置、存储介质及电子设备
CN114741483A (zh) 数据识别的方法和装置
CN115017385A (zh) 一种物品搜索方法、装置、设备和存储介质
CN114647739A (zh) 实体链指方法、装置、电子设备及存储介质
CN117852553B (zh) 基于聊天记录提取元器件交易场景信息的语言处理系统
US12008047B2 (en) Providing an object-based response to a natural language query
KR101456188B1 (ko) 복합 평가 요소에 기초한 특허 무효성 자동 평가 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination