CN111797247B - 基于人工智能的案件推送方法、装置、电子设备及介质 - Google Patents

基于人工智能的案件推送方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN111797247B
CN111797247B CN202010944021.4A CN202010944021A CN111797247B CN 111797247 B CN111797247 B CN 111797247B CN 202010944021 A CN202010944021 A CN 202010944021A CN 111797247 B CN111797247 B CN 111797247B
Authority
CN
China
Prior art keywords
case
target
text
word
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010944021.4A
Other languages
English (en)
Other versions
CN111797247A (zh
Inventor
于溦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010944021.4A priority Critical patent/CN111797247B/zh
Publication of CN111797247A publication Critical patent/CN111797247A/zh
Application granted granted Critical
Publication of CN111797247B publication Critical patent/CN111797247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及人工智能,提供一种基于人工智能的案件推送方法、装置、电子设备及介质。该方法能够提取待处理案件及初筛案件,获取案件文本并进行预处理,得到目标文本并分析,得到目标特征并确定特征向量,语义分析目标文本,得到待处理语义向量,获取与初筛案件对应的词语向量及初筛语义向量,计算每个词语向量与特征向量的相似度,得到第一相似度,并计算每个初筛语义向量与待处理语义向量的相似度,得到第二相似度,确定第一相似度及第二相似度的权重,计算第一相似度与第二相似度的加权和,得到分值,根据分值推送初筛案件,能够准确地推送案件。此外,本发明还涉及区块链技术,所述多个词语向量及所述多个初筛语义向量存储于区块链中。

Description

基于人工智能的案件推送方法、装置、电子设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的案件推送方法、装置、电子设备及介质。
背景技术
为了方便法官或者案件负责人对每一个案件有更加深入和系统的了解,类案推荐方法随之产生,即:通过待处理案件的前置文书以及用户总结的争议焦点信息,从过往的裁判文书中寻找到与待处理案件相关度较高的裁判文书并将其推荐给用户,作为案件评判的参考依据。
本申请发明人在研究中发现,目前的类案推荐方法通常是通过TF-IDF、BM25等算法计算前置文书与过往的裁判文书的文本相似度,然而,由于这类算法将词的权重设为与词频反相关,因此这类算法的词权重并不适合法律场景的案件,同时,通过对关键词进行简单的加权匹配,丧失了对待处理案件的语义理解,导致无法准确确定待处理案件与过往裁判文书的相似度。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的案件推送方法、装置、电子设备及介质,能够准确地确定待处理案件与多个初筛案件的相似度,以准确地推送案件。
本发明第一方面提供一种基于人工智能的案件推送方法,所述方法包括:
当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本;
对所述案件文本进行预处理,得到目标文本;
利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量;
对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量;
获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量;
计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度;
基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值;
根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
本发明第二方面提供一种基于人工智能的案件推送装置,所述装置包括:
获取单元,用于当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本;
预处理单元,用于对所述案件文本进行预处理,得到目标文本;
确定单元,用于利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量;
分析单元,用于对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量;
所述获取单元,还用于获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量;
计算单元,用于计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度;
所述计算单元,还用于基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值;
推送单元,用于根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
本发明第三方面提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,获取所述存储器中存储的指令以实现所述基于人工智能的案件推送方法。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器获取以实现所述基于人工智能的案件推送方法。
由以上技术方案可以看出,本发明通过对案件文本进行预处理,能够避免目标文本中存在无用词汇,节省了分析目标文本的线程,进而通过词独立性算法分析目标文本,使本案适用于法律场景类案的推送,通过将目标文本输入至语义向量模型,能够快速得到待处理语义向量。此外,本发明从词语向量及语义向量两个维度上计算待处理案件与多个初筛案件的相似度,能够准确地确定待处理案件与多个初筛案件的相似度,以准确地推送案件。
附图说明
图1是本发明基于人工智能的案件推送方法的较佳实施例的流程图。
图2是本发明基于人工智能的案件推送装置的较佳实施例的功能模块图。
图3是本发明实现基于人工智能的案件推送方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明基于人工智能的案件推送方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述基于人工智能的案件推送方法应用于智慧政务场景中,从而推动智慧城市的建设。所述基于人工智能的案件推送方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或 信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、 数字处理器(DigitalSignal Processor,DSP)、 嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本。
在本发明的至少一个实施例中,所述案件推送请求所携带的信息包括,但不限于:待处理案件、多个用户初筛后的初筛案件。进一步地,所述待处理案件可以是一个案号标识。
在本发明的至少一个实施例中,所述电子设备从所述案件推送请求中提取待处理案件及多个初筛案件包括:
所述电子设备解析所述案件推送请求的方法体,得到所述案件推送请求携带的所有信息,进一步地,所述电子设备从配置标签库中获取第一预设标签,及获取第二预设标签,所述电子设备从所述所有信息中提取与所述第一预设标签对应的信息,作为所述待处理案件,及从所述所有信息中提取与所述第二预设标签对应的信息,作为所述多个初筛案件。
其中,所述方法体是指所述案件推送请求的报文内容。
进一步地,所述配置标签库中存储多个预设标签,更进一步地,所述第一预设标签及所述第二预设标签是指预先定义好的标签。
通过第一预设标签与待处理案件的映射关系,能够准确确定出所述待处理案件,通过第二预设标签与初筛案件的映射关系,能够准确确定出所述多个初筛案件。
在本发明的至少一个实施例中,区块链存储案件信息表,所述电子设备从所述案件信息表中获取与所述待处理案件对应的摘要信息,作为所述案件文本。
其中,所述案件信息表的形式可以是多个二元组,每个二元组包含案件名称和该案件的摘要信息。
例如,其中一个二元组为案件名称:A 案件,摘要信息:下述是针对某地级市所有高校开学时间做出的决定;另一个二元组为案件名称:B 案件,摘要信息:下述是某公司员工在2018年缴纳的税收。当所述待处理案件为A案件时,所述电子设备从所述案件信息表中获取到与所述A案件对应的摘要信息为“下述是针对某地级市所有高校开学时间做出的决定”,所述电子设备将“下述是针对某地级市所有高校开学时间做出的决定”确定为所述案件文本。
S11,对所述案件文本进行预处理,得到目标文本。
在本发明的至少一个实施例中,所述目标文本是对所述案件文本进行预处理后的文本;进一步地,预处理包括,但不限于:清洗、分词、去除停用词等。
在本发明的至少一个实施例中,所述电子设备对所述案件文本进行预处理,得到目标文本包括:
所述电子设备过滤所述案件文本中的预设字符,所述电子设备根据预设的自定义词典对过滤后的案件文本进行切分,得到切分位置,所述电子设备根据所述切分位置,构建至少一个有向无环图,所述电子设备根据所述自定义词典中的权值计算每个有向无环图的概率,所述电子设备将概率最大的有向无环图对应的切分位置确定为目标切分位置,所述电子设备根据所述目标切分位置切分所述过滤后的案件文本,得到多个分词,所述电子设备确定每个分词在所述案件文本中的词性,所述词性包括目标词性,所述目标词性包括拟声词、连词、副词、介词,所述电子设备获取预设停用词表,从所述多个分词中删除所述预设停用词表中的词语及删除词性为所述目标词性的词语,并将删除后的多个分词确定为所述目标文本。
其中,所述预设字符包括,但不限于:表情符号、符号图案等。
进一步地,所述预设的自定义词典中存储至少一个自定义词及每个自定义词对应的权值。
更进一步地,所述预设停用词表中的词语可以根据实际应用场景设置,所述预设停用词表中的词语的特点是词语在文本中出现频率非常高但对文本分析无用的领域专有词,如“争议焦点”、“诉请”等法律领域的专有词。
具体地,所述电子设备利用加权和方式,并根据所述自定义词典中的权值计算每个有向无环图的概率。
通过自定义词典切分所述过滤后的案件文本,能够根据需求切分所述案件文本,进而删除预设停用词表中的词语及词性为目标词性的词语,便于后续能够快速分析目标文本。
S12,利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量。
在本发明的至少一个实施例中,所述目标特征是指对待处理案件起指导性的词语。
在本发明的至少一个实施例中,在利用预先构建的词典分析所述目标文本之前,所述方法还包括:
所述电子设备确定所述待处理案件所属的领域,并从所述领域中获取历史文本,所述电子设备对所述历史文本进行预处理,得到目标历史文本,所述目标历史文本包括多个特征词,所述电子设备计算每个特征词的词频权重,并计算每个特征词的独立性权重,所述电子设备将词频权重大于或者等于第一预设词频阈值,及独立性权重大于或者等于第一预设独立性阈值的特征词确定为第一特征,所述电子设备将词频权重小于所述第一预设词频阈值,且词频权重大于或者等于第二预设词频阈值的特征词,及独立性权重小于所述第一预设独立性阈值,且独立性权重大于或者等于第二预设独立性阈值的特征词确定为第二特征,所述电子设备计算所述第二特征与所述第一特征的词相关性权重,所述电子设备融合所述第一特征及词相关性权重大于配置值的第二特征,得到所述词典。
具体地,所述电子设备计算每个特征词的词频权重包括:
所述电子设备计算包含每个特征词的目标历史文本的第一数量,并计算所述目标历史文本的总数量,所述电子设备将所述总数量除以每个第一数量,得到多个第一运算结果,并对所述多个第一运算结果取以10为底的对数值,得到每个特征词的词频权重。
具体地,所述电子设备计算每个特征词的独立性权重包括:
对于任意特征词,所述电子设备计算不包含所述任意特征词的目标历史文本的第二数量,并计算包含所述任意特征词的目标历史文本的第三数量,所述电子设备将所述第二数量除以所述第三数量,得到所述任意特征词的独立性权重。
具体地,所述电子设备计算所述第二特征与所述第一特征的词相关性权重包括:
所述电子设备计算同时包含所述第二特征及所述第一特征的目标历史文本的数量,得到第四数量,所述电子设备计算包含所述第二特征及不包含所述第一特征的目标历史文本的数量,得到第五数量,所述电子设备计算包含所述第一特征及不包含所述第二特征的目标历史文本的数量,得到第六数量,所述电子设备将所述第五数量乘以所述第六数量,并将所述第四数量除以运算得到的结果,得到所述第二特征与所述第一特征的词相关性权重。
在本发明的至少一个实施例中,所述电子设备利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量包括:
所述电子设备遍历所述目标文本,并从所述目标文本中筛选出所述词典中包含的分词,作为所述目标特征,所述电子设备获取所述目标特征在所述词典中的独立性权重,并获取映射文件,所述电子设备基于所述映射文件,将所述目标特征的独立性权重映射为所述目标特征向量。
其中,所述映射文件中的信息包括所述独立性权重与所述目标特征向量的映射关系。
通过上述实施方式,不仅能够快速确定出目标特征,还能够准确确定所述目标特征的目标特征向量。
S13,对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量。
在本发明的至少一个实施例中,所述目标文本包括多个目标分词,所述电子设备对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量包括:
所述电子设备采用编码技术对所述多个目标分词进行编码,并对编码后的目标文本进行降维,得到所述多个目标分词对应的多个第一特征向量,所述电子设备计算所述多个第一特征向量的平均值,得到所述目标文本对应的第二特征向量,所述电子设备将所述第二特征向量乘以预设权重矩阵,并加上预设偏置值,得到所述目标文本的结果矩阵,所述结果矩阵中每行向量表征所述目标文本对应的语义,所述电子设备采用激活函数计算所述结果矩阵中每个行向量的概率,所述电子设备将概率最大的行向量确定为所述待处理语义向量。
S14,获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量。
需要强调的是,为进一步保证上述多个词语向量及上述多个初筛语义向量的私密和安全性,上述多个词语向量及上述多个初筛语义向量还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述电子设备获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量包括:
所述电子设备确定所述多个初筛案件的多个识别码,根据所述多个识别码从第一预设列表中获取与所述多个识别码对应的向量,作为所述多个词语向量,并根据所述识别码从第二预设列表中获取与所述多个识别码对应的向量,作为所述多个初筛语义向量。
其中,所述多个识别码是指所述多个初筛案件的案件编号,所述第一预设列表中预先存储多个识别码与多个词语向量的映射关系,所述第二预设列表中预先存储多个识别码与多个语义向量的映射关系。
S15,计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度。
在本发明的至少一个实施例中,所述电子设备基于距离公式,计算每个词语向量与所述目标特征向量的距离,并将每个距离确定为每个初筛案件对应的第一相似度。
其中,距离公式属于现有技术,本发明对此不再赘述。
在其他实施例中,所述电子设备计算每个初筛语义向量与所述待处理语义向量的相似度的方式与所述电子设备计算计算每个词语向量与所述目标特征向量的相似度的方式相同。
S16,基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值。
在本发明的至少一个实施例中,所述电子设备基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重包括:
所述电子设备从配置库中获取评估体系,所述评估体系包括目标层、准则层和指标层,所述电子设备根据所述评估体系构建判断矩阵,所述电子设备利用模糊层次分析法将所述判断矩阵转化为模糊一致判断矩阵,所述电子设备基于所述模糊一致判断矩阵计算所述多个第一相似度及所述多个第二相似度的权重。
通过构建了模糊一致判断矩阵,增加了判断矩阵的模糊性及一致性,避免了层次分析法中缺乏依据的一致性检验。
S17,根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
在本发明的至少一个实施例中,所述电子设备可以根据所述分值按照预设顺序对所述多个初筛案件进行排序,其中,所述预设顺序可以是从小至大的顺序,也可以是从大至小的顺序,本发明对此不作限制。
在本发明的至少一个实施例中,所述电子设备对排序后的多个初筛案件进行推送包括:
所述电子设备确定所述案件推送请求的请求等级,所述电子设备根据所述请求等级确定推送方式,所述电子设备以所述推送方式推送所述排序后的多个初筛案件。
通过上述实施方式,能够以合适的方式推送所述排序后的多个初筛案件。
由以上技术方案可以看出,本发明通过对案件文本进行预处理,能够避免目标文本中存在无用词汇,节省了分析目标文本的线程,进而通过词独立性算法分析目标文本,使本案适用于法律场景类案的推送,通过将目标文本输入至语义向量模型,能够快速得到待处理语义向量。此外,本发明从词语向量及语义向量两个维度上计算待处理案件与多个初筛案件的相似度,能够准确地确定待处理案件与多个初筛案件的相似度,以准确地推送案件。
如图2所示,是本发明基于人工智能的案件推送装置的较佳实施例的功能模块图。所述基于人工智能的案件推送装置11包括获取单元110、预处理单元111、确定单元112、分析单元113、计算单元114、推送单元115及融合单元116。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
当接收到案件推送请求时,获取单元110从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本。
在本发明的至少一个实施例中,所述案件推送请求所携带的信息包括,但不限于:待处理案件、多个用户初筛后的初筛案件。进一步地,所述待处理案件可以是一个案号标识。
在本发明的至少一个实施例中,所述获取单元110从所述案件推送请求中提取待处理案件及多个初筛案件包括:
所述获取单元110解析所述案件推送请求的方法体,得到所述案件推送请求携带的所有信息,进一步地,所述获取单元110从配置标签库中获取第一预设标签,及获取第二预设标签,所述获取单元110从所述所有信息中提取与所述第一预设标签对应的信息,作为所述待处理案件,及从所述所有信息中提取与所述第二预设标签对应的信息,作为所述多个初筛案件。
其中,所述方法体是指所述案件推送请求的报文内容。
进一步地,所述配置标签库中存储多个预设标签,更进一步地,所述第一预设标签及所述第二预设标签是指预先定义好的标签。
通过第一预设标签与待处理案件的映射关系,能够准确确定出所述待处理案件,通过第二预设标签与初筛案件的映射关系,能够准确确定出所述多个初筛案件。
在本发明的至少一个实施例中,区块链存储多个案件信息表,所述获取单元110从所述案件信息表中获取与所述待处理案件对应的文本,作为所述案件文本。
其中,所述案件信息表的形式可以是多个二元组,每个二元组包含案件名称和该案件的摘要信息。
例如,其中一个二元组为案件名称:A 案件,摘要信息:下述是针对某地级市所有高校开学时间做出的决定;另一个二元组为案件名称:B 案件,摘要信息:下述是某公司员工在2018年缴纳的税收。当所述待处理案件为A案件时,所述获取单元110从所述案件信息表中获取到与所述A案件对应的摘要信息为“下述是针对某地级市所有高校开学时间做出的决定”,所述获取单元110将“下述是针对某地级市所有高校开学时间做出的决定”确定为所述案件文本。
预处理单元111对所述案件文本进行预处理,得到目标文本。
在本发明的至少一个实施例中,所述目标文本是对所述案件文本进行预处理后的文本;进一步地,预处理包括,但不限于:清洗、分词、去除停用词等。
在本发明的至少一个实施例中,所述预处理单元111对所述案件文本进行预处理,得到目标文本包括:
所述预处理单元111过滤所述案件文本中的预设字符,所述预处理单元111根据预设的自定义词典对过滤后的案件文本进行切分,得到切分位置,所述预处理单元111根据所述切分位置,构建至少一个有向无环图,所述预处理单元111根据所述自定义词典中的权值计算每个有向无环图的概率,所述预处理单元111将概率最大的有向无环图对应的切分位置确定为目标切分位置,所述预处理单元111根据所述目标切分位置切分所述过滤后的案件文本,得到多个分词,所述预处理单元111确定每个分词在所述案件文本中的词性,所述词性包括目标词性,所述目标词性包括拟声词、连词、副词、介词,所述预处理单元111获取预设停用词表,从所述多个分词中删除所述预设停用词表中的词语及删除词性为所述目标词性的词语,并将删除后的多个分词确定为所述目标文本。
其中,所述预设字符包括,但不限于:表情符号、符号图案等。
进一步地,所述预设的自定义词典中存储至少一个自定义词及每个自定义词对应的权值。
更进一步地,所述预设停用词表中的词语可以根据实际应用场景设置,所述预设停用词表中的词语的特点是词语在文本中出现频率非常高但对文本分析无用的领域专有词,如“争议焦点”、“诉请”等法律领域的专有词。
具体地,所述预处理单元111利用加权和方式,并根据所述自定义词典中的权值计算每个有向无环图的概率。
通过自定义词典切分所述过滤后的案件文本,能够根据需求切分所述案件文本,进而删除预设停用词表中的词语及词性为目标词性的词语,便于后续能够快速分析目标文本。
确定单元112利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量。
在本发明的至少一个实施例中,所述目标特征是指对待处理案件起指导性的词语。
在本发明的至少一个实施例中,在利用预先构建的词典分析所述目标文本之前,所述确定单元112确定所述待处理案件所属的领域,并从所述领域中获取历史文本,所述预处理单元111对所述历史文本进行预处理,得到目标历史文本,所述目标历史文本包括多个特征词,计算单元114计算每个特征词的词频权重,并计算每个特征词的独立性权重,所述确定单元112将词频权重大于或者等于第一预设词频阈值,及独立性权重大于或者等于第一预设独立性阈值的特征词确定为第一特征,所述确定单元112将词频权重小于所述第一预设词频阈值,且词频权重大于或者等于第二预设词频阈值的特征词,及独立性权重小于所述第一预设独立性阈值,且独立性权重大于或者等于第二预设独立性阈值的特征词确定为第二特征,所述计算单元114计算所述第二特征与所述第一特征的词相关性权重,融合单元116融合所述第一特征及词相关性权重大于配置值的第二特征,得到所述词典。
具体地,所述计算单元114计算每个特征词的词频权重包括:
所述计算单元114计算包含每个特征词的目标历史文本的第一数量,并计算所述目标历史文本的总数量,所述计算单元114将所述总数量除以每个第一数量,得到多个第一运算结果,并对所述多个第一运算结果取以10为底的对数值,得到每个特征词的词频权重。
具体地,所述计算单元114计算每个特征词的独立性权重包括:
对于任意特征词,所述计算单元114计算不包含所述任意特征词的目标历史文本的第二数量,并计算包含所述任意特征词的目标历史文本的第三数量,所述计算单元114将所述第二数量除以所述第三数量,得到所述任意特征词的独立性权重。
具体地,所述计算单元114计算所述第二特征与所述第一特征的词相关性权重包括:
所述计算单元114计算同时包含所述第二特征及所述第一特征的目标历史文本的数量,得到第四数量,所述计算单元114计算包含所述第二特征及不包含所述第一特征的目标历史文本的数量,得到第五数量,所述计算单元114计算包含所述第一特征及不包含所述第二特征的目标历史文本的数量,得到第六数量,所述计算单元114将所述第五数量乘以所述第六数量,并将所述第四数量除以运算得到的结果,得到所述第二特征与所述第一特征的词相关性权重。
在本发明的至少一个实施例中,所述确定单元112利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量包括:
所述确定单元112遍历所述目标文本,并从所述目标文本中筛选出所述词典中包含的分词,作为所述目标特征,所述确定单元112获取所述目标特征在所述词典中的独立性权重,并获取映射文件,所述确定单元112基于所述映射文件,将所述目标特征的独立性权重映射为所述目标特征向量。
其中,所述映射文件中的信息包括所述独立性权重与所述目标特征向量的映射关系。
通过上述实施方式,不仅能够快速确定出目标特征,还能够准确确定所述目标特征的目标特征向量。
分析单元113对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量。
在本发明的至少一个实施例中,所述目标文本包括多个目标分词,所述分析单元113对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量包括:
所述分析单元113采用编码技术对所述多个目标分词进行编码,并对编码后的目标文本进行降维,得到所述多个目标分词对应的多个第一特征向量,所述分析单元113计算所述多个第一特征向量的平均值,得到所述目标文本对应的第二特征向量,所述分析单元113将所述第二特征向量乘以预设权重矩阵,并加上预设偏置值,得到所述目标文本的结果矩阵,所述结果矩阵中每行向量表征所述目标文本对应的语义,所述分析单元113采用激活函数计算所述结果矩阵中每个行向量的概率,所述分析单元113将概率最大的行向量确定为所述待处理语义向量。
所述获取单元110获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量。
需要强调的是,为进一步保证上述多个词语向量及上述多个初筛语义向量的私密和安全性,上述多个词语向量及上述多个初筛语义向量还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述获取单元110获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量包括:
所述获取单元110确定所述多个初筛案件的多个识别码,根据所述多个识别码从第一预设列表中获取与所述多个识别码对应的向量,作为所述多个词语向量,并根据所述识别码从第二预设列表中获取与所述多个识别码对应的向量,作为所述多个初筛语义向量。
其中,所述多个识别码是指所述多个初筛案件的案件编号,所述第一预设列表中预先存储多个识别码与多个词语向量的映射关系,所述第二预设列表中预先存储多个识别码与多个语义向量的映射关系。
所述计算单元114计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度。
在本发明的至少一个实施例中,所述计算单元114基于距离公式,计算每个词语向量与所述目标特征向量的距离,并将每个距离确定为每个初筛案件对应的第一相似度。
其中,距离公式属于现有技术,本发明对此不再赘述。
在其他实施例中,所述计算单元114计算每个初筛语义向量与所述待处理语义向量的相似度的方式与所述计算单元114计算计算每个词语向量与所述目标特征向量的相似度的方式相同。
所述计算单元114基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值。
在本发明的至少一个实施例中,所述计算单元114基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重包括:
所述计算单元114从配置库中获取评估体系,所述评估体系包括目标层、准则层和指标层,所述计算单元114根据所述评估体系构建判断矩阵,所述计算单元114利用模糊层次分析法将所述判断矩阵转化为模糊一致判断矩阵,所述计算单元114基于所述模糊一致判断矩阵计算所述多个第一相似度及所述多个第二相似度的权重。
通过构建了模糊一致判断矩阵,增加了判断矩阵的模糊性及一致性,避免了层次分析法中缺乏依据的一致性检验。
推送单元115根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
在本发明的至少一个实施例中,所述推送单元115可以根据所述分值按照预设顺序对所述多个初筛案件进行排序,其中,所述预设顺序可以是从小至大的顺序,也可以是从大至小的顺序,本发明对此不作限制。
在本发明的至少一个实施例中,所述推送单元115对排序后的多个初筛案件进行推送包括:
所述推送单元115确定所述案件推送请求的请求等级,所述推送单元115根据所述请求等级确定推送方式,所述推送单元115以所述推送方式推送所述排序后的多个初筛案件。
通过上述实施方式,能够以合适的方式推送所述排序后的多个初筛案件。
由以上技术方案可以看出,本发明通过对案件文本进行预处理,能够避免目标文本中存在无用词汇,节省了分析目标文本的线程,进而通过词独立性算法分析目标文本,使本案适用于法律场景类案的推送,通过将目标文本输入至语义向量模型,能够快速得到待处理语义向量。此外,本发明从词语向量及语义向量两个维度上计算待处理案件与多个初筛案件的相似度,能够准确地确定待处理案件与多个初筛案件的相似度,以准确地推送案件。
如图3所示,是本发明实现基于人工智能的案件推送方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于人工智能的案件推送程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及获取所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
所述处理器13获取所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13获取所述应用程序以实现上述各个基于人工智能的案件推送方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13获取,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的获取过程。例如,所述计算机程序可以被分割成获取单元110、预处理单元111、确定单元112、分析单元113、计算单元114、推送单元115及融合单元116。
所述存储器12可用于存储所述计算机程序和/或模块,所述处理器13通过运行或获取存储在所述存储器12内的计算机程序和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器12可以包括非易失性和易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器获取时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可获取文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种基于人工智能的案件推送方法,所述多个指令被所述处理器13获取及执行从而实现:当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本;对所述案件文本进行预处理,得到目标文本;利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量;对所述目标文本进行语义分析,得到所述待处理案件的待处理语义向量;获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量;计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度;基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值;根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种基于人工智能的案件推送方法,其特征在于,所述基于人工智能的案件推送方法包括:
当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本;
对所述案件文本进行预处理,得到目标文本,所述目标文本包括多个目标分词;
利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量;
采用编码技术对所述多个目标分词进行编码,并对编码后的目标文本进行降维,得到所述多个目标分词对应的多个第一特征向量;
计算所述多个第一特征向量的平均值,得到所述目标文本对应的第二特征向量;
将所述第二特征向量乘以预设权重矩阵,并加上预设偏置值,得到所述目标文本的结果矩阵,所述结果矩阵中每行向量表征所述目标文本对应的语义;
采用激活函数计算所述结果矩阵中每个行向量的概率;
将概率最大的行向量确定为所述待处理语义向量;
获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量;
计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度;
基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值;
根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
2.如权利要求1所述的基于人工智能的案件推送方法,其特征在于,所述从所述案件推送请求中提取待处理案件及多个初筛案件包括:
解析所述案件推送请求的方法体,得到所述案件推送请求携带的所有信息;
从配置标签库中获取第一预设标签,及获取第二预设标签;
从所述所有信息中提取与所述第一预设标签对应的信息,作为所述待处理案件,及从所述所有信息中提取与所述第二预设标签对应的信息,作为所述多个初筛案件。
3.如权利要求1所述的基于人工智能的案件推送方法,其特征在于,所述对所述案件文本进行预处理,得到目标文本包括:
过滤所述案件文本中的预设字符;
根据预设的自定义词典对过滤后的案件文本进行切分,得到切分位置;
根据所述切分位置,构建至少一个有向无环图;
根据所述自定义词典中的权值计算每个有向无环图的概率;
将概率最大的有向无环图对应的切分位置确定为目标切分位置;
根据所述目标切分位置切分所述过滤后的案件文本,得到多个分词;
确定每个分词在所述案件文本中的词性,所述词性包括目标词性,所述目标词性包括拟声词、连词、副词、介词;
获取预设停用词表,从所述多个分词中删除所述预设停用词表中的词语及删除词性为所述目标词性的词语,并将删除后的多个分词确定为所述目标文本。
4.如权利要求1所述的基于人工智能的案件推送方法,其特征在于,在利用预先构建的词典分析所述目标文本之前,所述方法还包括:
确定所述待处理案件所属的领域,并从所述领域中获取历史文本;
对所述历史文本进行预处理,得到目标历史文本,所述目标历史文本包括多个特征词;
计算每个特征词的词频权重;
对于每个特征词中任意特征词,计算不包含所述任意特征词的目标历史文本的第二数量,并计算包含所述任意特征词的目标历史文本的第三数量,将所述第二数量除以所述第三数量,得到每个特征词的独立性权重;
将词频权重大于或者等于第一预设词频阈值,及独立性权重大于或者等于第一预设独立性阈值的特征词确定为第一特征;
将词频权重小于所述第一预设词频阈值,且词频权重大于或者等于第二预设词频阈值的特征词,及独立性权重小于所述第一预设独立性阈值,且独立性权重大于或者等于第二预设独立性阈值的特征词确定为第二特征;
计算所述第二特征与所述第一特征的词相关性权重;
融合所述第一特征及词相关性权重大于配置值的第二特征,得到所述词典。
5.如权利要求4所述的基于人工智能的案件推送方法,其特征在于,所述利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量包括:
遍历所述目标文本,并从所述目标文本中筛选出所述词典中包含的分词,作为所述目标特征;
获取所述目标特征在所述词典中的独立性权重,并获取映射文件;
基于所述映射文件,将所述目标特征的独立性权重映射为所述目标特征向量。
6.如权利要求1所述的基于人工智能的案件推送方法,其特征在于,所述基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重包括:
从配置库中获取评估体系,所述评估体系包括目标层、准则层和指标层;
根据所述评估体系构建判断矩阵;
利用模糊层次分析法将所述判断矩阵转化为模糊一致判断矩阵;
基于所述模糊一致判断矩阵计算所述多个第一相似度及所述多个第二相似度的权重。
7.一种基于人工智能的案件推送装置,其特征在于,所述基于人工智能的案件推送装置包括:
获取单元,用于当接收到案件推送请求时,从所述案件推送请求中提取待处理案件及多个初筛案件,并获取所述待处理案件对应的案件文本;
预处理单元,用于对所述案件文本进行预处理,得到目标文本,所述目标文本包括多个目标分词;
确定单元,用于利用预先构建的词典分析所述目标文本,得到所述待处理案件对应的目标特征,并确定所述目标特征的目标特征向量;
分析单元,用于采用编码技术对所述多个目标分词进行编码,并对编码后的目标文本进行降维,得到所述多个目标分词对应的多个第一特征向量;
所述分析单元,还用于计算所述多个第一特征向量的平均值,得到所述目标文本对应的第二特征向量;
所述分析单元,还用于将所述第二特征向量乘以预设权重矩阵,并加上预设偏置值,得到所述目标文本的结果矩阵,所述结果矩阵中每行向量表征所述目标文本对应的语义;
所述分析单元,还用于采用激活函数计算所述结果矩阵中每个行向量的概率;
所述分析单元,还用于将概率最大的行向量确定为所述待处理语义向量;
所述获取单元,还用于获取与所述多个初筛案件对应的多个词语向量,及获取与所述多个初筛案件对应的多个初筛语义向量;
计算单元,用于计算每个词语向量与所述目标特征向量的相似度,得到多个第一相似度,并计算每个初筛语义向量与所述待处理语义向量的相似度,得到多个第二相似度;
所述计算单元,还用于基于层次分析法确定所述多个第一相似度及所述多个第二相似度的权重,并根据所述权重对所述多个第一相似度与所述多个第二相似度进行加权和运算,得到所述多个初筛案件的分值;
推送单元,用于根据所述分值对所述多个初筛案件进行排序,并对排序后的多个初筛案件进行推送。
8.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,获取所述存储器中存储的指令以实现如权利要求1至6中任意一项所述的基于人工智能的案件推送方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至6中任意一项所述的基于人工智能的案件推送方法。
CN202010944021.4A 2020-09-10 2020-09-10 基于人工智能的案件推送方法、装置、电子设备及介质 Active CN111797247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010944021.4A CN111797247B (zh) 2020-09-10 2020-09-10 基于人工智能的案件推送方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010944021.4A CN111797247B (zh) 2020-09-10 2020-09-10 基于人工智能的案件推送方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN111797247A CN111797247A (zh) 2020-10-20
CN111797247B true CN111797247B (zh) 2020-12-22

Family

ID=72834249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010944021.4A Active CN111797247B (zh) 2020-09-10 2020-09-10 基于人工智能的案件推送方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN111797247B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051899A (zh) * 2021-04-23 2021-06-29 深圳壹账通智能科技有限公司 同义词库构建方法、装置、设备及存储介质
CN113361248B (zh) * 2021-06-30 2022-08-12 平安普惠企业管理有限公司 一种文本的相似度计算的方法、装置、设备及存储介质
CN116070624A (zh) * 2023-04-06 2023-05-05 中南大学 一种基于环保案件要素的类案推送方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688690B2 (en) * 2010-04-15 2014-04-01 Palo Alto Research Center Incorporated Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction
CN108804443A (zh) * 2017-04-27 2018-11-13 安徽富驰信息技术有限公司 一种基于多特征融合的司法类案搜索方法
CN109684628A (zh) * 2018-11-23 2019-04-26 武汉烽火众智数字技术有限责任公司 基于案情语义分析的案件智能推送方法及系统
CN109783639B (zh) * 2018-12-24 2020-10-27 银江股份有限公司 一种基于特征提取的调解案件智能分派方法及系统
CN110597949A (zh) * 2019-08-01 2019-12-20 湖北工业大学 一种基于词向量和词频的法院相似案件推荐模型
CN110750993A (zh) * 2019-10-15 2020-02-04 成都数联铭品科技有限公司 分词方法及分词器、命名实体识别方法及系统
CN111309900B (zh) * 2020-01-17 2022-09-06 中国科学技术大学 一种法律类案相似度判别及推送方法

Also Published As

Publication number Publication date
CN111797247A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111695033B (zh) 企业舆情分析方法、装置、电子设备及介质
CN106328147B (zh) 语音识别方法和装置
CN111797247B (zh) 基于人工智能的案件推送方法、装置、电子设备及介质
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
CN111222305A (zh) 一种信息结构化方法和装置
CN111639181A (zh) 基于分类模型的论文分类方法、装置、电子设备及介质
US11645447B2 (en) Encoding textual information for text analysis
CN111291177A (zh) 一种信息处理方法、装置和计算机存储介质
CN111597309A (zh) 相似企业推荐方法、装置、电子设备及介质
CN113283238B (zh) 文本数据处理的方法和装置、电子设备和存储介质
CN113094478B (zh) 表情回复方法、装置、设备及存储介质
CN110569350A (zh) 法条推荐方法、设备和存储介质
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
CN112347223A (zh) 文档检索方法、设备及计算机可读存储介质
WO2021012958A1 (zh) 原创文本甄别方法、装置、设备与计算机可读存储介质
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN115759082A (zh) 一种基于改进Simhash算法的文本查重方法及装置
CN113627186B (zh) 基于人工智能的实体关系检测方法及相关设备
CN114943285A (zh) 互联网新闻内容数据智能审核系统
CN113868417A (zh) 一种敏感评论识别方法、装置、终端设备和存储介质
CN112528021A (zh) 一种模型训练方法、模型训练装置及智能设备
CN115495636A (zh) 网页搜索方法、装置及存储介质
CN111552827A (zh) 标注方法和装置、行为意愿预测模型训练方法和装置
CN113742455B (zh) 基于人工智能的简历搜索方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant