CN111428041A - 案件摘要生成方法、装置、系统和存储介质 - Google Patents

案件摘要生成方法、装置、系统和存储介质 Download PDF

Info

Publication number
CN111428041A
CN111428041A CN201910019738.5A CN201910019738A CN111428041A CN 111428041 A CN111428041 A CN 111428041A CN 201910019738 A CN201910019738 A CN 201910019738A CN 111428041 A CN111428041 A CN 111428041A
Authority
CN
China
Prior art keywords
case
entity
attribute information
abstract
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910019738.5A
Other languages
English (en)
Other versions
CN111428041B (zh
Inventor
谢朋峻
马春平
王潇斌
李林琳
司罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910019738.5A priority Critical patent/CN111428041B/zh
Publication of CN111428041A publication Critical patent/CN111428041A/zh
Application granted granted Critical
Publication of CN111428041B publication Critical patent/CN111428041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种案件摘要生成方法、装置、系统和存储介质。该方法包括:针对案件的审问记录,抽取实体和实体属性信息,确定实体属性信息和实体之间的关系;根据案件的案件类型对应的事件构成要素,对审问记录进行事件抽取,得到事件构成要素的内容;选择与案件类型对应的案件摘要模板,案件摘要模板包括与案件类型对应的案件要素;至少基于事件构成要素、实体、实体属性信息和该实体属性信息和实体之间关系,确定案件摘要模板中案件要素的内容,生成案件的案件摘要。根据本发明实施例提供的方法,可以对审问记录进行信息抽取,节省大量人工成本,提高案件简要案情获取的准确率。

Description

案件摘要生成方法、装置、系统和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种案件摘要生成方法、装置、系统和存储介质。
背景技术
公安民警处理日常案件的过程中,每接到一个新的案件,会首先对受害人和嫌疑人进行审问,并记录下审问的问答内容。由于审问记录繁琐冗长,被审问人表达不清,公安民警在审问后,需要基于完整的审问记录,人工整理出一个案情的简要描述,作为历史存档,以便后续的案件分析。
案件审问和案情总结过程,通常完全依赖基层民警。例如,需要民警参与审问、记录和案件摘要整个流程,案件摘要还需要民警综合分析和比对嫌疑人和受害者的描述,理解语义和推理,最后再总结成简要案情,整个过程耗时耗力,容易出错。
发明内容
本发明实施例提供一种案件摘要生成方法、装置、系统和存储介质,可以对审问记录进行信息抽取,节省大量人工成本,提高案件简要案情获取的准确率。
根据本发明实施例的一方面,提供一种案件摘要生成方法,包括:
针对案件的审问记录,抽取实体和实体属性信息,确定实体属性信息和实体之间的关系;
根据案件的案件类型对应的事件构成要素,对审问记录进行事件抽取,得到事件构成要素的内容;
选择与案件类型对应的案件摘要模板,案件摘要模板包括与案件类型对应的案件要素;
至少基于事件构成要素、实体、实体属性信息、以及实体属性信息和实体之间的关系,确定案件摘要模板中案件要素的内容,生成案件的案件摘要。
根据本发明实施例的另一方面,提供一种案件摘要生成装置,包括:
实体属性关系抽取模块,用于针对案件的审问记录,抽取实体和实体属性信息,确定实体属性信息和实体之间的关系;
事件构成要素抽取模块,用于根据案件的案件类型对应的事件构成要素,对审问记录进行事件抽取,得到事件构成要素的内容;
案件摘要模板选择模块,用于选择与案件类型对应的案件摘要模板,案件摘要模板包括与案件类型对应的案件要素;
案件摘要生成模块,用于至少基于事件构成要素、实体、实体属性信息、以及实体属性信息和实体之间的关系,确定案件摘要模板中案件要素的内容,生成案件的案件摘要。
根据本发明实施例的再一方面,提供一种案件摘要生成系统,包括:存储器和处理器;该存储器用于存储程序;该处理器用于读取存储器中存储的可执行程序代码以执行上述的案件摘要生成方法。
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述各方面所述的案件摘要生成方法。
根据本发明实施例中的案件摘要生成方法、装置、系统和存储介质,通过信息抽取的方法自动获取不同案件的重要要素,例如实体、实体属性、实体属性与实体之间的关系、以及事件构成要素等,并在信息抽取的要素库基础上,结合案件摘要生成模板的方式,自动生成案件简要案情,节省大量人工成本的同时,提高获取简要案情的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出根据本发明一个实施例的案件摘要生成系统框架示意图;
图2是示出根据本发明实施例的案件摘要生成方法的流程图;
图3是示出根据本发明一个实施例的案件摘要生成装置的结构示意图;
图4是示出可以实现根据本发明实施例的案件摘要生成方法和装置的计算设备的示例性硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例中,审问记录是案件发生后,公安民警对受害人、嫌疑人等进行审问并记录,形成的一问一答形式的记录信息。而案件摘要是对一个案件的简要整体描述。一般是民警根据对受害人、嫌疑人等审问后,生成的总结性的摘要性文本,案件摘要也可以称为是简要案情。
通常针对不同的案件类型,案件摘要都有相对固定的模板。公安民警对审问记录进行处理,并基于梳理后的审问记录完善案件摘要。
在本发明实施例中,可以通过多种获取形式获取案件的审问记录,因此审问记录可以具有多种实现形式。例如通过文字记录的形式获取的审问记录(例如审问笔录、问答笔录等)、通过音频记录的形式获取的审问记录(例如语音审问记录、语音问答记录等)等。本领域技术人员应理解,审问记录的多种获取形式和实现形式,并不能被解读为限制本方案的范围或实施可能性,本发明实施例的案件摘要生成方法,针对不同获取形式获取的审问记录,或者不同实现形式的审问记录的处理方法保持一致。
下表1示出了根据本发明示例性实施例的审问记录和案情摘要。
表1审问记录和案情摘要
Figure BDA0001940354210000041
通过表1可以看出,该审问记录可以是通过问答形式得到的问答记录。由于案件审问和案情总结过程,对基层民警依赖性大。需要民警参与审问、记录和案件摘要整个流程,案件摘要还需要民警综合分析和比对嫌疑人和受害者的描述,理解语义和推理,最后再总结成简要案情,整个过程耗时耗力。
本发明实施例提供一种案件摘要生成方法、装置、系统和存储介质,可以结合信息抽取的方法,对嫌疑人和/或受害人的问答信息进行信息抽取,再结合抽取的信息,基于模板的方法生成简要案情,以省去民警理解审问记录和人工总结的过程,在节省大量人工成本的同时,得到高准确率的简要案情。
为了更好的理解本发明,下面将结合附图,详细描述根据本发明实施例的案件摘要生成方法、装置、系统和存储介质,应注意,这些实施例并不是用来限制本发明公开的范围。
图1示出了根据本发明一个实施例的案件摘要生成系统框架示意图。下面结合图1描述本发明实施例的案件摘要生成方法,如图1所示,本发明实施例中的案件摘要生成系统100可以包括:实体属性关系抽取模块110、事件抽取模块120、案情摘要模板库130和案件摘要生成模块140。
在一个实施例中,实体属性关系抽取模块110可以用于识别审问记录中预设的实体类别、关系类别以及实体属性所属的实体。
其中,实体类别通常可以包括人名、地名、时间等信息;实体属性通常可以包含人的手机、身份证、车牌号、账号等信息;关系类别通常可以包含亲属关系例如父子关系、夫妻关系、父母关系、兄弟关系等以及社会关系例如同学关系、同事关系、朋友关系等。
在一个实施例中,可以基于神经网络模型的机器学习,进行实体识别和关系抽取。作为一个示例,可以使用实体识别模型例如LSTM-CRF模型或BiLSTM-CRF模型,识别审问记录中的实体;作为一个示例,可以使用特征提取模型例如CNN模型,提取审问记录中实体属性信息和实体之间的关系属性。
在一个实施例中,可以利用实体属性关系抽取模块110,针对案件的审问记录,抽取实体信息和实体属性信息,确定实体属性信息和实体信息之间的关系。
下表2示出了对上述表1所示审问记录中的实体信息和实体属性信息进行抽取,得到的实体属性关系库。
表2实体属性关系库
实体 实体类别和实体属性 对应的主体
2018年5月20日 时间
李兴 姓名
513213XXXXXX2432 身份证 李兴
134XXXX5916 支付宝账号 李兴
张三 姓名
6224XXXXXXXX4537 银行卡 张三
170XXXX6937 手机号 张三
通过表2可以看出,实体属性关系库中包括不同实体类别对应的实体信息和不同实体属性对应的属性信息,并且还包括实体属性信息的主体。
在一个实施例中,事件抽取模块120可以根据不同的案件类型,识别与案件类型对应的案件行为、案件时间、地点、人物、实施者、受害者等事件构成要素。在实际实现的时候,其他事件构成要素都是可以被构想的,本申请不做具体限定。
在一个实施例中,可以基于神经网络模型的机器学习进行事件抽取。作为一个示例,利用特征提取模型例如CNN模型,对不同案件类型案件中的事件进行事件构成要素信息的抽取。
表3示出了对上述表1中审问记录进行事件抽取得到的事件构成要素。
表3事件构成要素
时间 2018年5月20日
地点
受害人 李兴
实施者 张三
行为 被骗转账
转账金额 3000元
通过表3可以看出,事件抽取模块120可以根据案件类型的不同,提取审问记录中不同的事件构成要素。如果无法提取到某个事件构成要素的内容,该事件构成要素的内容即为空值即可。
在一个实施例中,案件摘要模板库130,可以根据不同案件类型需要的案件要素,提供与案件类型对应的案件摘要模板。
作为一个示例,案件类型为诈骗案时,案件摘要模板例如可以包括如下信息项:
<受害人名><受害人身份证><受害人年龄>,<诈骗时间><诈骗地点><诈骗受害者信息><诈骗行为><诈骗实施者信息><诈骗金额>,总共被骗<诈骗金额>。
在一个实施例中,案件摘要生成模块140根据不同的案件类型,自动选择案件摘要模板库130提供的与案件类型对应的案件摘要模板,并至少基于上述的实体属性关系抽取模块110抽取的实体、实体属性信息、实体属性信息和实体时间的关系,以及事件抽取模块120从审问记录中抽取的事件构成要素的内容,对案件摘要模板库130提供的与案件类型对应的案件摘要模板进行自适应填空,得到该审问记录的案件摘要。
作为一个示例,针对表1所示的审问记录,选择案件类型为诈骗案对应的案件摘要模板,对于案件摘要模板中的信息项:
首先,利用事件抽取模块120从审问记录中识别的事件构成要素如表3所示,可以确定<受害人名>的内容例如受害人李兴;
其次,根据实体属性关系抽取模块110抽取的实体、实体属性信息、实体属性信息和实体时间的关系可以确定,与<受害人名>具有关联关系的<受害人身份证>信息和<受害人年龄>信息,例如通过上述表2示出的实体属性关系库可以确定对应于李兴的<受害人身份证>信息为513213XXXXXX2432,<受害人年龄>信息为空值。
接着,根据事件抽取模块120从审问记录中提取的事件构成要素,可以确定案件摘要模板中的如下信息项:<诈骗时间><诈骗地点><诈骗受害者信息><诈骗行为><诈骗实施者信息>和<诈骗金额>。如上述表3所示,
<诈骗时间>的内容为2018年5月20日,
<诈骗地点>的内容为空值,
<诈骗受害者信息>的内容为李兴,
<诈骗行为>的内容为被骗转账,
<诈骗实施者信息>的内容为张三,以及
<诈骗金额>的内容为3000元。
最后,对上述案件摘要模板中的信息项进行整理,得到案件审问记录的案件摘要信息如下表4所示:
表4案件摘要信息
<受害人名> 李兴
<受害人身份证> 513213XXXXXX2432
<受害人年龄>
<诈骗时间> 2018年5月20日
<诈骗地点>
<诈骗受害者信息> 李兴
<诈骗行为> 被骗转账
<诈骗实施者信息> 张三
<诈骗金额> 3000元
总共被骗<诈骗金额> 总共被骗3000元
上述表4示出了利用从审问记录中抽取的实体和实体属性信息,利用实体属性信息和实体之间的关系,以及从审问记录中抽取的时间构成要素,确定与案件类型对应的案件摘要模板中案件要素的内容,从而根据与案件类型对应的案件摘要模板中案件要素的内容,生成该案件的案件摘要。
根据本发明实施例的案件摘要生成方法,通过信息抽取的方法自动获取不同案件的重要要素,例如实体、实体属性、实体属性与实体之间的关联关系、以及事件构成要素等,在信息抽取的要素库基础上,结合摘要生成模板的方式,自动生成案件简要案情,节省大量人工成本的同时,提高获取简要案情的准确率。
图2是示出根据本发明实施例的案件摘要生成方法的流程图。如图2所示,本发明实施例中的案件摘要生成方法200包括以下步骤:
步骤S210,针对案件的审问记录,抽取实体和实体属性信息,确定实体属性信息和实体之间的关系。
在一个实施例中,步骤S210具体可以包括:
步骤S211,从案件的审问记录中提取不同实体类别的实体;
步骤S212,提取审问记录中的实体属性信息;
步骤S213,根据实体属性信息所属的实体,确定实体属性信息和实体之间的关系。
在该实施例中,提取案件的审问记录中的实体和实体属性,并确定实体属性与实体之间的关联关系,以便后续确定案件摘要中的案件信息时,对实体信息及实体属性信息的提取,提高自动提取的案件信息的准确性。
在一个实施例中,步骤S210还可以包括:
步骤S214,将提取的实体中实体类别为姓名的实体,作为姓名类实体。
步骤S215,如果姓名类实体的数量大于等于两个,确定姓名类实体所属主体之间的主体关系。
在该实施例中,如果姓名类实体的数量大于等于两个,确定该两个实体之间的主体关系,例如上述实施例中描述的亲属关系或社会关系。
步骤S220,根据案件的案件类型对应的事件构成要素,对审问记录进行事件抽取,得到事件构成要素的内容。
在一个实施例中,事件构成要素包括如下项中的至少一项:案件行为、案件时间、案件地点、案件人物、以及与案件类型对应的其他构成要素。
在一个实施例中,案件人物包括如下项中的至少一项:受害者、实施者和其他涉案者。
步骤S230,选择与案件类型对应的案件摘要模板,案件摘要模板包括与案件类型对应的案件要素。
步骤S240,至少基于事件构成要素、实体、实体属性信息、以及实体属性信息和实体之间的关系,确定案件摘要模板中案件要素的内容,生成案件的案件摘要。
在一个实施例中,步骤S240具体可以包括:
步骤S241,确定与案件要素匹配的事件构成要素,获取案件要素中匹配的事件构成要素的内容;
步骤S242,如果案件要素中包括匹配的事件构成要素的属性信息,将匹配的事件构成要素的内容与抽取的实体进行匹配,确定匹配的实体,以及与匹配的实体具有关联关系的实体属性信息;
步骤S243,利用匹配的实体、以及与匹配的实体具有关联关系的实体属性信息,确定案件要素中匹配的事件构成要素的属性信息;
步骤S244,根据案件要素中匹配的事件构成要素的内容、以及案件要素中匹配的事件构成要素的属性信息,生成案件的案件摘要。
在一个实施例中,案件摘要生成方法200,还可以包括:
步骤S245,针对案件摘要模板中的第一案件要素,如果不存在与第一案件要素匹配的事件构成要素,或者不存在与第一案件要素匹配的事件构成要素的内容相匹配的实体,将第一案件要素的内容设置为空值。
根据本发明实施例的案件摘要生成方法,对嫌疑人和受害人的问答信息进行信息抽取,再结合抽取的知识,基于案件模板库自动生成简要案情,省去了民警理解审问记录和人工总结的流程,节省大量人工成本的同时,得到的简要案情准确率也高。
图3示出了根据本发明一个实施例的案件摘要生成装置的结构示意图。如图3所示,在一个实施例中,案件摘要生成装置300可以包括:
实体属性关系抽取模块310,用于针对案件的审问记录,抽取实体和实体属性信息,确定实体属性信息和实体之间的关系;
事件构成要素抽取模块320,用于根据案件的案件类型对应的事件构成要素,对审问记录进行事件抽取,得到事件构成要素的内容;
案件摘要模板选择模块330,用于选择与案件类型对应的案件摘要模板,案件摘要模板包括与案件类型对应的案件要素;
案件摘要生成模块340,用于至少基于事件构成要素、实体、实体属性信息、以及实体属性信息和实体之间的关系,确定案件摘要模板中案件要素的内容,生成案件的案件摘要。
在一个实施例中,实体属性关系抽取模块310具体可以包括:
实体提取单元,用于从案件的审问记录中提取不同实体类别的实体;
实体属性提取单元,用于提取审问记录中的实体属性信息;
关系确定单元,用于根据实体属性信息所属的实体,确定实体属性信息和实体之间的关系。
在一个实施例中,实体属性关系抽取模块310,还可以包括:
姓名类实体确定单元,用于将提取的实体中实体类别为姓名的实体,作为姓名类实体;
主体关系确定单元,用于如果姓名类实体的数量大于等于两个,确定姓名类实体所属主体之间的主体关系。
在一个实施例中,事件构成要素包括如下项中的至少一项:案件行为、案件时间、案件地点、案件人物、以及与案件类型对应的其他构成要素。
在一个实施例中,案件人物包括如下项中的至少一项:受害者、实施者和其他涉案者。
在一个实施例中案件摘要生成模块340具体可以包括:
事件构成要素获取单元,用于确定与案件要素匹配的事件构成要素,获取案件要素中匹配的事件构成要素的内容;
实体属性信息确定单元,用于如果案件要素中包括匹配的事件构成要素的属性信息,将匹配的事件构成要素的内容与抽取的实体进行匹配,确定匹配的实体,以及与匹配的实体具有关联关系的实体属性信息;
案件要素确定单元,用于利用匹配的实体、以及与匹配的实体具有关联关系的实体属性信息,确定案件要素中匹配的事件构成要素的属性信息;
案件摘要生成模块340,具体还用于根据案件要素中匹配的事件构成要素的内容、以及案件要素中匹配的事件构成要素的属性信息,生成案件的案件摘要。
在一个实施例中,案件摘要生成模块340,还可以包括:
案件要素空值设置单元,用于针对案件摘要模板中的第一案件要素,如果不存在与第一案件要素匹配的事件构成要素,或者不存在与第一案件要素匹配的事件构成要素的内容相匹配的实体,将第一案件要素的内容设置为空值。
根据本发明实施例的案件摘要生成装置,解决了传统的案件摘要生成过程中,完全依赖基层民警理解审问笔录,手动梳理案件要素,带来的过程繁琐、人力成本高等缺点,在信息抽取的要素库基础上,结合摘要生成模板的方式,自动生成案件简要案情,节省大量人工成本,并提高案件简要案情获取的准确率。
需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图4是示出能够实现根据本发明实施例的案件摘要生成方法和装置的计算设备的示例性硬件架构的结构图。
如图4所示,计算设备400包括输入设备401、输入接口402、中央处理器403、存储器404、输出接口405、以及输出设备406。其中,输入接口402、中央处理器403、存储器404、以及输出接口405通过总线410相互连接,输入设备401和输出设备406分别通过输入接口402和输出接口405与总线410连接,进而与计算设备400的其他组件连接。
具体地,输入设备401接收来自外部(例如,审问记录录入设备)的输入信息,并通过输入接口402将输入信息传送到中央处理器403;中央处理器403基于存储器404中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器404中,然后通过输出接口405将输出信息传送到输出设备406;输出设备406将输出信息输出到计算设备400的外部供用户使用。
在一个实施例中,图4所示的计算设备400可以被实现为一种案件摘要生成系统,该案件摘要生成系统可以包括:存储器,被配置为存储程序;处理器,被配置为运行存储器中存储的程序,以执行上述实施例描述的案件摘要生成方法。
根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以从网络上被下载和安装,和/或从可拆卸存储介质被安装。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令,当其在计算机上运行时,使得计算机执行上述各个实施例中描述的方法。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘)等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使对应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种案件摘要生成方法,包括:
针对案件的审问记录,抽取实体和实体属性信息,确定所述实体属性信息和所述实体之间的关系;
根据所述案件的案件类型对应的事件构成要素,对所述审问记录进行事件抽取,得到所述事件构成要素的内容;
选择与所述案件类型对应的案件摘要模板,所述案件摘要模板包括与所述案件类型对应的案件要素;
至少基于所述事件构成要素、所述实体、所述实体属性信息、以及所述实体属性信息和所述实体之间的关系,确定所述案件摘要模板中所述案件要素的内容,生成所述案件的案件摘要。
2.根据权利要求1所述的案件摘要生成方法,其中,所述针对案件的审问记录,抽取实体和实体属性信息,确定所述实体属性信息和所述实体之间的关系,包括:
从所述案件的审问记录中提取不同实体类别的实体;
提取所述审问记录中的实体属性信息;
根据所述实体属性信息所属的实体,确定所述实体属性信息和所述实体之间的关系。
3.根据权利要求2所述的案件摘要生成方法,还包括:
将提取的所述实体中实体类别为姓名的实体,作为姓名类实体;
如果所述姓名类实体的数量大于等于两个,确定所述姓名类实体所属主体之间的主体关系。
4.根据权利要求1所述的案件摘要生成方法,其中,
所述事件构成要素包括如下项中的至少一项:案件行为、案件时间、案件地点、案件人物、以及与所述案件类型对应的其他构成要素;
所述案件人物包括如下项中的至少一项:受害者、实施者和其他涉案者。
5.根据权利要求1所述的案件摘要生成方法,其中,所述至少基于所述事件构成要素、所述实体、所述实体属性信息、以及所述实体属性信息和所述实体之间的关系,确定所述案件摘要模板中所述案件要素的内容,生成所述案件的案件摘要,包括:
确定与所述案件要素匹配的事件构成要素,获取所述案件要素中匹配的事件构成要素的内容;
如果所述案件要素中包括所述匹配的事件构成要素的属性信息,将所述匹配的事件构成要素的内容与抽取的所述实体进行匹配,确定匹配的实体,以及与所述匹配的实体具有关联关系的实体属性信息;
利用所述匹配的实体、以及所述与所述匹配的实体具有关联关系的实体属性信息,确定所述案件要素中所述匹配的事件构成要素的属性信息;
根据所述案件要素中匹配的事件构成要素的内容、以及所述案件要素中所述匹配的事件构成要素的属性信息,生成所述案件的案件摘要。
6.根据权利要求5所述的案件摘要生成方法,还包括:
针对所述案件摘要模板中的第一案件要素,如果不存在与所述第一案件要素匹配的事件构成要素,或者不存在与所述第一案件要素匹配的事件构成要素的内容相匹配的实体,将所述第一案件要素的内容设置为空值。
7.一种案件摘要生成装置,包括:
实体属性关系抽取模块,用于针对案件的审问记录,抽取实体和实体属性信息,确定所述实体属性信息和所述实体之间的关系;
事件构成要素抽取模块,用于根据所述案件的案件类型对应的事件构成要素,对所述审问记录进行事件抽取,得到所述事件构成要素的内容;
案件摘要模板选择模块,用于选择与所述案件类型对应的案件摘要模板,所述案件摘要模板包括与所述案件类型对应的案件要素;
案件摘要生成模块,用于至少基于所述事件构成要素、所述实体、所述实体属性信息、以及所述实体属性信息和所述实体之间的关系,确定所述案件摘要模板中所述案件要素的内容,生成所述案件的案件摘要。
8.根据权利要求7所述的案件摘要生成装置,其中,所述案件摘要生成模块包括:
事件构成要素获取单元,用于确定与所述案件要素匹配的事件构成要素,获取所述案件要素中匹配的事件构成要素的内容;
实体属性信息确定单元,用于如果所述案件要素中包括所述匹配的事件构成要素的属性信息,将所述匹配的事件构成要素的内容与抽取的所述实体进行匹配,确定匹配的实体,以及与所述匹配的实体具有关联关系的实体属性信息;
案件要素确定单元,用于利用所述匹配的实体、以及所述与所述匹配的实体具有关联关系的实体属性信息,确定所述案件要素中所述匹配的事件构成要素的属性信息;
案件摘要生成模块,具体用于根据所述案件要素中匹配的事件构成要素的内容、以及所述案件要素中所述匹配的事件构成要素的属性信息,生成所述案件的案件摘要。
9.一种案件摘要生成系统,其特征在于,包括存储器和处理器;
所述存储器用于储存有可执行程序代码;
所述处理器用于读取所述存储器中存储的可执行程序代码以执行权利要求1至6中任一项所述的案件摘要生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至6中任一项所述的案件摘要生成方法。
CN201910019738.5A 2019-01-09 2019-01-09 案件摘要生成方法、装置、系统和存储介质 Active CN111428041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910019738.5A CN111428041B (zh) 2019-01-09 2019-01-09 案件摘要生成方法、装置、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910019738.5A CN111428041B (zh) 2019-01-09 2019-01-09 案件摘要生成方法、装置、系统和存储介质

Publications (2)

Publication Number Publication Date
CN111428041A true CN111428041A (zh) 2020-07-17
CN111428041B CN111428041B (zh) 2023-06-16

Family

ID=71545919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910019738.5A Active CN111428041B (zh) 2019-01-09 2019-01-09 案件摘要生成方法、装置、系统和存储介质

Country Status (1)

Country Link
CN (1) CN111428041B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541346A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 摘要生成方法、装置、电子设备及可读存储介质
CN113806522A (zh) * 2021-09-18 2021-12-17 北京百度网讯科技有限公司 摘要生成方法、装置、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112713A1 (en) * 2005-11-10 2007-05-17 Motorola, Inc. Method and apparatus for profiling a potential offender of a criminal incident
US20160188819A1 (en) * 2014-12-31 2016-06-30 Palantir Technologies, Inc. Medical claims lead summary report generation
CN106484767A (zh) * 2016-09-08 2017-03-08 中国科学院信息工程研究所 一种跨媒体的事件抽取方法
CN107894981A (zh) * 2017-12-13 2018-04-10 武汉烽火普天信息技术有限公司 一种案件语义要素的自动抽取方法
CN108595525A (zh) * 2018-03-27 2018-09-28 成都律云科技有限公司 一种律师信息处理方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112713A1 (en) * 2005-11-10 2007-05-17 Motorola, Inc. Method and apparatus for profiling a potential offender of a criminal incident
US20160188819A1 (en) * 2014-12-31 2016-06-30 Palantir Technologies, Inc. Medical claims lead summary report generation
CN106484767A (zh) * 2016-09-08 2017-03-08 中国科学院信息工程研究所 一种跨媒体的事件抽取方法
CN107894981A (zh) * 2017-12-13 2018-04-10 武汉烽火普天信息技术有限公司 一种案件语义要素的自动抽取方法
CN108595525A (zh) * 2018-03-27 2018-09-28 成都律云科技有限公司 一种律师信息处理方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘稳;王锦;李锐;游景扬;陈建峡;: "法院判决书关键信息抽取系统设计与实现" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541346A (zh) * 2020-12-24 2021-03-23 北京百度网讯科技有限公司 摘要生成方法、装置、电子设备及可读存储介质
CN113806522A (zh) * 2021-09-18 2021-12-17 北京百度网讯科技有限公司 摘要生成方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN111428041B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN109885597B (zh) 基于机器学习的用户分群处理方法、装置及电子终端
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
WO2022127339A1 (zh) 基于网站注册的用户画像生成方法、装置、设备和介质
CN111553318A (zh) 敏感信息提取方法、裁判文书处理方法、装置和电子设备
CN112052396A (zh) 课程匹配方法、系统、计算机设备和存储介质
CN110765760A (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN110389941A (zh) 数据库校验方法、装置、设备及存储介质
CN111428041A (zh) 案件摘要生成方法、装置、系统和存储介质
CN110490750B (zh) 数据识别的方法、系统、电子设备及计算机存储介质
CN115292317A (zh) 表单生成方法、装置、设备及存储介质
CN115098440A (zh) 电子档案查询方法、装置、存储介质和设备
Owda et al. Financial discussion boards irregularities detection system (fdbs-ids) using information extraction
CN109144999B (zh) 一种数据定位方法、装置及存储介质、程序产品
CN116502261A (zh) 保留数据特性的数据脱敏方法及装置
CN113486247B (zh) 一种互联网在线鉴阅文档阅读分级管理系统
CN107315807B (zh) 人才推荐方法和装置
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
CN113204644B (zh) 一种基于知识图谱的政务百科构建方法
CN114550157A (zh) 弹幕聚集识别方法以及装置
CN114756685A (zh) 一种投诉单的投诉风险识别方法及装置
CN114090076A (zh) 应用程序的合规性判别方法和装置
CN108711073B (zh) 用户分析方法、装置及终端
CN112115237A (zh) 烟草科技文献数据推荐模型的构建方法及装置
CN110766091A (zh) 一种套路贷团伙的识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant