CN110457443A - 一种基于刑事案件的犯罪行为链构建方法 - Google Patents

一种基于刑事案件的犯罪行为链构建方法 Download PDF

Info

Publication number
CN110457443A
CN110457443A CN201910737523.7A CN201910737523A CN110457443A CN 110457443 A CN110457443 A CN 110457443A CN 201910737523 A CN201910737523 A CN 201910737523A CN 110457443 A CN110457443 A CN 110457443A
Authority
CN
China
Prior art keywords
crime
criminal
criminal offence
offence
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910737523.7A
Other languages
English (en)
Inventor
冯丽
靳文繁
扈应
秦永彬
陈艳平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUIZHOU CLOUD PIONEER TECH Co.,Ltd.
Guizhou University
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN201910737523.7A priority Critical patent/CN110457443A/zh
Publication of CN110457443A publication Critical patent/CN110457443A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于刑事案件的犯罪行为链构建方法,它包括如下步骤:一、犯罪行为识别:从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别:犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点等;三、犯罪关系识别:犯罪关系包含:犯罪行为之间的时序关系和者犯罪行为与犯罪要素之间的关系;四、犯罪行为链的构建:将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起,形成一条完整的犯罪行为链。通过构建犯罪“行为链”,建立以“犯罪行为”为中心的案情要素间的内在关联和知识体系。本发明的实施,可为“同案同判”、“量刑一致性”等问题提供技术支撑。

Description

一种基于刑事案件的犯罪行为链构建方法
技术领域
本发明涉及一种刑事案件,尤其涉及一种基于刑事案件的犯罪行为链构建方法,属于自然语言处理技术领域。
背景技术
在司法信息化建设过程中的研究发现,裁判文书中的案情描述对法条推荐结果、案件审判结果有着显著影响,关系到审判工作的严谨性和合理性,如何利用裁判文书中的案情描述和事实部分,分析推荐案件涉及的相关法条、罪名、类案等信息,有效服务于司法辅助审判工作,是当前司法实践中需要解决的关键技术问题,有着重要的研究与应用价值。传统的审判辅助工作主要依托独立的案情特征进行法条、量刑、案由的确立,进而辅助法官判案。然而,在这种情况下,案情特征的顺序容易被忽略,尤其是涉及到具体的案件审判时,“顺序问题”可能直接影响最终的审判结果,如相同特征的案件,因为案情要素序列的不同也可能导致审判结果的不同。例如,在“强奸杀人”、“杀人辱尸”以及“强奸致死”的案件中,对罪犯的量刑和引用条例是不同的,因此,案情特征描述的先后顺序对量刑和适用法条的选择有着重要的影响。
发明内容
本发明要解决的技术问题是:提供一种基于刑事案件的犯罪行为链构建方法。通过抽取刑事案件中具有时序关系的各种案件关键特征要素(如犯罪行为、犯罪主体、犯罪客体和犯罪工具等)来构建犯罪“行为链”,进而基于犯罪“行为链”实现对裁判文书中案情语义的深层分析,可以为案件的相似性检测、法条推荐、类案判别等提供理论和技术支撑,为法官判案、案件量刑提供辅助,提升司法辅助工作的智能化水平,继而推进案件审判工作的公平性和严谨性。
在该发明中涉及到犯罪行为识别、犯罪要素识别、关系识别、犯罪行为链的构建。在本发明中,犯罪行为是指犯罪主体在实施犯罪的过程中所关联的行为,用集合M={m1,m2,...,mn}表示一个具体案件中的所有的犯罪行为。与犯罪行为相关的其它犯罪要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点等,用集合C={c1,c2,...,cn}表示。案件中所涉及到的犯罪行为具有时序关系和因果关系,犯罪行为与犯罪主体之间也可以定义多种关系,如主动关系、被动关系等。把按犯罪行为按时序特征或因果特征串联起来的犯罪行为过程称为犯罪行为链。犯罪行为链用集合L={(mi,mj)|mi∈M,mj∈M}表示,犯罪行为链L可以表示为犯罪行为M上的一个偏序关系,而偏序关系可以用来分析犯罪行为之间的因果关系,如:(砍杀,逃跑)∈L,(逃跑,拘捕)∈L,则有(砍杀,拘捕)∈L。为了进一步融合犯罪案件中的信息,提升犯罪行为链的表达能力,把与犯罪行为相关的犯罪要素C也融合进犯罪行为链L中,这样的话,我们最终可以将犯罪行为链看作一个图(用G={V,R|V=C∪M,vi∈V,vj∈V,R=(vi,vj)}表示,其中,V表示图G的顶点集合,R表示顶点之间边的集合)。V有两类节点:犯罪行为节点和犯罪要素节点,R表示犯罪行为之间的时序(因果)关系,或者犯罪行为和犯罪要素之间的关系(如:主动关系、被动关系等)。
本发明的技术方案为:一种基于刑事案件的犯罪行为链构建方法,所述方法包括如下步骤:一、犯罪行为识别:从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别:犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间和犯罪地点等;三、犯罪关系识别:犯罪关系包含:犯罪行为之间的时序(因果)关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等);四、犯罪行为链的构建:将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起,形成一条完整的犯罪行为链。
所述步骤一中,犯罪行为识别首先是识别出整个刑事案件中的所有行为,然后利用其是否与犯罪主体关联,判断某一行为是否属于犯罪行为,再用集合 M={m1,m2,...,mn}表示一个具体案件中的所有犯罪行为。
所述步骤二中,把与犯罪行为相关的要素称为犯罪要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间、犯罪地点等,用集合C={c1,c2,...,cn}表示一个具体案件中的所有犯罪要素。
所述步骤三中,关系识别分为两种:犯罪行为之间的时序(因果)关系,犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等),用集合R表示。
所述步骤四中,犯罪行为链的构建,以犯罪行为词为中心,将其他要素融入一个犯罪行为链中,将所有信息整合后的犯罪行为链看作一个图,用G={V,R|V=C∪M,vi∈V,vj∈V,R=(vi,vj)}表示,其中,V表示图G的顶点集合,R表示顶点之间边的集合。
本发明的有益效果是:传统针对裁判文书的分析主要基于文档进行分析,没有考虑裁判文书中的案件特征要素信息,而裁判文书中犯罪行为的时序和和因果关系会影响法官的审判。针对裁判文书时序性和逻辑性强等特点,本项目通过提出犯罪“行为链”的概念,研究以“行为”为核心的案情要素序列抽取以及语义分析方法。通过构建犯罪“行为链”,建立以“犯罪行为”为中心的案情要素间的内在关联和知识体系。在此基础上,利用犯罪“行为链”探索案件相似性的计算方法,重点研究法条推荐、类案推送等辅助审判的模型和方法,为解决“同案同判”、“量刑一致性”等问题提供技术支撑。通过本发明的实施与应用,可以实现对裁判文书中的案情语义的深层分析,有效提高审判工作的效率、公正性和严谨性。
附图说明
图1为本发明的犯罪行为链构建的模型。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将参照本说明书附图对本发明作进一步的详细描述。
实施例1:如附图1所示,一种基于刑事案件的犯罪行为链构建方法,所述方法包括如下步骤:一、犯罪行为识别,主要目的是从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别,犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点、犯罪时间、犯罪地点等;三、犯罪关系识别,犯罪关系包含:犯罪行为之间的时序(因果) 关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等);四、犯罪行为链的构建,将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起。
下面将结合附图和实施例对本发明做进一步描述。
第一步,犯罪行为识别的主要目的是从案件文档的句子中判断某个犯罪行为是否出现,犯罪行为和一般行为的区别在于其关联到具体的犯罪主体或犯罪案件。在本发明中,利用哈工大的NLP系统识别出案件文档中识别出所有的行为词,用集合M={m1,m2,...,mn}表示,作为犯罪行为词的候选集,行为词与犯罪行为词之间存在区别,在后续步骤中,根据行为词与犯罪主体之间的关系,判断该行为词是否属于犯罪行为词。
第二步,犯罪要素识别,犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体,犯罪客体、犯罪工具、犯罪时间、犯罪地点等。在本发明中,利用哈工大的NLP系统识别出案件文档中的所有犯罪要素,C={c1,c2,...,cn}表示。系统识别的结果还需要经过筛选,删除一些冗余数据。在本发明中,采用TextRNN深度神经网络对哈工大NLP的识别结果进行数据后处理。
第三步,犯罪关系识别,犯罪关系包含:犯罪行为之间的时序(因果)关系或者犯罪行为与犯罪要素之间的关系(如:主动关系、被动关系等)。本发明中,将案件文档的数据以句子为单位输入深度神经网络模型中,原始句子经过 embedding层向量化表示后,进入TextCNN-BiLSTM-CRF模型中,从文本中识别出犯罪行为与犯罪主体之间的关系。
第四步,犯罪行为链的构建,以犯罪行为词为中心,将其他要素融入一个犯罪行为链中,将所有信息整合后的犯罪行为链看作一个图,我们用 G={V,R|V=C∪M,vi∈V,vj∈V,R=(vi,vj)}表示,其中,V表示图G的顶点集合,R表示顶点之间边的集合)。在模型中,将前三步的输入作一个拼接,然后再经过一个softmax函数将信息整合,形成一条完整的犯罪行为链。
本发明未详述之处,均为本技术领域技术人员的公知技术。最后说明的是,以上实施例所采用的哈工大NLP系统、TextRNN和Text-BiLSTM-CRF模型仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于刑事案件的犯罪行为链构建方法,其特征在于:所述方法包括如下步骤:一、犯罪行为识别:从案件文档的句子中判断某个犯罪行为是否出现;二、犯罪要素识别:犯罪要素是指与犯罪行为相关的其它要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间和犯罪地点;三、犯罪关系识别:犯罪关系包含:犯罪行为之间的时序关系或者犯罪行为与犯罪要素之间的主动关系或被动关系;四、犯罪行为链的构建:将犯罪行为链看作一个图,把上述三步中的识别结果整合在一起,形成一条完整的犯罪行为链。
2.根据权利要求1所述的基于刑事案件的犯罪行为链构建方法,其特征在于:所述步骤一中,犯罪行为识别首先是识别出整个刑事案件中的所有行为,然后利用其是否与犯罪主体关联,判断某一行为是否属于犯罪行为,再用集合M={m1,m2,...,mn}表示一个具体案件中的所有犯罪行为。
3.根据权利要求1所述的基于刑事案件的犯罪行为链构建方法,其特征在于:所述步骤二中,把与犯罪行为相关的要素称为犯罪要素,如犯罪主体、犯罪客体、犯罪工具、犯罪时间和犯罪地点,用集合C={c1,c2,...,cn}表示一个具体案件中的所有犯罪要素。
4.根据权利要求1所述的基于刑事案件的犯罪行为链构建方法,其特征在于:所述步骤三中,关系识别分为两种:犯罪行为之间的时序关系,犯罪行为与犯罪要素之间的关系,用集合R表示。
5.根据权利要求1所述的基于刑事案件的犯罪行为链构建方法,其特征在于:所述步骤四中,犯罪行为链的构建,以犯罪行为词为中心,将其他要素融入一个犯罪行为链中,将所有信息整合后的犯罪行为链看作一个图,用G={V,R|V=C∪M,vi∈V,vj∈V,R=(vi,vj)}表示,其中,V表示图G的顶点集合,R表示顶点之间边的集合。
CN201910737523.7A 2019-08-12 2019-08-12 一种基于刑事案件的犯罪行为链构建方法 Pending CN110457443A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910737523.7A CN110457443A (zh) 2019-08-12 2019-08-12 一种基于刑事案件的犯罪行为链构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910737523.7A CN110457443A (zh) 2019-08-12 2019-08-12 一种基于刑事案件的犯罪行为链构建方法

Publications (1)

Publication Number Publication Date
CN110457443A true CN110457443A (zh) 2019-11-15

Family

ID=68485871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910737523.7A Pending CN110457443A (zh) 2019-08-12 2019-08-12 一种基于刑事案件的犯罪行为链构建方法

Country Status (1)

Country Link
CN (1) CN110457443A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047041A (zh) * 2019-11-25 2020-04-21 清华大学 基于贝叶斯网络推理模型的犯罪重建方法及装置
CN111639494A (zh) * 2020-04-20 2020-09-08 北京大学 案件事理关系确定方法及系统
CN111783295A (zh) * 2020-06-28 2020-10-16 中国人民公安大学 城市社区特定人行为链动态识别与预测评估方法及系统
CN113688635A (zh) * 2021-09-01 2021-11-23 中国矿业大学(北京) 一种基于语义相似度的类案推荐方法
CN117830060A (zh) * 2024-03-04 2024-04-05 天津财经大学 一种基于知识图谱的伤害类犯罪执法监督与辅助决策系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112713A1 (en) * 2005-11-10 2007-05-17 Motorola, Inc. Method and apparatus for profiling a potential offender of a criminal incident
KR101442669B1 (ko) * 2013-03-22 2014-09-24 에프엔엔(주) 지능형 객체감지를 통한 범죄행위 판별방법 및 그 장치
CN106096623A (zh) * 2016-05-25 2016-11-09 中山大学 一种犯罪识别与预测方法
CN109949185A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于事件树分析的司法案件判别系统和方法
CN110046259A (zh) * 2019-03-15 2019-07-23 浙江大学城市学院 一种基于判决书文本的涉毒案件深度分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112713A1 (en) * 2005-11-10 2007-05-17 Motorola, Inc. Method and apparatus for profiling a potential offender of a criminal incident
KR101442669B1 (ko) * 2013-03-22 2014-09-24 에프엔엔(주) 지능형 객체감지를 통한 범죄행위 판별방법 및 그 장치
CN106096623A (zh) * 2016-05-25 2016-11-09 中山大学 一种犯罪识别与预测方法
CN109949185A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于事件树分析的司法案件判别系统和方法
CN110046259A (zh) * 2019-03-15 2019-07-23 浙江大学城市学院 一种基于判决书文本的涉毒案件深度分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
秦永彬等: ""智慧法院"数据融合分析与集成应用", 《大数据》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047041A (zh) * 2019-11-25 2020-04-21 清华大学 基于贝叶斯网络推理模型的犯罪重建方法及装置
CN111047041B (zh) * 2019-11-25 2022-05-24 清华大学 基于贝叶斯网络推理模型的犯罪重建方法及装置
CN111639494A (zh) * 2020-04-20 2020-09-08 北京大学 案件事理关系确定方法及系统
CN111783295A (zh) * 2020-06-28 2020-10-16 中国人民公安大学 城市社区特定人行为链动态识别与预测评估方法及系统
CN111783295B (zh) * 2020-06-28 2020-12-22 中国人民公安大学 城市社区特定人行为链动态识别与预测评估方法及系统
CN113688635A (zh) * 2021-09-01 2021-11-23 中国矿业大学(北京) 一种基于语义相似度的类案推荐方法
CN113688635B (zh) * 2021-09-01 2023-05-30 中国矿业大学(北京) 一种基于语义相似度的类案推荐方法
CN117830060A (zh) * 2024-03-04 2024-04-05 天津财经大学 一种基于知识图谱的伤害类犯罪执法监督与辅助决策系统
CN117830060B (zh) * 2024-03-04 2024-05-28 天津财经大学 一种基于知识图谱的伤害类犯罪执法监督与辅助决策系统

Similar Documents

Publication Publication Date Title
CN110457443A (zh) 一种基于刑事案件的犯罪行为链构建方法
CN110457479A (zh) 一种基于犯罪行为链的裁判文书分析方法
CN105138570B (zh) 网络言论数据疑似犯罪度计算方法
CN104657463B (zh) 应用于自动问答系统的问句分类方法及装置
CN106055536A (zh) 一种中文事件联合推理方法和系统
CN110334214B (zh) 一种自动识别案件中虚假诉讼的方法
KR20140129053A (ko) 술어 템플릿 수집 장치, 특정 프레이즈 페어 수집 장치, 및 이들을 위한 컴퓨터 프로그램
CN110287180A (zh) 一种基于深度学习的风控建模方法
CN113239130A (zh) 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
Figueiredo et al. Breaking into pieces: An ontological approach to conceptual model complexity management
CN104462053A (zh) 一种文本内的基于语义特征的人称代词指代消解方法
Hage Comparative law as method and the method of comparative law
CN109101551A (zh) 一种问答知识库的构建方法及装置
CN106599824B (zh) 一种基于情感对的gif动画情感识别方法
CN106384245A (zh) 产品特征分析方法和系统
CN115081918A (zh) 基于数据驱动的轨道交通风险点预测方法及系统
CN113239208A (zh) 一种基于知识图谱的标注训练模型
CN109166605A (zh) 基于ai的老人分诊系统及方法
JP2004334841A (ja) 経験知識情報処理装置
US8337208B1 (en) Content analysis to detect high stress in oral interviews and text documents
CN107862037A (zh) 一种基于实体连通图的事件模版构造方法
Tianxiong et al. Identifying chinese event factuality with convolutional neural networks
Falomir et al. On the rationality of explanations in classification algorithms
CN106528764A (zh) 基于人工智能的提问型检索词的检索方法及装置
KR102470959B1 (ko) 건설현장사진 촬영의도 자동인식 및 포토메시징 기술기반의 건설현장 관리시스템 및 관리방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant after: Guizhou University

Applicant after: Higher people's Court of Guizhou Province

Applicant after: GUIZHOU CLOUD PIONEER TECH Co.,Ltd.

Address before: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant before: Guizhou University

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20191115

RJ01 Rejection of invention patent application after publication