CN110889502A - 一种基于深度学习的争议焦点生成方法 - Google Patents
一种基于深度学习的争议焦点生成方法 Download PDFInfo
- Publication number
- CN110889502A CN110889502A CN201910980161.4A CN201910980161A CN110889502A CN 110889502 A CN110889502 A CN 110889502A CN 201910980161 A CN201910980161 A CN 201910980161A CN 110889502 A CN110889502 A CN 110889502A
- Authority
- CN
- China
- Prior art keywords
- original
- sentence
- defended
- vector
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000014509 gene expression Effects 0.000 claims abstract description 15
- 230000009193 crawling Effects 0.000 claims abstract description 5
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 208000028017 Psychotic disease Diseases 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006996 mental state Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Technology Law (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:步骤1)从网络中爬取大量裁判文书;步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
Description
技术领域
本发明涉及一种生成方法,具体涉及一种基于深度学习的争议焦点生成方法,属于文本生成技术领域。
背景技术
随着自然语言处理技术和人工智能的发展,自助法律服务系统也渐渐建立并完善起来。譬如,可以根据法律文书中的事实描述来预测控诉罪名,实现辅助判决。可以通过查询寻找相关的法律文书;可以为控诉罪名的预测提供合理的法律条文证明。这些工作为法律从业者提供了很大的便利。争议焦点的生成对法官和律师来说具有重要意义。
争议焦点是法官归纳并经过当事人认可的关于证据、事实和法律适用争议的关键问题,既是庭审的主要内容,也是制作裁判文书的主线,方便组织证据认定、事实认定和说理部分的论述。争议焦点生成的意义如下所示:
(1)对法官的意义
·划清审判脉络,保障庭审高效有序。
·争议焦点的总结是裁判文书的“中心思想”。
·双方围绕争议焦点所作的陈述与辩论,加上法官依法作出的裁定,就是裁判文书的雏形。
·双方围绕争议焦点作出的举证质证和发表的辩论,构成了决定案件判决结果的基础。
(2)对律师的意义
·提前帮助律师预判庭审走向,准备证据,确定法律适用。
·一定程度上引导庭审方向。
·帮助预测对方的辩论思路,提前做好准备。
法律争议焦点生成工作属于法律服务系统的一部分,随着技术的发展,法律服务系统的功能越来越多样化。早期的法律工作主要应用的是机器学习的文本分类技术。Boella等人在2011年实现了根据法律文书和它的领域标签之间的关系,来确定特定法律文本的相关领域。Liu和Chen在2017年使用了数据挖掘的方法从先例中提取特征,然后使用文本分类器自动对判决情况分类,以实现判决预测。
发明内容
本发明正是针对现有技术中存在的问题,提供一种基于深度学习的争议焦点生成方法,该技术方案对于给定原告诉称和被告辩称,能够自动生成给定的原告诉称和被告辩称的双方的争议焦点的装置,同时,本发明从网络上爬取裁判文书,并对这些裁判文书抽取出原告诉称和被告辩称,抽取出所有的原告诉称和被告辩称,并标注相应的争议焦点,构建出相应的争议焦点生成装置。
为了实现上述目的,本发明的技术方案如下,一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:
步骤1)从网络中爬取大量裁判文书;
步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;
步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;
步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
作为本发明的一种改进,所述步骤3)具体如下:
1)seq2seq的编码模型融合了上下文文本信息和文本主题信息,首先将原告诉称进行句子级的切分,对于每一个切分好的句子,进行分词,然后将句子放入GRU模型,得到句子的最终表示;
hp,it=GRU(xp,it,hp,it-1),t∈[1,r];
xp,it表示原告诉称的第i句第t个词的词向量,词向量通过word2vec训练得到,hp,it-1表示原告诉称第i句的t-1状态的隐状态,最终得到第r步的隐状态;
2)利用第r步的隐状态和每一步的隐状态计算attention值,并将attention计算得到的权重,乘以相应的隐状态向量,最终得到的计算向量即是句子的向量表示,计算公式如下所示:
up,it=tanh(Wωhp,it+bω);
sp,i=∑tαp,ithp,it;
其中,hp,it表示GRU中的原告诉称中第i个词的隐状态表示,Wω和bω表示待调节的参数,最终得到sp,i,sp,i是原告诉称的第i个句子的嵌入表示,对于原告诉称,可以得到句子序列sp,1,sp,2……,sp,m。将句子序列输入到GRU模型中,得到原告诉称的m个句子的总体表示;
hp,i=GRU(sp,i,hp,i-1),i∈[1,m];
其中sp,i代表第i句子的原告诉称,hp,i-1代表上一步的输出的隐状态,m代表原告诉称的句子长度,最终得到最后的原告诉称表示,同理也可得到最终的被告辩称。
作为本发明的一种改进,所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告诉称和被告辩称,引入了主题向量表示。对于原告诉称的主题分布为Tp=(tp,1,tp,2,…,tp,m)。tp,q注意力权重可以通过以下的计算公式得到:
其中hp,m是输入文本的最后的隐状态,用于提高相关主题的权重,弱化不相干主题的权重。被告辩称也可通过相同的公式得到。本装置将原告诉称和被告辩称的attention的进行联合计算,得到统一的主题注意力权重,计算公式如下所示:
αjq=mp,jq·Wq·md,jq
本方法联合上下文注意力机制和主题注意力机制联合计算得到cj。计算公式如下所示:
其中tp,j是Tp主题中的一个主题的向量,td,j是Td主题中的一个主题的向量。
得到原告诉称和被告辩称的融合向量以后,并以此向量作为解码器的输入,并生成争议焦点,生成的所有词的概率如下公式所示:
dj=GRU(yj-1,dj-1,cj)
相对于现有技术,本发明具有如下优点,由于争议焦点生成存在两大难点:1、原被告双方描述相似但不是争议焦点。2、原被告双方描述不相似但是争议焦点。因此,单单从字面意思上得出争议焦点难以确保争议焦点的正确性和全面性。为了提高生成争议焦点的正确性和全面性,本装置从两个层面检测争议焦点,分别是字面意思层面和主题信息层面。
经过实验分析证明,利用本发明提出的争议焦点生成技术,可以实现根据原告诉称和被告辩称自动生成争议焦点任务。从字面意思和主题信息两个层面检测争议焦点能够很好的解决以往的模型无法处理原被告双方描述相似但不是争议焦点和原被告双方描述不相似但是争议焦点的两种情况。本发明中,争议焦点生成的效果在语言的自然性上,还有准确率,召回率,F1值,等指标上都充分表现了该技术的出色效果。本方法利用文本生成的技术,相比于抽取式的方法更加灵活,概括性更强,争议焦点生成的效果更好。
附图说明
图1是本发明的基本过程示意图;
图2是层次体系结构构建算法图。
具体实施方式:
为了加深对本发明的理解,下面结合附图对本实施例做详细的说明。
实施例1:参见图1,一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:
步骤1)从网络中爬取大量裁判文书;
步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;
步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;
步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
所述步骤3)具体如下:
1)seq2seq的编码模型融合了上下文文本信息和文本主题信息,首先将原告诉称进行句子级的切分,对于每一个切分好的句子,进行分词,然后将句子放入GRU模型,得到句子的最终表示;
hp,it=GRU(xp,it,hp,it-1),t∈[1,r];
xp,it表示原告诉称的第i句第t个词的词向量,词向量通过word2vec训练得到,hp,it-1表示原告诉称第i句的t-1状态的隐状态,最终得到第r步的隐状态;
2)利用第r步的隐状态和每一步的隐状态计算attention值,并将attention计算得到的权重,乘以相应的隐状态向量,最终得到的计算向量即是句子的向量表示,计算公式如下所示:
up,it=tanh(Wωhp,it+bω);
sp,i=∑tαp,ithp,it;
其中,hp,it表示GRU中的原告诉称中第i个词的隐状态表示,Wω和bω表示待调节的参数,最终得到sp,i,sp,i是原告诉称的第i个句子的嵌入表示,对于原告诉称,可以得到句子序列sp,1,sp,2……,sp,m。将句子序列输入到GRU模型中,得到原告诉称的m个句子的总体表示;
hp,i=GRU(sp,i,hp,i-1),i∈[1,m];
其中sp,i代表第i句子的原告诉称,hp,i-1代表上一步的输出的隐状态,m代表原告诉称的句子长度,最终得到最后的原告诉称表示,同理也可得到最终的被告辩称。
所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告诉称和被告辩称,引入了主题向量表示。对于原告诉称的主题分布为Tp=(tp,1,tp,2,…,tp,m)。tp,q注意力权重可以通过以下的计算公式得到:
其中hp,m是输入文本的最后的隐状态,用于提高相关主题的权重,弱化不相干主题的权重。被告辩称也可通过相同的公式得到。本装置将原告诉称和被告辩称的attention的进行联合计算,得到统一的主题注意力权重,计算公式如下所示:
αjq=mp,jq·Wq·md,jq
本方法联合上下文注意力机制和主题注意力机制联合计算得到cj。计算公式如下所示:
其中tp,j是Tp主题中的一个主题的向量,td,j是Td主题中的一个主题的向量。
得到原告诉称和被告辩称的融合向量以后,并以此向量作为解码器的输入,并生成争议焦点,生成的所有词的概率如下公式所示:
dj=GRU(yj-1,dj-1,cj)
应用实施例:参见图1、图2,一种基于深度学习的争议焦点生成方法,包括以下几个步骤:
步骤1)利用爬虫技术,从网络中爬取裁判文书,从爬取到的裁判文书中,筛选出含有原告诉称和被告辩称的裁判文书,并撰写规则从中抽取出相应的原告诉称和被告辩称。
详细步骤如下:
(1)中国裁判文书网的法律文书覆盖面全,文书质量较高,本实施例中以它作为文书的来源。
(2)撰写规则对文书进行处理,并抽取出原告诉称和被告辩称。
抽取的原告诉称例如“原告蔡某甲诉称:被告蔡某乙、杨某某是被告蔡某丙的父母。被告蔡某丙的父母为推卸对患有精神病女儿应承担的监护义务,隐瞒其女病情,委托介绍女儿与原告订婚,并索要彩礼438000元(有证人证言和转账为证)。订婚当天,被告蔡某乙、杨某某就催促原告将蔡某丙带回家。蔡某丙在原告家不到一个月即言行反常,并于2013年8月15日住进了精神病院。现原告为了维护自身的合法权益,诉求人民法院依法判令被告返还原告彩礼438000元。”
抽取的被告辩称例如“被告蔡某乙、杨某某、蔡某丙辩称:原告恶意杜撰一些事实以达到诋毁被告的目的。被告蔡某丙在订婚前曾就读于长乐职业中专学校,毕业后在长乐市林光荣中医内科上班,是一个正常健康的人,其是在与原告生活的这五个月期间精神状态发生异常的。”
具体的规则如下所示:
a.裁判文书的某一行中以“原告”作为这一行的起始字符,并且该行中含有“诉称”,“提出诉讼请求”,“诉求”等关键词,该行字符串即为原告诉称。
b.裁判文书的某一行中以“被告”作为这一行的起始字符,并且该行中含有“辩称”,“答辩状”,“陈述”,“某辩称”等关键词,该行字符即为被告辩称。
步骤2)对于抽取好的原告诉称和被告辩称按照1:1整理成原始数据集,从原始数据集中抽取10%作为训练集,并对训练集进行人工标注争议焦点。
步骤3)首先将原告诉称进行句子级的切分,对于每一个切分好的句子,进行分词,然后将句子放入GRU模型,得到句子的最终表示,融入了句子中不同词的权重。
对于分词,首先利用jieba分词将原告诉称和被告辩称进行分词切分。例如将“被告蔡某的父母为推卸对患有精神病女儿应承担的监护义务”切分为“被告/蔡某/的/父母/为/推卸/对/患有/精神病/女儿/应/承担/的/监护/义务”,然后对其去停用词,得到词的序列为“被告/蔡某/父母/推卸/患有/精神病/女儿/承担/监护/义务”。将词序列输入到GRU模型中,初试的hidden初始化为(0,0…….,0),维度为词向量的维度。公式如下所示:
hp,it=GRU(xp,it,hp,it-1),t∈[1,r]
xp,it表示原告诉称的第i句第t个词的词向量,hp,it-1表示原告诉称第i句的t-1状态的隐状态,最终得到第r步的隐状态。利用第r步的隐状态和每一步的隐状态计算attention值,并将attention计算得到的权重,乘以相应的隐状态向量。
例如原告诉称“原告蔡某甲诉称:被告蔡某乙、杨某某是被告蔡某丙的父母。被告蔡某丙的父母为推卸对患有精神病女儿应承担的监护义务,隐瞒其女病情,委托介绍女儿与原告订婚,并索要彩礼438000元(有证人证言和转账为证)。订婚当天,被告蔡某乙、杨某某就催促原告将蔡某丙带回家。蔡某丙在原告家不到一个月即言行反常,并于2013年8月15日住进了精神病院。现原告为了维护自身的合法权益,诉求人民法院依法判令被告返还原告彩礼438000元。”得到的最终表示向量为(0.5478,…….,0.8254),维度为256维。
被告辩称“被告蔡某乙、杨某某、蔡某丙辩称:原告恶意杜撰一些事实以达到诋毁被告的目的。被告蔡某丙在订婚前曾就读于长乐职业中专学校,毕业后在长乐市林光荣中医内科上班,是一个正常健康的人,其是在与原告生活的这五个月期间精神状态发生异常的。”得到最终向量为(-0.1906,……,0.3269),维度为256维。
同时利用编码时每一句原告诉称句子和被告辩称句子的隐状态和解码时每一步的隐状态计算得到权重。并计算上下文联合权重。得到上下文联合权重为(0.0234,……,0.0592)。
计算主题权重,并计算联合主题权重,维度为(0.0189,……,0,0962)。
计算得到最终的原告诉称和被告辩称的整体表示为(-0.2348,……,0.4297)
步骤4)对于原告诉称“原告蔡某甲诉称:被告蔡某乙、杨某某是被告蔡某丙的父母。被告蔡某丙的父母为推卸对患有精神病女儿应承担的监护义务,隐瞒其女病情,委托介绍女儿与原告订婚,并索要彩礼438000元(有证人证言和转账为证)。订婚当天,被告蔡某乙、杨某某就催促原告将蔡某丙带回家。蔡某丙在原告家不到一个月即言行反常,并于2013年8月15日住进了精神病院。现原告为了维护自身的合法权益,诉求人民法院依法判令被告返还原告彩礼438000元。”和被告辩称“被告蔡某乙、杨某某、蔡某丙辩称:原告恶意杜撰一些事实以达到诋毁被告的目的。被告蔡某丙在订婚前曾就读于长乐职业中专学校,毕业后在长乐市林光荣中医内科上班,是一个正常健康的人,其是在与原告生活的这五个月期间精神状态发生异常的。”解码得到争议焦点为“婚前彩礼是否退还,是否婚姻期间伤害女方”。
5)上述原告诉称和被告辩称人工标注的争议焦点是“彩礼归属,婚姻期间是否对女方造成伤害”,使用交叉熵损失函数计算生成器生成的争议焦点和人工标注的争议焦点的损失函数,并且利用梯度下降的方式,调节生成器的参数,最终得到生成器模型;
6)利用训练得到的生成器对未标注的原告诉称和被告辩称进行争议焦点的自动生成。
需要说明的是上述实施例,并非用来限定本发明的保护范围,在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。
Claims (3)
1.一种基于深度学习的争议焦点生成方法,其特征在于,所述方法包括以下步骤:
步骤1)从网络中爬取大量裁判文书;
步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;
步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;
步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
2.根据权利要求1所述的基于深度学习的争议焦点生成方法,其特征在于,所述步骤3)具体如下:
1)seq2seq的编码模型融合了上下文文本信息和文本主题信息,首先将原告诉称进行句子级的切分,对于每一个切分好的句子,进行分词,然后将句子放入GRU模型,得到句子的最终表示;
hp,it=GRU(xp,it,hp,it-1),t∈[1,r];
xp,it表示原告诉称的第i句第t个词的词向量,词向量通过word2vec训练得到,hp,it-1表示原告诉称第i句的t-1状态的隐状态,最终得到第r步的隐状态;
2)利用第r步的隐状态和每一步的隐状态计算attention值,并将attention计算得到的权重,乘以相应的隐状态向量,最终得到的计算向量即是句子的向量表示,计算公式如下所示:
up,it=tanh(Wωhp,it+bω);
sp,i=∑tαp,ithp,it;
其中,hp,it表示GRU中的原告诉称中第i个词的隐状态表示,Wω和bω表示待调节的参数,最终得到sp,i,sp,i是原告诉称的第i个句子的嵌入表示,对于原告诉称,可以得到句子序列sp,1,sp,2……,sp,m。将句子序列输入到GRU模型中,得到原告诉称的m个句子的总体表示;
hp,i=GRU(sp,i,hp,i-1),i∈[1,m];
其中sp,i代表第i句子的原告诉称,hp,i-1代表上一步的输出的隐状态,m代表原告诉称的句子长度,最终得到最后的原告诉称表示,同理可得到最终的被告辩称。
3.根据权利要求2所述的基于深度学习的争议焦点生成方法,其特征在于,所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告所述步骤3)中,除了利用到了上下文的表示,对于双方表述不同,但是含义相同的情况,对于原告诉称和被告辩称,引入了主题向量表示,对于原告诉称的主题分布为Tp=(tp,1,tp,2,…,tp,m);tp,q注意力权重通过以下的计算公式得到:
其中hp,m是输入文本的最后的隐状态,用于提高相关主题的权重,弱化不相干主题的权重,被告辩称也可通过相同的公式得到,本装置将原告诉称和被告辩称的attention的进行联合计算,得到统一的主题注意力权重,计算公式如下所示:
αjq=mp,jq·Wq·md,jq
其中tp,j是Tp主题中的一个主题的向量,td,j是Td主题中的一个主题的向量。
得到原告诉称和被告辩称的融合向量以后,并以此向量作为解码器的输入,并生成争议焦点,生成的所有词的概率如下公式所示:
dj=GRU(yj-1,dj-1,cj)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910980161.4A CN110889502B (zh) | 2019-10-15 | 2019-10-15 | 一种基于深度学习的争议焦点生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910980161.4A CN110889502B (zh) | 2019-10-15 | 2019-10-15 | 一种基于深度学习的争议焦点生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110889502A true CN110889502A (zh) | 2020-03-17 |
CN110889502B CN110889502B (zh) | 2024-02-06 |
Family
ID=69746168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910980161.4A Active CN110889502B (zh) | 2019-10-15 | 2019-10-15 | 一种基于深度学习的争议焦点生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110889502B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563367A (zh) * | 2020-05-06 | 2020-08-21 | 首都师范大学 | 基于FocalGAN的短文本自动生成方法、装置、设备及存储介质 |
CN111814477A (zh) * | 2020-07-06 | 2020-10-23 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN112329464A (zh) * | 2020-11-27 | 2021-02-05 | 浙江大学 | 基于深度神经网络的司法审理首问题生成方法、装置、介质 |
CN112395426A (zh) * | 2020-11-16 | 2021-02-23 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112651853A (zh) * | 2020-11-17 | 2021-04-13 | 四川大学 | 一种基于裁判文书的论辩观点挖掘方法及系统 |
CN112800746A (zh) * | 2021-01-28 | 2021-05-14 | 北京华宇元典信息服务有限公司 | 基于文本匹配的争议焦点推荐方法、装置和电子设备 |
CN113468323A (zh) * | 2021-06-01 | 2021-10-01 | 成都数之联科技有限公司 | 争议焦点类别及相似判断方法及系统及装置及推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304386A (zh) * | 2018-03-05 | 2018-07-20 | 上海思贤信息技术股份有限公司 | 一种基于逻辑规则推断法律文书判决结果的方法及装置 |
WO2018224028A1 (zh) * | 2017-06-09 | 2018-12-13 | 北京国双科技有限公司 | 获取裁判文书焦点的方法和装置 |
CN109359175A (zh) * | 2018-09-07 | 2019-02-19 | 平安科技(深圳)有限公司 | 电子装置、诉讼数据处理的方法及存储介质 |
CN109858008A (zh) * | 2017-11-30 | 2019-06-07 | 南京大学 | 基于深度学习的文书判决结果倾向性的方法及装置 |
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
-
2019
- 2019-10-15 CN CN201910980161.4A patent/CN110889502B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018224028A1 (zh) * | 2017-06-09 | 2018-12-13 | 北京国双科技有限公司 | 获取裁判文书焦点的方法和装置 |
CN109858008A (zh) * | 2017-11-30 | 2019-06-07 | 南京大学 | 基于深度学习的文书判决结果倾向性的方法及装置 |
CN108304386A (zh) * | 2018-03-05 | 2018-07-20 | 上海思贤信息技术股份有限公司 | 一种基于逻辑规则推断法律文书判决结果的方法及装置 |
CN109359175A (zh) * | 2018-09-07 | 2019-02-19 | 平安科技(深圳)有限公司 | 电子装置、诉讼数据处理的方法及存储介质 |
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563367A (zh) * | 2020-05-06 | 2020-08-21 | 首都师范大学 | 基于FocalGAN的短文本自动生成方法、装置、设备及存储介质 |
CN111814477A (zh) * | 2020-07-06 | 2020-10-23 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN111814477B (zh) * | 2020-07-06 | 2022-06-21 | 重庆邮电大学 | 一种基于争议焦点实体的争议焦点发现方法、装置及终端 |
CN112395426A (zh) * | 2020-11-16 | 2021-02-23 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112395426B (zh) * | 2020-11-16 | 2023-04-21 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112651853A (zh) * | 2020-11-17 | 2021-04-13 | 四川大学 | 一种基于裁判文书的论辩观点挖掘方法及系统 |
CN112329464A (zh) * | 2020-11-27 | 2021-02-05 | 浙江大学 | 基于深度神经网络的司法审理首问题生成方法、装置、介质 |
CN112329464B (zh) * | 2020-11-27 | 2023-08-04 | 浙江大学 | 基于深度神经网络的司法审理首问题生成方法、装置、介质 |
CN112800746A (zh) * | 2021-01-28 | 2021-05-14 | 北京华宇元典信息服务有限公司 | 基于文本匹配的争议焦点推荐方法、装置和电子设备 |
CN113468323A (zh) * | 2021-06-01 | 2021-10-01 | 成都数之联科技有限公司 | 争议焦点类别及相似判断方法及系统及装置及推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110889502B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110889502A (zh) | 一种基于深度学习的争议焦点生成方法 | |
CN110134771B (zh) | 一种基于多注意力机制融合网络问答系统的实现方法 | |
CN108733653A (zh) | 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法 | |
CN107315737A (zh) | 一种语义逻辑处理方法及系统 | |
CN107632968A (zh) | 一种面向裁判文书的证据链关系模型的构建方法 | |
Xue et al. | A better way to attend: Attention with trees for video question answering | |
CN110083710A (zh) | 一种基于循环神经网络与潜变量结构的词语定义生成方法 | |
WO2022033073A1 (zh) | 一种面向认知服务的用户意图识别方法及系统 | |
CN112612871B (zh) | 一种基于序列生成模型的多事件检测方法 | |
CN108256968A (zh) | 一种电商平台商品专家评论生成方法 | |
CN109408630B (zh) | 一种根据犯罪事实的描述自动生成法院观点的方法 | |
CN112101044A (zh) | 一种意图识别方法、装置及电子设备 | |
McCrae et al. | Multi-modal semantic inconsistency detection in social media news posts | |
Qi et al. | DuReadervis: A Chinese dataset for open-domain document visual question answering | |
da Silva et al. | Improving Named Entity Recognition using Deep Learning with Human in the Loop. | |
CN111221964A (zh) | 一种不同分面观点演化趋势引导的文本生成方法 | |
Wang et al. | Cognitive distortion based explainable depression detection and analysis technologies for the adolescent internet users on social media | |
CN117252255A (zh) | 一种面向辅助决策的灾害应急知识图谱构建方法 | |
CN116341519A (zh) | 基于背景知识的事件因果关系抽取方法、装置及存储介质 | |
Liyanage et al. | Augmenting reddit posts to determine wellness dimensions impacting mental health | |
CN115600561A (zh) | 融合规则与小样本的网页结构化方法、设备和存储介质 | |
CN113901172B (zh) | 基于关键词结构编码的涉案微博评价对象抽取方法 | |
CN111709230B (zh) | 基于词性软模板注意力机制的短文本自动摘要方法 | |
CN112069777B (zh) | 一种基于骨架的二阶段数据到文本生成方法 | |
CN114254175A (zh) | 一种用于电力政策文件的生成式摘要的提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |