CN108009284A - 采用半监督卷积神经网络的法律文本分类方法 - Google Patents
采用半监督卷积神经网络的法律文本分类方法 Download PDFInfo
- Publication number
- CN108009284A CN108009284A CN201711408277.8A CN201711408277A CN108009284A CN 108009284 A CN108009284 A CN 108009284A CN 201711408277 A CN201711408277 A CN 201711408277A CN 108009284 A CN108009284 A CN 108009284A
- Authority
- CN
- China
- Prior art keywords
- vector
- neural networks
- law
- convolutional neural
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种采用半监督卷积神经网络的法律文本分类方法,属于神经网络领域。该方法利用SSC对自然语言进行处理,实现了该系统的主要目标,通过对法律案情描述的处理,初步解决该法律案情描述触犯了当事人什么权益,或是当事人违反了哪些法律法规,当事人可能不止一个权益受到侵犯,也或者是当事人同时触犯了多个法律法规,实现多标签分类。该法律服务平台帮助办案人员高效处理各类法律案件,对各类法律案件进行语义分析,实现分类,使我们的自然语言理解功能不仅具备理解字面意思的能力,还具备逻辑推理,理解深层意思的能力。
Description
技术领域
本发明属于神经网络领域,涉及采用半监督卷积神经网络的法律文本分类方法。
背景技术
随着经济社会的快速发展,各类突发公共事件层出不穷,大量的法律案件每天都在产生,案件的紧急处理和自动分类是最基本和最关键的步骤。然而,对于公安执法领域,执法人员的办案经验及对法律法规的熟悉程度良莠不齐,产生了很多判决有失偏颇的问题,而且现有的公安信息系统的应用基本停留在查询、统计等一些简单的应用,不能满足案件及时处理的需求;对于律师事务所来说,传统的方案通常采用人工处理模式对法律案件一一处理,不但造成大量的人力资源浪费,同时违反犯罪行为得不到及时有效解决;对于普通民众来说,及时辨别自己违反了哪种法律也是迫在眉睫的。利用深度学习技术对法律案件进行处理,实现对案件的自动分类,可以在一定程度上缓解这些问题。基于深度神经网络对法律案件处理的方法,实现对案件的深层语义分析,完成分类任务,使我们的自然语言理解功能不仅具备理解字面意思的能力,还具备逻辑推理,理解深层意思的能力。本发明采用半监督卷积神经网络对法律文本进行分类,可以大大减少执法人员和律师的工作量,同时,为缺乏法律知识的普通民众提供了查询平台。
发明内容
有鉴于此,本发明的目的在于提供一种基于半监督卷积神经网络(Semi-supervised Convolutional Neural Networks,SSC)的互联网+法律服务平台,该系统实现法律文本的有效分类。比传统神经网络算法具有更高的准确度,能够更好地表示数据的特征。
为达到上述目的,本发明提供如下技术方案:
采用半监督卷积神经网络的法律文本分类方法,包括以下步骤:
S1:从输入的法律案情文本数据中提取高频单词;
S2:利用word2vec将词表征为向量,得到矩阵作为输入;
S3:通过训练two-view-embedding学习模型,每个特征区域预测目标区域;
S4:把学到的向量标签数据整合进监督卷积神经网络;
S5:滤波器对句子矩阵做卷积运算;
S6:得到不同程度的特征字典;
S7:对特征字典进行最大值池化,利用最大值池化方法,对特征字典进行池化操作;
S8:生成一串单变量的特征向量;
S9:在softmax层,以这个特征向量作为输入,对句子矩阵做分类;
S10:输入验证集,调整分类器参数;
S11:输入测试集,测试模型的分类能力。
进一步,所述步骤S2具体为:采用Word2vec(Word To Vector)神经网络语言模型对词向量进行训练,将词汇转换成向量形式,从而把对文本的处理转化为向量空间中的向量运算,方便地完成各种NLP任务;Word2vec以法律文本语料库作为输入,首先在训练文本数据集中构建一个词汇表,然后训练出每个单词的词向量作为输出,产生的词向量文件作为特征向量供后续的自然语言处理和机器学习等算法使用;Word2Vec模型提取文本中词汇的位置关系,提取词汇的上下文信息,生成词汇的向量模型;词汇通过数值向量量化表示,词汇之间的相似度由向量计算得到。
进一步,所述步骤S4具体为:把从two-view-embedding学习模型学习到的标签数据整合进监督卷积神经网络,作为卷积神经网络的额外输入,表达式为:σ(W·ri(x)+V·ui(x)+b),代替σ(W·ri(x)+b),ri(x)是卷积神经网络模型第i个区域的输入区域向量,ui(x)是two-view-embedding学习模型的第i个区域的输出向量,W、V为权重矩阵,b为偏差向量。
进一步,所述步骤S5具体为:利用三种区域尺寸的滤波器,且每个区域尺寸有2个滤波器,共有6个滤波器对句子矩阵做卷积运算。
进一步,所述步骤S9具体为:利用SSC对自然语言进行处理,通过对法律案情描述的处理,初步解决该法律案情描述触犯当事人什么权益,或是当事人违反哪些法律法规,当事人权益受到侵犯不止一个,也或是当事人同时触犯多个法律法规,实现多标签分类。
本发明的有益效果在于:本发明利用SSC对自然语言进行处理,实现了该系统的主要目标,通过对法律案情描述的处理,初步解决该法律案情描述触犯了当事人什么权益,或是当事人违反了哪些法律法规,当事人可能不止一个权益受到侵犯,也或者是当事人同时触犯了多个法律法规,实现多标签分类。该法律服务平台帮助办案人员高效处理各类法律案件,对各类法律案件进行语义分析,实现分类,使我们的自然语言理解功能不仅具备理解字面意思的能力,还具备逻辑推理,理解深层意思的能力。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明采用半监督卷积神经网络对法律文本分类的流程图;
图2为本发明采用two-view-embedding学习模型训练模型的示意图;
图3为本发明用于句子分类的卷积神经网络架构示意图;
图4为本发明独热卷积神经网络示意图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图1为本发明的采用半监督卷积神经网络对法律文本实现多标签分类的流程图。以法律案情描述文本为语义知识资源,半监督卷积神经网络为语义分析方法。本文构建一种基于半监督卷积神经网络下的自然语言语义分析方法,对自然语言完成分类任务。下面结合附图1给出一个利用半监督卷积神经网络对自然语言语义分类的实施例以对本发明作进一步的阐述。如图1所示,本发明各部分具体实施细节如下:
1.从输入的法律案情文本数据中提取高频单词。由于对输入文本数据的保存会造成大量的资源消耗,所以没有必要使用所有的法律案情文本数据作为训练集。为了获得更好的文本分类性能,从输入的法律案情文本数据中提取高频单词作为模型的训练集。
2.利用word2vec将词表征为向量,得到矩阵作为输入。词向量这种方式最主要的优点在于让有一定关系的词,在数学意义上的距离更近了。要想对词向量进行训练,其中最广泛使用的方法有神经网络语言模型,word2vec也是基于它进行改进的,本文针对此种模型进行研宄。Word2vec(WordToVector),它可以将词汇转换成向量形式,从而把对文本的处理转化为向量空间中的向量运算,方便地完成各种自然语言处理任务。Word2vec以文本语料库作为输入,首先在训练文本数据集中构建一个词汇表,然后训练出每个单词的词向量作为输出,产生的词向量文件可以作为特征向量供后续的自然语言处理和机器学习等算法使用。Word2Vec模型提取文本中词汇的位置关系,提取词汇的上下文信息,生成词汇的向量模型。词汇可以通过数值向量量化表示,词汇之间的相似度可以由向量计算得到。
3.通过训练two-view-embedding学习模型,每个特征区域预测目标区域(邻近区域)。Two-view-embedding模型不同于监督卷积神经网络学习模型,two-view-embedding学习模型的输入数据是无标签数据,且每个小区域都与自己的目标输出相关联,如图2所示。
4.通过训练two-view-embedding模型学习到的标签数据整合进监督卷积神经网络。把从two-view-embedding学习模型学习到的标签数据整合进监督卷积神经网络,作为卷积神经网络的额外输入。数学表达式表达为:σ(W·ri(x)+V·ui(x)+b),代替σ(W·ri(x)+b)。这里,ri(x)是卷积神经网络模型第i个区域的输入区域向量,ui(x)是two-view-embedding学习模型的第i个区域的输出向量,W、V为权重矩阵,b为偏差向量。
5.滤波器对句子矩阵做卷积运算。本系统利用三种区域尺寸(2、3、4)的滤波器,且每个区域尺寸有2个滤波器,共有6个滤波器对句子矩阵做卷积运算,如图3所示。
6.得到不同程度的特征字典。
7.对特征字典进行最大值池化。本系统利用最大值池化方法,对特征字典进行池化操作。
8.生成一串单变量的特征向量。
9.在softmax层,以这个特征向量作为输入,对句子矩阵做分类。利用SSC对自然语言进行处理,实现了该系统的主要目标,通过对法律案情描述的处理,初步解决该法律案情描述触犯了当事人什么权益,或是当事人违反了哪些法律法规,当事人可能不止一个权益受到侵犯,也或者是当事人同时触犯了多个法律法规,实现多标签分类。
10.入验证集,调整分类器参数。
11.输入测试集,测试模型的分类能力。
图2为本发明采用two-view-embedding学习模型训练模型的示意图。Two-view-embedding学习模型是由输入层、卷积层、高层和输出层组成的网络模型。
Two-view-embedding学习模型定义如下:如果存在函数g1,满足:
P(X2|X1)=g1(f1(X1),X2) (X1,X2)∈χ1×χ2 (1)
那么,函数f1被定义为χ1关于χ2的二视图嵌套。Two-view-embedding模型学习得到的标签数据整合进入CNN,作为CNN的额外输入。
Two-view-embedding模型主要实现下面三个目标:
(1)从每个尺寸为p的文本区域预测邻近区域,而且,它能够获取数据之间的内部信息;
(2)它能够为每个尺寸为p的小文本区域分配一个标签(例如,积极的/消极的),而不是整个文本实现最终的分类任务;
(3)通过训练,卷积层学习文本区域的向量表示。也就是说,它把高维的向量转化为低维向量,获取预测的特征信息。
通过训练two-view-embedding学习模型,每个特征区域预测目标区域(邻近区域)。two-view-embedding模型不同于监督卷积神经网络学习模型,two-view-embedding学习模型的输入数据是无标签数据,且每个小区域都与自己的目标输出相关联。把通过训练two-view-embedding学习模型学习到的标签数据整合进监督卷积神经网络,作为卷积神经网络的额外输入。
图3为本发明用于句子分类的卷积神经网络架构示意图。滤波器对句子矩阵做卷积运算。本系统利用三种区域尺寸的滤波器,且每个区域尺寸有2个滤波器,共有6个滤波器对句子矩阵做卷积运算,得到不同程度的特征字典;对特征字典进行最大值池化,本系统利用最大值池化方法,对特征字典进行池化操作,生成一串单变量的特征向量;在softmax层,以这个特征向量作为输入,对句子矩阵做分类。利用CNN对自然语言进行处理,完成语义分析,对法律案情文本实现多标签分类任务。CNN底层的神经网络接收原始的特征向量,在自底向上的传递过程中,从具体的特征向量逐渐转化为抽象的特征向量,在顶层的神经网络形成更易于分类的组合特征向量,增加网络层数能够将特征向量更加抽象化。
卷积层包含许多计算单元,每一个对应于输入的一小块区域,所有的这些小区域覆盖全部输入数据。与输入x的第i个区域相关联的计算单元的数学表达式如下:
σ(W·ri(x)+b) (2)
σ是预先定义的非线性激活函数,ri(x)是第i个输入区域向量,权重矩阵W和偏向向量b通过训练被学习到,被相同层的计算单元所共享,减少了系统参数。
卷积层的输出被输送到池化层,池化层通过合并邻近像素点本质上缩小了输入矩阵大小,以至于高层能够处理更抽象、更全局的信息。池化层包括许多池化单元,每一个池化单元与输入矩阵的每个小区域密切相关。通常使用的池化方法有平均池化和最大池化,本系统利用最大值池化方法,对特征字典进行池化操作,生成一串单变量的特征向量。
在CNN中,全连接层位于网络模型的最后部分,负责对网络最终的输出特征进行分类预测,得出分类结果。图4为本发明独热卷积神经网络示意图。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (5)
1.采用半监督卷积神经网络的法律文本分类方法,其特征在于:该方法包括以下步骤:
S1:从输入的法律案情文本数据中提取高频单词;
S2:利用word2vec将词表征为向量,得到矩阵作为输入;
S3:通过训练two-view-embedding学习模型,每个特征区域预测目标区域;
S4:把学到的向量标签数据整合进监督卷积神经网络;
S5:滤波器对句子矩阵做卷积运算;
S6:得到不同程度的特征字典;
S7:对特征字典进行最大值池化,利用最大值池化方法,对特征字典进行池化操作;
S8:生成一串单变量的特征向量;
S9:在softmax层,以这个特征向量作为输入,对句子矩阵做分类;
S10:输入验证集,调整分类器参数;
S11:输入测试集,测试模型的分类能力。
2.根据权利要求1所述的采用半监督卷积神经网络的法律文本分类方法,其特征在于:所述步骤S2具体为:采用Word2vec(WordToVector)神经网络语言模型对词向量进行训练,将词汇转换成向量形式,从而把对文本的处理转化为向量空间中的向量运算,方便地完成各种NLP任务;Word2vec以法律文本语料库作为输入,首先在训练文本数据集中构建一个词汇表,然后训练出每个单词的词向量作为输出,产生的词向量文件作为特征向量供后续的自然语言处理和机器学习等算法使用;Word2Vec模型提取文本中词汇的位置关系,提取词汇的上下文信息,生成词汇的向量模型;词汇通过数值向量量化表示,词汇之间的相似度由向量计算得到。
3.根据权利要求1所述的采用半监督卷积神经网络的法律文本分类方法,其特征在于:所述步骤S4具体为:把从two-view-embedding学习模型学习到的标签数据整合进监督卷积神经网络,作为卷积神经网络的额外输入,表达式为:σ(W·ri(x)+V·ui(x)+b),代替σ(W·ri(x)+b),ri(x)是卷积神经网络模型第i个区域的输入区域向量,ui(x)是two-view-embedding学习模型的第i个区域的输出向量,W、V为权重矩阵,b为偏差向量。
4.根据权利要求1所述的采用半监督卷积神经网络的法律文本分类方法,其特征在于:所述步骤S5具体为:利用三种区域尺寸的滤波器,且每个区域尺寸有2个滤波器,共有6个滤波器对句子矩阵做卷积运算。
5.根据权利要求1所述的采用半监督卷积神经网络的法律文本分类方法,其特征在于:所述步骤S9具体为:利用SSC对自然语言进行处理,通过对法律案情描述的处理,初步解决该法律案情描述触犯当事人什么权益,或是当事人违反哪些法律法规,当事人权益受到侵犯不止一个,也或是当事人同时触犯多个法律法规,实现多标签分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711408277.8A CN108009284A (zh) | 2017-12-22 | 2017-12-22 | 采用半监督卷积神经网络的法律文本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711408277.8A CN108009284A (zh) | 2017-12-22 | 2017-12-22 | 采用半监督卷积神经网络的法律文本分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108009284A true CN108009284A (zh) | 2018-05-08 |
Family
ID=62060710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711408277.8A Pending CN108009284A (zh) | 2017-12-22 | 2017-12-22 | 采用半监督卷积神经网络的法律文本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009284A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102157A (zh) * | 2018-07-11 | 2018-12-28 | 交通银行股份有限公司 | 一种基于深度学习的银行工单派单方法及系统 |
CN109299753A (zh) * | 2018-12-11 | 2019-02-01 | 济南浪潮高新科技投资发展有限公司 | 一种用于法律文本信息挖掘的集成学习方法及系统 |
CN109325116A (zh) * | 2018-08-23 | 2019-02-12 | 武大吉奥信息技术有限公司 | 一种基于深度学习的城市事件自动分类派发方法及装置 |
CN109376241A (zh) * | 2018-10-17 | 2019-02-22 | 国网浙江杭州市萧山区供电有限公司 | 一种基于DenseNet面向电力领域的电话诉求文本分类算法 |
CN109472424A (zh) * | 2018-12-18 | 2019-03-15 | 广东博维创远科技有限公司 | 犯罪实际刑期的预测方法、装置、存储介质及服务器 |
CN109597885A (zh) * | 2018-12-11 | 2019-04-09 | 福建亿榕信息技术有限公司 | 一种知识地图构建方法及存储介质 |
CN109740728A (zh) * | 2018-12-10 | 2019-05-10 | 杭州世平信息科技有限公司 | 一种基于多种神经网络组合的量刑计算方法 |
CN109902172A (zh) * | 2019-01-31 | 2019-06-18 | 深度好奇(北京)科技有限公司 | 案情文本分类方法、装置以及存储介质 |
CN110110846A (zh) * | 2019-04-24 | 2019-08-09 | 重庆邮电大学 | 基于卷积神经网络的辅助驾驶人车交互方法 |
CN110119905A (zh) * | 2019-05-23 | 2019-08-13 | 贵州大学 | 一种基于双通道卷积神经网络的精准分案方法 |
CN110196977A (zh) * | 2019-05-31 | 2019-09-03 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
CN110245227A (zh) * | 2019-04-25 | 2019-09-17 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110276068A (zh) * | 2019-05-08 | 2019-09-24 | 清华大学 | 法律案情分析方法及装置 |
CN110968689A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 罪名及法条预测模型的训练方法以及罪名及法条预测方法 |
CN111180019A (zh) * | 2018-11-09 | 2020-05-19 | 上海云贵信息科技有限公司 | 一种基于深度学习的化合物参数自动提取方法 |
CN111241274A (zh) * | 2019-12-31 | 2020-06-05 | 航天信息股份有限公司 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
CN111401063A (zh) * | 2020-06-03 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 一种基于多池化网络的文本处理方法、装置和相关设备 |
CN111475651A (zh) * | 2020-04-08 | 2020-07-31 | 掌阅科技股份有限公司 | 文本分类方法、计算设备及计算机存储介质 |
CN111488503A (zh) * | 2019-01-29 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 案件分类方法及装置 |
CN111552808A (zh) * | 2020-04-20 | 2020-08-18 | 北京北大软件工程股份有限公司 | 一种基于卷积神经网络的行政违法案由预测方法及工具 |
CN111666771A (zh) * | 2020-06-05 | 2020-09-15 | 北京百度网讯科技有限公司 | 文书的语义标签抽取、装置、电子设备及可读存储介质 |
CN112100212A (zh) * | 2020-09-04 | 2020-12-18 | 中国航天科工集团第二研究院 | 一种基于机器学习和规则匹配的案件情节抽取方法 |
CN112131390A (zh) * | 2020-11-24 | 2020-12-25 | 江苏电力信息技术有限公司 | 一种基于深度学习的电力预警信息自动分类方法 |
WO2021042554A1 (zh) * | 2019-09-03 | 2021-03-11 | 平安科技(深圳)有限公司 | 一种法律文本归档方法、装置、可读存储介质及终端设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106874410A (zh) * | 2017-01-22 | 2017-06-20 | 清华大学 | 基于卷积神经网络的中文微博文本情绪分类方法及其系统 |
CN107015963A (zh) * | 2017-03-22 | 2017-08-04 | 重庆邮电大学 | 基于深度神经网络的自然语言语义分析系统及方法 |
CN107247702A (zh) * | 2017-05-05 | 2017-10-13 | 桂林电子科技大学 | 一种文本情感分析处理方法和系统 |
CN107451565A (zh) * | 2017-08-01 | 2017-12-08 | 重庆大学 | 一种半监督小样本深度学习图像模式分类识别方法 |
-
2017
- 2017-12-22 CN CN201711408277.8A patent/CN108009284A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106874410A (zh) * | 2017-01-22 | 2017-06-20 | 清华大学 | 基于卷积神经网络的中文微博文本情绪分类方法及其系统 |
CN107015963A (zh) * | 2017-03-22 | 2017-08-04 | 重庆邮电大学 | 基于深度神经网络的自然语言语义分析系统及方法 |
CN107247702A (zh) * | 2017-05-05 | 2017-10-13 | 桂林电子科技大学 | 一种文本情感分析处理方法和系统 |
CN107451565A (zh) * | 2017-08-01 | 2017-12-08 | 重庆大学 | 一种半监督小样本深度学习图像模式分类识别方法 |
Non-Patent Citations (2)
Title |
---|
RIE JOHNSON 等: "Semi-supervised Convolutional Neural Networks for Text Categorization via Region Embedding", 《ARXIV:1504.01255V3[STAT.ML]》 * |
林志宏 等: "基于卷积神经网络的公安案件文本语义特征提取方法研究", 《数学的实践与认识》 * |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102157A (zh) * | 2018-07-11 | 2018-12-28 | 交通银行股份有限公司 | 一种基于深度学习的银行工单派单方法及系统 |
CN109325116A (zh) * | 2018-08-23 | 2019-02-12 | 武大吉奥信息技术有限公司 | 一种基于深度学习的城市事件自动分类派发方法及装置 |
CN109325116B (zh) * | 2018-08-23 | 2020-11-27 | 武大吉奥信息技术有限公司 | 一种基于深度学习的城市事件自动分类派发方法及装置 |
CN110968689A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 罪名及法条预测模型的训练方法以及罪名及法条预测方法 |
CN109376241A (zh) * | 2018-10-17 | 2019-02-22 | 国网浙江杭州市萧山区供电有限公司 | 一种基于DenseNet面向电力领域的电话诉求文本分类算法 |
CN109376241B (zh) * | 2018-10-17 | 2020-09-18 | 国网浙江杭州市萧山区供电有限公司 | 一种基于DenseNet面向电力领域的电话诉求文本分类算法 |
CN111180019A (zh) * | 2018-11-09 | 2020-05-19 | 上海云贵信息科技有限公司 | 一种基于深度学习的化合物参数自动提取方法 |
CN109740728A (zh) * | 2018-12-10 | 2019-05-10 | 杭州世平信息科技有限公司 | 一种基于多种神经网络组合的量刑计算方法 |
CN109597885A (zh) * | 2018-12-11 | 2019-04-09 | 福建亿榕信息技术有限公司 | 一种知识地图构建方法及存储介质 |
CN109299753A (zh) * | 2018-12-11 | 2019-02-01 | 济南浪潮高新科技投资发展有限公司 | 一种用于法律文本信息挖掘的集成学习方法及系统 |
CN109472424A (zh) * | 2018-12-18 | 2019-03-15 | 广东博维创远科技有限公司 | 犯罪实际刑期的预测方法、装置、存储介质及服务器 |
CN109472424B (zh) * | 2018-12-18 | 2020-06-02 | 华南师范大学 | 犯罪实际刑期的预测方法、装置、存储介质及服务器 |
CN111488503A (zh) * | 2019-01-29 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 案件分类方法及装置 |
CN109902172A (zh) * | 2019-01-31 | 2019-06-18 | 深度好奇(北京)科技有限公司 | 案情文本分类方法、装置以及存储介质 |
CN110110846A (zh) * | 2019-04-24 | 2019-08-09 | 重庆邮电大学 | 基于卷积神经网络的辅助驾驶人车交互方法 |
CN110245227B (zh) * | 2019-04-25 | 2021-12-28 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110245227A (zh) * | 2019-04-25 | 2019-09-17 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110276068B (zh) * | 2019-05-08 | 2020-08-28 | 清华大学 | 法律案情分析方法及装置 |
CN110276068A (zh) * | 2019-05-08 | 2019-09-24 | 清华大学 | 法律案情分析方法及装置 |
CN110119905A (zh) * | 2019-05-23 | 2019-08-13 | 贵州大学 | 一种基于双通道卷积神经网络的精准分案方法 |
CN110196977A (zh) * | 2019-05-31 | 2019-09-03 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
CN110196977B (zh) * | 2019-05-31 | 2023-06-09 | 广西南宁市博睿通软件技术有限公司 | 一种智能警情督导处理系统及方法 |
WO2021042554A1 (zh) * | 2019-09-03 | 2021-03-11 | 平安科技(深圳)有限公司 | 一种法律文本归档方法、装置、可读存储介质及终端设备 |
CN111241274B (zh) * | 2019-12-31 | 2023-11-28 | 航天信息股份有限公司 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
CN111241274A (zh) * | 2019-12-31 | 2020-06-05 | 航天信息股份有限公司 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
CN111475651A (zh) * | 2020-04-08 | 2020-07-31 | 掌阅科技股份有限公司 | 文本分类方法、计算设备及计算机存储介质 |
CN111475651B (zh) * | 2020-04-08 | 2023-04-07 | 掌阅科技股份有限公司 | 文本分类方法、计算设备及计算机存储介质 |
CN111552808A (zh) * | 2020-04-20 | 2020-08-18 | 北京北大软件工程股份有限公司 | 一种基于卷积神经网络的行政违法案由预测方法及工具 |
CN111401063B (zh) * | 2020-06-03 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 一种基于多池化网络的文本处理方法、装置和相关设备 |
CN111401063A (zh) * | 2020-06-03 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 一种基于多池化网络的文本处理方法、装置和相关设备 |
CN111666771A (zh) * | 2020-06-05 | 2020-09-15 | 北京百度网讯科技有限公司 | 文书的语义标签抽取、装置、电子设备及可读存储介质 |
CN111666771B (zh) * | 2020-06-05 | 2024-03-08 | 北京百度网讯科技有限公司 | 文书的语义标签抽取、装置、电子设备及可读存储介质 |
CN112100212A (zh) * | 2020-09-04 | 2020-12-18 | 中国航天科工集团第二研究院 | 一种基于机器学习和规则匹配的案件情节抽取方法 |
CN112131390A (zh) * | 2020-11-24 | 2020-12-25 | 江苏电力信息技术有限公司 | 一种基于深度学习的电力预警信息自动分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009284A (zh) | 采用半监督卷积神经网络的法律文本分类方法 | |
Onan | Sentiment analysis on product reviews based on weighted word embeddings and deep neural networks | |
Nikolentzos et al. | Message passing attention networks for document understanding | |
Elfaik et al. | Deep bidirectional LSTM network learning-based sentiment analysis for Arabic text | |
Tao et al. | Toward multi-label sentiment analysis: a transfer learning based approach | |
Gao et al. | Convolutional neural network based sentiment analysis using Adaboost combination | |
EP3173983A1 (en) | A method and apparatus for providing automatically recommendations concerning an industrial system | |
Amro et al. | Instance reduction for avoiding overfitting in decision trees | |
Xiao et al. | Using convolution control block for Chinese sentiment analysis | |
CN106294568A (zh) | 一种基于bp网络的中文文本分类规则生成方法及系统 | |
CN110188195A (zh) | 一种基于深度学习的文本意图识别方法、装置及设备 | |
CN105975497A (zh) | 微博话题自动推荐方法及装置 | |
Kansara et al. | Comparison of traditional machine learning and deep learning approaches for sentiment analysis | |
Wang et al. | A text classification method based on LSTM and graph attention network | |
CN113779387A (zh) | 基于知识图谱的行业推荐方法及系统 | |
Savelev et al. | The high-level overview of social media content search engine | |
Cai et al. | Graph convolutional networks for fast text classification | |
Bharti et al. | Hyperbolic feature-based sarcasm detection in Telugu conversation sentences | |
Wang et al. | Investigating diagrammatic reasoning with deep neural networks | |
Schmitt et al. | Outlier detection on semantic space for sentiment analysis with convolutional neural networks | |
Liu et al. | Character-level neural networks for short text classification | |
Revathy et al. | Efficient author community generation on Nlp based relevance feature detection | |
Dhar et al. | Automatic categorization of web text documents using fuzzy inference rule | |
Mackare et al. | Artificial Intelligence aspects in developed E-material formatting application | |
Kireev | Deriving cognitive map concepts on the basis of social media data clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180508 |