CN111859936A - 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 - Google Patents
一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 Download PDFInfo
- Publication number
- CN111859936A CN111859936A CN202010654090.1A CN202010654090A CN111859936A CN 111859936 A CN111859936 A CN 111859936A CN 202010654090 A CN202010654090 A CN 202010654090A CN 111859936 A CN111859936 A CN 111859936A
- Authority
- CN
- China
- Prior art keywords
- text data
- text
- professional
- tensor
- jurisdiction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 239000000463 material Substances 0.000 abstract description 6
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法,属于深度学习技术领域,步骤为:1)文本数据向量化处理得到文本对应的向量矩阵;2)通过TextCNN模块提取文本数据的空间结构特征;3)通过TextRNN模块提取文本数据的序列信息特征;4)利用张量将文本数据的空间结构特征和序列信息特征构造为表征能力更强的高阶数据块;5)在soft‑max层以高阶数据块作为输入进行分类,得到案件的专业管辖权结果。本发明针对跨域立案中的文本起诉材料设深度混合计算网络,有效融合TextCNN和TextRNN,联合学习文本数据的空间结构特征和序列信息特征,并为此采用张量外积的方式将两种特征提取结果构造成具有丰富语义的高阶数据块,完成分类任务,识别出案件的专业管辖权结果。
Description
技术领域
本发明属于深度学习技术领域,涉及一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法。
背景技术
随着经济社会的发展,人民群众的司法需求与日俱增,司法为民的广度和深度急需全面拓展。与此同时,“互联网+”、大数据、云计算等科技不断取得迅猛的发展,通过利用互联网技术的红利,提供更加便民利民能真正让当事人享受到便捷优质的诉讼服务,契合了时代发展的要求,符合人民群众对司法领域新的需求。跨域立案正是这一背景下司法为民便民的当代实践。通过跨域立案,当事人可以就近选择收件法院,通过法院间的文件转换系统向具有管辖权的法院提交诉讼材料,实现远程立案,避免长途奔波。不可忽视的是,便利的起诉条件也容易增加当事人将案件起诉到法院以解决纠纷的动力,致使法院案件增多,加剧法院案多人少的矛盾等。为了避免跨域立案推广所带来的进一步潜在负担,提高立案的效率势在必行。
由于跨域立案中的诉讼材料大部分为文本形式,因此有许多研究者将基于机器学习的文本分类算法应用于诉讼材料。其中,最具影响力的机器学习方法包括贝叶斯网络,决策树,支持向量机和人工神经网络。贝叶斯网络关注文档属于特定类别的概率。决策树侧重于数据空间的层次分解。支持向量机通过构造分类超平面来最大化分类间隔。人工神经网络通过浅层前馈网络实现文本分类。但是,这些方法都是浅层的机器学习模型,限制了它们表达复杂函数的能力,进而导致对复杂语义的理解不准确。深度学习凭借其复杂的网络结构有效地解决了上述问题。在文本分类领域,使用最广泛的深度学习方法为基于卷积神经网络的文本分类模型(TextCNN)和基于递归神经网络的文本分类模型(TextRNN)。凭借其独特的卷积运算,TextCNN可有效捕获文本数据在空间结构上的局部相关性。但是,TextCNN却无法有效地对文本数据中的序列信息进行建模,这一缺点限制了TextCNN的功能。TextRNN利用其特定的有向递归结构可以有效解决输入文本之间的上下文依赖问题。但是,TextRNN提取文本特征的能力却不如TextCNN强大。
因此,本发明针对跨域立案过程中案件的专业管辖权识别问题,主要考虑有效融合TextCNN和TextRNN的优势,提出了一种基于深度混合网络(Hybrid)的面向跨域立案的法律文书专业管辖权识别方法。
发明内容
本发明提出一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法。该方法采取并行组合的方式,在互不干扰的前提下,使用TextCNN和TextRNN分别提取文本数据的空间特征和序列特征,以此解决特征提取和序列信息建模的问题;此外,为了更有效利用特征提取结果,本发明对于提取的空间特征和序列信息结果不做简单拼接处理,选择使用张量外积的方法构造一个高阶数据块以融合它们,使其包含更丰富的信息并具有强大的表示能力,最终提高案件专业管辖权识别的精度,召回率,F1分数值和准确率。
为了达到上述目的,本发明采用的技术方案为:
一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法,包括以下步骤:
步骤1、文本数据的向量化处理,得到文本对应的向量矩阵;
步骤2、通过TextCNN模块提取文本数据的空间结构特征;
步骤3、通过TextRNN模块提取文本数据的序列信息特征;
步骤4、利用张量将文本数据的空间结构特征和序列信息特征构造为表征能力更强的高阶数据块;
步骤5、在soft-max层,以这个高阶数据块作为输入,进行分类,得到案件的专业管辖权结果;
本发明的有益效果为:本发明针对跨域立案中的文本起诉材料设计了一种深度混合计算网络,主要考虑有效融合TextCNN和TextRNN的优势,联合学习文本数据的空间结构特征和序列信息特征,并为此采用张量外积的方式将两种特征提取结果构造成具有丰富语义的高阶数据块,进而完成分类任务,识别出案件的专业管辖权结果。实验表明,本发明在文本分类方法常用的评价指标Precision,Recall,F1 Score和Accuracy上,有效提高了分类性能。
附图说明
图1基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法框架图;
图2本发明提出方法的流程图;
具体实施方式
下面结合附图对本发明的实施方式做进一步说明。
图1为基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法框架图。首先采用对文本数据进行分词处理,统计出其中的Top5000高频词汇,使用Word2Vec对单词进行预训练,并将文本填充为统一的长度得到固定大小的向量化结果。其次,通过TextCNN和TextRNN模块分别提取文本数据的空间结构特征和序列信息特征。然后,使用张量外积的方式将捕获的特征结果构造成表征能力更强的高阶数据块,其中低阶主要表达文本数据的空间特征,而高阶主要表达序列信息。最后,使用soft-max分类器对特征融合结果进行分类,得到案件应属的专业管辖权识别结果。具体步骤如下:
步骤1、文本的向量化表示;
在自然语言处理领域中,首要解决的问题就是如何使计算机能够有效识别人类语言。计算机无法直接处理自然语言,想要完成文本数据分析和分类任务,最直接的想法是将文本编码成计算机能够直接处理的数字信息。本发明中首先采用结巴分词模块对文本数据进行分词处理;为了使语义更加明确,选择删除在文本中没有实际意义的停用词,这里采用的是百度停用词列表;然后统计文本中单词出现的频率,选出Top5000的高频词汇作为词汇表;进而利用Word2Vec完成预训练,将单词转化为词嵌入向量;最后利用预训练得到的词向量替换文本数据中的单词,并将文本数据填充为统一的长度,如此将可变长度的文本数据转换为固定大小的l*k维矩阵的输入文本,其中l表示文档中单词的数量,k表示预训练单词转化为向量后的维度。
步骤2、TextCNN模块提取文本数据的空间结构特征;
卷积神经网络(CNN)的局部感知野用作网络结构的输入,每一层通过卷积核得到输入数据的显著特征。其权值共享结构不仅可以减少权值的总数,而且可以降低模型的复杂性,避免过拟合。本发明中使用交替连接的卷积层和池化层对原始特征进行特征提取和数据降维,得到初始文本数据经过处理的特征图,即数据的空间结构特征提取结果。对于输入文本经过向量化处理之后得到的嵌入层E1,将数据表示为X∈Rl×k,其中l表示文档中单词的数量,k表示预训练单词转化为向量后的维度。卷积核的大小为w∈Rd×k,其中d代表该卷积核可以提取到的单词个数。每次操作都是对E1中的d个单词进行卷积运算,通过公式(1)得到对应的特征提取结果qj。
qj=f(w·xj:j+d+b) (1)
其中b代表偏置项,j代表卷积运算在数据X中的起始位置,f代表ReLU激活函数。本发明中共选择使用n个卷积核完成特征提取的任务,得到的特征提取结果如公式(2)所示。
Q=[q1,q2,...,qn] (2)
这里qi对应着第i个卷积核捕获的特征提取结果。在本发明中,将n个卷积核设置为相同大小,以学习互补性的特征。在每次卷积运算之后,使用最大池化运算来获得特征提取结果中的最大值,如此可以获得其中的显著特征,同时有效降低该模块的复杂度。
步骤3、TextRNN模块提取文本数据的序列信息特征;
循环神经网络(RNN)具有独特的方向环结构,使得它可以记住句子中的长距离依赖关系,进而使网络具有保留文本中主要语义信息的能力。LSTM是循环神经网络的一种变体,通过在RNN中添加门控单元用以控制数据的传输,LSTM能够有效解决RNN存在的长期依赖以及梯度消失或爆炸的问题。故本发明中在TextRNN模块中选择使用LSTM完成对文本数据序列信息特征的提取任务。在每个时刻t,LSTM通过吸收前一时刻的隐藏状态ht-1和单元状态ct-1以及当前时刻的输入xt,生成当前时刻的隐藏状态ht和单元状态ct。ct的计算过程如下:
ft=σ(Wf·[ht-1,xt]+bf) (3)
it=σ(Wi·[ht-1,xt]+bi) (4)
ht的计算过程如下:
ot=σ(Wo·[ht-1,xt]+bo) (7)
其中σ代表Sigmoid函数,·代表矩阵乘法,代表逐元素乘法。ft,it和ot分别代表遗忘门,输入门和输出门的输出结果。Wf,Wi和Wo分别代表遗忘门,输入门和输出门的权重,bf,bi和bo分别代表遗忘门,输入门和输出门的偏差。Wc和bc分别代表更新单元状态的权重和偏差。代表当前时刻单元状态的更新值。输出门的最后隐藏状态ht_last用作该模块的输出,作为文本数据的序列信息特征捕获结果。
步骤4、基于张量(Tensor)的特征融合;
对于TextCNN和TextRNN模块提取的特征结果,本发明中使用了张量外积方法进行融合,而不是以往大多数工作中的直接拼接的方式。通过张量外积的运算,构造出表征能力更强的高阶数据块,其中低阶主要表达文本数据的空间特征,而高阶主要表达序列信息。张量是矢量在高维空间中的扩展,N阶张量表示为其中N是张量的阶数,In是张量在第n阶的维数。对于一个N阶张量和一个M阶张量它们的外积产生一个(M+N)阶张量其中的元素定义为:
其中a和b分别是张量A和B中的元素。通过这种方式,本发明将TextCNN模块和TextRNN模块分别提取到的文本数据的空间结构特征Q和序列信息特征ht_last构造成高阶的数据块Xs作为文本数据的特征融合结果,并将其作为下一阶段soft-max分类函数的输入。
步骤5、soft-max分类,得到案件的专业管辖权结果;
本发明的最后一部分是完成对案件专业管辖权的识别,即对输入的文本数据进行分类,得到其应属的专业管辖权类别。本发明中将文本数据的特征融合结果Xs作为soft-max分类器层的输入,并输出一个r维的类别向量y,其中r和专业管辖权类别的数量相等,且y中每一个元素的数值范围为0-1。soft-max使用归一化指数函数估计类概率,计算过程如下式:
其中u代表专业管辖权所属的类别;K代表专业管辖权所属的类别集合;Wp和bp分别代表soft-max分类器层的权重和偏差。最终选择概率最大的类别标签作为该案件专业管辖权的识别结果。在模型的训练过程中,通过最小化正确标签的负似然对数,生成有关权重和偏置的最大似然。本发明使用反向传播算法进行训练,使用了TensorFlow中的梯度下降优化器。
验证结果:
本发明中使用的法律文本数据集由2068个案例材料组成,收集于裁判文书网。其中包括三种类型的专业管辖法院和普通法院,案件根据它们所属的专业法院进行分类。具体地,知识产权法院520件,互联网法院511件,铁路运输法院504件,普通法院533件。在实验中,随机选择80%的数据用于模型训练,另外20%的数据用于测试。数据集的详细信息如表1所示。
表1 数据集的基本信息
类别 | 样本数量 | 训练集数量 | 测试集数量 |
知识产权法院 | 520 | 416 | 104 |
互联网法院 | 511 | 408 | 103 |
铁路运输法院 | 504 | 403 | 101 |
普通法院 | 533 | 426 | 107 |
本发明的评价标准为精度(Precision),召回率(Recall),F1分数值(F1 score)和准确率(Accuracy)。
为了验证本发明的性能,选择业界流行的两个典型文本分类方法进行对比:基于卷积神经网络的文本分类方法(TextCNN),基于循环神经网络的文本分类方法(TextRNN)。此外,为了验证张量融合(Tensor)方法的有效性,增加对比实验,实验设置为在本发明的深度混合网络(Hybrid)保持不变的基础上对特征提取结果使用直接拼接(Stitching)的方式进行融合。
表2和表3分别显示了TextCNN方法和TextRNN方法在法律文本测试数据集上分类结果的混淆矩阵。表4显示了选择直接拼接方式对TextCNN和TextRNN模块捕获的特征进行融合的实验结果。表5显示了本发明方法的实验结果。表6显示了本发明方法和几种基准方法在每种评估指标上的平均结果。
表2 TextCNN方法在测试集上分类结果的混淆矩阵
表3 TextRNN方法在测试集上分类结果的混淆矩阵
表4 Hybrid+Stitching方法在测试集上分类结果的混淆矩阵
从实验结果可以看出,与典型方法TextCNN和TextRNN相比,本发明的深度混合网络(Hybrid)的性能在各种评估指标中均达到了最佳结果。这说明本发明设计的深度混合网络对于提取文本特征以提高分类效果更有效。在保持深度混合网络不变的情况下,本发明中还使用对特征提取结果进行以直接拼接的方式进行融合作为比较的基线。结果表明本发明采用的张量融合方法结果明显优于传统的拼接方法,说明本发明中构造的高阶数据块包含更多的信息,具有更强的特征表示能力。
表5 Hybrid+Tensor方法在测试集上分类结果的混淆矩阵
表6 基于不同方法的分类平均结果比较
方法 | Precision | Recall | F1 Score | Accuracy |
TextCNN | 93.41 | 91.50 | 91.51 | 91.50 |
TextRNN | 92.48 | 91.84 | 91.79 | 91.84 |
Hybrid+Stitching | 93.44 | 92.52 | 92.52 | 92.52 |
Hybrid+Tensor | 97.13 | 97.11 | 97.0 | 97.11 |
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (1)
1.一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法,其特征在于,包括以下步骤:
步骤1、文本的向量化表示;
采用结巴分词模块对文本数据进行分词处理,采用百度停用词列表删除在文本中没有实际意义的停用词,再统计文本中单词出现的频率,选出Top5000的高频词汇作为词汇表;利用Word2Vec完成预训练,将单词转化为词嵌入向量,利用预训练得到的词向量替换文本数据中的单词,并将文本数据填充为统一的长度,将可变长度的文本数据转换为固定大小的l*k维矩阵的输入文本,其中l表示文档中单词的数量,k表示预训练单词转化为向量后的维度;
步骤2、TextCNN模块提取文本数据的空间结构特征;
对于输入文本经过向量化处理之后得到的嵌入层E1,将数据表示为X∈Rl×k,其中l表示文档中单词的数量,k表示预训练单词转化为向量后的维度;卷积核的大小为w∈Rd×k,其中d代表该卷积核提取到的单词个数;每次操作都是对嵌入层E1中的d个单词进行卷积运算,通过公式(1)得到对应的特征提取结果qj;
qj=f(w·xj:j+d+b) (1)
其中,b代表偏置项,j代表卷积运算在数据X中的起始位置,f代表ReLU激活函数;共选择使用n个卷积核完成特征提取的任务,得到的特征提取结果如公式(2)所示;
Q=[q1,q2,...,qn] (2)
其中,qi对应着第i个卷积核捕获的特征提取结果;将n个卷积核设置为相同大小,学习互补性的特征;在每次卷积运算之后,使用最大池化运算获得特征提取结果中的最大值,获得其中的显著特征,降低该模块的复杂度;
步骤3、TextRNN模块提取文本数据的序列信息特征;
在每个时刻t,LSTM通过吸收前一时刻的隐藏状态ht-1和单元状态ct-1以及当前时刻的输入xt,生成当前时刻的隐藏状态ht和单元状态ct;ct的计算过程如下:
ft=σ(Wf·[ht-1,xt]+bf) (3)
it=σ(Wi·[ht-1,xt]+bi) (4)
ht的计算过程如下:
ot=σ(Wo·[ht-1,xt]+bo) (7)
其中,σ代表Sigmoid函数,·代表矩阵乘法,代表逐元素乘法;ft、it和ot分别代表遗忘门、输入门和输出门的输出结果;Wf、Wi和Wo分别代表遗忘门、输入门和输出门的权重;bf、bi和bo分别代表遗忘门、输入门和输出门的偏差;Wc和bc分别代表更新单元状态的权重和偏差;代表当前时刻单元状态的更新值;输出门最后时刻的隐藏状态ht_last用作该模块的输出,作为文本数据的序列信息特征捕获结果;
步骤4、基于张量的特征融合;
其中,a和b分别是张量A和B中的元素;采用张量外积的方式,将TextCNN模块和TextRNN模块分别提取到的文本数据的空间结构特征Q和序列信息特征ht_last构造成高阶的数据块Xs作为文本数据的特征融合结果,并将其作为下一阶段soft-max分类函数的输入;
步骤5、soft-max分类,得到案件的专业管辖权结果;
将文本数据的特征融合结果Xs作为soft-max分类器层的输入,并输出一个r维的类别向量y,其中r和专业管辖权类别的数量相等,且y中每一个元素的数值范围为0-1;
soft-max使用归一化指数函数估计类概率,计算过程如下式:
其中,u代表专业管辖权所属的类别;K代表专业管辖权所属的类别集合;Wp和bp分别代表soft-max分类器层的权重和偏差;
选择概率最大的类别标签作为该案件专业管辖权的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010654090.1A CN111859936B (zh) | 2020-07-09 | 2020-07-09 | 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010654090.1A CN111859936B (zh) | 2020-07-09 | 2020-07-09 | 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859936A true CN111859936A (zh) | 2020-10-30 |
CN111859936B CN111859936B (zh) | 2022-09-20 |
Family
ID=73152518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010654090.1A Active CN111859936B (zh) | 2020-07-09 | 2020-07-09 | 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859936B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328791A (zh) * | 2020-11-09 | 2021-02-05 | 济南大学 | 一种基于DiTextCNN的中文政务信息的文本分类方法 |
CN114491032A (zh) * | 2022-01-21 | 2022-05-13 | 淮阴工学院 | 一种基于LSTM-TextCNN算法的新闻文本分类方法和介质 |
CN114996461A (zh) * | 2022-07-18 | 2022-09-02 | 北京大学 | 医学不良事件文本分类方法、装置、电子设备及介质 |
CN118332455A (zh) * | 2024-06-13 | 2024-07-12 | 人民法院信息技术服务中心 | 一种管辖机构识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN110442720A (zh) * | 2019-08-09 | 2019-11-12 | 中国电子技术标准化研究院 | 一种基于lstm卷积神经网络的多标签文本分类方法 |
CN110717330A (zh) * | 2019-09-23 | 2020-01-21 | 哈尔滨工程大学 | 基于深度学习的词句级短文本分类方法 |
CN111209738A (zh) * | 2019-12-31 | 2020-05-29 | 浙江大学 | 一种联合文本分类的多任务命名实体识别方法 |
-
2020
- 2020-07-09 CN CN202010654090.1A patent/CN111859936B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN110442720A (zh) * | 2019-08-09 | 2019-11-12 | 中国电子技术标准化研究院 | 一种基于lstm卷积神经网络的多标签文本分类方法 |
CN110717330A (zh) * | 2019-09-23 | 2020-01-21 | 哈尔滨工程大学 | 基于深度学习的词句级短文本分类方法 |
CN111209738A (zh) * | 2019-12-31 | 2020-05-29 | 浙江大学 | 一种联合文本分类的多任务命名实体识别方法 |
Non-Patent Citations (2)
Title |
---|
姜炎宏等: "多标签文本分类模型对比研究", 《辽宁科技大学学报》 * |
张伟智等: "一种融合摘要与主体特征的混合神经网络文本主题分类方法", 《计算机与数字工程》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328791A (zh) * | 2020-11-09 | 2021-02-05 | 济南大学 | 一种基于DiTextCNN的中文政务信息的文本分类方法 |
CN114491032A (zh) * | 2022-01-21 | 2022-05-13 | 淮阴工学院 | 一种基于LSTM-TextCNN算法的新闻文本分类方法和介质 |
CN114996461A (zh) * | 2022-07-18 | 2022-09-02 | 北京大学 | 医学不良事件文本分类方法、装置、电子设备及介质 |
CN118332455A (zh) * | 2024-06-13 | 2024-07-12 | 人民法院信息技术服务中心 | 一种管辖机构识别方法及装置 |
CN118332455B (zh) * | 2024-06-13 | 2024-08-20 | 人民法院信息技术服务中心 | 一种管辖机构识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111859936B (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111859936B (zh) | 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 | |
CN112308158B (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
CN109271522B (zh) | 基于深度混合模型迁移学习的评论情感分类方法及系统 | |
CN108874782B (zh) | 一种层次注意力lstm和知识图谱的多轮对话管理方法 | |
Chen et al. | Research on text sentiment analysis based on CNNs and SVM | |
Dong et al. | Automatic age estimation based on deep learning algorithm | |
CN110046656B (zh) | 基于深度学习的多模态场景识别方法 | |
CN106649561B (zh) | 面向税务咨询业务的智能问答系统 | |
CN109934261B (zh) | 一种知识驱动参数传播模型及其少样本学习方法 | |
CN106919951B (zh) | 一种基于点击与视觉融合的弱监督双线性深度学习方法 | |
CN108830287A (zh) | 基于残差连接的Inception网络结合多层GRU的中文图像语义描述方法 | |
CN113378913B (zh) | 一种基于自监督学习的半监督节点分类方法 | |
CN110188195B (zh) | 一种基于深度学习的文本意图识别方法、装置及设备 | |
CN108038492A (zh) | 一种基于深度学习的感性词向量及情感分类方法 | |
CN104346440A (zh) | 一种基于神经网络的跨媒体哈希索引方法 | |
CN110175221B (zh) | 利用词向量结合机器学习的垃圾短信识别方法 | |
CN112925904B (zh) | 一种基于Tucker分解的轻量级文本分类方法 | |
CN113378938B (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
CN107818084A (zh) | 一种融合点评配图的情感分析方法 | |
CN113255366B (zh) | 一种基于异构图神经网络的方面级文本情感分析方法 | |
Parvathi et al. | Identifying relevant text from text document using deep learning | |
Rijal et al. | Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19. | |
CN111723649B (zh) | 一种基于语义分解的短视频事件检测方法 | |
CN113378962A (zh) | 一种基于图注意力网络的服装属性识别方法与系统 | |
Huang et al. | A Model for Legal Judgment Prediction Based on Multi-model Fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |