CN112712120A - 用于纠纷处置分类的分类器的训练方法 - Google Patents
用于纠纷处置分类的分类器的训练方法 Download PDFInfo
- Publication number
- CN112712120A CN112712120A CN202011608284.4A CN202011608284A CN112712120A CN 112712120 A CN112712120 A CN 112712120A CN 202011608284 A CN202011608284 A CN 202011608284A CN 112712120 A CN112712120 A CN 112712120A
- Authority
- CN
- China
- Prior art keywords
- dispute
- classification
- feature vectors
- major
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 title claims abstract description 66
- 239000013598 vector Substances 0.000 claims abstract description 292
- 230000014509 gene expression Effects 0.000 claims abstract description 44
- 230000003213 activating effect Effects 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 79
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/182—Alternative dispute resolution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其包括:获得纠纷数据集,其分为多个大类且每个大类包含用于表示大类指标的多个小类;将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;将该小类纠纷特征向量按照大类分组并融合以获得多个大类纠纷特征向量;将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;以该多个大类纠纷加权系数对该多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;将该纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值;以及,基于该分类损失函数值更新该分类器的参数。
Description
技术领域
本申请涉及人工智能技术领域,且更为具体地,涉及一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法、用于纠纷处置的处置单位分类方法、系统和电子设备。
背景技术
为了推进政法机关的纠纷处置职能,希望通过内部运行管理数字化和履行职能数字化来全面提升政法系统的数字治理能力和水平,其中,对于不同类型的纠纷,比如民转刑类纠纷、访源转事件类纠纷、法院诉讼类纠纷等,期望能够实现各类纠纷分类指派到不同基层网格进行处理,比如街道、社区、社会组织、基层法院、基层公安机关等。这样,可以让更多矛盾纠纷在萌芽阶段、在诉讼之外得到妥善化解,切实做到预防在先、发现在早、处置在小。
因此,期望能够根据纠纷的具体类型以及纠纷处置过程中所获得的相关数据,比如不同类型的纠纷的发生率、化解成功率等数据,来进行纠纷数据的合理分配,从而对于不同的纠纷能够分配最合理的单位进行处置。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在机器视觉、图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展,为纠纷处置的合理分配提供了新的解决思路和方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法、用于纠纷处置的处置单位分类方法、系统和电子设备,其将纠纷数据按照大类进行分类,再获得每个大类下的纠纷数据的小类指标数据,进而,通过一维卷积来获得用于表示小类纠纷数据内的关联特征的小类数据特征向量,然后将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,使得每个大类纠纷特征向量能够充分表达该大类内的所有小类的数据之间的隐含关联特征;继而通过将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,可以通过提取各个大类之间的关联特征来获得用于表示各个大类纠纷的特征在整体分类下的权重的数值表达,这样,再通过以多个大类纠纷加权系数对多个大类纠纷特征向量进行加权以获得纠纷分类特征向量,就可以使得纠纷分类特征向量能够充分地表达纠纷数据按照大类和小类划分后的不同层级的关联特征。因此,当将所述纠纷分类特征向量用作作为纠纷描述数据的案件文本的特征向量的标签数据来进行分类,可以提高分类器的分类的准确性。
根据本申请的一个方面,提供了一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其包括:
获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;
将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;
将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;
将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;
以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;
将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及
基于所述分类损失函数值更新所述分类器的参数。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量,包括:获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号;将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;以及,对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,包括:将所述小类纠纷特征向量按照大类进行分组;以及,将每个分组内的多个小类纠纷特征向量进行级联以获得多个大类纠纷特征向量。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,包括:计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;将所述多个平均值或者所述最大值构成为大类数值特征向量;以及,对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,所述大类和对应的小类包括:
民转刑类纠纷,包括案件发生数、化解成功率、民转刑率;
访源转事件类纠纷,包括事件发生数、化解成功率;
法院诉讼类纠纷,包括案件发生数、化解成功率;以及
协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率。
根据本申请的另一方面,提供了一种用于纠纷处置的处置单位分类方法,其包括:
获取待处置的纠纷数据,所述纠纷数据包含案件描述;
将所述案件描述转换为案件文本特征向量;
将所述案件文本特征向量输入如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
根据本申请的又一方面,提供了一种基于权重的特征表达的用于纠纷处置分类的分类器的训练系统,其包括:
纠纷数据集获取单元,用于获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;
小类纠纷特征向量生成单元,用于将所述纠纷数据集获取单元获得的每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;
大类纠纷特征向量生成单元,用于将所述小类纠纷特征向量生成单元获得的所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;
大类纠纷加权系数生成单元,用于将所述大类纠纷特征向量生成单元获得的所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;
纠纷分类特征向量生成单元,用于以所述大类纠纷加权系数生成单元获得的所述多个大类纠纷加权系数对所述大类纠纷特征向量生成单元获得的所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;
分类损失函数值计算单元,用于将所述纠纷分类特征向量生成单元获得的所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及
参数更新单元,用于基于所述分类损失函数值更新所述分类器的参数。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中,所述小类纠纷特征向量生成单元,包括:纠纷数据指标获取子单元,用于获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号;四元特征向量生成子单元,用于将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;以及,一维卷积处理子单元,用于对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中,所述大类纠纷特征向量生成单元,包括:分组子单元,用于将所述小类纠纷特征向量按照大类进行分组;以及,级联子单元,用于将每个分组内的多个小类纠纷特征向量进行级联以获得多个大类纠纷特征向量。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中,所述大类纠纷加权系数生成单元,包括:数值计算子单元,用于计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;大类数值特征向量生成子单元,用于将所述多个平均值或者所述最大值构成为大类数值特征向量;以及,一维卷积激活子单元,用于对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。
在上述基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中,所述大类和对应的小类包括:
民转刑类纠纷,包括案件发生数、化解成功率、民转刑率;
访源转事件类纠纷,包括事件发生数、化解成功率;
法院诉讼类纠纷,包括案件发生数、化解成功率;以及
协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率。
根据本申请的又一方面,提供了一种用于纠纷处置的处置单位分类系统,其包括:
待处理纠纷数据获取单元,用于获取待处置的纠纷数据,所述纠纷数据包含案件描述;
案件文本特征向量生成单元,用于将所述待处理纠纷数据获取单元获得的所述案件描述转换为案件文本特征向量;以及
分类单元,用于将所述案件文本特征向量生成单元获得的所述案件文本特征向量输入如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,或者,用于纠纷处置的处置单位分类方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,或者,用于纠纷处置的处置单位分类方法。
本申请提供的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法、用于纠纷处置的处置单位分类方法、系统和电子设备,其将纠纷数据按照大类进行分类,再获得每个大类下的纠纷数据的小类指标数据,进而,通过一维卷积来获得用于表示小类纠纷数据内的关联特征的小类数据特征向量,然后将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,使得每个大类纠纷特征向量能够充分表达该大类内的所有小类的数据之间的隐含关联特征;继而通过将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,可以通过提取各个大类之间的关联特征来获得用于表示各个大类纠纷的特征在整体分类下的权重的数值表达,这样,再通过以多个大类纠纷加权系数对多个大类纠纷特征向量进行加权以获得纠纷分类特征向量,就可以使得纠纷分类特征向量能够充分地表达纠纷数据按照大类和小类划分后的不同层级的关联特征。因此,当将所述纠纷分类特征向量用作作为纠纷描述数据的案件文本的特征向量的标签数据来进行分类,可以提高分类器的分类的准确性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法的流程图。
图2图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法的架构示意图。
图3图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量的流程图。
图4图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数的流程图。
图5图示了根据本申请实施例的用于纠纷处置的处置单位分类方法的流程图。
图6图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统的框图。
图7图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中小类纠纷特征向量生成单元的框图。
图8图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中大类纠纷特征向量生成单元的框图。
图9图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统中大类纠纷加权系数生成单元的框图。
图10图示了根据本申请实施例的用于纠纷处置的处置单位分类系统的框图。
图11图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如前所述,为了推进政法机关的纠纷处置职能和通过内部运行管理数字化和履行职能数字化来全面提升政法系统的数字治理能力和水平,期望能够根据纠纷的具体类型以及纠纷处置过程中所获得的相关数据,比如不同类型的纠纷的发生率、化解成功率等数据,来进行纠纷数据的合理分配,从而对于不同的纠纷能够分配最合理的单位进行处置。
近年来,深度学习以及神经网络的发展,为纠纷处置的合理分配提供了新的解决思路和方案。
经研发,本申请发明人意识到纠纷处理的合理分配问题本质上是一个基于数据的分类问题。但是,如果仅依赖于深度神经网络对原始数据进行分类,由于原始数据无法反映出纠纷的具体类型以及其更细节的指标数据,使得深度神经网络无法有效地提取出用于具体分类的类型,即,在本申请中基于处置单位分类的有效特征,从而影响分类结果。
因此,在本申请的技术方案中,首先将纠纷数据按照大类进行分类,例如,将纠纷数据划分为民转刑类、访源转事件类、法院诉讼类、街道或者社区调解类、公安机关调解类等,然后再获得每个大类下的纠纷数据的小类指标数据,比如发生数、化解成功率等。并且,本申请的申请人发现,在基于小类指标进行分类之后,每个小类内的多项纠纷数据基本上可以以数值形式来进行表示,这虽然在一方面便于使用数学模型来进行计算,但是数值之间的隐含关联会比文本、图像等其它形式要更加难以挖掘。
因此,在本申请的技术方案中,首先通过一维卷积来获得用于表示小类纠纷数据内的关联特征的小类数据特征向量,然后将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,使得每个大类纠纷特征向量能够充分表达该大类内的所有小类的数据之间的隐含关联特征。然后,通过将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,可以通过提取各个大类之间的关联特征来获得用于表示各个大类纠纷的特征在整体分类下的权重的数值表达,这样,再通过以多个大类纠纷加权系数对多个大类纠纷特征向量进行加权以获得纠纷分类特征向量,就可以使得纠纷分类特征向量能够充分地表达纠纷数据按照大类和小类划分后的不同层级的关联特征。
因此,当将所述纠纷分类特征向量用作作为纠纷描述数据的案件文本的特征向量的标签数据来进行分类,可以提高分类的准确性。
基于此,本申请提出了一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其包括:获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及,基于所述分类损失函数值更新所述分类器的参数。
进一步地,本申请提供了一种用于纠纷处置的处置单位分类方法,其包括:获取待处置的纠纷数据,所述纠纷数据包含案件描述;将所述案件描述转换为案件文本特征向量;以及,将所述案件文本特征向量输入如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法的流程图。如图1所示,根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,包括:S110,获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;S120,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;S130,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;S140,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;S150,以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;S160,将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及,S170,基于所述分类损失函数值更新所述分类器的参数。
图2图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法的架构示意图。如图2所示,在所述训练方法的网络架构中,首先,对基于每个小类的多项纠纷数据转换的特征向量(例如,如图2中所示意的V0)以卷积层(例如,如图2中所示意的Cl1)进行一维卷积以获得小类纠纷特征向量(例如,如图2中所示意的Vs);接着,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量(例如,如图2中所示意的Vl);然后,将所述多个大类纠纷特征向量以卷积层(例如,如图2中所示意的Cl2)进行一维卷积并以Sigmoid函数(例如,如图2中所示意的圈S)激活以获得多个大类纠纷加权系数;接着,以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量(例如,如图2中所示意的Vj);然后,将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络(例如,如图2中所示意的DN)和预定分类函数(例如,如图2中所示意的圈S),且所述预定分类函数以所述处置单位为标签;接着,基于所述分类损失函数值更新所述分类器的参数。
在步骤S110中,获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据。也就是,在本申请实施例中,将纠纷数据按照大类和小类进行规整。
这里,在本申请实施例中,所述大类包括民转刑类纠纷、访源转事件类纠纷、法院诉讼类纠纷和协同办案类纠纷,其分别对应的小类为:所述民转刑类纠纷,包括案件发生数、化解成功率、民转刑率;所述访源转事件类纠纷,包括事件发生数、化解成功率;所述法院诉讼类纠纷,包括案件发生数、化解成功率;所述协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率。
当然,应可以理解,在本申请实施例中,用于规整纠纷数据的大类和小类可基于实际情况作出调整,对此,并不为本申请所局限。
在步骤S120中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量。应可以理解,在每个大类下的纠纷数据都有小类指标数据,比如,发生数、成功率等。因此,在基于小类指标进行分类之后,每个小类内的多项纠纷数据基本上可以以数值形式来进行表示,这虽然在一方面便于使用数学模型来进行计算,但是数值之间的隐含关联会比文本、图像等其它形式要更加难以挖掘。
相应地,在本申请实施例中,通过一维卷积来获得用于表示小类纠纷数据内的关联特征的小类数据特征向量。具体地,在本申请实施例中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量的过程,包括:首先,获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号,比如,大类编号,民转刑类纠纷,编号01,小类编号,化解成功率,编号02,小类数值,化解成功率,50%,处置单位编号,基层法院,编号05。这样,这样将每个数据以数值进行表示。
然后,将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;应可以理解,可以统一数值规范,便于计算。接着,对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
也就是,在本申请实施例中,将每个纠纷数据以数值进行表示,并对数组进行一维卷积,可以充分挖掘各项数据代表的数值之间的关联关系,从而充分地提取出能够体现出纠纷的大类、小类、数值和处置单位的特征表达。
图3图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量的流程图。如图3所示,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量,包括:S210,获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号;S220,将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;以及,S230,对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
在步骤S130中,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量。也就是,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,使得每个大类纠纷特征向量能够充分表达该大类内的所有小类的数据之间的隐含关联特征。
具体地,在本申请实施例中,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量的过程,包括:首先,将所述小类纠纷特征向量按照大类进行分组,这里的大类包括如前所述的所述协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率;接着,将每个分组内的多个小类纠纷特征向量进行级联以获得多个大类纠纷特征向量。
应可以理解,将特征进行级联可以不损失特征表达,从而利用提取出来的特征。并且,通过级联即可以学习到标签向量和数据向量的各个位之前的关联,也可以学习到标签向量自己的各个位以及数据向量自己的各个位之间的关联,并且,所有这些学习到的关联都可以在一个统一的全域下面。
在步骤S140中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。应可以理解,通过将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,可以通过提取各个大类之间的关联特征来获得用于表示各个大类纠纷的特征在整体分类下的权重的数值表达。
具体地,在本申请实施例中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数的过程,包括:首先计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;然后,将所述多个平均值或者所述最大值构成为大类数值特征向量;接着,对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。
特别地,因为该大类纠纷加权系数是用于通过一维卷积来学习小类数据对于大类数据的权重表达,相当于以大类数据的整体来看,是学习大类数据中的部分,即各个小类数据的局部特征相对于大类数据的整体特征的贡献的特征表达,因此,可以将各个小类数据作为一个整体来计算其局部特征。并且,该局部特征基于特征属性,可以考虑平均值或者最大值,例如,用于表示发生率的数值可以考虑其平均值属性,而用于表示化解成功率的数值可以考虑其最大值属性。
图4图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数的流程图。如图4所示,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,包括:S310,计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;S320,将所述多个平均值或者所述最大值构成为大类数值特征向量;以及,S330,对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数
在步骤S150中,以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量。这样,就可以使得纠纷分类特征向量能够充分地表达纠纷数据按照大类和小类划分后的不同层级的关联特征。
在步骤S160中,将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签。
应可以理解,当将所述纠纷分类特征向量用作作为纠纷描述数据的案件文本的特征向量的标签数据来进行分类,可以提高所述分类器的分类的准确性。
值得一提的是,在所述分类器中,所述预定分类函数可以为Softmax分类函数,其中,所述预定分类函数以所述处置单位为标签,所述处置单位包括:街道、社区、社会组织、基层法院、基层公安机关等。
综上,基于本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法被阐明,其将纠纷数据按照大类进行分类,再获得每个大类下的纠纷数据的小类指标数据,进而,通过一维卷积来获得用于表示小类纠纷数据内的关联特征的小类数据特征向量,然后将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,使得每个大类纠纷特征向量能够充分表达该大类内的所有小类的数据之间的隐含关联特征;继而通过将该多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,可以通过提取各个大类之间的关联特征来获得用于表示各个大类纠纷的特征在整体分类下的权重的数值表达,这样,再通过以多个大类纠纷加权系数对多个大类纠纷特征向量进行加权以获得纠纷分类特征向量,就可以使得纠纷分类特征向量能够充分地表达纠纷数据按照大类和小类划分后的不同层级的关联特征。因此,当将所述纠纷分类特征向量用作作为纠纷描述数据的案件文本的特征向量的标签数据来进行分类,可以提高分类器的分类的准确性。
进一步地,在通过如上所述的如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器后,可通过所述分类器对待处置的纠纷数据进行处置单位的分类。
图5图示了根据本申请实施例的用于纠纷处置的处置单位分类方法的流程图。如图5所示,根据本申请实施例的用于纠纷处置的处置单位分类方法,包括:S410,获取待处置的纠纷数据,所述纠纷数据包含案件描述;S420,将所述案件描述转换为案件文本特征向量;以及,S430,将所述案件文本特征向量输入如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
值得一提的是,在对所述待处理的纠纷数据进行分类时,可提取所述待处理的纠纷数据中的部分数据作为标签,例如,从所述待处置纠纷数据中提取大类标号作为标签,然后与所述案件文本特征一起进行分类,这样,可降低分类难度提高分类效率和精度。
示例性系统
图6图示了根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统的框图。
如图6所示,根据本申请实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练系统 600,包括:纠纷数据集获取单元 610,用于获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;小类纠纷特征向量生成单元 620,用于将所述纠纷数据集获取单元 610获得的每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;大类纠纷特征向量生成单元 630,用于将所述小类纠纷特征向量生成单元620获得的所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;大类纠纷加权系数生成单元 640,用于将所述大类纠纷特征向量生成单元 630获得的所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;纠纷分类特征向量生成单元 650,用于以所述大类纠纷加权系数生成单元 640获得的所述多个大类纠纷加权系数对所述大类纠纷特征向量生成单元 630获得的所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;分类损失函数值计算单元 660,用于将所述纠纷分类特征向量生成单元 650获得的所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及,参数更新单元 670,用于基于所述分类损失函数值更新所述分类器的参数。
在一个示例中,在上述训练系统 600中,如图7所示,所述小类纠纷特征向量生成单元 620,包括:纠纷数据指标获取子单元 621,用于获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号;四元特征向量生成子单元 622,用于将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;以及,一维卷积处理子单元 623,用于对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
在一个示例中,在上述训练系统 600中,如图8所示,所述大类纠纷特征向量生成单元 630,包括:分组子单元 631,用于将所述小类纠纷特征向量按照大类进行分组;以及,级联子单元 632,用于将每个分组内的多个小类纠纷特征向量进行级联以获得多个大类纠纷特征向量。
在一个示例中,在上述训练系统 600中,如图9所示,所述大类纠纷加权系数生成单元 640,包括:数值计算子单元 641,用于计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;大类数值特征向量生成子单元 642,用于将所述多个平均值或者所述最大值构成为大类数值特征向量;以及,一维卷积激活子单元 643,用于对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。
在一个示例中,在上述训练系统 600中,所述大类和对应的小类包括:
民转刑类纠纷,包括案件发生数、化解成功率、民转刑率;
访源转事件类纠纷,包括事件发生数、化解成功率;
法院诉讼类纠纷,包括案件发生数、化解成功率;以及
协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率。
这里,本领域技术人员可以理解,上述训练系统 600中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的训练系统 600可以实现在各种终端设备中,例如纠纷数据处置单位分类的服务器等。在一个示例中,根据本申请实施例的训练系统 600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该训练系统 600可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该训练系统 600同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该训练系统 600与该终端设备也可以是分立的设备,并且该训练系统 600可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
根据本申请的另一方面,还提供了一种用于纠纷处置的处置单位分类系统。
图10图示了根据本申请实施例的用于纠纷处置的处置单位分类系统的框图。如图10所示,根据本申请实施例的用于纠纷处置的处置单位分类系统 700,包括:待处理纠纷数据获取单元,用于获取待处置的纠纷数据,所述纠纷数据包含案件描述;案件文本特征向量生成单元,用于将所述待处理纠纷数据获取单元获得的所述案件描述转换为案件文本特征向量;以及,分类单元,用于将所述案件文本特征向量生成单元获得的所述案件文本特征向量输入如上所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
这里,本领域技术人员可以理解,上述分类系统 700中的各个单元和模块的具体功能和操作已经在上面参考图5的用于纠纷处置的处置单位分类方法描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的分类系统 700可以实现在各种终端设备中,例如纠纷数据处置单位分类的服务器等。在一个示例中,根据本申请实施例的分类系统 700可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该分类系统 700可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该分类系统 700同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该分类系统 700与该终端设备也可以是分立的设备,并且该分类系统 700可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图11来描述根据本申请实施例的电子设备。
图11图示了根据本申请实施例的电子设备的框图。
如图11所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练,或者,用于纠纷处置的处置单位分类方法的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如纠纷数据等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图11中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练,或者,用于纠纷处置的处置单位分类方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于权重的特征表达的用于纠纷处置分类的分类器的训练,或者,用于纠纷处置的处置单位分类方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (9)
1.一种基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其特征在于,包括:
获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;
将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;
将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;
将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;
以所述多个大类纠纷加权系数对所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;
将所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及
基于所述分类损失函数值更新所述分类器的参数。
2.根据权利要求1所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其中,将每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量,包括:
获取每项纠纷数据所对应的大类编号、小类编号、小类数值和处置单位编号;
将所述大类编号、小类编号、小类数值和处置单位编号进行以归一化以获得四元数组形式的特征向量;以及
对所述特征向量并进行一维卷积以获得小类纠纷特征向量。
3.根据权利要求1所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其中,将所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量,包括:
将所述小类纠纷特征向量按照大类进行分组;以及
将每个分组内的多个小类纠纷特征向量进行级联以获得多个大类纠纷特征向量。
4.根据权利要求1所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其中,将所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数,包括:
计算所述多个大类纠纷特征向量中的每个大类纠纷特征向量的平均值或者最大值;
将所述多个平均值或者所述最大值构成为大类数值特征向量;以及
对所述大类数值特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数。
5.根据权利要求1至4任意一项所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法,其中,所述大类和对应的小类包括:
民转刑类纠纷,包括案件发生数、化解成功率、民转刑率;
访源转事件类纠纷,包括事件发生数、化解成功率;
法院诉讼类纠纷,包括案件发生数、化解成功率;以及
协同办案类纠纷,包括流转案件总量、电子换押次数、双轨流转案件量、单轨流转案件量、逮捕协同率。
6.一种用于纠纷处置的处置单位分类方法,其特征在于,包括:
获取待处置的纠纷数据,所述纠纷数据包含案件描述;
将所述案件描述转换为案件文本特征向量;
将所述案件文本特征向量输入如权利要求1到5中任意一项所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
7.一种基于权重的特征表达的用于纠纷处置分类的分类器的训练系统,其特征在于,包括:
纠纷数据集获取单元,用于获得纠纷数据集,所述纠纷数据集分为多个大类,且每个大类包含用于表示大类指标的多个小类,且每个小类包含基于处置单位的多项纠纷数据;
小类纠纷特征向量生成单元,用于将所述纠纷数据集获取单元获得的每个小类的多项纠纷数据转换为特征向量并进行一维卷积以获得小类纠纷特征向量;
大类纠纷特征向量生成单元,用于将所述小类纠纷特征向量生成单元获得的所述小类纠纷特征向量按照大类进行分组并融合以获得多个大类纠纷特征向量;
大类纠纷加权系数生成单元,用于将所述大类纠纷特征向量生成单元获得的所述多个大类纠纷特征向量进行一维卷积并以Sigmoid函数激活以获得多个大类纠纷加权系数;
纠纷分类特征向量生成单元,用于以所述大类纠纷加权系数生成单元获得的所述多个大类纠纷加权系数对所述大类纠纷特征向量生成单元获得的所述多个大类纠纷特征向量进行加权以获得纠纷分类特征向量;
分类损失函数值计算单元,用于将所述纠纷分类特征向量生成单元获得的所述纠纷分类特征向量作为对应的案件文本特征向量的标签数据通过分类器进行分类以获得分类损失函数值,所述分类器包含深度神经网络和预定分类函数,且所述预定分类函数以所述处置单位为标签;以及
参数更新单元,用于基于所述分类损失函数值更新所述分类器的参数。
8.一种用于纠纷处置的处置单位分类系统,其特征在于,包括:
待处理纠纷数据获取单元,用于获取待处置的纠纷数据,所述纠纷数据包含案件描述;
案件文本特征向量生成单元,用于将所述待处理纠纷数据获取单元获得的所述案件描述转换为案件文本特征向量;以及
分类单元,用于将所述案件文本特征向量生成单元获得的所述案件文本特征向量输入如权利要求1到5中任意一项所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练方法训练出的分类器以获得分类结果,所述分类结果用于表示所述待处置的纠纷数据的处置单位。
9.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-6中任一项所述的基于权重的特征表达的用于纠纷处置分类的分类器的训练,或者,如权利要求7所述的用于纠纷处置的处置单位分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011608284.4A CN112712120A (zh) | 2020-12-30 | 2020-12-30 | 用于纠纷处置分类的分类器的训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011608284.4A CN112712120A (zh) | 2020-12-30 | 2020-12-30 | 用于纠纷处置分类的分类器的训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112712120A true CN112712120A (zh) | 2021-04-27 |
Family
ID=75547174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011608284.4A Pending CN112712120A (zh) | 2020-12-30 | 2020-12-30 | 用于纠纷处置分类的分类器的训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712120A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837144A (zh) * | 2021-10-25 | 2021-12-24 | 广州微林软件有限公司 | 一种冰箱的智能化图像数据采集处理方法 |
-
2020
- 2020-12-30 CN CN202011608284.4A patent/CN112712120A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837144A (zh) * | 2021-10-25 | 2021-12-24 | 广州微林软件有限公司 | 一种冰箱的智能化图像数据采集处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113822494B (zh) | 风险预测方法、装置、设备及存储介质 | |
Varma et al. | Snuba: Automating weak supervision to label training data | |
Onoe et al. | Learning to denoise distantly-labeled data for entity typing | |
Qian et al. | Deep learning for steganalysis via convolutional neural networks | |
Wu et al. | Tagging like humans: Diverse and distinct image annotation | |
US10956673B1 (en) | Method and system for identifying citations within regulatory content | |
CN109284371B (zh) | 反欺诈方法、电子装置及计算机可读存储介质 | |
CN115796173B (zh) | 针对监管报送需求的数据处理方法和系统 | |
CN110580292A (zh) | 一种文本标签生成方法、装置和计算机可读存储介质 | |
US11481734B2 (en) | Machine learning model for predicting litigation risk on construction and engineering projects | |
CN117251699B (zh) | 基于人工智能的医疗大数据分析方法及系统 | |
Mattioli et al. | An experiment on the use of genetic algorithms for topology selection in deep learning | |
JP7005045B2 (ja) | ナイーブベイズ分類器に対する限界攻撃方法 | |
CN116247824B (zh) | 电力设备的控制方法及其系统 | |
CN112651466A (zh) | 土壤重金属污染的微生物种类选择的神经网络训练方法 | |
Agarwal et al. | Sentiment Analysis in Stock Price Prediction: A Comparative Study of Algorithms | |
CN114372475A (zh) | 一种基于RoBERTa模型的网络舆情情感分析方法及系统 | |
Farazi et al. | Reciprocal attention fusion for visual question answering | |
CN114398557A (zh) | 基于双画像的信息推荐方法、装置、电子设备及存储介质 | |
Pang | Machine learning for high energy heavy ion collisions | |
CN115905528A (zh) | 具有时序特征的事件多标签分类方法、装置及电子设备 | |
Enamoto et al. | Multi-label legal text classification with BiLSTM and attention | |
CN112712120A (zh) | 用于纠纷处置分类的分类器的训练方法 | |
He et al. | Multilabel classification by exploiting data‐driven pair‐wise label dependence | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240105 Address after: Room 408-8, 4th Floor, Building 2, Haichuang Technology Center, Cangqian Street, Yuhang District, Hangzhou City, Zhejiang Province, 313000 Applicant after: HANGZHOU ZHUILIE TECHNOLOGY Co.,Ltd. Address before: Unit 02, 16 / F, block 2, Zhonghai Junda Plaza, Guizhou Avenue, Zhenhua community, Ronggui street, Shunde District, Foshan City, Guangdong Province Applicant before: Foshan shiai Network Technology Co.,Ltd. |