CN115034183A - 一种辅助行政处罚决定的方法及计算机可读存储介质 - Google Patents
一种辅助行政处罚决定的方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115034183A CN115034183A CN202210551765.9A CN202210551765A CN115034183A CN 115034183 A CN115034183 A CN 115034183A CN 202210551765 A CN202210551765 A CN 202210551765A CN 115034183 A CN115034183 A CN 115034183A
- Authority
- CN
- China
- Prior art keywords
- data
- word
- administrative
- phrase
- assisting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 61
- 230000011218 segmentation Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000008030 elimination Effects 0.000 claims abstract description 9
- 238000003379 elimination reaction Methods 0.000 claims abstract description 9
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 55
- 230000006399 behavior Effects 0.000 claims description 21
- 238000002372 labelling Methods 0.000 claims description 4
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000455 protein structure prediction Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种辅助行政处罚决定的方法及计算机可读存储介质,属于数据挖掘的技术领域,解决了现有技术在案由认定与处罚决定中存在决策困难、精准度低的问题。一种辅助行政处罚决定的方法,包括:接收行政执法文书数据;对行政执法文书数据进行数据清洗,得到包含违法行为类型、违法事实和处罚类别的基本字段数据;对基本字段数据进行分词处理及停止词消除,得到有效字段数据;对有效字段数据中的处罚类别进行标签化处理,生成每个案件的标签;将有效字段数据中的违法行为类型和违法事实进行拼接,得到包含违法行为类型和违法事实的词组数据;将词组数据输入到word2vec模型,生成词组数据对应的词向量。
Description
技术领域
本发明涉及数据挖掘技术领域,尤其是涉及一种辅助行政处罚决定的方法及计算机可读存储介质。
背景技术
图表示学习已经被广泛应用与现实世界的网络中,如社交网络推荐、蛋白质结构预测、电商推荐等。
目前主要借助自然语言处理的方式进行行政法律文书的案由认定与处罚决定,行政执法文书中信息要素的表征方式多、案由认定和处罚决定难以决策,并且既往类似案例推荐方法存在准确度低和缺乏可解释等问题。
因此,现有技术在案由认定与处罚决定中存在决策困难、精准度低的问题。
发明内容
本发明的目的在于提供一种辅助行政处罚决定的方法及计算机可读存储介质,以缓解现有技术在案由认定与处罚决定中存在决策困难、精准度低的问题技术问题。
第一方面,本发明提供一种辅助行政处罚决定的方法,包括:
接收行政执法文书数据;
对行政执法文书数据进行数据清洗,得到包含违法行为类型、违法事实和处罚类别的基本字段数据;
对基本字段数据进行分词处理及停止词消除,得到有效字段数据;
对有效字段数据中的处罚类别进行标签化处理,生成每个案件的标签;
将有效字段数据中的违法行为类型和违法事实进行拼接,得到包含违法行为类型和违法事实的词组数据;
将词组数据输入到word2vec模型,生成词组数据对应的词向量;
基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵;
基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型;
基于每个案件的标签,计算辅助行政处罚决定模型的准确率。
进一步的,所述基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵的步骤,包括:
根据词组数据,生成网络节点;
根据词组数据对应的词向量,生成网络节点的属性向量,得到属性矩阵;
根据词向量之间的关联度,生成网络节点连边结果,得到邻接矩阵;
基于网络节点、网络节点的属性向量和网络节点连边结果,构建网络。
进一步的,所述根据词向量之间的关联度,生成网络节点连边结果,得到邻接矩阵的步骤,包括:
利用关联度算式计算词向量之间的关联度,得到词向量之间的关联度数值;
根据词向量之间的关联度数值,生成网络节点连边结果;
根据网络节点连边结果,得到邻接矩阵。
进一步的,所述关联度算式为:
其中,#W(i)为所有词组数据中含有词组i的窗口的数量,#W(j)为所有词组数据中含有词组j的窗口的数量,#W(i,j)为所有词组数据中同时含有词组i和词组j的窗口的数量,#W为所有窗口的总数量。
进一步的,所述根据词向量之间的关联度数值,生成网络节点连边结果的步骤,包括:
判断词向量之间的关联度数值是否大于0;
若是,则生成网络节点之间有连边的结果;
若否,则生成网络节点之间无连边的结果。
进一步的,所述对基本字段数据进行分词处理及停止词消除,得到有效字段数据的步骤包括:
利用jieba分词对基本字段数据进行分词处理,得到分词后数据;
利用哈工大停用词表对分词后数据进行停用词删除,得到有效字段数据。
进一步的,,所述标签为label向量标签。
进一步的,所述GCN模型数量为2;所述readout层数量为1。
进一步的,所述基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型的步骤,包括:
将邻接矩阵和属性矩阵输入到GCN模型中,得到节点的嵌入表示;
根据节点的嵌入表示,利用readout层计算节点的嵌入表示平均值;
根据节点的嵌入表示和节点的嵌入表示平均值,得到辅助行政处罚决定模型。
第二方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行第一方面提供的方法。
本发明提供一种辅助行政处罚决定的方法,包括:接收行政执法文书数据;对行政执法文书数据进行数据清洗,得到包含违法行为类型、违法事实和处罚类别的基本字段数据;对基本字段数据进行分词处理及停止词消除,得到有效字段数据;对有效字段数据中的处罚类别进行标签化处理,生成每个案件的标签;将有效字段数据中的违法行为类型和违法事实进行拼接,得到包含违法行为类型和违法事实的词组数据;将词组数据输入到word2vec模型,生成词组数据对应的词向量;基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵;基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型;基于每个案件的标签,计算辅助行政处罚决定模型的准确率。
采用本发明提供的辅助行政处罚决定的方法,利用行政执法文书数据,首先对其进行数据清洗、分词处理及停止词消除等步骤,得到包括违法行为类型、违法事实和处罚类别的有效字段数据,根据处罚类别生成每个案件的标签,将有效字段数据中的违法行为类型和违法事实进行拼接,得到词组数据,利用word2vec模型生成词组数据对应的词向量,基于词组数据和词向量构建网络并得到邻接矩阵和属性矩阵,利用GCN模型和readout层对邻接矩阵和属性矩阵进行学习,得到辅助行政处罚决定模型,根据每个案件的标签可计算辅助行政处罚决定模型的准确率,根据可验证模型的实用性,可根据准确率调整训练方法,使得辅助行政处罚决定模型的实用性更强。通过将每个行政执法文书实例构建为一个网络,网络的节点为行政执法文书中的词组,将词组的词向量作为对应节点的属性向量。通过GCN模型即图卷积神经网络进行行政执法文书的嵌入生成,最后完成基于图挖掘的辅助行政处罚决定模型。通过大量行政执法文书作为本方法的数据集,可以使得本方法的模型更具有鲁棒性,能够根据违法行为类型进行行政判罚,具有更高的准群率与合理性。应用范围广泛,扩展性强,能够适用于不同场景,并对相关行政处罚的判决提供依据,从而解决了现有技术中信息要素的表征方式多、案由认定与处罚决定的决策困难、精准度低的问题。
相应地,本发明提供的计算机可读存储介质也同样具有上述技术效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的辅助行政处罚决定的方法流程图;
图2为本发明实施例中辅助行政处罚决定模型的准确率判断结果。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
目前主要借助自然语言处理的方式进行行政法律文书的案由认定与处罚决定,行政执法文书中信息要素的表征方式多、案由认定和处罚决定难以决策,并且既往类似案例推荐方法存在准确度低和缺乏可解释等问题。
因此,现有技术在案由认定与处罚决定中存在决策困难、精准度低的问题。
为解决以上问题,本发明实施例提供一种辅助行政处罚决定的方法。
如图1所示,本发明实施例提供一种辅助行政处罚决定的方法,包括:
S1:接收行政执法文书数据。
S2:对行政执法文书数据进行数据清洗,得到包含违法行为类型、违法事实和处罚类别的基本字段数据。
保留每条行政执法文书的违法行为类型、违法事实、处罚类别作为其基本字段。
S3:对基本字段数据进行分词处理及停止词消除,得到有效字段数据。
对包含违法行为类型、违法事实、处罚类别的基本字段数据利用jieba分词对数据进行分词,使用停用词表对主句中的停用词进行删除,最大化保留有效词汇。
S4:对有效字段数据中的处罚类别进行标签化处理,生成每个案件的标签。
在“处罚类别”字段中,每个类别由分号进行分割。首先统计全部行政执法文书的处罚类别并进行数字标注;然后对每个行政执法文书的处罚类别生成one-hot向量,将该行政文书涉及到的处罚类别对应的位置设置为1,例如(0;0;0;1;0;0)表示六种处罚类别中的第四种。
S5:将有效字段数据中的违法行为类型和违法事实进行拼接,得到包含违法行为类型和违法事实的词组数据。
得到的包含违法行为类型和违法事实的词组数据用于构建网络节点。
S6:将词组数据输入到word2vec模型,生成词组数据对应的词向量。
生成词组数据对应的词向量,将词向量作为网络节点的属性向量。
S7:基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵。
邻接矩阵和属性矩阵作为GCN模型的训练样本。
S8:基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型。
S9:基于每个案件的标签,计算辅助行政处罚决定模型的准确率。
准确率用来预测正确的占总的比重,其公式如下:
其中,TP为被模型预测为正类的正样本;TN为被模型预测为负类的负样本;FP为被模型预测为正类的负样本;FN为被模型预测为负类的正样本。辅助行政处罚决定模型的准确率判断结果如图2所示,图中横轴为训练率,纵轴为准确率。
采用本发明实施例提供的辅助行政处罚决定的方法,利用行政执法文书数据,首先对其进行数据清洗、分词处理及停止词消除等步骤,得到包括违法行为类型、违法事实和处罚类别的有效字段数据,根据处罚类别生成每个案件的标签,将有效字段数据中的违法行为类型和违法事实进行拼接,得到词组数据,利用word2vec模型生成词组数据对应的词向量,基于词组数据和词向量构建网络并得到邻接矩阵和属性矩阵,利用GCN模型和readout层对邻接矩阵和属性矩阵进行学习,得到辅助行政处罚决定模型,根据每个案件的标签可计算辅助行政处罚决定模型的准确率,根据可验证模型的实用性,可根据准确率调整训练方法,使得辅助行政处罚决定模型的实用性更强。通过将每个行政执法文书实例构建为一个网络,网络的节点为行政执法文书中的词组,将词组的词向量作为对应节点的属性向量。通过GCN模型即图卷积神经网络进行行政执法文书的嵌入生成,最后完成基于图挖掘的辅助行政处罚决定模型。通过大量行政执法文书作为本方法的数据集,可以使得本方法的模型更具有鲁棒性,能够根据违法行为类型进行行政判罚,具有更高的准群率与合理性。应用范围广泛,扩展性强,能够适用于不同场景,并对相关行政处罚的判决提供依据,从而解决了现有技术中信息要素的表征方式多、案由认定与处罚决定的决策困难、精准度低的问题。
在一种可能的实施方式中,步骤S7具体包括:
S71:根据词组数据,生成网络节点。
S72:根据词组数据对应的词向量,生成网络节点的属性向量,得到属性矩阵。
S73:根据词向量之间的关联度,生成网络节点连边结果,得到邻接矩阵。
S74:基于网络节点、网络节点的属性向量和网络节点连边结果,构建网络。
将词向量作为节点的属性向量,得到属性矩阵;根据词向量的关联度矩阵构建带权值的邻接矩阵,并得到网络节点连边结果。
在一种可能的实施方式中,步骤S72具体包括:
S721:利用关联度算式计算词向量之间的关联度,得到词向量之间的关联度数值;
S722:根据词向量之间的关联度数值,生成网络节点连边结果;
S723:根据网络节点连边结果,得到邻接矩阵。
在一种可能的实施方式中,关联度算式为:
其中,#W(i)为所有词组数据中含有词组i的窗口的数量,#W(j)为所有词组数据中含有词组j的窗口的数量,#W(i,j)为所有词组数据中同时含有词组i和词组j的窗口的数量,#W为所有窗口的总数量。
通过计算词向量之间的关联度值,从而得到两个节点之间是否有连边的结果。
在一种可能的实施方式中,步骤S73具体包括:
S731:判断词向量之间的关联度数值是否大于0;
若是,则执行步骤S731;若否,则执行步骤S732;
S731:生成网络节点之间有连边的结果;
S732:生成网络节点之间无连边的结果。
计算每个案例中词向量之间的关联度,PMI(关联度)值大于0,则两个节点之间有连边,否则就没有连边。
在一种可能的实施方式中,步骤S3具体包括:
S31:利用jieba分词对基本字段数据进行分词处理,得到分词后数据;
S32:利用哈工大停用词表对分词后数据进行停用词删除,得到有效字段数据。
首先利用python的jieba分词对每个行政执法文书进行分词,并使用哈工大停用词表hit_stopwords对停用词进行删除,最大化保留有效词汇,获得包含违法行为类型和违法事实的效字段数据。
在一种可能的实施方式中,标签为label向量标签。
在一种可能的实施方式中,GCN模型数量为2;readout层数量为1。
构建两层GCN模型和一层readout层来学习图向量,然后通过一层MLP进行分类,两层图神经网络的形式如下:
Z=f(X,A)=softmax(A^ReLU(A^XW^((0)))W^((1)))
例如:
在一种可能的实施方式中,步骤S8具体包括:
S81:将邻接矩阵和属性矩阵输入到GCN模型中,得到节点的嵌入表示;
S82:根据节点的嵌入表示,利用readout层计算节点的嵌入表示平均值;
S83:根据节点的嵌入表示和节点的嵌入表示平均值,得到辅助行政处罚决定模型。
将得到的邻接矩阵与属性矩阵输入到两层图卷积神经网络GCN中得到节点的嵌入表示,通过readout函数计算图中所有节点表示的平均值,得到辅助行政处罚决定模型。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有机器可运行指令,计算机可运行指令在被处理器调用和运行时,计算机可运行指令促使处理器运行上述实施例提供的方法。
本发明实施例所提供的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
又例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,再例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种辅助行政处罚决定的方法,其特征在于,包括:
接收行政执法文书数据;
对行政执法文书数据进行数据清洗,得到包含违法行为类型、违法事实和处罚类别的基本字段数据;
对基本字段数据进行分词处理及停止词消除,得到有效字段数据;
对有效字段数据中的处罚类别进行标签化处理,生成每个案件的标签;
将有效字段数据中的违法行为类型和违法事实进行拼接,得到包含违法行为类型和违法事实的词组数据;
将词组数据输入到word2vec模型,生成词组数据对应的词向量;
基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵;
基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型;
基于每个案件的标签,计算辅助行政处罚决定模型的准确率。
2.根据权利要求1所述的辅助行政处罚决定的方法,其特征在于,所述基于词组数据和词向量构建网络,得到邻接矩阵和属性矩阵的步骤,包括:
根据词组数据,生成网络节点;
根据词组数据对应的词向量,生成网络节点的属性向量,得到属性矩阵;
根据词向量之间的关联度,生成网络节点连边结果,得到邻接矩阵;
基于网络节点、网络节点的属性向量和网络节点连边结果,构建网络。
3.根据权利要求2所述的辅助行政处罚决定的方法,其特征在于,所述根据词向量之间的关联度,生成网络节点连边结果,得到邻接矩阵的步骤,包括:
利用关联度算式计算词向量之间的关联度,得到词向量之间的关联度数值;
根据词向量之间的关联度数值,生成网络节点连边结果;
根据网络节点连边结果,得到邻接矩阵。
5.根据权利要求3所述的辅助行政处罚决定的方法,其特征在于,所述根据词向量之间的关联度数值,生成网络节点连边结果的步骤,包括:
判断词向量之间的关联度数值是否大于0;
若是,则生成网络节点之间有连边的结果;
若否,则生成网络节点之间无连边的结果。
6.根据权利要求1所述的辅助行政处罚决定的方法,其特征在于,所述对基本字段数据进行分词处理及停止词消除,得到有效字段数据的步骤包括:
利用jieba分词对基本字段数据进行分词处理,得到分词后数据;
利用哈工大停用词表对分词后数据进行停用词删除,得到有效字段数据。
7.根据权利要求1所述的辅助行政处罚决定的方法,其特征在于,所述标签为label向量标签。
8.根据权利要求1所述的辅助行政处罚决定的方法,其特征在于,所述GCN模型数量为2;所述readout层数量为1。
9.根据权利要求1所述的辅助行政处罚决定的方法,其特征在于,所述基于邻接矩阵和属性矩阵,通过GCN模型和readout层进行学习,得到辅助行政处罚决定模型的步骤,包括:
将邻接矩阵和属性矩阵输入到GCN模型中,得到节点的嵌入表示;
根据节点的嵌入表示,利用readout层计算节点的嵌入表示平均值;
根据节点的嵌入表示和节点的嵌入表示平均值,得到辅助行政处罚决定模型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210551765.9A CN115034183B (zh) | 2022-05-18 | 2022-05-18 | 一种辅助行政处罚决定的方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210551765.9A CN115034183B (zh) | 2022-05-18 | 2022-05-18 | 一种辅助行政处罚决定的方法及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115034183A true CN115034183A (zh) | 2022-09-09 |
CN115034183B CN115034183B (zh) | 2024-05-31 |
Family
ID=83120327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210551765.9A Active CN115034183B (zh) | 2022-05-18 | 2022-05-18 | 一种辅助行政处罚决定的方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034183B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101963988A (zh) * | 2010-09-26 | 2011-02-02 | 福建南威软件工程发展有限公司 | 一种规范自由裁量的智能引擎及其实现方法 |
CN108876686A (zh) * | 2018-06-05 | 2018-11-23 | 南京腾迪智能科技有限公司 | 基于二维模型的行政处罚自由裁量权处罚金额计算方法 |
CN110335181A (zh) * | 2019-07-05 | 2019-10-15 | 北京梦天门科技股份有限公司 | 一种基于人工智能的卫生监督执法自由裁量算法 |
CN110991999A (zh) * | 2019-12-02 | 2020-04-10 | 深圳市华云中盛科技股份有限公司 | 执法裁量效率的提高方法、装置、计算机设备及存储介质 |
WO2021248656A1 (zh) * | 2020-06-09 | 2021-12-16 | 平安国际智慧城市科技股份有限公司 | 基于区块链的电子罚单处理方法、装置、设备及存储介质 |
CN114048305A (zh) * | 2021-11-05 | 2022-02-15 | 山东大学 | 一种基于图卷积神经网络的行政处罚文书的类案推荐方法 |
-
2022
- 2022-05-18 CN CN202210551765.9A patent/CN115034183B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101963988A (zh) * | 2010-09-26 | 2011-02-02 | 福建南威软件工程发展有限公司 | 一种规范自由裁量的智能引擎及其实现方法 |
CN108876686A (zh) * | 2018-06-05 | 2018-11-23 | 南京腾迪智能科技有限公司 | 基于二维模型的行政处罚自由裁量权处罚金额计算方法 |
CN110335181A (zh) * | 2019-07-05 | 2019-10-15 | 北京梦天门科技股份有限公司 | 一种基于人工智能的卫生监督执法自由裁量算法 |
CN110991999A (zh) * | 2019-12-02 | 2020-04-10 | 深圳市华云中盛科技股份有限公司 | 执法裁量效率的提高方法、装置、计算机设备及存储介质 |
WO2021248656A1 (zh) * | 2020-06-09 | 2021-12-16 | 平安国际智慧城市科技股份有限公司 | 基于区块链的电子罚单处理方法、装置、设备及存储介质 |
CN114048305A (zh) * | 2021-11-05 | 2022-02-15 | 山东大学 | 一种基于图卷积神经网络的行政处罚文书的类案推荐方法 |
Non-Patent Citations (3)
Title |
---|
HUI WANG等: "A Contrastive Evaluation Method for Discretion in Administrative Penalty", ELECTRONICS 2022, 26 April 2022 (2022-04-26) * |
孙蔚;王益建;: "对卫生行政处罚推行说理式法律文书的探讨", 中国卫生监督杂志, no. 06, 20 December 2015 (2015-12-20) * |
郝元;: "基于计算机控制的自由裁量辅助决策系统初探", 电子政务, no. 09, 20 September 2010 (2010-09-20) * |
Also Published As
Publication number | Publication date |
---|---|
CN115034183B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112070138B (zh) | 多标签混合分类模型的构建方法、新闻分类方法及系统 | |
CN111985229A (zh) | 一种序列标注方法、装置及计算机设备 | |
CN113139052B (zh) | 基于图神经网络特征聚合的谣言检测方法及装置 | |
CN111275060A (zh) | 识别模型更新处理方法、装置、电子设备及存储介质 | |
CN108550065A (zh) | 评论数据处理方法、装置及设备 | |
CN111324738B (zh) | 一种确定文本标签的方法和系统 | |
CN115391570A (zh) | 一种基于方面的情感知识图谱构建方法及装置 | |
CN109462578A (zh) | 基于统计学习的威胁情报利用与繁殖方法 | |
CN114936290A (zh) | 数据处理方法及装置、存储介质及电子设备 | |
CN113590945A (zh) | 一种基于用户借阅行为-兴趣预测的图书推荐方法和装置 | |
CN113554184A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
CN112800226A (zh) | 用于获取文本分类模型的方法、用于文本分类的方法、装置及设备 | |
Cai et al. | Underwater distortion target recognition network (UDTRNet) via enhanced image features | |
CN111723287A (zh) | 一种基于大规模机器学习的内容和服务推荐方法及其系统 | |
CN114860941A (zh) | 一种基于数据大脑的行业数据治理方法及系统 | |
CN114090880A (zh) | 用于商品推荐的方法及装置、电子设备、存储介质 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
CN111786999B (zh) | 一种入侵行为的检测方法、装置、设备和存储介质 | |
CN115034183B (zh) | 一种辅助行政处罚决定的方法及计算机可读存储介质 | |
CN116824583A (zh) | 弱监督视频场景图生成方法、装置及电子设备 | |
CN113988085B (zh) | 文本语义相似度匹配方法、装置、电子设备及存储介质 | |
CN115017894A (zh) | 一种舆情风险识别方法及装置 | |
CN115455934A (zh) | 一种企业多种经营范围识别方法与系统 | |
CN115358228A (zh) | 基于节点分类的智能辅助处罚决定的方法及电子设备 | |
CN114882279A (zh) | 基于直推式半监督深度学习的多标签图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |