CN117407659A - 基于机器学习的矛盾纠纷事件升级预测方法 - Google Patents
基于机器学习的矛盾纠纷事件升级预测方法 Download PDFInfo
- Publication number
- CN117407659A CN117407659A CN202311695645.7A CN202311695645A CN117407659A CN 117407659 A CN117407659 A CN 117407659A CN 202311695645 A CN202311695645 A CN 202311695645A CN 117407659 A CN117407659 A CN 117407659A
- Authority
- CN
- China
- Prior art keywords
- contradictory
- category
- feature
- dispute
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000010801 machine learning Methods 0.000 title claims abstract description 14
- 230000008094 contradictory effect Effects 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000000546 chi-square test Methods 0.000 claims abstract description 4
- 238000012360 testing method Methods 0.000 claims abstract description 4
- 101150071577 chi2 gene Proteins 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 6
- 239000002131 composite material Substances 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000000691 measurement method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及基于机器学习的矛盾纠纷事件升级预测方法,包括以下步骤:步骤S1:获取矛盾纠纷事件相关人员的特征信息数据,并预处理;步骤S2:对预处理后的特征信息数据进行特征编码;步骤S3:基于卡方检验选择相关性最高的若干个特征;步骤S4:基于类别分布算法对选择出来的若干个特征进行过采样,构建训练数据集和测试数据集;步骤S5:构建K‑Nearest Neighbor模型,并基于训练数据集训练,得到预测模型;步骤S6:将新的矛盾纠纷事件相关人员的特征信息数据经过步骤S1‑S3的处理后,输入预测模型,得到预测结果。本发明实现对可能存在的矛盾升级进行提前预测。
Description
技术领域
本发明涉及大数据分析领域,尤其涉及一种基于机器学习的矛盾纠纷事件升级预测方法。
背景技术
在日常的出警事件中,大部分是人与人之间的矛盾纠纷事件,而该类事件一般情况经过调解都能简单的解决,但是有些矛盾纠纷事件由于各种因素,经过调解后,后续会进一步升级,导致严重的社会治安事件,严重影响社会安全。
然而,目前针对社会矛盾纠纷预警的相关技术中,需要考虑的因素较多,无法靠人工判断哪个事件容易进行升级,缺乏对异常事件的矛盾纠纷升级化的预警,即并不能够实现对可能存在的矛盾升级进行提前预警。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于机器学习的矛盾纠纷事件升级预测方法,实现对可能存在的矛盾升级进行提前预测。
为实现上述目的,本发明采用以下技术方案:
一种基于机器学习的矛盾纠纷事件升级预测方法,包括以下步骤:
步骤S1:获取矛盾纠纷事件相关人员的特征信息数据,并预处理;
步骤S2:对预处理后的特征信息数据进行特征编码;
步骤S3:基于卡方检验选择相关性最高的若干个特征;
步骤S4:基于类别分布算法对选择出来的若干个特征进行过采样,构建训练数据集和测试数据集;
步骤S5:构建K-Nearest Neighbor模型,并基于训练数据集训练,得到预测模型;
步骤S6:将新的矛盾纠纷事件相关人员的特征信息数据经过步骤S1-S3的处理后,输入预测模型,得到预测结果。
进一步的,所述特征信息数据包括13类特征信息,包括:年龄、酒店上网次数、网吧上网次数、性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业。
进一步的,所述预处理具体为:
针对采集到的13类特征信息,年龄、酒店上网次数、网吧上网次数的缺失值均采用平均值进行填充;
针对性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业均增加其他字典项;
并针对采集数据不规整的情况选择将相关字典项进行合并。
进一步的,所述步骤S2具体为:
根据数据中的数据类型进行特征编码,针对年龄、酒店上网次数、网吧上网次数特征采用MinMaxScaler归一化算法将所有年龄缩放至0~1之间;
针对字典类型特征采用独热编码算法进行编码:
(1)对于每个字典类型特征,找出所有不重复的类别;
(2)对于每个样本,根据其字典类型特征的值,找到对应的类别;
(3)对于每个类别,创建一个二进制向量,长度为类别总数;
(4)将对应类别的位置设为1,其他位置设为0;
(5)将所有的二进制向量连接起来,得到独热编码矩阵;
针对结果类型进行LabelEncoder编码进行编码:
找出结果类型的所有不重复类别;
对于每个类别,分配一个唯一的整数值;
将每个样本的结果类型替换为对应的整数值。
进一步的,所述步骤S3具体为:
使用SelectKBest算法,并指定score_func参数为chi2;
将特征编码后的特征信息数据作为输入,对特征进行分组,每个组代表一个类别;
计算每个特征在每个类别中的观测频数Oij;
计算每个特征在每个类别中的期望频数Eij;
根据公式计算所有特征的 chi2 值:
chi2 = sum((Oij - Eij)^2 / Eij)
其中,Oij表示第i个特征在第j个类别中的观测频数,Eij表示第i个特征在第j个类别中的期望频数;
对所有特征的chi2值进行排序,选择排名前H个得分最高的特征。
进一步的,所述类别分布算法,具体为:
计算矛盾纠纷事件未升级样本数量N_majority和矛盾纠纷事件升级数量N_minority;
计算类别分布差异性因子D_factor = N_majority / N_minority;
对于矛盾纠纷事件升级事件的每个样本,计算该样本的过采样倍数Oversampling_factor = D_factor - 1。
生成Oversampling_factor个新的合成样本,作为最终的矛盾纠纷事件升级样本集。
进一步的,所述步骤S5具体为:
构建K-Nearest Neighbor模型,指定G值和距离度量方法为闵可夫斯基距离;
d(x, y) = (sum(|xi - yi|^p))^(1/p)
其中,x和y分别表示两个样本向量的特征值,xi和yi分别表示两个样本向量的第i个特征值,p表示闵可夫斯基距离的阶数;G值表示预测时选择的最近邻居的数量;
使用训练集数据拟合KNN模型,得到预测模型。
进一步的,所述G值的获取,具体如下:
将训练数据集划分为K个折,对于每个K折数据集,将其中一个折作为验证集,其余折作为训练集,对于每个可能的G值,重复以下步骤:
(1)使用K-1个折的数据作为训练集,训练KNN模型;
(2)使用剩下的一个折作为验证集,评估模型的性能;
(3)对于每个G值,计算模型在验证集上的性能指标的平均值;
(4)选择具有最高性能指标平均值的G值作为最优G值;
(5)使用最优G值重新训练KNN模型,使用所有训练数据,得到预测模型。
本发明具有如下有益效果:
1、本发明基于13类特征信息,并对不同类型的特征信息进行不同的预处理,提升数据的准确度,综合考虑多方面影响因素,对矛盾升级进行提前预测,可靠性,准确性高;
2、由于矛盾纠纷事件升级为恶性事件的比例可能非常低,导致正负样本不平衡,本发明基于类别分布算法对样本数据进行处理,处理样本不平衡问题,以提高模型的预测能力。
附图说明
图1为本发明方法流程图;
图2为本发明一实施例中特征相关词云图;
图3为本发明一实施例中的K-Nearest Neighbor模型预测方法;
图4为本发明一实施例中人员信息表示意图。
具体实施方式
以下结合附图和具体实施例对本发明做进一步详细说明:
参考图1,本发明提供一种基于机器学习的矛盾纠纷事件升级预测方法,包括以下步骤:
步骤S1:获取矛盾纠纷事件相关人员的特征信息数据,并预处理;
步骤S2:对预处理后的特征信息数据进行特征编码;
步骤S3:基于卡方检验选择相关性最高的若干个特征;
步骤S4:基于类别分布算法对选择出来的若干个特征进行过采样,构建训练数据集和测试数据集;
步骤S5:构建K-Nearest Neighbor模型,并基于训练数据集训练,得到预测模型;
步骤S6:将新的矛盾纠纷事件相关人员的特征信息数据经过步骤S1-S3的处理后,输入预测模型,得到预测结果。
参考图2,在本实施例中,特征信息数据包括13类特征信息,包括:年龄、酒店上网次数、网吧上网次数、性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业。
在本实施例中,预处理具体为:
针对采集到的13类特征信息,年龄、酒店上网次数、网吧上网次数的缺失值均采用平均值进行填充;
针对性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业均增加其他字典项;
并针对采集数据不规整的情况选择将相关字典项进行合并。
如:复婚和再婚进行合并、初中和初中毕业进行合并等。
在本实施例中,步骤S2具体为:
根据数据中的数据类型进行特征编码,针对年龄、酒店上网次数、网吧上网次数特征采用MinMaxScaler归一化算法将所有年龄缩放至0~1之间;
针对字典类型特征采用独热编码算法进行编码:
(1)对于每个字典类型特征,找出所有不重复的类别;
(2)对于每个样本,根据其字典类型特征的值,找到对应的类别;
(3)对于每个类别,创建一个二进制向量,长度为类别总数;
(4)将对应类别的位置设为1,其他位置设为0;
(5)将所有的二进制向量连接起来,得到独热编码矩阵;
针对结果类型进行LabelEncoder编码进行编码:
找出结果类型的所有不重复类别;
对于每个类别,分配一个唯一的整数值;
将每个样本的结果类型替换为对应的整数值。
进一步的,所述步骤S3具体为:
使用SelectKBest算法,并指定score_func参数为chi2;
将特征编码后的特征信息数据作为输入,对特征进行分组,每个组代表一个类别;
计算每个特征在每个类别中的观测频数Oij;
计算每个特征在每个类别中的期望频数Eij;
根据公式计算所有特征的 chi2 值:
chi2 = sum((Oij - Eij)^2 / Eij)
其中,Oij表示第i个特征在第j个类别中的观测频数,Eij表示第i个特征在第j个类别中的期望频数;
对所有特征的chi2值进行排序,选择排名前H个得分最高的特征。
在本实施例中,基于类别分布算法,具体为:
计算矛盾纠纷事件未升级样本数量N_majority和矛盾纠纷事件升级数量N_minority;
计算类别分布差异性因子D_factor = N_majority / N_minority;
对于矛盾纠纷事件升级事件的每个样本,计算该样本的过采样倍数Oversampling_factor = D_factor - 1。
生成Oversampling_factor个新的合成样本,作为最终的矛盾纠纷事件升级样本集。
在本实施例中,涉事人员信息横向平铺。其横向为涉事人员特征信息,纵向为每一起纠纷案件。经过上述排列后得到如图4所示数据结构:
在本实施例中,步骤S5具体为:
构建K-Nearest Neighbor模型,指定G值和距离度量方法为闵可夫斯基距离;
d(x, y) = (sum(|xi - yi|^p))^(1/p)
其中,x和y分别表示两个样本向量的特征值,xi和yi分别表示两个样本向量的第i个特征值,p表示闵可夫斯基距离的阶数;
使用训练集数据拟合KNN模型,得到预测模型。
在本实施例中,G值获取,具体如下:
将训练数据集划分为K个折,对于每个K折数据集,将其中一个折作为验证集,其余折作为训练集,对于每个可能的G值,重复以下步骤:
(1)使用K-1个折的数据作为训练集,训练KNN模型;
(2)使用剩下的一个折作为验证集,评估模型的性能;
(3)对于每个G值,计算模型在验证集上的性能指标的平均值;
(4)选择具有最高性能指标平均值的G值作为最优G值;
(5)使用最优G值重新训练KNN模型,使用所有训练数据,得到预测模型。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (7)
1.基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,包括以下步骤:
步骤S1:获取矛盾纠纷事件相关人员的特征信息数据,并预处理;
步骤S2:对预处理后的特征信息数据进行特征编码;
步骤S3:基于卡方检验选择相关性最高的若干个特征;
步骤S4:基于类别分布算法对选择出来的若干个特征进行过采样,构建训练数据集和测试数据集;
所述类别分布算法,具体为:
计算矛盾纠纷事件未升级样本数量N_majority和矛盾纠纷事件升级数量N_minority;
计算类别分布差异性因子D_factor = N_majority / N_minority;
对于矛盾纠纷事件升级事件的每个样本,计算该样本的过采样倍数Oversampling_factor = D_factor - 1;
生成Oversampling_factor个新的合成样本,作为最终的矛盾纠纷事件升级样本集;
步骤S5:构建K-Nearest Neighbor模型,并基于训练数据集训练,得到预测模型;
步骤S6:将新的矛盾纠纷事件相关人员的特征信息数据经过步骤S1-S3的处理后,输入预测模型,得到预测结果。
2.根据权利要求1所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述特征信息数据包括13类特征信息,包括:年龄、酒店上网次数、网吧上网次数、性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业。
3.根据权利要求2所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述预处理具体为:
针对采集到的13类特征信息,年龄、酒店上网次数、网吧上网次数的缺失值均采用平均值进行填充;
针对性别、学历、婚姻情况、父母情况、兄弟情况、姐妹情况、子女情况、从事职业均增加其他字典项;
并针对采集数据不规整的情况选择将相关字典项进行合并。
4.根据权利要求3所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述步骤S2具体为:
根据数据中的数据类型进行特征编码,针对年龄、酒店上网次数、网吧上网次数特征采用MinMaxScaler归一化算法将所有年龄缩放至0~1之间;
针对字典类型特征采用独热编码算法进行编码:
(1)对于每个字典类型特征,找出所有不重复的类别;
(2)对于每个样本,根据其字典类型特征的值,找到对应的类别;
(3)对于每个类别,创建一个二进制向量,长度为类别总数;
(4)将对应类别的位置设为1,其他位置设为0;
(5)将所有的二进制向量连接起来,得到独热编码矩阵;
针对结果类型进行LabelEncoder编码进行编码:
找出结果类型的所有不重复类别;
对于每个类别,分配一个唯一的整数值;
将每个样本的结果类型替换为对应的整数值。
5.根据权利要求1所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述步骤S3具体为:
使用SelectKBest算法,并指定score_func参数为chi2;
将特征编码后的特征信息数据作为输入,对特征进行分组,每个组代表一个类别;
计算每个特征在每个类别中的观测频数Oij;
计算每个特征在每个类别中的期望频数Eij;
根据公式计算所有特征的 chi2 值:
chi2 = sum((Oij - Eij)^2 / Eij)
其中,Oij表示第i个特征在第j个类别中的观测频数,Eij表示第i个特征在第j个类别中的期望频数;
对所有特征的chi2值进行排序,选择排名前H个得分最高的特征。
6.根据权利要求1所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述步骤S5具体为:
构建K-Nearest Neighbor模型,指定G值和距离度量方法为闵可夫斯基距离;
d(x, y) = (sum(|xi - yi|^p))^(1/p)
其中,x和y分别表示两个样本向量的特征值,xi和yi分别表示两个样本向量的第i个特征值,p表示闵可夫斯基距离的阶数,G值表示预测时选择的最近邻居的数量;
使用训练集数据拟合KNN模型,得到预测模型。
7.根据权利要求6所述的基于机器学习的矛盾纠纷事件升级预测方法,其特征在于,所述G值的获取,具体如下:
将训练数据集划分为K个折,对于每个K折数据集,将其中一个折作为验证集,其余折作为训练集,对于每个可能的G值,重复以下步骤:
(1)使用K-1个折的数据作为训练集,训练KNN模型;
(2)使用剩下的一个折作为验证集,评估模型的性能;
(3)对于每个G值,计算模型在验证集上的性能指标的平均值;
(4)选择具有最高性能指标平均值的G值作为最优G值;
(5)使用最优G值重新训练KNN模型,使用所有训练数据,得到预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311695645.7A CN117407659A (zh) | 2023-12-12 | 2023-12-12 | 基于机器学习的矛盾纠纷事件升级预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311695645.7A CN117407659A (zh) | 2023-12-12 | 2023-12-12 | 基于机器学习的矛盾纠纷事件升级预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117407659A true CN117407659A (zh) | 2024-01-16 |
Family
ID=89491130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311695645.7A Pending CN117407659A (zh) | 2023-12-12 | 2023-12-12 | 基于机器学习的矛盾纠纷事件升级预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117407659A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210241036A1 (en) * | 2020-02-04 | 2021-08-05 | Capital One Services, Llc | Computer-based systems including machine learning models trained on distinct dataset types and methods of use thereof |
US11195616B1 (en) * | 2020-10-15 | 2021-12-07 | Stasis Labs, Inc. | Systems and methods using ensemble machine learning techniques for future event detection |
CN116108955A (zh) * | 2022-11-18 | 2023-05-12 | 中国电信股份有限公司 | 社会矛盾纠纷的升级预警方法、装置、设备及存储介质 |
CN117033923A (zh) * | 2023-06-01 | 2023-11-10 | 南京北斗创新应用科技研究院有限公司 | 一种基于可解释性机器学习的犯罪数量预测方法及系统 |
-
2023
- 2023-12-12 CN CN202311695645.7A patent/CN117407659A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210241036A1 (en) * | 2020-02-04 | 2021-08-05 | Capital One Services, Llc | Computer-based systems including machine learning models trained on distinct dataset types and methods of use thereof |
US11195616B1 (en) * | 2020-10-15 | 2021-12-07 | Stasis Labs, Inc. | Systems and methods using ensemble machine learning techniques for future event detection |
CN116108955A (zh) * | 2022-11-18 | 2023-05-12 | 中国电信股份有限公司 | 社会矛盾纠纷的升级预警方法、装置、设备及存储介质 |
CN117033923A (zh) * | 2023-06-01 | 2023-11-10 | 南京北斗创新应用科技研究院有限公司 | 一种基于可解释性机器学习的犯罪数量预测方法及系统 |
Non-Patent Citations (5)
Title |
---|
任韬 等: "《大数据预处理:基于Python的应用 第1版》", 30 April 2022, 首都经济贸易大学出版社, pages: 114 - 116 * |
刘宇 等: "《智能搜索和推荐系统:原理、算法与应用》", 31 January 2021, 机械工业出版社, pages: 163 - 165 * |
周俊 等: "《人工智能基础及应用》", 30 November 2021, 华中科技大学出版社, pages: 85 - 90 * |
康跃: "《智能技术基础及应用》", 28 February 2021, 北京首都经济贸易大学出版社, pages: 117 - 121 * |
白肇强: "基于用户行为的特征工程构建与应用研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 12, 15 December 2018 (2018-12-15), pages 1 - 44 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11556861B2 (en) | Debugging correctness issues in training machine learning models | |
US11640563B2 (en) | Automated data processing and machine learning model generation | |
CN106611052B (zh) | 文本标签的确定方法及装置 | |
CN111639516B (zh) | 基于机器学习的分析平台 | |
CN108133223B (zh) | 确定卷积神经网络cnn模型的装置和方法 | |
Meng et al. | Classifier ensemble selection based on affinity propagation clustering | |
US11954202B2 (en) | Deep learning based detection of malicious shell scripts | |
CN110647995A (zh) | 规则训练方法、装置、设备及存储介质 | |
CN107368526A (zh) | 一种数据处理方法及装置 | |
CN112420125A (zh) | 分子属性预测方法、装置、智能设备和终端 | |
CN111045916A (zh) | 自动化软件缺陷验证 | |
CN116361788A (zh) | 一种基于机器学习的二进制软件漏洞预测方法 | |
CN115034315A (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
CN117521063A (zh) | 基于残差神经网络并结合迁移学习的恶意软件检测方法及装置 | |
CN113642727A (zh) | 神经网络模型的训练方法和多媒体信息的处理方法、装置 | |
US20190180180A1 (en) | Information processing system, information processing method, and recording medium | |
CN114139636B (zh) | 异常作业处理方法及装置 | |
CN111582313A (zh) | 样本数据生成方法、装置及电子设备 | |
Zhang et al. | Higher-order proximity-based MiRNA-disease associations prediction | |
CN116861358A (zh) | 基于bp神经网络与多源数据融合的计算思维评测方法 | |
CN117407659A (zh) | 基于机器学习的矛盾纠纷事件升级预测方法 | |
CN113127342B (zh) | 基于电网信息系统特征选择的缺陷预测方法及装置 | |
CN114300036A (zh) | 遗传变异致病性预测方法、装置、存储介质及计算机设备 | |
CN111108516B (zh) | 使用深度学习算法来评价输入数据 | |
CN115280415A (zh) | 致病性模型的应用和其训练 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |