CN113780338A - 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 - Google Patents

基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113780338A
CN113780338A CN202110868718.2A CN202110868718A CN113780338A CN 113780338 A CN113780338 A CN 113780338A CN 202110868718 A CN202110868718 A CN 202110868718A CN 113780338 A CN113780338 A CN 113780338A
Authority
CN
China
Prior art keywords
vector
hyperplane
confidence
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110868718.2A
Other languages
English (en)
Other versions
CN113780338B (zh
Inventor
李扬曦
王佩
刘科栋
彭成维
肖林焱
王亚箭
黄自强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING SINOVATIO TECHNOLOGY CO LTD
National Computer Network and Information Security Management Center
Original Assignee
NANJING SINOVATIO TECHNOLOGY CO LTD
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING SINOVATIO TECHNOLOGY CO LTD, National Computer Network and Information Security Management Center filed Critical NANJING SINOVATIO TECHNOLOGY CO LTD
Priority to CN202110868718.2A priority Critical patent/CN113780338B/zh
Publication of CN113780338A publication Critical patent/CN113780338A/zh
Application granted granted Critical
Publication of CN113780338B publication Critical patent/CN113780338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于支持向量机的大数据分析中置信度评价方法及系统,应用于互联网骚扰电话的分析领域,对骚扰电话进行评价;本方法基于支持向量机实现了自动分类的置信度评价,提出了海量数据分析领域中分类评价的解决方案,从而高效、直观对骚扰电话的分类。本方法提供对分析样本进行高效、准确的分类置信度评价。

Description

基于支持向量机的大数据分析中置信度评价方法、系统、设备 及存储介质
技术领域
本发明应用于互联网骚扰电话的分析领域,涉及大数据处理、分析领域,结合机器学习改进方法,尤其是一种用于在大数据分析过程中,通过典型数据特征进行评价分类。
背景技术
近年来,随着移动互联网的高速发展,智能终端的普及率在逐年上升,互联网骚扰电话出现的频率也在急剧增加,网络环境的净化手段也在逐步提升,在海量数据的基础上,各类数据分析评价模型和分类模型也应运而生。
在传统的机器学习方法中,由于支持向量机-SVM有着良好的分类效果,而且具有良好的“鲁棒”性,基本不涉及大数定律,实现了高效的从训练样本到预测样本的“转导推理”。更重要的SVM在求解最终分类过程中,会输出向量点到最优超平面的距离,这就为我们的置信度评价方法提供了基础。
在大多数及机器学习算法都无法直接提供置信度评价方法,而无法达到量化直观的度量,更多的提供的是标签标记,已确定好分类结果,在这种情况下,就无法结合更多数据过滤算法,和对已确定的分类进行容错矫正。
在这样的背景下,需要一种方法,在现有机器学习算法下,更有效用于骚扰电话分析工程项目中。
发明内容
本发明所要解决的技术问题在于,如何能够实现了从简单的分类标签到量化、直观的置信度评价,用以达到快速、直观的对骚扰电话的分类效果。
为解决上述技术问题,本发明提供一种基于支持向量机的大数据分析中置信度评价方法,包括以下步骤:
步骤1,整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
步骤2,通过特征向量提取原始数据集,分为训练向量集和预测向量集;
步骤3,训练向量集应用拉格朗日函数,求解对偶问题;
步骤4:通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
步骤5:确定最优分类超平面w*.xi+b*=0;
步骤6:预测向量函数
Figure BDA0003188230460000021
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure BDA0003188230460000022
Figure BDA0003188230460000023
γmax大于0;此时
Figure BDA0003188230460000024
为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
步骤8:针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure BDA0003188230460000025
Figure BDA0003188230460000026
γmin小于0;此时
Figure BDA0003188230460000027
是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
步骤9:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据,置信度Pi小于设定值的预测数据标记为正常数据。
有益效果:本发明结合机器学习分类算法中计算置信度评价,从而高效、直观对骚扰电话的分类。从适用性上,不依赖现有数据分析平台,适用于各类编程语言;从功能性看,在海量数据分析中,缺少直接的分类算法置信度评价方法,本方法提供对分析样本进行高效、准确的分类置信度评价。
对应上述基于支持向量机的大数据分析中置信度评价方法,本发明还提供一种基于支持向量机的大数据分析中置信度评价系统,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于10s的比例、被叫号码总共小于2次接通占比、被叫号码地理位置离散度、是否为001+区号号码等特征维度,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
第六模块:用以预测向量函数
Figure BDA0003188230460000031
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第七模块:用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure BDA0003188230460000032
Figure BDA0003188230460000033
γmax大于0;此时
Figure BDA0003188230460000034
为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
第八模块:用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure BDA0003188230460000037
Figure BDA0003188230460000035
γmin小于0;此时
Figure BDA0003188230460000036
是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
第九模块:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据;置信度Pi小于设定值的预测数据标记为正常数据。
附图说明
图1是本发明的通用置信度方法的流程实现示意图。
图2是本发明的数学实现置信度评价方法的几何间隔示意图。
具体实施方式
如图1及图2所示,为本实施例一种基于支持向量机的高可用置信度评价方法,包括如下步骤:
(1)对海量数据进行预处理,进行标准化数据输入。
(2)选取呼叫成功率,振铃造早释率,通话时长小于10s的比例,被叫号码总共只有1次接通占比,被叫号码地理位置离散度,是否为001+区号号码等特征维度,挑选机器学习特征维度,并形成特征向量,为后续模型训练做准备。
(3)确定分类标签,并将标签与特征向量进行关联,形成标签-特征向量。
(4)将标签-特征向量做输入,通过支持向量机算法进行模型训练,得到超平面分类模型,确定w*.xi+b*=0,并确定超平面参数,向量参数w*,常量参数b*
(5)组织步骤(2)中的特征向量,生成预测数据向量集,并使用步骤(4)中参数w*,b*,通过函数
Figure BDA0003188230460000041
进行预测计算,输出预测结果。
(6)通过步骤(5)预测结果中,筛选出正侧几何间隔最大值、负侧几何间隔最小值。
(7)通过步骤(5)中生成的几何间隔预测结果进行逐条几何间隔计算。
(8)将步骤(6)和步骤(7)的结果作为输入,并通过置信度评价方法计算每个特征向量的置信度评价。
具体的,用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure BDA0003188230460000042
Figure BDA0003188230460000043
γmax大于0;此时
Figure BDA0003188230460000044
为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
Figure BDA0003188230460000045
γmax针对每次训练样本动态更新。
用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure BDA0003188230460000046
Figure BDA0003188230460000047
γmin小于0;此时
Figure BDA0003188230460000048
是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
Figure BDA0003188230460000049
γmin针对每次训练样本动态更新。
(9)针对输出置信度Pi大于50的预测数据,标记为骚扰数据,置信度Pi小于50的预测数据标记为正常数据,输出置信度评价到数据库中,并输出骚扰电话分类结果。
如图2所示,展示本发明的核心原理,其实施步骤如下:
1)选取呼叫成功率,振铃造早释率,通话时长小于10s的比例,被叫号码总共只有1次接通占比,被叫号码地理位置离散度,是否为001+区号号码等特征维度,挑选机器学习特征维度,并形成特征向量。
2)组织特征向量,生成预测数据向量集,并通过函数
Figure BDA00031882304600000410
Figure BDA0003188230460000051
进行预测计算,输出预测向量的几何间隔。
3)通过步骤2)预测结果中,筛选出正侧几何间隔最大值、负侧几何间隔最小值。
4)通过步骤2)中生成的几何间隔预测结果进行逐条几何间隔处理。
5)将步骤3)和步骤4)的结果作为输入,并通过置信度评价方法
Figure BDA0003188230460000052
Figure BDA0003188230460000053
计算每个特征向量的置信度评价。
6)输出置信度Pi大于50的预测数据,标记为骚扰,置信度Pi小于50的预测数据标记为正常,输出置信度评价到数据库中,并输出骚扰电话分类结果。
本发明还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述基于支持向量机的高可用置信度评价方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述基于支持向量机的高可用置信度评价方法的步骤。
对应上述提取网络设备指纹的方法,本发明还提供一种提取网络设备指纹的系统的技术方案,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
第六模块:用以预测向量函数
Figure BDA0003188230460000054
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第七模块:用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure BDA0003188230460000061
Figure BDA0003188230460000062
γmax大于0;
第八模块:用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure BDA0003188230460000063
Figure BDA0003188230460000064
γmin小于0;
第九模块:输出置信度Pi大于50的预测数据,标记为骚扰数据,置信度Pi小于50的预测数据标记为正常数据,输出置信度评价到数据库中,并输出骚扰电话分类结果。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所提及方法和系统的前提下进行的改进,这些改进也应视为本发明的保护范围。

Claims (8)

1.一种基于支持向量机的大数据分析中置信度评价方法,其特征在于,包括以下步骤:
步骤1,整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
步骤2,通过特征向量提取原始数据集,分为训练向量集和预测向量集;
步骤3,训练向量集应用拉格朗日函数,求解对偶问题;
步骤4:通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
步骤5:确定最优分类超平面w*.xi+b*=0;
步骤6:预测向量函数
Figure FDA0003188230450000011
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
步骤7:针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure FDA0003188230450000012
Figure FDA0003188230450000013
γmax大于0;此时
Figure FDA0003188230450000014
为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
步骤8:针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure FDA0003188230450000015
Figure FDA0003188230450000016
γmin小于0;此时
Figure FDA0003188230450000017
是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
步骤9:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据,置信度Pi小于设定值的预测数据标记为正常数据。
2.根据权利要求1所述的大数据分析中置信度评价方法,其特征在于,步骤1中,通话时长阈值为通话时长小于10s,设定接通阈值次数为2次,区号号码为是否为001+区号号码等特征维度。
3.根据权利要求1或2所述的大数据分析中置信度评价方法,其特征在于,用以对拨打电话是否为骚扰电话的评价。
4.一种基于支持向量机的大数据分析中置信度评价系统,其特征在于,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
第六模块:用以预测向量函数
Figure FDA0003188230450000021
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第七模块:用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:
Figure FDA0003188230450000022
Figure FDA0003188230450000023
γmax大于0;此时
Figure FDA0003188230450000024
为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
第八模块:用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:
Figure FDA0003188230450000025
Figure FDA0003188230450000026
γmin小于0;此时
Figure FDA0003188230450000027
是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
第九模块:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据;置信度Pi小于设定值的预测数据标记为正常数据。
5.根据权利要求4所述的大数据分析中置信度评价系统,其特征在于,第一模块中,通话时长阈值为通话时长小于10s,设定接通阈值次数为2次,区号号码为是否为001+区号号码等特征维度。
6.根据权利要求4或5所述的大数据分析中置信度评价系统,其特征在于,用以对拨打电话是否为骚扰电话的评价。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN202110868718.2A 2021-07-30 2021-07-30 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 Active CN113780338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110868718.2A CN113780338B (zh) 2021-07-30 2021-07-30 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110868718.2A CN113780338B (zh) 2021-07-30 2021-07-30 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113780338A true CN113780338A (zh) 2021-12-10
CN113780338B CN113780338B (zh) 2024-04-09

Family

ID=78836526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110868718.2A Active CN113780338B (zh) 2021-07-30 2021-07-30 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113780338B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100001177A (ko) * 2008-06-26 2010-01-06 주식회사 비츠로시스 주성분 분석을 이용한 유전자 선택 알고리즘
CN104462762A (zh) * 2014-11-04 2015-03-25 西南交通大学 一种输电线路的模糊故障分类方法
CN105868900A (zh) * 2016-03-28 2016-08-17 大连理工大学 基于支持向量机的企业预合作伙伴分类方法
JP2017118384A (ja) * 2015-12-25 2017-06-29 国立大学法人京都大学 管理装置、コンピュータに実行させるためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN107300698A (zh) * 2017-08-21 2017-10-27 哈尔滨工业大学 一种基于支持向量机的雷达目标航迹起始方法
CN109035025A (zh) * 2018-08-17 2018-12-18 北京奇虎科技有限公司 评价股票评论可靠性的方法和装置
CN109583520A (zh) * 2018-12-27 2019-04-05 云南电网有限责任公司玉溪供电局 一种云模型与遗传算法优化支持向量机的状态评估方法
JP2019164774A (ja) * 2018-03-15 2019-09-26 富士通株式会社 学習装置、検査装置、学習検査方法、学習プログラムおよび検査プログラム
CN110995937A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种被骚扰用户的识别方法及装置
CN111078876A (zh) * 2019-12-04 2020-04-28 国家计算机网络与信息安全管理中心 一种基于多模型集成的短文本分类方法和系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100001177A (ko) * 2008-06-26 2010-01-06 주식회사 비츠로시스 주성분 분석을 이용한 유전자 선택 알고리즘
CN104462762A (zh) * 2014-11-04 2015-03-25 西南交通大学 一种输电线路的模糊故障分类方法
JP2017118384A (ja) * 2015-12-25 2017-06-29 国立大学法人京都大学 管理装置、コンピュータに実行させるためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN105868900A (zh) * 2016-03-28 2016-08-17 大连理工大学 基于支持向量机的企业预合作伙伴分类方法
CN107300698A (zh) * 2017-08-21 2017-10-27 哈尔滨工业大学 一种基于支持向量机的雷达目标航迹起始方法
JP2019164774A (ja) * 2018-03-15 2019-09-26 富士通株式会社 学習装置、検査装置、学習検査方法、学習プログラムおよび検査プログラム
CN109035025A (zh) * 2018-08-17 2018-12-18 北京奇虎科技有限公司 评价股票评论可靠性的方法和装置
CN109583520A (zh) * 2018-12-27 2019-04-05 云南电网有限责任公司玉溪供电局 一种云模型与遗传算法优化支持向量机的状态评估方法
CN110995937A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种被骚扰用户的识别方法及装置
CN111078876A (zh) * 2019-12-04 2020-04-28 国家计算机网络与信息安全管理中心 一种基于多模型集成的短文本分类方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MOHAPATRA S M等: "A Novel Approach for Confidence Estimation using Support Vector Machines for more Accurate Value Prediction", 《INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS》, pages 1 - 8 *
SAKR G E等: "Decision confidence-based multi-level support vector machines", 《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》, vol. 26, no. 8, pages 1892 - 1901 *
WANG W等: "Learning confidence sets using support vector machines", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》, vol. 31, pages 1 - 10 *
李阳: "支持向量机若干算法的研究及其应用", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 4, pages 140 - 11 *
沈小乔: "基因表达数据分类算法及其应用研究", 《中国优秀博硕士学位论文全文数据库 (硕士)信息科技辑》, no. 7, pages 138 - 821 *

Also Published As

Publication number Publication date
CN113780338B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN109086811B (zh) 多标签图像分类方法、装置及电子设备
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN110362814B (zh) 一种基于改进损失函数的命名实体识别方法及装置
CN109977895B (zh) 一种基于多特征图融合的野生动物视频目标检测方法
CN111160469A (zh) 一种目标检测系统的主动学习方法
CN110956615B (zh) 图像质量评估模型训练方法、装置、电子设备及存储介质
CN111160959B (zh) 一种用户点击转化预估方法及装置
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN109685104B (zh) 一种识别模型的确定方法和装置
CN113516144A (zh) 目标检测方法及装置、计算设备
CN109002831A (zh) 一种基于卷积神经网络的乳腺密度分类方法、系统及装置
CN111738319A (zh) 一种基于大规模样本的聚类结果评价方法及装置
EP4174769A1 (en) Method and apparatus for marking object outline in target image, and storage medium and electronic apparatus
CN114387451A (zh) 异常图像检测模型的训练方法、装置及介质
CN112434717B (zh) 一种模型训练方法及装置
CN117274212A (zh) 一种桥梁水下结构裂缝检测方法
CN109657710B (zh) 数据筛选方法、装置、服务器及存储介质
CN111126720A (zh) 养殖场风险预测方法、装置、设备及存储介质
CN113780338A (zh) 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质
CN115661542A (zh) 一种基于特征关系迁移的小样本目标检测方法
CN114330542A (zh) 一种基于目标检测的样本挖掘方法、装置及存储介质
CN114399497A (zh) 文本图像质量检测方法、装置、计算机设备及存储介质
CN113515771A (zh) 数据敏感度判定方法、电子设备及计算机可读存储介质
CN112861689A (zh) 一种基于nas技术的坐标识别模型的搜索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant