CN113780338A - 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 - Google Patents
基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN113780338A CN113780338A CN202110868718.2A CN202110868718A CN113780338A CN 113780338 A CN113780338 A CN 113780338A CN 202110868718 A CN202110868718 A CN 202110868718A CN 113780338 A CN113780338 A CN 113780338A
- Authority
- CN
- China
- Prior art keywords
- vector
- hyperplane
- confidence
- module
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 26
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 18
- 238000007405 data analysis Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 106
- 238000012549 training Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 239000006185 dispersion Substances 0.000 claims description 7
- 230000009977 dual effect Effects 0.000 claims description 5
- 238000012517 data analytics Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 6
- 238000010801 machine learning Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于支持向量机的大数据分析中置信度评价方法及系统,应用于互联网骚扰电话的分析领域,对骚扰电话进行评价;本方法基于支持向量机实现了自动分类的置信度评价,提出了海量数据分析领域中分类评价的解决方案,从而高效、直观对骚扰电话的分类。本方法提供对分析样本进行高效、准确的分类置信度评价。
Description
技术领域
本发明应用于互联网骚扰电话的分析领域,涉及大数据处理、分析领域,结合机器学习改进方法,尤其是一种用于在大数据分析过程中,通过典型数据特征进行评价分类。
背景技术
近年来,随着移动互联网的高速发展,智能终端的普及率在逐年上升,互联网骚扰电话出现的频率也在急剧增加,网络环境的净化手段也在逐步提升,在海量数据的基础上,各类数据分析评价模型和分类模型也应运而生。
在传统的机器学习方法中,由于支持向量机-SVM有着良好的分类效果,而且具有良好的“鲁棒”性,基本不涉及大数定律,实现了高效的从训练样本到预测样本的“转导推理”。更重要的SVM在求解最终分类过程中,会输出向量点到最优超平面的距离,这就为我们的置信度评价方法提供了基础。
在大多数及机器学习算法都无法直接提供置信度评价方法,而无法达到量化直观的度量,更多的提供的是标签标记,已确定好分类结果,在这种情况下,就无法结合更多数据过滤算法,和对已确定的分类进行容错矫正。
在这样的背景下,需要一种方法,在现有机器学习算法下,更有效用于骚扰电话分析工程项目中。
发明内容
本发明所要解决的技术问题在于,如何能够实现了从简单的分类标签到量化、直观的置信度评价,用以达到快速、直观的对骚扰电话的分类效果。
为解决上述技术问题,本发明提供一种基于支持向量机的大数据分析中置信度评价方法,包括以下步骤:
步骤1,整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
步骤2,通过特征向量提取原始数据集,分为训练向量集和预测向量集;
步骤3,训练向量集应用拉格朗日函数,求解对偶问题;
步骤4:通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
步骤5:确定最优分类超平面w*.xi+b*=0;
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
步骤8:针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
步骤9:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据,置信度Pi小于设定值的预测数据标记为正常数据。
有益效果:本发明结合机器学习分类算法中计算置信度评价,从而高效、直观对骚扰电话的分类。从适用性上,不依赖现有数据分析平台,适用于各类编程语言;从功能性看,在海量数据分析中,缺少直接的分类算法置信度评价方法,本方法提供对分析样本进行高效、准确的分类置信度评价。
对应上述基于支持向量机的大数据分析中置信度评价方法,本发明还提供一种基于支持向量机的大数据分析中置信度评价系统,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于10s的比例、被叫号码总共小于2次接通占比、被叫号码地理位置离散度、是否为001+区号号码等特征维度,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第七模块:用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
第八模块:用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
第九模块:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据;置信度Pi小于设定值的预测数据标记为正常数据。
附图说明
图1是本发明的通用置信度方法的流程实现示意图。
图2是本发明的数学实现置信度评价方法的几何间隔示意图。
具体实施方式
如图1及图2所示,为本实施例一种基于支持向量机的高可用置信度评价方法,包括如下步骤:
(1)对海量数据进行预处理,进行标准化数据输入。
(2)选取呼叫成功率,振铃造早释率,通话时长小于10s的比例,被叫号码总共只有1次接通占比,被叫号码地理位置离散度,是否为001+区号号码等特征维度,挑选机器学习特征维度,并形成特征向量,为后续模型训练做准备。
(3)确定分类标签,并将标签与特征向量进行关联,形成标签-特征向量。
(4)将标签-特征向量做输入,通过支持向量机算法进行模型训练,得到超平面分类模型,确定w*.xi+b*=0,并确定超平面参数,向量参数w*,常量参数b*。
(6)通过步骤(5)预测结果中,筛选出正侧几何间隔最大值、负侧几何间隔最小值。
(7)通过步骤(5)中生成的几何间隔预测结果进行逐条几何间隔计算。
(8)将步骤(6)和步骤(7)的结果作为输入,并通过置信度评价方法计算每个特征向量的置信度评价。
具体的,用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;γmax针对每次训练样本动态更新。
用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;γmin针对每次训练样本动态更新。
(9)针对输出置信度Pi大于50的预测数据,标记为骚扰数据,置信度Pi小于50的预测数据标记为正常数据,输出置信度评价到数据库中,并输出骚扰电话分类结果。
如图2所示,展示本发明的核心原理,其实施步骤如下:
1)选取呼叫成功率,振铃造早释率,通话时长小于10s的比例,被叫号码总共只有1次接通占比,被叫号码地理位置离散度,是否为001+区号号码等特征维度,挑选机器学习特征维度,并形成特征向量。
3)通过步骤2)预测结果中,筛选出正侧几何间隔最大值、负侧几何间隔最小值。
4)通过步骤2)中生成的几何间隔预测结果进行逐条几何间隔处理。
6)输出置信度Pi大于50的预测数据,标记为骚扰,置信度Pi小于50的预测数据标记为正常,输出置信度评价到数据库中,并输出骚扰电话分类结果。
本发明还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述基于支持向量机的高可用置信度评价方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述基于支持向量机的高可用置信度评价方法的步骤。
对应上述提取网络设备指纹的方法,本发明还提供一种提取网络设备指纹的系统的技术方案,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第九模块:输出置信度Pi大于50的预测数据,标记为骚扰数据,置信度Pi小于50的预测数据标记为正常数据,输出置信度评价到数据库中,并输出骚扰电话分类结果。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所提及方法和系统的前提下进行的改进,这些改进也应视为本发明的保护范围。
Claims (8)
1.一种基于支持向量机的大数据分析中置信度评价方法,其特征在于,包括以下步骤:
步骤1,整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
步骤2,通过特征向量提取原始数据集,分为训练向量集和预测向量集;
步骤3,训练向量集应用拉格朗日函数,求解对偶问题;
步骤4:通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
步骤5:确定最优分类超平面w*.xi+b*=0;
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
步骤7:针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
步骤8:针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
步骤9:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据,置信度Pi小于设定值的预测数据标记为正常数据。
2.根据权利要求1所述的大数据分析中置信度评价方法,其特征在于,步骤1中,通话时长阈值为通话时长小于10s,设定接通阈值次数为2次,区号号码为是否为001+区号号码等特征维度。
3.根据权利要求1或2所述的大数据分析中置信度评价方法,其特征在于,用以对拨打电话是否为骚扰电话的评价。
4.一种基于支持向量机的大数据分析中置信度评价系统,其特征在于,包括:
第一模块,用以整理数据集特征:选取的数据集特征包括呼叫成功率、振铃造早释率、通话时长小于设定通话时长阈值的比例、被叫号码总共小于设定接通阈值次数接通占比、被叫号码地理位置离散度、区号号码,通过上述数据集特征确定特征向量;
第二模块,用以通过特征向量提取原始数据集,分为训练向量集和预测向量集;
第三模块,用以对训练向量集应用拉格朗日函数,求解对偶问题;
第四模块:用以通过求解获得支持向量机超平面w*.xi+b*=±1,并确定超平面参数;其中w*为向量参数,b*为常量参数;xi为向量点;
第五模块:用以确定最优分类超平面w*.xi+b*=0;
其中计算超平面(w*,b*)关于样本点(xi,yi)的几何间隔,获得几何间隔γi,其中xi是向量点,yi是分类标记,yi取值为+1,-1;
第七模块:用以针对预测向量中yi取值为+1的部分向量,即该向量点xi在超平面正的一侧,使用公式获得置信度:且γmax大于0;此时为向量点xi在超平面正侧距离分类边界的距离;γmax为超平面正侧距离分类边界的的最大距离;
第八模块:用以针对预测向量中yi取值为-1的部分向量,即该向量点xi在超平面负的一侧,使用公式获得置信度:且γmin小于0;此时是向量点xi在超平面负侧距离分类边界的距离;γmin是超平面负侧距离分类边界的的最大距离;
第九模块:针对输出置信度Pi大于设定值的预测数据,标记为骚扰数据;置信度Pi小于设定值的预测数据标记为正常数据。
5.根据权利要求4所述的大数据分析中置信度评价系统,其特征在于,第一模块中,通话时长阈值为通话时长小于10s,设定接通阈值次数为2次,区号号码为是否为001+区号号码等特征维度。
6.根据权利要求4或5所述的大数据分析中置信度评价系统,其特征在于,用以对拨打电话是否为骚扰电话的评价。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110868718.2A CN113780338B (zh) | 2021-07-30 | 2021-07-30 | 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110868718.2A CN113780338B (zh) | 2021-07-30 | 2021-07-30 | 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780338A true CN113780338A (zh) | 2021-12-10 |
CN113780338B CN113780338B (zh) | 2024-04-09 |
Family
ID=78836526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110868718.2A Active CN113780338B (zh) | 2021-07-30 | 2021-07-30 | 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780338B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100001177A (ko) * | 2008-06-26 | 2010-01-06 | 주식회사 비츠로시스 | 주성분 분석을 이용한 유전자 선택 알고리즘 |
CN104462762A (zh) * | 2014-11-04 | 2015-03-25 | 西南交通大学 | 一种输电线路的模糊故障分类方法 |
CN105868900A (zh) * | 2016-03-28 | 2016-08-17 | 大连理工大学 | 基于支持向量机的企业预合作伙伴分类方法 |
JP2017118384A (ja) * | 2015-12-25 | 2017-06-29 | 国立大学法人京都大学 | 管理装置、コンピュータに実行させるためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN107300698A (zh) * | 2017-08-21 | 2017-10-27 | 哈尔滨工业大学 | 一种基于支持向量机的雷达目标航迹起始方法 |
CN109035025A (zh) * | 2018-08-17 | 2018-12-18 | 北京奇虎科技有限公司 | 评价股票评论可靠性的方法和装置 |
CN109583520A (zh) * | 2018-12-27 | 2019-04-05 | 云南电网有限责任公司玉溪供电局 | 一种云模型与遗传算法优化支持向量机的状态评估方法 |
JP2019164774A (ja) * | 2018-03-15 | 2019-09-26 | 富士通株式会社 | 学習装置、検査装置、学習検査方法、学習プログラムおよび検査プログラム |
CN110995937A (zh) * | 2019-11-29 | 2020-04-10 | 上海观安信息技术股份有限公司 | 一种被骚扰用户的识别方法及装置 |
CN111078876A (zh) * | 2019-12-04 | 2020-04-28 | 国家计算机网络与信息安全管理中心 | 一种基于多模型集成的短文本分类方法和系统 |
-
2021
- 2021-07-30 CN CN202110868718.2A patent/CN113780338B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100001177A (ko) * | 2008-06-26 | 2010-01-06 | 주식회사 비츠로시스 | 주성분 분석을 이용한 유전자 선택 알고리즘 |
CN104462762A (zh) * | 2014-11-04 | 2015-03-25 | 西南交通大学 | 一种输电线路的模糊故障分类方法 |
JP2017118384A (ja) * | 2015-12-25 | 2017-06-29 | 国立大学法人京都大学 | 管理装置、コンピュータに実行させるためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN105868900A (zh) * | 2016-03-28 | 2016-08-17 | 大连理工大学 | 基于支持向量机的企业预合作伙伴分类方法 |
CN107300698A (zh) * | 2017-08-21 | 2017-10-27 | 哈尔滨工业大学 | 一种基于支持向量机的雷达目标航迹起始方法 |
JP2019164774A (ja) * | 2018-03-15 | 2019-09-26 | 富士通株式会社 | 学習装置、検査装置、学習検査方法、学習プログラムおよび検査プログラム |
CN109035025A (zh) * | 2018-08-17 | 2018-12-18 | 北京奇虎科技有限公司 | 评价股票评论可靠性的方法和装置 |
CN109583520A (zh) * | 2018-12-27 | 2019-04-05 | 云南电网有限责任公司玉溪供电局 | 一种云模型与遗传算法优化支持向量机的状态评估方法 |
CN110995937A (zh) * | 2019-11-29 | 2020-04-10 | 上海观安信息技术股份有限公司 | 一种被骚扰用户的识别方法及装置 |
CN111078876A (zh) * | 2019-12-04 | 2020-04-28 | 国家计算机网络与信息安全管理中心 | 一种基于多模型集成的短文本分类方法和系统 |
Non-Patent Citations (5)
Title |
---|
MOHAPATRA S M等: "A Novel Approach for Confidence Estimation using Support Vector Machines for more Accurate Value Prediction", 《INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS》, pages 1 - 8 * |
SAKR G E等: "Decision confidence-based multi-level support vector machines", 《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》, vol. 26, no. 8, pages 1892 - 1901 * |
WANG W等: "Learning confidence sets using support vector machines", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》, vol. 31, pages 1 - 10 * |
李阳: "支持向量机若干算法的研究及其应用", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 4, pages 140 - 11 * |
沈小乔: "基因表达数据分类算法及其应用研究", 《中国优秀博硕士学位论文全文数据库 (硕士)信息科技辑》, no. 7, pages 138 - 821 * |
Also Published As
Publication number | Publication date |
---|---|
CN113780338B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086811B (zh) | 多标签图像分类方法、装置及电子设备 | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111460250B (zh) | 用于画像的数据的清洗方法、装置、介质及电子设备 | |
CN110362814B (zh) | 一种基于改进损失函数的命名实体识别方法及装置 | |
CN109977895B (zh) | 一种基于多特征图融合的野生动物视频目标检测方法 | |
CN111160469A (zh) | 一种目标检测系统的主动学习方法 | |
CN110956615B (zh) | 图像质量评估模型训练方法、装置、电子设备及存储介质 | |
CN111160959B (zh) | 一种用户点击转化预估方法及装置 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN109685104B (zh) | 一种识别模型的确定方法和装置 | |
CN113516144A (zh) | 目标检测方法及装置、计算设备 | |
CN109002831A (zh) | 一种基于卷积神经网络的乳腺密度分类方法、系统及装置 | |
CN111738319A (zh) | 一种基于大规模样本的聚类结果评价方法及装置 | |
EP4174769A1 (en) | Method and apparatus for marking object outline in target image, and storage medium and electronic apparatus | |
CN114387451A (zh) | 异常图像检测模型的训练方法、装置及介质 | |
CN112434717B (zh) | 一种模型训练方法及装置 | |
CN117274212A (zh) | 一种桥梁水下结构裂缝检测方法 | |
CN109657710B (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN111126720A (zh) | 养殖场风险预测方法、装置、设备及存储介质 | |
CN113780338A (zh) | 基于支持向量机的大数据分析中置信度评价方法、系统、设备及存储介质 | |
CN115661542A (zh) | 一种基于特征关系迁移的小样本目标检测方法 | |
CN114330542A (zh) | 一种基于目标检测的样本挖掘方法、装置及存储介质 | |
CN114399497A (zh) | 文本图像质量检测方法、装置、计算机设备及存储介质 | |
CN113515771A (zh) | 数据敏感度判定方法、电子设备及计算机可读存储介质 | |
CN112861689A (zh) | 一种基于nas技术的坐标识别模型的搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |