CN110096630A - 一类基于聚类分析的大数据处理方法 - Google Patents
一类基于聚类分析的大数据处理方法 Download PDFInfo
- Publication number
- CN110096630A CN110096630A CN201910373090.1A CN201910373090A CN110096630A CN 110096630 A CN110096630 A CN 110096630A CN 201910373090 A CN201910373090 A CN 201910373090A CN 110096630 A CN110096630 A CN 110096630A
- Authority
- CN
- China
- Prior art keywords
- data
- cluster
- clustering
- reduction
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Abstract
本发明公开了一类基于聚类分析的大数据处理方法,包括如下步骤:构建算法模型、数据约简聚类、划分聚类优化、构建函数、聚类有效性分析和结果输出,本发明结构科学合理,使用安全方便,该基于聚类分析的大数据处理方法运行时,采集到的原始数据首先会建立原始数据集合,随后进行数据约简,并根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,选取每个聚簇中心位置数据,构建一个划分矩阵代入函数进行优化,随后计算聚类的聚类有效性指标值,若聚类有效性指标值符合,算法终止,输出的运算结果,需转化为计算机所能识别语言,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
Description
技术领域
本发明涉及大数据处理技术领域,具体为一类基于聚类分析的大数据处理方法。
背景技术
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分,据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%,大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值;
聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法,聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法,聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中,聚类分析在电子商务中网站建设数据挖掘中也是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。
发明内容
本发明提供一种技术方案,可以有效解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一类基于聚类分析的大数据处理方法,包括如下步骤:
S1、构建算法模型:在计算机内构建FCM算法模型;
S2、数据约简:代入原始数据,使用数据约简算法对原始数据进行约简;
S3、聚类划分:代入约简后的数据,根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部约简的数据划分为多个聚簇;
S4、聚类优化:选取每个聚簇中心位置数据,构建一个划分矩阵,并代入函数进行优化;
S5、构建函数:构建判别函数;
S6、聚类有效性分析:代入判别函数,得出聚类有效性指标值,若达到终止条件,停止运算,若未达到终止条件,返回步骤2重新计算;
S7、结果输出:输出运算结果,并将运算结果转换为计算机所能识别语言。
根据上述技术特征,所述步骤1中,构建的函数模型为:
这里c是聚类个数,V=[v1,v2,…,vn]是聚类中心向量构成的矩阵,dij=||xj-vi||表示数据xj与聚类中心vi之间的距离,U=(uij)c×n是模糊划分矩阵,uij表示数据xj属于第i类的隶属度值,满足0≤uij≤1,(i=1,…,c,j=1,…,n)与指数m>1是模糊系数,它用来控制聚类划分结果的模糊程度。
根据上述技术特征,所述步骤2中,代入原始数据,假设原始数据集合为约简后数据集合为d(x,S)表示数据x与数据集合S之间的距离,数据约简算法的具体过程如下:
A、初始化阈值γ,l=1,yl=x1,j=2;
B、对数据xj,计算整数r使其满足d(xj,yr)=min1≤k≤ld(xj,yk);
C、如果d(xj,yr)>γ,l=l+1,yl=xj;否则,令yr=yr∪xj,j=j+1;
D、如果j<n,转至步骤B;否则,更新yk为其自身数据集合的均值。
根据上述技术特征,所述步骤3中,代入DWFCM算法模型的约简后数据,会根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部原始数据划分为n个聚簇。
根据上述技术特征,所述步骤4中,选取每个聚簇中心位置数据,构建一个划分矩阵V=(x1+x2+...xn),代入函数进行优化,得到集合Q=(X1+X2+...Xn),去除集合中的重复数据。
根据上述技术特征,所述步骤5中,构建判别函数,判别函数具体为:
设定聚类个数最小值cmin、最大值cmax、模糊系数m、DWFCM算法的最大运行次数Tmax、迭代收敛精度ε,令当前聚类个数c=cmin、运行次数T=0。
根据上述技术特征,所述步骤6具体分为以下几个步骤:
a:利用DRA算法得到约简后数据集合
b:设定权重为数据精简前的数据个数、随机初始化DWFCM算法的隶属度矩阵或者中心;
c:利用
式迭代直至满足DWFCM算法终止条件||Unew-Uold||<ε,设定T=T+1,保存聚类中心与目标函数值;
d:如果T=Tmax,取为DWFCM算法最小目标函数值对应的聚类中心;
e:以为初始中心运行FCM算法,得到聚类中心V与划分矩阵U;
f:根据U、V计算聚类个数c的聚类有效性指标值,聚类有效性指标值符合结果,则停止运算,若不符合,令c=c+1,转至步骤2。
根据上述技术特征,所述步骤6中,步骤c内,取为数据精简前的数据个数,表示数据与聚类中心vi之间的距离。
根据上述技术特征,所述步骤6中,步骤f具体还有以下判别条件:
若c=cmax,根据不同个数下的有效性指标值确定最优聚类个数c*,输出c=c*时的聚类划分矩阵与聚类中心,算法终止,否则,令c=c+1,转至步骤2。
根据上述技术特征,所述步骤7中,输出的运算结果,需转化为计算机所能识别语言,通过计算机内部存储单元进行存储,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便:
该基于聚类分析的大数据处理方法运行时,采集到的原始数据首先会建立原始数据集合随后初始化阈值γ,l=1,yl=x1,j=2,对数据xj,计算整数r使其满足d(xj,yr)=min1≤k≤ld(xj,yk),如果d(xj,yr)>γ,l=l+1,yl=xj;否则,令yr=yr∪xj,j=j+1,如果j<n,转至步骤B;否则,更新yk为其自身数据集合的均值,约简后数据集合为代入DWFCM算法模型的约简后数据,会根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部原始数据划分为n个聚簇,选取每个聚簇中心位置数据,构建一个划分矩阵V=(x1+x2+...xn),代入函数进行优化,得到集合Q=(X1+X2+...Xn),去除集合中的重复数据,利用DRA算法得到约简后数据集合设定权重为数据精简前的数据个数、随机初始化DWFCM算法的隶属度矩阵或者中心,利用和式迭代直至满足DWFCM算法终止条件||Unew-Uold||<ε,设定T=T+1,保存聚类中心与目标函数值,如果T=Tmax,取为DWFCM算法最小目标函数值对应的聚类中心,以为初始中心运行FCM算法,得到聚类中心V与划分矩阵U,根据U、V计算聚类个数c的聚类有效性指标值,若c=cmax,根据不同个数下的有效性指标值确定最优聚类个数c*,输出c=c*时的聚类划分矩阵与聚类中心,算法终止,否则,令c=c+1,转至步骤2,输出的运算结果,需转化为计算机所能识别语言,通过计算机内部存储单元进行存储,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明的流程结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1所示,本发明提供一种技术方案,本发明提供如下技术方案:一类基于聚类分析的大数据处理方法,包括如下步骤:
S1、构建算法模型:在计算机内构建FCM算法模型;
S2、数据约简:代入原始数据,使用数据约简算法对原始数据进行约简;
S3、聚类划分:代入约简后的数据,根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部约简的数据划分为多个聚簇;
S4、聚类优化:选取每个聚簇中心位置数据,构建一个划分矩阵,并代入函数进行优化;
S5、构建函数:构建判别函数;
S6、聚类有效性分析:代入判别函数,得出聚类有效性指标值,若达到终止条件,停止运算,若未达到终止条件,返回步骤2重新计算;
S7、结果输出:输出运算结果,并将运算结果转换为计算机所能识别语言。
根据上述技术特征,步骤1中,构建的函数模型为:
这里c是聚类个数,V=[v1,v2,…,vn]是聚类中心向量构成的矩阵,dij=||xj-vi||表示数据xj与聚类中心vi之间的距离,U=(uij)c×n是模糊划分矩阵,uij表示数据xj属于第i类的隶属度值,满足0≤uij≤1,(i=1,…,c,j=1,…,n)与指数m>1是模糊系数,它用来控制聚类划分结果的模糊程度。
根据上述技术特征,步骤2中,代入原始数据,假设原始数据集合为约简后数据集合为d(x,S)表示数据x与数据集合S之间的距离,数据约简算法的具体过程如下:
A、初始化阈值γ,l=1,yl=x1,j=2;
B、对数据xj,计算整数r使其满足d(xj,yr)=min1≤k≤ld(xj,yk);
C、如果d(xj,yr)>γ,l=l+1,yl=xj;否则,令yr=yr∪xj,j=j+1;
D、如果j<n,转至步骤B;否则,更新yk为其自身数据集合的均值。
根据上述技术特征,步骤3中,代入DWFCM算法模型的约简后数据,会根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部原始数据划分为n个聚簇。
根据上述技术特征,步骤4中,选取每个聚簇中心位置数据,构建一个划分矩阵V=(x1+x2+...xn),代入函数进行优化,得到集合Q=(X1+X2+...Xn),去除集合中的重复数据。
根据上述技术特征,步骤5中,构建判别函数,判别函数具体为:
设定聚类个数最小值cmin、最大值cmax、模糊系数m、DWFCM算法的最大运行次数Tmax、迭代收敛精度ε,令当前聚类个数c=cmin、运行次数T=0。
根据上述技术特征,步骤6具体分为以下几个步骤:
a:利用DRA算法得到约简后数据集合
b:设定权重为数据精简前的数据个数、随机初始化DWFCM算法的隶属度矩阵或者中心;
c:利用
和
式迭代直至满足DWFCM算法终止条件||Unew-Uold||<ε,设定T=T+1,保存聚类中心与目标函数值;
d:如果T=Tmax,取为DWFCM算法最小目标函数值对应的聚类中心;
e:以为初始中心运行FCM算法,得到聚类中心V与划分矩阵U;
f:根据U、V计算聚类个数c的聚类有效性指标值,聚类有效性指标值符合结果,则停止运算,若不符合,令c=c+1,转至步骤2。
根据上述技术特征,步骤6中,步骤c内,取为数据精简前的数据个数,表示数据与聚类中心vi之间的距离。
根据上述技术特征,步骤6中,步骤f具体还有以下判别条件:
若c=cmax,根据不同个数下的有效性指标值确定最优聚类个数c*,输出c=c*时的聚类划分矩阵与聚类中心,算法终止,否则,令c=c+1,转至步骤2。
根据上述技术特征,步骤7中,输出的运算结果,需转化为计算机所能识别语言,通过计算机内部存储单元进行存储,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
本发明的工作原理及使用流程:该基于聚类分析的大数据处理方法运行时,采集到的原始数据首先会建立原始数据集合随后初始化阈值γ,l=1,yl=x1,j=2,对数据xj,计算整数r使其满足d(xj,yr)=min1≤k≤ld(xj,yk),如果d(xj,yr)>γ,l=l+1,yl=xj;否则,令yr=yr∪xj,j=j+1,如果j<n,转至步骤B;否则,更新yk为其自身数据集合的均值,约简后数据集合为代入DWFCM算法模型的约简后数据,会根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部原始数据划分为n个聚簇,选取每个聚簇中心位置数据,构建一个划分矩阵V=(x1+x2+...xn),代入函数进行优化,得到集合Q=(X1+X2+...Xn),去除集合中的重复数据,利用DRA算法得到约简后数据集合设定权重为数据精简前的数据个数、随机初始化DWFCM算法的隶属度矩阵或者中心,利用和式迭代直至满足DWFCM算法终止条件||Unew-Uold||<ε,设定T=T+1,保存聚类中心与目标函数值,如果T=Tmax,取为DWFCM算法最小目标函数值对应的聚类中心,以为初始中心运行FCM算法,得到聚类中心V与划分矩阵U,根据U、V计算聚类个数c的聚类有效性指标值,若c=cmax,根据不同个数下的有效性指标值确定最优聚类个数c*,输出c=c*时的聚类划分矩阵与聚类中心,算法终止,否则,令c=c+1,转至步骤2,输出的运算结果,需转化为计算机所能识别语言,通过计算机内部存储单元进行存储,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一类基于聚类分析的大数据处理方法,其特征在于,包括如下步骤:
S1、构建算法模型:在计算机内构建FCM算法模型;
S2、数据约简:代入原始数据,使用数据约简算法对原始数据进行约简;
S3、聚类划分:代入约简后的数据,根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部约简的数据划分为多个聚簇;
S4、聚类优化:选取每个聚簇中心位置数据,构建一个划分矩阵,并代入函数进行优化;
S5、构建函数:构建判别函数:
S6、聚类有效性分析:代入判别函数,得出聚类有效性指标值,若达到终止条件,停止运算,若未达到终止条件,返回步骤2重新计算;
S7、结果输出:输出运算结果,并将运算结果转换为计算机所能识别语言。
2.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤1中,构建的函数模型为:
这里c是聚类个数,V=[v1,v2,…,vn]是聚类中心向量构成的矩阵,dij=||xj-vi||表示数据xj与聚类中心vi之间的距离,U=(uij)c×n是模糊划分矩阵,uij表示数据xj属于第i类的隶属度值,满足0≤uij≤1,(i=1,…,c,j=1,…,n)与指数m>1是模糊系数,它用来控制聚类划分结果的模糊程度。
3.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤2中,代入原始数据,假设原始数据集合为约简后数据集合为d(x,S)表示数据x与数据集合S之间的距离,数据约简算法的具体过程如下:
A、初始化阈值γ,l=1,yl=x1,j=2;
B、对数据xj,计算整数r使其满足d(xj,yr)=min1≤k≤ld(xj,yk);
C、如果d(xj,yr)>γ,l=l+1,yl=xj;否则,令j=j+1;
D、如果j<n,转至步骤B;否则,更新yk为其自身数据集合的均值。
4.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤3中,代入DWFCM算法模型的约简后数据,会根据约简后数据中的特征选择,选择具有相同特征的划分成单个聚簇,将全部原始数据划分为n个聚簇。
5.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤4中,选取每个聚簇中心位置数据,构建一个划分矩阵V=(x1+x2+...xn),代入函数进行优化,得到集合Q=(X1+X2+...Xn),去除集合中的重复数据。
6.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤5中,构建判别函数,判别函数具体为:
设定聚类个数最小值cmin、最大值cmax、模糊系数m、DWFCM算法的最大运行次数Tmax、迭代收敛精度ε,令当前聚类个数c=cmin、运行次数T=0。
7.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤6具体分为以下几个步骤:
a:利用DRA算法得到约简后数据集合
b:设定权重为数据精简前的数据个数、随机初始化DWFCM算法的隶属度矩阵或者中心;
c:利用
和
式迭代直至满足DWFCM算法终止条件||Unew-Uold||<ε,设定T=T+1,保存聚类中心与目标函数值;
d:如果T=Tmax,取为DWFCM算法最小目标函数值对应的聚类中心;
e:以为初始中心运行FCM算法,得到聚类中心V与划分矩阵U;
f:根据U、V计算聚类个数c的聚类有效性指标值,聚类有效性指标值符合结果,则停止运算,若不符合,令c=c+1,转至步骤2。
8.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤6中,步骤c内,取为数据精简前的数据个数,表示数据与聚类中心vi之间的距离。
9.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤6中,步骤f具体还有以下判别条件:
若c=cmax,根据不同个数下的有效性指标值确定最优聚类个数c*,输出c=c*时的聚类划分矩阵与聚类中心,算法终止,否则,令c=c+1,转至步骤2。
10.根据权利要求1所述的一类基于聚类分析的大数据处理方法,其特征在于,所述步骤7中,输出的运算结果,需转化为计算机所能识别语言,通过计算机内部存储单元进行存储,并通过计算机将运算结果转化为图表呈现在电子显示设备上,供使用者参考。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373090.1A CN110096630A (zh) | 2019-05-06 | 2019-05-06 | 一类基于聚类分析的大数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373090.1A CN110096630A (zh) | 2019-05-06 | 2019-05-06 | 一类基于聚类分析的大数据处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110096630A true CN110096630A (zh) | 2019-08-06 |
Family
ID=67447010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910373090.1A Pending CN110096630A (zh) | 2019-05-06 | 2019-05-06 | 一类基于聚类分析的大数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110096630A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291822A (zh) * | 2020-02-21 | 2020-06-16 | 南京航空航天大学 | 基于模糊聚类最优k值选择算法的设备运行状态判断方法 |
CN111651755A (zh) * | 2020-05-08 | 2020-09-11 | 中国联合网络通信集团有限公司 | 入侵检测方法和装置 |
CN111756600A (zh) * | 2020-06-24 | 2020-10-09 | 厦门长江电子科技有限公司 | 一种实现多种交换机测试机的多通信系统及方法 |
CN113807413A (zh) * | 2021-08-30 | 2021-12-17 | 北京百度网讯科技有限公司 | 对象的识别方法、装置、电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020091655A1 (en) * | 2000-03-22 | 2002-07-11 | Agrafiotis Dimitris K. | System, method, and computer program product for representing object relationships in a multidimensional space |
CN103838210A (zh) * | 2014-02-25 | 2014-06-04 | 北京理工大学 | 突发事件现场有毒气体远程无线监测系统和方法 |
CN107239800A (zh) * | 2017-06-06 | 2017-10-10 | 常州工学院 | 松弛模糊c均值聚类算法 |
CN107330458A (zh) * | 2017-06-27 | 2017-11-07 | 常州信息职业技术学院 | 一种最小方差优化初始聚类中心的模糊c均值聚类方法 |
CN108830162A (zh) * | 2018-05-21 | 2018-11-16 | 西华大学 | 无线电频谱监测数据中的时序模式序列提取方法及存储方法 |
-
2019
- 2019-05-06 CN CN201910373090.1A patent/CN110096630A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020091655A1 (en) * | 2000-03-22 | 2002-07-11 | Agrafiotis Dimitris K. | System, method, and computer program product for representing object relationships in a multidimensional space |
CN103838210A (zh) * | 2014-02-25 | 2014-06-04 | 北京理工大学 | 突发事件现场有毒气体远程无线监测系统和方法 |
CN107239800A (zh) * | 2017-06-06 | 2017-10-10 | 常州工学院 | 松弛模糊c均值聚类算法 |
CN107330458A (zh) * | 2017-06-27 | 2017-11-07 | 常州信息职业技术学院 | 一种最小方差优化初始聚类中心的模糊c均值聚类方法 |
CN108830162A (zh) * | 2018-05-21 | 2018-11-16 | 西华大学 | 无线电频谱监测数据中的时序模式序列提取方法及存储方法 |
Non-Patent Citations (1)
Title |
---|
曲福恒等: "一种高效鲁棒的无监督模糊c均值聚类算法", 《吉林大学学报(理学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291822A (zh) * | 2020-02-21 | 2020-06-16 | 南京航空航天大学 | 基于模糊聚类最优k值选择算法的设备运行状态判断方法 |
CN111291822B (zh) * | 2020-02-21 | 2023-05-05 | 南京航空航天大学 | 基于模糊聚类最优k值选择算法的设备运行状态判断方法 |
CN111651755A (zh) * | 2020-05-08 | 2020-09-11 | 中国联合网络通信集团有限公司 | 入侵检测方法和装置 |
CN111651755B (zh) * | 2020-05-08 | 2023-04-18 | 中国联合网络通信集团有限公司 | 入侵检测方法和装置 |
CN111756600A (zh) * | 2020-06-24 | 2020-10-09 | 厦门长江电子科技有限公司 | 一种实现多种交换机测试机的多通信系统及方法 |
CN113807413A (zh) * | 2021-08-30 | 2021-12-17 | 北京百度网讯科技有限公司 | 对象的识别方法、装置、电子设备 |
CN113807413B (zh) * | 2021-08-30 | 2024-02-06 | 北京百度网讯科技有限公司 | 对象的识别方法、装置、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110096630A (zh) | 一类基于聚类分析的大数据处理方法 | |
CN104951425B (zh) | 一种基于深度学习的云服务性能自适应动作类型选择方法 | |
Guan et al. | Text clustering with seeds affinity propagation | |
WO2019144066A1 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
CN110458187A (zh) | 一种恶意代码家族聚类方法和系统 | |
CN105825269B (zh) | 一种基于并行自动编码机的特征学习方法及系统 | |
CN106067034B (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN110175168A (zh) | 一种基于生成对抗网络的时间序列数据填补方法及系统 | |
CN113807520A (zh) | 基于图神经网络的知识图谱对齐模型的训练方法 | |
CN103838803A (zh) | 一种基于节点Jaccard相似度的社交网络社团发现方法 | |
CN109214429A (zh) | 基于矩阵引导正则化的局部缺失多视图聚类机器学习方法 | |
CN109919172A (zh) | 一种多源异构数据的聚类方法及装置 | |
CN114881223B (zh) | 深度学习模型的转换方法、装置、电子设备和存储介质 | |
CN106789338B (zh) | 一种在动态大规模社交网络中发现关键人物的方法 | |
CN113221475A (zh) | 一种用于高精度流场分析的网格自适应方法 | |
CN108898273A (zh) | 一种基于形态分析的用户侧负荷特征聚类评价方法 | |
US20230005572A1 (en) | Molecular structure acquisition method and apparatus, electronic device and storage medium | |
Green II et al. | Intelligent state space pruning for Monte Carlo simulation with applications in composite power system reliability | |
CN103207804B (zh) | 基于集群作业日志的MapReduce负载模拟方法 | |
Chen et al. | Differentiated graph regularized non-negative matrix factorization for semi-supervised community detection | |
CN102982567B (zh) | 一种基于统计分析的变形体碰撞检测剔除方法 | |
CN114580645A (zh) | 随机量子测量的模拟方法、装置、设备及存储介质 | |
Cheng et al. | Mofsrank: a multiobjective evolutionary algorithm for feature selection in learning to rank | |
CN110717043A (zh) | 基于网络表示学习训练的学术团队构建方法 | |
CN113408304B (zh) | 文本翻译方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |