CN113157816B - 一种基于网格密度的消费者分类标签融合过滤方法 - Google Patents

一种基于网格密度的消费者分类标签融合过滤方法 Download PDF

Info

Publication number
CN113157816B
CN113157816B CN202110258151.7A CN202110258151A CN113157816B CN 113157816 B CN113157816 B CN 113157816B CN 202110258151 A CN202110258151 A CN 202110258151A CN 113157816 B CN113157816 B CN 113157816B
Authority
CN
China
Prior art keywords
grid
class
membership
sample
consumer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110258151.7A
Other languages
English (en)
Other versions
CN113157816A (zh
Inventor
左毅
赵力澄
孙卓
矢田胜俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202110258151.7A priority Critical patent/CN113157816B/zh
Publication of CN113157816A publication Critical patent/CN113157816A/zh
Application granted granted Critical
Publication of CN113157816B publication Critical patent/CN113157816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于网格密度的消费者分类标签融合过滤方法,该方法主要包括三个处理阶段,具体包括:对消费者数据样本进预处理,构建样本集;消费者每个特征维度的划分和网格构建处理;网格中分类标签的融合及过滤处理;最后,利用机器学习方法,应用融合过滤后的数据集进行消费者分类。本发明针对消费者分类中的标签重叠和数据偏斜问题提出了一个行之有效的解决方法,使原样本集在标签重构处理后进行的消费者分类中可以获得更高的分类精度。

Description

一种基于网格密度的消费者分类标签融合过滤方法
技术领域
本发明涉及行为识别技术领域,具体而言,尤其涉及一种基于网格密度的消费者分类标签融合过滤方法。
背景技术
在消费者细分领域,数据挖掘和机器学习的分类技术被广泛的使用。然而,在实际的问题中,由于消费者在购物过程中受环境、主观认知和行为等因素影响,但在数据采集中不能100%的对所有影响因素进行度量。因此,不同类别所属的消费者样本集在某些特征上具有相似甚至相同的表现特征,从而使得消费者标签特征重叠,导致消费者的识别分类效果不佳,无法满足实际需求。同时,相关的研究也表明,分类器划分错误往往集中在标签特征空间的边界区域,而这正是本发明解决的类标签重叠问题。
2005年,Prati和Batista等通过人工生成重叠数据对类标签重叠问题进行了系统分析,结果表明类标签重叠的程度与类数据特征不均衡有紧密的联系。在消费者细分问题中,一般会对消费者购买行为进行识别分类,其中就经常存在着购买样本和非购买样本的两种数据量相差较大的标签不均衡问题。此时,小样本中的消费者购买识别分类精度偏低,很难对消费者的购买决策作出有效判断。Garaia和Mollineda等将多个不同类型的分类器,包括K-NN、MLP、NB、RBF和C4.5等,应用在标签重叠区域的偏斜数据集上,实验结果表明基于全局学习的分类器仅仅有助于类标签重叠区域的大类样本的分类精度提升。
现有文献经常讨论不平衡数据集的解决方案,如数据级和算法级方法。过采样和欠采样是最常见的数据级技术,通过调整不同类之间的平衡率来实现类别间的均衡分布;在标签重叠问题研究中,主要有两种不同的解决思路,一种是将重叠区域的样本合并为一个新的类,先进行多分类,然后再针对新的类构建模型进行二分类;另一种是对重叠区域和非重叠区域样本进行分割学习,构建架不同的分类模型。然而,在现有的这两种思路的解决方法本质上都是针对不同的分类样本空间构建不同的分类器,提升了问题复杂度,在具有高不平衡比和类重叠的消费者行为数据集中,这样的方法可能并不能很好地解决消费者细分中的标签重叠问题。
发明内容
根据上述提出并不能很好地解决消费者细分中的标签重叠问题的技术问题,而提供一种基于网格密度的消费者分类标签融合过滤方法。本发明主要利用一种基于网格密度的消费者分类标签融合过滤方法,其特征在于,包括以下步骤:
步骤S1:对消费者样本数据预处理:将每一个消费者数据作为数值实验的一个样本;根据所述消费者数据构建消费者分类样本集:
Figure GDA0003078158540000021
其中,N表示样本总量,类别yi∈{1,…,C},C(C≥2)表示样本类别;Xi表示样本i的特征,
Figure GDA0003078158540000022
表示样本特征维度,
Figure GDA0003078158540000023
表示样本i的第h个特征;令
Figure GDA0003078158540000024
表示所有样本特征k取值的矩阵;
步骤S2:根据步长对特征空间进行网格划分并构建初始网格;
根据消费者样本特征数据以及网格步长进行网格划分,并构建出划分后的初始网格;
步骤S3:对所述初始网格中的分类标签进行融合及过滤处理;
根据所述初始网格为基本网格单元,计算每个网格中所含标签样本的类密度δ与隶属度α,设定参数网格隶属度阈值θ,根据所述阈值θ识别所述每个网格的隶属类,当网格中某类隶属度大于等于该阈值时,则表示该类为网格的隶属类;
步骤S4:通过机器学习方法,应用融合过滤后的数据集进行消费者分类。
进一步地,根据步长对特征空间进行网格划分并构建初始网格,所述步骤S2中,具体步骤如下:
步骤S21:对所述特征空间进行划分;根据所述消费者样本数据确定特征维度k和输入步长参数d,对k维特征的每一特征进行等间距划分,将全空间划分为等体积的网格单元;其中,d表示网格步长,即每个特征的网格边的长度;
步骤S22:构建初始网格;通过步长d表示出每个特征所有的取值段集合,对划分后不同特征的取值段集合,分别取其中一段进行组合,得到一个包含k个元素来自k个特征的取值段集合,即表示为一个网格;消费者样本根据网格划分的步长d,确定出其所属网格的区域位置,并标记样本所属网格。
更进一步地,所述步骤S3中,具体步骤如下:
步骤S31:计算每个初始网格的α和δ值,其计算式分别如下:
Figure GDA0003078158540000031
Figure GDA0003078158540000032
其中,I()表示指示函数,隶属度α表示网格了某一类标签样本占网格中所有样本的比率,用于衡量该网格隶属于该类别标签的概率;αj表示j类在网格内的隶属度,αj越大表明网格隶属于j类的概率越大;类密度δ表示网格内某一类标签样本在网格中的数量,表示该类别在网格中的聚集程度;δj表示j类在网格内的密度,表示j类样本在网格中的数量;
步骤S32:设定参数网格隶属度阈值θ,遍历所有网格,确定每个网格的隶属类;当网格中隶属度和隶属度阈值满足maxα=αj,αj≥θ时,则j类为该网格中的隶属类;若某网格中maxα=αj,αj<θ时,则无法确定网格的隶属类,此时,该网格需要进一步处理;根据隶属度及隶属度阈值无法确定网格的隶属类时,该网格需要与周围相邻的网格分别进行合并,计算并筛选出其与每一个相邻网格合并后所得网格的最大隶属度,选取所有合并网格中隶属度值最大的网格,据隶属度阈值确定该合并后网格的隶属类,即max{α1,…,αU}=αu,u∈{1,…,U},U为其相邻网格数。若满足条件
Figure GDA0003078158540000033
Figure GDA0003078158540000034
则停止合并;否则,该网格再次与周围相邻网格进行合并,直到能够确定出合并后网格的隶属度为止;
步骤S33:当所有网格均确定出网格的隶属类后,标记相同隶属类的网格组成联通区域,遍历整个数据集,将网格的隶属类标记到其内样本数据集,得到新样本集:
Figure GDA0003078158540000041
较现有技术相比,本发明具有以下优点:
本发明针对类重叠和不平衡消费者行为数据分类设计了一个基于网格的消费者分类标签融合过滤方法,相比直接应用样本进行分类,通过该方法能够提供相较于原始样本更易区分的分类样本集,能有效的解决消费者分类中的类重叠及不均衡数据分类难题。
通过网格重构样本标签,组成新的消费者行为数据集,利用支持向量机、神经网络等机器学习方法对融合过滤后的样本数据集进行分类。通过将数据集类重叠部分的样本经过网格划分赋予新的标签,能够使数据集的特征更便于分类器的识别,提升分类器性能。
本发明的特点及有益效果:机器学习技术被广泛的应用于营销领域的顾客细分中,然而,对于在顾客实际消费过程中收集的行为数据中出现的类重叠和类不平衡现象的状况,机器学习算法依然很难取得满意的分类效果。
第一,本发明提出了一种基于网格的消费者分类标签融合过滤方法。该方法以网格内各类别密度为依据,对其内的样本标签进行融合过滤,用于寻找类别间明显的分界面。该方法通过改变类重叠区域某一范围内类别密度较小类的标签,使其与密度大的类别进行融合,形成便于机器学习算法识别的分界面。
第二,本发明以网格内类别密度作为样本标签的重构依据,使得每一类样本在聚集度高的区域能够形成聚集簇,能有效降低对不均衡数据集中的小样本类别的错分风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为类重叠和类偏斜的消费者行为数据集分类问题示例图。其中,Feature 1和Feature 2分别表示消费者店内的两个行为特征。
图2为相邻网格合并图(以二维网格为例)
图3为三维相邻网格合并图。
图4为本发明基于网格的消费者分类标签融合过滤方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1-4所示,本发明提供了一种基于网格的消费者分类标签融合过滤方法,具有如下步骤:
步骤S1:消费者样本数据预处理,将每一个消费者数据作为数值实验的一个样本。根据消费者的各种采集数据构建消费者分类样本集:
Figure GDA0003078158540000051
其中,N为样本总量。类别yi∈{1,…,C},C(C≥2)表示样本类别;Xi表示样本i的特征,
Figure GDA0003078158540000061
表示样本特征维度,
Figure GDA0003078158540000062
表示样本i的第h个特征。令
Figure GDA0003078158540000063
表示所有样本特征k取值的矩阵。
步骤S2:根据步长对特征空间进行网格划分并构建初始网格。根据S1中表示出的消费者样本特征数据以及网格步长进行网格划分,并构建出划分后的初始网格。具体步骤如下:
步骤S21:对特征空间进行划分。根据消费者样本数据确定特征维度k和输入参数d,对k维空间的每一维度进行等量划分,将全空间划分为互不相交的网格单元。在进行网格划分前,设定参数值d,d表示网格步长,是每个维度任一网格边的长度。
据步长d将特征空间划分成互不相交的网格单元,划分后某变量维度在单个网格中的取值区域Ak为:
A={A1,…,Ak}
Figure GDA0003078158540000064
其中,tk表示在特征k所处维度以d为步长进行划分后的序数点,值为正整数。
S22:构建初始网格。利用步长d表示出每个特征所有的取值段集合,据此得出网格的集合表达。每个样本根据网格划分的步长d,确定出所属网格的区域位置,并标记样本所属网格。
由S21及前文叙述所诉可知,网格起始范围中min(Vk)与d在实际应用环境中均为定值,tk值不同,所表示的网格不同,因此,网格表示为:
Figure GDA0003078158540000065
根据样本特征的取值,可以确定出每个样本(Xi,yi)所属网格所处的取值区域,表示为:
Figure GDA0003078158540000066
其中,
Figure GDA0003078158540000067
表示样本i在特征k所属维度计算出的序数点,计算式为:
Figure GDA0003078158540000068
Figure GDA0003078158540000069
时,则表示样本i在网格
Figure GDA00030781585400000610
中。此时,样本i标记为
Figure GDA00030781585400000611
记网格
Figure GDA00030781585400000612
中样本集合为
Figure GDA00030781585400000613
S3:网格中分类标签的融合及过滤处理。以S2中构建好的网格为基本网格单元,计算每个网格中所含样本的类密度δ与隶属度α,设定参数网格隶属度阈值θ,根据给定的θ值识别网格的隶属类,当网格中某类隶属度大于等于该阈值时,表示该类为网格的隶属类。
基于网格的消费者分类标签融合及过滤处理过程为:
S31:计算每个初始网格的α和δ值,其计算式分别如下:
Figure GDA0003078158540000071
Figure GDA0003078158540000072
其中,I()为指示函数,α隶属度表示网格了某一类标签样本占网格中所有样本的比率,用于衡量该网格隶属于该类别标签的概率。αj为j类在网格内的隶属度,αj越大表明网格隶属于j类的概率越大。类密度δ表示网格内某一类样本在网格中的数量,表示该类别在网格中的聚集程度。δj为j类在网格内的密度,表示j类样本在网格中的数量。
S32:设定参数网格隶属度阈值θ,遍历所有网格,确定每个网格的隶属类。当网格中隶属度和隶属度阈值满足maxα=αj,αj≥θ时,则j类为该网格中的隶属类。即在网格
Figure GDA0003078158540000073
中,有maxα=αj,1≤j≤C,若αj≥θ,则j即为网格的隶属类,此时,网格
Figure GDA0003078158540000074
标记为
Figure GDA0003078158540000075
网格中的样本标记为:
Figure GDA0003078158540000076
根据隶属度及隶属度阈值无法确定网格的隶属类时,该网格需要与周围相邻的网格分别进行合并(如图3所示),计算并筛选出其与每一个相邻网格合并后所得网格的最大隶属度,选取所有合并网格中隶属度值最大的网格,据隶属度阈值确定该合并后网格的隶属类,即max{α1,…,αU}=αu,u∈{1,…,U},U为其相邻网格数。若满足条件
Figure GDA0003078158540000077
则停止合并;否则,该网格再次与周围相邻网格进行合并(如图2所示),直到能够确定出合并后网格的隶属度为止。
在具有k维的高维空间中,两个网格相邻的条件有:记
Figure GDA0003078158540000078
其中L为有限集合,L中元素个数表示为card(L),此时,存在
Figure GDA0003078158540000079
当card(L)=k-1,th-1=t′h或th=t′h-1时,
Figure GDA0003078158540000081
为相邻网格。
当第h个特征的单个网格取值段A′h在Ah的左侧与其紧邻,即th-1=t′h时,合并后网格表示为:
Figure GDA0003078158540000082
当第h个特征的单个网格取值段A′h在Ah的右侧与其紧邻,即th=t′h-1时,合并后网格表示为:
Figure GDA0003078158540000083
根据隶属度阈值θ确定合并后网格的隶属类j后,合并后的网格标记为
Figure GDA0003078158540000084
Figure GDA0003078158540000085
网格中的样本分别标记为(其中,yi∈{1,…,C},y′i=j):
Figure GDA0003078158540000086
S33:当所有网格均确定出网格的隶属类后,标记相同隶属类的网格组成联通区域,遍历整个数据集,将网格隶属类标记到其内样本数据集,得到新样本集:
Figure GDA0003078158540000087
S4:最后,利用机器学习方法,应用融合过滤后的数据集进行消费者分类。
传统的应用消费者样本集
Figure GDA0003078158540000088
进行有监督的消费者分类时,在训练集中,是以特征Xi标签yi作为学习对象,训练出模型M。在这样的消费者样本集进行模型训练时,在类重叠区域,模型M在对这部分进行划分时,由于损失函数的松弛变量所需要的支付的代价增加,惩罚参数设置过大则无法使损失函数达到具有较强泛化能力的收敛条件,惩罚参数设置过小,则会忽略小样本的分类精度,致使分类结果不佳。
应用基于网格的消费者分类标签融合过滤方法,得到新的样本数据集
Figure GDA0003078158540000089
进行分类模型构建时,以特征Xi标签yi′作为学习对象,训练出模型M′。对于模型M和M′,在训练是特征Xi一致,但通过基于网格的消费者分类标签融合过滤方法后,其学习的标签发生了变化,在原始的重叠区域能够将不同类别清晰的进行划分,模型预测和真实标签之间的精度关系更容易通过损失函数进行调节。其改进主要有如下两个优点:
①在重叠区域网格的隶属类是满足其密度在某一网格中所占的比例大于或等于隶属阈值θ,故保证了重叠区域这一区域范围内yi′和yi满足数值θ以上的正确率。
②基于网格的消费者分类标签融合过滤方法赋予了网格内所有样本相同的标签,使分类模型在进行损失函数寻优时能够尽可能少的受到某一类样本点离群值的影响,此时,损失函数对每个松弛变量所需要支付的代价便会减少,损失函数的惩罚参数越大,对错分点容忍度更低,使模型M′的精确度较M更高。
综上,本发明针对类重叠和不平衡消费者行为数据样本集设计了一个基于网格的消费者分类标签融合过滤方法,相比于传统的分类数据处理方法,该方法通过基于网格内类别的密度进行分类标签的融合过滤,构造新的样本数据集,以提高样本数据在分类器中的可分性,提升分类准确率。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (3)

1.一种基于网格密度的消费者分类标签融合过滤方法,其特征在于,包括以下步骤:
S1:对消费者样本数据预处理:将每一个消费者数据作为数值实验的一个样本,每个消费者样本数据包含有消费者样本特征数据和消费者样本类别数据;根据所述消费者数据构建消费者分类样本集:
其中,N表示样本总量,类别yi∈{1,…,C},C(C≥2)表示样本类别;Xi表示样本i的特征,表示样本特征维度,表示样本i的第h个特征;令表示所有样本特征k取值的矩阵;
S2:根据步长对特征空间进行网格划分并构建初始网格;
根据消费者样本特征数据以及网格步长进行网格划分,并构建出划分后的初始网格;
S3:对所述初始网格中的分类标签进行融合及过滤处理;
根据所述初始网格为基本网格单元,计算每个网格中所含标签样本的类密度δ与隶属度α,设定参数网格隶属度阈值θ,根据所述阈值θ识别所述每个网格的隶属类,当网格中某类隶属度大于等于该阈值时,则表示该类为网格的隶属类;
S4:通过机器学习方法,应用融合过滤后的数据集进行消费者分类。
2.根据权利要求1所述的一种基于网格密度的消费者分类标签融合过滤方法,其特征在于,
根据步长对特征空间进行网格划分并构建初始网格,所述步骤S2中,具体步骤如下:
S21:对所述特征空间进行划分;根据所述消费者样本数据确定特征维度k和输入步长参数d,对k维特征的每一特征进行等间距划分,将全空间划分为等体积的网格单元;其中,d表示网格步长,即每个特征的网格边的长度;
S22:构建初始网格;通过步长d表示出每个特征所有的取值段集合,对划分后不同特征的取值段集合,分别取其中一段进行组合,得到一个包含k个元素来自k个特征的取值段集合,即表示为一个网格;消费者样本根据网格划分的步长d,确定出其所属网格的区域位置,并标记样本所属网格。
3.根据权利要求1所述的一种基于网格密度的消费者分类标签融合过滤方法,其特征在于,
所述步骤S3中,具体步骤如下:
S31:计算每个初始网格的α和δ值,其计算式分别如下:
其中,I()表示指示函数,隶属度α表示网格中某一类标签样本占网格中所有样本的比率,用于衡量该网格隶属于该类别标签的概率;αj表示j类在网格内的隶属度,αj越大表明网格隶属于j类的概率越大;类密度δ表示网格内某一类标签样本在网格中的数量,表示该类别在网格中的聚集程度;δj表示j类在网格内的密度,表示j类样本在网格中的数量;
S32:设定参数网格隶属度阈值θ,遍历所有网格,确定每个网格的隶属类;当网格中隶属度和隶属度阈值满足maxα=αj,αj≥θ时,则j类为该网格中的隶属类;若某网格中maxα=αj,αj<θ时,则无法确定网格的隶属类,此时,该网格需要进一步处理;根据隶属度及隶属度阈值无法确定网格的隶属类时,该网格需要与周围相邻的网格分别进行合并,计算并筛选出其与每一个相邻网格合并后所得网格的最大隶属度,选取所有合并网格中隶属度值最大的网格,据隶属度阈值确定该合并后网格的隶属类,即max{α1,…,αU}=αu,u∈{1,…,U},U为其相邻网格数;若满足条件 则停止合并;否则,该网格再次与周围相邻网格进行合并,直到能够确定出合并后网格的隶属度为止;
S33:当所有网格均确定出网格的隶属类后,标记相同隶属类的网格组成联通区域,遍历整个数据集,将网格的隶属类标记到其内样本数据集,得到新样本集:
CN202110258151.7A 2021-03-09 2021-03-09 一种基于网格密度的消费者分类标签融合过滤方法 Active CN113157816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110258151.7A CN113157816B (zh) 2021-03-09 2021-03-09 一种基于网格密度的消费者分类标签融合过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110258151.7A CN113157816B (zh) 2021-03-09 2021-03-09 一种基于网格密度的消费者分类标签融合过滤方法

Publications (2)

Publication Number Publication Date
CN113157816A CN113157816A (zh) 2021-07-23
CN113157816B true CN113157816B (zh) 2023-05-16

Family

ID=76886580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110258151.7A Active CN113157816B (zh) 2021-03-09 2021-03-09 一种基于网格密度的消费者分类标签融合过滤方法

Country Status (1)

Country Link
CN (1) CN113157816B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545577A (zh) * 2017-08-23 2018-01-05 电子科技大学 基于神经网络的沉积相图像分割方法
CN110210534A (zh) * 2019-05-21 2019-09-06 河海大学 基于多包融合的高分遥感图像场景多标签分类方法
CN111783826A (zh) * 2020-05-27 2020-10-16 西华大学 一种基于预分类与集成学习的驾驶风格分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10037603B2 (en) * 2015-05-04 2018-07-31 Siemens Healthcare Gmbh Method and system for whole body bone removal and vascular visualization in medical image data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545577A (zh) * 2017-08-23 2018-01-05 电子科技大学 基于神经网络的沉积相图像分割方法
CN110210534A (zh) * 2019-05-21 2019-09-06 河海大学 基于多包融合的高分遥感图像场景多标签分类方法
CN111783826A (zh) * 2020-05-27 2020-10-16 西华大学 一种基于预分类与集成学习的驾驶风格分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于VGGNet和标签分布学习的航拍目标分类方法;戚银城;赵振兵;杜丽群;乔弘;王磊;;电力建设(02);全文 *

Also Published As

Publication number Publication date
CN113157816A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
Turaga et al. Convolutional networks can learn to generate affinity graphs for image segmentation
Wang et al. Improving semi-supervised co-forest algorithm in evolving data streams
CN107169768A (zh) 异常交易数据的获取方法和装置
Zare et al. Determination of Customer Satisfaction using Improved K-means algorithm
CN115661550B (zh) 基于生成对抗网络的图数据类别不平衡分类方法及装置
Aslani et al. A fast instance selection method for support vector machines in building extraction
Wang et al. A spectral clustering method with semantic interpretation based on axiomatic fuzzy set theory
Zhang et al. Robust class-specific autoencoder for data cleaning and classification in the presence of label noise
Zhou et al. Automatic optic disc detection using low-rank representation based semi-supervised extreme learning machine
Ma et al. LabelForest: Non-parametric semi-supervised learning for activity recognition
Shi et al. Dynamic barycenter averaging kernel in RBF networks for time series classification
CN103927522A (zh) 一种基于流形自适应核的人脸识别方法
Wang et al. Deep learning-based imbalanced classification with fuzzy support vector machine
Mohammed et al. Toward leveraging big value from data: chronic lymphocytic leukemia cell classification
Hasan et al. Multistrategy self-organizing map learning for classification problems
Hsieh et al. Adaptive structural co-regularization for unsupervised multi-view feature selection
CN113157816B (zh) 一种基于网格密度的消费者分类标签融合过滤方法
Saranya et al. FBCNN-TSA: An optimal deep learning model for banana ripening stages classification
Song et al. Visual feature representation in microscopy image classification
Wang et al. One novel class of Bézier smooth semi-supervised support vector machines for classification
Zhao et al. Segmentation and classification of two-channel C. elegans nucleus-labeled fluorescence images
Li et al. MMD-encouraging convolutional autoencoder: a novel classification algorithm for imbalanced data
Araújo et al. Improving convolutional neural network design via variable neighborhood search
CN113222177A (zh) 模型迁移方法、装置及电子设备
Aung et al. Plurality Rule-based Density and Correlation Coefficient-based Clustering for K-NN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant