CN112307288A - 一种用于多渠道的用户聚类方法 - Google Patents
一种用于多渠道的用户聚类方法 Download PDFInfo
- Publication number
- CN112307288A CN112307288A CN202011254099.XA CN202011254099A CN112307288A CN 112307288 A CN112307288 A CN 112307288A CN 202011254099 A CN202011254099 A CN 202011254099A CN 112307288 A CN112307288 A CN 112307288A
- Authority
- CN
- China
- Prior art keywords
- user
- clustering
- data
- multiple channels
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims abstract description 15
- 238000012800 visualization Methods 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种用于多渠道的用户聚类方法,该方法包含:步骤1、获取用户数据;步骤2、对用户数据的信息进行one‑hot编码得到一串0‑1的值来描述该用户;步骤3、对数据进行降维,用一个三维空间中的点来描述该用户;步骤4、利用DBSCAN算法对用户信息建模,并调整参数使得评估指标为局部最优解;步骤5、进行图形可视化,对数据进行展现。本发明提供的用于多渠道的用户聚类方法,是一种关于多渠道的用户聚类算法,利用DBSCAN算法,可以对用户的基础属性信息进行聚类,在对算法进行调整之后可以很好地对用户进行分群,从而可以更了解用户。
Description
技术领域
本发明涉及一种关于多渠道的用户聚类算法模型,具体地,涉及一种用于多渠道的用户聚类方法。
背景技术
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
无监督聚类是深度学习中一种建模框架,无监督聚类只能够聚类成指定数量的类,但却不能够说明每一个类到底代表着什么。
对于无类标的情况,没有唯一的评价指标。对于数据凸分布的情况只能通过类内聚合度、类间低耦合的原则来作为指导思想,参见图1所示。
当然,有这些还不够,对于如图1所示的数据在N维空间中的不是凸分布的情况下,此时就需要采用另外的一些评价指标。典型的无监督聚类算法也很多,例如基于局部密度的LOF算法、DBSCAN算法等,在此种情况下的聚类效果就更加优秀。
发明内容
本发明的目的是提供一种关于多渠道的用户聚类算法,利用DBSCAN算法,可以对用户的基础属性信息进行聚类,在对算法进行调整之后可以很好地对用户进行分群,从而可以更了解用户。
本发明提供了一种用于多渠道的用户聚类方法,其中,所述的方法包含:步骤1、获取用户数据;步骤2、对用户数据的信息进行one-hot编码得到一串0-1的值来描述该用户;步骤3、对数据进行降维,用一个三维空间中的点来描述该用户;步骤4、利用DBSCAN算法对用户信息建模,并调整参数使得评估指标为局部最优解;步骤5、进行图形可视化,对数据进行展现。
上述的用于多渠道的用户聚类方法,其中,所述的步骤1的用户数据包含用户的行业信息、人生阶段。
上述的用于多渠道的用户聚类方法,其中,所述的步骤2包含:步骤2.1、对用户数据进行预处理,利用one-hot编码将分类数据转换成一串0-1变量;步骤2.2、对缺失值进行填补,用0来代替缺失值;步骤2.3、对于连续型变量,对其进行归一化,使之到达同一个尺度,便于进行后续步骤的处理。
上述的用于多渠道的用户聚类方法,其中,所述的步骤2.3中的归一化是使用0-1归一化,最大值变换为1,最小值变换为0,变换公式为x=(x-min)/(max-min)。
上述的用于多渠道的用户聚类方法,其中,所述的步骤3是利用pca降维算法将数据降为三维数据。
上述的用于多渠道的用户聚类方法,其中,所述的步骤4是利用DBSCAN进行聚类,并对可能的超参数搜索区域进行搜索,并利用轮廓系数作为评估指标评估聚类效果,得到若干个候选聚类模型;超参数是在开始学习过程之前设置值的参数。
上述的用于多渠道的用户聚类方法,其中,所述的步骤5是对候选聚类模型进行可视化,输入不同的候选超参数,利用图像得到一个较好的聚类结果并保存模型。
上述的用于多渠道的用户聚类方法,其中,所述的步骤5的可视化是利用matplotlib做出三维图像,并观察相应的局部最优解,从直观选出一个最优解。
本发明提供的用于多渠道的用户聚类方法具有以下优点:
该方法是一种关于多渠道的用户聚类算法,利用了机器学习里的一种聚类算法(DBSCAN)对用户进行聚类。使用本发明提供的方法具有的优点还包括:
1.对数据进行降维并展现可以很方便的看出数据点的分布,对聚类效果有个直观的感受,并可以很方便的调整模型的超参数,使得聚类效果更好。
2.同时利用评估指标,可以很方便的进行超参数网格搜索,得到一个局部最优解。
3.结合上述两种方法,可以很好地对用户进行聚类,从而为用户分群打下良好基础。
附图说明
图1为无监督聚类无类标的情况下数据凸分布的示意图。
图2为本发明的用于多渠道的用户聚类方法的三维图。
具体实施方式
以下结合附图对本发明的具体实施方式作进一步地说明。
本发明提供了一种用于多渠道的用户聚类方法,该方法包含:
步骤1、获取用户数据。
步骤2、对用户数据的信息进行one-hot编码得到一串0-1的值来描述该用户。
步骤3、对数据进行降维,用一个三维空间中的点来描述该用户。
步骤4、利用DBSCAN算法对用户信息建模,并调整参数使得评估指标为局部最优解。
步骤5、进行图形可视化,对数据进行展现。
优选地,步骤1的用户数据包含用户的行业信息、人生阶段等。
步骤2包含:步骤2.1、对用户数据进行预处理,利用one-hot编码将分类数据转换成一串0-1变量;步骤2.2、对缺失值进行填补,用0来代替缺失值;步骤2.3、对于连续型变量,对其进行归一化,使之到达同一个尺度,便于进行后续步骤的处理。
步骤2.3中的归一化是使用0-1归一化,最大值变换为1,最小值变换为0,变换公式为x=(x-min)/(max-min)。
步骤3是利用pca降维算法将数据降为三维数据。
步骤4是利用DBSCAN进行聚类,并对可能的超参数搜索区域进行搜索,并利用轮廓系数作为评估指标评估聚类效果,得到若干个候选聚类模型;超参数是在开始学习过程之前设置值的参数,例如邻域半径、邻域内最小样本数等。
步骤5是对候选聚类模型进行可视化,输入不同的候选超参数,利用图像得到一个较好的聚类结果并保存模型。
步骤5的可视化是利用matplotlib做出三维图像,并观察相应的局部最优解,从直观选出一个最优解。
matplotlib是风格类似Matlab的基于Python的图表绘图系统。matplotlib是Python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
DBSCAN是一种基于密度的聚类算法,这类密度聚类算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间的紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。
通过将紧密相连的样本划为一类,这样就得到了一个聚类类别。通过将所有各组紧密相连的样本划为各个不同的类别,则我们就得到了最终的所有聚类类别结果。
输入:样本集D=(x1,x2,...,xm)(x1,x2,...,xm),邻域参数(∈,MinPts)(∈,MinPts),样本距离度量方式
输出:簇划分C
2)对于j=1,2,...m,按下面的步骤找出所有的核心对象:
a)通过距离度量方式,找到样本xjxj的∈∈-邻域子样本集N∈(xj)N∈(xj)
b)如果子样本集样本个数满足|N∈(xj)|≥MinPts|N∈(xj)|≥MinPts,将样本xjxj加入核心对象样本集合:Ω=Ω∪{xj}Ω=Ω∪{xj}
4)在核心对象集合ΩΩ中,随机选择一个核心对象oo,初始化当前簇核心对象队列Ωcur={o}Ωcur={o},初始化类别序号k=k+1,初始化当前簇样本集合Ck={o}Ck={o},更新未访问样本集合Γ=Γ-{o}Γ=Γ-{o}
6)在当前簇核心对象队列ΩcurΩcur中取出一个核心对象o′o′,通过邻域距离阈值∈∈找出所有的∈∈-邻域子样本集N∈(o′)N∈(o′),令Δ=N∈(o′)∩ΓΔ=N∈(o′)∩Γ,更新当前簇样本集合Ck=Ck∪ΔCk=Ck∪Δ,更新未访问样本集合Γ=Γ-ΔΓ=Γ-Δ,转入步骤5.
输出结果为:簇划分C={C1,C2,...,Ck}{C1,C2,...,Ck}
同时,还对变量进行one-hot编码。
One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。
One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1。
超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,在机器学习过程中需要对超参数进行优化,给学习器选择一组最优超参数,以提高学习的性能和效果。比如,树的数量或树的深度,学习率(多种模式)以及k均值聚类中的簇数等都是超参数。与超参数区别的概念是参数,它是模型训练过程中学习到的一部分,比如回归系数,神经网络权重等。简单的描述参数是模型训练获得的,超参数是人工配置参数(本质上是参数的参数,每次改变超参数,模型都要重新训练)。网格搜索是在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果(暴力搜索)。原理:在一定的区间内,通过循环遍历,尝试每一种可能性,并计算其约束函数和目标函数的值,对满足约束条件的点,逐个比较其目标函数的值,将坏的点抛弃,保留好的点,最后便得到最优解的近似解。为了评价每次选出的参数的好坏,需要选择评价指标,评价指标可以根据自己的需要选择accuracy、f1-score、f-beta、percision、recall等。在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。
下面结合实施例对本发明提供的用于多渠道的用户聚类方法做更进一步描述。
实施例1
一种用于多渠道的用户聚类方法,该方法包含:
步骤1、获取用户数据。用户数据包含用户的行业信息、人生阶段等。
步骤2、对用户数据的信息进行one-hot编码得到一串0-1的值来描述该用户。
步骤2包含:
步骤2.1、对用户数据进行预处理,利用one-hot编码将分类数据转换成一串0-1变量。
步骤2.2、对缺失值进行填补,用0来代替缺失值。
步骤2.3、对于连续型变量,对其进行归一化,使之到达同一个尺度,便于进行后续步骤的处理。归一化主要使用0-1归一化,最大值变换为1,最小值变换为0,变换公式为x=(x-min)/(max-min)。
步骤3、对数据进行降维,用一个三维空间中的点来描述该用户。
优选地,利用pca降维算法将数据降为三维数据。
具体代码如下:
from sklearn.decomposition import PCA
pca=PCA(n_components=3)
其中n_components为所需降维的维度,这里为3维。这样可以便于可视化,为后续调整超参数打下基础。
步骤4、利用DBSCAN算法对用户信息建模,并调整参数使得评估指标为局部最优解。
利用DBSCAN进行聚类,并对可能的超参数搜索区域进行搜索,并利用轮廓系数作为评估指标评估聚类效果,得到若干个候选聚类模型。
具体代码如下:
from sklearn.cluster import DBSCAN
clustering=DBSCAN(eps=3,min_samples=2).fit(X)
其中eps为邻域半径,而min_samples为邻域内最小样本数
对于这两个超参数进行网格搜索,可以得到一组局部最优解。
范围分别为range(0.1,0.35,0.05),和range(2,20,1)。
步骤5、进行图形可视化,对数据进行展现。
对候选聚类模型进行可视化,输入不同的候选超参数,利用图像得到一个较好的聚类结果并保存模型。
优选地,利用matplotlib做出三维图像,并观察相应的局部最优解,从直观选出一个最优解。
参见图2所示,不同的点为不同的用户,不同位置聚集的不同深浅的点代表不同类别的用户,那些不属于任何类别的用户被自动地标为离群点(最深的黑色)。
本发明提供的用于多渠道的用户聚类方法,是一种关于多渠道的用户聚类算法,利用DBSCAN算法,可以对用户的基础属性信息进行聚类,在对算法进行调整之后可以很好地对用户进行分群,从而可以更了解用户。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (8)
1.一种用于多渠道的用户聚类方法,其特征在于,所述的方法包含:
步骤1、获取用户数据;
步骤2、对用户数据的信息进行one-hot编码得到一串0-1的值来描述该用户;
步骤3、对数据进行降维,用一个三维空间中的点来描述该用户;
步骤4、利用DBSCAN算法对用户信息建模,并调整参数使得评估指标为局部最优解;
步骤5、进行图形可视化,对数据进行展现。
2.如权利要求1所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤1的用户数据包含用户的行业信息、人生阶段。
3.如权利要求1所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤2包含:
步骤2.1、对用户数据进行预处理,利用one-hot编码将分类数据转换成一串0-1变量;
步骤2.2、对缺失值进行填补,用0来代替缺失值;
步骤2.3、对于连续型变量,对其进行归一化,使之到达同一个尺度,便于进行后续步骤的处理。
4.如权利要求3所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤2.3中的归一化是使用0-1归一化,最大值变换为1,最小值变换为0,变换公式为x=(x-min)/(max-min)。
5.如权利要求1所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤3是利用pca降维算法将数据降为三维数据。
6.如权利要求1所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤4是利用DBSCAN进行聚类,并对可能的超参数搜索区域进行搜索,并利用轮廓系数作为评估指标评估聚类效果,得到若干个候选聚类模型;超参数是在开始学习过程之前设置值的参数。
7.如权利要求1所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤5是对候选聚类模型进行可视化,输入不同的候选超参数,利用图像得到一个较好的聚类结果并保存模型。
8.如权利要求7所述的用于多渠道的用户聚类方法,其特征在于,所述的步骤5的可视化是利用matplotlib做出三维图像,并观察相应的局部最优解,从直观选出一个最优解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011254099.XA CN112307288A (zh) | 2020-11-11 | 2020-11-11 | 一种用于多渠道的用户聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011254099.XA CN112307288A (zh) | 2020-11-11 | 2020-11-11 | 一种用于多渠道的用户聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112307288A true CN112307288A (zh) | 2021-02-02 |
Family
ID=74325829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011254099.XA Pending CN112307288A (zh) | 2020-11-11 | 2020-11-11 | 一种用于多渠道的用户聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112307288A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230112096A1 (en) * | 2021-10-13 | 2023-04-13 | SparkCognition, Inc. | Diverse clustering of a data set |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020038307A1 (en) * | 2000-01-03 | 2002-03-28 | Zoran Obradovic | Systems and methods for knowledge discovery in spatial data |
CN108763496A (zh) * | 2018-05-30 | 2018-11-06 | 南京讯高科技有限公司 | 一种基于网格和密度的动静态数据融合客户分类算法 |
CN110472031A (zh) * | 2019-08-13 | 2019-11-19 | 北京知道创宇信息技术股份有限公司 | 一种正则表达式获得方法、装置、电子设备及存储介质 |
CN110569922A (zh) * | 2019-09-17 | 2019-12-13 | 深圳前海微众银行股份有限公司 | 交互式层次聚类实现方法、装置、设备及可读存储介质 |
-
2020
- 2020-11-11 CN CN202011254099.XA patent/CN112307288A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020038307A1 (en) * | 2000-01-03 | 2002-03-28 | Zoran Obradovic | Systems and methods for knowledge discovery in spatial data |
CN108763496A (zh) * | 2018-05-30 | 2018-11-06 | 南京讯高科技有限公司 | 一种基于网格和密度的动静态数据融合客户分类算法 |
CN110472031A (zh) * | 2019-08-13 | 2019-11-19 | 北京知道创宇信息技术股份有限公司 | 一种正则表达式获得方法、装置、电子设备及存储介质 |
CN110569922A (zh) * | 2019-09-17 | 2019-12-13 | 深圳前海微众银行股份有限公司 | 交互式层次聚类实现方法、装置、设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
王小静: "基于集成学习的短文本聚类", 中国优秀硕士学位论文全文数据库经济与管理科学辑, no. 03, pages 152 - 804 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230112096A1 (en) * | 2021-10-13 | 2023-04-13 | SparkCognition, Inc. | Diverse clustering of a data set |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165664B (zh) | 一种基于生成对抗网络的属性缺失数据集补全与预测方法 | |
CN110580501B (zh) | 一种基于变分自编码对抗网络的零样本图像分类方法 | |
US20200167659A1 (en) | Device and method for training neural network | |
CN112306494A (zh) | 一种基于卷积和循环神经网络的代码分类及聚类方法 | |
CN113821670B (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
CN112000772A (zh) | 面向智能问答基于语义特征立方体的句子对语义匹配方法 | |
CN114093445B (zh) | 一种基于偏多标记学习的患者筛选标记方法 | |
CN112860904A (zh) | 一种融入外部知识的生物医疗关系抽取方法 | |
CN117494051A (zh) | 一种分类处理的方法、模型训练的方法以及相关装置 | |
CN112214570A (zh) | 一种基于对抗投影学习哈希的跨模态检索方法及装置 | |
CN117171393A (zh) | 一种面向多模态检索的自适应半配对询问哈希方法 | |
Luqman et al. | Subgraph spotting through explicit graph embedding: An application to content spotting in graphic document images | |
CN113065520B (zh) | 一种面向多模态数据的遥感图像分类方法 | |
CN112686306B (zh) | 基于图神经网络的icd手术分类自动匹配方法及系统 | |
CN112699261B (zh) | 一种服装图像自动生成系统及方法 | |
CN117634459A (zh) | 目标内容生成及模型训练方法、装置、系统、设备及介质 | |
CN112307288A (zh) | 一种用于多渠道的用户聚类方法 | |
US11853858B2 (en) | Chart building user interface providing machine learned chart recommendations | |
CN114972959B (zh) | 深度学习中样本生成和类内排序损失的遥感图像检索方法 | |
CN115063374A (zh) | 模型训练、人脸图像质量评分方法、电子设备及存储介质 | |
CN112465054B (zh) | 一种基于fcn的多变量时间序列数据分类方法 | |
CN111401519B (zh) | 一种基于物体内和物体间相似性距离的深层神经网络无监督学习方法 | |
CN114120447A (zh) | 一种基于原型对比学习的行为识别方法及系统、存储介质 | |
CN116578611B (zh) | 一种孕育知识的知识管理方法和系统 | |
CN117010459B (zh) | 基于模块化和序列化自动生成神经网络的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |