CN110516068B - 一种基于度量学习的多维度文本聚类方法 - Google Patents

一种基于度量学习的多维度文本聚类方法 Download PDF

Info

Publication number
CN110516068B
CN110516068B CN201910785197.7A CN201910785197A CN110516068B CN 110516068 B CN110516068 B CN 110516068B CN 201910785197 A CN201910785197 A CN 201910785197A CN 110516068 B CN110516068 B CN 110516068B
Authority
CN
China
Prior art keywords
clustering
dimension
constraint
learning
dimensions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910785197.7A
Other languages
English (en)
Other versions
CN110516068A (zh
Inventor
黄瑞章
白瑞娜
秦永彬
陈艳平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Luhao Technology Co.,Ltd.
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN201910785197.7A priority Critical patent/CN110516068B/zh
Publication of CN110516068A publication Critical patent/CN110516068A/zh
Application granted granted Critical
Publication of CN110516068B publication Critical patent/CN110516068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于度量学习的多维度文本聚类方法,它主要包括以下步骤:一从数据集中选取两个维度并进行特征向量化表示;二使用K‑Means聚类方法并结合度量矩阵学习分别对两个维度进行初始化聚类;三判断当前的聚类结果是否达到结束条件,若不满足则设置约束对上限常数执行步骤四,否则结束算法,输出聚类结果辅助下游任务;四利用当前维度的聚类结果挑选满足条件的约束对;五将步骤四所生成的约束集合加入到维度的聚类过程中,调节目标函数和度量矩阵的学习,得到两个维度的聚类结果;六重复迭代步骤三至步骤五。此方法基于度量学习的多维度文本聚类算法综合考虑数据在不同特征空间的表现方式,进行多维度辅助聚类,有较好的聚类效果。

Description

一种基于度量学习的多维度文本聚类方法
技术领域
本发明涉及一种文本聚类方法,尤其涉及一种基于度量学习的多维度文本聚类方法,属于机器学习和自然语言处理技术领域。
背景技术
多维度数据在大数据时代的实际应用中十分常见。例如,网页的描述不仅可以是其本身涉及到的单词,还可以是网页的相关链接;在文本相关任务中,可以通过文本特征、语义信息甚至是用户对文本的点赞、转发、评论等行为同时描述文本。相应的,多维度聚类作为机器学习、模式识别和数据挖掘的基本任务已经成为聚类的重要扩展。传统的文本聚类一般都是从文本内容中提取特征,然后同其他维度属性特征进行直接组合或是对多个维度赋予不同权重作为特征表示。这类算法不仅忽略了不同特征空间之间的异质性,而且没有机制来探寻聚类结果与多个维度之间的潜在关系。
发明内容
本发明要解决的技术问题是:提供一种基于度量学习的多维度文本聚类方法,基于文本间的相似性在不同空间维度上应该保持一致的原则,选取词特征和用户行为特征两个空间维度(原始维度和信息维度)相互作为对方的约束对候选集,并利用挑选好的约束对为每个簇学习各自的距离矩阵,在当前聚类结果的基础上更新约束对和度量矩阵,使两个维度相互迭代促进直到达到停止条件以用于下游任务,有效的解决了上述存在的问题。
本发明的技术方案为:一种基于度量学习的多维度文本聚类方法,所述方法包括如下步骤:
步骤一:从数据集中选取两个维度,记作:维度A和维度B,并进行特征向量化表示;
步骤二:使用K-Means聚类方法并结合度量矩阵学习分别对A、B两个维度进行初始化聚类;
步骤三:判断当前的聚类结果是否达到终止条件,若不满足则设置约束对上限常数时执行步骤四,否则结束算法,输出聚类结果辅助下游任务;
步骤四:利用当前A、B维度的聚类结果为A,B维度挑选满足条件的约束对,且不超过步骤三给定的约束对上限,分别构成A维度的约束集合MA,B维度的约束集合MB
步骤五:将步骤四所生成的约束集合MA加入到A维度的聚类过程中,调节目标函数和度量矩阵的学习,同理也将MB利用到对B维度的聚类过程,得到两个维度的聚类结果;
步骤六:重复迭代步骤三~步骤五。
所述步骤二中利用传统的K-Means聚类方法对A、B维度的特征进行分别聚类,在聚类中融入了度量矩阵的学习,能很好的改善簇间、簇内距离。
所述步骤三中是整个算法迭代终止条件的设置,终止条件可以是迭代次数的限制,也可以是聚类结果的收敛与否,若满足终止条件则结束算法,输出聚类结果,若不满足则设置挑选约束对上限,进入算法迭代部分。
所述步骤四中,利用当前A、B维度的聚类结果为A,B维度挑选约束对,两个样本点(xi,xj)∈M需满足:1)A(B)维度xi,xj没被聚到一个簇,并且距离超过了置信值(较远);2)在B(A)维度xi,xj被聚到了同一簇,分别构成A维度的约束集合MA,B维度的约束集合MB,且约束集合MA和MB的大小不超过步骤三给定的约束对上限。
所述步骤五中,利用步骤四所生成的约束集合MA加入到A维度的聚类过程中,使用度量矩阵学习距离,并利用生成的约束将目标函数改写成为基于度量矩阵的样本点到簇中心距离总和及约束违程度的惩罚两项之和
Figure BDA0002177824420000021
同理也将MB利用到对B维度的聚类过程,得到两个维度的聚类结果。
本发明的有益效果是:与现有技术相比,采用本发明的技术方案,本发明针对多维度文本数据,基于文本间的相似性在不同空间维度上应该保持一致的原则,对数据进行初始化表述,挑选约束对,使用度量矩阵学习和最小化组合目标函数进行聚类。针对数据集不同维度空间的异质性,以及文本数据特征表述的高维稀疏性,本发明在特征表示阶段改善了高维稀疏性,不同于现有的多维度特征拼接方法,本发明采用不同维度之间构成的约束关系,并蕴含在组合目标函数中,参与度量学习的聚类过程和目标函数最小化。本发明对多维度数据进行分析聚类,可以支持很多下游任务。例如:如果我们所选择的数据集是新闻领域,文本数据的词向量特征是用户浏览的新闻正文,文本数据的其他维度选择用户id,经过本算法输出的聚类结果,可以分析哪些人具有相同的兴趣爱好,并进行推荐。
附图说明
图1为本发明实施例1的模型示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将参照本说明书附图对本发明作进一步的详细描述。
实施例1:如附图1所示,一种基于度量学习的多维度文本聚类方法,所述方法包括如下步骤:
步骤一:从数据集中选取两个维度,记作:维度A和维度B,并进行特征向量化表示;
步骤二:使用K-Means聚类方法并结合度量矩阵学习分别对A、B两个维度进行初始化聚类;
步骤三:判断当前的聚类结果是否达到终止条件,若不满足则设置约束对上限常数时执行步骤四,否则结束算法,输出聚类结果辅助下游任务;
步骤四:利用当前A、B维度的聚类结果为A,B维度挑选满足条件的约束对,且不超过步骤三给定的约束对上限,分别构成A维度的约束集合MA,B维度的约束集合MB
步骤五:将步骤四所生成的约束集合MA加入到A维度的聚类过程中,调节目标函数和度量矩阵的学习,同理也将MB利用到对B维度的聚类过程,得到两个维度的聚类结果;
步骤六:重复迭代步骤三~步骤五。
步骤一中选取合适的维度和对应维度特征的向量化。通常状况下,在文本相关任务中,可以通过文本特征、语义信息甚至是用户对文本的点赞、转发、评论等行为同时描述文本。所以我们认为,多维度文本聚类不仅可以利用文本原有特征空间的词特征,还可以使用其他维度信息充分辅助聚类。维度的选择上除了词特征作为原始维度,还可以选择用户id等特征。在选取好合适的维度后,需要采用不同的方法进行向量化。词特征维度可以选用:TF(词频)、TF-IDF(词频-逆文本频率指数)或是Word2Vec等方法做映射,考虑到用户id做聚类不具有可解释性,顾利用Word2Vec思想训练一个用户id-用户相关文本的Embedding,用于将用户id向量化。
所述步骤二中,利用传统的K-Means聚类方法对A、B维度的特征进行分别聚类,在聚类中融入了度量矩阵的学习,能很好的改善簇间、簇内距离。
所述步骤三中是整个算法迭代终止条件的设置,终止条件可以是迭代次数的限制,也可以是聚类结果的收敛与否,若满足终止条件则结束算法,输出聚类结果,若不满足则设置挑选约束对上限,进入算法迭代部分。
所述步骤四中,利用当前A、B维度的聚类结果为A,B维度挑选约束对,两个样本点(xi,xj)∈M需满足:1)A(B)维度xi,xj没被聚到一个簇,并且距离超过了置信值(较远);2)在B(A)维度xi,xj被聚到了同一簇,分别构成A维度的约束集合MA,B维度的约束集合MB,且约束集合MA和MB的大小不超过步骤三给定的约束对上限。
所述步骤五中,利用步骤四所生成的约束集合MA加入到A维度的聚类过程中,使用度量矩阵学习距离,并利用生成的约束将目标函数改写成为基于度量矩阵的样本点到簇中心距离总和及约束违程度的惩罚两项之和
Figure BDA0002177824420000041
同理也将MB利用到对B维度的聚类过程,得到两个维度的聚类结果。
步骤六重复迭代步骤三~步骤五。随着两个维度聚类效果的提升,所选出的约束对也越来越可信,在迭代中两个维度的聚类效果是相互促进提升的。
在本实施例中,步骤四中,进行约束对的挑选是两个维度分别进行的,并且每个维度约束对的挑选都用到了两个维度的聚类结果。所以在附图1中,对应约束对MA的挑选除了一条实线直连(标记为1),还有一条虚线的连接(标记为1)。利用当前A、B维度的聚类结果为A,B维度挑选约束对,两个样本点(xi,xj)∈M需满足:1)A(B)维度xi、xj没被聚到一个簇,并且距离超过了置信值(较远);2)在B(A)维度xi、xj被聚到了同一簇。分别构成A维度的约束集合MA,B维度的约束集合MB,且约束集合MA和MB的大小不超过步骤三给定的约束对上限。如果我们假设统一约束成本wij则所有约束违规都被平等对待。然而在约束对集合M(MA或MB)中,违反损失较大的惩罚因子应高于损失较小的惩罚因子,即如果两个必须连接的点根据当前度量相距很远,则该度量非常不足并需要进行严格修改。由于约束违规涉及两个簇,因此相应的惩罚应影响两个簇的度量,表示为:
Figure BDA0002177824420000051
其中:(xi,xj)∈M,hi为数据点xi所属的簇标号,hi∈{1,2,…,K}。
步骤五中,由于K-Means不能直接处理成对约束,需要将成对约束聚类的目标制定为最小化组合目标函数,定义为点与它们的聚类质心之间的总平方距离的总和,以及违反约束对的程度。文本数据的表现形式可能未指定簇与簇之间充分分离的空间,所以采用在基于约束监督的聚类上添加距离度量矩阵的学习。采用对应每一个簇都学习出一个独立的度量矩阵的方式。利用对称正定矩阵Qh参数化样本点到簇中心距离度量,表示为:
Figure BDA0002177824420000052
值得注意的是:若矩阵Qh为对角矩阵,则会通过对角线上的权重元素对每个维度中相应的特征进行缩放;否则,则会与原始特征线性组合而产生新特征。基于选出的约束集M及其对应的惩罚函数(1),及度量距离(2),这种广义的K-Means模型需要最小的化目标函数转换为:
Figure BDA0002177824420000061
其中:log(det(Qhi))是第hi个高斯与协方差矩阵
Figure BDA0002177824420000062
的正态常数;fM(xi,xj)即为上述式子中提到的双约束项,wij为每个约束项提供惩罚因子;I(·)为示性函数,I(ture)=1;反之为0;Ci≠Cj表示xi和xj分配到的簇hi和hj不同。
步骤六:重复迭代步骤三~步骤五。使得本方法是在迭代下进行聚类。
对数据进行初始化后传入模型,进行K-means聚类后判断是否满足停止条件,若不满足则进行约束对的挑选,将挑选出的约束对运用于聚类过程,辅助学习度量矩阵、调整目标函数,直到模型满足收敛条件。此模型为迭代优化模型。基于度量学习的多维度文本聚类算法综合考虑数据在不同特征空间的表现方式,进行多维度辅助聚类,有较好的聚类效果。
为了更好的处理多维度数据聚类问题,本发明提出了基于度量学习的多维度文本聚类算法。本发明结合挑选的约束指导聚类算法,通过度量学习修正特征权重来辅助无监督聚类。依照文本间的相似性在不同的空间维度应该保持一致性的原则,首先选出维度并挑选约束对;然后,利用对应维度的约束来调节相似度,并结合距离矩阵学习改善文本间的距离;最后,通过约束迭代相互优化聚类。
将多维度聚类分为聚类方法本身和多维度数据的处理两个方面。聚类方法有别于数据有无标记。最初的方法利用标记数据作为约束进行聚类,或是将未标记数据进行聚类,用得到的聚类结果结合已标记数据来预测未知样本点的类别。更为通用的方法是使用成对约束的聚类方法,通过调整目标函数,从而得到较好的聚类结果。但是考虑到特征的高维稀疏性,不能改善特征之间的距离度量。从而借鉴半监督聚类度量学习的方法,将度量学习矩阵的方法用于改善聚类过程。现有聚类方法均使用了度量学习,更一步说明了度量学习在聚类问题的适用性。
在多维度应用上传统处理多维度数据的方法不考虑特征空间的异质性,直接进行特征向量的拼接或者赋予特征向量不同的权重。现有的方法都使用与特定领域的属性特征来辅助聚类:利用其他维度数据特征进行约束;选择数据的其他维度进行加权辅助聚类;或是利用多个候选多视图聚类来最大化最坏情况下的性能增益,以实现最佳单视图聚类如RMVC。
本发明,重点在于解决文本数据不同维度空间所带来的异质性和高维稀疏性。基于文本间的相似性在不同空间维度上应该保持一致的原则,选取词特征和用户行为特征两个空间维度(原始维度和信息维度)相互作为对方的约束对候选集,并利用挑选好的约束对为每个簇学习各自的距离矩阵,在当前聚类结果的基础上更新约束对和度量矩阵,使两个维度相互迭代促进直到达到停止条件以用于下游任务。
本发明针对多维度文本特征的异质性和高维稀疏性,面向不同维度的文本数据,研究多维度文本聚类算法。在具体的文本任务中,有效支撑机器学习和自然语言处理的下游任务工作。基于文本间的相似性在不同空间维度上应该保持一致的原则,提出基于度量学习的多维度文本聚类算法。
本发明未详述之处,均为本技术领域技术人员的公知技术。最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种基于度量学习的多维度文本聚类方法,其特征在于:所述方法包括如下步骤:
步骤一:从数据集中选取两个维度,记作:维度A和维度B,其中维度A为词特征,维度B为用户id特征,并对特征进行向量化表示;
步骤二:使用K-Means聚类方法并结合度量矩阵学习分别对A、B两个维度进行初始化聚类;
步骤三:判断当前的聚类结果是否达到终止条件,若不满足则设置约束对上限常数时执行步骤四,否则结束算法,输出聚类结果辅助下游任务;
步骤四:利用当前A、B维度的聚类结果为A,B维度挑选约束对,两个样本点(xi,xj)∈M需满足:1)A(B)维度xi,xj没被聚到一个簇,并且距离超过了置信值;2)在B(A)维度xi,xj被聚到了同一簇,分别构成A维度的约束集合MA,B维度的约束集合MB,且约束集合MA和MB的大小不超过步骤三给定的约束对上限;
步骤五:利用步骤四所生成的约束集合MA加入到A维度的聚类过程中,使用度量矩阵学习距离,并利用生成的约束将目标函数改写成为基于度量矩阵的样本点到簇中心距离总和及约束违规程度的惩罚两项之和:
Figure FDA0003938806300000011
同理也将MB利用到对B维度的聚类过程,得到两个维度的聚类结果;其中:
Figure FDA0003938806300000012
是第hi个高斯与协方差矩阵/>
Figure FDA0003938806300000013
的正态常数;fM(xi,xj)即为上述式子中提到的双约束项,wij为每个约束项提供惩罚因子;I(·)为示性函数,I(true)=1;反之为0;Ci≠Cj表示xi和xj分配到的簇hi和hj不同;
步骤六:重复迭代步骤三~步骤五。
2.根据权利要求1所述的基于度量学习的多维度文本聚类方法,其特征在于:所述步骤三中是整个算法迭代终止条件的设置,终止条件可以是迭代次数的限制,也可以是聚类结果的收敛与否;若满足终止条件则结束算法,输出聚类结果;若不满足则设置挑选约束对上限,进入算法迭代部分。
CN201910785197.7A 2019-08-23 2019-08-23 一种基于度量学习的多维度文本聚类方法 Active CN110516068B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910785197.7A CN110516068B (zh) 2019-08-23 2019-08-23 一种基于度量学习的多维度文本聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910785197.7A CN110516068B (zh) 2019-08-23 2019-08-23 一种基于度量学习的多维度文本聚类方法

Publications (2)

Publication Number Publication Date
CN110516068A CN110516068A (zh) 2019-11-29
CN110516068B true CN110516068B (zh) 2023-05-26

Family

ID=68627515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910785197.7A Active CN110516068B (zh) 2019-08-23 2019-08-23 一种基于度量学习的多维度文本聚类方法

Country Status (1)

Country Link
CN (1) CN110516068B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114661903B (zh) * 2022-03-03 2024-07-09 贵州大学 一种结合用户意图的深度半监督文本聚类方法、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104142918A (zh) * 2014-07-31 2014-11-12 天津大学 基于tf-idf特征的短文本聚类以及热点主题提取方法
CN104391988A (zh) * 2014-12-12 2015-03-04 南京理工大学 一种基于超度量距离矩阵的半监督层次聚类方法
US9141882B1 (en) * 2012-10-19 2015-09-22 Networked Insights, Llc Clustering of text units using dimensionality reduction of multi-dimensional arrays
CN108520284A (zh) * 2018-04-17 2018-09-11 桂林电子科技大学 一种改进的谱聚类及并行化方法
CN108664633A (zh) * 2018-05-15 2018-10-16 南京大学 一种利用多样化文本特征进行文本分类的方法
CN109582782A (zh) * 2018-10-26 2019-04-05 杭州电子科技大学 一种基于用弱监督深度学习的文本聚类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747083B2 (en) * 2006-03-27 2010-06-29 Yahoo! Inc. System and method for good nearest neighbor clustering of text
US20070226207A1 (en) * 2006-03-27 2007-09-27 Yahoo! Inc. System and method for clustering content items from content feeds

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141882B1 (en) * 2012-10-19 2015-09-22 Networked Insights, Llc Clustering of text units using dimensionality reduction of multi-dimensional arrays
CN104142918A (zh) * 2014-07-31 2014-11-12 天津大学 基于tf-idf特征的短文本聚类以及热点主题提取方法
CN104391988A (zh) * 2014-12-12 2015-03-04 南京理工大学 一种基于超度量距离矩阵的半监督层次聚类方法
CN108520284A (zh) * 2018-04-17 2018-09-11 桂林电子科技大学 一种改进的谱聚类及并行化方法
CN108664633A (zh) * 2018-05-15 2018-10-16 南京大学 一种利用多样化文本特征进行文本分类的方法
CN109582782A (zh) * 2018-10-26 2019-04-05 杭州电子科技大学 一种基于用弱监督深度学习的文本聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户行为特征的多维度文本聚类;黎万英等;《计算机应用》;20180719(第11期);全文 *

Also Published As

Publication number Publication date
CN110516068A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
Zhu et al. Exploring auxiliary context: discrete semantic transfer hashing for scalable image retrieval
Wang et al. Multimodal data enhanced representation learning for knowledge graphs
WO2023000574A1 (zh) 一种模型训练方法、装置、设备及可读存储介质
Deng et al. A survey on soft subspace clustering
Yu et al. Learning to rank using user clicks and visual features for image retrieval
CN113204952B (zh) 一种基于聚类预分析的多意图与语义槽联合识别方法
Zhang et al. Cross-modal retrieval using multiordered discriminative structured subspace learning
Yin et al. Incomplete multi-view clustering via subspace learning
Chen et al. Semi-supervised learning via regularized boosting working on multiple semi-supervised assumptions
Shang et al. Dual space latent representation learning for unsupervised feature selection
CN112765352A (zh) 基于具有自注意力机制的图卷积神经网络文本分类方法
CN111444342B (zh) 一种基于多重弱监督集成的短文本分类方法
Zhang et al. Non-negative multi-label feature selection with dynamic graph constraints
CN109784405B (zh) 基于伪标签学习和语义一致性的跨模态检索方法及系统
CN109902144A (zh) 一种基于改进wmd算法的实体对齐方法
CN114817673A (zh) 一种基于模态关系学习的跨模态检索方法
CN112487190A (zh) 基于自监督和聚类技术从文本中抽取实体间关系的方法
Yu et al. Binary set embedding for cross-modal retrieval
Xu et al. Transductive visual-semantic embedding for zero-shot learning
Wang et al. Unsupervised language model adaptation for handwritten Chinese text recognition
Shu et al. Robust supervised matrix factorization hashing with application to cross-modal retrieval
Zhu et al. Low-rank hypergraph feature selection for multi-output regression
Yu et al. Representation learning based on autoencoder and deep adaptive clustering for image clustering
CN110516068B (zh) 一种基于度量学习的多维度文本聚类方法
Guo et al. Multi-attribute subspace clustering via auto-weighted tensor nuclear norm minimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20241015

Address after: No. 001, Building 3, Computing Power Center, Guiyang Big Data Science and Technology Innovation City, Huchao Township, Gui'an New District, Guiyang City, Guizhou Province, 550000

Patentee after: Guizhou Luhao Technology Co.,Ltd.

Country or region after: China

Address before: Science and Technology Department of Huaxi north campus, Guizhou University, Huaxi District, Guiyang City, Guizhou Province

Patentee before: Guizhou University

Country or region before: China