CN109784404A - 一种融合标签信息的多标签分类原型系统及方法 - Google Patents
一种融合标签信息的多标签分类原型系统及方法 Download PDFInfo
- Publication number
- CN109784404A CN109784404A CN201910038740.7A CN201910038740A CN109784404A CN 109784404 A CN109784404 A CN 109784404A CN 201910038740 A CN201910038740 A CN 201910038740A CN 109784404 A CN109784404 A CN 109784404A
- Authority
- CN
- China
- Prior art keywords
- node
- label
- matrix
- network
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种融合标签信息的多标签分类原型系统及方法。所述系统包括:一数据预处理模块,用于对网络中结构进行节点和边的表示;一节点嵌入模块,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;一标签嵌入模块,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;一分类结果输出模块,用分类函数得到节点最终的多标签分类结果。本发明能够将节点向量特征得分融入到现有的排序学习框架中进行分类,并按照顺序输出节点。
Description
技术领域
本发明涉及一种融合标签信息的多标签分类原型系统及方法。
背景技术
当前,有很多技术方法可用于网络中节点的多标签分类分析。传统的多标签分类算法是将多标签学习问题转换为多类(单标签)分类问题。将训练数据集中的标签集合子集进行二进制编码,每个编码值看作是单标签分类任务中的多类分类问题的不同类别值,然后,训练多类分类器。当给定一个未知样本时,首先根据训练得到的多类分类器对其进行预测,然后将预测出的结果转成二进制编码,从而得到其所属的类别标签集合。这个方法比较简单,但如果当标签类别的数量很多时,将其转换为新的类别标签时值的数量会增加很多,从而导致这些类别标签的训练样本不足以及训练时间开销大。
当前,存在着一些基于网络表示学习的多标签分类分析方法。基于矩阵特征向量计算,通过计算关系矩阵的前k个特征向量或奇异向量来得到k维的节点表示。利用“非线性降维的全局几何框架”计算出了全局最优解的Isomap算法。通过分析高维度的流行,从而找到与之对应的低纬度的嵌入,在计算高维度节点之间的距离时,提出了用实际输入数据来估算其测地线距离的算法,代替了传统的欧式距离,并保证了近似收敛到原始高维数据的真实结构。
当前,还存在着一些基于随机游走的多标签分类分析方法。研究者将词嵌入技术应用于网络或图节点的特征学习。通过实验验证了随机游走序列中节点和文档中的单词一样都遵从指数定律(power-law),从而进一步将著名的词表示学习算法 word2vec应用在随机游走序列上,学习节点表示。
发明内容
本发明的目的在于提供一种融合标签信息的多标签分类原型系统及方法,通过利用谱技术将节点和节点属性进行结合,从而得到网络嵌入表示;接着将网络空间中的标签信息进行表示学习,将其映射成为向量,然后与已学习到的网络嵌入的矩阵进行融合,最终得到节点的向量表示,改善网络中节点的多标签分类效果。
为实现上述目的,本发明的技术方案是:一种融合标签信息的多标签分类原型系统,包括:
一数据预处理模块,用于对网络中结构进行节点和边的表示;
一节点嵌入模块,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
一标签嵌入模块,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
一分类结果输出模块,用分类函数得到节点最终的多标签分类结果。
在本发明一实施例中,所述数据预处理模块,采用二维平面上的欧几里得网格的规则来表示结构,节点之间的边用概率决定。
在本发明一实施例中,所述节点嵌入模块,利用节点间的距离相似、节点间属性的余弦相似度的分歧程度来表示两个节点的相似度,进而通过将每两个节点的相似度作为相似矩阵上的元素,构造网络的相似矩阵,得到节点嵌入表示。
在本发明一实施例中,所述标签嵌入模块,将标签中的节点的邻接领域信息映射到向量表示中,利用节点属性网络的表示学习接近度来平滑标签信息建模;而后,将具有相同的标签的节点包含在同一个集合中,并计算的余弦相似度矩阵,并通过计算拉普拉斯矩阵,其中,计算为余弦相似度矩阵,是的度矩阵;最后,使用已学习到的网络嵌入的矩阵来做过渡,得到最终的标签嵌入表示。
在本发明一实施例中,述分类结果输出模块,根据节点向量表示,利用softmax分类函数对所得向量逐一计算,根据设定的阈值得到节点关于标签类别的预测值;在训练阶段,需要将预测值与目标值求误差,并利用随机梯度下降法和后向传播对整个系统的参数进行迭代更新;否则,只需将得到的预测值输出即可。
在本发明一实施例中,还包括一信息采集模块,用于将网络中的用户信息进行采集和标签标记,而后输入给所述数据预处理模块。
本发明还提供了一种融合标签信息的多标签分类方法,包括如下步骤:
首先,将网络中的用户信息进行采集和标签标记,并对网络中结构进行节点和边的表示;
其次,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
再而,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
最后,根据节点向量表示,用分类函数得到节点最终的多标签分类结果。
在本发明一实施例中,所述对网络中结构进行节点和边的表示,即:采用二维平面上的欧几里得网格的规则来表示结构,节点之间的边用概率决定。
在本发明一实施例中,所述构造网络的相似矩阵,即:利用节点间的距离相似、节点间属性的余弦相似度的分歧程度来表示两个节点的相似度,进而通过将每两个节点的相似度作为相似矩阵上的元素,构造网络的相似矩阵,得到节点嵌入表示。
在本发明一实施例中,所述利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示,即:将标签中的节点的邻接领域信息映射到向量表示中,利用节点属性网络的表示学习接近度来平滑标签信息建模;而后,将具有相同的标签的节点包含在同一个集合中,并计算的余弦相似度矩阵,并通过计算拉普拉斯矩阵,其中,计算为余弦相似度矩阵,是的度矩阵;最后,使用已学习到的网络嵌入的矩阵来做过渡,得到最终的标签嵌入表示。
相较于现有技术,本发明具有以下有益效果:本发明能够将节点向量特征得分融入到现有的排序学习框架中进行分类,并按照顺序输出节点。
附图说明
图1为本发明方法流程图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提供了一种融合标签信息的多标签分类原型系统,包括:
一数据预处理模块,用于对网络中结构进行节点和边的表示;
一节点嵌入模块,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
一标签嵌入模块,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
一分类结果输出模块,用分类函数得到节点最终的多标签分类结果。
在本发明一实施例中,还包括一信息采集模块,用于将网络中的用户信息进行采集和标签标记,而后输入给所述数据预处理模块。
本发明还提供了一种融合标签信息的多标签分类方法,包括如下步骤:
首先,将网络中的用户信息进行采集和标签标记,并对网络中结构进行节点和边的表示;
其次,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
再而,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
最后,根据节点向量表示,用分类函数得到节点最终的多标签分类结果。
以下为本发明的具体实现过程。
如图1所示,根据本发明实施例在网络节点中的多标签分类分析系统包括:数据预处理模块1,对节点进行特征化处理;节点嵌入模块2,用于将节点和节点属性进行结合,构造网络的相似矩阵;标签嵌入模块3,用谱技术方法将标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;分类结果输出模块4,用分类函数得到节点最终的多标签分类结果。下面分别详细描述各模块的配置。
1)数据预处理模块1
首先,描述数据预处理模块如何用户进行数据的预处理。
用二维平面上的欧几里得网格的规则来表示结构,节点之间的边用一个概率决定,也就是随机网络。
2)节点嵌入模块2
下面描述节点嵌入模块2是如何将上一模块得到的数据进行节点嵌入的。该模块的构建的核心思想是关注每对节点和,如果它们具有相似的局部属性,那么它们的向量表示和在学习空间中也应该是相似的,利用来表示。除了上述的距离相似还可以使用两节点属性的余弦相似度来表示。在图G的节点邻接领域矩阵中,计算两个节点属性的余弦相似度,得到矩阵,将每两个节点的相似度作为矩阵特定位置上的元素,即为中第i行第j列上的元素。因为如果节点i和j具有相似的属性信息,会很大,否则会很小;利用这两种方式的分歧程度来表示节点的相似度,可以较为全面的得到节点嵌入表示。
3)标签嵌入模块3
下面描述标签嵌入模块3是如何将节点的标签信息进行标签嵌入的。首先,我们将标签中的节点的邻接领域信息映射到向量表示中。基本思想是利用节点属性网络的表示学习接近度来平滑标签信息建模。当节点具有相同的标签时,它们的网络结构和节点属性的最终向量表示趋于相似。但是,由于标签信息的数量以及类别非常都非常少,所以在处理标签信息时没有办法完全按照属性网络的嵌入方法。我们具有相同的标签的节点包含在同一个集合中,并计算的余弦相似度矩阵,并通过计算拉普拉斯矩阵,其中,计算为余弦相似度矩阵,是的度矩阵。为了解决这个问题,由于标签数量较少,我们使用已学习到的矩阵来做一个过渡,得到最终的标签嵌入表示。
4)分类结果输出模块4
最后,将描述分类结果输出模块4。模块3)的输出向量得到了最终的节点向量,分类结果输出模块利用softmax分类函数对所得向量逐一计算,根据设定的阈值得到该节点关于标签类别的预测值。在训练阶段,需要将预测值与目标值求误差,并利用随机梯度下降法和后向传播对整个系统的参数进行迭代更新;否则,只需将得到的预测值输出即可。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (10)
1.一种融合标签信息的多标签分类原型系统,其特征在于,包括:
一数据预处理模块,用于对网络中结构进行节点和边的表示;
一节点嵌入模块,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
一标签嵌入模块,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
一分类结果输出模块,用分类函数得到节点最终的多标签分类结果。
2.根据权利要求1所述的系统,其特征在于,所述数据预处理模块,采用二维平面上的欧几里得网格的规则来表示结构,节点之间的边用概率决定。
3.根据权利要求1所述的系统,其特征在于,所述节点嵌入模块,利用节点间的距离相似、节点间属性的余弦相似度的分歧程度来表示两个节点的相似度,进而通过将每两个节点的相似度作为相似矩阵上的元素,构造网络的相似矩阵,得到节点嵌入表示。
4.根据权利要求1所述的系统,其特征在于,所述标签嵌入模块,将标签中的节点的邻接领域信息映射到向量表示中,利用节点属性网络的表示学习接近度来平滑标签信息建模;而后,将具有相同的标签的节点包含在同一个集合中,并计算的余弦相似度矩阵,并通过计算拉普拉斯矩阵,其中,计算为余弦相似度矩阵,是的度矩阵;最后,使用已学习到的网络嵌入的矩阵来做过渡,得到最终的标签嵌入表示。
5.根据权利要求1所述的系统,其特征在于,所述分类结果输出模块,根据节点向量表示,利用softmax分类函数对所得向量逐一计算,根据设定的阈值得到节点关于标签类别的预测值;在训练阶段,需要将预测值与目标值求误差,并利用随机梯度下降法和后向传播对整个系统的参数进行迭代更新;否则,只需将得到的预测值输出即可。
6.根据权利要求1所述的系统,其特征在于,还包括一信息采集模块,用于将网络中的用户信息进行采集和标签标记,而后输入给所述数据预处理模块。
7.一种融合标签信息的多标签分类方法,其特征在于,包括如下步骤:
首先,将网络中的用户信息进行采集和标签标记,并对网络中结构进行节点和边的表示;
其次,利用谱技术的方法将节点和节点属性进行结合,构造网络的相似矩阵;
再而,利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示;
最后,根据节点向量表示,用分类函数得到节点最终的多标签分类结果。
8.根据权利要求7所述的方法,其特征在于,所述对网络中结构进行节点和边的表示,即:采用二维平面上的欧几里得网格的规则来表示结构,节点之间的边用概率决定。
9.根据权利要求7所述的方法,其特征在于,所述构造网络的相似矩阵,即:利用节点间的距离相似、节点间属性的余弦相似度的分歧程度来表示两个节点的相似度,进而通过将每两个节点的相似度作为相似矩阵上的元素,构造网络的相似矩阵,得到节点嵌入表示。
10.根据权利要求7所述的方法,其特征在于,所述利用谱技术方法将网络空间中的标签信息进行表示学习,与已学习到的网络嵌入的矩阵进行融合,得到节点向量表示,即:将标签中的节点的邻接领域信息映射到向量表示中,利用节点属性网络的表示学习接近度来平滑标签信息建模;而后,将具有相同的标签的节点包含在同一个集合中,并计算的余弦相似度矩阵,并通过计算拉普拉斯矩阵,其中,计算为余弦相似度矩阵,是的度矩阵;最后,使用已学习到的网络嵌入的矩阵来做过渡,得到最终的标签嵌入表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038740.7A CN109784404A (zh) | 2019-01-16 | 2019-01-16 | 一种融合标签信息的多标签分类原型系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038740.7A CN109784404A (zh) | 2019-01-16 | 2019-01-16 | 一种融合标签信息的多标签分类原型系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784404A true CN109784404A (zh) | 2019-05-21 |
Family
ID=66500691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910038740.7A Pending CN109784404A (zh) | 2019-01-16 | 2019-01-16 | 一种融合标签信息的多标签分类原型系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784404A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110276387A (zh) * | 2019-06-12 | 2019-09-24 | 深圳前海微众银行股份有限公司 | 一种模型的生成方法及装置 |
CN110659427A (zh) * | 2019-09-06 | 2020-01-07 | 北京百度网讯科技有限公司 | 基于多源数据的城市功能划分方法、装置和电子设备 |
CN112861941A (zh) * | 2021-01-26 | 2021-05-28 | 中山大学 | 一种多标签图像分类方法、装置、设备和存储介质 |
-
2019
- 2019-01-16 CN CN201910038740.7A patent/CN109784404A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110276387A (zh) * | 2019-06-12 | 2019-09-24 | 深圳前海微众银行股份有限公司 | 一种模型的生成方法及装置 |
CN110276387B (zh) * | 2019-06-12 | 2023-06-23 | 深圳前海微众银行股份有限公司 | 一种模型的生成方法及装置 |
CN110659427A (zh) * | 2019-09-06 | 2020-01-07 | 北京百度网讯科技有限公司 | 基于多源数据的城市功能划分方法、装置和电子设备 |
CN112861941A (zh) * | 2021-01-26 | 2021-05-28 | 中山大学 | 一种多标签图像分类方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022062419A1 (zh) | 基于非督导金字塔相似性学习的目标重识别方法及系统 | |
De Morsier et al. | Kernel low-rank and sparse graph for unsupervised and semi-supervised classification of hyperspectral images | |
CN106547880B (zh) | 一种融合地理区域知识的多维度地理场景识别方法 | |
CN113707235A (zh) | 基于自监督学习的药物小分子性质预测方法、装置及设备 | |
Rajagopal et al. | Fine-tuned residual network-based features with latent variable support vector machine-based optimal scene classification model for unmanned aerial vehicles | |
CN113822315B (zh) | 属性图的处理方法、装置、电子设备及可读存储介质 | |
CN111931505A (zh) | 一种基于子图嵌入的跨语言实体对齐方法 | |
CN110619059B (zh) | 一种基于迁移学习的建筑物标定方法 | |
CN114283350B (zh) | 视觉模型训练和视频处理方法、装置、设备及存储介质 | |
Moreno-García et al. | A graph repository for learning error-tolerant graph matching | |
Yang et al. | Active matting | |
CN113821670A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
CN109784404A (zh) | 一种融合标签信息的多标签分类原型系统及方法 | |
CN113657145B (zh) | 一种基于汗孔特征及神经网络的指纹检索方法 | |
Liu et al. | An ensemble of classifiers based on positive and unlabeled data in one-class remote sensing classification | |
Uzun et al. | Deep learning based classification of time series of chaotic systems over graphic images | |
CN109472370B (zh) | 一种维修厂分类方法及装置 | |
CN103544500B (zh) | 多用户自然场景标记排序方法 | |
CN117131214A (zh) | 基于特征分布对齐与聚类的零样本草图检索方法及系统 | |
CN117079063B (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
CN116824572A (zh) | 基于全局和部件匹配的小样本点云物体识别方法、系统及介质 | |
Kavitha et al. | Classification of Indian monument architecture styles using bi-level hybrid learning techniques | |
CN114936327A (zh) | 元素识别模型的获取方法、装置、计算机设备和存储介质 | |
CN109308492B (zh) | 一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法 | |
Kong et al. | A Mountain Summit Recognition Method Based on Improved Faster R‐CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |
|
RJ01 | Rejection of invention patent application after publication |