CN108764537B - 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法 - Google Patents

一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法 Download PDF

Info

Publication number
CN108764537B
CN108764537B CN201810453513.6A CN201810453513A CN108764537B CN 108764537 B CN108764537 B CN 108764537B CN 201810453513 A CN201810453513 A CN 201810453513A CN 108764537 B CN108764537 B CN 108764537B
Authority
CN
China
Prior art keywords
community
source
network
target
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810453513.6A
Other languages
English (en)
Other versions
CN108764537A (zh
Inventor
傅晨波
郑永立
赵明浩
宣琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810453513.6A priority Critical patent/CN108764537B/zh
Publication of CN108764537A publication Critical patent/CN108764537A/zh
Application granted granted Critical
Publication of CN108764537B publication Critical patent/CN108764537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于A‑TrAdaboost算法的多源社区标签发展趋势预测方法,包括以下步骤:(1)构建问答社区中的标签网络;(2)计算源领域社区和目标领域社区结构的向量表征(3)计算源领域与目标领域之间的结构相似性;(4)构建基于A‑TrAdaboost算法的多源社区标签流行性预测模型。本发明利用网络图表征的方法,得到各个网络的向量表征,进而计算网络之间的相似性,作为不同问答社区之间的领域距离,并将网络结构之间的相似性作为多源迁移学习算法TrAdaboost的初始权重,在进行跨社区预测新标签流行性问题时,能够较好的避免多源迁移中的负迁移问题,提高模型的训练时间和精度。

Description

一种基于A-TrAdaboost算法的多源社区标签发展趋势预测 方法
技术领域
本发明涉及数据挖掘、图结构分析技术,特别是涉及一种基于A-TrAdaboost 算法的多源社区标签发展趋势预测方法。
背景技术
当前随着移动互联网和智能设备的广泛普及,改变了人们的生活方式,人们 更倾向于在网络上发表自己看法和搜集自己需要的信息,因此在线问答社区变得 越来越活跃和流行。由于问答社区中的帖子数量巨大,用户在问答社区中获取的 信息主要根据问题答案的标签来进行筛选和推荐,随着时间的推移,标签的数量 也越来与巨大,问答社区中的标签研究日益成为关注的热点。
傅晨波等人(见文献[1]Fu C,Zheng Y,Li S,et al.Predicting the popularityof tags in StackExchange QA communities[C]//Complex Systems and Networks(IWCSN),2017International Workshop on.IEEE,2017:90-95.即傅晨波,郑永立,李 诗迪.预测StackExchange问答社区标签流行性[C]//复杂的系统和网络 (IWCSN),2017国际研讨会.IEEE,2017:90-95。)已经研究了问答社区中新标签未 来的流行性发展趋势预测,但是其预测模型仅根据单个社区中标签数据来进行模 型构建。在这种情况下,当在一些数据量较小的社区或者新出现的社区中使用模 型时,由于标记数据样本较少,会使得训练后的模型并不理想。迁移学习从一个 相关并同时拥有丰富训练样本的领域中训练模型,并分享到目标领域。利用迁移 学习可以解决目标领域训练数据较少的缺陷。因此我们利用迁移学习的思路在其 他较大社区中进行模型训练,然后再迁移到目标社区,以提高预测模型的精度。
单源迁移时常常会遇到负迁移的状况,使得迁移过来的效果并不好。为了解 决这一问题,其中一种方法是设置不同的样本权重,通过设置不同样本之间的权 重,选择出对目标任务有帮助的样本,提高迁移学习的效果。TrAdaboost(见文 献[2]Dai W,Yang Q,XueG R,et al.Boosting for transfer learning[C]//International Conference onMachine Learning.ACM,2007:193-200.即戴文渊,杨强,薛贵荣,俞 勇.迁移学习集成[C]//国际机器学习会议.ACM,2007:193-200.)方法利用迭代更新 权重的方法,通过对每次训练的模型在目标领域上的分类效果,计算误差,反馈 更新样本的权重,得出最后的分类模型。另外一种方法是多源迁移的模型框架。 已有的多源迁移学习方法已经很多,目前比较常用的迁移学习方法是根据不同领 域之间的特征分布的距离作为其衡量领域之间的相似性,进而对不同领域构建的 基分类器进行加权。在使用迁移学习的方法来预测问答社区标签流行性发展趋势 的预测问题中,根据特征分布之间的差异性来衡量不同领域之间的相似性大小, 不能取得较好的迁移提升效果。
发明内容
为了解决跨社区标签流行性的预测问题,为了较好的衡量涉及网络结构的不 同领域之间的差异,和改善TrAdaboost在在具有负迁移数据源上的迁移效果的 鲁棒性,本发明提出一种基于网络结构相似性的A-TrAdaboost算法来预测在线 问答社区中新标签在未来的流行性发展趋势。
本发明解决其技术问题所采用的技术方案如下:
一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法,包括如下步 骤:
步骤1:构建问答社区中标签网络,如果同一个问题帖子下边出现多个标签, 则认为这些标签具有连边,构建问答社区标签网络,得到源领域和目标领域社区 的网络结构集合
Figure BDA0001659026100000021
步骤2:计算各社区中网络结构的向量表征,采用graph2vec的方法,将每 个网络Gi∈Ω用一个维度为d的向量来进行表征,最后学习得到源领域网络结构 表征向量
Figure BDA0001659026100000022
和目标领域结构向量表征VT
步骤3:计算源领域与目标领域之间的结构相似性,计算源领域网络结构表 征向量
Figure BDA0001659026100000023
和目标领域VT之间的余弦相似性γt
Figure BDA0001659026100000024
步骤4:构建基于A-TrAdaboost算法的多源社区标签流行性预测模型。通过 提取源领域
Figure BDA0001659026100000025
和目标领域DT中的样本标签及特征数据,把步骤3中计算的相似 性γt作为各源领域上样本的初始权重,通过有权SVM的方法,训练出预测模型, 然后不断迭代更新不同训练样本中的权重,得出最后的训练模型。
进一步,所述步骤1中,构建问答社区中标签网络,对源领域问答社区Si中, 统计其社区中所有的新标签,按时间排序,取比例为前α=10%中的新标签中最 后一个标签出现的时刻
Figure BDA0001659026100000031
社区所有标签的网络,作为该社区的网络结构
Figure BDA0001659026100000032
Figure BDA0001659026100000033
时刻的社区网络结构初步形成,其结构特征能够代表该领域社区的网络结构,最 后得到源领域和目标领域社区的网络结构集合
Figure BDA0001659026100000034
再进一步,所述步骤2中,计算各个社区中网络结构的向量表征,采用 graph2vec(见文献[3]Narayanan A,Chandramohan M,Venkatesan R,et al. graph2vec:LearningDistributed Representations of Graphs[J].arXiv preprint arXiv:1707.05005,2017.即Narayanan A,Chandramohan M,Venkatesan R. graph2vec:学习图的分布式表征[J].arXiv preprint arXiv:1707.05005,2017.)的方法, 将每个网络Gi∈Ω用一个维度为d的向量来进行表征;首先,提取网络Gi的根 子图结构,利用Weisfeiler-Lehman(WL)核方法对网络Gi中每一个节点依次 提取最小子图结构,集合为
Figure RE-GDA0001741763940000035
vi表示网络Gi中的子图的 种类,然后利用类比doc2vec(见文献[4]Le Q,MikolovT.Distributed representations of sentences and documents[C]//InternationalConference on Machine Learning.2014:1188-1196.即Le Q,Mikolov T.句子和文档的分布式表征[C]//国 际机器学习会议.2014:1188-1196.)的方法中的skip-gram的语言嵌入模型,将子 图结构类比于单词,每个图类比一个文档,最后学习得到源领域社区和目标社区 网络图结构的向量表征
Figure RE-GDA0001741763940000036
和VT,t∈{1,2,…,n}。
更进一步,所述步骤4中,构建基于网络结构相似性的A-TrAdaboost算法模 型,操作如下:根据文献[1]中提取特征和标签标记的方法,得到源领域社区和 目标领域的特征标记样本
Figure BDA0001659026100000037
和 DT={(xT,c(xT))},其中
Figure BDA0001659026100000038
为目标领域有标记数 据集,
Figure BDA0001659026100000039
为目标领域无标记数据集,c(x)函数表示样本x的标记 函数,c(x)∈{0,1},选择源领域数据和目标领域有标记样本数据集作为模型的训 练集
Figure BDA00016590261000000310
测试集为
Figure BDA00016590261000000311
将步骤3所计算的余弦相似性γt分别 作为源领域
Figure BDA0001659026100000041
中样本的权重
Figure BDA0001659026100000042
Figure BDA0001659026100000043
中样本的初始权重设为1,记为wT,即所 有训练样本权重为
Figure BDA0001659026100000044
作为A-TrAdaboost方法的初始权 重,
Figure BDA0001659026100000045
分别表示
Figure BDA0001659026100000046
的样本大小,n表示
Figure BDA0001659026100000047
的样本大小,
Figure BDA0001659026100000048
在每次迭代 过程中,通过有权SVM训练每次的基分类器ft,然后根据公式计算每次迭代后 在目标领域有标记样本
Figure BDA0001659026100000049
上的误差率εt
Figure BDA00016590261000000410
Figure BDA00016590261000000411
Figure BDA00016590261000000412
其中,βt表示为当前的基分类器的权重。再根据误差率更新训练样本的权重,
Figure BDA00016590261000000413
使得对目标领域有益的样本权重增加,反之权重降低,迭代N次后,对最后得 到的N个基分类器{f1,f2,…,fN}进行加权投票得出最后的出最后的预测模型fT
Figure BDA00016590261000000414
本发明的有益效果表现在:利用网络图表征的方法,得到各个网络的向量表 征,进而计算网络之间的相似性,作为不同问答社区之间的领域距离,并将网络 结构之间的相似性作为多源迁移学习算法TrAdaboost的初始权重,在进行跨社 区预测新标签流行性问题时,能够较好的避免多源迁移中的负迁移问题,提高模 型的训练时间和精度。
附图说明
图1基于A-TrAdaboost算法的多源社区标签发展趋势预测方法流程框图;
图2为A-TrAdaboost算法的基本步骤。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。
参照图1和图2,一种基于A-TrAdaboost算法的多源社区标签发展趋势预测 方法,本发明使用了Stack Exchange问答网站中数据进行实例分析,数据采用了 部分问答社区中每个帖子创建时间,帖子ID,用户ID,帖子标签等信息,构建 标签网络,提取标签对应的结构特征和非结构特征,进行提出的A-TrAdaboost 模型的构建和训练。
本发明具体分为以下四个步骤::
步骤1:构建问答社区标签网络。
步骤2:计算各个社区中网络结构的向量表征。
步骤3:计算源领域与目标领域之间的相似性。
步骤4:构建基于A-TrAdaboost算法的多源社区标签流行性预测模型。
所述步骤1中,构建问答社区中标签网络,操作如下:如果同一个问题帖子 下边出 现多个标签,则认为这些标签具有连边,构建社区的标签网络;例如对源 领域问答社区Si 中,统计其社区中所有的新标签,按时间排序,取比例为前 α=10%中的新标签中最后一个 标签出现的时刻
Figure BDA0001659026100000051
社区所有标签的网络,作为该 社区的网络结构
Figure BDA0001659026100000052
Figure BDA0001659026100000053
时刻的社区网络 结构初步形成,其结构特征能够代表该 领域社区的网络结构,最后得到源领域和目标领域 社区的网络结构集合
Figure BDA0001659026100000054
所述步骤2中,计算社区中网络结构的向量表征,采用graph2vec的方法, 将每个网络Gi∈Ω用一个维度为d的向量来进行表征;首先,提取网络Gi的根 子图结构,利用Weisfeiler-Lehman(WL)核方法对网络Gi中每一个节点依次 提取最小子图结构,集合为
Figure BDA0001659026100000055
vi表示网络Gi中的子图的 种类。然后利用类比doc2vec的方法中的skip-gram的语言嵌入模型,将子图结 构类比于单词,每个图类比一个文档,最后学习得到每个源领域社区和目标领域 社区的网络图结构的向量表征
Figure BDA0001659026100000056
和VT,t∈{1,2,…,n}。
所述步骤3中,计算源领域与目标领域之间的结构相似性,计算源领域网络 结构表征向量
Figure BDA0001659026100000057
和VT之间的余弦相似性γt
Figure BDA0001659026100000061
所述步骤4中,构建基于A-TrAdaboost算法的多源社区标签流行性预测模型。 具体操作如下,根据文献[1]中提取特征和标签标记的方法,得到源领域社区和 目标领域的特征标记样本
Figure BDA0001659026100000062
和 DT={(xT,c(xT))},其中
Figure BDA0001659026100000063
为目标领域有标记数 据集,
Figure BDA0001659026100000064
为目标领域无标记数据集,c(x)函数表示样本x的标记 函数,c(x)∈{0,1}。选择源领域数据和目标领域有标记样本数据集作为模型的训 练集
Figure BDA0001659026100000065
测试集为
Figure BDA0001659026100000066
将步骤3所计算的余弦相似性γt分别 作为源领域
Figure BDA0001659026100000067
中样本的权重
Figure BDA0001659026100000068
Figure BDA0001659026100000069
中样本的初始权重设为1,记为wT,即所 有训练样本权重为
Figure BDA00016590261000000610
作为A-TrAdaboost方法的初始权 重。在每次迭代过程中,通过有权SVM训练每次的基分类器ft,然后根据公式 计算每次迭代后在目标领域有标记样本
Figure BDA00016590261000000611
上的误差率:
Figure BDA00016590261000000612
Figure BDA00016590261000000613
Figure BDA00016590261000000614
其中,βt表示为当前的基分类器的权重。再根据误差率更新训练样本的权重,
Figure BDA00016590261000000615
使得对目标领域有益的样本权重增加,反之权重降低,迭代N次后,对最后得 到的N个基分类器{f1,f2,…,fN}进行加权投票得出最后的出最后的预测模型fT
Figure BDA0001659026100000071
如上所述为本发明在问答网站Stack Exchange中进行了基于网络结构相似性 的A-TrAdaboost算法模型的构建,本发明选择多个较大社区里的标记数据作为 源领域数据,对目标领域社区中进行多源迁移模型的构建,根据不同社区之间的 网络结构相似性,作为源领域社区与目标领域社区之间的初始权重,通过迭代更 新得出最后的预测模型,相比于传统的TrAdaboost方法,能够提高模型训练时 间,在某些具有负迁移的数据上,能够具有较好的提升效果。本专业技术人员理 解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等 效,但都将落入本发明的保护范围内。

Claims (1)

1.一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法,其特征在于,所述方法包括如下步骤:
步骤1:构建问答社区中标签网络,如果同一个问题帖子下边出现多个标签,则认为这些标签具有连边,构建问答社区标签网络,统计其社区中所有的新标签,按时间排序,取比例为前α=10%中的新标签中最后一个标签出现的时刻
Figure FDA0003253817350000011
社区所有标签的网络,作为该社区的网络结构
Figure FDA0003253817350000012
得到源领域和目标领域社区的网络结构集合
Figure FDA0003253817350000013
步骤2:计算各社区中网络结构的向量表征,采用graph2vec的方法,提取网络Gi的根子图结构,利用Weisfeiler-Lehman核方法对网络Gi中每一个节点依次提取最小子图结构,集合为
Figure FDA0003253817350000014
vi表示网络Gi中的子图的种类,然后利用类比doc2vec的方法中的skip-gram的语言嵌入模型,学习得到源领域社区和目标社区网络图结构的向量表征
Figure FDA0003253817350000015
和VT,t∈{1,2,…,n}。
步骤3:计算源领域与目标领域之间的结构相似性,计算源领域网络结构表征向量
Figure FDA0003253817350000016
和和目标领域VT之间的余弦相似性γt
Figure FDA0003253817350000017
步骤4:构建基于A-TrAdaboost算法的多源社区标签流行性预测模型,通过提取源领域
Figure FDA0003253817350000018
和目标领域DT中的样本标签及特征数据,把步骤3中计算的相似性γt作为各源领域迁移到目标领域上的初始权重,通过有权SVM的方法,不断迭代更新不同训练样本中的权重,得出最后的训练模型;
所述步骤4中,构建基于网络结构相似性的A-Tradaboost算法模型,操作如下,获取所有源领域和目标领域社区的特征标记样本DS和DT,其中
Figure FDA0003253817350000019
Figure FDA00032538173500000110
Figure FDA00032538173500000111
为目标领域有标记数据集,
Figure FDA00032538173500000112
为目标领域无标记数据集,选择源领域数据和目标领域有标记样本数据集作为模型的训练集
Figure FDA00032538173500000113
测试集为
Figure FDA00032538173500000114
c(x)函数表示样本x的标记函数,c(x)∈{0,1},将步骤3所计算的余弦相似性γt分别作为源领域
Figure FDA00032538173500000115
中样本的权重
Figure FDA0003253817350000021
Figure FDA0003253817350000022
中样本的初始权重设为1,记为wT,即所有训练样本权重为
Figure FDA0003253817350000023
作为A-TrAdaboost方法的初始权重,在每次迭代过程中,通过有权SVM训练每次的基分类器ft,然后根据公式计算每次迭代后在目标领域有标记样本
Figure FDA0003253817350000029
上的误差率εt
Figure FDA0003253817350000024
Figure FDA0003253817350000025
Figure FDA0003253817350000026
其中,βt表示为当前的基分类器的权重,再根据误差率更新训练样本的权重,
Figure FDA0003253817350000027
使得对目标领域有益的样本权重增加,反之权重降低,迭代N次后,对最后得到的N个基分类器{f1,f2,…,fN}进行加权投票得出最后的出最后的预测模型fT
Figure FDA0003253817350000028
CN201810453513.6A 2018-05-14 2018-05-14 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法 Active CN108764537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810453513.6A CN108764537B (zh) 2018-05-14 2018-05-14 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810453513.6A CN108764537B (zh) 2018-05-14 2018-05-14 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法

Publications (2)

Publication Number Publication Date
CN108764537A CN108764537A (zh) 2018-11-06
CN108764537B true CN108764537B (zh) 2021-11-23

Family

ID=64010325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810453513.6A Active CN108764537B (zh) 2018-05-14 2018-05-14 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法

Country Status (1)

Country Link
CN (1) CN108764537B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862084B (zh) * 2021-04-26 2021-11-30 苏州博宇鑫交通科技有限公司 基于深度迁移融合学习的交通流量预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199857A (zh) * 2014-08-14 2014-12-10 西安交通大学 一种基于多标签分类的税务文档层次分类方法
CN104899430A (zh) * 2015-05-14 2015-09-09 江苏大学 一种基于多源实例迁移学习的恐怖行为预测方法
CN105718532A (zh) * 2016-01-15 2016-06-29 北京大学 一种基于多深度网络结构的跨媒体排序方法
CN106951471A (zh) * 2017-03-06 2017-07-14 浙江工业大学 一种基于svm的标签发展趋势预测模型的构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199857A (zh) * 2014-08-14 2014-12-10 西安交通大学 一种基于多标签分类的税务文档层次分类方法
CN104899430A (zh) * 2015-05-14 2015-09-09 江苏大学 一种基于多源实例迁移学习的恐怖行为预测方法
CN105718532A (zh) * 2016-01-15 2016-06-29 北京大学 一种基于多深度网络结构的跨媒体排序方法
CN106951471A (zh) * 2017-03-06 2017-07-14 浙江工业大学 一种基于svm的标签发展趋势预测模型的构建方法

Also Published As

Publication number Publication date
CN108764537A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN109492099B (zh) 一种基于领域对抗自适应的跨领域文本情感分类方法
US20200285903A1 (en) System for time-efficient assignment of data to ontological classes
CN111026671B (zh) 测试用例集构建方法和基于测试用例集的测试方法
CN109684440A (zh) 基于层级标注的地址相似度度量方法
CN111914558A (zh) 基于句袋注意力远程监督的课程知识关系抽取方法及系统
CN108388559A (zh) 地理空间应用下的命名实体识别方法及系统、计算机程序
CN108959305A (zh) 一种基于互联网大数据的事件抽取方法及系统
CN108681585A (zh) 一种基于NetSim-TL的多源迁移学习标签流行性预测模型的构建方法
CN104573130A (zh) 基于群体计算的实体解析方法及装置
CN104966105A (zh) 一种鲁棒机器错误检索方法与系统
CN109948735A (zh) 一种多标签分类方法、系统、装置及存储介质
CN105930873A (zh) 一种基于子空间的自步跨模态匹配方法
CN103473308B (zh) 基于最大间隔张量学习的高维多媒体数据分类方法
CN104317837B (zh) 一种基于主题模型的跨模态检索方法
CN110807086A (zh) 文本数据标注方法及装置、存储介质、电子设备
CN109033087B (zh) 计算文本语义距离的方法、去重方法、聚类方法以及装置
CN103778206A (zh) 一种网络服务资源的提供方法
CN113946657A (zh) 一种基于知识推理的电力业务意图自动识别方法
CN104036021A (zh) 混合生成式和判别式学习模型的图像语义标注方法
CN110245234A (zh) 一种基于本体和语义相似度的多源数据样本关联方法
CN110287495A (zh) 一种电力营销专业词识别方法及系统
CN114201583A (zh) 一种基于图注意力网络的中文金融事件自动抽取方法及系统
CN108764537B (zh) 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法
CN111339258A (zh) 基于知识图谱的大学计算机基础习题推荐方法
CN112163069A (zh) 一种基于图神经网络节点特征传播优化的文本分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant