CN109117891B - 融合社交关系和命名特征的跨社交媒体账户匹配方法 - Google Patents

融合社交关系和命名特征的跨社交媒体账户匹配方法 Download PDF

Info

Publication number
CN109117891B
CN109117891B CN201810985465.5A CN201810985465A CN109117891B CN 109117891 B CN109117891 B CN 109117891B CN 201810985465 A CN201810985465 A CN 201810985465A CN 109117891 B CN109117891 B CN 109117891B
Authority
CN
China
Prior art keywords
account
seed
classifier
user
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810985465.5A
Other languages
English (en)
Other versions
CN109117891A (zh
Inventor
费高雷
杨立波
于富财
胡光岷
张乐中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810985465.5A priority Critical patent/CN109117891B/zh
Publication of CN109117891A publication Critical patent/CN109117891A/zh
Application granted granted Critical
Publication of CN109117891B publication Critical patent/CN109117891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:S1、找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将做笛卡尔乘积,作为候选账户对;S3、进行预处理,取特征形成特征向量;S4、将特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。本发明的方法降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,大幅降低了无效计算在整个计算过程中的比例,提高了效率。

Description

融合社交关系和命名特征的跨社交媒体账户匹配方法
技术领域
本发明涉及一种融合社交关系和命名特征的跨社交媒体账户匹配方法。
背景技术
对于跨社交媒体的账户匹配问题,通常将其建模为一个分类问题:在给定两个用户a、b分别属于社交媒体平台A和B,研究的目的就是获得一个分类判别函数,当输入用户a和b的信息后,如果两个用户属于同一人物实体则输出1,否则输出0,如下公示所示:
Figure BDA0001779597220000011
跨社交媒体的人物识别方法对于数据挖掘的研究具有非常重大的意义,可以作为多种研究的前提。
现有跨社交媒体用户匹配方法的主要思想是把用户匹配转换为个二分类问题,结合文档、内容和网络等多种特征,并采用有监督学习的方法进行求解。但是现有方法还存在两方面的问题:
第一,分类模型的泛化能力差。现有研究主要着眼于特征构建以及模型选择,对于训练集和测试集构建通过挑选账户中主动提供了其它社交平台账号的用户作为正例,并在此基础上把正例中已知的匹配关系随机打乱获得负例,这种方式的缺陷是负例数据随机性较大,训练集中处于决策边界的样本数较少,导致构建的分类器不够准确。
第二,无法适用于实际应用。跨社交媒体用户匹配的使用场景通常是已知不同社交媒体账号的集合,需要将两个集合中相互对应的账号进行匹配,现有的方法通过基于聚类和模糊匹配,通常需要将不同账号集合中的账号进行依次相互比较,存在计算复杂度过高的问题,无法将该方法推广到实际海量社交媒体账号匹配。
发明内容
本发明的目的在于克服现有技术的不足,提供一种降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,这一策略大幅降低了无效计算在整个计算过程中的比例,提高了效率,加快关联用户发现的速度的融合社交关系和命名特征的跨社交媒体账户匹配方法。
本发明的目的是通过以下技术方案来实现的:融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对,做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
进一步地,所述步骤S4中训练分类器的具体实现方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器。
本发明的有益效果是:本发明提出了一个实用的关联用户发现框架,结合用户连接关系提高了在大规模数据集中下用户搜索的效率,通过对训练集的采样再扩充过程并结合集成学习算法,提高了分类模型的准确率和泛化能力。具体来说:通过在种子用户数据集(已知的属于同一个人实体的账号信息)的直接好友关系出发,进行潜在用户关联配对的生成的策略,可以获得如下有益效果:
1、降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,这一策略大幅降低了无效计算在整个计算过程中的比例,提高了效率,加快关联用户发现的速度。
2、通过在缩小搜索范围减少了同名的个人实体对于识别结果的影响。用户好友中出现用户名相同的好友的可能性非常小,因此在用户的直接好友关系中结合用户名进行关联判决还能解决相同名字的不同个人实体的消岐问题,进一步提高识别效果。
3、提高了分类模型的泛化能力。通过将用典型的错误分类结果扩充分类器训练集重复训练分类器,提高分类准确率的同时,模型泛化能力得到了增强,模型在实际的应用场景中的表现变得更加优秀。
附图说明
图1为本发明的融合社交关系和命名特征的跨社交媒体账户匹配方法的流程图;
图2为本发明的潜在关联用户配对原理图。
具体实施方式
本发明提出一种融合社交关系和命名特征的用户关联匹配的方法,该方法利用用户关系网络缩小预匹配用户范围,减小账号匹配过程中的计算量;并针对现有方法训练集构建不够理想的问题,提出通过迭代训练的方式将每次分类时容易被分错的样本加入训练集,提高处于分类器边界的样本比例,同时结合集成学习的方法,能够准确、高效地完成跨社交媒体用户账号匹配。流程上总体分为两个部分,潜在关联用户配对生成和用户关联结果判定。潜在关联用户配对生成找出需要对哪些账号进行关联判别,我们可以将这一过程称之为预匹配;用户关联结果判定则负责训练出可靠的分类器,同时对预匹配的用户配对作出最终判别。
设两个社交平台用户数据集分别为A和B,我们的目标是找出一个用户配对集合
Pairs={(s1,s2)|s1∈A,s2∈B}
使得这个集合的规模尽量小,并且最后输入分类器判定为正类的配对尽可能高。我们将这一过程称为潜在关联用户配对生成。我们定义计算效率如下:
Figure BDA0001779597220000031
match_pairs={(s1,s2)|(s1,s2)∈Pairs,s1=s2} (2-2)
如果直接将两个集合相乘得到一个笛卡尔积,那么|Pairs|=|A|×|B|,则整个流程中的计算复杂度将变成Θ(n2),其中有大量的无效运算,假设两个集合的用户数都为N,则计算效率为1/N,当数据集规模上亿时,这个效率是无法忍受的。现有的方法主要采取聚类算法和模糊匹配用于大数据集情况下的用户发现,这类方法的计算复杂度仍然为Θ(n2),对于计算效率并没有实质上的提高。因此为了提高计算效率,我们需要首先找到最有可能属于同一人物实体的账户对,我们称这一过程为预匹配。
在社交媒体相关的研究中,用户的连接关系可以根据链接的完整性和连通性分为两种类型,局部连接和全局连接。局部连接关系只利用用户的第一条连接关系,即直接的好友关系。全局连接则使用多跳关系形成的网络信息为用户关联识别提供依据。但是直接利用这些链接信息作为属性输入分类模型获得的信息增益少,同时图算法的计算复杂度通常也较高。因此我们不把用户的好友连接关系作为特征用在分类器中,而是通过在已经匹配的两个账号的好友内进行匹配,减小计算量。
本方案是基于这样一种假设:人物实体在现实中的社会关系会在一定程度上映射到他所在的社交媒体平台上。举例来说就是,我们在现实世界中的朋友我们在QQ、微信上加为好友,同时也可能在微博上互相关注。这种映射存在一定的随机性,例如我们可能并没有在微博上关注这些好友,在微博上关注的用户也许在现实中也没有交集,因此用这些信息计算相似性并不可靠。但是我们可以通过这种方式来减少上面定义的Pairs,从而提高计算效率。
下面结合附图进一步说明本发明的技术方案。
如图1所示,融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、如图2所示,从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对(图中黑色连线),做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中(黑色粗线代表判别为属于同一人的账户);
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
在上述流程中,需要判定这些用户是否属于同一人物实体。本发明将这个问题建模成一个二分类问题,利用社交媒体上用户自己提供的个人系统,提取属性,进行分类。考虑到不同社交平台用户填写的个人信息字段可能不同,以及大部分用户提供的信息都极为稀疏的特点,我们从用户名这一所有用户都必须提供的字段着手提取特征用于分类。
在特征使用上本方案借鉴了MOBIUS模型中的特征,但是在实际仿真中发现与频率想关的特征带来的信息增益极小,并且还引入了不必要的错误,因此除去了频率相关的特征,并添加了增加了一些编辑距离相关的特征。选用的特征如下表:
Figure BDA0001779597220000041
Figure BDA0001779597220000051
在提取用户名长度特征时,如果在一方平台上用户名多于一个(例如Twitter上一个用户同时有屏显名和用户名),则对提取的数值取平均值、标准差、中位数和最大值最小值的方式处理。
进一步地,所述步骤S4中训练分类器的具体实现方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器。
简单的对这些用户名进行预处理,忽略字母大小写。按照上述特征提取策略进行特征抽取,训练出初始的分类器。在实验仿真中,首先使用的是logistic回归模型进行分类,用Twitter和LinkedIn的数据集测试能够获得90%以上的F1值数据。但是在实际使用分类器的时候分类器会把很多不属于同一个用户的账户判定为同一账户,经过分析发现分类结果中错误的分类结果中的用户名有一点相似度,例如同名不同姓的名字会被判定为正例。这是由于构建的负例不够典型造成的,其中相似但不属于同一个人的用户名比例太低。
通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,例如
LinkedIn中部分用户会给出自己的Twitter账号。这些正例基本能够保证正确性,然后在正例的基础上把原有的配对打散,随机构建负例;在本发明中是用移位的方式,例如构建的正例为:{(a1,b1),(a2,b2),(a3,b3)},然后将配对中的B平台用户移动两位获得负例,就能保证负例数据集的正确性:{(a1,b2),(a2,b3),(a3,b1)}。将这些数据集按比例划分成训练集和测试集来训练和测试分类器。
本发明从集成学习方法的思路中得到启发,将前一次模型中的错误分类结果补充到训练集中,再一次训练分类器模型调整权重以期获得更加合理的模型。同时通过AdaBo-ost算法结合logsitic回归构建的分类器进一步增强性能。
在实验中,经过两轮训练过后,分类器的F1值可以达到94%.,并且大大降低了将负例判定为属于同一人物实体的数量。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (1)

1.融合社交关系和特征向量的跨社交媒体账户匹配方法,其特征在于,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对,做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;分类器的训练方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器;
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
CN201810985465.5A 2018-08-28 2018-08-28 融合社交关系和命名特征的跨社交媒体账户匹配方法 Active CN109117891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810985465.5A CN109117891B (zh) 2018-08-28 2018-08-28 融合社交关系和命名特征的跨社交媒体账户匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810985465.5A CN109117891B (zh) 2018-08-28 2018-08-28 融合社交关系和命名特征的跨社交媒体账户匹配方法

Publications (2)

Publication Number Publication Date
CN109117891A CN109117891A (zh) 2019-01-01
CN109117891B true CN109117891B (zh) 2022-04-08

Family

ID=64860267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810985465.5A Active CN109117891B (zh) 2018-08-28 2018-08-28 融合社交关系和命名特征的跨社交媒体账户匹配方法

Country Status (1)

Country Link
CN (1) CN109117891B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457404B (zh) * 2019-08-19 2021-11-02 电子科技大学 基于复杂异质网络的社交媒体账户分类方法
CN111160130B (zh) * 2019-12-12 2022-04-01 中国电子科技网络信息安全有限公司 一种多平台虚拟身份账号的多维碰撞识别方法
CN112084335B (zh) * 2020-09-09 2022-04-12 电子科技大学 一种基于信息融合的社交媒体用户账号分类方法
CN113761386A (zh) * 2021-04-30 2021-12-07 中科天玑数据科技股份有限公司 一种人物社交关系挖掘的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379158A (zh) * 2012-04-24 2013-10-30 中国移动通信集团公司 一种社交网络中推荐好友信息的方法及系统
WO2014201840A1 (en) * 2013-06-19 2014-12-24 Tencent Technology (Shenzhen) Company Limited Method, device and computer-readable storage medium for cross-platform synchronization of contacts in a multi-platform environment
CN104765729A (zh) * 2014-01-02 2015-07-08 中国人民大学 一种跨平台微博社区账户匹配方法
CN105808696A (zh) * 2016-03-03 2016-07-27 北京邮电大学 一种基于全局和局部特征的跨在线社交网络用户匹配方法
CN106202543A (zh) * 2016-07-27 2016-12-07 苏州家佳宝妇幼医疗科技有限公司 基于机器学习的本体匹配方法和系统
CN106971152A (zh) * 2017-03-16 2017-07-21 天津大学 一种基于航拍图像的检测输电线路中鸟巢的方法
CN107330355A (zh) * 2017-05-11 2017-11-07 中山大学 一种基于正样本平衡约束的深度行人再标识方法
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9589205B2 (en) * 2014-05-15 2017-03-07 Fuji Xerox Co., Ltd. Systems and methods for identifying a user's demographic characteristics based on the user's social media photographs
US20170235849A1 (en) * 2016-01-15 2017-08-17 Jacob Research Institute, LLC Matching system and method psychometric instrument system and method and system and method using same

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379158A (zh) * 2012-04-24 2013-10-30 中国移动通信集团公司 一种社交网络中推荐好友信息的方法及系统
WO2014201840A1 (en) * 2013-06-19 2014-12-24 Tencent Technology (Shenzhen) Company Limited Method, device and computer-readable storage medium for cross-platform synchronization of contacts in a multi-platform environment
CN104765729A (zh) * 2014-01-02 2015-07-08 中国人民大学 一种跨平台微博社区账户匹配方法
CN105808696A (zh) * 2016-03-03 2016-07-27 北京邮电大学 一种基于全局和局部特征的跨在线社交网络用户匹配方法
CN106202543A (zh) * 2016-07-27 2016-12-07 苏州家佳宝妇幼医疗科技有限公司 基于机器学习的本体匹配方法和系统
CN106971152A (zh) * 2017-03-16 2017-07-21 天津大学 一种基于航拍图像的检测输电线路中鸟巢的方法
CN107330355A (zh) * 2017-05-11 2017-11-07 中山大学 一种基于正样本平衡约束的深度行人再标识方法
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Cross-Platform Identification of Anonymous Identical Users in Multiple Social Media Networks;Xiaoping Zhou 等;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20160229;第28卷(第2期);第411-424页 *
Matching User Accounts across Social Networks based on Users Message;Ying Sha 等;《Procedia Computer Science》;20161231;第80卷;第2423-2427页 *
基于Spark的并行推荐算法的研究与实现;郑凤飞;《万方数据知识服务平台》;20161111;第27页最后一段 *
基于两步聚类和随机森林的乳腺腺管自动识别方法;王帅 等;《计算机科学》;20180331;第45卷(第3期);第247-252页 *

Also Published As

Publication number Publication date
CN109117891A (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
CN109117891B (zh) 融合社交关系和命名特征的跨社交媒体账户匹配方法
CN110825881B (zh) 一种建立电力知识图谱的方法
CN108492200B (zh) 一种基于卷积神经网络的用户属性推断方法和装置
CN111061856B (zh) 一种基于知识感知的新闻推荐方法
CN109753602B (zh) 一种基于机器学习的跨社交网络用户身份识别方法和系统
CN110457404A (zh) 基于复杂异质网络的社交媒体账户分类方法
WO2020038100A1 (zh) 一种特征关系推荐方法及装置、一种计算设备及存储介质
CN107239512B (zh) 一种结合评论关系网络图的微博垃圾评论识别方法
CN113222775B (zh) 融合多模态信息及权重张量的用户身份关联方法
CN105893484A (zh) 一种基于文本特征和行为特征的微博Spammer识别方法
CN110580339B (zh) 一种医疗术语知识库完善的方法和装置
Wang et al. Deep multi-person kinship matching and recognition for family photos
CN111666350A (zh) 一种基于bert模型的医疗文本关系抽取的方法
CN114048295A (zh) 一种用于数据处理的跨模态检索方法及系统
Lai et al. Transconv: Relationship embedding in social networks
CN115438274A (zh) 基于异质图卷积网络的虚假新闻识别方法
CN115204171A (zh) 基于超图神经网络的文档级事件抽取方法及系统
Shao et al. AsyLink: user identity linkage from text to geo-location via sparse labeled data
CN114387005A (zh) 一种基于图分类的套利团伙识别方法
Wang et al. Joint Learning on Relevant User Attributes in Micro-blog.
Baboo et al. Sentiment analysis and automatic emotion detection analysis of twitter using machine learning classifiers
Zhang et al. Spam comments detection with self-extensible dictionary and text-based features
Iliev et al. Information retrieval and recommendation using emotion from speech signals
CN111008285A (zh) 一种基于论文关键属性网络的作者消歧方法
Wang et al. Generalised zero-shot learning for entailment-based text classification with external knowledge

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant