CN109117891A - 融合社交关系和命名特征的跨社交媒体账户匹配方法 - Google Patents
融合社交关系和命名特征的跨社交媒体账户匹配方法 Download PDFInfo
- Publication number
- CN109117891A CN109117891A CN201810985465.5A CN201810985465A CN109117891A CN 109117891 A CN109117891 A CN 109117891A CN 201810985465 A CN201810985465 A CN 201810985465A CN 109117891 A CN109117891 A CN 109117891A
- Authority
- CN
- China
- Prior art keywords
- account
- user
- feature
- seed
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000008569 process Effects 0.000 title claims abstract description 20
- 230000004927 fusion Effects 0.000 claims abstract description 8
- 241001632422 Radiola linoides Species 0.000 claims abstract 2
- 238000012549 training Methods 0.000 claims description 33
- 238000007781 pre-processing Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000011160 research Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 241001632427 Radiola Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010010 raising Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:S1、找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将做笛卡尔乘积,作为候选账户对;S3、进行预处理,取特征形成特征向量;S4、将特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。本发明的方法降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,大幅降低了无效计算在整个计算过程中的比例,提高了效率。
Description
技术领域
本发明涉及一种融合社交关系和命名特征的跨社交媒体账户匹配方法。
背景技术
对于跨社交媒体的账户匹配问题,通常将其建模为一个分类问题:在给定两个用户a、b分别属于社交媒体平台A和B,研究的目的就是获得一个分类判别函数,当输入用户a和b的信息后,如果两个用户属于同一人物实体则输出1,否则输出0,如下公示所示:
跨社交媒体的人物识别方法对于数据挖掘的研究具有非常重大的意义,可以作为多种研究的前提。
现有跨社交媒体用户匹配方法的主要思想是把用户匹配转换为个二分类问题,结合文档、内容和网络等多种特征,并采用有监督学习的方法进行求解。但是现有方法还存在两方面的问题:
第一,分类模型的泛化能力差。现有研究主要着眼于特征构建以及模型选择,对于训练集和测试集构建通过挑选账户中主动提供了其它社交平台账号的用户作为正例,并在此基础上把正例中已知的匹配关系随机打乱获得负例,这种方式的缺陷是负例数据随机性较大,训练集中处于决策边界的样本数较少,导致构建的分类器不够准确。
第二,无法适用于实际应用。跨社交媒体用户匹配的使用场景通常是已知不同社交媒体账号的集合,需要将两个集合中相互对应的账号进行匹配,现有的方法通过基于聚类和模糊匹配,通常需要将不同账号集合中的账号进行依次相互比较,存在计算复杂度过高的问题,无法将该方法推广到实际海量社交媒体账号匹配。
发明内容
本发明的目的在于克服现有技术的不足,提供一种降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,这一策略大幅降低了无效计算在整个计算过程中的比例,提高了效率,加快关联用户发现的速度的融合社交关系和命名特征的跨社交媒体账户匹配方法。
本发明的目的是通过以下技术方案来实现的:融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对,做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
进一步地,所述步骤S4中训练分类器的具体实现方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器。
本发明的有益效果是:本发明提出了一个实用的关联用户发现框架,结合用户连接关系提高了在大规模数据集中下用户搜索的效率,通过对训练集的采样再扩充过程并结合集成学习算法,提高了分类模型的准确率和泛化能力。具体来说:通过在种子用户数据集(已知的属于同一个人实体的账号信息)的直接好友关系出发,进行潜在用户关联配对的生成的策略,可以获得如下有益效果:
1、降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,这一策略大幅降低了无效计算在整个计算过程中的比例,提高了效率,加快关联用户发现的速度。
2、通过在缩小搜索范围减少了同名的个人实体对于识别结果的影响。用户好友中出现用户名相同的好友的可能性非常小,因此在用户的直接好友关系中结合用户名进行关联判决还能解决相同名字的不同个人实体的消岐问题,进一步提高识别效果。
3、提高了分类模型的泛化能力。通过将用典型的错误分类结果扩充分类器训练集重复训练分类器,提高分类准确率的同时,模型泛化能力得到了增强,模型在实际的应用场景中的表现变得更加优秀。
附图说明
图1为本发明的融合社交关系和命名特征的跨社交媒体账户匹配方法的流程图;
图2为本发明的潜在关联用户配对原理图。
具体实施方式
本发明提出一种融合社交关系和命名特征的用户关联匹配的方法,该方法利用用户关系网络缩小预匹配用户范围,减小账号匹配过程中的计算量;并针对现有方法训练集构建不够理想的问题,提出通过迭代训练的方式将每次分类时容易被分错的样本加入训练集,提高处于分类器边界的样本比例,同时结合集成学习的方法,能够准确、高效地完成跨社交媒体用户账号匹配。流程上总体分为两个部分,潜在关联用户配对生成和用户关联结果判定。潜在关联用户配对生成找出需要对哪些账号进行关联判别,我们可以将这一过程称之为预匹配;用户关联结果判定则负责训练出可靠的分类器,同时对预匹配的用户配对作出最终判别。
设两个社交平台用户数据集分别为A和B,我们的目标是找出一个用户配对集合
Pairs={(s1,s2)|s1∈A,s2∈B}
使得这个集合的规模尽量小,并且最后输入分类器判定为正类的配对尽可能高。我们将这一过程称为潜在关联用户配对生成。我们定义计算效率如下:
match_pairs={(s1,s2)|(s1,s2)∈Pairs,s1=s2} (2-2)
如果直接将两个集合相乘得到一个笛卡尔积,那么|Pairs|=|A|×|B|,则整个流程中的计算复杂度将变成Θ(n2),其中有大量的无效运算,假设两个集合的用户数都为N,则计算效率为1/N,当数据集规模上亿时,这个效率是无法忍受的。现有的方法主要采取聚类算法和模糊匹配用于大数据集情况下的用户发现,这类方法的计算复杂度仍然为Θ(n2),对于计算效率并没有实质上的提高。因此为了提高计算效率,我们需要首先找到最有可能属于同一人物实体的账户对,我们称这一过程为预匹配。
在社交媒体相关的研究中,用户的连接关系可以根据链接的完整性和连通性分为两种类型,局部连接和全局连接。局部连接关系只利用用户的第一条连接关系,即直接的好友关系。全局连接则使用多跳关系形成的网络信息为用户关联识别提供依据。但是直接利用这些链接信息作为属性输入分类模型获得的信息增益少,同时图算法的计算复杂度通常也较高。因此我们不把用户的好友连接关系作为特征用在分类器中,而是通过在已经匹配的两个账号的好友内进行匹配,减小计算量。
本方案是基于这样一种假设:人物实体在现实中的社会关系会在一定程度上映射到他所在的社交媒体平台上。举例来说就是,我们在现实世界中的朋友我们在QQ、微信上加为好友,同时也可能在微博上互相关注。这种映射存在一定的随机性,例如我们可能并没有在微博上关注这些好友,在微博上关注的用户也许在现实中也没有交集,因此用这些信息计算相似性并不可靠。但是我们可以通过这种方式来减少上面定义的Pairs,从而提高计算效率。
下面结合附图进一步说明本发明的技术方案。
如图1所示,融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、如图2所示,从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对(图中黑色连线),做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中(黑色粗线代表判别为属于同一人的账户);
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
在上述流程中,需要判定这些用户是否属于同一人物实体。本发明将这个问题建模成一个二分类问题,利用社交媒体上用户自己提供的个人系统,提取属性,进行分类。考虑到不同社交平台用户填写的个人信息字段可能不同,以及大部分用户提供的信息都极为稀疏的特点,我们从用户名这一所有用户都必须提供的字段着手提取特征用于分类。
在特征使用上本方案借鉴了MOBIUS模型中的特征,但是在实际仿真中发现与频率想关的特征带来的信息增益极小,并且还引入了不必要的错误,因此除去了频率相关的特征,并添加了增加了一些编辑距离相关的特征。选用的特征如下表:
在提取用户名长度特征时,如果在一方平台上用户名多于一个(例如Twitter上一个用户同时有屏显名和用户名),则对提取的数值取平均值、标准差、中位数和最大值最小值的方式处理。
进一步地,所述步骤S4中训练分类器的具体实现方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器。
简单的对这些用户名进行预处理,忽略字母大小写。按照上述特征提取策略进行特征抽取,训练出初始的分类器。在实验仿真中,首先使用的是logistic回归模型进行分类,用Twitter和LinkedIn的数据集测试能够获得90%以上的F1值数据。但是在实际使用分类器的时候分类器会把很多不属于同一个用户的账户判定为同一账户,经过分析发现分类结果中错误的分类结果中的用户名有一点相似度,例如同名不同姓的名字会被判定为正例。这是由于构建的负例不够典型造成的,其中相似但不属于同一个人的用户名比例太低。
通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,例如
LinkedIn中部分用户会给出自己的Twitter账号。这些正例基本能够保证正确性,然后在正例的基础上把原有的配对打散,随机构建负例;在本发明中是用移位的方式,例如构建的正例为:{(a1,b1),(a2,b2),(a3,b3)},然后将配对中的B平台用户移动两位获得负例,就能保证负例数据集的正确性:{(a1,b2),(a2,b3),(a3,b1)}。将这些数据集按比例划分成训练集和测试集来训练和测试分类器。
本发明从集成学习方法的思路中得到启发,将前一次模型中的错误分类结果补充到训练集中,再一次训练分类器模型调整权重以期获得更加合理的模型。同时通过AdaBo-ost算法结合logsitic回归构建的分类器进一步增强性能。
在实验中,经过两轮训练过后,分类器的F1值可以达到94%.,并且大大降低了将负例判定为属于同一人物实体的数量。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (2)
1.融合社交关系和命名特征的跨社交媒体账户匹配方法,其特征在于,包括以下步骤:
S1、将采集到的不同平台用户信息存入数据库中,找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;
S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将好友两两配对,做笛卡尔乘积,形成潜在关联用户配对,作为候选账户对;
S3、对S2获得的候选账户对进行预处理,取特征形成特征向量;
S4、将步骤S3抽取的特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;
S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。
2.根据权利要求1所述的融合社交关系和命名特征的跨社交媒体账户匹配方法,所述步骤S4中训练分类器的具体实现方法为:
S41、根据种子用户构建训练集;
S42、用训练集训练一个初始的分类器;
S43、通过寻找在账户中给出了对方平台账号的用户对作为分类器训练集的正例,通过交叉组合的方法构建一个负例验证集;
S44、将负例验证集输入初始分类器进行分类,将分类结果中的负例加入到训练集中,使得训练集中正负实例的比例为1:4;
S45、用新训练集重新训练分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985465.5A CN109117891B (zh) | 2018-08-28 | 2018-08-28 | 融合社交关系和命名特征的跨社交媒体账户匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985465.5A CN109117891B (zh) | 2018-08-28 | 2018-08-28 | 融合社交关系和命名特征的跨社交媒体账户匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109117891A true CN109117891A (zh) | 2019-01-01 |
CN109117891B CN109117891B (zh) | 2022-04-08 |
Family
ID=64860267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810985465.5A Active CN109117891B (zh) | 2018-08-28 | 2018-08-28 | 融合社交关系和命名特征的跨社交媒体账户匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109117891B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457404A (zh) * | 2019-08-19 | 2019-11-15 | 电子科技大学 | 基于复杂异质网络的社交媒体账户分类方法 |
CN111160130A (zh) * | 2019-12-12 | 2020-05-15 | 中国电子科技网络信息安全有限公司 | 一种多平台虚拟身份账号的多维碰撞识别方法 |
CN112084335A (zh) * | 2020-09-09 | 2020-12-15 | 电子科技大学 | 一种基于信息融合的社交媒体用户账号分类方法 |
CN113761386A (zh) * | 2021-04-30 | 2021-12-07 | 中科天玑数据科技股份有限公司 | 一种人物社交关系挖掘的方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103379158A (zh) * | 2012-04-24 | 2013-10-30 | 中国移动通信集团公司 | 一种社交网络中推荐好友信息的方法及系统 |
WO2014201840A1 (en) * | 2013-06-19 | 2014-12-24 | Tencent Technology (Shenzhen) Company Limited | Method, device and computer-readable storage medium for cross-platform synchronization of contacts in a multi-platform environment |
CN104765729A (zh) * | 2014-01-02 | 2015-07-08 | 中国人民大学 | 一种跨平台微博社区账户匹配方法 |
US20150332087A1 (en) * | 2014-05-15 | 2015-11-19 | Fuji Xerox Co., Ltd. | Systems and Methods for Identifying a User's Demographic Characteristics Based on the User's Social Media Photographs |
CN105808696A (zh) * | 2016-03-03 | 2016-07-27 | 北京邮电大学 | 一种基于全局和局部特征的跨在线社交网络用户匹配方法 |
CN106202543A (zh) * | 2016-07-27 | 2016-12-07 | 苏州家佳宝妇幼医疗科技有限公司 | 基于机器学习的本体匹配方法和系统 |
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
US20170235849A1 (en) * | 2016-01-15 | 2017-08-17 | Jacob Research Institute, LLC | Matching system and method psychometric instrument system and method and system and method using same |
CN107330355A (zh) * | 2017-05-11 | 2017-11-07 | 中山大学 | 一种基于正样本平衡约束的深度行人再标识方法 |
CN107330798A (zh) * | 2017-06-05 | 2017-11-07 | 大连理工大学 | 一种基于种子节点传播的社交网络间用户身份识别方法 |
-
2018
- 2018-08-28 CN CN201810985465.5A patent/CN109117891B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103379158A (zh) * | 2012-04-24 | 2013-10-30 | 中国移动通信集团公司 | 一种社交网络中推荐好友信息的方法及系统 |
WO2014201840A1 (en) * | 2013-06-19 | 2014-12-24 | Tencent Technology (Shenzhen) Company Limited | Method, device and computer-readable storage medium for cross-platform synchronization of contacts in a multi-platform environment |
CN104765729A (zh) * | 2014-01-02 | 2015-07-08 | 中国人民大学 | 一种跨平台微博社区账户匹配方法 |
US20150332087A1 (en) * | 2014-05-15 | 2015-11-19 | Fuji Xerox Co., Ltd. | Systems and Methods for Identifying a User's Demographic Characteristics Based on the User's Social Media Photographs |
US20170235849A1 (en) * | 2016-01-15 | 2017-08-17 | Jacob Research Institute, LLC | Matching system and method psychometric instrument system and method and system and method using same |
CN105808696A (zh) * | 2016-03-03 | 2016-07-27 | 北京邮电大学 | 一种基于全局和局部特征的跨在线社交网络用户匹配方法 |
CN106202543A (zh) * | 2016-07-27 | 2016-12-07 | 苏州家佳宝妇幼医疗科技有限公司 | 基于机器学习的本体匹配方法和系统 |
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
CN107330355A (zh) * | 2017-05-11 | 2017-11-07 | 中山大学 | 一种基于正样本平衡约束的深度行人再标识方法 |
CN107330798A (zh) * | 2017-06-05 | 2017-11-07 | 大连理工大学 | 一种基于种子节点传播的社交网络间用户身份识别方法 |
Non-Patent Citations (4)
Title |
---|
XIAOPING ZHOU 等: "Cross-Platform Identification of Anonymous Identical Users in Multiple Social Media Networks", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
YING SHA 等: "Matching User Accounts across Social Networks based on Users Message", 《PROCEDIA COMPUTER SCIENCE》 * |
王帅 等: "基于两步聚类和随机森林的乳腺腺管自动识别方法", 《计算机科学》 * |
郑凤飞: "基于Spark的并行推荐算法的研究与实现", 《万方数据知识服务平台》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457404A (zh) * | 2019-08-19 | 2019-11-15 | 电子科技大学 | 基于复杂异质网络的社交媒体账户分类方法 |
CN110457404B (zh) * | 2019-08-19 | 2021-11-02 | 电子科技大学 | 基于复杂异质网络的社交媒体账户分类方法 |
CN111160130A (zh) * | 2019-12-12 | 2020-05-15 | 中国电子科技网络信息安全有限公司 | 一种多平台虚拟身份账号的多维碰撞识别方法 |
CN112084335A (zh) * | 2020-09-09 | 2020-12-15 | 电子科技大学 | 一种基于信息融合的社交媒体用户账号分类方法 |
CN113761386A (zh) * | 2021-04-30 | 2021-12-07 | 中科天玑数据科技股份有限公司 | 一种人物社交关系挖掘的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109117891B (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023065545A1 (zh) | 风险预测方法、装置、设备及存储介质 | |
CN112035669B (zh) | 基于传播异质图建模的社交媒体多模态谣言检测方法 | |
CN109117891A (zh) | 融合社交关系和命名特征的跨社交媒体账户匹配方法 | |
CN114064918B (zh) | 一种多模态事件知识图谱构建方法 | |
CN104318340B (zh) | 基于文本履历信息的信息可视化方法及智能可视分析系统 | |
CN110674840B (zh) | 一种多方证据关联模型构建方法和证据链提取方法及装置 | |
CN111625659B (zh) | 知识图谱处理方法、装置、服务器及存储介质 | |
CN110457404A (zh) | 基于复杂异质网络的社交媒体账户分类方法 | |
CN110598005A (zh) | 一种面向公共安全事件的多源异构数据知识图谱构建方法 | |
CN116795973B (zh) | 基于人工智能的文本处理方法及装置、电子设备、介质 | |
CN113051927B (zh) | 基于多模态图卷积神经网络的社交网络突发事件检测方法 | |
CN110472226A (zh) | 一种基于知识图谱的网络安全态势预测方法及装置 | |
Liu et al. | Social network rumor detection method combining dual-attention mechanism with graph convolutional network | |
Liu et al. | Behavior2vector: Embedding users’ personalized travel behavior to vector | |
CN115860152B (zh) | 一种面向人物军事知识发现的跨模态联合学习方法 | |
WO2024098956A1 (zh) | 一种社交媒体数据与移动轨迹数据的融合方法 | |
CN107577782A (zh) | 一种基于异质数据的人物相似度刻画方法 | |
CN109918648B (zh) | 一种基于动态滑动窗口特征评分的谣言深度检测方法 | |
CN109949174A (zh) | 一种异构社交网络用户实体锚链接识别方法 | |
CN114238524B (zh) | 基于增强样本模型的卫星频轨数据信息抽取方法 | |
Zhu et al. | Configurable graph reasoning for visual relationship detection | |
Lhasiw et al. | A bidirectional LSTM model for classifying Chatbot messages | |
CN110222737A (zh) | 一种基于长短时记忆网络的搜索引擎用户满意度评估方法 | |
CN114387005A (zh) | 一种基于图分类的套利团伙识别方法 | |
CN118035056A (zh) | 一种面向多模态数据查询的基准测试方法和测试框架 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |