CN110399564B - 帐号分类方法和装置、存储介质及电子装置 - Google Patents
帐号分类方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110399564B CN110399564B CN201910668348.0A CN201910668348A CN110399564B CN 110399564 B CN110399564 B CN 110399564B CN 201910668348 A CN201910668348 A CN 201910668348A CN 110399564 B CN110399564 B CN 110399564B
- Authority
- CN
- China
- Prior art keywords
- account
- account set
- node
- accounts
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 abstract description 6
- 241001122767 Theaceae Species 0.000 description 12
- 235000013616 tea Nutrition 0.000 description 12
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 235000013162 Cocos nucifera Nutrition 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 235000006468 Thea sinensis Nutrition 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000010380 label transfer Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000020333 oolong tea Nutrition 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种帐号分类方法和装置、存储介质及电子装置。其中,该方法包括:获取社交应用中的第一帐号集合和第二帐号集合;生成第一帐号集合和第二帐号集合中的帐号之间的连接图;根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。本发明解决了发布媒体资源的帐号分类困难的技术问题。本发明实施例的帐号分类方法中,通过机器学习的方法对标签进行传播学习,对节点的标签进行确定,从而确定出节点表示的帐号的类别。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种帐号分类方法和装置、存储介质及电子装置。
背景技术
在现有的社交应用中,一些特定的帐号可以发布媒体资源,用户账号可以对这些帐号发布的媒体资源进行浏览或转发。随着社交应用平台的发展,会出现越来越多发布媒体资源的帐号,例如数量庞大的微信公众号,这促使社交应用平台对这些帐号进行分类。传统的分类方法是通过人工对账号进行标注,但是对于越来越多发布媒体资源的帐号,仅仅要发现出现的新的帐号便需要投入巨大的人力,对其进行分类标注更是困难。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种帐号分类方法和装置、存储介质及电子装置,以至少解决发布媒体资源的帐号分类困难的技术问题。
根据本发明实施例的一个方面,提供了一种帐号分类方法,包括:获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
根据本发明实施例的另一方面,还提供了一种帐号分类装置,包括:第一获取模块,用于获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;生成模块,用于生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;第一确定模块,用于根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;第二确定模块,用于将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述帐号分类方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的帐号分类方法。
在本发明实施例中,采用获取第一帐号集合和第二帐号集合,第一帐号集合中的帐号的分类已知,第二帐号集合中的帐号的分类未知,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,根据连接图中第一帐号集合中的帐号对应的节点的分类以及节点之间的连接关系,确定第二帐号集合中的帐号对应的节点的标签,从而根据第二帐号集合中的帐号对应的节点的标签确定类别,从而实现了对未知帐号类别的第二帐号集合中的帐号进行分类的技术效果,进而解决了发布媒体资源的帐号分类困难的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的帐号分类方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的帐号分类方法的流程示意图;
图3是根据本发明实施例的邻接图的结构示意图;
图4是根据本发明实施例的连接图的结构示意图;
图5是根据本发明实施例的另一种可选的帐号分类方法的流程示意图;
图6是根据本发明实施例的一种可选的帐号分类装置的结构示意图;
图7是根据本发明实施例的另一种可选的帐号分类装置的结构示意图;
图8是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本发明实施例的帐号分类方法中,通过机器学习的方法对标签进行传播学习,对节点的标签进行确定,从而确定出节点表示的帐号的类别。
根据本发明实施例的一个方面,提供了一种帐号分类方法,可选地,作为一种可选的实施方式,上述帐号分类方法可以但不限于应用于如图1所示的环境中。
服务器102可以通过处理引擎106执行步骤S108,获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;S110,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;S112,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;S114,将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。服务器102可以将第二帐号集合中的帐号的类别存储在数据库104中。
可选地,在本实施例中,上述帐号分类方法可以但不限于应用于服务器102中,用于确定未知分类的帐号的类别。可以理解的是,服务器102在对第二帐号集合中的帐号确定每一个帐号的类别后,可以在接收用户设备发送的请求推送目标类别的帐号的请求时,向用户设备推送第一帐号集合和第二帐号集合中为目标类别的帐号。该用户设备可以但不限于为手机、平板电脑、笔记本电脑、PC机等支持运行应用客户端的终端设备。上述服务器102和用户设备可以但不限于通过网络实现数据交互,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,作为一种可选的实施方式,如图2所示,上述帐号分类方法包括:
S202,获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;
在本发明实施例中,第一帐号集合和第二帐号集合中的每一个帐号均是社交应用中发布媒体资源的帐号,例如可以是微信中的公众号,所发布的媒体资源可以被使用该社交应用的用户的帐号转发,例如使用微信的用户可以转发公众号所发布的文章、视频、图片等,可以将其转发至朋友圈、群组或者其他用户的帐号。可以理解的是,本发明并不对转发第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源的形式作出限定。
这里,在第一帐号集合中的帐号的类别是已经确定的,第二帐号集合中的帐号的类别尚未被确定。可以理解的是,对于第一帐号集合中的帐号的类别可以是通过人工打标的方式确定的,也可以是大于阈值的用户帐号对发布媒体资源的帐号所确定类别。可以理解的是,对于第一帐号集合中的帐号的类别确定的方式本发明并不作出限定。
需要注意的是,在本发明可选实施例中,也可以是获取帐号集合,该帐号集合中包括类别已被确定的第一帐号集合和类别未被确定的第二帐号集合。
S204,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;
S206,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;
S208,将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
在本发明实施例中,采用获取第一帐号集合和第二帐号集合,第一帐号集合中的帐号的分类已知,第二帐号集合中的帐号的分类未知,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,根据连接图中第一帐号集合中的帐号对应的节点的分类以及节点之间的连接关系,确定第二帐号集合中的帐号对应的节点的标签,从而根据第二帐号集合中的帐号对应的节点的标签确定类别,从而实现了对未知帐号类别的第二帐号集合中的帐号进行分类。
在本发明可选实施例中,可以通过标签传播算法LPA、基于标签传递的重叠设备发现算法COPRA或者社团发现算法SLPA根据连接图中的已知标签的节点和节点间的连接关系,确定第二帐号集合中的帐号对应的节点的标签。当然可以理解的是,对于确定第二帐号集合中的帐号对应的节点的标签并不仅限于上述算法,对此本发明并不作出限定。
在本发明可选实施例中,可以根据第三帐号集合,以及第一帐号集合和第二帐号集合,生成邻接图,其中,第三帐号集合中的帐号在社交应用中转发过第一帐号集合或第二帐号集合中的帐号所发布的媒体资源,从而根据邻接图生成第一帐号集合和第二帐号集合中的帐号之间的连接图。如图3所示的,第三帐号集合302中包括多个转发过第一帐号集合或第二帐号集合中的帐号所发布的媒体资源的帐号,例如帐号306,帐号集合304中包括第一帐号集合和第二帐号集合中的帐号,例如帐号308。可以理解的是,这里的帐号308可以是第一帐号集合中的帐号,也可以是第二帐号集合中的帐号。在邻接图中,第三帐号集合中的帐号与帐号集合304中的帐号连接,其中,第三帐号集合中的帐号与帐号集合304中的帐号连接表示第三帐号集合中的帐号转发过与其连接的帐号集合304中的帐号所发布的媒体资源。如图3所示的,在邻接图中,第一帐号集合302中的帐号a分别与帐号集合304中的帐号A和帐号B相连接,表示帐号a转发过帐号A和帐号B所发布的媒体资源。
可选的,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签包括:根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,通过标签传播算法确定与第二帐号集合中的帐号对应的节点的标签,其中,与第二帐号集合中的帐号对应的节点的标签是在满足标签传播算法的收敛条件下与节点具有连接关系的节点的标签。在本发明实施例中,可以通过标签传播算法LPA在连接图中将第一帐号集合中的帐号对应的节点的标签传递至第二帐号集合中的帐号对应的标签,从而在满足收敛条件的情况下,确定第二帐号集合中的帐号对应的节点的标签。这里的收敛条件可以是通过标签传播算法LPA对连接图中的第二帐号集合中的帐号对应的节点的标签进行更新,直至第二帐号集合中的帐号对应的节点的标签不再发生变化。可以理解的是,由于等待第二帐号集合中的帐号对应的节点的标签不再发生变化所需的更新迭代的次数较多,故而也可以设置更新迭代的次数的上限值,从而在更新迭代的次数到达该上限值的情况下,确定满足收敛条件。可以理解的是,对于收敛的条件可以根据实际情况进行适应的设置,对此,本发明并不作出限定。如图4所示的,通过标签传播算法LPA对第二帐号集合中的帐号对应的节点的标签进行传播更新的过程中,也可以实现对连接图中的节点进行聚类,例如图4所示的每个聚类集合中均包括多个节点,例如节点404,在满足收敛条件的情况下,每个聚类集合中的每一个节点的标签均相同。可以理解的是,在使用标签传播算法LPA确定第二帐号集合中的帐号所对应的节点的标签的情况下,上述连接图为完全图。
可选的,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,通过标签传播算法确定与第二帐号集合中的帐号对应的节点的标签包括:根据连接图的每一个节点,构建概率传递矩阵和标注矩阵,其中,概率传递矩阵用于指示连接图中的一个节点到另一个节点的概率,概率根据节点间的欧式距离确定,标注矩阵用于指示连接图中的一个节点被标注为多个标签中的每一个标签的概率;重复执行根据概率传递矩阵与标注矩阵的乘积,对连接图中的每一个节点的标签进行更新的步骤,直到连接图中的每一个节点的标签均不再发生变化。
下面通过举例对标签传播算法进行举例说明。这里,连接图相互连接的两个节点表示该两个节点所对应的帐号所发布的媒体资源被同一个帐号转发过,令(x1,y1)…(xt,yt)为已标注数据,其中,x1至xt表示第一帐号集合中的帐号,可以理解的是,可以根据不同的帐号的ID第一帐号集合中的帐号进行区别并标号,y1至yt表示转发过第一帐号集合中的帐号所发布的媒体资源的帐号,可以理解的是,为了避免用户信息的泄露,可以生成转发过第一帐号集合中的帐号所对应的虚拟ID,从而实现数据脱敏。这里的y1至yt也可认为是当前发布媒体资源的第一帐号集合中的帐号对应的类别ID。其中,(x1,y1)表示y1转发过x1所发布的媒体资源,相应的也可以表示帐号x1的类别为y1,YT={y1…yt}∈{1…C}是类别标签,类别数C已知,且均存在于标签数据中。令(xt+1,yt+1)…(xt+u,yt+u)为未标注数据,YU={yt+1…yt+u}不可观测,t<<u,令数据集X={x1…xt+u}∈R。则可以将问题转换为:从数据集X中,利用YT的学习,为未标注数据集YU的每个数据找到对应的标签。将所有数据作为节点,包括已标注和未标注数据),创建一个完全连接图,其边的权重计算式如下:
其中:dij表示两个节点i和j之间的欧氏距离,两个节点i和j之间的权重wij受控于参数σ,该参数σ可以根据实验进行设置。
为衡量一个节点的标注通过边传播到其他节点的概率,在此定义一个(t+u)×(t+u)概率传递矩阵T如下所示:
其中:Tij是节点j到i的传播概率;k指的是第i个节点,即P(j→i)中的游标;t指的是已标注节点的个数;n指的是t+u,即未标注节点的个数,t+n相当于所有节点的个数。
则,通过标签传播算法确定第二标签集合中帐号所对应的节点的标签,算法描述如下:S1,所有节点传播标签一步:Y←TY;S2,标注矩阵Y来维持类别的概率;S3,夹逼标注数据,重复S2直到Y收敛,也就是直到第二帐号集在的帐号所对应的节点的标签不再发生变化。
可选的,在根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签之后,方法还包括:对连接图中的节点进行聚类处理,获得多个聚类后的节点集合,其中,每一个节点集合中包括至少一个与第一帐号集合中的帐号对应的节点,分别与第二帐号集合中的每个帐号对应的节点位于一个节点集合中,每一个节点集合中的节点的标签均相同。在本发明实施例中,还可以对连接图中的节点进行聚类处理,从而将相同标签的节点聚类获得多个节点集合,以便于后续对相同标签的节点所对应的相同类别的帐号进行处理。如图4所示的,节点集合402中包括多个节点,在一个节点集合中每个节点的标签均相同。
可选的,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,包括:将第一帐号集合和第二帐号集合中的第一帐号删除,获得更新后的第一帐号集合和更新后的第二帐号集合,其中,第一帐号发布的媒体资源被转发的次数大于第一阈值,或者小于第二阈值;根据更新后的第一帐号集合和更新后的第二帐号集合,生成第一帐号集合和第二帐号集合中的帐号之间的连接图。在本发明实施例中,考虑到部分帐号所发布的内容可以是新闻或其他类型容易被不同的用户帐号转发,部分帐号所发布的内容较为生僻,转发的所发布的媒体资源的用户较少,不易被确定出分类。故而将第一帐号集合和第二帐号集合中的第一帐号删除,从而提高后续确定第二帐号集合中的帐号的类别的准确度。
如图5所示的,在本发明可选实施例中,上述步骤S202-S208之后,上述方法还可以包括:
S502,获取目标帐号发送的携带有搜索关键词的搜索请求,其中,搜索请求用于请求获取与搜索关键词相匹配的帐号;
S504,确定搜索关键词所属的目标类别;
S506,将第一帐号集合和第二帐号集合中的帐号的类别为目标类别的帐号推送至目标帐号。
在本发明实施例中,用户可能对某一类别发布媒体资源的帐号较为感兴趣,例如对茶叶的相关媒体资源感兴趣,为了获得更多发布该类别的媒体资源的帐号,可以发送搜索请求,从而在第一帐号集合和第二帐号集合中获取到搜索请求中携带的关键词所属的目标类别的帐号。
可以理解的是,在本发明可选实施例中,为了提高分类的准确度,可以将类别的分为多个大类,也就是分类的粒度大于设定值,例如将发布媒体资源的账号分为茶类、美食类、穿衣打扮类等。用户在获取相关类别的帐号时,均可以确定该搜索关键词所属的类别。例如搜索关键词为茶、茶叶或者乌龙茶时,均将其确定为茶类,从而将茶类的发布媒体资源的帐号推送至发送请求的帐号。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述帐号分类方法的帐号分类装置。如6所示,该装置包括:
第一获取模块602,用于获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;
生成模块604,用于生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;
第一确定模块606,用于根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;
第二确定模块608,用于将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
在本发明实施例中,第一帐号集合和第二帐号集合中的每一个帐号均是社交应用中发布媒体资源的帐号,例如可以是微信中的公众号,所发布的媒体资源可以被使用该社交应用的用户的帐号转发,例如使用微信的用户可以转发公众号所发布的文章、视频、图片等,可以将其转发至朋友圈、群组或者其他用户的帐号。可以理解的是,本发明并不对转发第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源的形式作出限定。
这里,在第一帐号集合中的帐号的类别是已经确定的,第二帐号集合中的帐号的类别尚未被确定。可以理解的是,对于第一帐号集合中的帐号的类别可以是通过人工打标的方式确定的,也可以是大于阈值的用户帐号对发布媒体资源的帐号所确定类别。可以理解的是,对于第一帐号集合中的帐号的类别确定的方式本发明并不作出限定。
需要注意的是,在本发明可选实施例中,也可以是获取帐号集合,该帐号集合中包括类别已被确定的第一帐号集合和类别未被确定的第二帐号集合。
在本发明实施例中,采用获取第一帐号集合和第二帐号集合,第一帐号集合中的帐号的分类已知,第二帐号集合中的帐号的分类未知,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,根据连接图中第一帐号集合中的帐号对应的节点的分类以及节点之间的连接关系,确定第二帐号集合中的帐号对应的节点的标签,从而根据第二帐号集合中的帐号对应的节点的标签确定类别,从而实现了对未知帐号类别的第二帐号集合中的帐号进行分类。
在本发明可选实施例中,可以通过标签传播算法LPA、基于标签传递的重叠设备发现算法COPRA或者社团发现算法SLPA根据连接图中的已知标签的节点和节点间的连接关系,确定第二帐号集合中的帐号对应的节点的标签。当然可以理解的是,对于确定第二帐号集合中的帐号对应的节点的标签并不仅限于上述算法,对此本发明并不作出限定。
在本发明可选实施例中,上述装置还可以用于执行以下步骤:根据第三帐号集合,以及第一帐号集合和第二帐号集合,生成邻接图,其中,第三帐号集合中的帐号在社交应用中转发过第一帐号集合或第二帐号集合中的帐号所发布的媒体资源,从而根据邻接图生成第一帐号集合和第二帐号集合中的帐号之间的连接图。
可选的,第一确定模块可以包括:确定单元,用于根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,通过标签传播算法确定与第二帐号集合中的帐号对应的节点的标签,其中,与第二帐号集合中的帐号对应的节点的标签是在满足标签传播算法的收敛条件下与节点具有连接关系的节点的标签。在本发明实施例中,可以通过标签传播算法LPA在连接图中将第一帐号集合中的帐号对应的节点的标签传递至第二帐号集合中的帐号对应的标签,从而在满足收敛条件的情况下,确定第二帐号集合中的帐号对应的节点的标签。这里的收敛条件可以是通过标签传播算法LPA对连接图中的第二帐号集合中的帐号对应的节点的标签进行更新,直至第二帐号集合中的帐号对应的节点的标签不再发生变化。可以理解的是,由于等待第二帐号集合中的帐号对应的节点的标签不再发生变化所需的更新迭代的次数较多,故而也可以设置更新迭代的次数的上限值,从而在更新迭代的次数到达该上限值的情况下,确定满足收敛条件。可以理解的是,对于收敛的条件可以根据实际情况进行适应的设置,对此,本发明并不作出限定。
可选的,确定单元可以具体用于:根据连接图的每一个节点,构建概率传递矩阵和标注矩阵,其中,概率传递矩阵用于指示连接图中的一个节点到另一个节点的概率,概率根据节点间的欧式距离确定,标注矩阵用于指示连接图中的一个节点被标注为多个标签中的每一个标签的概率;重复执行根据概率传递矩阵与标注矩阵的乘积,对连接图中的每一个节点的标签进行更新的步骤,直到连接图中的每一个节点的标签均不再发生变化。
下面通过举例对标签传播算法进行举例说明。这里,连接图相互连接的两个节点表示该两个节点所对应的帐号所发布的媒体资源被同一个帐号转发过,令(x1,y1)…(xt,yt)为已标注数据,其中,x1至xt表示第一帐号集合中的帐号,可以理解的是,可以根据不同的帐号的ID第一帐号集合中的帐号进行区别并标号,y1至yt表示转发过第一帐号集合中的帐号所发布的媒体资源的帐号,可以理解的是,为了避免用户信息的泄露,可以生成转发过第一帐号集合中的帐号所对应的虚拟ID,从而实现数据脱敏。这里的y1至yt也可认为是当前发布媒体资源的第一帐号集合中的帐号对应的类别ID。其中,(x1,y1)表示y1转发过x1所发布的媒体资源,相应的也可以表示帐号x1的类别为y1,YT={y1…yt}∈{1…C}是类别标签,类别数C已知,且均存在于标签数据中。令(xt+1,yt+1)…(xt+u,yt+u)为未标注数据,YU={yt+1…yt+u}不可观测,t<<u,令数据集X={x1…xt+u}∈R。则可以将问题转换为:从数据集X中,利用YT的学习,为未标注数据集YU的每个数据找到对应的标签。将所有数据作为节点,包括已标注和未标注数据),创建一个完全连接图,其边的权重计算式如下:
其中:dij表示两个节点i和j之间的欧氏距离,两个节点i和j之间的权重wij受控于参数σ,该参数σ可以根据实验进行设置。
为衡量一个节点的标注通过边传播到其他节点的概率,在此定义一个(t+u)×(t+u)概率传递矩阵T如下所示:
其中:Tij是节点j到i的传播概率;k指的是第i个节点,即P(j→i)中的游标;t指的是已标注节点的个数;n指的是t+u,即未标注节点的个数,t+n相当于所有节点的个数。
则,通过标签传播算法确定第二标签集合中帐号所对应的节点的标签,算法描述如下:S1,所有节点传播标签一步:Y←TY;S2,标注矩阵Y来维持类别的概率;S3,夹逼标注数据,重复S2直到Y收敛,也就是直到第二帐号集在的帐号所对应的节点的标签不再发生变化。
可选的,上述装置还可以包括:聚类模块702,用于对连接图中的节点进行聚类处理,获得多个聚类后的节点集合,其中,每一个节点集合中包括至少一个与第一帐号集合中的帐号对应的节点,分别与第二帐号集合中的每个帐号对应的节点位于一个节点集合中,每一个节点集合中的节点的标签均相同。在本发明实施例中,还可以对连接图中的节点进行聚类处理,从而将相同标签的节点聚类获得多个节点集合。
可选的,上述生成模块可以包括:获取单元,用于将第一帐号集合和第二帐号集合中的第一帐号删除,获得更新后的第一帐号集合和更新后的第二帐号集合,其中,第一帐号发布的媒体资源被转发的次数大于第一阈值,或者小于第二阈值;生成单元,用于根据更新后的第一帐号集合和更新后的第二帐号集合,生成第一帐号集合和第二帐号集合中的帐号之间的连接图。在本发明实施例中,考虑到部分帐号所发布的内容可以是新闻或其他类型容易被不同的用户帐号转发,部分帐号所发布的内容较为生僻,转发的所发布的媒体资源的用户较少,不易被确定出分类。故而将第一帐号集合和第二帐号集合中的第一帐号删除,从而提高后续确定第二帐号集合中的帐号的类别的准确度。
如图7所示的,在本发明可选实施例中,上述装置还可以包括:第二获取模块704,用于获取目标帐号发送的携带有搜索关键词的搜索请求,其中,搜索请求用于请求获取与搜索关键词相匹配的帐号;第三确定模块706,用于确定搜索关键词所属的目标类别;推送模块708,用于将第一帐号集合和第二帐号集合中的帐号的类别为目标类别的帐号推送至目标帐号。在本发明实施例中,用户可能对某一类别发布媒体资源的帐号较为感兴趣,例如对茶叶的相关媒体资源感兴趣,为了获得更多发布该类别的媒体资源的帐号,可以发送搜索请求,从而在第一帐号集合和第二帐号集合中获取到搜索请求中携带的关键词所属的目标类别的帐号。
可以理解的是,在本发明可选实施例中,为了提高分类的准确度,可以将类别的分为多个大类,也就是分类的粒度大于设定值,例如将发布媒体资源的账号分为茶类、美食类、穿衣打扮类等。用户在获取相关类别的帐号时,均可以确定该搜索关键词所属的类别。例如搜索关键词为茶、茶叶或者乌龙茶时,均将其确定为茶类,从而将茶类的发布媒体资源的帐号推送至发送请求的帐号。
根据本发明实施例的又一个方面,还提供了一种用于实施上述帐号分类方法的电子装置,如图8所示,该电子装置包括存储器802和处理器804,该存储器802中存储有计算机程序,该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;
S2,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;
S3,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;
S4,将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图8中所示更多或者更少的组件(如网络接口等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本发明实施例中的帐号分类方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的帐号分类方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器802具体可以但不限于用于存储第一帐号集合和第二帐号集合等信息。作为一种示例,如图8所示,上述存储器802中可以但不限于包括上述帐号分类装置中的第一获取模块602、生成模块604、第一确定模块606及第二确定模块608。此外,还可以包括但不限于上述帐号分类装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置806用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置806包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置806为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器808,用于显示上述第二帐号集合中的帐号的类别;和连接总线810,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取社交应用中的第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类别已被确定,第二帐号集合中的帐号的类别未被确定,第一帐号集合和第二帐号集合中的帐号在社交应用中发布的媒体资源被转发过;
S2,生成第一帐号集合和第二帐号集合中的帐号之间的连接图,其中,第一帐号集合和第二帐号集合中的每个帐号对应于连接图中的一个节点,连接图中相互连接的两个节点表示两个节点对应的帐号所发布的媒体资源被社交应用中的同一个帐号转发过,连接图中与第一帐号集合中的帐号对应的节点的标签用于表示第一帐号集合中对应的帐号的类别;
S3,根据连接图中与第一帐号集合中的帐号对应的节点的标签以及连接图中节点之间的连接关系,确定与第二帐号集合中的帐号对应的节点的标签;
S4,将第二帐号集合中的帐号的类别确定为与第二帐号集合中的帐号对应的节点的标签所表示的类别。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (14)
1.一种帐号分类方法,其特征在于,包括:
获取社交应用中的第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类别已被确定,所述第二帐号集合中的帐号的类别未被确定,所述第一帐号集合和所述第二帐号集合中的帐号在所述社交应用中发布的媒体资源被转发过;
生成所述第一帐号集合和所述第二帐号集合中的帐号之间的连接图,其中,所述第一帐号集合和所述第二帐号集合中的每个帐号对应于所述连接图中的一个节点,所述连接图中相互连接的两个节点表示所述两个节点对应的帐号所发布的媒体资源被所述社交应用中的同一个帐号转发过,所述连接图中与所述第一帐号集合中的帐号对应的节点的标签用于表示所述第一帐号集合中对应的帐号的类别;
根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,确定与所述第二帐号集合中的帐号对应的节点的标签;
将所述第二帐号集合中的帐号的类别确定为与所述第二帐号集合中的所述帐号对应的节点的标签所表示的类别。
2.根据权利要求1所述的方法,其特征在于,根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,确定与所述第二帐号集合中的帐号对应的节点的标签包括:
根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,通过标签传播算法确定与所述第二帐号集合中的帐号对应的节点的标签,其中,与所述第二帐号集合中的帐号对应的节点的标签是在满足所述标签传播算法的收敛条件下与所述节点具有连接关系的节点的标签。
3.根据权利要求2所述的方法,其特征在于,根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,通过标签传播算法确定与所述第二帐号集合中的帐号对应的节点的标签包括:
根据所述连接图的每一个节点,构建概率传递矩阵和标注矩阵,其中,所述概率传递矩阵用于指示所述连接图中的一个节点到另一个节点的概率,所述概率根据节点间的欧式距离确定,所述节点间的欧式距离根据所述节点之间的连接关系确定,所述标注矩阵用于指示所述连接图中的一个节点被标注为多个所述标签中的每一个标签的概率;
重复执行根据所述概率传递矩阵与所述标注矩阵的乘积,对所述连接图中的每一个节点的标签进行更新的步骤,直到所述连接图中的每一个节点的标签均不再发生变化。
4.根据权利要求1所述的方法,其特征在于,在根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,确定与所述第二帐号集合中的帐号对应的节点的标签之后,所述方法还包括:
对所述连接图中的节点进行聚类处理,获得多个聚类后的节点集合,其中,每一个所述节点集合中包括至少一个与所述第一帐号集合中的帐号对应的节点,分别与所述第二帐号集合中的每个帐号对应的节点位于一个所述节点集合中,每一个所述节点集合中的节点的标签均相同。
5.根据权利要求1所述的方法,其特征在于,所述生成所述第一帐号集合和所述第二帐号集合中的帐号之间的连接图,包括:
将所述第一帐号集合和所述第二帐号集合中的第一帐号删除,获得更新后的第一帐号集合和更新后的第二帐号集合,其中,所述第一帐号发布的媒体资源被转发的次数大于第一阈值,或者小于第二阈值;
根据更新后的所述第一帐号集合和更新后的所述第二帐号集合,生成所述第一帐号集合和所述第二帐号集合中的帐号之间的连接图。
6.根据权利要求1所述的方法,其特征在于,在将所述第二帐号集合中的帐号的类别确定为与所述第二帐号集合中的所述帐号对应的节点的标签所表示的类别之后,还包括:
获取目标帐号发送的携带有搜索关键词的搜索请求,其中,所述搜索请求用于请求获取与所述搜索关键词相匹配的帐号;
确定所述搜索关键词所属的目标类别;
将所述第一帐号集合和所述第二帐号集合中的帐号的类别为所述目标类别的帐号推送至所述目标帐号。
7.一种帐号分类装置,其特征在于,包括:
第一获取模块,用于获取社交应用中的第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类别已被确定,所述第二帐号集合中的帐号的类别未被确定,所述第一帐号集合和所述第二帐号集合中的帐号在所述社交应用中发布的媒体资源被转发过;
生成模块,用于生成所述第一帐号集合和所述第二帐号集合中的帐号之间的连接图,其中,所述第一帐号集合和所述第二帐号集合中的每个帐号对应于所述连接图中的一个节点,所述连接图中相互连接的两个节点表示所述两个节点对应的帐号所发布的媒体资源被所述社交应用中的同一个帐号转发过,所述连接图中与所述第一帐号集合中的帐号对应的节点的标签用于表示所述第一帐号集合中对应的帐号的类别;
第一确定模块,用于根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,确定与所述第二帐号集合中的帐号对应的节点的标签;
第二确定模块,用于将所述第二帐号集合中的帐号的类别确定为与所述第二帐号集合中的所述帐号对应的节点的标签所表示的类别。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
确定单元,用于根据所述连接图中与所述第一帐号集合中的帐号对应的节点的标签以及所述连接图中节点之间的连接关系,通过标签传播算法确定与所述第二帐号集合中的帐号对应的节点的标签,其中,与所述第二帐号集合中的帐号对应的节点的标签是在满足所述标签传播算法的收敛条件下与所述节点具有连接关系的节点的标签。
9.根据权利要求8所述的装置,其特征在于,所述确定单元具体用于:根据所述连接图的每一个节点,构建概率传递矩阵和标注矩阵,其中,所述概率传递矩阵用于指示所述连接图中的一个节点到另一个节点的概率,所述概率根据节点间的欧式距离确定,所述节点间的欧式距离根据所述节点之间的连接关系确定,所述标注矩阵用于指示所述连接图中的一个节点被标注为多个所述标签中的每一个标签的概率;重复执行根据所述概率传递矩阵与所述标注矩阵的乘积,对所述连接图中的每一个节点的标签进行更新的步骤,直到所述连接图中的每一个节点的标签均不再发生变化。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
聚类模块,用于对所述连接图中的节点进行聚类处理,获得多个聚类后的节点集合,其中,每一个所述节点集合中包括至少一个与所述第一帐号集合中的帐号对应的节点,分别与所述第二帐号集合中的每个帐号对应的节点位于一个所述节点集合中,每一个所述节点集合中的节点的标签均相同。
11.根据权利要求7所述的装置,其特征在于,所述生成模块包括:
获取单元,用于将所述第一帐号集合和所述第二帐号集合中的第一帐号删除,获得更新后的第一帐号集合和更新后的第二帐号集合,其中,所述第一帐号发布的媒体资源被转发的次数大于第一阈值,或者小于第二阈值;
生成单元,用于根据更新后的所述第一帐号集合和更新后的所述第二帐号集合,生成所述第一帐号集合和所述第二帐号集合中的帐号之间的连接图。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取目标帐号发送的携带有搜索关键词的搜索请求,其中,所述搜索请求用于请求获取与所述搜索关键词相匹配的帐号;
第三确定模块,用于确定所述搜索关键词所属的目标类别;
推送模块,用于将所述第一帐号集合和所述第二帐号集合中的帐号的类别为所述目标类别的帐号推送至所述目标帐号。
13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
14.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910668348.0A CN110399564B (zh) | 2019-07-23 | 2019-07-23 | 帐号分类方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910668348.0A CN110399564B (zh) | 2019-07-23 | 2019-07-23 | 帐号分类方法和装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110399564A CN110399564A (zh) | 2019-11-01 |
CN110399564B true CN110399564B (zh) | 2022-03-25 |
Family
ID=68324920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910668348.0A Active CN110399564B (zh) | 2019-07-23 | 2019-07-23 | 帐号分类方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399564B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382283B (zh) * | 2020-03-12 | 2023-01-03 | 腾讯科技(深圳)有限公司 | 资源类别标签标注方法、装置、计算机设备和存储介质 |
CN112001748A (zh) * | 2020-08-14 | 2020-11-27 | 广州掌淘网络科技有限公司 | 一种基于标签传播的数据扩展方法与设备 |
CN112329838B (zh) * | 2020-11-02 | 2024-02-02 | 上海明略人工智能(集团)有限公司 | 一种目标集合类别标签的确定方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294524A (zh) * | 2015-06-25 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种关系数据的处理方法和装置 |
CN106407212A (zh) * | 2015-07-31 | 2017-02-15 | 阿里巴巴集团控股有限公司 | 一种网络账户的类别确定方法、对象聚类方法及装置 |
CN108280755A (zh) * | 2018-02-28 | 2018-07-13 | 阿里巴巴集团控股有限公司 | 可疑洗钱团伙的识别方法和识别装置 |
CN108764667A (zh) * | 2018-05-15 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 风险数据确定方法及装置 |
CN109102418A (zh) * | 2018-08-08 | 2018-12-28 | 电子科技大学 | 基于用户关系的社交网络垃圾账号识别方法 |
CN110020858A (zh) * | 2019-03-13 | 2019-07-16 | 北京三快在线科技有限公司 | 支付异常检测方法、装置、存储介质及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11481454B2 (en) * | 2017-06-02 | 2022-10-25 | Microsoft Technology Licensing, Llc | Search engine results for low-frequency queries |
-
2019
- 2019-07-23 CN CN201910668348.0A patent/CN110399564B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294524A (zh) * | 2015-06-25 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种关系数据的处理方法和装置 |
CN106407212A (zh) * | 2015-07-31 | 2017-02-15 | 阿里巴巴集团控股有限公司 | 一种网络账户的类别确定方法、对象聚类方法及装置 |
CN108280755A (zh) * | 2018-02-28 | 2018-07-13 | 阿里巴巴集团控股有限公司 | 可疑洗钱团伙的识别方法和识别装置 |
CN108764667A (zh) * | 2018-05-15 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 风险数据确定方法及装置 |
CN109102418A (zh) * | 2018-08-08 | 2018-12-28 | 电子科技大学 | 基于用户关系的社交网络垃圾账号识别方法 |
CN110020858A (zh) * | 2019-03-13 | 2019-07-16 | 北京三快在线科技有限公司 | 支付异常检测方法、装置、存储介质及电子设备 |
Non-Patent Citations (1)
Title |
---|
社交媒体中协作用户检测;章群燕;《中国优秀硕士学位论文全文数据库信息科技辑》;20151015;第2-35页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110399564A (zh) | 2019-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109872242B (zh) | 信息推送方法和装置 | |
CN110399564B (zh) | 帐号分类方法和装置、存储介质及电子装置 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
CN111310074B (zh) | 兴趣点的标签优化方法、装置、电子设备和计算机可读介质 | |
CN107193932B (zh) | 信息推送方法和装置 | |
CN111339406B (zh) | 个性化推荐方法、装置、设备及存储介质 | |
CN112307352B (zh) | 内容推荐方法、系统、装置和存储介质 | |
CN112989169A (zh) | 目标对象识别方法、信息推荐方法、装置、设备及介质 | |
CN110191183A (zh) | 精准智能推送方法、系统、装置及计算机可读存储介质 | |
CN112256880A (zh) | 文本识别方法和装置、存储介质及电子设备 | |
CN111538859B (zh) | 一种动态更新视频标签的方法、装置及电子设备 | |
CN109819002B (zh) | 数据推送方法和装置、存储介质及电子装置 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN111652451B (zh) | 社交关系的获取方法和装置及存储介质 | |
CN111667018B (zh) | 一种对象聚类的方法、装置、计算机可读介质及电子设备 | |
CN112818213A (zh) | 多媒体业务数据推送方法、装置、设备及存储介质 | |
CN113744002A (zh) | 推送信息的方法、装置、设备和计算机可读介质 | |
CN116823410A (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN111935259B (zh) | 目标帐号集合的确定方法和装置、存储介质及电子设备 | |
CN115114519A (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
CN117009631A (zh) | 投放对象筛选方法、装置、设备和存储介质 | |
CN113627454B (zh) | 物品信息聚类方法、推送方法和装置 | |
CN114691880A (zh) | 知识图谱构建方法、装置及电子设备 | |
CN113191840A (zh) | 物品信息显示方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |