CN114547430A - 信息对象的标签标注方法、装置、设备及存储介质 - Google Patents

信息对象的标签标注方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114547430A
CN114547430A CN202011332338.9A CN202011332338A CN114547430A CN 114547430 A CN114547430 A CN 114547430A CN 202011332338 A CN202011332338 A CN 202011332338A CN 114547430 A CN114547430 A CN 114547430A
Authority
CN
China
Prior art keywords
information object
node
information
community
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011332338.9A
Other languages
English (en)
Inventor
林岳
马浩峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011332338.9A priority Critical patent/CN114547430A/zh
Publication of CN114547430A publication Critical patent/CN114547430A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请公开了一种信息对象的标签标注方法、装置、设备及存储介质,涉及用户兴趣推荐领域。该方法包括:从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系;响应于n个用户帐号中存在至少两个用户帐号具有关联关系,根据信息对象集和关联关系生成信息对象网络;读取信息对象网络中的连接关系,调用社团发现算法对信息对象网络中的信息对象进行社团划分得到至少一个社团;获取社团的标签,在存储器中将标签写入属于社团中的信息对象的信息对象数据中。该方法能提高信息对象的标签标注效率,便于根据信息对象的标签向用户精准推荐信息对象。

Description

信息对象的标签标注方法、装置、设备及存储介质
技术领域
本申请涉及用户兴趣推荐领域,特别涉及一种信息对象的标签标注方法、装置、设备及存储介质。
背景技术
推荐系统是基于用户帐号的历史行为、社交关系、兴趣点、所处上下文环境等信息,去判断用户帐号当前需要或感兴趣的物品/服务,或帮助用户帐号进行决策的一类应用,推荐系统的任务和作用在于连接,缩短用户帐号与有价值信息之间的路径,让用户帐号离偏好的东西更近一步,提升产品体验与转化效率。
相关技术中,推荐系统基于用户帐号的历史行为以及产品的标签,向用户帐号推荐可能感兴趣的产品。例如,当用户帐号的历史行为中包括美食类产品时,推荐系统会向用户帐号推荐同属于美食类的其他产品。而产品的标签通常是由人工为产品进行一一标注的。
相关技术中的方法,通过人工来标注产品标签的标注效率过低,且浪费人力资源。
发明内容
本申请实施例提供了一种信息对象的标签标注方法、装置、设备及存储介质,可以提高信息对象的标签标注效率。所述技术方案如下。
根据本申请的一方面,提供了一种信息对象的标签标注方法,应用于计算机设备中,所述方法包括:
从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系,所述信息对象集中包括至少一个信息对象,n为大于1的整数;
响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集和所述关联关系生成信息对象网络,所述信息对象网络包括所述信息对象对应的节点和用于连接两个关联节点的连接线,所述两个关联节点的信息对象分别属于存在所述关联关系的两个用户帐号对应的信息对象集;
读取所述信息对象网络中的连接关系,调用社团发现算法对所述信息对象网络中的所述信息对象进行社团划分得到至少一个社团,所述社团中包括至少一个信息对象;
获取所述社团的标签,在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中。
根据本申请的另一方面,提供了一种信息对象的标签标注装置,所述装置包括:
读取模块,用于从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系,所述信息对象集中包括至少一个信息对象,n为大于1的整数;
生成模块,用于响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集和所述关联关系生成信息对象网络,所述信息对象网络包括所述信息对象对应的节点和用于连接两个关联节点的连接线,所述两个关联节点的信息对象分别属于存在所述关联关系的两个用户帐号对应的信息对象集;
所述读取模块,用于读取所述信息对象网络中的连接关系;
社团模块,用于调用社团发现算法对所述信息对象网络中的所述信息对象进行社团划分得到至少一个社团,所述社团中包括至少一个信息对象;
获取模块,用于获取所述社团的标签;
写入模块,用于在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中。
在一个可选的实施例中,所述生成模块,用于响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集中的所述信息对象构建所述节点,所述信息对象与所述节点一一对应;
所述生成模块,用于根据所述关联关系生成集间连接线,所述集间连接线用于连接第i个信息对象集中一个信息对象对应的节点和第j个信息对象集中一个信息对象对应的节点,所述第i个信息对象集对应的第i个用户帐号和所述第j个信息对象集对应的第j个用户帐号具有所述关联关系,i、j为不大于n的正整数,n为大于1的整数;
所述生成模块,用于根据所述节点和所述集间连接线生成所述信息对象网络。
在一个可选的实施例中,所述生成模块,用于响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,生成连接所述第i个信息对象集中第x个信息对象的节点,与所述第j个信息对象集中第y个信息对象的节点连接的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
在一个可选的实施例中,所述信息对象集中的所述信息对象对应有用户行为;
所述生成模块,用于响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,且所述第i个信息对象集中的第x个信息对象与所述第j个信息对象集中的第y个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第y个信息对象的节点的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
在一个可选的实施例中,所述生成模块,用于根据所述信息对象集生成集内连接线,所述集内连接线用于连接所述第i个信息对象集中两个信息对象对应的两个节点;
所述生成模块,用于根据所述节点、所述集间连接线和所述集内连接线生成所述信息对象网络。
在一个可选的实施例中,所述生成模块,用于将所述第i个信息对象集中全部信息对象对应的节点,以全连接的方式生成连接任意两个节点的所述集内连接线,i为不大于n的正整数,n为正整数。
在一个可选的实施例中,所述信息对象集中的所述信息对象对应有用户行为;所述生成模块,用于响应于所述第i个信息对象集中第x个信息对象与第z个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第z个信息对象的节点的所述集内连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第z个信息对象包括所述第i个信息对象集中的任意一个不同于所述第x个信息对象的信息对象,i为不大于n的正整数,x、z为正整数,n为大于1的整数。
在一个可选的实施例中,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点;
所述生成模块,用于响应于第a个节点和第b个节点间存在多个所述集间连接线,将连接所述第a个节点和所述第b个节点的多个所述集间连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
所述生成模块,用于响应于第a个节点和第b个节点间存在一个所述集间连接线,将连接所述第a个节点和所述第b个节点的所述集间连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
所述生成模块,用于根据连接所述第a个节点和所述第b个节点的所述集间连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
所述生成模块,用于根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
在一个可选的实施例中,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点;
所述生成模块,用于响应于第a个节点和第b个节点间存在多个所述连接线,将连接所述第a个节点和所述第b个节点的多个所述连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述连接线包括集内连接线和所述集间连接线中的至少一种,所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
所述生成模块,用于响应于第a个节点和第b个节点间存在一个所述连接线,将连接所述第a个节点和所述第b个节点的所述连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
所述生成模块,用于根据连接所述第a个节点和所述第b个节点的所述连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
所述生成模块,用于根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
在一个可选的实施例中,所述读取模块,用于读取所述信息对象网络中的连接关系;
所述社团模块,用于根据所述信息对象网络中所述节点的所述连接关系将所述信息对象网络中的相邻节点划分至同一社团,计算所述信息对象网络的模块度,重复本步骤得到所述信息对象网络的多个所述模块度;所述相邻节点包括具有所述连接关系的两个节点,所述模块度用于描述所述信息对象网络中社区划分的优劣程度;
所述社团模块,用于响应于所述信息对象网络的所述模块度取最大值,得到社团划分结果,所述社团划分结果包括至少一个社团;
所述社团模块,用于将属于同一个所述社团的节点作为一个节点,更新所述信息对象网络,重复上述步骤,直至所述信息对象网络的网络结构不变。
在一个可选的实施例中,所述获取模块,用于获取采用人工标注方式对所述社团标注的所述标签;
所述写入模块,用于在所述存储器中将所述标签写入属于所社团中的所述信息对象的信息对象数据中。
在一个可选的实施例中,所述n个信息对象集中的所述信息对象包括有标签对象和无标签对象;
所述获取模块,用于根据属于所述社团的所述有标签对象确定所述社团的标签;
所述写入模块,用于在所述存储器中将所述标签写入属于所述社团中的所述无标签对象的信息对象数据中。
在一个可选的实施例中,所述读取模块,用于从存储器中读取待推荐用户帐号的用户历史行为;
推荐模块,用于根据所述用户历史行为对应的所述信息对象确定所述推荐用户帐号的推荐标签,所述推荐标签包括所述用户历史行为对应的所述信息对象的标签;
所述推荐模块,用于根据所述推荐标签确定所述待推荐用户帐号的推荐对象,所述推荐对象的标签与所述推荐标签相同;
发送模块,用于向所述待推荐用户帐号的客户端发送所述推荐对象。
根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的信息对象的标签标注方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的信息对象的标签标注方法。
根据本公开实施例的另一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述可选实现方式中提供的信息对象的标签标注方法。
本申请实施例提供的技术方案带来的有益效果至少包括如下的有益效果。
通过根据用户帐号间的关联关系,将不同用户帐号对应的信息对象集中的信息对象构建成信息对象网络,形成信息对象的拓扑结构,进而根据信息对象网络上的拓扑结构调用社团发现算法来将信息对象划分至不同的社团中,完成对信息对象的分类,进而实现对一个社团中的信息对象批量标注标签,提高信息对象的标签标注效率,节省人力资源。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的计算机系统的框图;
图2是本申请另一个示例性实施例提供的信息对象的标签标注方法的方法流程图;
图3是本申请另一个示例性实施例提供的信息对象的标签标注方法的方法流程图;
图4是本申请另一个示例性实施例提供的信息对象的标签标注方法的方法流程图;
图5是本申请另一个示例性实施例提供的信息对象的标签标注方法的集间连接线示意图;
图6是本申请另一个示例性实施例提供的信息对象的标签标注方法的集间连接线示意图;
图7是本申请另一个示例性实施例提供的信息对象的标签标注方法的集间连接线示意图;
图8是本申请另一个示例性实施例提供的信息对象的标签标注方法的集内连接线示意图;
图9是本申请另一个示例性实施例提供的信息对象的标签标注方法的集内连接线示意图;
图10是本申请另一个示例性实施例提供的信息对象的标签标注方法的集内连接线示意图;
图11是本申请另一个示例性实施例提供的信息对象的标签标注方法的无向连接线示意图;
图12是本申请另一个示例性实施例提供的信息对象的标签标注方法的有向连接线示意图;
图13是本申请另一个示例性实施例提供的信息对象的标签标注方法的信息对象网络的示意图;
图14是本申请另一个示例性实施例提供的信息对象的标签标注方法的社团发现算法的示意图;
图15是本申请另一个示例性实施例提供的信息对象的标签标注方法的信息对象网络的示意图;
图16是本申请另一个示例性实施例提供的信息对象的标签标注方法的标签标注结果的示意图;
图17是本申请另一个示例性实施例提供的信息对象的标签标注装置的框图;
图18是本申请另一个示例性实施例提供的服务器的结构示意图;
图19是本申请另一个示例性实施例提供的终端的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术(Cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
云社交(Cloud Social)是一种物联网、云计算和移动互联网交互应用的虚拟社交应用模式,以建立著名的“资源分享关系图谱”为目的,进而开展网络社交,云社交的主要特征,就是把大量的社会资源统一整合和评测,构成一个资源有效池向用户按需提供服务。参与分享的用户越多,能够创造的利用价值就越大。
图1示出了本申请一个示例性实施例提供的计算机系统的结构示意图,该计算机系统包括终端120和服务器140。
终端120与服务器140之间通过有线或者无线网络相互连接。
终端120可以包括智能手机、笔记本电脑、台式电脑、平板电脑、智能音箱、智能机器人中的至少一种。在一种可选的实现方式中,终端120上安装有支持信息对象推荐功能的客户端,信息对象包括:商品、图片、表情、酒店、商户、电影、书籍、视频、资讯、网页、品牌、应用程序中的至少一种。在一种可选的实现方式中,终端120上安装有支持对信息对象进行分类或标注标签功能的客户端,信息对象的类型同上。在一种可选的实现方式中,终端120上安装有支持信息对象推荐功能的客户端,信息对象的类型同上。例如,客户端可以是生活服务类应用程序的客户端,在应用程序中提供有多种商户的商户信息,用户可以通过浏览商户信息选择感兴趣的商户进行消费,为了便于用户快速找到感兴趣的商户,客户端会对商户标注标签,使用户可以通过标签来快速找到商户,示例性的,客户端还可以根据用户的兴趣和各个商户的标签向用户推荐可能感兴趣的商户。
示例性的,本申请提供的方法可以由终端上的客户端来执行,也可以由服务器来执行。示例性的,本申请提供的方法由服务器来执行,客户端可以显示服务器对信息对象的标注结果。
示例性的,客户端会向服务器发送用户的用户数据,以便服务器根据用户数据来对信息对象标注标签。例如,第一用户帐号122使用第一终端上的客户端与第一信息对象121之间产生用户行为,例如,第一用户帐号122购买第一信息对象121,客户端会将第一用户帐号122与第一信息对象121间产生用户行为的用户数据上传至服务器。第二用户帐号123使用第二终端上的客户端与第二信息对象124之间产生用户行为,例如,第二用户帐号123浏览第二信息对象124,客户端会将第二用户帐号123与第二信息对象124间产生用户行为的用户数据上传至服务器。
终端120包括第一存储器和第一处理器。第一存储器中存储有第一程序;上述第一程序被第一处理器调用执行以实现本申请提供的信息对象的标签标注方法。第一存储器可以包括但不限于以下几种:随机存取存储器(Random Access Memory,RAM)、只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM)、以及电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)。
第一处理器可以是一个或者多个集成电路芯片组成。可选地,第一处理器可以是通用处理器,比如,中央处理器(Central Processing Unit,CPU)或者网络处理器(NetworkProcessor,NP)。可选地,第一处理器可以通过运行程序或代码来实现本申请提供的信息对象的标签标注方法。
服务器140包括第二存储器和第二处理器。第二存储器中存储有第二程序,上述第二程序被第二处理器调用来实现本申请提供的信息对象的标签标注方法。示例性的,第二存储器中存储有第二程序。示例性的,服务器接收并存储终端发送的用户数据,基于用户数据来对信息对象进行标注。可选地,第二存储器可以包括但不限于以下几种:RAM、ROM、PROM、EPROM、EEPROM。可选地,第二处理器可以是通用处理器,比如,CPU或者NP。
示例性的,服务器140中包括数据库141、网络构建单元142、社团发现单元143和标签标注单元144。
其中,数据库141用户存储用户帐号的用户数据和信息对象的数据,用户数据包括:用户帐号、用户帐号间的关联关系、用户帐号对应的信息对象集等,信息对象的数据包括信息对象的名称、信息对象与用户帐号间的用户行为等。
网络构建单元142用于根据数据库141中存储的用户数据和信息对象的数据构建信息对象网络110。
社团发现单元143用于基于网络构建单元142构建出的信息对象网络110,调用社团发现算法将信息对象网络110中的节点划分至各个社团中,得到社团划分结果111。例如,图1中的社团划分结果111包括划分出的四个社团,每个社团对应一种样式的节点,第一社团对应有五个节点,第二社团对应有三个节点,第三社团对应有六个节点,第四社团对应有两个节点。
标签标注单元144用于根据社团发现单元143得到的社团划分结果111,获取每个社团对应的标签,用社团的标签来为属于社团中的节点对应的信息对象进行标签标注,例如,对第一社团中节点对应的信息对象标注标签101,对第二社团中节点对应的信息对象标注标签102,对第三社团中节点对应的信息对象标注标签103,对第四社团中节点对应的信息对象标注标签104。示例性的,标签标注单元144会将对信息对象的标签标注结果存储到数据库141中。
示例性的,服务器还可以包括推荐单元。推荐单元用于根据用户帐号的推荐标签,从数据库141中查找与推荐标签的标签相同的信息对象,将这些信息对象确定为推荐对象推荐给用户帐号。
服务器140可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
图2示出了本申请一个示例性实施例提供的信息对象的标签标注方法的流程图。该方法可以由计算机设备来执行,例如,如图1所示的终端或服务器来执行。方法包括如下步骤。
步骤201,从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系,信息对象集中包括至少一个信息对象,n为大于1的整数。
示例性的,信息对象包括商品、图片、表情、酒店、商户、电影、书籍、视频、资讯、网页、品牌、用户帐号帐号、应用程序中的至少一种。示例性的,为了保证社团划分的准确性,信息对象可以只选用上述多种类型中的一个类型。
示例性的,第i个用户帐号的第i个信息对象集是由与第i个用户帐号相关的信息对象组成的集合。示例性的,信息对象与用户帐号相关是指用户帐号与信息对象间存在关联行为(用户行为),即,用户帐号对信息对象做出了关联行为。示例性的,关联行为包括:购买、浏览、收藏、关注、打开、分享、推荐、评论、使用、发送、接收、签到、观看、租赁、点赞中的至少一种。
例如,当信息对象是商品时,第i个用户帐号对应的第i个商品集包括:第i个用户帐号购买过的商品、加入购物车的商品、浏览过的商品、收藏的商品、关注的商品、分享过的商品等。
示例性的,不同用户帐号的信息对象集中可能存在相同的信息对象,例如,用户帐号A的信息对象集中包括信息对象A,用户帐号B的信息对象集中也包括信息对象A。
示例性的,用户帐号与用户帐号之间存在关联关系。关联关系包括用户帐号之间的互动关系,例如,好友关系、关注关系、点赞关系、评论关系、群组关系(属于同一个群组);关联关系还包括用户帐号间的用户帐号信息关系,例如,具有相同或相近的用户帐号属性(性别相同、居住地/登录地相同或相近、爱好相同或相近等);关联关系还包括用户帐号间的间接关系,例如,访问过同一家商户、与同一个用户帐号具有好友关系等。
步骤202,响应于n个用户帐号中存在至少两个用户帐号具有关联关系,根据信息对象集和关联关系生成信息对象网络,信息对象网络包括信息对象对应的节点和用于连接两个关联节点的连接线,两个关联节点的信息对象分别属于存在关联关系的两个用户帐号对应的信息对象集。
示例性的,根据用户帐号与用户帐号间的关联关系,确定信息对象集中信息对象的连接关系,以信息对象为节点,构建信息对象网络。
示例性的,一个信息对象在信息对象网络中对应一个节点,示例性的,不同信息对象集中的相同信息对象对应同一个节点。例如,信息对象集A中包括信息对象A、信息对象B和信息对象C,信息对象集B中包括信息对象A和信息对象D,则根据信息对象集A和信息对象集B构建的信息对象网络中包括信息对象A、信息对象B、信息对象C和信息对象D分别对应的四个节点。
根据用户帐号间的关联关系,可以确定出信息对象集中的连接关系,例如,用户帐号A与用户帐号B具有关联关系,则信息对象集A和信息对象集B具有关联关系,两个信息对象集具有关联关系,则信息对象集中的信息对象具有连接关系。例如,信息对象集A中的一个信息对象,与信息对象集B中的每一个信息对象都具有连接关系。因此,根据用户帐号间的关联关系,可以推得信息对象间的连接关系,进而根据信息对象间的连接关系,将两个信息对象对应的节点用连接线相连,组成信息对象网络。
示例性的,信息对象网络是用于描述信息对象间的连接关系的网络,信息对象的连接关系可以根据用户帐号间的关联关系来确定,也可以根据用户帐号自身的用户行为来确定。示例性的,用户帐号间的关联关系可以确定两个信息对象集之间信息对象的连接关系,用户行为可以确定一个信息对象集内部的信息对象间的连接关系。
步骤203,读取信息对象网络中的连接关系,调用社团发现算法对信息对象网络中的信息对象进行社团划分得到至少一个社团,社团中包括至少一个信息对象。
示例性的,客户端基于信息对象网络采用社团发现算法来对信息对象网络中的节点(信息对象)进行社团划分,得到至少一个社团。示例性的,一个社团内的信息对象具有相似特征、属于同一类别。示例性的,一个社团内包括至少一个节点(信息对象),一个节点(信息对象)只属于一个社团。
由于许多实际网络均具有社团结构,即整个网络由若干个社团组成,社团之间的连接相对稀疏、社团内部的连接相对稠密。社团发现算法则是利用网络的拓扑结构中所蕴藏的信息从复杂网络中解析出其模块化的社团结构。
示例性的,社团发现算法包括基于模块度优化的社团发现算法、基于谱分析的社团发现算法、基于信息论的社团发现算法、基于标号传播的社团发现算法中的至少一种。
步骤204,获取社团的标签,在存储器中将标签写入属于社团中的信息对象的信息对象数据中。
示例性的,在将信息对象划分至不同的社团中后,获取该社团对应的标签,将该属于该社团的所有信息对象标注该标签,进而实现批量对信息对象标注标签,提高信息对象的标签标注效率。
示例性的,在存储器中存储有信息对象的信息对象数据,例如,信息对象数据包括:信息对象的名称、价格、所属商户、存量、历史销量、规格、属性、上架时间、标签等等。
示例性的,在存储器中将标签写入属于社团中的信息对象的信息对象数据中,即,根据社团的标签标注属于社团中的信息对象。
示例性的,可以使用区块链技术来对信息对象的标签标注结果进行存储。示例性的,步骤201中的用户帐号、用户帐号间的关联关系、用户帐号对应的信息对象集可以存储在区块链中。
综上所述,本实施例提供的方法,通过根据用户帐号间的关联关系,将不同用户帐号对应的信息对象集中的信息对象构建成信息对象网络,形成信息对象的拓扑结构,进而根据信息对象网络上的拓扑结构调用社团发现算法来将信息对象划分至不同的社团中,完成对信息对象的分类,进而实现对一个社团中的信息对象批量标注标签,提高信息对象的标签标注效率,节省人力资源。
示例性的,给出一种基于用户帐号间的关联关系和/或用户行为来构建信息对象网络的示例性实施例。
图3示出了本申请一个示例性实施例提供的信息对象的标签标注方法的流程图。该方法可以由计算机设备来执行,例如,如图1所示的终端或服务器来执行。在图2所示的示例性实施例的基础上,步骤202还包括步骤2021至步骤2023,步骤203还包括步骤2031至步骤2033,步骤204还包括步骤2041,步骤204之后还包括步骤205至步骤207。
步骤2021,响应于n个用户帐号中存在至少两个用户帐号具有关联关系,根据信息对象集中的信息对象生成节点,信息对象与节点一一对应。
示例性的,信息对象集中的每一个信息对象在信息对象网络中都对应有一个节点。示例性的,部分信息对象集中可能存在重复的信息对象,重复的多个信息对象在信息对象网络中对应同一个节点。例如,在信息对象集A、信息对象集B和信息对象集C中都包含了信息对象A,但信息对象A在信息对象网络中只有一个节点,而不是三个节点。
示例性的,信息对象网络中的连接线可能包括两种类型:集间连接线和集内连接线,集间连接线用于连接分属于不同信息对象集的两个信息对象的节点,集内连接线用于连接属于同一个信息对象集中的两个信息对象的节点。
图3中的步骤2022和步骤2023给出了信息对象网络包括集间连接线的示例。图4中的步骤2022、步骤2024和步骤2023-1给出了信息对象网络包括集间连接线和集内连接线的示例。示例性的,本实施例还分别给出了两种生成集间连接线的方法,以及两种生成集内连接线的方法,下面分别对上述的步骤进行一一说明。
步骤2022,根据关联关系生成集间连接线,集间连接线用于连接第i个信息对象集中一个信息对象对应的节点和第j个信息对象集中一个信息对象对应的节点,第i个信息对象集对应的第i个用户帐号和第j个信息对象集对应的第j个用户帐号具有关联关系,i、j为不大于n的正整数,n为大于1的整数。
示例性的,第i个信息对象集为n个信息对象集中的任意一个信息对象集,第j个信息对象集为n个信息对象集中的任意一个不同于第i个信息对象集的信息对象集。
示例性的,当两个用户帐号存在关联关系时,可以确定两个用户帐号对应的两个信息对象集存在关联关系,则可以将两个信息对象集中的信息对象建立集间联系。示例性的,集间连接线是用于连接分别属于两个信息对象集中的两个信息对象的节点的连接线。集间连接线用于连接具有关联关系的两个信息对象集中信息对象对应的节点。
示例性的,可以采用两种方法中的一种来生成节点间的集间连接线。
一种方法为:响应于n个用户帐号中的第i个用户帐号与第j个用户帐号具有关联关系,生成连接第i个信息对象集中第x个信息对象的节点,与第j个信息对象集中第y个信息对象的节点连接的集间连接线;其中,第x个信息对象包括第i个信息对象集中的任意一个信息对象,第y个信息对象包括第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
即,当两个信息对象集存在关联关系时,遍历其中一个信息对象集中的信息对象,将信息对象中的节点与另一个信息对象集中信息对象的节点一一相连。
例如,如图5所示,当第一用户帐号301和第二用户帐号302具有关联关系时,将第一用户帐号301对应的信息对象集中的信息对象1,分别与第二用户帐号302对应的信息对象集中的信息对象5、信息对象6和信息对象7相连,同理将信息对象2、信息对象3和信息对象4与第二用户帐号302对应的信息对象集中的每一个信息对象相连。
示例性的,若两个用户帐号的信息对象集中存在相同的信息对象,则该信息对象只对应一个节点,该节点与两个信息对象集中的其他节点分别相连。如图6所示,第一用户帐号301的信息对象集和第二用户帐号302的信息对象集中都包含信息对象1,则信息对象1在信息对象网络中只对应一个节点,该节点与两个信息对象集中的其他节点(信息对象2、信息对象3、信息对象4、信息对象6和信息对象7)分别相连。
另一种方法为:信息对象集中的信息对象对应有用户行为;响应于n个用户帐号中的第i个用户帐号与第j个用户帐号具有关联关系,且第i个信息对象集中的第x个信息对象与第j个信息对象集中的第y个信息对象对应的用户行为相同,生成连接第x个信息对象的节点与第y个信息对象的节点的集间连接线;其中,第x个信息对象包括第i个信息对象集中的任意一个信息对象,第y个信息对象包括第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
示例性的,使用用户帐号间的关联关系来连接连个信息对象集中的信息对象,还可以使用用户帐号的用户行为对该信息对象的连接关系进行限定。
示例性的,用户行为是信息对象与用户帐号产生关联的关联行为,例如,用户行为包括购买、浏览、收藏、关注、打开、分享、推荐、评论、使用、发送、接收、签到、观看、租赁、点赞中的至少一种。
当两个用户帐号存在关联关系时,判断两个用户帐号对应的两个信息对象集中是否存在对应相同用户行为的信息对象,若存在,则将这两个信息对象的节点用集间连接线相连;若不存在,则不连接这两个信息对象集中信息对象的节点。
例如,如图7所示,第一用户帐号301的信息对象集中,信息对象1和信息对象2都是第一用户帐号购买过的信息对象,则信息对象1和信息对象2对应的用户行为为购买,信息对象3和信息对象4是第一用户帐号浏览过的信息对象,则信息对象3和信息对象4对应的用户行为为浏览。第二用户帐号302的信息对象集中,信息对象5是第二用户帐号购买过的信息对象,则信息对象5对应的用户行为为购买,信息对象6和信息对象7是第二用户帐号浏览过的信息对象,则信息对象6和信息对象7对应的用户行为为浏览。响应于第一用户帐号301和第二用户帐号302存在关联关系,则将两个信息对象集中对应相同用户行为的信息对象的节点相连。即,将信息对象1和信息对象5相连,信息对象2和信息对象5相连,信息对象3和信息对象6、信息对象7分别相连,信息对象4和信息对象6、信息对象7分别相连,相连的连接线为集间连接线。
示例性的,信息对象网络中的不仅包含集间连接线,还可以包含集内连接线,如图4所示,该方法还包括步骤2024。
步骤2024,根据信息对象集生成集内连接线,集内连接线用于连接第i个信息对象集中两个信息对象对应的两个节点。
示例性的,集内连接线用于连接一个用户帐号对应的一个信息对象集内多个信息对象对应的节点。即,将一个信息对象集内信息对象对应的节点连接起来。示例性的,集间连接线用于表达用户帐号与用户帐号间的关联关系,集内连接线用于表达一个用户帐号内信息对象之间的关联关系(这些信息对象与同一个用户帐号有关联,或,这些信息对象与同一个用户帐号的关联方式相同)。
示例性的,可以采用两种方法中的一种来生成节点间的集间连接线。
一种方法为:将第i个信息对象集中全部信息对象对应的节点,以全连接的方式生成连接任意两个节点的集内连接线,i为不大于n的正整数,n为正整数。
即,将一个用户帐号对应的一个信息对象集内全部的信息对象对应的多个节点,两两相连形成全连接。由于这些信息对象同属于一个用户帐号,则任意两个信息对象间都存在关联关系。
例如,如图8所示,将第一用户帐号301对应的信息对象集内的六个信息对象两两相连,形成由六个节点组成的全连接网络。
另一种方法为:信息对象集中的信息对象对应有用户行为;响应于第i个信息对象集中第x个信息对象与第z个信息对象对应的用户行为相同,生成连接第x个信息对象的节点与第z个信息对象的节点的集内连接线;其中,第x个信息对象包括第i个信息对象集中的任意一个信息对象,第z个信息对象包括第i个信息对象集中的任意一个不同于第x个信息对象的信息对象,i为不大于n的正整数,x、z为正整数,n为大于1的整数。
即,将一个用户帐号对应的一个信息对象集中,对应相同用户行为的多个信息对象的节点连接起来。
例如,如图9所示,第一用户帐号301的信息对象集中,信息对象1、信息对象2、信息对象3和信息对象4都是第一用户帐号评论过的商户,信息对象5、信息对象6是第一用户帐号签到过的商户。则将信息对象1、信息对象2、信息对象3和信息对象4用集内连接线两两相连,将信息对象5和信息对象6相连。
示例性的,当一个信息对象对应了多个用户行为时,需要依次判定该信息对象的每一个用户行为,是否存在相同用户行为的信息对象,当该信息对象对应的多个用户行为都存在相同用户行为的信息对象时,该信息对象的节点会被多次连接。
例如,如图10所示,第一用户帐号301的信息对象集中,信息对象1、信息对象2、信息对象3和信息对象4都是第一用户帐号评论过的商户,信息对象2、信息对象5、信息对象6是第一用户帐号签到过的商户。则将信息对象1、信息对象2、信息对象3和信息对象4用集内连接线两两相连,将信息对象2、信息对象5和信息对象6用集内连接线两两相连。
示例性的,连接线(集内连接线或集间连接线)可以是如图11所示的无向连接线303,也可以是如图12所示的有向连接线304。无向连接线仅表示了两个节点间的连接关系,有向连接线除了表示两个节点间的连接关系,还可以表示该连接关系的方向。例如,用户在浏览商品A时,在商品A的推荐页面上购买了商品B,则可以用有向连接线从商品A的节点指向商品B的节点,以表达这种推荐关系。
示例性的,对于有向连接线,在进行社团划分时,只能延有向连接线指向的方向进行社团划分,例如,节点A指向节点B,则只能间节点A归为节点B所属的社团,不能将节点B归为节点A所属的社团。
步骤2023,根据节点和集间连接线生成信息对象网络。
示例性的,当连接线包括集间连接线时,根据节点和集间连接线生成信息对象网络。当连接线包括集内连接线和集间连接线时,如图4所示,步骤2023包括步骤2023-1:根据节点、集内连接线和集间连接线生成信息对象网络。
示例性的,由于不同用户帐号的信息对象集中的信息对象可能存在重复,并且位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点,则两个信息对象的节点间可能被连接了多次,例如,用户帐号A的信息对象集中有信息对象A和信息对象B,用户帐号B的信息对象集中有信息对象B,则当用户帐号A和用户帐号B存在关联关系时,信息对象A的节点和信息对象B的节点间存在一个集内连接线,还存在一个集间连接线。同理,当多个信息对象集中都存在相同的信息对象时,两个节点间还可能存在多个集间连接线,或,存在多个集内连接线。
因此,需要对节点间的多个连接线进行去重。
当连接线包括集间连接线时,响应于第a个节点和第b个节点间存在多个连接线,将连接第a个节点和第b个节点的多个集间连接线去重,得到第a个节点和第b个节点间的单连接线;第a个节点和第b个节点为任意两个相连的节点,a、b为正整数;响应于第a个节点和第b个节点间存在一个集间连接线,将连接第a个节点和第b个节点的集间连接线确定为第a个节点和第b个节点间的单连接线;根据连接第a个节点和第b个节点的集间连接线的数量,确定第a个节点和第b个节点之间的单连接线的权重;根据节点、单连接线和单连接线的权重生成信息对象网络。
当连接线包括集间连接线和/或集内连接线时,响应于第a个节点和第b个节点间存在多个连接线,将连接第a个节点和第b个节点的多个连接线去重,得到第a个节点和第b个节点间的单连接线;连接线包括集内连接线和集间连接线中的至少一种,第a个节点和第b个节点为任意两个相连的节点,a、b为正整数;响应于第a个节点和第b个节点间存在一个连接线,将连接第a个节点和第b个节点的连接线确定为第a个节点和第b个节点间的单连接线;根据连接第a个节点和第b个节点的连接线的数量,确定第a个节点和第b个节点之间的单连接线的权重;根据节点、单连接线和单连接线的权重生成信息对象网络。
即,当两个节点间存在多个连接线时,去掉多余的连接线,只保留一个连接线作为单连接线,最终的信息对象网络中,两个节点间只存在一个连接线(单连接线)。
示例性的,单连接线还对应有权重,单连接线的权重等于两个节点间连接线的数量。当两个节点间存在10个连接线时,则两个节点间单连接线的权重为10。
示例性的,单连接线的权重也可以是预置值,例如,所有单连接线的权重都为1。
例如,如图13所示,将节点间的多个连接线进行去重保留单连接线,并求出单连接线的权重后,根据节点、单连接线和权重可以生成如图13所示的信息对象网络。例如,节点1和节点3之间具有单连接线305,单连接线的权重为w1,3
步骤2031,读取信息对象网络中的连接关系,根据信息对象网络中节点的连接关系将信息对象网络中的相邻节点划分至同一社团,计算信息对象网络的模块度,重复本步骤得到信息对象网络的多个模块度;相邻节点包括具有连接关系的两个节点,模块度用于描述信息对象网络中社区划分的优劣程度。
示例性的,本实施例给出一种采用基于模块度的Fast-Unfolding(快速展开)社团发现算法进行社团划分的示例性实施例。
Fast-Unfolding算法主要包括两个阶段:
第一阶段称为Modularity Optimization(模块化优化),主要是将每个节点划分到与其邻接的节点所在的社团中,以使得模块度的值不断变大。
第二阶段称为Community Aggregation(社区聚集),主要是将第一步划分出来的社团聚合成为一个节点,即根据上一步生成的社团结构重新构造信息对象网络。重复以上的过程,直到信息对象网络中的结构不再改变为止。
算法过程如下所示:
第一步,初始化信息对象网络,将每个节点划分在不同的社团中;
第二步,对每个节点,将每个节点尝试划分到与其邻接的节点所在的社团中,计算此时的信息对象网络的模块度Q,判断划分前后的模块度的差值ΔQ是否为正数,若为正数,则接受本次的社团划分,若不为正数,则放弃本次的社团划分;
第三步,重复以上的过程,直到不能再增大模块度为止;
第四步,将属于一个社团的多个节点作为一个节点,更新信息对象网络,新的信息对象网络中的每个节点代表的是第三步中划出来的每个社团,继续执行第二步和第三步,直到信息对象网络(社团划分)的结构不再改变为止。
示例性的,模块度的计算公式为:
Figure BDA0002796180560000211
其中,m为信息对象网络中的所有权重的和,
Figure BDA0002796180560000212
Ai,j表示节点i和节点j之间的权重(单连接线的权重);ki表示与节点i连接的单连接线的权重之和,ki=∑jAi,j,ci表示节点i被分配到的社区,δ(ci,cj)用于判断节点i与节点j是否被划分至同一个社区,若是,则返回1,否则返回0。
示例性的,上述公式用于计算节点i与节点j之间的模块度,信息对象网络的模块度为信息对象网络中所有相连节点间模块度之和。例如,信息对象网络中存在三个节点,则信息对象网络的模块度为这三个节点间的三个模块度之和。
模块度(modularity)是指信息对象网络中连接社区结构内部节点的连接线所占的比例,减去在同样的社团结构下任意连接这两个节点的比例的期望值。
示例性的,基于上述的Fast-Unfolding算法的过程理解步骤2031至步骤2033的方法。
即,首先将信息对象网络中每一个节点都各自划分一个社团,然后将其中的一个节点划分至其相邻的一个节点的社团内,计算本次划分前后信息对象网络的模块度之差,若模块度之差大于零,则接受本次划分。若模块度之差不为正数则不接受本次划分,将该节点重新归为原社团,再次将信息对象网络中的一个节点划分至其相邻的一个节点的社团内,继续计算划分前后信息对象网络的模块度之差。重复这一过程,直至信息对象网络的模块度达到不再增大,即,信息对象网络的模块度达到最大值。
步骤2032,响应于信息对象网络的模块度取最大值,得到社团划分结果,社团划分结果包括至少一个社团。
将信息对象网络的模块度达到最大值时的各个节点的社团划分情况作为社团划分结果。
步骤2033,将属于同一个社团的节点作为一个节点,更新信息对象网络,重复上述步骤,直至信息对象网络的网络结构不变。
根据步骤2032中得到的社团划分结果,将属于一个社团的节点(一个或多个节点)合并为一个节点,更新信息对象网络,然后重复步骤2031至步骤2032的过程,再次将信息对象网络中的各个节点尝试划分至其相邻节点的社团内,直至模块度不再增大,再次根据模块度不再增大时的社团划分情况更新信息对象网络,直至信息对象网络的网络结构不再发生变化,即,社团的划分结果不再发生变化。
如图14中的(1)所示,为初始化的信息对象网络,网络中各个节点分属于不同的社团,经过第一阶段Modularity Optimization(模块化优化)后,得到如图14中的(2)所示的社团划分结果,图中颜色相同的节点被划分至同一个社团即,节点1、节点2、节点4、节点5、节点0为同一社团,节点3、节点7、节点6为同一社团,节点15、节点8、节点9、节点14、节点12、节点10为同一社团,节点11、节点13为同一社团,此时,信息对象网络的模块度取最大值。然后对图14中的(2)的结果进行第二阶段Community Aggregation(社区聚集),将属于同一社团的节点合并为一个节点,得到如图14中的(3)所示的信息对象网络,图中各个节点对应的数值为该节点对应的社团的模块度,然后对图14中的(3)所示的信息对象网络再进行第一阶段Modularity Optimization(模块化优化)和第二阶段Community Aggregation(社区聚集),最终得到如图14中的(4)所示的信息对象网络,即,最终将信息对象网络中的节点划分为两个社团。
示例性的,如图15所示,使用社团发现算法,可以将信息对象网络中的节点划分为多个社团306,从图15中可以看出,社团内部节点间的连接较为紧密,不同社团的节点间的连接较为稀疏。
步骤2041,获取人工对社团标注的标签,在存储器中将标签写入属于社团中的信息对象的信息对象数据中。
在将信息对象网络中的节点划分为多个社团后,由于节点对应着信息对象,也就可以将信息对象划分为多个社团,然后可以根据获取每个社团的标签,使用社团的标签来为社团内的信息对象统一标注标签。
示例性的,社团的标签可以是人工标注的,即,在使用上述方法将信息对象划分为多个社团(类别)后,人工识别每个社团中信息对象的类别,即可获得该社团的标签,然后用社团的标签统一为社团中的信息对象进行标注。
示例性的,如图4所示,步骤2041还可以替换为步骤2042。
步骤2042,根据属于社团的有标签对象确定社团的标签,在存储器中将标签写入属于社团中的无标签对象的信息对象数据中。
示例性的,n个信息对象集中的信息对象包括有标签对象和无标签对象。初始时信息对象集中的信息对象,可以是部分有标签部分无标签的。
在将信息对象分为多个社团后,可以根据社团内有标签的信息对象(有标签对象)的标签,将数量最多的标签确定为该社团的标签,然后用社团的标签为社团内无标签的信息对象(无标签对象)标注标签。这样就可以使用少量的有标签数据,来实现对无标签数据的自动标注。
示例性的,如图16所示,在使用社团发现算法将12个信息对象分为4个社团后,分别获取每个社团的标签,将第一个社团中的信息对象标注为动物307,将第二个社团中的信息对象标注为食物308,将第三个社团中的信息对象标注为人309,将第四个社团中的信息对象标注为汽车310。
步骤205,从存储器中读取待推荐用户帐号的用户历史行为,根据用户历史行为对应的信息对象确定推荐用户帐号的推荐标签,推荐标签包括用户历史行为对应的信息对象的标签。
在将信息对象标注标签后,就可以根据信息对象的标签来向用户推荐信息对象。
示例性的,可以根据用户帐号的用户历史行为来向用户推荐信息对象。用户历史行为包括用户帐号历史发生过的用户行为对应的信息对象。示例性的,获取用户历史行为队对应的信息对象的标签,然后根据这些信息对象的标签,确定用户偏好的推荐标签,从而根据推荐标签来确定推荐信息对象,向用户来推荐推荐信息对象。
步骤206,根据推荐标签确定待推荐用户帐号的推荐对象,推荐对象的标签与推荐标签相同。
示例性的,根据推荐标签,从已经标注标签的多个信息对象中,确定出与推荐标签的标签相同的推荐信息对象。
步骤207,向待推荐用户帐号的客户端发送推荐对象。
综上所述,本实施例提供的方法,通过根据用户帐号间的关联关系,将不同用户帐号对应的信息对象集中的信息对象生成成信息对象网络,形成信息对象的拓扑结构,进而根据信息对象网络上的拓扑结构调用社团发现算法来将信息对象划分至不同的社团中,完成对信息对象的分类,进而实现对一个社团中的信息对象批量标注标签,提高信息对象的标签标注效率,节省人力资源。
本实施例提供的方法,通过使用集内连接线连接一个用户帐号的信息对象集内的信息对象的节点,加强同属于一个用户帐号的信息对象间的联系,使社团发现算法可以基于该拓扑结构上的联系,发现不同信息对象间的相似特征,从而更准确进行社团划分。
本实施例提供的方法,通过使用社团发现算法来基于信息对象网络,将信息对象划分为不同的社团,从而可以根据社团的标签,一次性地标注该社团内的全部信息对象,提高标签的标注效率,节省人力资源。
本实施例提供的方法,通过使用标注标签后的信息对象,以及用户的用户历史行为,来确定用户喜爱的标签,进而可以根据用户喜爱的标签向用户推荐信息对象。
示例性的,给出一种将本申请提供的信息对象的标签标注方法用于标注商品标签的示例性实施例。
示例性的,服务器获取每一个用户帐号的用户数据,用户数据包括与用户帐号有过关联行为(用户行为)的商品,例如,用户帐号购买过的商品、加入购物车的商品、收藏的商品、浏览的商品、分享过的商品、关注的商品中的至少一种,将每个用户帐号对应的商品生成各自的商品集。
服务器获取用户帐号间的关联关系,例如,根据用户帐号的好友列表、用户帐号的关注列表、用户帐号的消息发送列表等获取与该用户帐号具有关联关系的用户帐号。
服务器根据多个用户帐号的多个商品集以及用户帐号的关联关系构建商品网络,商品网络包括商品对应的节点,和用于连接两个关联节点的连接线,两个关联节点对应的商品分别属于存在关联关系的两个用户帐号对应的商品集。
示例性的,服务器将每个商品集内的商品对应的节点进行全连接,将具有关联关系的两个用户帐号对应的两个商品集对应的节点进行全连接,构成商品网络。示例性的,商品网络中连接线的权重为两个节点间的连接次数,例如,根据用户帐号A与用户帐号B的关联关系,将商品A和商品B的节点连接一次,根据用户帐号C与用户帐号D的关联关系,又将商品A和商品B的节点连接一次,则商品A和商品B的节点间的连接线的权重为2。
服务器使用社团发现算法对商品网络中的商品进行社团划分,得到多个社团。
服务器获取通过人工标注方式对每个社团标注的标签,根据标签标注属于社团中的商品。
服务器通过上述方法对商品标注标签后,可以根据用户的喜好向用户推荐用户可能感兴趣的商品。例如,服务器根据用户设置的商品标签偏好,来向用户推荐对应标签的商品。
综上所述,本实施例提供的方法,通过使用用户的商品数据,和用户间的关联数据,来构建商品网络,基于商品网络使用社团发现算法对商品进行分类,从而实现快速批量地标注商品标签,当商品数量较为庞大时,使用该方法可以快速地标注大量商品的标签,提高商品标签的标注效率,便于根据商品标签向用户推荐商品。
以下为本申请的装置实施例,对于装置实施例中未详细描述的细节,可以结合参考上述方法实施例中相应的记载,本文不再赘述。
图17示出了本申请的一个示例性实施例提供的信息对象的标签标注装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分,该装置包括:
读取模块401,用于从存储器中读取n个用户帐号分别对应的n个信息对象集,以及=用户帐号间的关联关系,所述信息对象集中包括至少一个信息对象,n为大于1的整数;
生成模块402,用于根据所述信息对象集和所述关联关系生成信息对象网络,所述信息对象网络包括所述信息对象对应的节点和用于连接两个关联节点的连接线,所述两个关联节点的信息对象分别属于存在所述关联关系的两个用户帐号对应的信息对象集;
所述读取模块401,用于读取所述信息对象网络中的连接关系;
社团模块403,用于调用社团发现算法对所述信息对象网络中的所述信息对象进行社团划分得到至少一个社团,所述社团中包括至少一个信息对象;
获取模块407,用于获取所述社团的标签;
写入模块404,用于在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中。
在一个可选的实施例中,所述生成模块402,用于响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集中的所述信息对象生成所述节点,所述信息对象与所述节点一一对应;
所述生成模块402,用于根据所述关联关系生成集间连接线,所述集间连接线用于连接第i个信息对象集中一个信息对象对应的节点和第j个信息对象集中一个信息对象对应的节点,所述第i个信息对象集对应的第i个用户帐号和所述第j个信息对象集对应的第j个用户帐号具有所述关联关系,i、j为不大于n的正整数,n为大于1的整数;
所述生成模块402,用于根据所述节点和所述集间连接线生成所述信息对象网络。
所述生成模块402,用于响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,生成连接所述第i个信息对象集中第x个信息对象的节点,与所述第j个信息对象集中第y个信息对象的节点连接的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
在一个可选的实施例中,所述信息对象集中的所述信息对象对应有用户行为;
所述生成模块402,用于响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,且所述第i个信息对象集中的第x个信息对象与所述第j个信息对象集中的第y个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第y个信息对象的节点的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
在一个可选的实施例中,所述生成模块402,用于根据所述信息对象集生成集内连接线,所述集内连接线用于连接所述第i个信息对象集中两个信息对象对应的两个节点;
所述生成模块402,用于根据所述节点、所述集间连接线和所述集内连接线生成所述信息对象网络。
在一个可选的实施例中,所述生成模块402,用于将所述第i个信息对象集中全部信息对象对应的节点,以全连接的方式生成连接任意两个节点的所述集内连接线,i为不大于n的正整数,n为正整数。
在一个可选的实施例中,所述信息对象集中的所述信息对象对应有用户行为;所述生成模块402,用于响应于所述第i个信息对象集中第x个信息对象与第z个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第z个信息对象的节点的所述集内连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第z个信息对象包括所述第i个信息对象集中的任意一个不同于所述第x个信息对象的信息对象,i为不大于n的正整数,x、z为正整数,n为大于1的整数。
在一个可选的实施例中,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点;
所述生成模块402,用于响应于第a个节点和第b个节点间存在多个所述集间连接线,将连接所述第a个节点和所述第b个节点的多个所述集间连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
所述生成模块402,用于响应于第a个节点和第b个节点间存在一个所述集间连接线,将连接所述第a个节点和所述第b个节点的所述集间连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
所述生成模块402,用于根据连接所述第a个节点和所述第b个节点的所述集间连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
所述生成模块402,用于根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
在一个可选的实施例中,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点;
所述生成模块402,用于响应于第a个节点和第b个节点间存在多个所述连接线,将连接所述第a个节点和所述第b个节点的多个所述连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述连接线包括集内连接线和所述集间连接线中的至少一种,所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
所述生成模块402,用于响应于第a个节点和第b个节点间存在一个所述连接线,将连接所述第a个节点和所述第b个节点的所述连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
所述生成模块402,用于根据连接所述第a个节点和所述第b个节点的所述连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
所述生成模块402,用于根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
在一个可选的实施例中,所述读取模块401,用于读取所述信息对象网络中的连接关系;
所述社团模块403,用于根据所述信息对象网络中所述节点的所述连接关系将所述信息对象网络中的相邻节点划分至同一社团,计算所述信息对象网络的模块度,重复本步骤得到所述信息对象网络的多个所述模块度;所述相邻节点包括具有所述连接关系的两个节点,所述模块度用于描述所述信息对象网络中社区划分的优劣程度;
所述社团模块403,用于响应于所述信息对象网络的所述模块度取最大值,得到社团划分结果,所述社团划分结果包括至少一个社团;
所述社团模块403,用于将属于同一个所述社团的节点作为一个节点,更新所述信息对象网络,重复上述步骤,直至所述信息对象网络的网络结构不变。
在一个可选的实施例中,所述获取模块407,用于获取采用人工标注方式对所述社团标注的所述标签;
所述写入模块404,用于在所述存储器中将所述标签写入属于所社团中的所述信息对象的信息对象数据中。
在一个可选的实施例中,所述n个信息对象集中的所述信息对象包括有标签对象和无标签对象;
所述获取模块407,用于根据属于所述社团的所述有标签对象确定所述社团的标签;
所述写入模块404,用于在所述存储器中将所述标签写入属于所述社团中的所述无标签对象的信息对象数据中。
在一个可选的实施例中,所述读取模块401,用于从存储器中读取待推荐用户帐号的用户历史行为;
推荐模块405,用于根据所述用户历史行为对应的所述信息对象确定所述推荐用户帐号的推荐标签,所述推荐标签包括所述用户历史行为对应的所述信息对象的标签;
所述推荐模块405,用于根据所述推荐标签确定所述待推荐用户帐号的推荐对象,所述推荐对象的标签与所述推荐标签相同;
发送模块406,用于向所述待推荐用户帐号的客户端发送所述推荐对象。
图18是本申请一个实施例提供的服务器的结构示意图。具体来讲:服务器1800包括中央处理单元(英文:Central Processing Unit,简称:CPU)1801、包括随机存取存储器(英文:Random Access Memory,简称:RAM)1802和只读存储器(英文:Read-Only Memory,简称:ROM)1803的系统存储器1804,以及连接系统存储器1804和中央处理单元1801的系统总线1805。服务器1800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1806,和用于存储操作系统1813、应用程序1814和其他程序模块1815的大容量存储设备1807。
基本输入/输出系统1806包括有用于显示信息的显示器1808和用于用户帐号输入信息的诸如鼠标、键盘之类的输入设备1809。其中显示器1808和输入设备1809都通过连接到系统总线1805的输入/输出控制器1810连接到中央处理单元1801。基本输入/输出系统1806还可以包括输入/输出控制器1810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入/输出控制器1810还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备1807通过连接到系统总线1805的大容量存储控制器(未示出)连接到中央处理单元1801。大容量存储设备1807及其相关联的计算机可读介质为服务器1800提供非易失性存储。也就是说,大容量存储设备1807可以包括诸如硬盘或者只读光盘(英文:Compact Disc Read-Only Memory,简称:CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(英文:Erasable Programmable Read-Only Memory,简称:EPROM)、电可擦除可编程只读存储器(英文:Electrically Erasable Programmable Read-Only Memory,简称:EEPROM)、闪存或其他固态存储其技术,CD-ROM、数字通用光盘(英文:Digital Versatile Disc,简称:DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1804和大容量存储设备1807可以统称为存储器。
根据本申请的各种实施例,服务器1800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1800可以通过连接在系统总线1805上的网络接口单元1811连接到网络1812,或者说,也可以使用网络接口单元1811来连接到其他类型的网络或远程计算机系统(未示出)。
本申请还提供了一种终端,该终端包括处理器和存储器,存储器中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述各个方法实施例提供的信息对象的标签标注方法。需要说明的是,该终端可以是如下图19所提供的终端。
图19示出了本申请一个示例性实施例提供的终端1900的结构框图。该终端1900可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1900还可能被称为用户帐号设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1900包括有:处理器1901和存储器1902。
处理器1901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1901可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1901可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1901还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1901所执行以实现本申请中方法实施例提供的信息对象的标签标注方法。
在一些实施例中,终端1900还可选包括有:外围设备接口1903和至少一个外围设备。处理器1901、存储器1902和外围设备接口1903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1903相连。具体地,外围设备包括:射频电路1904、显示屏1905、摄像头组件1906、音频电路1907、定位组件1908和电源1909中的至少一种。
外围设备接口1903可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1901和存储器1902。在一些实施例中,处理器1901、存储器1902和外围设备接口1903被集成在同一芯片或电路板上;在一些其他实施例中,处理器1901、存储器1902和外围设备接口1903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1904用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。示例性的,射频电路1904包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户帐号身份模块卡等等。射频电路1904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1904还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1905用于显示UI(User Interface,用户帐号界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1905是触摸显示屏时,显示屏1905还具有采集在显示屏1905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1901进行处理。此时,显示屏1905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1905可以为一个,设置终端1900的前面板;在另一些实施例中,显示屏1905可以为至少两个,分别设置在终端1900的不同表面或呈折叠设计;在再一些实施例中,显示屏1905可以是柔性显示屏,设置在终端1900的弯曲表面上或折叠面上。甚至,显示屏1905还可以设置成非矩形的不规则图形,也即异形屏。显示屏1905可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1906用于采集图像或视频。示例性的,摄像头组件1906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1907可以包括麦克风和扬声器。麦克风用于采集用户帐号及环境的声波,并将声波转换为电信号输入至处理器1901进行处理,或者输入至射频电路1904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1901或射频电路1904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1907还可以包括耳机插孔。
定位组件1908用于定位终端1900的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1908可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1909用于为终端1900中的各个组件进行供电。电源1909可以是交流电、直流电、一次性电池或可充电电池。当电源1909包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1900还包括有一个或多个传感器1910。该一个或多个传感器1910包括但不限于:加速度传感器1911、陀螺仪传感器1912、压力传感器1913、指纹传感器1914、光学传感器1915以及接近传感器1916。
加速度传感器1911可以检测以终端1900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1911可以用于检测重力加速度在三个坐标轴上的分量。处理器1901可以根据加速度传感器1911采集的重力加速度信号,控制显示屏1905以横向视图或纵向视图进行用户帐号界面的显示。加速度传感器1911还可以用于游戏或者用户帐号的运动数据的采集。
陀螺仪传感器1912可以检测终端1900的机体方向及转动角度,陀螺仪传感器1912可以与加速度传感器1911协同采集用户帐号对终端1900的3D动作。处理器1901根据陀螺仪传感器1912采集的数据,可以实现如下功能:动作感应(比如根据用户帐号的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1913可以设置在终端1900的侧边框和/或显示屏1905的下层。当压力传感器1913设置在终端1900的侧边框时,可以检测用户帐号对终端1900的握持信号,由处理器1901根据压力传感器1913采集的握持信号进行左右手识别或快捷操作。当压力传感器1913设置在显示屏1905的下层时,由处理器1901根据用户帐号对显示屏1905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1914用于采集用户帐号的指纹,由处理器1901根据指纹传感器1914采集到的指纹识别用户帐号的身份,或者,由指纹传感器1914根据采集到的指纹识别用户帐号的身份。在识别出用户帐号的身份为可信身份时,由处理器1901授权该用户帐号执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1914可以被设置终端1900的正面、背面或侧面。当终端1900上设置有物理按键或厂商Logo时,指纹传感器1914可以与物理按键或厂商Logo集成在一起。
光学传感器1915用于采集环境光强度。在一个实施例中,处理器1901可以根据光学传感器1915采集的环境光强度,控制显示屏1905的显示亮度。具体地,当环境光强度较高时,调高显示屏1905的显示亮度;当环境光强度较低时,调低显示屏1905的显示亮度。在另一个实施例中,处理器1901还可以根据光学传感器1915采集的环境光强度,动态调整摄像头组件1906的拍摄参数。
接近传感器1916,也称距离传感器,通常设置在终端1900的前面板。接近传感器1916用于采集用户帐号与终端1900的正面之间的距离。在一个实施例中,当接近传感器1916检测到用户帐号与终端1900的正面之间的距离逐渐变小时,由处理器1901控制显示屏1905从亮屏状态切换为息屏状态;当接近传感器1916检测到用户帐号与终端1900的正面之间的距离逐渐变大时,由处理器1901控制显示屏1905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图19中示出的结构并不构成对终端1900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的信息对象的标签标注方法。
本申请还提供一种计算机设备,该计算机设备包括:处理器和存储器,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的信息对象的标签标注方法。
本申请还提供一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的信息对象的标签标注方法。
本申请还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述可选实现方式中提供的信息对象的标签标注方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种信息对象的标签标注方法,其特征在于,应用于计算机设备中,所述方法包括:
从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系,所述信息对象集中包括至少一个信息对象,n为大于1的整数;
响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集和所述关联关系生成信息对象网络,所述信息对象网络包括所述信息对象对应的节点和用于连接两个关联节点的连接线,所述两个关联节点的信息对象分别属于存在所述关联关系的两个用户帐号对应的信息对象集;
读取所述信息对象网络中的连接关系,调用社团发现算法对所述信息对象网络中的所述信息对象进行社团划分得到至少一个社团,所述社团中包括至少一个信息对象;
获取所述社团的标签,在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中。
2.根据权利要求1所述的方法,其特征在于,所述响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集和所述关联关系生成信息对象网络,包括:
响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集中的所述信息对象生成所述节点,所述信息对象与所述节点一一对应;
根据所述关联关系生成集间连接线,所述集间连接线用于连接第i个信息对象集中一个信息对象对应的节点和第j个信息对象集中一个信息对象对应的节点,所述第i个信息对象集对应的第i个用户帐号和所述第j个信息对象集对应的第j个用户帐号具有所述关联关系,i、j为不大于n的正整数,n为大于1的整数;
根据所述节点和所述集间连接线生成所述信息对象网络。
3.根据权利要求2所述的方法,其特征在于,所述根据所述关联关系生成集间连接线,包括:
响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,生成连接所述第i个信息对象集中第x个信息对象的节点,与所述第j个信息对象集中第y个信息对象的节点连接的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
4.根据权利要求2所述的方法,其特征在于,所述信息对象集中的所述信息对象对应有用户行为;所述根据所述关联关系生成集间连接线,包括:
响应于所述n个用户帐号中的所述第i个用户帐号与所述第j个用户帐号具有所述关联关系,且所述第i个信息对象集中的第x个信息对象与所述第j个信息对象集中的第y个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第y个信息对象的节点的所述集间连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第y个信息对象包括所述第j个信息对象集中的任意一个信息对象,i、j为不大于n的正整数,x、y为正整数,n为大于1的整数。
5.根据权利要求2至4任一所述的方法,其特征在于,所述方法还包括:
根据所述信息对象集生成集内连接线,所述集内连接线用于连接所述第i个信息对象集中两个信息对象对应的两个节点;
所述根据所述节点和所述集间连接线构建所述信息对象网络,包括:
根据所述节点、所述集间连接线和所述集内连接线生成所述信息对象网络。
6.根据权利要求5所述的方法,其特征在于,所述根据所述信息对象集生成集内连接线,包括:
将所述第i个信息对象集中全部信息对象对应的节点,以全连接的方式生成连接任意两个节点的所述集内连接线,i为不大于n的正整数,n为正整数。
7.根据权利要求5所述的方法,其特征在于,所述信息对象集中的所述信息对象对应有用户行为;所述根据所述信息对象集生成集内连接线,包括:
响应于所述第i个信息对象集中第x个信息对象与第z个信息对象对应的所述用户行为相同,生成连接所述第x个信息对象的节点与所述第z个信息对象的节点的所述集内连接线;
其中,所述第x个信息对象包括所述第i个信息对象集中的任意一个信息对象,所述第z个信息对象包括所述第i个信息对象集中的任意一个不同于所述第x个信息对象的信息对象,i为不大于n的正整数,x、z为正整数,n为大于1的整数。
8.根据权利要求2至4任一所述的方法,其特征在于,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点,所述根据所述节点和所述集间连接线生成所述信息对象网络,包括:
响应于第a个节点和第b个节点间存在多个所述集间连接线,将连接所述第a个节点和所述第b个节点的多个所述集间连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
响应于第a个节点和第b个节点间存在一个所述集间连接线,将连接所述第a个节点和所述第b个节点的所述集间连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
根据连接所述第a个节点和所述第b个节点的所述集间连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
9.根据权利要求5所述的方法,其特征在于,位于不同信息对象集中的相同信息对象在信息对象网络中对应同一个节点,所述根据所述节点、所述集间连接线和所述集内连接线生成所述信息对象网络,包括:
响应于第a个节点和第b个节点间存在多个所述连接线,将连接所述第a个节点和所述第b个节点的多个所述连接线去重,得到所述第a个节点和所述第b个节点间的单连接线;所述连接线包括集内连接线和所述集间连接线中的至少一种,所述第a个节点和所述第b个节点为任意两个相连的节点,a、b为正整数;
响应于第a个节点和第b个节点间存在一个所述连接线,将连接所述第a个节点和所述第b个节点的所述连接线确定为所述第a个节点和所述第b个节点间的所述单连接线;
根据连接所述第a个节点和所述第b个节点的所述连接线的数量,确定所述第a个节点和所述第b个节点之间的所述单连接线的权重;
根据所述节点、所述单连接线和所述单连接线的所述权重生成所述信息对象网络。
10.根据权利要求1至4任一所述的方法,其特征在于,所述获取所述社团的标签,在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中,包括:
获取采用人工标注方式对所述社团标注的所述标签,在所述存储器中将所述标签写入属于所社团中的所述信息对象的信息对象数据中。
11.根据权利要求1至4任一所述的方法,其特征在于,所述n个信息对象集中的所述信息对象包括有标签对象和无标签对象;
所述获取所述社团的标签,在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中,包括:
根据属于所述社团的所述有标签对象确定所述社团的标签,在所述存储器中将所述标签写入属于所述社团中的所述无标签对象的信息对象数据中。
12.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:
从存储器中读取待推荐用户帐号的用户历史行为,根据所述用户历史行为对应的所述信息对象确定所述推荐用户帐号的推荐标签,所述推荐标签包括所述用户历史行为对应的所述信息对象的标签;
根据所述推荐标签确定所述待推荐用户帐号的推荐对象,所述推荐对象的标签与所述推荐标签相同;
向所述待推荐用户帐号的客户端发送所述推荐对象。
13.一种信息对象的标签标注装置,其特征在于,所述装置包括:
读取模块,用于从存储器中读取n个用户帐号分别对应的n个信息对象集,以及用户帐号间的关联关系,所述信息对象集中包括至少一个信息对象,n为大于1的整数;
生成模块,用于响应于所述n个用户帐号中存在至少两个用户帐号具有所述关联关系,根据所述信息对象集和所述关联关系生成信息对象网络,所述信息对象网络包括所述信息对象对应的节点和用于连接两个关联节点的连接线,所述两个关联节点的信息对象分别属于存在所述关联关系的两个用户帐号对应的信息对象集;
所述读取模块,用于读取所述信息对象网络中的连接关系;
社团模块,用于调用社团发现算法对所述信息对象网络中的所述信息对象进行社团划分得到至少一个社团,所述社团中包括至少一个信息对象;
获取模块,用于获取所述社团的标签;
写入模块,用于在所述存储器中将所述标签写入属于所述社团中的所述信息对象的信息对象数据中。
14.一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如权利要求1至12任一项所述的信息对象的标签标注方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行,以实现如权利要求1至12任一项所述的信息对象的标签标注方法。
CN202011332338.9A 2020-11-24 2020-11-24 信息对象的标签标注方法、装置、设备及存储介质 Pending CN114547430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011332338.9A CN114547430A (zh) 2020-11-24 2020-11-24 信息对象的标签标注方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011332338.9A CN114547430A (zh) 2020-11-24 2020-11-24 信息对象的标签标注方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114547430A true CN114547430A (zh) 2022-05-27

Family

ID=81660455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011332338.9A Pending CN114547430A (zh) 2020-11-24 2020-11-24 信息对象的标签标注方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114547430A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809693A (zh) * 2023-01-16 2023-03-17 南京集成电路产业服务中心有限公司 基于神经网络的芯片设计能效优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115809693A (zh) * 2023-01-16 2023-03-17 南京集成电路产业服务中心有限公司 基于神经网络的芯片设计能效优化方法
CN115809693B (zh) * 2023-01-16 2023-04-07 南京集成电路产业服务中心有限公司 基于神经网络的芯片设计能效优化方法

Similar Documents

Publication Publication Date Title
CN111652678B (zh) 物品信息显示方法、装置、终端、服务器及可读存储介质
CN110458360B (zh) 热门资源的预测方法、装置、设备及存储介质
CN111737573A (zh) 资源推荐方法、装置、设备及存储介质
CN111897996B (zh) 话题标签推荐方法、装置、设备及存储介质
CN112069414A (zh) 推荐模型训练方法、装置、计算机设备及存储介质
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN112966124B (zh) 知识图谱对齐模型的训练方法、对齐方法、装置及设备
CN111914180B (zh) 基于图结构的用户特征确定方法、装置、设备及介质
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN110555102A (zh) 媒体标题识别方法、装置及存储介质
CN114117206B (zh) 推荐模型处理方法、装置、电子设备及存储介质
CN111931075B (zh) 一种内容推荐方法、装置、计算机设备及存储介质
CN112561084B (zh) 特征提取方法、装置、计算机设备及存储介质
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
CN112000264B (zh) 菜品信息展示方法、装置、计算机设备及存储介质
CN113269612A (zh) 物品推荐方法、装置、电子设备及存储介质
CN112766406A (zh) 物品图像的处理方法、装置、计算机设备及存储介质
CN112818080A (zh) 搜索方法、装置、设备及存储介质
CN114547430A (zh) 信息对象的标签标注方法、装置、设备及存储介质
CN113987326B (zh) 资源推荐方法、装置、计算机设备及介质
CN112765470B (zh) 内容推荐模型的训练方法、内容推荐方法、装置及设备
US20150248225A1 (en) Information interface generation
CN112070586B (zh) 基于语义识别的物品推荐方法、装置、计算机设备及介质
CN109635153B (zh) 迁移路径生成方法、装置及存储介质
CN113722422A (zh) 模型训练方法、文本标签生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination