CN113672816A - 帐号特征信息的生成方法、装置和存储介质及电子设备 - Google Patents
帐号特征信息的生成方法、装置和存储介质及电子设备 Download PDFInfo
- Publication number
- CN113672816A CN113672816A CN202111224118.9A CN202111224118A CN113672816A CN 113672816 A CN113672816 A CN 113672816A CN 202111224118 A CN202111224118 A CN 202111224118A CN 113672816 A CN113672816 A CN 113672816A
- Authority
- CN
- China
- Prior art keywords
- account
- service
- target
- information
- characteristic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种帐号特征信息的生成方法、装置和存储介质及电子设备。本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。其中,该方法包括:获取第一帐号所对应的第二帐号的目标帐号表征信息;从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号;从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。本发明解决了业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度较低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种帐号特征信息的生成方法、装置和存储介质及电子设备。
背景技术
随着互联网技术的发展和人们需求的增加,需要推出更多的业务来满足用户的需求,也有越来越多的业务被新推出出来。但是在业务推出的初期,由于还没有大量的用户来使用,或者由于用户使用的还不够多,就会导致业务无法准确刻画用户的帐号特征与用户兴趣之间的关系。这种情况很有可能导致业务由于无法满足用户的兴趣而无法长期运营下去。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种帐号特征信息的生成方法、装置和存储介质及电子设备,以至少解决业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度较低的技术问题。
根据本发明实施例的一个方面,提供了一种帐号特征信息的生成方法,包括:获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,所述第一帐号是在第一业务上注册的帐号,所述第二帐号是在第二业务上注册的帐号,所述第一帐号在所述第一业务上的帐号属性与所述第二帐号在所述第二业务上的帐号属性相匹配,所述目标帐号表征信息用于表征预测出的所述第二帐号对所述第一业务上的业务对象的兴趣度;从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足所述匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,所述目标帐号列表用于记录所述第一业务中具有帐号特征信息的帐号,所述帐号特征信息用于表征根据所述第一业务中的帐号在所述第一业务上的操作行为确定出的所述第一业务中的帐号对所述第一业务上的业务对象的兴趣度;从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息。
根据本发明实施例的另一方面,还提供了一种帐号特征信息的生成装置,包括:第一获取模块,用于获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,所述第一帐号是在第一业务上注册的帐号,所述第二帐号是在第二业务上注册的帐号,所述第一帐号在所述第一业务上的帐号属性与所述第二帐号在所述第二业务上的帐号属性相匹配,所述目标帐号表征信息用于表征预测出的所述第二帐号对所述第一业务上的业务对象的兴趣度;第二获取模块,用于从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足所述匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,所述目标帐号列表用于记录所述第一业务中具有帐号特征信息的帐号,所述帐号特征信息用于表征根据所述第一业务中的帐号在所述第一业务上的操作行为确定出的所述第一业务中的帐号对所述第一业务上的业务对象的兴趣度;第三获取模块,用于从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息。
可选的,所述第一获取模块,包括:第一获取单元,用于从所述第二业务上注册的帐号中获取帐号属性与所述第一帐号在所述第一业务上的帐号属性相匹配的帐号作为所述第二帐号;第二获取单元,用于从具有对应关系的帐号和帐号表征信息中获取所述第二帐号所对应的帐号表征信息作为所述目标帐号表征信息,其中,所述具有对应关系的帐号和帐号表征信息是根据所述第二业务上注册的帐号的帐号行为信息和所述第一业务上的业务对象的对象特征信息创建的,所述帐号行为信息用于指示所述第二业务上注册的帐号在所述第二业务上的操作行为,所述对象特征信息用于指示所述第一业务上的业务对象的属性特征。
可选的,所述装置还包括:第四获取模块,用于在所述从具有对应关系的帐号和帐号表征信息中获取所述第二帐号所对应的帐号表征信息作为所述目标帐号表征信息之前,获取样本数据集,其中,所述样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,所述兴趣度标识用于指示对应所述帐号行为样本的样本帐号在所述第一业务中对应的帐号对具有所述对象特征样本的业务对象是否感兴趣;训练模块,用于使用所述样本数据集训练初始预测模型,得到目标预测模型,其中,所述目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,所述目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,所述目标对象表示层用于将输入的对象特征信息转换为对象表征信息,所述目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度;处理模块,用于将所述第二业务上注册的帐号的帐号行为信息输入所述目标帐号表示层,得到所述目标帐号表示层输出的具有对应关系的帐号和帐号表征信息。
可选的,所述训练模块,包括:第一输入单元,用于将所述帐号行为样本输入初始帐号表示层,并将所述所述帐号行为样本对应的所述对象特征样本输入初始对象表示层;第二输入单元,用于将所述初始帐号表示层的输出信息与所述初始对象表示层的输出信息输入初始匹配层,其中,所述初始预测模型包括所述初始帐号表示层,所述初始对象表示层和所述初始匹配层;第一确定单元,用于确定所述初始匹配层输出的初始匹配度与所述帐号行为样本所标注的兴趣度标识之间的函数关系;调整单元,用于根据所述函数关系与所述初始预测模型对应的收敛条件调整所述初始预测模型的模型参数,直至所述函数关系满足所述收敛条件;第二确定单元,用于将所述函数关系满足所述收敛条件的模型参数确定为所述目标预测模型的模型参数,得到所述目标预测模型。
可选的,所述第四获取模块,包括:第三获取单元,用于从所述第二业务上注册的帐号中获取在所述第一业务上具有对应帐号的样本帐号,以及所述样本帐号对应的帐号行为样本;第四获取单元,用于从所述第一业务上获取所述样本帐号执行了目标操作的业务对象的对象特征样本,其中,所述目标操作包括以下至少之一:用于指示帐号对业务对象感兴趣的操作,用于指示帐号对业务对象不感兴趣的操作;标注单元,用于使用所述目标操作所对应的兴趣度标识对具有对应关系的帐号行为样本和对象特征样本进行标注,得到所述样本数据集。
可选的,所述第二获取模块,包括:第三确定单元,用于确定所述目标帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;第五获取单元,用于从所述目标帐号列表中获取对应的匹配度从高到低排列排在前K个的帐号作为所述至少一个参考帐号。
可选的,所述第三确定单元,用于:使用所述目标帐号列表中每个帐号对应的帐号表征信息对初始索引模型进行训练,得到目标索引模型,其中,所述目标索引模型用于计算输入的帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;将所述目标帐号表征信息输入所述目标索引模型,得到所述目标索引模型输出的所述目标帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度。
可选的,所述装置还包括:第五获取模块,用于在所述从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号之前,从所述第一业务上注册的帐号中获取在所述第二业务上具有对应帐号的候选帐号;第六获取模块,用于从所述候选帐号中获取在所述第一业务上的活跃度高于目标活跃度的帐号,得到所述目标帐号列表。
可选的,所述第三获取模块,包括:第六获取单元,用于获取至少一个所述参考帐号中每个参考帐号的画像标签列表,得到画像标签集合,其中,每个参考帐号所对应的帐号特征信息包括每个参考帐号的画像标签列表;第四确定单元,用于确定所述画像标签集合中每个画像标签对应的标签质量;第七获取单元,用于从所述画像标签集合中获取所对应的标签质量从高到低排列排在前T个的画像标签作为所述目标特征信息。
可选的,所述第四确定单元,用于:获取所述每个画像标签在所述第一业务中所对应的业务对象的优质率以及所述每个画像标签在至少一个所述参考帐号中每个参考帐号的画像标签列表中出现的次数;对所述优质率与所述次数进行加权运算,得到所述每个画像标签对应的标签质量。
可选的,所述装置还包括:第七获取模块,用于在所述从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息之后,获取所述第一帐号在所述第一业务上触发的推送请求;第八获取模块,用于响应所述推送请求,从所述第一业务上的业务对象中获取与所述目标特征信息匹配的目标业务对象;推送模块,用于在所述第一业务上向所述第一帐号推送所述目标业务对象。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述帐号特征信息的生成方法。
根据本申请实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上帐号特征信息的生成方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的帐号特征信息的生成方法。
在本发明实施例中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,为了为第一帐号生成帐号特征信息,可以首先获取在第二业务上帐号属性与其相匹配的第二帐号的目标帐号表征信息,该目标帐号表征信息表征了预测出的第二帐号对第一业务上的业务对象的兴趣度,再通过帐号表征信息之间的匹配度来从第一业务中具有帐号特征信息的帐号中获取与第一帐号的相似帐号,获取出的相似帐号所具有的帐号特征信息能够表征出该帐号对第一业务上的业务对象的兴趣度,从这些相似帐号所具有的帐号特征信息中获取的目标特征信息也就能够较准确的表示出第一帐号可能对第一业务上的业务对象的兴趣所在,进而达到了准确捕捉用户兴趣的目的,从而实现了提高业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度的技术效果,进而解决了业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的帐号特征信息的生成方法的示意图;
图2是根据本发明实施例的一种可选的帐号特征信息的生成方法的业务环境的示意图;
图3是根据本发明实施例的一种可选的帐号特征信息的生成方法的流程的示意图;
图4是根据本发明实施例的另一种可选的帐号特征信息的生成方法的示意图一;
图5是根据本发明实施例的另一种可选的帐号特征信息的生成方法的示意图二;
图6是根据本发明实施例的另一种可选的帐号特征信息的生成方法的示意图三;
图7是根据本发明实施例的另一种可选的帐号特征信息的生成方法的示意图四;
图8是根据本发明实施例的另一种可选的帐号特征信息的生成方法的示意图五;
图9是根据本发明实施例的一种可选的帐号特征信息的生成装置的示意图;
图10是根据本发明实施例的一种可选的电子设备的结构示意图;
图11是根据本发明实施例的一种可选的电子设备的计算机系统的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在互联网公司内,常常存在很多个产品线。不同的产品覆盖的用户数以及积累的用户行为日志信息均不一样,根据这些区别可以区分出两类产品:一类可以称之为成熟产品/场景,这类产品的覆盖用户量大,几乎每个人都在用,如某些即时通信应用,月度活跃用户数超10亿。另一类可以称之为成长期产品/场景,或者,新产品/场景,其覆盖用户量较上一类产品差距极大。在成长期产品/场景,或者,新产品/场景中,产品对用户兴趣的捕获是吸引用户,挽留用户的重要因素。产品的诉求是希望将成熟产品/场景的老用户变成成长期产品/场景,或者,新产品/场景的新用户,如图1所示,较大的环形区域中表示成熟产品/场景的用户,较小的环形区域中表示成长期产品/场景,或者,新产品/场景的用户,二者有部分的交集,只有极少部分的用户只使用成长期产品/场景,或者,新产品/场景。对于成长期产品/场景,或者,新产品/场景来说,只使用成熟产品/场景的用户都算是其潜在的新用户,可以通过预测这部分用户对成长期产品/场景,或者,新产品/场景上提供的服务对象的兴趣来吸引这部分用户对成长期产品/场景,或者,新产品/场景的长期使用。
需要说明的是,本发明实施例中所有用户数据以及帐号数据的使用均获得了用户的授权。
根据本发明实施例的一个方面,提供了一种帐号特征信息的生成方法,可选地,作为一种可选的实施方式,上述帐号特征信息的生成方法可以但不限于业务于如图2所示的环境中。其中,可以但不限于包括用户设备202、网络210及服务器212,其中,该用户设备202上可以但不限于包括显示器208、处理器206及存储器204。
具体过程可如下步骤:步骤S202,用户设备202通过显示器208中安装的可识别到触碰操作的感应器,获取目标触控屏上产生的在第一业务上注册帐号的操作;S204-S206,用户设备202通过网络210在服务器212上注册第一帐号;S208-S212,服务器212通过数据库214获取第一帐号所对应的第二业务上的第二帐号的目标帐号表征信息以及目标帐号列表,并通过处理引擎216从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,再从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息;步骤S214,第一帐号在用户设备202上触发推送请求;步骤S216-S218,用户设备202通过网络210向服务器212发送推送请求;步骤S220,服务器212响应推送请求,从第一业务上的业务对象中获取与目标特征信息匹配的目标业务对象。步骤S222-S224,服务器212通过网络210将目标业务对象发送给用户设备202;步骤S226,用户设备202中的处理器206将目标业务对象显示在显示器208中。
除图2示出的示例之外,上述步骤可以由用户设备202独立完成,即由用户设备202执行图像的处理、采集姿态正常或异常的判断等步骤,从而减轻服务器的处理压力。该用户设备202包括但不限于手持设备(如手机)、笔记本电脑、台式电脑、车载设备等,本发明并不限制用户设备202的具体实现方式。
可选地,作为一种可选的实施方式,如图3所示,上述帐号特征信息的生成方法包括:
S302,获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度;
S304,从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,目标帐号列表用于记录第一业务中具有帐号特征信息的帐号,帐号特征信息用于表征根据第一业务中的帐号在第一业务上的操作行为确定出的第一业务中的帐号对第一业务上的业务对象的兴趣度;
S306,从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。
可选地,在本实施例中,上述帐号特征信息的生成方法可以但不限于应用于利用一个业务中的帐号的帐号信息和另一个应用中业务对象的信息来为另一个应用中的帐号生成帐号特征信息的场景中。比如:利用即时通信应用中帐号的帐号信息和短视频应用中短视频信息为短视频应用中的帐号生成帐号画像标签的场景,或者,利用游戏应用中游戏帐号的帐号信息和购物应用中的商品信息为购物应用中的帐号生成帐号画像标签的场景等等。
通过本申请提供的实施例,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,为了为第一帐号生成帐号特征信息,可以首先获取在第二业务上帐号属性与其相匹配的第二帐号的目标帐号表征信息,该目标帐号表征信息表征了预测出的第二帐号对第一业务上的业务对象的兴趣度,再通过帐号表征信息之间的匹配度来从第一业务中具有帐号特征信息的帐号中获取与第一帐号的相似帐号,获取出的相似帐号所具有的帐号特征信息能够表征出该帐号对第一业务上的业务对象的兴趣度,从这些相似帐号所具有的帐号特征信息中获取的目标特征信息也就能够较准确的表示出第一帐号可能对第一业务上的业务对象的兴趣所在,进而达到了准确捕捉用户兴趣的目的,从而实现了提高业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度的技术效果,进而解决了业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度较低的技术问题。
可选地,在本实施例中,业务可以但不限于指互联网上以任何形式任何维度提供的服务,可以但不限于指研发的产品,上线的应用,应用中的场景等等。比如:一个游戏项目可以有多个不同的产品线的研发,游戏应用,游戏周边,活动策划等等。在游戏应用中又可以存在多种多样的场景,比如:游戏对战场景,游戏排行榜场景,游戏聊天场景等等。上述每一个元素都可以称为一个业务,可以但不限于采用上述过程为业务中的帐号生成帐号特征信息来表示业务中的帐号与业务中提供的业务对象之间的兴趣关系。
可选地,在本实施例中,用户可以但不限于通过用户终端在业务上注册帐号。用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
在上述步骤S302提供的技术方案中,上述第一业务可以但不限于是任何具有为注册帐号生成帐号特征信息需求的业务,对于这样的需求来说,第一业务可以但不限于包括上述成长期产品/场景,或者,新产品/场景,比如:新上线的游戏应用,上线不久的短视频应用,游戏项目中新推出的游戏周边产品等等。上述第一业务还可以但不限于是任何具有需要吸引其他业务上的注册用户来使用的需求的业务,对于这样的需求来说,第一业务可以但不限于包括上述成长期产品/场景,或者,新产品/场景,或者,成熟产品/场景等等。比如:需要吸引游戏应用上用户的游戏周边产品,需要吸引即时通信应用上用户的短视频应用等等。
可选地,在本实施例中,上述第二业务可以但不限于是任何用户覆盖率达到一定规模的业务,比如:几乎人人都在使用的即时通信应用,玩家遍布全球的游戏应用等等。上述第二业务还可以但不限于是任何覆盖了第一业务的目标人群的业务,比如:覆盖了游戏周边产品所期望的目标人群的游戏应用,覆盖了短视频平台所指向的目标人群的即时通信应用等等。
可选地,在本实施例中,第一业务和第二业务可以但不限于是在相同的维度上的业务,比如:第一业务是应用,第二业务也是应用,第一业务是产品,第二业务也是产品等等。第一业务和第二业务也可以但不限于是在不同的维度上的业务,比如:第一业务是应用,第二业务可以是产品或者场景,第一业务是产品,第二业务可以是应用或者场景,第一业务是场景,第二业务可以是应用或者产品等等。本实施例对此不作限定。
可选地,在本实施例中,第一帐号可以是在第一业务上注册的任何帐号,比如:其可以是第一业务上新注册的帐号,这种帐号可以看作是处于用户冷启阶段的帐号,处于这种状态下的帐号一般都是用户使用产品初期,用户日志信息积累较少,用户兴趣往往难以刻画,可以借助该用户或者类似用户在其他业务上丰富的用户信息来刻画这类用户在第一业务上的帐号的用户画像。
可选地,在本实施例中,第一帐号还可以是已经使用了一段时间第一业务的帐号,通过这一段时间的使用,可能并没有刻画出较好的用户画像,为了避免用户的流失,可以借助该用户在其他业务上的帐号的信息来协助刻画其在第一应用上的用户画像。或者,也有可能希望该用户在第一应用上的粘性更强,可以借助该用户在其他业务上的帐号的信息来协助刻画出更好的用户画像。
可选地,在本实施例中,第二帐号是在第二业务上注册的帐号,并且第一帐号与第二帐号之间的对应关系可以是指第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配。两个帐号的帐号属性相匹配可以但不限于是指两个帐号的帐号属性完全相同,这种情况下可以认为两个帐号是同一个用户。两个帐号的帐号属性相匹配可以但不限于是指两个帐号的帐号属性相似度较高(相似度高于某个设定阈值),这种情况下可以认为两个帐号分别属于两个相似的用户,这两个相似的用户可能会有相似的兴趣爱好。
可选地,在本实施例中,帐号属性可以但不限于指帐号的基本信息,比如:在帐号注册时或者帐号使用时补充的帐号资料等信息,可以但不限于包括:用户名,身份证号,手机号,性别,年龄,出生日期,收货地址等等。
可选地,在本实施例中,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度。目标帐号表征信息可以但不限于是根据第二帐号在第二应用上的操作,行为等信息以及第一业务上的业务对象的信息构造的。目标帐号表征信息的表达形式不一定是一系列的兴趣度值,其可以是通过向量,矩阵,知识图谱等各种形式来体现出第二帐号对第一业务上的业务对象的兴趣度。
可选地,在本实施例中,第一业务上的业务对象可以但不限于包括任何在第一业务上提供的业务服务,比如:对于短视频应用来说,业务对象可以是短视频,直播间,带货商品等等。对于多媒体应用来说,业务对象可以是影视综艺剧集,用户上传视频,电子书,小游戏等等。对于购物应用来说,业务对象可以但不限于包括售卖的实体商品,虚拟商品,带货直播间等等。
作为一种可选的方案,获取第一帐号所对应的第二帐号的目标帐号表征信息,包括:
S11,从第二业务上注册的帐号中获取帐号属性与第一帐号在第一业务上的帐号属性相匹配的帐号作为第二帐号;
S12,从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息,其中,具有对应关系的帐号和帐号表征信息是根据第二业务上注册的帐号的帐号行为信息和第一业务上的业务对象的对象特征信息创建的,帐号行为信息用于指示第二业务上注册的帐号在第二业务上的操作行为,对象特征信息用于指示第一业务上的业务对象的属性特征。
可选地,在本实施例中,获取第二帐号的方式可以但不限于包括比对帐号属性中的关键属性(比如:姓名,身份证号,手机号等等)来找到在第二业务中与第一帐号属于同一个用户的第二帐号。或者,也可以通过计算帐号属性之间相似度的方式来找到使用第一帐号的用户的相似用户,将其在第二业务上的帐号作为第二帐号。
可选地,在本实施例中,具有对应关系的帐号和帐号表征信息可以但不限于是根据第二业务上注册的帐号的帐号行为信息和第一业务上的业务对象的对象特征信息创建的。创建的方式可以但不限于使用算法程序来计算,或者也可以预先训练AI模型,再通过训练后的AI模型来自动生成。
可选地,在本实施例中,帐号行为信息可以但不限于用于指示第二业务上注册的帐号在第二业务上的操作行为,第二业务上注册的帐号的帐号行为信息可以但不限于包括帐号行为日志,帐号操作日志,帐号历史使用记录等等。
可选地,在本实施例中,对象特征信息可以但不限于用于指示第一业务上的业务对象的属性特征。对象特征信息的表达形式可以但不限于是业务对象本身,业务对象的描述信息,业务对象上提取的特征等等。
作为一种可选的方案,在从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息之前,还包括:
S21,获取样本数据集,其中,样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,兴趣度标识用于指示对应帐号行为样本的样本帐号在第一业务中对应的帐号对具有对象特征样本的业务对象是否感兴趣;
S22,使用样本数据集训练初始预测模型,得到目标预测模型,其中,目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,目标对象表示层用于将输入的对象特征信息转换为对象表征信息,目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度;
S23,将第二业务上注册的帐号的帐号行为信息输入目标帐号表示层,得到目标帐号表示层输出的具有对应关系的帐号和帐号表征信息。
第一业务和第二业务很可能属于两个公司或者同一公司的两个部门。两个公司或者公司间的部门不会提供各自数据给对方,导致了现在大量存在的数据孤岛,以及隐私保护问题,这种情况下就可以采用联邦学习的方式来解决合作的问题。联邦学习本质上是一种分布式机器学习技术,或机器学习框架。其目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升AI模型的效果。
可选地,在本实施例中,在上述步骤S12之前,可以但不限于通过上述模型训练的方式来创建具有对应关系的帐号和帐号表征信息。上述初始预测模型可以但不限于采用联邦学习(Federated Learning)的模型架构,比如:DSSM模型(Deep Structured SemanticModels,深度结构语义模型),或称为双塔模型。
可选地,在本实施例中,目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,目标对象表示层用于将输入的对象特征信息转换为对象表征信息,目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度。帐号的帐号表征信息可以是目标帐号表示层的输出。
可选地,在本实施例中,输入到目标帐号表示层的第二业务上注册的帐号的帐号行为信息可以但不限于是第二业务上注册的全量帐号的帐号行为信息,也可以但不限于是第二业务上注册的部分帐号的帐号行为信息。比如:利用训练后的DSSM,成熟产品侧可以将全量User(全量帐号)以及相应的特征(即帐号行为信息)输入给DSSM的User塔(即目标帐号表示层),经过表示层的转换,就得到全量User的embedding表示(即具有对应关系的帐号和帐号表征信息),以此提供给成长期产品,或者,新产品/场景侧。
可选地,在本实施例中,样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,上述兴趣度标识用于指示对应帐号行为样本的样本帐号在第一业务中对应的帐号对具有对象特征样本的业务对象是否感兴趣。可以使用某个固定标识来指示感兴趣,使用另一个固定标识来指示不感兴趣。比如:1表示感兴趣,0表示不感兴趣。
可选地,在本实施例中,样本数据集可以但不限于是正样本数据集(即仅包括标识为感兴趣的样本),也可以是负样本数据集(即仅包括标识为不感兴趣的样本),还可以是正负样本数据集(既包括标识为感兴趣的样本,又包括标识为不感兴趣的样本)。
作为一种可选的方案,使用样本数据集训练初始预测模型,得到目标预测模型,包括:
S31,将帐号行为样本输入初始帐号表示层,并将帐号行为样本对应的对象特征样本输入初始对象表示层;
S32,将初始帐号表示层的输出信息与初始对象表示层的输出信息输入初始匹配层,其中,初始预测模型包括初始帐号表示层,初始对象表示层和初始匹配层;
S33,确定初始匹配层输出的初始匹配度与帐号行为样本所标注的兴趣度标识之间的函数关系;
S34,根据函数关系与初始预测模型对应的收敛条件调整初始预测模型的模型参数,直至函数关系满足收敛条件;
S35,将函数关系满足收敛条件的模型参数确定为目标预测模型的模型参数,得到目标预测模型。
可选地,在本实施例中,在上述模型中,第一业务和第二业务间不必进行数据的交互,可以各自分别利用双塔模型中的双塔(即帐号表示层和对象表示层)来构建帐号表征信息和对象表征信息。或者说,上述步骤S31可以但不限于是由第一业务侧和第二业务侧分别执行的。
可选地,在本实施例中,上述初始帐号表示层和初始对象表示层可以但不限于采用以下之一的网络结构:多层感知机、卷积神经网络(Convolutional Neural Network,简称为CNN)、循环神经网络(Recurrent Neural Network,简称为RNN)、Transformer等。
可选地,在本实施例中,上述初始帐号表示层和初始对象表示层中还可以但不限于分别包括一个输入层,用来接收帐号行为样本或者对象特征样本。
可选地,在本实施例中,确定所述初始匹配层输出的初始匹配度与所述帐号行为样本所标注的兴趣度标识之间的函数关系的方式可以但不限于通过预设的损失函数来实现。比如:cross-entropy loss函数等等。
在一个可选的实施方式中,提供了一个对DSSM模型进行训练的过程。如图4所示,双塔模型DSSM可以分为User塔和Item塔。得益于成熟产品侧丰富的用户积累,利用联邦学习技术,在双塔模型的User侧使用成熟产品侧的用户特征(即帐号行为样本)作为User塔的输入层。为了反映用户在成长期产品,或者,新产品/场景侧的兴趣爱好,在Item侧使用成长期产品,或者,新产品/场景侧的物品特征(即对象特征样本)作为Item塔的输入层。User侧和Item侧的特征可以但不限于由各开发人员根据具体业务场景理解来构建,可以以是否能够表征User和Item的信息为依据。表示层(即初始帐号表示层和初始对象表示层)为特征加工层,可以是多层感知机、卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN将目标业务对象显示在显示器208中。
除图2示出的示例之外,上述步骤可以由用户设备202独立完成,即由用户设备202执行图像的处理、采集姿态正常或异常的判断等步骤,从而减轻服务器的处理压力。该用户设备202包括但不限于手持设备(如手机)、笔记本电脑、台式电脑、车载设备等,本发明并不限制用户设备202的具体实现方式。
可选地,作为一种可选的实施方式,如图3所示,上述帐号特征信息的生成方法包括:
S302,获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度;
S304,从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,目标帐号列表用于记录第一业务中具有帐号特征信息的帐号,帐号特征信息用于表征根据第一业务中的帐号在第一业务上的操作行为确定出的第一业务中的帐号对第一业务上的业务对象的兴趣度;
S306,从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。
可选地,在本实施例中,上述帐号特征信息的生成方法可以但不限于应用于利用一个业务中的帐号的帐号信息和另一个应用中业务对象的信息来为另一个应用中的帐号生成帐号特征信息的场景中。比如:利用即时通信应用中帐号的帐号信息和短视频应用中短视频信息为短视频应用中的帐号生成帐号画像标签的场景,或者,利用游戏应用中游戏帐号的帐号信息和购物应用中的商品信息为购物应用中的帐号生成帐号画像标签的场景等等。
通过本申请提供的实施例,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,为了为第一帐号生成帐号特征信息,可以首先获取在第二业务上帐号属性与其相匹配的第二帐号的目标帐号表征信息,该目标帐号表征信息表征了预测出的第二帐号对第一业务上的业务对象的兴趣度,再通过帐号表征信息之间的匹配度来从第一业务中具有帐号特征信息的帐号中获取与第一帐号的相似帐号,获取出的相似帐号所具有的帐号特征信息能够表征出该帐号对第一业务上的业务对象的兴趣度,从这些相似帐号所具有的帐号特征信息中获取的目标特征信息也就能够较准确的表示出第一帐号可能对第一业务上的业务对象的兴趣所在,进而达到了准确捕捉用户兴趣的目的,从而实现了提高业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度的技术效果,进而解决了业务中用户帐号对应的帐号特征信息与用户兴趣之间的匹配度较低的技术问题。
可选地,在本实施例中,业务可以但不限于指互联网上以任何形式任何维度提供的服务,可以但不限于指研发的产品,上线的应用,应用中的场景等等。比如:一个游戏项目可以有多个不同的产品线的研发,游戏应用,游戏周边,活动策划等等。在游戏应用中又可以存在多种多样的场景,比如:游戏对战场景,游戏排行榜场景,游戏聊天场景等等。上述每一个元素都可以称为一个业务,可以但不限于采用上述过程为业务中的帐号生成帐号特征信息来表示业务中的帐号与业务中提供的业务对象之间的兴趣关系。
可选地,在本实施例中,用户可以但不限于通过用户终端在业务上注册帐号。用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
在上述步骤S302提供的技术方案中,上述第一业务可以但不限于是任何具有为注册帐号生成帐号特征信息需求的业务,对于这样的需求来说,第一业务可以但不限于包括上述成长期产品/场景,或者,新产品/场景,比如:新上线的游戏应用,上线不久的短视频应用,游戏项目中新推出的游戏周边产品等等。上述第一业务还可以但不限于是任何具有需要吸引其他业务上的注册用户来使用的需求的业务,对于这样的需求来说,第一业务可以但不限于包括上述成长期产品/场景,或者,新产品/场景,或者,成熟产品/场景等等。比如:需要吸引游戏应用上用户的游戏周边产品,需要吸引即时通信应用上用户的短视频应用等等。
可选地,在本实施例中,上述第二业务可以但不限于是任何用户覆盖率达到一定规模的业务,比如:几乎人人都在使用的即时通信应用,玩家遍布全球的游戏应用等等。上述第二业务还可以但不限于是任何覆盖了第一业务的目标人群的业务,比如:覆盖了游戏周边产品所期望的目标人群的游戏应用,覆盖了短视频平台所指向的目标人群的即时通信应用等等。
可选地,在本实施例中,第一业务和第二业务可以但不限于是在相同的维度上的业务,比如:第一业务是应用,第二业务也是应用,第一业务是产品,第二业务也是产品等等。第一业务和第二业务也可以但不限于是在不同的维度上的业务,比如:第一业务是应用,第二业务可以是产品或者场景,第一业务是产品,第二业务可以是应用或者场景,第一业务是场景,第二业务可以是应用或者产品等等。本实施例对此不作限定。
可选地,在本实施例中,第一帐号可以是在第一业务上注册的任何帐号,比如:其可以是第一业务上新注册的帐号,这种帐号可以看作是处于用户冷启阶段的帐号,处于这种状态下的帐号一般都是用户使用产品初期,用户日志信息积累较少,用户兴趣往往难以刻画,可以借助该用户或者类似用户在其他业务上丰富的用户信息来刻画这类用户在第一业务上的帐号的用户画像。
可选地,在本实施例中,第一帐号还可以是已经使用了一段时间第一业务的帐号,通过这一段时间的使用,可能并没有刻画出较好的用户画像,为了避免用户的流失,可以借助该用户在其他业务上的帐号的信息来协助刻画其在第一应用上的用户画像。或者,也有可能希望该用户在第一应用上的粘性更强,可以借助该用户在其他业务上的帐号的信息来协助刻画出更好的用户画像。
可选地,在本实施例中,第二帐号是在第二业务上注册的帐号,并且第一帐号与第二帐号之间的对应关系可以是指第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配。两个帐号的帐号属性相匹配可以但不限于是指两个帐号的帐号属性完全相同,这种情况下可以认为两个帐号是同一个用户。两个帐号的帐号属性相匹配可以但不限于是指两个帐号的帐号属性相似度较高(相似度高于某个设定阈值),这种情况下可以认为两个帐号分别属于两个相似的用户,这两个相似的用户可能会有相似的兴趣爱好。
可选地,在本实施例中,帐号属性可以但不限于指帐号的基本信息,比如:在帐号注册时或者帐号使用时补充的帐号资料等信息,可以但不限于包括:用户名,身份证号,手机号,性别,年龄,出生日期,收货地址等等。
可选地,在本实施例中,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度。目标帐号表征信息可以但不限于是根据第二帐号在第二应用上的操作,行为等信息以及第一业务上的业务对象的信息构造的。目标帐号表征信息的表达形式不一定是一系列的兴趣度值,其可以是通过向量,矩阵,知识图谱等各种形式来体现出第二帐号对第一业务上的业务对象的兴趣度。
可选地,在本实施例中,第一业务上的业务对象可以但不限于包括任何在第一业务上提供的业务服务,比如:对于短视频应用来说,业务对象可以是短视频,直播间,带货商品等等。对于多媒体应用来说,业务对象可以是影视综艺剧集,用户上传视频,电子书,小游戏等等。对于购物应用来说,业务对象可以但不限于包括售卖的实体商品,虚拟商品,带货直播间等等。
作为一种可选的方案,获取第一帐号所对应的第二帐号的目标帐号表征信息,包括:
S11,从第二业务上注册的帐号中获取帐号属性与第一帐号在第一业务上的帐号属性相匹配的帐号作为第二帐号;
S12,从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息,其中,具有对应关系的帐号和帐号表征信息是根据第二业务上注册的帐号的帐号行为信息和第一业务上的业务对象的对象特征信息创建的,帐号行为信息用于指示第二业务上注册的帐号在第二业务上的操作行为,对象特征信息用于指示第一业务上的业务对象的属性特征。
可选地,在本实施例中,获取第二帐号的方式可以但不限于包括比对帐号属性中的关键属性(比如:姓名,身份证号,手机号等等)来找到在第二业务中与第一帐号属于同一个用户的第二帐号。或者,也可以通过计算帐号属性之间相似度的方式来找到使用第一帐号的用户的相似用户,将其在第二业务上的帐号作为第二帐号。
可选地,在本实施例中,具有对应关系的帐号和帐号表征信息可以但不限于是根据第二业务上注册的帐号的帐号行为信息和第一业务上的业务对象的对象特征信息创建的。创建的方式可以但不限于使用算法程序来计算,或者也可以预先训练AI模型,再通过训练后的AI模型来自动生成。
可选地,在本实施例中,帐号行为信息可以但不限于用于指示第二业务上注册的帐号在第二业务上的操作行为,第二业务上注册的帐号的帐号行为信息可以但不限于包括帐号行为日志,帐号操作日志,帐号历史使用记录等等。
可选地,在本实施例中,对象特征信息可以但不限于用于指示第一业务上的业务对象的属性特征。对象特征信息的表达形式可以但不限于是业务对象本身,业务对象的描述信息,业务对象上提取的特征等等。
作为一种可选的方案,在从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息之前,还包括:
S21,获取样本数据集,其中,样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,兴趣度标识用于指示对应帐号行为样本的样本帐号在第一业务中对应的帐号对具有对象特征样本的业务对象是否感兴趣;
S22,使用样本数据集训练初始预测模型,得到目标预测模型,其中,目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,目标对象表示层用于将输入的对象特征信息转换为对象表征信息,目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度;
S23,将第二业务上注册的帐号的帐号行为信息输入目标帐号表示层,得到目标帐号表示层输出的具有对应关系的帐号和帐号表征信息。
第一业务和第二业务很可能属于两个公司或者同一公司的两个部门。两个公司或者公司间的部门不会提供各自数据给对方,导致了现在大量存在的数据孤岛,以及隐私保护问题,这种情况下就可以采用联邦学习的方式来解决合作的问题。联邦学习本质上是一种分布式机器学习技术,或机器学习框架。其目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升AI模型的效果。
可选地,在本实施例中,在上述步骤S12之前,可以但不限于通过上述模型训练的方式来创建具有对应关系的帐号和帐号表征信息。上述初始预测模型可以但不限于采用联邦学习(Federated Learning)的模型架构,比如:DSSM模型(Deep Structured SemanticModels,深度结构语义模型),或称为双塔模型。
可选地,在本实施例中,目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,目标对象表示层用于将输入的对象特征信息转换为对象表征信息,目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度。帐号的帐号表征信息可以是目标帐号表示层的输出。
可选地,在本实施例中,输入到目标帐号表示层的第二业务上注册的帐号的帐号行为信息可以但不限于是第二业务上注册的全量帐号的帐号行为信息,也可以但不限于是第二业务上注册的部分帐号的帐号行为信息。比如:利用训练后的DSSM,成熟产品侧可以将全量User(全量帐号)以及相应的特征(即帐号行为信息)输入给DSSM的User塔(即目标帐号表示层),经过表示层的转换,就得到全量User的embedding表示(即具有对应关系的帐号和帐号表征信息),以此提供给成长期产品,或者,新产品/场景侧。
可选地,在本实施例中,样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,上述兴趣度标识用于指示对应帐号行为样本的样本帐号在第一业务中对应的帐号对具有对象特征样本的业务对象是否感兴趣。可以使用某个固定标识来指示感兴趣,使用另一个固定标识来指示不感兴趣。比如:1表示感兴趣,0表示不感兴趣。
可选地,在本实施例中,样本数据集可以但不限于是正样本数据集(即仅包括标识为感兴趣的样本),也可以是负样本数据集(即仅包括标识为不感兴趣的样本),还可以是正负样本数据集(既包括标识为感兴趣的样本,又包括标识为不感兴趣的样本)。
作为一种可选的方案,使用样本数据集训练初始预测模型,得到目标预测模型,包括:
S31,将帐号行为样本输入初始帐号表示层,并将帐号行为样本对应的对象特征样本输入初始对象表示层;
S32,将初始帐号表示层的输出信息与初始对象表示层的输出信息输入初始匹配层,其中,初始预测模型包括初始帐号表示层,初始对象表示层和初始匹配层;
S33,确定初始匹配层输出的初始匹配度与帐号行为样本所标注的兴趣度标识之间的函数关系;
S34,根据函数关系与初始预测模型对应的收敛条件调整初始预测模型的模型参数,直至函数关系满足收敛条件;
S35,将函数关系满足收敛条件的模型参数确定为目标预测模型的模型参数,得到目标预测模型。
可选地,在本实施例中,在上述模型中,第一业务和第二业务间不必进行数据的交互,可以各自分别利用双塔模型中的双塔(即帐号表示层和对象表示层)来构建帐号表征信息和对象表征信息。或者说,上述步骤S31可以但不限于是由第一业务侧和第二业务侧分别执行的。
可选地,在本实施例中,上述初始帐号表示层和初始对象表示层可以但不限于采用以下之一的网络结构:多层感知机、卷积神经网络(Convolutional Neural Network,简称为CNN)、循环神经网络(Recurrent Neural Network,简称为RNN)、Transformer等。
可选地,在本实施例中,上述初始帐号表示层和初始对象表示层中还可以但不限于分别包括一个输入层,用来接收帐号行为样本或者对象特征样本。
可选地,在本实施例中,确定所述初始匹配层输出的初始匹配度与所述帐号行为样本所标注的兴趣度标识之间的函数关系的方式可以但不限于通过预设的损失函数来实现。比如:cross-entropy loss函数等等。
在一个可选的实施方式中,提供了一个对DSSM模型进行训练的过程。如图4所示,双塔模型DSSM可以分为User塔和Item塔。得益于成熟产品侧丰富的用户积累,利用联邦学习技术,在双塔模型的User侧使用成熟产品侧的用户特征(即帐号行为样本)作为User塔的输入层。为了反映用户在成长期产品,或者,新产品/场景侧的兴趣爱好,在Item侧使用成长期产品,或者,新产品/场景侧的物品特征(即对象特征样本)作为Item塔的输入层。User侧和Item侧的特征可以但不限于由各开发人员根据具体业务场景理解来构建,可以以是否能够表征User和Item的信息为依据。表示层(即初始帐号表示层和初始对象表示层)为特征加工层,可以是多层感知机、卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN
可选地,在本实施例中,画像标签(TAG)可以是用于描述用户兴趣的词语等等。画像标签可以但不限于是帐号特征信息的一种表现形式。
可选地,在本实施例中,通过标签质量的参数可以但不限于表达出用户是否会对标签产生兴趣等信息。
可选地,在本实施例中,T可以但不限于为大于或者等于1的整数。比如:20个,50个,77个等等。
作为一种可选的方案,确定画像标签集合中每个画像标签对应的标签质量,包括:
S91,获取每个画像标签在第一业务中所对应的业务对象的优质率以及每个画像标签在至少一个参考帐号中每个参考帐号的画像标签列表中出现的次数;
S92,对优质率与次数进行加权运算,得到每个画像标签对应的标签质量。
可选地,在本实施例中,确定标签质量的方式可以但不限于根据业务需求来确定相应策略。比如:标签质量可以但不限于是根据每个TAG对应的Item的优质率,以及TAG在K个老用户中出现的次数等等数据计算的。
可选地,在本实施例中,加权运算可以但不限于包括加权和,加权平均等运算方式。
可选地,在本实施例中,利用成长期产品,或者,新产品/场景积累的老用户TAG表,将上一步K个老用户的TAG提取出来,并制定策略,从这K个老用户的TAG中,提取优质的T(如20)个TAG作为新用户TAG。具体的策略可以视具体场景而定,比如:根据每个TAG对应的Item的优质率,以及TAG在K个老用户中出现的次数做加权排序处理,取TOP T作为新用户TAG。
在一个可选的实施方式中,提供了一个可选的为成长期产品,或者,新产品/场景中的新用户生成画像标签的过程,在成长期产品或新产品/场景中,累计用户数量较少,导致存在大量的潜力新用户。这些潜力新用户在使用该产品时,由于在历史上未积累下行为,导致平台很难刻画其兴趣爱好。而在一些累计用户量大的产品中,用户在该用户量大的产品上积累了丰富的行为日志。基于这些有用信息,如图5所示,整个生成画像标签的过程可以分为以下六个部分:部分(1),利用联邦学习训练双塔模型DSSM,其中成熟产品侧提供用户侧特征(即上述帐号行为信息),成长期产品或新产品/场景侧提供Item侧特征(即上述对象特征信息)。训练用户样本为两者共有老用户(用设备id标识)。部分(2),利用训练后的DSSM,成熟产品侧提供全量帐号,通过训练后的DSSM生成全量帐号的User embedding给成长期产品或新产品/场景侧。部分(3),成长期产品或新产品/场景侧制定策略,筛选出优质老用户,作为种子老用户。部分(4),成长期产品或新产品/场景侧基于种子老用户在全量帐号的User embedding中对应的User embedding,训练Facebook AI Similarity Search(Faiss)模型,得到Faiss Index。部分(5),针对每一个新用户,利用训练后的Faiss Index,将新用户在全量帐号的User embedding中对应的User embedding输入到训练后的FaissIndex中,得到与新用户最相近的K个老用户。部分(6),利用成长期产品或新产品/场景积累的老用户TAG表,将上一步K个老用户的TAG提取出来,并制定策略,从这K个老用户的TAG中,提取优质的T个TAG作为新用户TAG。
作为一种可选的方案,在从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息之后,还包括:
S101,获取第一帐号在第一业务上触发的推送请求;
S102,响应推送请求,从第一业务上的业务对象中获取与目标特征信息匹配的目标业务对象;
S103,在第一业务上向第一帐号推送目标业务对象。
可选地,在本实施例中,第一帐号的目标帐号信息可以用于为第一帐号推送业务对象。生成的帐号特征信息可用于推荐场景的新用户画像召回,通过生成的画像对新用户兴趣的精准刻画,召回其喜欢的物品(如在短视频推荐场景,通过用户画像,召回用户最喜欢的视频类型给用户)等等。
可选地,在本实施例中,通过前端与后端的交互来实现业务对象的推荐,如图6所示,前端接收到新用户的画像请求,后台通过上述过程对新用户进行画像召回,得到其对应的目标特征信息,然后根据得到的目标特征信息对第一业务中提供的物品进行召回,并返回召回的物品结果到前端。
图7示意性地示出了本申请实施例中帐号特征信息的生成过程在一应用场景中的原理示意图。如图7所示,在第一业务的后端发现新注册的第一帐号,则可以获取到其在第二业务上对应的第二帐号的目标帐号表征信息,将该目标帐号表征信息与目标帐号列表中帐号的帐号表征信息进行匹配,得到匹配度满足匹配度条件的至少一个参考帐号,从至少一个参考帐号的帐号特征信息中筛选出目标特征信息作为第一帐号的帐号特征信息。在第一业务的前端,使用第一帐号登录的用户通过下滑页面的操作希望刷新第一业务的显示页面,在第一业务的后端相当于接收到了第一帐号发送的推送请求,响应该推送请求,使用生成的第一帐号的帐号特征信息为第一帐号匹配目标业务对象,并将目标业务对象返回给前端,前端将目标业务对象显示在刷新后的第一业务的显示页面上。
通过上述过程,利用用户在成熟产品/场景上留下的行为日志信息,帮助其在成长期产品/场景,或者,新产品/场景构建兴趣画像。使用联邦学习的技术,使成熟产品/场景的用户与成长期产品/场景,或者,新产品/场景的业务对象共同建模,从而得到一个全量的成熟产品/场景的表征,用来刻画成熟产品/场景的用户对成长期产品/场景,或者,新产品/场景的业务对象的兴趣程度,有了这个表征,就可以使用U2U2TAG等方法,将每个新用户最相似的老用户的TAG,通过融合策略,赋值给新用户作为新用户的用户画像。
在一个可选实施例中,提供了一个为第一业务中的第一帐号生成帐号特征信息,并利用生成的帐号特征信息为第一帐号推送业务对象的方式,如图8所示,首先可以利用联邦学习的模型架构构建初始预测模型,由第一业务提供业务对象的信息作为对象特征样本,由第二业务提供帐号的信息作为帐号行为样本来联合训练初始预测模型,得到目标预测模型。再将第二业务中全量帐号以及全量帐号的帐号行为信息输入到目标预测模型,构建出具有对应关系的帐号和帐号表征信息。从具有对应关系的帐号和帐号表征信息中找到第一业务上的第一帐号在第二业务上对应的第二帐号的目标帐号表征信息。
利用第一业务上活跃度高于目标活跃度的帐号构建出目标帐号列表,并从具有对应关系的帐号和帐号表征信息获取到该列表中帐号的帐号表征信息,利用获取到的帐号表征信息训练初始索引模型,得到目标索引模型。
将第一帐号在第二业务上对应的第二帐号的目标帐号表征信息输入到目标索引模型中,即可从目标帐号列表中筛选出帐号表征信息之间的匹配度从高到低排列在前K个的帐号,用这些帐号的帐号标签构建帐号标签集合,从中筛选出标签质量从高到低排列排在前T个的画像标签作为第一帐号的帐号特征信息。
当第一业务接收到第一帐号的帐号请求时,可以从第一业务的业务对象中获取到与第一帐号的帐号特征信息相匹配的业务对象作为目标业务对象推送给第一帐号。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述帐号特征信息的生成方法的帐号特征信息的生成装置。如图9所示,该装置包括:
第一获取模块92,用于获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度;
第二获取模块94,用于从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,目标帐号列表用于记录第一业务中具有帐号特征信息的帐号,帐号特征信息用于表征根据第一业务中的帐号在第一业务上的操作行为确定出的第一业务中的帐号对第一业务上的业务对象的兴趣度;
第三获取模块96,用于从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。
具体实施例可以参考上述帐号特征信息的生成方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,第一获取模块,包括:第一获取单元,用于从第二业务上注册的帐号中获取帐号属性与第一帐号在第一业务上的帐号属性相匹配的帐号作为第二帐号;第二获取单元,用于从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息,其中,具有对应关系的帐号和帐号表征信息是根据第二业务上注册的帐号的帐号行为信息和第一业务上的业务对象的对象特征信息创建的,帐号行为信息用于指示第二业务上注册的帐号在第二业务上的操作行为,对象特征信息用于指示第一业务上的业务对象的属性特征。
作为一种可选的方案,上述装置还包括:第四获取模块,用于在从具有对应关系的帐号和帐号表征信息中获取第二帐号所对应的帐号表征信息作为目标帐号表征信息之前,获取样本数据集,其中,样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,兴趣度标识用于指示对应帐号行为样本的样本帐号在第一业务中对应的帐号对具有对象特征样本的业务对象是否感兴趣;训练模块,用于使用样本数据集训练初始预测模型,得到目标预测模型,其中,目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,目标对象表示层用于将输入的对象特征信息转换为对象表征信息,目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度;处理模块,用于将第二业务上注册的帐号的帐号行为信息输入目标帐号表示层,得到目标帐号表示层输出的具有对应关系的帐号和帐号表征信息。
作为一种可选的方案,训练模块,包括:第一输入单元,用于将帐号行为样本输入初始帐号表示层,并将帐号行为样本对应的对象特征样本输入初始对象表示层;第二输入单元,用于将初始帐号表示层的输出信息与初始对象表示层的输出信息输入初始匹配层,其中,初始预测模型包括初始帐号表示层,初始对象表示层和初始匹配层;第一确定单元,用于确定初始匹配层输出的初始匹配度与帐号行为样本所标注的兴趣度标识之间的函数关系;调整单元,用于根据函数关系与初始预测模型对应的收敛条件调整初始预测模型的模型参数,直至函数关系满足收敛条件;第二确定单元,用于将函数关系满足收敛条件的模型参数确定为目标预测模型的模型参数,得到目标预测模型。
作为一种可选的方案,第四获取模块,包括:第三获取单元,用于从第二业务上注册的帐号中获取在第一业务上具有对应帐号的样本帐号,以及样本帐号对应的帐号行为样本;第四获取单元,用于从第一业务上获取样本帐号执行了目标操作的业务对象的对象特征样本,其中,目标操作包括以下至少之一:用于指示帐号对业务对象感兴趣的操作,用于指示帐号对业务对象不感兴趣的操作;标注单元,用于使用目标操作所对应的兴趣度标识对具有对应关系的帐号行为样本和对象特征样本进行标注,得到样本数据集。
作为一种可选的方案,第二获取模块,包括:第三确定单元,用于确定目标帐号表征信息与目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;第五获取单元,用于从目标帐号列表中获取对应的匹配度从高到低排列排在前K个的帐号作为至少一个参考帐号。
作为一种可选的方案,第三确定单元,用于:使用目标帐号列表中每个帐号对应的帐号表征信息对初始索引模型进行训练,得到目标索引模型,其中,目标索引模型用于计算输入的帐号表征信息与目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;将目标帐号表征信息输入目标索引模型,得到目标索引模型输出的目标帐号表征信息与目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度。
作为一种可选的方案,上述装置还包括:第五获取模块,用于在从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号之前,从第一业务上注册的帐号中获取在第二业务上具有对应帐号的候选帐号;第六获取模块,用于从候选帐号中获取在第一业务上的活跃度高于目标活跃度的帐号,得到目标帐号列表。
作为一种可选的方案,第三获取模块,包括:第六获取单元,用于获取至少一个参考帐号中每个参考帐号的画像标签列表,得到画像标签集合,其中,每个参考帐号所对应的帐号特征信息包括每个参考帐号的画像标签列表;第四确定单元,用于确定画像标签集合中每个画像标签对应的标签质量;第七获取单元,用于从画像标签集合中获取所对应的标签质量从高到低排列排在前T个的画像标签作为目标特征信息。
作为一种可选的方案,第四确定单元,用于:获取每个画像标签在第一业务中所对应的业务对象的优质率以及每个画像标签在至少一个参考帐号中每个参考帐号的画像标签列表中出现的次数;对优质率与次数进行加权运算,得到每个画像标签对应的标签质量。
作为一种可选的方案,上述装置还包括:第七获取模块,用于在从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息之后,获取第一帐号在第一业务上触发的推送请求;第八获取模块,用于响应推送请求,从第一业务上的业务对象中获取与目标特征信息匹配的目标业务对象;推送模块,用于在第一业务上向第一帐号推送目标业务对象。
具体实施例可以参考上述帐号特征信息的生成方法中所示示例,本示例中在此不再赘述。
根据本发明实施例的又一个方面,还提供了一种用于实施上述帐号特征信息的生成方法的电子设备,如图10所示,该电子设备包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度;
从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,目标帐号列表用于记录第一业务中具有帐号特征信息的帐号,帐号特征信息用于表征根据第一业务中的帐号在第一业务上的操作行为确定出的第一业务中的帐号对第一业务上的业务对象的兴趣度;
从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的帐号特征信息的生成方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的帐号特征信息的生成方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储目标帐号表征信息、目标帐号列表以及目标特征信息等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述帐号特征信息的生成装置中的第一获取模块92、第二获取模块94及第三获取模块96。此外,还可以包括但不限于上述帐号特征信息的生成装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1008,用于显示上述目标特征信息等信息;和连接总线1010,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(Peer To Peer,简称P2P)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
图11示意性地示出了用于实现本申请实施例的电子设备的计算机系统结构框图。
需要说明的是,图11示出的电子设备的计算机系统1100仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理器1101(Central Processing Unit,CPU),其可以根据存储在只读存储器1102(Read-Only Memory,ROM)中的程序或者从存储部分1108加载到随机访问存储器1103(Random Access Memory,RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器1103中,还存储有系统操作所需的各种程序和数据。中央处理器1101、在只读存储器1102以及随机访问存储器1103通过总线1104彼此相连。输入/输出接口1105(Input /Output接口,即I/O接口)也连接至总线1104。
以下部件连接至输入/输出接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至输入/输出接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理器1101执行时,执行本申请的系统中限定的各种功能。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述帐号特征信息的生成方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,第一帐号是在第一业务上注册的帐号,第二帐号是在第二业务上注册的帐号,第一帐号在第一业务上的帐号属性与第二帐号在第二业务上的帐号属性相匹配,目标帐号表征信息用于表征预测出的第二帐号对第一业务上的业务对象的兴趣度;
从目标帐号列表中获取所对应的帐号表征信息与目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,目标帐号列表用于记录第一业务中具有帐号特征信息的帐号,帐号特征信息用于表征根据第一业务中的帐号在第一业务上的操作行为确定出的第一业务中的帐号对第一业务上的业务对象的兴趣度;
从至少一个参考帐号所对应的帐号特征信息中获取目标特征信息作为第一帐号的帐号特征信息。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (15)
1.一种帐号特征信息的生成方法,其特征在于,包括:
获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,所述第一帐号是在第一业务上注册的帐号,所述第二帐号是在第二业务上注册的帐号,所述第一帐号在所述第一业务上的帐号属性与所述第二帐号在所述第二业务上的帐号属性相匹配,所述目标帐号表征信息用于表征预测出的所述第二帐号对所述第一业务上的业务对象的兴趣度;
从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足所述匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,所述目标帐号列表用于记录所述第一业务中具有帐号特征信息的帐号,所述帐号特征信息用于表征根据所述第一业务中的帐号在所述第一业务上的操作行为确定出的所述第一业务中的帐号对所述第一业务上的业务对象的兴趣度;
从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息。
2.根据权利要求1所述的方法,其特征在于,所述获取第一帐号所对应的第二帐号的目标帐号表征信息,包括:
从所述第二业务上注册的帐号中获取帐号属性与所述第一帐号在所述第一业务上的帐号属性相匹配的帐号作为所述第二帐号;
从具有对应关系的帐号和帐号表征信息中获取所述第二帐号所对应的帐号表征信息作为所述目标帐号表征信息,其中,所述具有对应关系的帐号和帐号表征信息是根据所述第二业务上注册的帐号的帐号行为信息和所述第一业务上的业务对象的对象特征信息创建的,所述帐号行为信息用于指示所述第二业务上注册的帐号在所述第二业务上的操作行为,所述对象特征信息用于指示所述第一业务上的业务对象的属性特征。
3.根据权利要求2所述的方法,其特征在于,在所述从具有对应关系的帐号和帐号表征信息中获取所述第二帐号所对应的帐号表征信息作为所述目标帐号表征信息之前,所述方法还包括:
获取样本数据集,其中,所述样本数据集中记录了标注有兴趣度标识的具有对应关系的帐号行为样本和对象特征样本,所述兴趣度标识用于指示对应所述帐号行为样本的样本帐号在所述第一业务中对应的帐号对具有所述对象特征样本的业务对象是否感兴趣;
使用所述样本数据集训练初始预测模型,得到目标预测模型,其中,所述目标预测模型包括目标帐号表示层,目标对象表示层和目标匹配层,所述目标帐号表示层用于将输入的帐号行为信息转换为帐号表征信息,所述目标对象表示层用于将输入的对象特征信息转换为对象表征信息,所述目标匹配层用于根据输入的帐号表征信息和对象表征信息预测帐号对业务对象的兴趣度;
将所述第二业务上注册的帐号的帐号行为信息输入所述目标帐号表示层,得到所述目标帐号表示层输出的具有对应关系的帐号和帐号表征信息。
4.根据权利要求3所述的方法,其特征在于,所述使用所述样本数据集训练初始预测模型,得到目标预测模型,包括:
将所述帐号行为样本输入初始帐号表示层,并将所述所述帐号行为样本对应的所述对象特征样本输入初始对象表示层;
将所述初始帐号表示层的输出信息与所述初始对象表示层的输出信息输入初始匹配层,其中,所述初始预测模型包括所述初始帐号表示层,所述初始对象表示层和所述初始匹配层;
确定所述初始匹配层输出的初始匹配度与所述帐号行为样本所标注的兴趣度标识之间的函数关系;
根据所述函数关系与所述初始预测模型对应的收敛条件调整所述初始预测模型的模型参数,直至所述函数关系满足所述收敛条件;
将所述函数关系满足所述收敛条件的模型参数确定为所述目标预测模型的模型参数,得到所述目标预测模型。
5.根据权利要求3所述的方法,其特征在于,所述获取样本数据集,包括:
从所述第二业务上注册的帐号中获取在所述第一业务上具有对应帐号的样本帐号,以及所述样本帐号对应的帐号行为样本;
从所述第一业务上获取所述样本帐号执行了目标操作的业务对象的对象特征样本,其中,所述目标操作包括以下至少之一:用于指示帐号对业务对象感兴趣的操作,用于指示帐号对业务对象不感兴趣的操作;
使用所述目标操作所对应的兴趣度标识对具有对应关系的帐号行为样本和对象特征样本进行标注,得到所述样本数据集。
6.根据权利要求1所述的方法,其特征在于,所述从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,包括:
确定所述目标帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;
从所述目标帐号列表中获取对应的匹配度从高到低排列排在前K个的帐号作为所述至少一个参考帐号。
7.根据权利要求6所述的方法,其特征在于,所述确定所述目标帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度,包括:
使用所述目标帐号列表中每个帐号对应的帐号表征信息对初始索引模型进行训练,得到目标索引模型,其中,所述目标索引模型用于计算输入的帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度;
将所述目标帐号表征信息输入所述目标索引模型,得到所述目标索引模型输出的所述目标帐号表征信息与所述目标帐号列表中每个帐号对应的帐号表征信息之间的匹配度。
8.根据权利要求1所述的方法,其特征在于,在所述从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号之前,所述方法还包括:
从所述第一业务上注册的帐号中获取在所述第二业务上具有对应帐号的候选帐号;
从所述候选帐号中获取在所述第一业务上的活跃度高于目标活跃度的帐号,得到所述目标帐号列表。
9.根据权利要求1所述的方法,其特征在于,所述从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息,包括:
获取至少一个所述参考帐号中每个参考帐号的画像标签列表,得到画像标签集合,其中,每个参考帐号所对应的帐号特征信息包括每个参考帐号的画像标签列表;
确定所述画像标签集合中每个画像标签对应的标签质量;
从所述画像标签集合中获取所对应的标签质量从高到低排列排在前T个的画像标签作为所述目标特征信息。
10.根据权利要求9所述的方法,其特征在于,所述确定所述画像标签集合中每个画像标签对应的标签质量,包括:
获取所述每个画像标签在所述第一业务中所对应的业务对象的优质率以及所述每个画像标签在至少一个所述参考帐号中每个参考帐号的画像标签列表中出现的次数;
对所述优质率与所述次数进行加权运算,得到所述每个画像标签对应的标签质量。
11.根据权利要求1所述的方法,其特征在于,在所述从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息之后,所述方法还包括:
获取所述第一帐号在所述第一业务上触发的推送请求;
响应所述推送请求,从所述第一业务上的业务对象中获取与所述目标特征信息匹配的目标业务对象;
在所述第一业务上向所述第一帐号推送所述目标业务对象。
12.一种帐号特征信息的生成装置,其特征在于,包括:
第一获取模块,用于获取第一帐号所对应的第二帐号的目标帐号表征信息,其中,所述第一帐号是在第一业务上注册的帐号,所述第二帐号是在第二业务上注册的帐号,所述第一帐号在所述第一业务上的帐号属性与所述第二帐号在所述第二业务上的帐号属性相匹配,所述目标帐号表征信息用于表征预测出的所述第二帐号对所述第一业务上的业务对象的兴趣度;
第二获取模块,用于从目标帐号列表中获取所对应的帐号表征信息与所述目标帐号表征信息的匹配度满足匹配度条件的帐号,得到至少一个参考帐号,其中,帐号表征信息之间的匹配度满足所述匹配度条件用于指示帐号表征信息对应的帐号是相似帐号,所述目标帐号列表用于记录所述第一业务中具有帐号特征信息的帐号,所述帐号特征信息用于表征根据所述第一业务中的帐号在所述第一业务上的操作行为确定出的所述第一业务中的帐号对所述第一业务上的业务对象的兴趣度;
第三获取模块,用于从至少一个所述参考帐号所对应的帐号特征信息中获取目标特征信息作为所述第一帐号的帐号特征信息。
13.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至11任一项中所述的方法。
14.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至11任一项中所述方法的步骤。
15.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至11任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111224118.9A CN113672816B (zh) | 2021-10-21 | 2021-10-21 | 帐号特征信息的生成方法、装置和存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111224118.9A CN113672816B (zh) | 2021-10-21 | 2021-10-21 | 帐号特征信息的生成方法、装置和存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113672816A true CN113672816A (zh) | 2021-11-19 |
CN113672816B CN113672816B (zh) | 2022-02-08 |
Family
ID=78550711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111224118.9A Active CN113672816B (zh) | 2021-10-21 | 2021-10-21 | 帐号特征信息的生成方法、装置和存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113672816B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116702104A (zh) * | 2023-08-08 | 2023-09-05 | 阿里健康科技(中国)有限公司 | 账户信息的关联方法、装置、设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008999A (zh) * | 2019-03-07 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 目标帐号的确定方法、装置、存储介质及电子装置 |
CN110032678A (zh) * | 2019-04-08 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 业务资源推送方法和装置、存储介质和电子装置 |
CN110489646A (zh) * | 2019-08-15 | 2019-11-22 | 中国平安人寿保险股份有限公司 | 用户画像构建方法及终端设备 |
WO2020048062A1 (zh) * | 2018-09-05 | 2020-03-12 | 平安科技(深圳)有限公司 | 产品销售的智能推荐方法、装置、计算机设备和存储介质 |
CN111935259A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 目标帐号集合的确定方法和装置、存储介质及电子设备 |
CN111953763A (zh) * | 2020-08-06 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种业务数据推送方法、装置及存储介质 |
CN112329940A (zh) * | 2020-11-02 | 2021-02-05 | 北京邮电大学 | 一种结合联邦学习与用户画像的个性化模型训练方法及系统 |
CN112734463A (zh) * | 2020-12-30 | 2021-04-30 | 咪咕音乐有限公司 | 一种业务信息发送方法、装置、电子设备和存储介质 |
CN113032547A (zh) * | 2021-03-31 | 2021-06-25 | 龙关玲 | 基于人工智能的大数据处理方法、系统及云平台 |
-
2021
- 2021-10-21 CN CN202111224118.9A patent/CN113672816B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020048062A1 (zh) * | 2018-09-05 | 2020-03-12 | 平安科技(深圳)有限公司 | 产品销售的智能推荐方法、装置、计算机设备和存储介质 |
CN110008999A (zh) * | 2019-03-07 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 目标帐号的确定方法、装置、存储介质及电子装置 |
CN110032678A (zh) * | 2019-04-08 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 业务资源推送方法和装置、存储介质和电子装置 |
CN110489646A (zh) * | 2019-08-15 | 2019-11-22 | 中国平安人寿保险股份有限公司 | 用户画像构建方法及终端设备 |
CN111935259A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 目标帐号集合的确定方法和装置、存储介质及电子设备 |
CN111953763A (zh) * | 2020-08-06 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种业务数据推送方法、装置及存储介质 |
CN112329940A (zh) * | 2020-11-02 | 2021-02-05 | 北京邮电大学 | 一种结合联邦学习与用户画像的个性化模型训练方法及系统 |
CN112734463A (zh) * | 2020-12-30 | 2021-04-30 | 咪咕音乐有限公司 | 一种业务信息发送方法、装置、电子设备和存储介质 |
CN113032547A (zh) * | 2021-03-31 | 2021-06-25 | 龙关玲 | 基于人工智能的大数据处理方法、系统及云平台 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116702104A (zh) * | 2023-08-08 | 2023-09-05 | 阿里健康科技(中国)有限公司 | 账户信息的关联方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113672816B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180082200A1 (en) | Method for inferring latent user interests based on image metadata | |
CN109840793B (zh) | 推广信息的推送方法和装置、存储介质、电子装置 | |
CN108595494A (zh) | 答复信息的获取方法及装置 | |
CN107688605B (zh) | 跨平台数据匹配方法、装置、计算机设备和存储介质 | |
CN110798709B (zh) | 视频处理方法和装置、存储介质及电子装置 | |
CN108959323B (zh) | 视频分类方法和装置 | |
CN111008335B (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN108805598A (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
CN112053184B (zh) | 推广信息投放方法、装置、电子设备以及存储介质 | |
CN108876517A (zh) | 基于人工智能的用户喜好分析方法及系统 | |
CN117216362A (zh) | 内容推荐方法、装置、设备、介质和程序产品 | |
CN111259257A (zh) | 一种信息展示方法、系统、装置、电子设备及存储介质 | |
CN112287238A (zh) | 用户特征的确定方法和装置、存储介质及电子设备 | |
CN113052653A (zh) | 一种金融产品内容推荐方法、系统及计算机可读存储介质 | |
CN113672816B (zh) | 帐号特征信息的生成方法、装置和存储介质及电子设备 | |
CN110399564B (zh) | 帐号分类方法和装置、存储介质及电子装置 | |
CN115131052A (zh) | 一种数据处理方法、计算机设备和存储介质 | |
CN110852338B (zh) | 用户画像的构建方法及装置 | |
CN116634008A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN110942345A (zh) | 种子用户的选取方法、装置、设备及存储介质 | |
CN113076450B (zh) | 一种目标推荐列表的确定方法和装置 | |
CN109635193A (zh) | 一种书籍阅读共享平台 | |
CN111935259B (zh) | 目标帐号集合的确定方法和装置、存储介质及电子设备 | |
CN114862173A (zh) | 店铺数据的处理方法、装置、计算机设备和存储介质 | |
CN116521937A (zh) | 视频表单的生成方法、装置、设备及存储介质、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40055782 Country of ref document: HK |