CN113010788B - 信息推送方法及装置、电子设备、计算机可读存储介质 - Google Patents

信息推送方法及装置、电子设备、计算机可读存储介质 Download PDF

Info

Publication number
CN113010788B
CN113010788B CN202110296517.XA CN202110296517A CN113010788B CN 113010788 B CN113010788 B CN 113010788B CN 202110296517 A CN202110296517 A CN 202110296517A CN 113010788 B CN113010788 B CN 113010788B
Authority
CN
China
Prior art keywords
application
information
target user
future
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110296517.XA
Other languages
English (en)
Other versions
CN113010788A (zh
Inventor
刘曙铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Oppo Communication Technology Co ltd
Original Assignee
Chengdu Oppo Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Oppo Communication Technology Co ltd filed Critical Chengdu Oppo Communication Technology Co ltd
Priority to CN202110296517.XA priority Critical patent/CN113010788B/zh
Publication of CN113010788A publication Critical patent/CN113010788A/zh
Application granted granted Critical
Publication of CN113010788B publication Critical patent/CN113010788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请实施例涉及数据处理技术领域,公开了一种信息推送方法及装置、电子设备、计算机可读存储介质,该方法包括:获取新用户的第一应用序列信息,并根据第一应用序列信息查找与新用户相似的目标用户;进而根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对各个应用程序对应的各个标签的历史得分;然后根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分,并在未来第一时间段内根据未来得分向新用户进行信息推送。实施本申请实施例,能够提高向新用户推送信息的准确率。

Description

信息推送方法及装置、电子设备、计算机可读存储介质
技术领域
本申请涉及数据处理技术领域,具体涉及一种信息推送方法及装置、电子设备、计算机可读存储介质。
背景技术
随着互联网越来越流行,用户在日常的生活工作中,可以通过互联网推送的各种各样的推送信息来了解一些时事要闻,从而提升自身的见闻。
在实践中发现,现如今互联网的服务器通常是基于用户的身份信息以及行为数据,来向不同的用户推送对应的推送信息的,但是对于一些新用户,服务器能够获取到的身份信息和行为数据较少,从而不利于互联网的服务器向这些新用户进行信息的推送。
发明内容
本申请实施例公开了一种信息推送方法及装置、电子设备、计算机可读存储介质,能够提高向新用户推送信息的准确率。
本申请实施例第一方面公开一种信息推送方法,包括:
获取新用户的第一应用序列信息;
根据所述第一应用序列信息查找与所述新用户相似的目标用户,所述目标用户的第二应用序列信息与所述第一应用序列信息之间的相似度大于第一阈值;
根据所述目标用户使用各个应用程序的历史行为数据,确定出所述目标用户对所述各个应用程序对应的各个标签的历史得分;
根据所述历史得分预测所述目标用户在未来第一时间段内对所述各个标签的未来得分,并在所述未来第一时间段内根据所述未来得分向所述新用户进行信息推送。
本申请实施例第二方面公开一种信息推送装置,包括:
第一获取单元,用于获取新用户的第一应用序列信息;
查找单元,用于根据所述第一应用序列信息查找与所述新用户相似的目标用户,所述目标用户的第二应用序列信息与所述第一应用序列信息之间的相似度大于第一阈值;
第一确定单元,用于根据所述目标用户使用各个应用程序的历史行为数据,确定出所述目标用户对所述各个应用程序对应的各个标签的历史得分;
推送单元,用于根据所述历史得分预测所述目标用户在未来第一时间段内对所述各个标签的未来得分,并在所述未来第一时间段内根据所述未来得分向所述新用户进行信息推送。
本申请实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本申请实施例第一方面公开的信息推送方法。
本申请实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本申请实施例第一方面公开的信息推送方法。
本申请实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请实施例第一方面的任意一种方法的部分或全部步骤。
本申请实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请实施例第一方面的任意一种方法的部分或全部步骤。
与相关技术相比,本申请实施例具有以下有益效果:
本申请实施例中,可以根据新用户有限的第一应用序列信息,确定出应用使用序列与新用户相似的目标用户;而由于目标用户已经积累有大量使用应用程序的历史行为数据,所以可以根据这些历史行为数据来确定目标用户对其使用的各个应用程序对应的各个标签的历史得分,进而根据历史得分预测目标用户在未来一段时间内对各个标签的未来得分。此外,考虑到新用户的兴趣爱好与目标用户相似,所以可以根据目标用户在未来一段时间内对各个标签的未来得分向新用户进行信息推送,以使得所推送的推送信息更加符合新用户的兴趣爱好,从而提高了向新用户推送信息的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种适用于该信息推送方法的应用场景的示意图;
图2是本申请实施例公开的一种信息推送方法的流程示意图;
图3A是本申请实施例公开的另一种信息推送方法的流程示意图;
图3B是本申请实施例公开的一种应用表征模型的工作流程示意图;
图4是本申请实施例公开的又一种信息推送方法的流程示意图;
图5是本申请实施例公开的一种信息推送装置的结构示意图;
图6是本申请实施例公开的另一种信息推送装置的结构示意图;
图7是本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本申请实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例公开了一种信息推送方法及装置、电子设备、计算机可读存储介质,能够提高向新用户推送信息的准确率。
下面将结合具体实施例对本申请技术方案进行详细说明。
为了更加清楚地说明本申请实施例公开的信息推送方法及装置、电子设备、计算机可读存储介质,首先介绍一种适用于该信息推送方法的应用场景。如图1所示,服务器110(例如网络服务器、服务器集群)可以与用户终端120(例如,手机、平板电脑、台式电脑等)建立有通信连接,进而服务器110可以获取新用户的第一应用序列信息(该应用序列信息用于表征用户使用应用程序的先后顺序,例如:应用程序1-应用程序2-应用程序3等),并根据该第一应用序列信息查找出与该新用户兴趣相似的目标用户。进而,由于服务器110已经积累有大量目标用户使用应用程序的历史行为数据,所以服务器110可以根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对使用过的各个应用程序对应的标签的历史得分,并根据历史得分预测目标用户在未来一定时间段内对各个标签的未来得分。此外,由于考虑到新用户的兴趣爱好与目标用户相似,所以服务器110可以在未来一定时间段内,根据目标用户对各个标签的未来得分向新用户的用户终端120进行信息推送,以提高服务器110向新用户推送信息的准确率。
在一种实施例中,本申请实施例公开的信息推送方法及装置、电子设备、计算机可读存储介质可以应用于广告投放商向新用户投放广告的场景中。可选的,广告投放商的服务器可以根据收集到的新用户的应用序列信息,查找与新用户的兴趣习惯相似的目标用户,进而根据大量目标用户使用各个应用程序的行为数据(例如使用的应用程序类型、使用应用程序的使用时长等),确定出目标用户对各种应用程序对应的标签的历史得分,然后根据历史得分来预测目标用户在未来一段时间对应用程序对应的标签的未来得分,进而广告投放商的服务器可以在未来一定时间内根据未来得分向新用户进行广告投放,以提高广告投放商向新用户进行广告投放的准确性,从而解决了广告投放商向新用户投放广告的冷启动问题。
请参阅图2,图2是本申请实施例公开的一种信息推送方法的流程示意图,该信息推送方法可以应用于上述的服务器,该信息推送方法可以包括以下步骤:
202、获取新用户的第一应用序列信息。
本申请实施例中,服务器可以通过新用户在用户终端(例如手机、平板电脑)的操作记录中获取新用户的第一应用序列信息,也可以通过数据库(例如存储有用户使用应用程序的行为数据的数据库)或者应用程序的开发商反馈的应用程序使用信息,来获取新用户的第一应用序列信息,在此不作限定。
204、根据新用户的第一应用序列信息查找与新用户相似的目标用户。
本申请实施例中,用户的应用序列信息可以用于表示用户使用应用程序的先后顺序,该应用序列信息可以包括用户使用过的应用程序的标识信息,例如应用程序的名称、应用程序的编号等,并且根据用户使用这些应用程序的先后顺序进行排序,例如:应用程序1-应用程序2-应用程序3等。可以理解的是,由于用户的应用序列信息包括了用户使用过的应用程序,所以其可以大致反映用户的兴趣爱好,例如,第一应用序列信息为:音乐类应用程序1-唱歌类应用程序1-音乐类应用程序2,则说明新用户喜欢音乐。
对此,服务器可以根据新用户的第一应用序列信息,查找与新用户的应用序列信息相似的老用户作为目标用户,该目标用户的第二应用序列信息,与新用户的第一应用序列信息之间的相似度可以大于第一阈值(例如80%、90%等,具体数值可以由开发人员根据大量的开发数据设定,在此不作限定)。可以理解的是,两个用户的兴趣爱好相同时,他们之间的应用序列信息通常是相似的,那么若目标用户的第二应用序列信息,与新用户的第一应用序列信息之间的相似度大于第一阈值,则说明目标用户与新用户的兴趣爱好相似。
在另一种实施例中,目标用户也可以是应用序列信息与第一新用户的应用序列信息的相似度,大于第一阈值的第二新用户作为第一新用户对应的目标用户。可选的,该第二新用户使用各个应用程序的历史行为数据的数据量,可以大于第一新用户使用各个应用程序的历史行为数据的数据量。或者,服务器获取第二新用户使用各个应用程序的历史行为数据的获取难度,小于获取第一新用户使用各个应用程序的历史行为数据的获取难度,可选的,若第二新用户的历史行为数据保密程度,低于第一新用户的历史行为数据保密程度,则可以确定服务器获取第二新用户使用各个应用程序的历史行为数据的获取难度,小于获取第一新用户使用各个应用程序的历史行为数据的获取难度,在此不作限定。从而使得电子设备后续可以根据第二新用户使用各个应用程序的历史行为数据,来确定出第一新用户感兴趣的推送信息。
206、根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对各个应用程序对应的各个标签的历史得分。
本申请实施例中,新用户可以是指服务器仅存储有少量其使用各个应用程序的历史行为数据的用户,而老用户可以是指服务器已经积累有大量其使用各个应用程序的历史行为数据的用户,目标用户可以是老用户中与新用户的兴趣爱好相似的用户。其中历史行为数据可以包括用户经常使用的应用程序的类型、使用应用程序的累积时长等,可选的,服务器可以通过目标用户的用户设备的运行日志,或者目标用户的用户设备访问服务器的访问日志来获取目标用户的行为数据。
本申请实施例中,每个应用程序可以对应有标签,例如音乐类的应用程序可以对应有“音乐”的标签,游戏类的应用程序可以对应有“游戏”的标签。而目标用户对各个标签可以对应有一个历史得分,用于表示目标用户对各个标签的感兴趣程度。可选的,本申请实施例中,服务器可以根据目标用户使用各个应用程序的历史行为数据,来确定出目标用户对各个应用程序对应的各个标签的历史得分,例如服务器可以根据目标用户使用第一应用程序的使用时长,来确定目标用户对第一应用程序对应的第一标签的历史得分,其中,目标用户使用第一应用程序的使用时长越长,则说明目标用户对第一应用程序越感兴趣,目标用户对第一应用程序对应的第一标签的历史得分也就越高,反之则越低。
208、根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分,并在未来第一时间段内根据未来得分向新用户进行信息推送。
可以理解的是,用户在一段时间内的兴趣爱好通常不会发生太大的改变,所以目标用户对各个标签的历史得分,与目标用户在未来第一时间段(例如一周、一个月等,在此不作限定)内对各个标签的未来得分通常不会有太大的改变。对此,本申请实施例中,服务器可以根据目标用户对各个标签的历史得分,来预测目标用户在未来第一时间段内对各个标签的未来得分,进而可选的,服务器可以在未来第一时间段内,根据目标用户在未来第一时间段内对各个标签的未来得分,来向目标用户进行信息推送。
此外,考虑到新用户的兴趣爱好与目标用户相似,所以服务器同样可以在未来第一时间段内根据目标用户在未来第一时间段内对各个标签的未来得分,向新用户进行信息推送,以使得服务器所推送的推送信息更加符合新用户的兴趣爱好,从而提高了服务器向新用户推送信息的准确率。
实施上述各实施例公开的方法,可以根据新用户有限的第一应用序列信息,确定出应用使用序列与新用户相似的目标用户;而由于目标用户已经积累有大量使用应用程序的历史行为数据,所以可以根据这些历史行为数据来确定目标用户对其使用的各个应用程序对应的各个标签的历史得分,进而根据历史得分预测目标用户在未来一段时间内对各个标签的未来得分。此外,考虑到新用户的兴趣爱好与目标用户相似,所以可以根据目标用户在未来一段时间内对各个标签的未来得分向新用户进行信息推送,以使得所推送的推送信息更加符合新用户的兴趣爱好,从而提高了向新用户推送信息的准确率。
请参阅图3A,图3A是本申请实施例公开的另一种信息推送方法的流程示意图,该信息推送方法可以应用于上述的服务器,该信息推送方法可以包括以下步骤:
302、获取新用户的第一应用序列信息。
304、通过双向语言模型对新用户的第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量。
本申请实施例中,考虑到若用户的应用序列信息过长时,服务器处理新用户和老用户的应用序列信息时,将加大服务器的计算量且计算过程中容易出错。对此,服务器可以通过双向语音模型(例如:Bidirectional Encoder Representations fromTransformers,BERT双向语音模型)对新用户的第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量,该第一嵌入向量可以包括embedding嵌入向量,用于表征新用户的第一应用序列信息,而由于用嵌入向量表征应用序列信息更加地简洁,使得后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,同时减少服务器的计算量和出错的概率,此外由于嵌入向融合了多个信息维度(例如应用程序的名称、应用程序的开发单位、应用程序的类型等),所以将应用序列信息转换为嵌入向量再执行后续的相似度比较,能够提高后续比较新用户和老用户的应用序列信息的相似度的准确率。
需要说明的是,上述的双向语音模型可以是基于各个应用程序的词向量维度信息训练得到的,而正是由于该双向语音模型是基于各个应用程序的词向量维度信息训练得到的,所以该双向语音模型更加适用于对用户的应用序列信息进行处理,所得到的第一嵌入向量也不容易出错,从而可以提高后续服务器根据第一嵌入向量确定出的目标用户的准确率。
需要进一步说明的是,上述用于训练双向语音模型的词向量维度信息可以是通过语音表征模型(例如:Enhanced Graph Embedding with Side Information,EGES基于补充信息的增强的图模型)生成的,其中该应用表征模型可以是根据多个样本应用序列信息,以及每个样本应用序列信息中包括的各个样本应用的补充信息(例如应用程序的类型、应用程序的名称等)训练得到的。
在一种实施例中,服务器在通过双向语言模型对新用户的第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量之前,服务器可以通过获取样本应用序列信息,和样本应用序列信息中包括的各个样本应用的补充信息。可选的,该补充信息可以包括应用程序的类型、应用程序的名称、应用程序对应的推送信息、推送信息对应的开发单位中的一种或多种,在此不作限定,在另一种实施例中,补充信息还可以包括搜索行为、浏览资讯行为、观看视频行为以及听音乐行为等中的一种或多种,在此不作限定。
可将获取到的样本应用序列信息和补充信息输入到应用表征模型,进而应用表征模型可以根据样本应用序列信息和补充信息,构建样本应用程序的有向有权图,并根据样本应用程序的有向有权图随机生成多条随机应用序列信息(可选的,应用表征模型可以通过设置随机的初始节点和步长(即节点的数量),并根据该初始节点和步长在样本应用程序的有向有权图随机生成多条随机应用序列信息);之后,应用表征模型可以通过多条随机应用序列信息对词向量生成模型(例如:Word2vec模型)进行训练,并根据训练得到的词向量生成模型获取各个样本应用对应的词向量维度信息,然后服务器可以根据各个样本应用对应的词向量维度信息对待训练的双向语音模型进行训练,以使得训练后的双向语音模型更适用于对用户的应用序列信息进行处理,所得到的第一嵌入向量也不容易出错,从而可以提高后续服务器根据第一嵌入向量确定出的目标用户的准确率。
可选的,为了使得后续的根据应用表征模型生成的词向量维度信息更加地适合各种用户的应用序列信息,上述的样本用户可以包括新用户和/或老用户。需要说明的是,老用户可以是指服务器已经积累有大量其使用各个应用程序的历史行为数据的用户,新用户可以是指服务器仅存储有少量其使用各个应用程序的历史行为数据的用户,在此不作限定。
结合图3B举例来说,第一步:服务器可以获取样本用户的应用序列信息,例如:样本老用户1(图3B中的u_old1)的应用序列信息为:应用程序1(即图3B中的“a1”,以下类推)-应用程序3-应用程序5;样本老用户2(图3B中的u_old2)的应用序列信息为:应用程序2-应用程序4-应用程序5;样本新用户1(图3B中的u_new1)的应用序列信息为:应用程序1-应用程序3-应用程序5。
第二步:当服务器将样本老用户1、样本老用户2和样本新用户1的应用序列信息输入应用表征模型之后,区别于相关技术通常仅是根据用户的应用序列信息来构建同构图(图中的每个节点仅包括一种信息的图),本申请实施例中,应用表征模型可以根据样本老用户1、样本老用户2和样本新用户1和应用程序1、2、3、4、和5对应的补充信息来构建有向有权图(其中,该有向有权图中的每个节点(如图3B中的圆圈节点)可以包括多种信息(如图3B中的方形节点),例如应用程序的名称、应用程序的类型、应用程序的开发单位等)。
第三步:应用表征模型可以通过设置随机的初始节点和步长,并根据初始节点和步长在有向有权图中随机生成多条随机应用序列信息,如图3B中的:应用程序1-应用程序3-应用程序5,应用程序2-应用程序3-应用程序5等。
第四步:应用表征模型可以通过上述多条随机应用序列信息对词向量生成模型进行训练,并根据训练得到的词向量生成模型获取各个样本应用对应的词向量维度信息。之后服务器可以根据生成的词向量维度信息对待训练的双向语言模型进行训练。
实施上述方法,可以将应用程序的多个补充信息经过一系列融合操作融合成一个嵌入向量,并使用一个嵌入向量来表征应用序列信息。从而可以更好地表征新用户的应用序列信息,因为新用户的应用序列信息的信息量通常较少,所以可以根据应用程序对应的补充信息,比如应用程序的类型、应用程序的开发者以及应用程序的描述等来补充和表征应用程序的向量信息;此外,通过嵌入向量来表征用户的应用序列信息,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率。
306、根据第一嵌入向量确定出与新用户相似的目标用户。
本申请实施例中,服务器可以先将多个老用户的应用序列信息输入双向语言模型进行处理,以得到每个老用户的应用序列信息对应的嵌入向量,进而服务器可以根据新用户的第一嵌入向量,在多个老用户中确定出与新用户相似的目标用户,该目标用户的第二嵌入向量与第一嵌入向量的相似度大于第一阈值。
作为一种可选的实施方式,服务器可以分别计算多个老用户的应用序列信息对应的第二嵌入向量,与新用户的第一嵌入向量的余弦相似度,以得到与第一嵌入向量的余弦相似度大于第一阈值(例如:80%、90%等,具体数值可以由开发人员根据大量的开发数据设定,在此不作限定)的第二嵌入向量;进而服务器可以将余弦相似度大于第一阈值的第二嵌入向量对应的老用户,确定为与新用户相似的目标用户。
实施上述方法,服务器可以通过比较新用户和老用户的嵌入向量的余弦相似度,来确定出与新用户相似的目标用户,其中,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率。
308、根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对各个应用程序对应的各个标签的历史得分。
310、根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分,并在未来第一时间段内根据未来得分向新用户进行信息推送。
本申请实施例中,用户对标签的兴趣度不仅和用户积累的用户行为有关,还可以与时间日期相关。比如用户在每周四会对传奇游戏标签下的应用程序有更多的行为数据,而在其他的日期内则有很少的行为,那么可以在每周四给该用户推送传奇游戏标签对应的推送信息。
作为一种可选的实施方式,服务器可以通过时间序列预测模型对目标用户在历史第二时间段(例如一个小时、一天或者一周等,在此不作限定)内对各个标签的历史得分进行分析,以预测得到目标用户在未来第一时间段内对应的未来得分序列,并基于未来得分序列在未来第一时间段内向新用户进行信息推送。
其中,该时间序列预测模型可以包括Prophet模型,可以用于基于用户历史得分来预测未来一段时间的未来得分。此外,针对本申请实施例,由于Prophet模型等时间序列预测模型计算速度更加简单也更快,同时可以考虑节假日、时间趋势以及周期等因素,并且参数调优明确简单,所以模型线上预测速度较快,同时拥有不错的趋势预测效果,可以很好的应用到我们较多的节假日实际场景中。
在一种实施例中,服务器可以通过时间序列预测模型对目标用户在历史第二时间段内对第二标签的历史得分进行分析,以预测得到目标用户在未来第一时间段内对第二标签的未来得分序列,第二标签为各个标签中的任一标签,其中,未来得分序列是以单位时间为维度对第二标签的未来得分进行排列的。举例来说,单位时间是每天,则目标用户在未来第一时间段内对第二标签的未来得分序列可以是:周一80分;周二60分;周三55分;周四90分;周五20分等,从而后续服务器可以根据该未来得分序列选择得分最高的日期来向用户推送信息。
实施上述方法,服务器可以根据用户对标签的历史得分,来预测用户在未来一段时间内对标签的未来得分序列,进而后续服务器可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
作为一种可选的实施方式,服务器在得到目标用户在未来第一时间段内对第二标签的未来得分序列之后,可以在第二标签的未来得分序列中,确定出分数最高的未来得分作为目标未来得分;进而可以基于目标未来得分在未来得分序列中的序列位置确定出推送时间,并在推送时间向新用户推送第二标签对应的推送信息。
举例来说,第二标签的未来得分序列可以是:周一80分;周二60分;周三55分;周四90分;周五20分。则可以确定出最高的未来得分是90分,且该目标未来得分在未来得分序列中的序列位置是第四,确定出推送时间为周四,则服务器可以在未来的每周四向新用户推送第二标签对应的推送信息。
实施上述方法,服务器可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
在另一种实施例中,服务器通过时间序列预测模型对目标用户在历史第二时间段内对各个标签的历史得分进行分析,预测得到目标用户在未来第一时间段内对应的未来得分序列可以是未来最高得分序列,其中,该未来最高得分序列中的每个未来得分都是对应单位时间内,得分最高的标签的未来得分。举例来说,周一-标签A-90分;周二-标签B-95分;周三-标签A-90分;周四-标签C-90分;周五-标签D-99分。
对此可选的,服务器可以根据未来最高得分序列,确定出每个单位时间对应的最高未来得分对应的目标标签,并根据该最高未来得分在未来最高得分序列中的序列位置确定出推送时间,并在该推送时间向新用户推送上述目标标签对应的推送信息。
举例来说,服务器可以在周一推送标签A对应的推送信息,在周二推送标签B对应的推送信息,以此类推。
实施上述方法,服务器可以在每个单位时间向用户推送得分最高的标签对应的推送信息,从而可以保证在每个单位时间内向用户推送的信息都是比较符合用户的兴趣爱好的,从而可以提高服务器向用户推送信息的效率。
实施上述各实施例公开的方法,可以根据目标用户在未来一段时间内对各个标签的未来得分向新用户进行信息推送,以使得所推送的推送信息更加符合新用户的兴趣爱好,从而提高了向新用户推送信息的准确率;以及,可以更好地表征新用户的应用序列信息和减少服务器的计算量和出错的概率;以及,可以通过比较新用户和老用户的嵌入向量的余弦相似度,来确定出与新用户相似的目标用户,其中,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率;以及,服务器可以根据用户对标签的历史得分,来预测用户在未来一段时间内对标签的未来得分序列,进而后续服务器可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
请参阅图4,图4是本申请实施例公开的又一种信息推送方法的流程示意图,该信息推送方法可以应用于上述的服务器,该信息推送方法可以包括以下步骤:
402、获取新用户的第一应用序列信息。
404、根据新用户的第一应用序列信息查找与新用户相似的目标用户。
406、根据目标用户使用第一应用程序的历史行为数据,确定出目标用户在单位时间内对第一应用程序的使用程度值。
本申请实施例中,目标用户使用第一应用程序的历史行为数据可以包括:使用第一应用程序的时长、经常使用第一应用程序的时间点(例如,总在晚上使用,总在中午使用等)等,在此不作限定。
作为一种可选的实施方式,服务器可以根据目标用户在单位时间(例如一个小时、一天或者一周等,在次不作限定)内使用第一应用程序的使用时长,确定出目标用户在单位时间内对第一应用程序的使用程度值,其中,该使用程度值可以与使用时长成正相关关系,可以理解的是,用户对某一应用程序的使用时长越长,则说明用户对该应用程序的使用程度越高,反之则越低。
可选的,服务器可以将多个用户使用第一应用程序的多个使用时长进行排序,并根据排序结果划分为N个等级,该N为正整数,进而服务器可以根据目标用户在单位时间内使用第一应用程序的使用时长,在排序结果中确定出对应的等级作为目标用户在单位时间内对第一应用程序的使用程度值。
举例来说,如果有3个用户都使用应用程序1,且将3个用户使用应用程序1的使用时长进行排序,并根据排序结果划分为20个等级。那么若用户A当天使用应用程序1的时间是最长的,那么用户A使用应用程序1的程度值就是1,用户B的使用应用程序1的时长位列中间,则程度值可以是0.5,而用户C当天使用应用程序1的时长最短,则其使用应用程序1的程度值就会很小为0.05(20个等级中的最后一个档位)。
实施上述方法,服务器可以对多个用户使用应用程序的时长序列进行等级划分,从而可以更加直接地确定出用户对应用程序的使用程度值。
408、根据目标用户在单位时间内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度,确定出目标用户对第一标签在单位时间内的历史得分。
本申请实施例中,服务器可以根据目标用户在单位时间(例如:每天、每周等)内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度三个维度,来确定出目标用户对第一标签在单位时间内的历史得分。
可选的,服务器计算目标用户在单位时间内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度的乘积作为目标用户对第一标签在单位时间内的历史得分。
在一种实施例中,服务器还可以根据目标用户在单位时间内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度,结合以下公式得到目标用户对第一标签在单位时间内的历史得分,即:
Figure BDA0002984555550000151
其中,score(u,tag,day)表示目标用户对第一标签在单位时间内的历史得分;
Figure BDA0002984555550000152
表示目标用户在单位时间内对第一应用程序的使用程度值;/>
Figure BDA0002984555550000153
表示第一应用程序对应的第一标签的区分程度值;/>
Figure BDA0002984555550000154
表示第一应用程序与第一标签的匹配度。
需要说明的是,目标用户在单位时间内对第一应用程序的使用程度值可以大致表示目标用户对第一应用程序的使用程度。而第一应用程序对应的第一标签的区分程度值,可以用于表征第一标签对使用第一应用程序的用户的区分程度。可选的,服务器可以通过TFIDF(term frequency–inverse document frequency)统计算法来确定出第一应用程序对应的第一标签的区分程度值。作为一种可选的实施方式,服务器在据目标用户在单位时间内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度,确定出目标用户对第一标签在单位时间内的历史得分之前,可以先获取使用第一应用程序的用户数量,进而根据使用第一应用程序的用户数量确定出第一应用程序对应的第一标签的区分程度值。
举例来说,极端情况下,应用程序1被所有用户使用,那么这个应用程序对于标签的区分没有任何作用。因为大家都使用应用程序1,所以应用程序1基本上没法把人群很好的区分开,则这个应用程序1对于其对应的标签的区别程度值为0。而另外一个标签A对应的应用程序2虽然用户使用人数少,但是能起到识别标签A的作用。相当于通过这个应用程序2我们可以很方便地给使用应用程序2对应的人群打上标签A,并且可以将使用应用程序2的这些用户和其他的用户有很好的区分度。
也就是说,一个应用程序对其对应的标签的区分程度值与该应用程序的用户数量有关,具体的,该区分程度值可以与该应用程序的用户数量成负相关关系。
实施上述方法,服务器可以根据应用程序的用户数量来快速确定出,该应用程序对其对应的标签的区分程度值,从而减低了历史得分的确定难度。
需要进一步说明的是,第一应用程序与第一标签的匹配度可以大致表示第一应用程序属于第一标签的程度,因为在实际中发现,应用程序与其对应的标签的关联关系可以通过开发人员手动关联,此时由于可以保证应用程序与其对应的标签的关联关系是正确的,所以可以将该应用程序与其对应的标签的匹配度确定为1。此外,还可以通过计算机自动地关联应用程序与其对应的标签的关联关系,但是使用计算机以一定的规则进行关联时,难免会出现应用程序与其关联的标签的关联程度不高,所以通过计算机关联的应用程序与其对应的标签的匹配度通常在0~1之间,在此不作限定。可选的,第一应用程序与第一标签的匹配度可以大致表示第一应用程序属于第一标签的程度可以通过查询获得,或者由开发人员指定,在此不作限定。
410、根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分,并在未来第一时间段内根据未来得分向新用户进行信息推送。
实施上述各实施例公开的方法,可以根据目标用户在未来一段时间内对各个标签的未来得分向新用户进行信息推送,以使得所推送的推送信息更加符合新用户的兴趣爱好,从而提高了向新用户推送信息的准确率;以及,可以对多个用户使用应用程序的时长序列进行等级划分,从而可以更加直接地确定出用户对应用程序的使用程度值;以及,可以根据应用程序的用户数量来快速确定出,该应用程序对其对应的标签的区分程度值,从而减低了历史得分的确定难度。
请参阅图5,图5是本申请实施例公开的一种信息推送装置的结构示意图,该信息推送装置可以应用于上述的服务器,该信息推送装置可以包括:第一获取单元501、查找单元502、第一确定单元503和推送单元504,其中:
第一获取单元501,用于获取新用户的第一应用序列信息;
查找单元502,用于根据第一应用序列信息查找与新用户相似的目标用户,目标用户的第二应用序列信息与第一应用序列信息之间的相似度大于第一阈值;
第一确定单元503,用于根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对各个应用程序对应的各个标签的历史得分;
推送单元504,用于根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分,并在未来第一时间段内根据未来得分向新用户进行信息推送。
实施上述信息推送装置,可以根据新用户有限的第一应用序列信息,确定出应用使用序列与新用户相似的目标用户;而由于目标用户已经积累有大量使用应用程序的历史行为数据,所以可以根据这些历史行为数据来确定目标用户对其使用的各个应用程序对应的各个标签的历史得分,进而根据历史得分预测目标用户在未来一段时间内对各个标签的未来得分。此外,考虑到新用户的兴趣爱好与目标用户相似,所以可以根据目标用户在未来一段时间内对各个标签的未来得分向新用户进行信息推送,以使得所推送的推送信息更加符合新用户的兴趣爱好,从而提高了向新用户推送信息的准确率。
请参阅图6,图6是本申请实施例公开的另一种信息推送装置的结构示意图,图6所示的信息推送装置同样可以应用于上述的服务器,图6所示的信息推送装置可以是由图5所示的信息推送装置优化得到的,图6所示的信息推送装置包括的查找单元502用于根据第一应用序列信息查找与新用户相似的目标用户的方式具体可以为:
查找单元502,用于通过双向语言模型对第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量,双向语言模型是基于各个应用程序的词向量维度信息训练得到的;词向量维度信息通过应用表征模型生成的,应用表征模型是根据多个样本应用序列信息,以及每个样本应用序列信息对应的补充信息训练得到的;以及,根据第一嵌入向量确定出与新用户相似的目标用户,目标用户对应的第二嵌入向量与第一嵌入向量的相似度大于第一阈值,第二嵌入向量是通过双向语言模型对目标用户的第二应用序列信息进行处理得到的。
实施上述信息推送装置,可以通过嵌入向量来表征用户的应用序列信息,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率。
作为一种可选的实施方式,图6所示的信息推送装置还可以包括第二获取单元505、构建单元506、生成单元507和训练单元508,其中:
第二获取单元505,用于在查找单元502通过双向语言模型对第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量之前,获取样本应用序列信息,和样本应用序列信息中包括的各个样本应用的补充信息;
构建单元506,用于将样本应用序列信息和补充信息输入应用表征模型,并在应用表征模型中,根据样本应用序列信息和补充信息,构建样本应用程序的有向有权图,并根据样本应用程序的有向有权图,随机生成多条随机应用序列信息;
生成单元507,用于在应用表征模型中,通过多条随机应用序列信息对词向量生成模型进行训练,并根据训练得到的词向量生成模型获取各个样本应用对应的词向量维度信息;
训练单元508,用于根据各个样本应用对应的词向量维度信息对待训练的双向语言模型进行训练。
实施上述信息推送装置,可以通过嵌入向量来表征用户的应用序列信息,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率。
作为一种可选的实施方式,查找单元502用于根据第一嵌入向量确定出与新用户相似的目标用户的方式具体可以为:
查找单元502,用于分别计算多个老用户的应用序列信息对应的第二嵌入向量,与第一嵌入向量的余弦相似度,得到与第一嵌入向量的余弦相似度大于第一阈值的第二嵌入向量;以及,将余弦相似度大于第一阈值的第二嵌入向量对应的老用户,确定为与新用户相似的目标用户。
实施上述信息推送装置,可以通过比较新用户和老用户的嵌入向量的余弦相似度,来确定出与新用户相似的目标用户,其中,由于该嵌入向量更加地简洁,使用后续服务器可以更加容易地根据新用户的第一嵌入向量来确定出于新用户相似的目标用户,以减少服务器的计算量和出错的概率。
作为一种可选的实施方式,样本应用程序的补充信息包括应用程序的类型、应用程序的名称、应用程序对应的推送信息、推送信息对应的开发单位中的一种或多种。
实施上述信息推送装置,可以将应用程序的多个补充信息经过一系列融合操作融合成一个嵌入向量,并使用一个嵌入向量来表征应用序列信息,从而可以更好地表征新用户的应用序列信息,因为新用户的应用序列信息的信息量通常较少,所以可以根据应用程序对应的补充信息,比如应用程序的类型、应用程序的开发者以及应用程序的描述等来补充和表征应用程序的向量信息,以提高后续根据第一嵌入向量匹配的目标用户更加匹配新用户。
作为一种可选的实施方式,第一确定单元503用于根据目标用户使用各个应用程序的历史行为数据,确定出目标用户对各个应用程序对应的各个标签的历史得分的方式具体可以为:
第一确定单元503,用于根据目标用户使用第一应用程序的历史行为数据,确定出目标用户在单位时间内对第一应用程序的使用程度值,第一应用程序为目标用户使用的各个应用程序中的任一应用程序;以及,根据使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度,确定出目标用户对第一标签在单位时间内的历史得分,区分程度值用于表征第一标签对使用第一应用程序的用户的区分程度。
实施上述信息推送装置,可以根据目标用户在单位时间内对第一应用程序的使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度三个维度,来确定出目标用户对第一标签在单位时间内的历史得分,从而方便服务器后续根据历史得分来预测用户在未来一段时间内对标签的未来得分,提高了推送的效率。
作为一种可选的实施方式,第一确定单元503用于根据目标用户使用第一应用程序的历史行为数据,确定出目标用户在单位时间内对第一应用程序的使用程度值的方式具体可以为:
第一确定单元503,用于根据目标用户在单位时间内使用第一应用程序的使用时长,确定出目标用户在单位时间内对第一应用程序的使用程度值,其中,使用程度值与使用时长成正相关关系。
实施上述信息推送装置,可以对多个用户使用应用程序的时长序列进行等级划分,从而可以更加直接地确定出用户对应用程序的使用程度值。
作为一种可选的实施方式,图6所示的信息推送装置还可以包括第三获取单元509和第二确定单元510,其中:
第三获取单元509,用于在根据使用程度值、第一应用程序对应的第一标签的区分程度值和第一应用程序与第一标签的匹配度,确定出目标用户对第一标签在单位时间内的历史得分之前,获取使用第一应用程序的用户数量;
第二确定单元510,用于根据用户数量确定出第一应用程序对应的第一标签的区分程度值,其中,区分程度值与用户数量成负相关关系。
实施上述信息推送装置,可以根据应用程序的用户数量来快速确定出,该应用程序对其对应的标签的区分程度值,从而减低了历史得分的确定难度。
作为一种可选的实施方式,推送单元504用于根据历史得分预测目标用户在未来第一时间段内对各个标签的未来得分的方式具体可以为:
推送单元504,用于通过时间序列预测模型对目标用户在历史第二时间段内对各个标签的历史得分进行分析,以预测得到目标用户在未来第一时间段内对应的未来得分序列,并基于未来得分序列在未来第一时间段内向新用户进行信息推送。
实施上述信息推送装置,服务器可以根据用户对标签的历史得分,来预测用户在未来一段时间内对标签的未来得分序列,进而后续服务器可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
作为一种可选的实施方式,推送单元504用于通过时间序列预测模型对目标用户在历史第二时间段内对各个标签的历史得分进行分析,以预测得到目标用户在未来第一时间段内对应的未来得分序列的方式具体可以为:
推送单元504,用于通过时间序列预测模型对目标用户在历史第二时间段内对第二标签的历史得分进行分析,以预测得到目标用户在未来第一时间段内对第二标签的未来得分序列,第二标签为各个标签中的任一标签,其中,未来得分序列是以单位时间为维度对第二标签的未来得分进行排列的。
实施上述信息推送装置,服务器可以根据用户对标签的历史得分,来预测用户在未来一段时间内对标签的未来得分序列,进而后续服务器可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
作为一种可选的实施方式,推送单元504用于在未来第一时间段内根据未来得分向新用户进行信息推送的方式具体可以为:
推送单元504,用于在第二标签的未来得分序列中,确定出分数最高的未来得分作为目标未来得分;以及,基于目标未来得分在未来得分序列中的序列位置确定出推送时间,并在推送时间向新用户推送第二标签对应的推送信息。
实施上述信息推送装置,可以根据未来得分序列选择最合适的时间点来向用户进行信息推送,从而可以提高服务器向用户推送信息的效率。
请参阅图7,图7是本申请实施例公开的一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行上述各实施例公开的信息推送方法。
本申请实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行上述各实施例公开的信息推送方法。
本申请实施例公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本申请的各个实施例公开的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本申请实施例公开的一种信息推送方法及装置、电子设备、计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种信息推送方法,其特征在于,所述方法包括:
获取新用户的第一应用序列信息;
通过双向语言模型对所述第一应用序列信息进行处理,以得到第一应用序列信息对应的第一嵌入向量,并根据所述第一嵌入向量确定与所述新用户相似的目标用户,所述第一嵌入向量是融合多个信息维度的向量,所述目标用户的第二应用序列信息与所述第一应用序列信息之间的相似度大于第一阈值;
根据所述目标用户使用各个应用程序的历史行为数据,确定出所述目标用户对所述各个应用程序对应的各个标签的历史得分;
根据所述历史得分预测所述目标用户在未来第一时间段内对所述各个标签的未来得分,并在所述未来第一时间段内根据所述未来得分向所述新用户进行信息推送。
2.根据权利要求1所述的方法,其特征在于,所述双向语言模型是基于各个应用程序的词向量维度信息训练得到的;所述词向量维度信息是通过应用表征模型生成的,所述应用表征模型是根据多个样本应用序列信息,以及每个所述样本应用序列信息中包括的各个样本应用的补充信息训练得到的;所述目标用户对应的第二嵌入向量与所述第一嵌入向量的相似度大于第一阈值,所述第二嵌入向量是通过所述双向语言模型对所述目标用户的第二应用序列信息进行处理得到的。
3.根据权利要求2所述的方法,其特征在于,在所述通过双向语言模型对所述第一应用序列信息进行处理,以得到所述第一应用序列信息对应的第一嵌入向量之前,所述方法还包括:
获取样本应用序列信息,和所述样本应用序列信息中包括的各个样本应用的补充信息;
将所述样本应用序列信息和所述补充信息输入应用表征模型,并在所述应用表征模型中,根据所述样本应用序列信息和所述补充信息,构建所述样本应用的有向有权图,并根据所述有向有权图随机生成多条随机应用序列信息;
在所述应用表征模型中,通过所述多条随机应用序列信息对词向量生成模型进行训练,并根据训练得到的词向量生成模型获取各个所述样本应用对应的词向量维度信息;
根据各个所述样本应用对应的所述词向量维度信息对待训练的双向语言模型进行训练。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一嵌入向量确定出与所述新用户相似的目标用户,包括:
分别计算多个老用户的应用序列信息对应的第二嵌入向量,与所述第一嵌入向量的余弦相似度,得到与所述第一嵌入向量的余弦相似度大于第一阈值的第二嵌入向量;
将所述余弦相似度大于第一阈值的第二嵌入向量对应的老用户,确定为与所述新用户相似的目标用户。
5.根据权利要求2~4任一项所述的方法,其特征在于,所述补充信息包括应用程序的类型、应用程序的名称、应用程序对应的推送信息、所述推送信息对应的开发单位中的一种或多种。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户使用各个应用程序的历史行为数据,确定出所述目标用户对所述各个应用程序对应的各个标签的历史得分,包括:
根据所述目标用户使用第一应用程序的历史行为数据,确定出所述目标用户在单位时间内对所述第一应用程序的使用程度值,所述第一应用程序为所述目标用户使用的各个应用程序中的任一应用程序;
根据所述使用程度值、所述第一应用程序对应的第一标签的区分程度值和所述第一应用程序与所述第一标签的匹配度,确定出所述目标用户对所述第一标签在所述单位时间内的历史得分,所述区分程度值用于表征所述第一标签对使用所述第一应用程序的用户的区分程度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标用户使用第一应用程序的历史行为数据,确定出所述目标用户在单位时间内对所述第一应用程序的使用程度值,包括:
根据所述目标用户在单位时间内使用第一应用程序的使用时长,确定出所述目标用户在单位时间内对所述第一应用程序的使用程度值,其中,所述使用程度值与所述使用时长成正相关关系。
8.根据权利要求6所述的方法,其特征在于,在所述根据所述使用程度值、所述第一应用程序对应的第一标签的区分程度值和所述第一应用程序与所述第一标签的匹配度,确定出所述目标用户对所述第一标签在所述单位时间内的历史得分之前,所述方法还包括:
获取使用第一应用程序的用户数量;
根据所述用户数量确定出所述第一应用程序对应的第一标签的区分程度值,其中,所述区分程度值与所述用户数量成负相关关系。
9.根据权利要求1所述的方法,其特征在于,所述根据所述历史得分预测所述目标用户在未来第一时间段内对所述各个标签的未来得分,包括:
通过时间序列预测模型对所述目标用户在历史第二时间段内对所述各个标签的历史得分进行分析,以预测得到所述目标用户在未来第一时间段内对应的未来得分序列,并基于所述未来得分序列在所述未来第一时间段内向所述新用户进行信息推送。
10.根据权利要求9所述的方法,其特征在于,所述通过时间序列预测模型对所述目标用户在历史第二时间段内对所述各个标签的历史得分进行分析,以预测得到所述目标用户在未来第一时间段内对应的未来得分序列,包括:
通过时间序列预测模型对所述目标用户在历史第二时间段内对第二标签的历史得分进行分析,以预测得到所述目标用户在未来第一时间段内对所述第二标签的未来得分序列,所述第二标签为所述各个标签中的任一标签,其中,所述未来得分序列是以单位时间为维度对所述第二标签的未来得分进行排列的。
11.根据权利要求10所述的方法,其特征在于,所述在所述未来第一时间段内根据所述未来得分向所述新用户进行信息推送,包括:
在所述第二标签的未来得分序列中,确定出分数最高的未来得分作为目标未来得分;
基于所述目标未来得分在所述未来得分序列中的序列位置确定出推送时间,并在所述推送时间向所述新用户推送所述第二标签对应的推送信息。
12.一种信息推送装置,其特征在于,包括:
第一获取单元,用于获取新用户的第一应用序列信息;
查找单元,用于通过双向语言模型对所述第一应用序列信息进行处理,以得到所述第一应用序列信息对应的第一嵌入向量,并根据所述第一嵌入向量确定出与所述新用户相似的目标用户,所述第一嵌入向量是融合多个信息维度的向量,所述目标用户的第二应用序列信息与所述第一应用序列信息之间的相似度大于第一阈值;
第一确定单元,用于根据所述目标用户使用各个应用程序的历史行为数据,确定出所述目标用户对所述各个应用程序对应的各个标签的历史得分;
推送单元,用于根据所述历史得分预测所述目标用户在未来第一时间段内对所述各个标签的未来得分,并在所述未来第一时间段内根据所述未来得分向所述新用户进行信息推送。
13.一种电子设备,其特征在于,包括存储有可执行程序代码的存储器,以及与所述存储器耦合的处理器;其中,所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1~11任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~11任一项所述的方法。
CN202110296517.XA 2021-03-19 2021-03-19 信息推送方法及装置、电子设备、计算机可读存储介质 Active CN113010788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110296517.XA CN113010788B (zh) 2021-03-19 2021-03-19 信息推送方法及装置、电子设备、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110296517.XA CN113010788B (zh) 2021-03-19 2021-03-19 信息推送方法及装置、电子设备、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113010788A CN113010788A (zh) 2021-06-22
CN113010788B true CN113010788B (zh) 2023-05-23

Family

ID=76403339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110296517.XA Active CN113010788B (zh) 2021-03-19 2021-03-19 信息推送方法及装置、电子设备、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113010788B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629984B (zh) * 2023-07-24 2024-02-06 中信证券股份有限公司 基于嵌入模型的产品信息推荐方法、装置、设备和介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016181475A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 情報提示装置、情報提示方法およびプログラム
CN107958042A (zh) * 2017-11-23 2018-04-24 维沃移动通信有限公司 一种目标专题的推送方法及移动终端
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN109460512A (zh) * 2018-10-25 2019-03-12 腾讯科技(北京)有限公司 推荐信息处理方法、装置、设备及存储介质
CN109685610A (zh) * 2018-12-14 2019-04-26 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备
CN110489644A (zh) * 2019-08-13 2019-11-22 腾讯科技(北京)有限公司 信息推送方法、装置、计算机可读存储介质和计算机设备
CN111143178A (zh) * 2019-12-12 2020-05-12 支付宝(杭州)信息技术有限公司 用户行为分析方法、装置及设备
CN111277706A (zh) * 2020-01-06 2020-06-12 宇龙计算机通信科技(深圳)有限公司 一种应用推荐方法、装置、存储介质及电子设备
CN112102031A (zh) * 2020-08-24 2020-12-18 深圳市元征科技股份有限公司 一种推荐方法、推荐装置及终端设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11030414B2 (en) * 2017-12-26 2021-06-08 The Allen Institute For Artificial Intelligence System and methods for performing NLP related tasks using contextualized word representations
US11397785B2 (en) * 2019-01-18 2022-07-26 Optimizely, Inc. Identifying dynamic audiences based on user interests

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016181475A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 情報提示装置、情報提示方法およびプログラム
CN107958042A (zh) * 2017-11-23 2018-04-24 维沃移动通信有限公司 一种目标专题的推送方法及移动终端
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN109460512A (zh) * 2018-10-25 2019-03-12 腾讯科技(北京)有限公司 推荐信息处理方法、装置、设备及存储介质
CN109685610A (zh) * 2018-12-14 2019-04-26 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备
CN110489644A (zh) * 2019-08-13 2019-11-22 腾讯科技(北京)有限公司 信息推送方法、装置、计算机可读存储介质和计算机设备
CN111143178A (zh) * 2019-12-12 2020-05-12 支付宝(杭州)信息技术有限公司 用户行为分析方法、装置及设备
CN111277706A (zh) * 2020-01-06 2020-06-12 宇龙计算机通信科技(深圳)有限公司 一种应用推荐方法、装置、存储介质及电子设备
CN112102031A (zh) * 2020-08-24 2020-12-18 深圳市元征科技股份有限公司 一种推荐方法、推荐装置及终端设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An Attentive Deep Supervision based Semantic Matching Framework For Tag Recommendation in Software;Xinhao Zheng等;《2020 27th Asia-Pacific Software Engineering Conference (APSEC)》;20210301;490-494 *
基于深度学习的实体关系联合抽取方法研究;潘航宇;《中国优秀硕士学位论文全文数据库信息科技辑》;20191215(第12期);I138-685 *
语义支持的空间信息服务组合关键技术研究;陈科;《中国博士学位论文全文数据库基础科学辑》;20130615(第6期);A008-6 *

Also Published As

Publication number Publication date
CN113010788A (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN109635155B (zh) 为用户推送视频的方法、装置、电子设备及存储介质
CN109889891B (zh) 获取目标媒体文件的方法、装置及存储介质
CN107885852B (zh) 一种基于app使用记录的app推荐方法及系统
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN112100504B (zh) 内容推荐方法、装置、电子设备及存储介质
CN111159546A (zh) 事件推送方法、装置、计算机可读存储介质和计算机设备
CN111258593B (zh) 应用程序预测模型的建立方法、装置、存储介质及终端
CN112364184A (zh) 多媒体数据的排序方法、装置、服务器及存储介质
CN111898379A (zh) 槽填充模型训练方法和自然语言理解模型
CN112989212A (zh) 媒体内容推荐方法、装置和设备及计算机存储介质
CN112699309A (zh) 资源推荐方法、装置、可读介质以及设备
CN111177568B (zh) 基于多源数据的对象推送方法、电子装置及存储介质
CN110598126B (zh) 基于行为习惯的跨社交网络用户身份识别方法
CN112733024A (zh) 一种信息推荐的方法及装置
Deshpande Prediction & evaluation of online news popularity using machine intelligence
CN111625680A (zh) 确定搜索结果的方法及装置
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置
CN113010788B (zh) 信息推送方法及装置、电子设备、计算机可读存储介质
CN113836388A (zh) 信息推荐方法、装置、服务器及存储介质
CN112115354A (zh) 信息处理方法、装置、服务器及存储介质
CN108875014B (zh) 基于大数据与人工智能的精准项目推荐方法和机器人系统
JP6896594B2 (ja) 楽曲選択装置、楽曲選択方法及びプログラム
CN110188277A (zh) 一种资源的推荐方法及装置
CN111831892A (zh) 信息推荐方法、信息推荐装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant