CN117708439A - 一种目标文本的推送方法、装置、介质及设备 - Google Patents
一种目标文本的推送方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN117708439A CN117708439A CN202410167630.1A CN202410167630A CN117708439A CN 117708439 A CN117708439 A CN 117708439A CN 202410167630 A CN202410167630 A CN 202410167630A CN 117708439 A CN117708439 A CN 117708439A
- Authority
- CN
- China
- Prior art keywords
- initial
- text
- target text
- user
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 101
- 238000012545 processing Methods 0.000 abstract description 15
- 238000012549 training Methods 0.000 abstract description 5
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及数据处理技术领域,尤其涉及一种目标文本的推送方法、装置、介质及设备,包括:获取初始用户信息集和初始文本集;基于初始用户信息集和初始文本集对预设文本推送模型进行训练,生成目标文本推送模型;获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户;可知,通过文本和用户分别进行处理,得到文本向量和用户向量,在文本向量与用户向量进行匹配准确的确定出适合推送文本的用户,同时将用户向量存储且定期进行更新,能够快速确定合推送文本的用户。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种目标文本的推送方法、装置、介质及设备。
背景技术
随着手机普及使用,需要对手机的使用用户进行推送文本或者推送消息,能够使手机的使用用户,尽快获取到一些信息。
现有技术中,将消息或者文本推送到合适的用户或者快速的推到用户时会采用召回、粗排、精排、重排等几个阶段,其中召回和重排通常以规则为主,而粗排和精排可以以机器学习模型为主。粗排的作用往往是在召回的大量待推送信息内容中(如几百个到几千个),采用比较简单的模型,粗筛出用户可能偏好的一部分(如几十到几百个),然后输出给精排模型打分,以按照精排模型的打分结果进行重排;但是,推送消息或者文本时精排会推送的慢,而粗排会推送的无法准确。
因此,如何快速和准确的确定可以推送消息或者文本的用户成为亟待解决的问题。
发明内容
针对上述技术问题,本发明采用的技术方案为一种目标文本的推送方法,所述方法包括如下步骤:
获取初始用户信息集和初始文本集。
基于初始用户信息集和初始文本集对预设文本推送模型进行训练,生成目标文本推送模型。
获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
本发明还提供了一种目标文本的推送装置,所述装置包括:
获取模块,用于获取初始用户信息集和初始文本集。
确定模块,用于基于初始用户信息集和初始文本集对预设文本推送模型进行校验,确定出目标文本推送模型。
生成模块,用于获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
本发明还提供了一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现上述的目标文本的推送方法。
本发明还提供了一种电子设备,包括处理器和上述的非瞬时性计算机可读存储介质。
本发明至少具有以下有益效果:获取初始用户信息集和初始文本集;基于初始用户信息集和初始文本集对预设文本推送模型进行训练,生成目标文本推送模型;获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户;可知,通过文本和用户分别进行处理,得到文本向量和用户向量,在文本向量与用户向量进行匹配准确的确定出适合推送文本的用户,同时将用户向量存储且定期进行更新,能够快速确定合推送文本的用户。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种目标文本的推送的流程图;
图2为本发明实施例一提供的S3的流程图;
图3为本发明实施例二提供的一种目标文本的推送装置的结构示意图;
图4为本发明实施例二提供的模块3的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
如图1所示,本实施例一提供了一种目标文本的推送方法,所述方法包括如下步骤:
S1,获取初始用户信息集和初始文本集。
具体的,所述初始用户信息集包括若干个初始用户信息,任一所述初始用户信息包括初始用户ID、初始用户ID对应的初始APP列表、初始用户ID对应的初始APP列表中每一初始APP名称对应的初始APP标签列表和初始用户ID对应的历史文本集。
进一步的,所述初始用户ID是指初始用户的唯一身份标识。
进一步的,所述初始APP列表包括若干个初始APP名称,所述初始APP名称对应的初始APP是指初始用户ID对应的初始用户安装的APP。
进一步的,每一初始APP名称对应的初始APP标签列表包括若干个初始APP标签,所述初始APP标签表征初始APP的分类,例如,初始APP标签为影音、聊天、学习中一个或者多个。
进一步的,所述初始用户ID对应的历史文本集包括若干个初始用户ID对应的历史文本,其中,任一初始用户ID对应的历史文本是指初始用户ID对应的初始用户点击的推送文本。
具体的,所述初始文本集包括若干个初始文本,其中,初始文本是指预先采集到的推送文本。
S2,基于初始用户信息集和初始文本集对预设文本推送模型进行校验,确定出目标文本推送模型。
具体的,所述预设文本推送模型为已经训练完成的文本推送模型其中,优选的,所述预设文本推送模型为DSSM模型。
在一个具体的实施例中,在S2步骤中还包括如下步骤:
S21,从所述初始用户信息集中获取第一初始用户信息集A={A1,A2,……,Ai,……,Am},Ai={Ai1,Ai2,Ai3},Ai1是指第i个初始用户ID,Ai2={A1 i2,A2 i2,……,Aj i2,……,An(i) i2},Aj i2是指Ai1对应的第j个初始APP名称,Ai3={A1 i3,A2 i3,……,Aj i3,……,An(i) i3},Aj i3={Aj1 i3,Aj2 i3,……,Ajr i3,……,Ajs(j) i3},Ajr i3是指Aj i2对应的第r个初始APP标签,i的取值范围为1至m,m为初始用户ID数量,j的取值范围为1至n(i),n(i)为Ai1对应的初始APP名称数量,r的取值范围为1至s(j),s(j)为Aj i2对应的初始APP标签数量。
S22,将A输入至所述预设文本推送模型中第一预设子模型,获取到第一中间用户向量B1={B1 1,B1 2,……,B1 i,……,B1 m},其中,B1 i是指Ai1对应的第一中间用户向量;可以理解为:A通过所述预设文本推送模型中第一预设子模型内的第一SENet模块生成B1,例如,将A1转换成文本(A11,A1 12,A11 13,A12 13,……,A1r 13,……,A1s(1) 13,……,Am1,An(m) m2,An(m)1 m3,An(m)2 m3,……,An(m)r m3,……,An(m)s(n(m)) m3),再基于A1转换的文本通过第一SENet模块生成B1 1,本领域技术人员知晓SENet模块生成向量的方法,在此不再赘述。
S23,从所述初始用户信息集中获取第二初始用户信息集A0={A0 1,A0 2,……,A0 i,……,A0 m},A0 i={A0 i1,A0 i2……,A0 ig,……,A0 iz(i)},A0 ig是指Ai1对应的第g个历史文本,g的取值范围为1至z(i),z(i)是指Ai1对应的历史文本数量。
S24,将A0输入至所述预设文本推送模型中第一预设子模型,获取到第二中间用户向量集B2={B2 1,B2 2,……,B2 i,……,B2 m},其中,B2 i是指Ai1对应的第二中间用户向量;可以理解为:A通过所述预设文本推送模型中第一预设子模型内的第二SENet模块生成B2,例如,A0 i中所有的历史文本转换成一个文本,在基于A0 i转换的文本通过第一SENet模块生成B2 1。
S25,获取所述初始文本集C0对应的初始文本标签集C={C1,C2,……,Cx,……,Cp},Cx={Cx1,Cx2,……,Cxy,……,Cxq(x)},其中,C0={C0 1,C0 2,……,C0 x,……,C0 p},C0 x是指第x个初始文本,Cxy是指C0 x的第y个初始文本标签,x的取值范围为1至p,p为初始文本的数量,y的取值范围为1至q(y),q(y)为C0 x的初始文本标签数量。
S26,对C和C0输入至所述预设文本推送模型中第二预设子模型进行处理,生成所述初始文本集对应的初始文本向量集D={D1,D2,……,Dx,……,Dp},Dx是指C0 x对应的初始文本向量;可以理解为:C和C0通过所述预设文本推送模型中第二预设子模型内生成D,例如,本领域技术人员知晓生成文本向量的方法,在此不再赘述。
S27,根据B1、B2和D,确定出目标文本推送模型。
具体的,在S27步骤中还包括如下步骤:
S271,获取B1 i=(B1 i1,……,B1 ih,……,B1 iu),其中,B1 ih是指第一中间用户向量中第h位bit值。
S272,获取B2 i=(B2 i1,……,B2 ih,……,B2 iu),其中,B2 ih是指第二中间用户向量中第h位bit值。
S273,获取Dx=(Dx1,……,Dxh,……,Dxu),其中,B2 ih是指初始文本向量中第h位bit值。
其中,h的取值范围为1至u,u是向量的bit位数,优选的,u=768。
S274,将B1 i,B2 i和Dx,生成第i个初始用户ID的第x个关键文本优先级Fix,其中,Fix符合如下条件:
Fix=∑u h=1(B1 ih+B2 ih)×Dxh/2。
S275,基于关键文本优先级集F,筛选出初始用户ID对应的第一文本优先级列表G1和第二文本优先级集G2;其中,F={F1,F2,……,Fi,……,Fm},Fi={Fi1,Fi2,……,Fix,……,Fip};G1={G11,G12,……,G1i,……,G1m},G2={G21,G22,……,G2i,……,G2m},G2i={G1 2i,G2 2i,……,Gw 2i,……,Gv 2i},G1i是指第i个初始用户ID的第一文本优先级,即Fi中最大关键文本优先级,Gw 2i是指第i个初始用户ID的第w个第二文本优先级,即Fi中除最大关键文本优先级之外的任一关键文本优先级,w的取值范围为1至v,v是第二文本优先级的数量且v=p-1。
S276,根据G1和G2,确定出预设文本推送模型的优先级F0,F0符合如下条件:
,其中,m是指关键用户ID,可以理解为:关键用户ID是指任一初始用户ID对应的第一文本优先级与初始用户ID对应的预先设置的文本优先级之差小于预设优先级差阈值时的初始用户ID,其中,初始用户ID对应的预先设置的文本优先级对应的文本与初始用户ID对应的第一文本优先级对应的文本为相同文本,本领域技术人员根据实际需求设置预先优先级差阈值,在此不再赘述
S277,当F0<△F时,确定预设文本推送模型为非目标文本推送模型。
S278,当F0≥△F时,确定预设文本推送模型为目标文本推送模型,其中,△F为预先优先级阈值,本领域技术人员根据实际需求设置预先优先级阈值,在此不再赘述。
上述,能够通过两个不同的子模型之间文本向量关系,确定出预设文本推送模型是否满足条件,进而确定目标文本推送模,以保证后续的目标推送文本向目标用户推送的准确性,同时也加快了目标推送文本的处理效率。
S3,获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
具体的,在S3步骤中还包括如下步骤确定目标用户,如图2所示:
S31,获取所述目标文本集且将所述目标文本集中任一目标文本通过所述目标文本推送模型中的第二目标子模型,生成所述目标文本对应的目标文本向量;可以理解为:S31的具体步骤参照S25-S26步骤,在此不再赘述。
S32,根据所述目标文本向量和所述目标文本对应的指定用户向量集,确定出所述目标文本向量对应的目标用户。
具体的,在S32步骤中还包括如下步骤:
S321,获取原始用户信息集,其中,所述原始用户信息集包括若干个原始用户信息,原始用户信息包含的信息的维度与初始用户信息包含的信息的维度一致。
S322,基于原始用户信息集输入至所述目标文本推送模型中,获取原始用户信息集对应的原始用户向量集;可以理解为:所述原始用户向量集包括原始用户信息对应的第一原始用户向量和原始用户信息对应的第二原始用户向量,其中,原始用户信息对应的第一原始用户向量和原始用户信息对应的第二原始用户向量的获取方式与S21至S24步骤一致,在此不再赘述。
S323,在预设时间段内,获取到第一增添用户信息集且将第一增添用户信息集输入至所述目标文本推送模型中获取第一增添用户信息集对应的第一增添用户信息向量集,以使得将第一增添用户信息向量集插入至所述原始用户向量集中,生成第二增添用户信息集,其中,第一增添用户信息向量集的获取方式与所述原始用户向量集的获取方式一致,在此不再赘述,其中,第二增添用户信息集存储在本地服务器中,优选的,所述预设时间段的取值为1天。
S324,当所述第二增添用户信息集对应的时间点与采集所述目标文本对应的时间点一致时,确定所述第二增添用户信息集为指定用户向量集。
S325,基于所述目标文本向量和所述目标文本对应的指定用户向量集,获取所述目标文本向量对应的目标文本优先级集,其中,所述目标文本优先级集包括若干个目标文本优先级,所述目标文本优先级是指所述目标文本向量与所述指定用户向量集中任一指定用户向量之间的优先级,所述目标文本优先级的获取方式与关键文本优先级获取的方式一致,在此不再赘述。
S326,从所述目标文本向量对应的目标文本优先级集中选取大于目标文本优先级阈值的指定用户作为目标用户,本领域技术人员根据实际需求设置目标文本优先级阈值,在此不再赘述。
上述,能够通过无需每一进行文本推送时再计算一次用户向量,加快了文本推送的速度,实现海量文本推送。
本实施例一能够获取初始用户信息集和初始文本集;基于初始用户信息集和初始文本集对预设文本推送模型进行训练,生成目标文本推送模型;获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户;可知,通过文本和用户分别进行处理,得到文本向量和用户向量,在文本向量与用户向量进行匹配准确的确定出适合推送文本的用户,同时将用户向量存储且定期进行更新,能够快速确定合推送文本的用户。
实施例二
如图3所示,本实施例二提供了一种目标文本的推送装置,所述装置包括:
获取模块1,用于获取初始用户信息集和初始文本集。
具体的,所述初始用户信息集包括若干个初始用户信息,任一所述初始用户信息包括初始用户ID、初始用户ID对应的初始APP列表、初始用户ID对应的初始APP列表中每一初始APP名称对应的初始APP标签列表和初始用户ID对应的历史文本集。
进一步的,所述初始用户ID是指初始用户的唯一身份标识。
进一步的,所述初始APP列表包括若干个初始APP名称,所述初始APP名称对应的初始APP是指初始用户ID对应的初始用户安装的APP。
进一步的,每一初始APP名称对应的初始APP标签列表包括若干个初始APP标签,所述初始APP标签表征初始APP的分类,例如,初始APP标签为影音、聊天、学习中一个或者多个。
进一步的,所述初始用户ID对应的历史文本集包括若干个初始用户ID对应的历史文本,其中,任一初始用户ID对应的历史文本是指初始用户ID对应的初始用户点击的推送文本。
具体的,所述初始文本集包括若干个初始文本,其中,初始文本是指预先采集到的推送文本。
确定模块2,用于基于初始用户信息集和初始文本集对预设文本推送模型进行校验,确定出目标文本推送模型。
具体的,所述预设文本推送模型为已经训练完成的文本推送模型其中,优选的,所述预设文本推送模型为DSSM模型。
在一个具体的实施例中,确定模块2还包括:
第一初始用户信息集获取模块21,用于从所述初始用户信息集中获取第一初始用户信息集A={A1,A2,……,Ai,……,Am},Ai={Ai1,Ai2,Ai3},Ai1是指第i个初始用户ID,Ai2={A1 i2,A2 i2,……,Aj i2,……,An(i) i2},Aj i2是指Ai1对应的第j个初始APP名称,Ai3={A1 i3,A2 i3,……,Aj i3,……,An(i) i3},Aj i3={Aj1 i3,Aj2 i3,……,Ajr i3,……,Ajs(j) i3},Ajr i3是指Aj i2对应的第r个初始APP标签,i的取值范围为1至m,m为初始用户ID数量,j的取值范围为1至n(i),n(i)为Ai1对应的初始APP名称数量,r的取值范围为1至s(j),s(j)为Aj i2对应的初始APP标签数量。
第一中间用户向量获取模块22,用于将A输入至所述预设文本推送模型中第一预设子模型,获取到第一中间用户向量B1={B1 1,B1 2,……,B1 i,……,B1 m},其中,B1 i是指Ai1对应的第一中间用户向量;可以理解为:A通过所述预设文本推送模型中第一预设子模型内的第一SENet模块生成B1,例如,将A1转换成文本(A11,A1 12,A11 13,A12 13,……,A1r 13,……,A1s (1) 13,……,Am1,An(m) m2,An(m)1 m3,An(m)2 m3,……,An(m)r m3,……,An(m)s(n(m)) m3),再基于A1转换的文本通过第一SENet模块生成B1 1,本领域技术人员知晓SENet模块生成向量的方法,在此不再赘述。
第二初始用户信息集获取模块23,用于从所述初始用户信息集中获取第二初始用户信息集A0={A0 1,A0 2,……,A0 i,……,A0 m},A0 i={A0 i1,A0 i2……,A0 ig,……,A0 iz(i)},A0 ig是指Ai1对应的第g个历史文本,g的取值范围为1至z(i),z(i)是指Ai1对应的历史文本数量。
第二中间用户向量集获取模块24,用于将A0输入至所述预设文本推送模型中第一预设子模型,获取到第二中间用户向量集B2={B2 1,B2 2,……,B2 i,……,B2 m},其中,B2 i是指Ai1对应的第二中间用户向量;可以理解为:A通过所述预设文本推送模型中第一预设子模型内的第二SENet模块生成B2,例如,A0 i中所有的历史文本转换成一个文本,在基于A0 i转换的文本通过第一SENet模块生成B2 1。
初始文本标签获取模块25,用于获取所述初始文本集C0对应的初始文本标签集C={C1,C2,……,Cx,……,Cp},Cx={Cx1,Cx2,……,Cxy,……,Cxq(x)},其中,C0={C0 1,C0 2,……,C0 x,……,C0 p},C0 x是指第x个初始文本,Cxy是指C0 x的第y个初始文本标签,x的取值范围为1至p,p为初始文本的数量,y的取值范围为1至q(y),q(y)为C0 x的初始文本标签数量。
初始文本向量集生成模块26,用于对C和C0输入至所述预设文本推送模型中第二预设子模型进行处理,生成所述初始文本集对应的初始文本向量集D={D1,D2,……,Dx,……,Dp},Dx是指C0 x对应的初始文本向量;可以理解为:C和C0通过所述预设文本推送模型中第二预设子模型内生成D,例如,本领域技术人员知晓生成文本向量的方法,在此不再赘述。
第一确定模块27,用于根据B1、B2和D,确定出目标文本推送模型。
具体的,第一确定模块27包括:
第一执行模块271,用于获取B1 i=(B1 i1,……,B1 ih,……,B1 iu),其中,B1 ih是指第一中间用户向量中第h位bit值。
第二执行模块272,用于获取B2 i=(B2 i1,……,B2 ih,……,B2 iu),其中,B2 ih是指第二中间用户向量中第h位bit值。
第三执行模块273,用于获取Dx=(Dx1,……,Dxh,……,Dxu),其中,B2 ih是指初始文本向量中第h位bit值。
其中,h的取值范围为1至u,u是向量的bit位数,优选的,u=768。
第四执行模块274,用于将B1 i,B2 i和Dx,生成第i个初始用户ID的第x个关键文本优先级Fix,其中,Fix符合如下条件:
Fix=∑u h=1(B1 ih+B2 ih)×Dxh/2。
第五执行模块275,用于基于关键文本优先级集F,筛选出初始用户ID对应的第一文本优先级列表G1和第二文本优先级集G2;其中,F={F1,F2,……,Fi,……,Fm},Fi={Fi1,Fi2,……,Fix,……,Fip};G1={G11,G12,……,G1i,……,G1m},G2={G21,G22,……,G2i,……,G2m},G2i={G1 2i,G2 2i,……,Gw 2i,……,Gv 2i},G1i是指第i个初始用户ID的第一文本优先级,即Fi中最大关键文本优先级,Gw 2i是指第i个初始用户ID的第w个第二文本优先级,即Fi中除最大关键文本优先级之外的任一关键文本优先级,w的取值范围为1至v,v是第二文本优先级的数量且v=p-1。
第六执行模块276,用于根据G1和G2,确定出预设文本推送模型的优先级F0,F0符合如下条件:
,其中,m是指关键用户ID,可以理解为:关键用户ID是指任一初始用户ID对应的第一文本优先级与初始用户ID对应的预先设置的文本优先级之差小于预设优先级差阈值时的初始用户ID,其中,初始用户ID对应的预先设置的文本优先级对应的文本与初始用户ID对应的第一文本优先级对应的文本为相同文本,本领域技术人员根据实际需求设置预先优先级差阈值,在此不再赘述
第七执行模块277,用于当F0<△F时,确定预设文本推送模型为非目标文本推送模型。
第八执行模块278,用于当F0≥△F时,确定预设文本推送模型为目标文本推送模型,其中,△F为预先优先级阈值,本领域技术人员根据实际需求设置预先优先级阈值,在此不再赘述。
上述,能够通过两个不同的子模型之间文本向量关系,确定出预设文本推送模型是否满足条件,进而确定目标文本推送模,以保证后续的目标推送文本向目标用户推送的准确性,同时也加快了目标推送文本的处理效率。
生成模块3,获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
具体的,生成模块3包括,如图4所示:
目标文本向量生成模块31,用于获取所述目标文本集且将所述目标文本集中任一目标文本通过所述目标文本推送模型中的第二目标子模型,生成所述目标文本对应的目标文本向量;可以理解为:S31的具体步骤参照S25-S26步骤,在此不再赘述。
目标用户确定模块32,用于根据所述目标文本向量和所述目标文本对应的指定用户向量集,确定出所述目标文本向量对应的目标用户。
具体的,目标用户确定模块32包括:
第一处理模块321,用于获取原始用户信息集,其中,所述原始用户信息集包括若干个原始用户信息,原始用户信息包含的信息的维度与初始用户信息包含的信息的维度一致。
第二处理模块322,用于基于原始用户信息集输入至所述目标文本推送模型中,获取原始用户信息集对应的原始用户向量集;可以理解为:所述原始用户向量集包括原始用户信息对应的第一原始用户向量和原始用户信息对应的第二原始用户向量,其中,原始用户信息对应的第一原始用户向量和原始用户信息对应的第二原始用户向量的获取方式与S21至S24步骤一致,在此不再赘述。
第三处理模块323,用于在预设时间段内,获取到第一增添用户信息集且将第一增添用户信息集输入至所述目标文本推送模型中获取第一增添用户信息集对应的第一增添用户信息向量集,以使得将第一增添用户信息向量集插入至所述原始用户向量集中,生成第二增添用户信息集,其中,第一增添用户信息向量集的获取方式与所述原始用户向量集的获取方式一致,在此不再赘述,其中,第二增添用户信息集存储在本地服务器中,优选的,所述预设时间段的取值为1天。
第四处理模块324,用于当所述第二增添用户信息集对应的时间点与采集所述目标文本对应的时间点一致时,确定所述第二增添用户信息集为指定用户向量集。
第五处理模块325,用于基于所述目标文本向量和所述目标文本对应的指定用户向量集,获取所述目标文本向量对应的目标文本优先级集,其中,所述目标文本优先级集包括若干个目标文本优先级,所述目标文本优先级是指所述目标文本向量与所述指定用户向量集中任一指定用户向量之间的优先级,所述目标文本优先级的获取方式与关键文本优先级获取的方式一致,在此不再赘述。
第六处理模块326,用于从所述目标文本向量对应的目标文本优先级集中选取大于目标文本优先级阈值的指定用户作为目标用户,本领域技术人员根据实际需求设置目标文本优先级阈值,在此不再赘述。
上述,能够通过无需每一进行文本推送时再计算一次用户向量,加快了文本推送的速度,实现海量文本推送。
实施例三
本发明实施例三提供一种非瞬时性计算机可读存储介质,该非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现步骤:
获取初始用户信息集和初始文本集。
基于初始用户信息集和初始文本集对预设文本推送模型进行训练,生成目标文本推送模型。
获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器,存储,数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM),可编程ROM(PROM),电可编程ROM(EPROM),电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM),动态RAM(DRAM),同步DRAM(SDRAM),双数据率SDRAM(DDRSDRAM),增强型SDRAM(ESDRAM),同步链路(Synchlink)DRAM(SLDRAM),存储器总线(Rambus)直接RAM(RDRAM),直接存储器总线动态RAM(DRDRAM),以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元,模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元,模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
实施例四
本发明实施例四提供一种电子设备,该电子设备包括处理器和本发明实施例三中的非瞬时性计算机可读存储介质。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改,等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (12)
1.一种目标文本的推送方法,其特征在于,所述方法包括如下步骤:
获取初始用户信息集和初始文本集;
基于初始用户信息集和初始文本集对预设文本推送模型进行校验,确定出目标文本推送模型;
获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
2.根据权利要求1所述的目标文本的推送方法,其特征在于,所述初始用户信息集包括若干个初始用户信息,任一所述初始用户信息包括初始用户ID、初始用户ID对应的初始APP列表、初始用户ID对应的初始APP列表中每一初始APP名称对应的初始APP标签列表和初始用户ID对应的历史文本集。
3.根据权利要求2所述的目标文本的推送方法,其特征在于,所述初始APP列表包括若干个初始APP名称,所述初始APP名称对应的初始APP是指初始用户ID对应的初始用户安装的APP。
4.根据权利要求2所述的目标文本的推送方法,其特征在于,所述初始用户ID对应的历史文本集包括若干个初始用户ID对应的历史文本,其中,任一初始用户ID对应的历史文本是指初始用户ID对应的初始用户点击的推送文本。
5.根据权利要求1所述的目标文本的推送方法,其特征在于,获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,确定目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户的步骤中还通过如下步骤确定目标用户:
获取所述目标文本集且将所述目标文本集中任一目标文本通过所述目标文本推送模型中的第二目标子模型;
根据所述目标文本向量和所述目标文本对应的指定用户向量集,确定出所述目标文本向量对应的目标用户。
6.一种目标文本的推送装置,其特征在于,所述装置包括:
获取模块,用于获取初始用户信息集和初始文本集;
确定模块,用于基于初始用户信息集和初始文本集对预设文本推送模型进行校验,确定出目标文本推送模型;
生成模块,用于获取目标文本集且将所述目标文本集输入至所述目标文本推送模型中,生成目标文本集对应的目标用户集,以使得将目标文本集中任一目标文本推送至目标用户。
7.根据权利要求6所述的目标文本的推送装置,其特征在于,所述初始用户信息集包括若干个初始用户信息,任一所述初始用户信息包括初始用户ID、初始用户ID对应的初始APP列表、初始用户ID对应的初始APP列表中每一初始APP名称对应的初始APP标签列表和初始用户ID对应的历史文本集。
8.根据权利要求7所述的目标文本的推送装置,其特征在于,所述初始APP列表包括若干个初始APP名称,所述初始APP名称对应的初始APP是指初始用户ID对应的初始用户安装的APP。
9.根据权利要求7所述的目标文本的推送装置,其特征在于,所述初始用户ID对应的历史文本集包括若干个初始用户ID对应的历史文本,其中,任一初始用户ID对应的历史文本是指初始用户ID对应的初始用户点击的推送文本。
10.根据权利要求6所述的目标文本的推送装置,其特征在于,所述生成模块包括:
目标文本向量生成模块,用于获取所述目标文本集且将所述目标文本集中任一目标文本通过所述目标文本推送模型中的第二目标子模型;
目标用户确定模块,用于根据所述目标文本向量和所述目标文本对应的指定用户向量,确定出所述目标文本向量对应的目标用户。
11.一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-5中任意一项所述的目标文本的推送方法。
12.一种电子设备,其特征在于,包括处理器和权利要求11中所述的非瞬时性计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410167630.1A CN117708439B (zh) | 2024-02-06 | 2024-02-06 | 一种目标文本的推送方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410167630.1A CN117708439B (zh) | 2024-02-06 | 2024-02-06 | 一种目标文本的推送方法、装置、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708439A true CN117708439A (zh) | 2024-03-15 |
CN117708439B CN117708439B (zh) | 2024-05-31 |
Family
ID=90148375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410167630.1A Active CN117708439B (zh) | 2024-02-06 | 2024-02-06 | 一种目标文本的推送方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708439B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491540A (zh) * | 2018-03-30 | 2018-09-04 | 北京百度网讯科技有限公司 | 文本信息推送方法、装置及智能终端 |
US20190058609A1 (en) * | 2017-08-15 | 2019-02-21 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for pushing information based on artificial intelligence |
CN113033198A (zh) * | 2021-03-25 | 2021-06-25 | 平安国际智慧城市科技股份有限公司 | 相似文本推送方法、装置、电子设备及计算机存储介质 |
CN113569572A (zh) * | 2021-02-09 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 文本实体生成方法、模型训练方法及装置 |
CN113742593A (zh) * | 2021-09-15 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 用于推送信息的方法和装置 |
CN114781379A (zh) * | 2022-06-22 | 2022-07-22 | 中科雨辰科技有限公司 | 一种获取关键短语的数据处理系统 |
CN116405453A (zh) * | 2023-04-23 | 2023-07-07 | 中航信移动科技有限公司 | 一种基于多特征的信息推送方法、存储介质及电子设备 |
CN116805044A (zh) * | 2023-08-17 | 2023-09-26 | 北京睿企信息科技有限公司 | 一种标签的获取方法、电子设备及存储介质 |
-
2024
- 2024-02-06 CN CN202410167630.1A patent/CN117708439B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190058609A1 (en) * | 2017-08-15 | 2019-02-21 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for pushing information based on artificial intelligence |
CN108491540A (zh) * | 2018-03-30 | 2018-09-04 | 北京百度网讯科技有限公司 | 文本信息推送方法、装置及智能终端 |
CN113569572A (zh) * | 2021-02-09 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 文本实体生成方法、模型训练方法及装置 |
CN113033198A (zh) * | 2021-03-25 | 2021-06-25 | 平安国际智慧城市科技股份有限公司 | 相似文本推送方法、装置、电子设备及计算机存储介质 |
CN113742593A (zh) * | 2021-09-15 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 用于推送信息的方法和装置 |
CN114781379A (zh) * | 2022-06-22 | 2022-07-22 | 中科雨辰科技有限公司 | 一种获取关键短语的数据处理系统 |
CN116405453A (zh) * | 2023-04-23 | 2023-07-07 | 中航信移动科技有限公司 | 一种基于多特征的信息推送方法、存储介质及电子设备 |
CN116805044A (zh) * | 2023-08-17 | 2023-09-26 | 北京睿企信息科技有限公司 | 一种标签的获取方法、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
HYUNJONG LEE ET AL: "A study on intelligent personalized push notification with user history", 《2017 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)》, 14 December 2017 (2017-12-14), pages 1475 - 1482, XP033298394, DOI: 10.1109/BigData.2017.8258081 * |
Also Published As
Publication number | Publication date |
---|---|
CN117708439B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230297581A1 (en) | Method and system for ranking search content | |
CN111767400A (zh) | 文本分类模型的训练方法、装置、计算机设备和存储介质 | |
US11238050B2 (en) | Method and apparatus for determining response for user input data, and medium | |
CN110750523A (zh) | 数据标注方法、系统、计算机设备和存储介质 | |
CN111460290B (zh) | 信息的推荐方法、装置、设备和存储介质 | |
CN111835561A (zh) | 基于用户行为数据的异常用户群体检测方法、装置、设备 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN110213660B (zh) | 节目的分发方法、系统、计算机设备和存储介质 | |
CN109086386B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN117708439B (zh) | 一种目标文本的推送方法、装置、介质及设备 | |
CN111552810B (zh) | 实体抽取与分类方法、装置、计算机设备和存储介质 | |
CN109785867A (zh) | 双录流程配置方法、装置、计算机设备和存储介质 | |
CN112734307A (zh) | 一种在线实时企业画像生成方法、装置、设备及存储介质 | |
CN113434763A (zh) | 搜索结果的推荐理由生成方法、装置、设备及存储介质 | |
JP6680663B2 (ja) | 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム | |
CN112100491A (zh) | 基于用户数据的信息推荐方法、装置、设备及存储介质 | |
CN107977794B (zh) | 工业产品的数据处理方法、装置、计算机设备及存储介质 | |
CN113268563B (zh) | 基于图神经网络的语义召回方法、装置、设备及介质 | |
CN111061875B (zh) | 超参数确定方法、装置、计算机设备和存储介质 | |
CN113420876A (zh) | 基于无监督学习的实时运行数据处理方法、装置、设备 | |
CN115082045B (zh) | 数据校对方法、装置、计算机设备和存储介质 | |
CN112506556B (zh) | 应用程序分类方法、装置、计算机设备及存储介质 | |
Audrino et al. | Oracle properties, bias correction, and inference of the adaptive lasso for time series extremum estimators | |
CN117453681A (zh) | 映射关系生成方法、装置、设备及介质 | |
CN112632220A (zh) | 基于ai模型的贷款资金去向分析方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |