CN111859156B - 发布人群的确定方法、装置、可读存储介质及电子设备 - Google Patents
发布人群的确定方法、装置、可读存储介质及电子设备 Download PDFInfo
- Publication number
- CN111859156B CN111859156B CN202010774773.0A CN202010774773A CN111859156B CN 111859156 B CN111859156 B CN 111859156B CN 202010774773 A CN202010774773 A CN 202010774773A CN 111859156 B CN111859156 B CN 111859156B
- Authority
- CN
- China
- Prior art keywords
- distributed
- crowd
- resource
- determining
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Abstract
本申请提供了发布人群的确定方法、装置、可读存储介质及电子设备,获取每个待发布人群总体点击过的每一个历史推送资源的第一结构特征序列;基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。这样,综合考虑待发布资源的结构特征与待发布人群的历史浏览记录的第一匹配度,确定与待发布资源匹配的目标发布人群,可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
Description
技术领域
本申请涉及互联网技术领域,尤其是涉及发布人群的确定方法、装置、可读存储介质及电子设备。
背景技术
随着互联网与线上应用技术的发展,向用户推送待发布资源逐渐成为推送方的关注点,如何将待发布资源推送至合适的位置,并被更多用户浏览,成为亟需解决的问题。
现阶段,对于待发布资源的推送群体的推送匹配分析,大多还是基于待发布资源本身的关键词以及历史推送数据对用户群体的偏好进行分析,由于一个待发布资源从呈现形式上看,不仅包括文字和内容,仅基于待发布资源本身的推送,针对性不强,易导致被待发布资源推送的用户群体不准确,待发布资源被浏览的概率低等问题。
发明内容
有鉴于此,本申请的目的在于提供发布人群的确定方法、装置、可读存储介质及电子设备,综合考虑待发布资源的结构特征与待发布人群的历史浏览记录的匹配度,确定与待发布资源匹配的目标发布人群,可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
本申请实施例提供了一种发布人群的确定方法,所述确定方法包括:
获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;
基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;
将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
进一步的,通过以下步骤确定每一个历史推送资源的第一结构特征序列:
针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;
按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
进一步的,通过以下步骤确定所述第一匹配度:
计算所述待发布人群中每一个历史推送资源的第一结构特征序列与所述第二结构特征序列之间的相似度;
将计算出的多个相似度之间的平均相似度,确定为待发布人群与待发布资源之间的第一匹配度。
进一步的,通过以下步骤确定所述相似度:
基于所述第一结构特征序列的第一序列长度,以及所述第二结构特征序列的第二序列长度,确定第三序列长度;
确定所述第一结构特征序列与所述第二结构特征序列的多个相似结构序列,以及每一个相似结构序列的第四序列长度;
基于确定出的多个第四序列长度的和与所述第三序列确定所述相似度。
进一步的,在所述将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群之后,所述确定方法还包括:
确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;
基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;
将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
本申请实施例还提供了一种发布人群的确定装置,所述确定装置包括:
序列获取模块,用于获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;
匹配度确定模块,用于基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;
目标人群确定模块,用于将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
进一步的,所述确定装置还包括序列确定模块,所述序列确定模块用于:
针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;
按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
进一步的,所述匹配度确定模块用于通过以下步骤确定所述第一匹配度:
计算所述待发布人群中每一个历史推送资源的第一结构特征序列与所述第二结构特征序列之间的相似度;
将计算出的多个相似度之间的平均相似度,确定为待发布人群与待发布资源之间的第一匹配度。
进一步的,所述匹配度确定模块用于通过以下步骤确定所述相似度:
基于所述第一结构特征序列的第一序列长度,以及所述第二结构特征序列的第二序列长度,确定第三序列长度;
确定所述第一结构特征序列与所述第二结构特征序列的多个相似结构序列,以及每一个相似结构序列的第四序列长度;
基于确定出的多个第四序列长度的和与所述第三序列确定所述相似度。
进一步的,所述确定装置还包括匹配人群确定模块,所述匹配人群确定模块用于:
确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;
基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;
将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的发布人群的确定方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的发布人群的确定方法的步骤。
本申请实施例提供的发布人群的确定方法、装置、可读存储介质及电子设备,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
这样,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征,基于每一个历史推送资源的第一结构特征,确定出相应的待发布人群与待发布资源之间的第一匹配度,并从多个待发布人群中确定出第一匹配度大于预设匹配度阈值的至少一个待发布人群,并将至少一个待发布人群确定为待发布资源推送的至少一个目标发布人群,从而可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种可能的应用场景下的系统结构图;
图2为本申请实施例所提供的一种发布人群的确定方法的流程图;
图3为本申请另一实施例提供的一种发布人群的确定方法的流程图;
图4为本申请实施例所提供的一种发布人群的确定装置的结构示意图之一;
图5为本申请实施例所提供的一种发布人群的确定装置的结构示意图之二;
图6为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于互联网技术领域,确定出待发布资源的结构特征与每一个待发布人群之间的第一匹配度,并将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为目标发布人群,可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率,请参阅图1,图1为一种可能的应用场景下的系统结构图,如图1中所示,所述系统包括存储装置和确定装置,所述存储装置用于存储每一个待发布人群中每一个待发布用户点击的历史推送资源,确定装置在获取到每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列后,确定出待发布资源与每个待发布人群之间的第一匹配度,进而确定出可以进行待发布资源推送的至少一个目标发布人群。
经研究发现,现阶段,对于待发布资源的推送群体的推送匹配分析,大多还是基于待发布资源本身的关键词以及历史推送数据对用户群体的偏好进行分析,由于一个待发布资源从呈现形式上看,不仅限于包括文字和内容,仅基于待发布资源本身的推送,可能针对性不强,易导致被待发布资源推送的用户群体不准确,待发布资源被浏览的概率低等问题。
基于此,本申请实施例提供了一种发布人群的确定方法,可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
请参阅图2,图2为本申请实施例所提供的一种发布人群的确定方法的流程图。如图2中所示,本申请实施例提供的发布人群的确定方法,包括:
S201、获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列。
该步骤中,获取每个待发布人群在预设时间段内总体点击过的多个历史推送资源,并确定每一个历史推送资源的第一结构特征序列。
这里,对于每个待发布人群的定义,可以是根据预设维度进行划分的多个人群,划分依据可以是依据年龄段进行划分,或是依据人员所属区域进行划分,还可以是根据人群的历史购买记录进行划分等。
这里,预设时间段可以是一个预设周期(一天、一周、半年等),还可是推送资源的更新周期,例如,某一推送资源会在一个固定周期内进行更新,那么就可以将这个固定周期作为预设时间段。
这里,针对于每个待发布人群总体点击过的多个历史推送资源的确定可以是根据该待发布人群包括的每一个待发布人员点击的历史推送资源以及待发布人员的数量,并经过去重后确定出来的。
这里,推送资源的结构序列,指的是推送资源在结构上的构成方式,以推送资源为广告为例,广告计划的素材的展现方式包括:纯图片,纯文字,海报,短视频等,如果是一个长页面,里面可能包含多种组合方式,以某一个品牌的某次活动为例:广告中包含文字与图片,嵌入了商品链接,以及公众号的二维码,那么这些文字、图片、商品链接、二维码等都是广告的组成结构,对每个组成结构进行编码取(0,1,2,3),那么该次品牌活动的广告的结构序列为(0,1,0,1,2,2,3),则表示这是一个拥有两段文字,两张图片,且包含两个商品链接一个公众号二维码为结束的文案。
S202、基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度。
该步骤中,根据每个待发布人群中每一个历史推送资源的第一结构特征序列,确定出每个待发布人群与待发布资源之间的第一匹配度。
这里,需要根据待发布资源的第二结构特征序列,计算每一个历史推送资源的第一结构特征序列与第二结构特征序列之间的第一匹配度,并针对每一个待发布人群,计算完全部历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的第一匹配度后,将多个第一匹配度之间的平均值作为该待发布人群与待发布资源之间的第一匹配度。
这里,待发布资源可以为一个,也可以为一个计划系列中的多个待发布资源。
S203、将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
该步骤中,将确定出的第一匹配度大于预设第一匹配度阈值的至少一个待发布人群,确定为可以进行待发布资源推送的目标发布人群。
这里,可以预设一个预设匹配度阈值,第一匹配度大于该预设匹配度阈值的待发布人群对待发布资源的兴趣是比较大的,是可以进行待发布资源推送的目标发布人群,可以对这类目标发布人群进行待发布资源的推送,在目标发布人群中推送待发布资源,待发布资源被浏览的可能性是较大的。
这里,除了设置预设匹配度阈值作为确定目标发布人群的依据之外,还可以是根据每一个待发布人群与待发布资源的第一匹配度,按照第一匹配度由大到小的顺序进行排序,将排序在前N个预设位置的N个待发布人群确定为目标发布人群。
本申请实施例提供的发布人群的确定方法,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
这样,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征,基于每一个历史推送资源的第一结构特征,确定出相应的待发布人群与待发布资源之间的第一匹配度,并从多个待发布人群中确定出第一匹配度大于预设匹配度阈值的至少一个待发布人群,并将至少一个待发布人群确定为待发布资源推送的至少一个目标发布人群,从而可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
请参阅图3,图3为本申请另一实施例提供的一种发布人群的确定方法的流程图。如图3中所示,本申请实施例提供的发布人群的确定方法,包括:
S301、获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列。
S302、基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度。
S303、将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
S304、确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度。
该步骤中,基于待发布资源的基础特征,确定待发布资源与每一个目标发布人群之间的第二匹配度,并基于待发布资源的内容特征,确定待发布资源与每一个目标发布人群之间的第三匹配度。
这里,待发布资源的基础特征,表征了待发布资源本身的特征;待发布资源的内容特征,表征了待发布资源包含的具体内容。
以待发布资源为广告为例,基础特征表征了广告本身所述的品牌、品类等信息,内容特征表征看了广告本身要表达的内容(XX产品的功效等)。
这里,针对每个目标发布人群,对于第二匹配度的计算,是通过计算待发布资源的基础特征与该目标发布人群中包含的每一个历史推送资源的基础特征之间的匹配度,再取平均值得出;对于第三匹配度的计算,是通过计算待发布资源的内容特征与该目标发布人群中包含的每一个历史推送资源的内容特征之间的匹配度,再取平均值得出。
S305、基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度。
该步骤中,根据步骤S304确定出的第二匹配度以及预设基础特征对应的第一权重系数、第三匹配度以及预设内容特征对应的第二权重系数和第一匹配度以及对结构特征预设的第三权重系数,进行加权运算,确定出待发布资源与每一个目标发布人群之间的综合匹配度。
这里,对于第一权重系数、第二权重系数以及第三权重系数的设定,可以是根据对于待发布资源的推送需求确定的,例如,某个待发布资源更注重内容方面的推送效果,那么可以将内容特征对应的第二权重系数设置的高些;还可以是根据用户的历史点击数据的综合分析确定的,根据分析调查得出结论,可以得知用户更关心的也是待发布资源的内容特征,那么也需要将内容特征对应的第二权重系数设置的高些。
S306、将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
该步骤中,在步骤S305确定出的每一个目标发布人群的综合匹配度后,将综合匹配度按照由大到小的顺序排序,将序列位置位于前预设位数的多个目标发布人群,确定为可以推送待发布资源匹配的匹配发布人群。
这里,对于预设位数的设置,可以是根据待发布资源的推送计划进行确定,例如,本次待发布资源比较重要,需要推送到多个目标发布人群中,根据推广的位置设置,确定预设位数。
其中,S301至S303的描述可以参照S201至S203的描述,并且能达到相同的技术效果,对此不做赘述。
进一步的,通过以下步骤确定每一个历史推送资源的第一结构特征序列:针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
该步骤中,针对每一个历史推送资源,确定该历史推送资源中包括的用于呈现该历史推送资源的每一个呈现形式、每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序,按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
这里,以推送资源为广告为例,广告计划的素材的展现方式包括:纯图片,纯文字,海报,短视频等,如果是一个长页面,里面可能包含多种组合方式,以某一个品牌的某次活动为例:广告中包含文字与图片,嵌入了商品链接,以及公众号的二维码,那么这些文字、图片、商品链接、二维码等都是广告的组成结构,对每个组成结构进行编码取(0,1,2,3),那么该次品牌活动的广告的结构序列为(0,1,0,1,2,2,3),则表示这是一个拥有两段文字,两张图片,且包含两个商品链接一个公众号二维码为结束的文案;如果只是一个短视频(4),则此广告计划的素材结构特征为(4)。
进一步的,通过以下步骤确定所述第一匹配度:计算所述待发布人群中每一个历史推送资源的第一结构特征序列与所述第二结构特征序列之间的相似度;将计算出的多个相似度之间的平均相似度,确定为待发布人群与待发布资源之间的第一匹配度。
该步骤中,确定待发布资源的第二结构特征序列,计算待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,将计算出的多个相似度取平均值,确定平均相似度,并将该平均相似度确定为待发布资源之间的第一匹配度。
这里,可以通过以下公式计算第一匹配度:
其中,S表示待发布人群点击的历史推送资源集合,fi表示待发布资源i(i为大于等于1的正整数),fj表示历史推送资源j(j为大于等于1的正整数)。
这里,对于确定待发布资源的第二结构特征序列的确定,与历史推送资源的第一结构特征序列的获取方式是一致的,待发布资源的第二结构特征可以是对于待发布资源的结构设置的结构特征。
进一步的,通过以下步骤确定所述相似度:基于所述第一结构特征序列的第一序列长度,以及所述第二结构特征序列的第二序列长度,确定第三序列长度;确定所述第一结构特征序列与所述第二结构特征序列的多个相似结构序列,以及每一个相似结构序列的第四序列长度;基于确定出的多个第四序列长度的和与所述第三序列确定所述相似度。
该步骤中,基于第一结构特征序列的第一序列长度,以及第二结构特征序列的第二序列长度,将第一序列长度以及第二序列长度加和,确定出第一序列长度;确定第一结构特征序列与第二结构特征序列中包括的多个相似结构序列,以及每一个相似结构序列对应的第四序列长度;基于确定出多个第四序列长度以及三序列长度,确定相似度。
这里,结构特征序列长度指的是序列中包括的元素个数,例如,一个结构特征序列为(1,2,0,3),那么该结构特征序列的序列长度为4。
这里,第一结构特征序列与第二结构特征序列中包括的多个相似结构序列,指的是第一结构特征序列与第二结构特征序列元素组成和顺序完全一致的部分。
例如,第一结构特征序列为(0,1,0,1,2,3,0,1,2),第二结构特征序列为(0,0,1,2,3,0,1,3),那么第一结构特征序列与第二结构特征序列的相似结构序列为(0,1,2,3)、(0,1)以及(0);并且每个相似结构序列对应的第四序列长度为4、2以及1;第一结构特征序列的第一序列长度为9;第二结构特征序列的第二序列长度为8。
这里,可以通过以下公式确定相似度:
其中,S表示待发布人群点击的历史推送资源集合,N表示待发布资源集合,fi表示待发布资源i(i为大于等于1的正整数);fj表示历史推送资源j(j为大于等于1的正整数)。
针对于上述示例,相似度为:2*(1+4+2)/(9+8)=0.823。
本申请实施例提供的发布人群的确定方法,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群;确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
这样,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征,基于每一个历史推送资源的第一结构特征,确定出相应的待发布人群与待发布资源之间的第一匹配度,并从多个待发布人群中确定出第一匹配度大于预设匹配度阈值的至少一个待发布人群,并将至少一个待发布人群确定为待发布资源推送的至少一个目标发布人群,并结待发布资源的基础特征以及内容特征与目标发布人群的第一匹配度,确定出推送待发布资源的匹配发布人群,从而可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
请参阅图4、图5,图4为本申请实施例所提供的一种发布人群的确定装置的结构示意图之一,图5为本申请实施例所提供的一种发布人群的确定装置的结构示意图之二。如图4中所示,所述确定装置400包括:
序列获取模块410,用于获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列。
匹配度确定模块420,用于基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度。
目标人群确定模块430,用于将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
进一步的,如图5所示,所述确定装置400还包括序列确定模块440,所述序列确定模块440用于:
针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;
按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
进一步的,如图5所示,所述确定装置400还包括匹配人群确定模块450,所述匹配人群确定模块450用于:
确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;
基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;
将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
进一步的,所述匹配度确定模块420用于通过以下步骤确定所述匹配度:
计算所述待发布人群中每一个历史推送资源的第一结构特征序列与所述第二结构特征序列之间的相似度;
将计算出的多个相似度之间的平均相似度,确定为待发布人群与待发布资源之间的第一匹配度。
进一步的,所述匹配度确定模块420用于通过以下步骤确定所述相似度:
基于所述第一结构特征序列的第一序列长度,以及所述第二结构特征序列的第二序列长度,确定第三序列长度;
确定所述第一结构特征序列与所述第二结构特征序列的多个相似结构序列,以及每一个相似结构序列的第四序列长度;
基于确定出的多个第四序列长度的和与所述第三序列确定所述相似度。
本申请实施例提供的发布人群的确定装置,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;基于每个待发布人群中每一个历史推送资源的第一结构特征序列与所述待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
这样,获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征,基于每一个历史推送资源的第一结构特征,确定出相应的待发布人群与待发布资源之间的第一匹配度,并从多个待发布人群中确定出第一匹配度大于预设匹配度阈值的至少一个待发布人群,并将至少一个待发布人群确定为待发布资源推送的至少一个目标发布人群,从而可以提高待发布资源与待发布人群的匹配性,有助于提高待发布资源推送的准确性,以及待发布资源被浏览的概率。
请参阅图6,图6为本申请实施例所提供的一种电子设备的结构示意图。如图6中所示,所述电子设备600包括处理器610、存储器620和总线630。
所述存储器620存储有所述处理器610可执行的机器可读指令,当电子设备600运行时,所述处理器610与所述存储器620之间通过总线630通信,所述机器可读指令被所述处理器610执行时,可以执行如上述图2以及图3所示方法实施例中的发布人群的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的发布人群的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种发布人群的确定方法,其特征在于,所述确定方法包括:
获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;所述每一个历史推送资源的第一结构特征序列表征的是所述历史推送资源在结构上的构成方式;所述每一个历史推送资源的第一结构特征序列是基于每个历史推送资源中的每一个呈现形式对应的数值以及在所述历史推送资源中的出现顺序构建的;
基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;
将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
2.根据权利要求1所述的确定方法,其特征在于,通过以下步骤确定每一个历史推送资源的第一结构特征序列:
针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;
按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
3.根据权利要求1所述的确定方法,其特征在于,通过以下步骤确定所述第一匹配度:
计算所述待发布人群中每一个历史推送资源的第一结构特征序列与所述第二结构特征序列之间的相似度;
将计算出的多个相似度之间的平均相似度,确定为待发布人群与待发布资源之间的第一匹配度。
4.根据权利要求3所述的确定方法,其特征在于,通过以下步骤确定所述相似度:
基于所述第一结构特征序列的第一序列长度,以及所述第二结构特征序列的第二序列长度,确定第三序列长度;
确定所述第一结构特征序列与所述第二结构特征序列的多个相似结构序列,以及每一个相似结构序列的第四序列长度;
基于确定出的多个第四序列长度的和与所述第三序列确定所述相似度。
5.根据权利要求1所述的确定方法,其特征在于,在所述将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群之后,所述确定方法还包括:
确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;
基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;
将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
6.一种发布人群的确定装置,其特征在于,所述确定装置包括:
序列获取模块,用于获取每个待发布人群总体点击过的多个历史推送资源以及每一个历史推送资源的第一结构特征序列;所述每一个历史推送资源的第一结构特征序列表征的是所述历史推送资源在结构上的构成方式;所述每一个历史推送资源的第一结构特征序列是基于每个历史推送资源中的每一个呈现形式对应的数值以及在所述历史推送资源中的出现顺序构建的;
匹配度确定模块,用于基于每个待发布人群中每一个历史推送资源的第一结构特征序列与待发布资源的第二结构特征序列之间的相似度,确定每个待发布人群与待发布资源之间的第一匹配度;
目标人群确定模块,用于将第一匹配度大于预设匹配度阈值的至少一个待发布人群,确定为待发布所述待发布资源的至少一个目标发布人群。
7.根据权利要求6所述的确定装置,其特征在于,所述确定装置还包括序列确定模块,所述序列确定模块用于:
针对每一个历史推送资源,确定该历史推送资源包括的用于呈现该历史推送资源的每一个呈现形式对应的数值,以及每一个呈现形式在该历史推送资源中的出现顺序;
按照每一个呈现形式的出现顺序以及每一个呈现形式对应的数值,构建该历史推送资源的第一结构特征序列。
8.根据权利要求6所述的确定装置,其特征在于,所述确定装置还包括匹配人群确定模块,所述匹配人群确定模块用于:
确定所述待发布资源的基础特征与每一个目标发布人群之间的第二匹配度,以及所述待发布资源的内容特征与每一个目标发布人群之间的第三匹配度;
基于所述第二匹配度以及对应的第一权重系数、所述第三匹配度以及对应的第二权重系数与所述第一匹配度以及对应的第三权重系数,确定所述待发布资源与每一个目标发布人群之间的综合匹配度;
将每一个目标发布人群按照相应的综合匹配度由大到小的顺序排序,将排序位于前预设位数的多个目标发布人群,确定为与所述待发布资源匹配的匹配发布人群。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5中任一所述的发布人群的确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5中任一所述的发布人群的确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010774773.0A CN111859156B (zh) | 2020-08-04 | 2020-08-04 | 发布人群的确定方法、装置、可读存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010774773.0A CN111859156B (zh) | 2020-08-04 | 2020-08-04 | 发布人群的确定方法、装置、可读存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859156A CN111859156A (zh) | 2020-10-30 |
CN111859156B true CN111859156B (zh) | 2024-02-02 |
Family
ID=72953377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010774773.0A Active CN111859156B (zh) | 2020-08-04 | 2020-08-04 | 发布人群的确定方法、装置、可读存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859156B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191808B (zh) * | 2021-04-30 | 2023-04-25 | 北京深演智能科技股份有限公司 | 发布人群包的方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750334A (zh) * | 2012-06-01 | 2012-10-24 | 北京市农林科学院农业科技信息研究所 | 一种基于dm的农业信息精准推送的方法 |
WO2017071251A1 (zh) * | 2015-10-28 | 2017-05-04 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
WO2018090793A1 (zh) * | 2016-11-18 | 2018-05-24 | 腾讯科技(深圳)有限公司 | 多媒体推荐方法和装置 |
CN109299375A (zh) * | 2018-10-24 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 资讯个性化推送方法、装置、电子设备及存储介质 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN109492180A (zh) * | 2018-09-07 | 2019-03-19 | 平安科技(深圳)有限公司 | 资源推荐方法、装置、计算机设备及计算机可读存储介质 |
CN110347922A (zh) * | 2019-07-08 | 2019-10-18 | 上海证大喜马拉雅网络科技有限公司 | 基于相似度的推荐方法、装置、设备和存储介质 |
CN110457634A (zh) * | 2019-08-12 | 2019-11-15 | 拉扎斯网络科技(上海)有限公司 | 信息发布方法、装置、电子设备及计算机可读存储介质 |
CN111080361A (zh) * | 2019-12-16 | 2020-04-28 | 上海风秩科技有限公司 | 一种广告投放方法、装置、电子设备及可读存储介质 |
CN111125554A (zh) * | 2019-12-17 | 2020-05-08 | 上海秒针网络科技有限公司 | 信息推送的方法和装置、存储介质及电子装置 |
CN111160699A (zh) * | 2019-11-26 | 2020-05-15 | 清华大学 | 一种专家推荐方法及系统 |
CN111400517A (zh) * | 2020-03-20 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 信息推送、信息发布方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156127B (zh) * | 2015-04-08 | 2020-06-16 | 深圳市腾讯计算机系统有限公司 | 选择数据内容向终端推送的方法及装置 |
CN106557513B (zh) * | 2015-09-29 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 事件信息推送方法及事件信息推送装置 |
CN105868237A (zh) * | 2015-12-09 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 媒体数据推荐方法及服务器 |
CN107172151B (zh) * | 2017-05-18 | 2020-08-07 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN110019656A (zh) * | 2017-07-26 | 2019-07-16 | 上海颐为网络科技有限公司 | 一种新建词条相关内容智能推送方法和系统 |
-
2020
- 2020-08-04 CN CN202010774773.0A patent/CN111859156B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750334A (zh) * | 2012-06-01 | 2012-10-24 | 北京市农林科学院农业科技信息研究所 | 一种基于dm的农业信息精准推送的方法 |
WO2017071251A1 (zh) * | 2015-10-28 | 2017-05-04 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
WO2018090793A1 (zh) * | 2016-11-18 | 2018-05-24 | 腾讯科技(深圳)有限公司 | 多媒体推荐方法和装置 |
CN109492180A (zh) * | 2018-09-07 | 2019-03-19 | 平安科技(深圳)有限公司 | 资源推荐方法、装置、计算机设备及计算机可读存储介质 |
CN109299375A (zh) * | 2018-10-24 | 2019-02-01 | 中国平安人寿保险股份有限公司 | 资讯个性化推送方法、装置、电子设备及存储介质 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN110347922A (zh) * | 2019-07-08 | 2019-10-18 | 上海证大喜马拉雅网络科技有限公司 | 基于相似度的推荐方法、装置、设备和存储介质 |
CN110457634A (zh) * | 2019-08-12 | 2019-11-15 | 拉扎斯网络科技(上海)有限公司 | 信息发布方法、装置、电子设备及计算机可读存储介质 |
CN111160699A (zh) * | 2019-11-26 | 2020-05-15 | 清华大学 | 一种专家推荐方法及系统 |
CN111080361A (zh) * | 2019-12-16 | 2020-04-28 | 上海风秩科技有限公司 | 一种广告投放方法、装置、电子设备及可读存储介质 |
CN111125554A (zh) * | 2019-12-17 | 2020-05-08 | 上海秒针网络科技有限公司 | 信息推送的方法和装置、存储介质及电子装置 |
CN111400517A (zh) * | 2020-03-20 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 信息推送、信息发布方法及装置 |
Non-Patent Citations (1)
Title |
---|
一种基于本体语义相似度的协同过滤推荐方法;吴正洋;汤庸;方家轩;董浩业;;计算机科学(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859156A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
CN108733706B (zh) | 热度信息的生成方法和装置 | |
CN109697629B (zh) | 产品数据推送方法及装置、存储介质、计算机设备 | |
WO2019095417A1 (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
US20170148085A1 (en) | Providing personalized item recommendations using scalable matrix factorization with randomness | |
US20220405607A1 (en) | Method for obtaining user portrait and related apparatus | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
US8311882B2 (en) | System and method for forecasting an inventory of online advertisement impressions for targeting impression attributes | |
US20150254714A1 (en) | Systems and methods for keyword suggestion | |
CN110223186B (zh) | 用户相似度确定方法以及信息推荐方法 | |
CN105809478B (zh) | 一种广告标签的标注方法及系统 | |
CN111400517A (zh) | 信息推送、信息发布方法及装置 | |
CN112149003B (zh) | 商品社群推荐方法、装置和计算机设备 | |
US20150161634A1 (en) | Visitor session classification based on clickstreams | |
JP5481295B2 (ja) | オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム | |
CN111859156B (zh) | 发布人群的确定方法、装置、可读存储介质及电子设备 | |
CN110113410B (zh) | 一种信息推送的管理方法、装置、电子设备及存储介质 | |
CN112199523A (zh) | 一种作品分发方法、装置、计算机设备及存储介质 | |
CN108241699B (zh) | 用于推送信息的方法和装置 | |
CN112182390B (zh) | 一种函件推送方法、装置、计算机设备及存储介质 | |
CN112380417A (zh) | 一种基于标签与图的网页推荐方法、终端设备及存储介质 | |
US20170192966A1 (en) | Method and apparatus for searching cartoon | |
CN113204638B (zh) | 基于工作会话单元的推荐方法、系统、计算机和存储介质 | |
CN113378065B (zh) | 一种基于滑动谱分解确定内容多样性的方法和选定内容的方法 | |
KR20230102746A (ko) | 캐릭터를 이용한 온라인 마케팅 서비스 제공 장치, 시스템, 방법 및 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231229 Address after: 200,030 Unit 5B03, Floor 5, Building 2, No. 277, Longlan Road, Xuhui District, Shanghai Applicant after: SHANGHAI SECOND PICKET NETWORK TECHNOLOGY CO.,LTD. Address before: Floors 4, 5 and 6, No. 3, Lane 1473, Zhenguang Road, Putuo District, Shanghai, 200333 Applicant before: Shanghai Fengzhi Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |