CN111680121B - 一种内容评估方法、计算设备及存储介质 - Google Patents
一种内容评估方法、计算设备及存储介质 Download PDFInfo
- Publication number
- CN111680121B CN111680121B CN202010378926.XA CN202010378926A CN111680121B CN 111680121 B CN111680121 B CN 111680121B CN 202010378926 A CN202010378926 A CN 202010378926A CN 111680121 B CN111680121 B CN 111680121B
- Authority
- CN
- China
- Prior art keywords
- content
- user
- time
- browsing
- clue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 26
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 23
- 238000007477 logistic regression Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种内容评估方法,该方法在计算设备中执行,该方法包括步骤:获取一个访问周期内,内容平台中多篇内容的访问数据,根据访问数据获取线索用户所访问的内容集合,线索用户为在内容平台下线索的用户;结合线索用户浏览时间和线索用户浏览过的内容,获取内容集合中每篇内容的权重值;根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率;对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,其中,内容评分越高,表示该内容对平台的贡献度越大。本发明还公开了相应的计算设备及存储介质。
Description
技术领域
本发明涉及信息处理技术领域,特别涉及一种内容评估方法、计算设备及存储介质。
背景技术
内容质量审核是内容社区平台需要用到的关键一环,只有不断的生产高质量内容才能保证社区的活力与聚合力。因此,制定一套公正公平且符合业务场景的内容质量权衡方案是极其必要的。
如果能够提供一个内容贡献度分析结果,识别出不同场景中的优质内容,就能够直观有效地筛选出真正优质的内容。一方面可以总结抽取优质经验,甚至抽取内容模板,提高产能和产效。另一方面也可以通过内容质量分数对内容生产者提供创作积分、流量加权、颁发荣誉等奖励,鼓励他们在平台贡献更好更优质的内容,培养其在社区平台的粘性。
现有技术中较为普遍的内容质量权衡方案,有内容点击转化率、内容线索转化率、阅读次数、阅读时长、完读率、直接转化等等。但是阅读内容对于消费者的影响其实并不是如此直接可衡量的。例如一篇某产品近期爆发的负面新闻内容有可能点击转化率特别高,但是对于线索转化起到的作用却很可能是反向的,因此内容社区平台需要结合多种因素来评估促转化类型的内容质量。
发明内容
为此,本发明提供了一种内容评估成方法、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种内容评估方法,该方法在计算设备中执行,包括步骤:获取一个访问周期内,内容平台中多篇内容的访问数据,根据访问数据获取线索用户所访问的内容集合,所述线索用户为在内容平台下线索的用户;结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值;根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率;对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,其中,内容评分越高,表示该内容对平台的贡献度越大。
可选地,在根据本发明的内容评估方法中,结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值,包括步骤:根据内容集合中每篇内容的访问数据,获取浏览过内容集合中内容的用户集合;根据用户集合中用户浏览该内容的时间计算时间衰减值;根据用户集合中每个用户对内容集合中内容的时间衰减值生成特征向量,该用户是否下线索为标签,训练逻辑回归函数;将函数的参数值作为每篇内容的权重值。
可选地,在根据本发明的内容评估方法中,根据线索用户浏览该内容的时间计算时间衰减值,包括步骤:若当前时间为t1,用户浏览该内容的时间为t2,半衰期为t3,分别计算每个用户对该内容的时间若用户未浏览过该内容,则该用户对该内容的时间衰减值为0。
可选地,在根据本发明的内容评估方法中,根据线索用户浏览该内容的时间计算时间衰减值,还包括步骤:若用户存在多个浏览该内容的时间,则根据每个浏览时间计算多个时间衰减值,相加得每个用户对该内容的最终时间衰减值。
可选地,在根据本发明的内容评估方法中,逻辑回归函数的预测函数为:
其中,x表示每个用户对内容集合中的每篇内容的时间衰减值向量,表示用户是否是线索用户,w为该函数的权值参数向量,b为偏置。
可选地,在根据本发明的内容评估方法中,根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率,包括步骤:计算浏览过该内容的所有用户中线索用户的占比,作为内容转化率。
可选地,在根据本发明的内容评估方法中,对内容转化率进行平滑处理,以生成最终的内容转化率。
可选地,在根据本发明的内容评估方法中,对内容转化率和内容权重进行处理,以生成内容评分,包括步骤:
根据PAR公式计算每篇内容的内容评分,所述PAR公式为:
其中,w为该篇内容的权重值,cvr为该篇内容的转化率,contrib为该内容的评分。
可选地,在根据本发明的内容评估方法中,结合线索用户浏览时间和线索用户浏览过的内容,获取内容集合中每篇内容的权重值之前,还包括对用户访问记录去重的步骤。
可选地,在根据本发明的内容评估方法中,对内容转化率和内容权重进行处理,以生成内容评分,还包括步骤:对所有内容的内容评分进行归一化处理。
根据本发明的又一个方面,提供了一种计算设备,包括至少一个处理器;以及存储器,存储有程序指令,其中程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行根据本发明的内容评估方法的指令。
根据本发明的又一个方面,提供了一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得计算设备执行本发明的内容评估方法。
根据本发明的技术方案,获取一个访问周期内,内容平台中多篇内容的访问数据,因为未被线索用户浏览过的内容对平台的贡献度较低,根据访问数据获取线索用户所访问的内容集合,缩小了内容评估的范围。再结合线索用户浏览时间和线索用户浏览过的内容,获取内容集合中每篇内容的权重值,通过模型结果分析出哪些内容对转化的影响较大,有利于识别出内容对最后用户是否下线索影响的正负性取向,及时调整内容投放,做好内容营销。
根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率,对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,其中,内容评分越高,表示该内容对平台的贡献度越大,将用户的历史访问内容记录与用户最终是否在内容平台留下线索进行关联,给出一个被访问过的内容对最终转化的量化评分,以此来分析用户的最终转化是受到哪些内容影响,以及影响程度的高低,提高贡献度高的内容的投放比例,能尽可能多识别真正有诉求的消费者,引导他们找到真正关心的产品相关的核心优质内容,将消费者与产品销售的成交周期缩短。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的示意图;
图2示出了根据本发明的一个实施例的内容评估方法200的流程图;
图3示出了根据本发明的一个实施例的用户访问字段示意图;
图4示出了根据本发明的一个实施例的逻辑回归模型输入的数据示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行内容评估方法,程序数据124中就包含了用于执行所述方法的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、图像输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在一些实施例中,计算机可读介质中存储一个或多个程序,这一个或多个程序中包括执行某些方法的指令,如根据本发明的实施例,计算设备100通过所述指令来执行基于本发明的内容评估方法200。
计算设备100上安装有支持网络文件传输和存储的移动APP或者客户端应用,包括原生应用或者诸如包括IE、Chrome和Firefox等浏览器,或者微信、QQ等通讯软件,并且本地存储有各种文件,如照片、音频、视频、文档(如Word、PDF等格式的文档)。应用客户端可以运行在诸如Windows、MacOS、安卓等操作系统上。计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。内容平台通常驻留在浏览器中,例如视频分享网站、旅游网站、企业对外门户等,本发明对内容平台的驻留场所和细化分类不做限制。内容平台除了普通用户生产的内容外,还会通过具有一定知识和专业背景的行业人士生产内容,并付给相应报酬,用户浏览内容后如果对某款产品感兴趣,会通过一定的通道留下个人信息以参加活动,或者购买某种产品,称为下线索,此时普通用户转化为线索用户,评估转化类型的内容质量以促进生产高质量内容,才能保证社区的活力与聚合力。假设用户A来到一家旅游网站,看了游记内容C1、C2,隔了3天后看了一篇OGC(Occupationally-generated Content,职业生产内容)内容,直接通过OGC的转化入口留下了线索。那么引导用户完成线索转化的路径中的所有内容其实都是有效果的,如何衡量每篇内容对此条线索的转化贡献度就成了整个业务流程中关键的评价内容质量的因素。
图2示出了根据本发明的一个实施例的内容评估方法200的流程图。方法200适于在计算设备(例如前述计算设备100中)执行。如图2所示,内容评估方法始于步骤S210。
在步骤S210中,获取一个访问周期内,内容平台中多篇内容的访问数据,根据访问数据获取线索用户所访问的内容集合。
内容平台例如视频分享网站、旅游网站、企业对外门户等,线索用户是指被内容所影响的转化用户,一般指对某一商品感兴趣或有购买意向,从而填写自己的手机号,留下相关信息等,内容分享平台会存储用户在其网站上的浏览数据。一个线索用户从来到网站到内容到留下线索的平均周期为50天,因此根据本发明实施例,访问周期可定为50天,也可根据实际情况对访问周期进行调整。未被线索用户浏览过的内容对平台的贡献度较低,本方案只抽取线索用户的cookie日志信息,获取线索用户所访问的内容集合,以缩小内容评估的范围。
接着在步骤S220中,结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值。
确定内容集合后,根据内容集合中每篇内容的访问数据,获取浏览过内容集合中内容的用户集合。获取每个内容相对于每个用户的访问字段,根据浏览过该内容的全部用户是否下线索,以全面评估内容集合中的内容。
用户访问内容的时间不同,该内容对最后用户是否下线索的影响程度不同。因此根据本发明的一个实施例,访问字段如图3所示,主要包括用户设备id、用户浏览的内容id,用户浏览内容的时间、当前用户是否为线索用户,根据线索用户浏览该内容的时间计算时间衰减值。计算时间衰减值采用的函数不唯一,可根据业务场景进行选择。
根据本发明的一个实施例,计算时间衰减值的步骤如下:
若当前时间为t1,用户浏览该内容的时间为t2,半衰期为t3;
分别计算每个用户对该内容的时间
若用户未浏览过该内容,则该用户对该内容的时间衰减值为0。
访问记录数据中会存在同一个用户访问同一篇内容多次的情况,若用户存在多个浏览该内容的时间,则根据每个浏览时间计算多个时间衰减值,相加得每个用户对该内容的最终时间衰减值。需要说明的是,结合线索用户浏览时间和线索用户浏览过的内容,获取内容集合中每篇内容的权重值之前,如果访问时间完全重合或者趋近,可能是用户多次点击,需要对这种数据进行去重。
根据用户集合中每个用户对内容集合中内容的时间衰减值生成特征向量,特征向量的长度即内容集合中的内容的数量,该用户是否下线索为标签,训练逻辑回归函数,将函数的参数值作为每篇内容的权重值。进一步地,生成特征向量的步骤为对得到的数据进行one-hot编码,得到逻辑回归模型输入的矩阵数据。如图4所示,行代表用户,列表示各内容id,交叉值表示用户对每篇内容的时间衰减值,用户没有浏览过的内容时间衰减值记作0,最后一列label表示是否是下线索用户。结合线索用户访问内容的先后时间顺序,通过模型结果分析出哪些内容对转化的影响较大,有利于识别出内容对最后用户是否下线索影响的正负性取向,及时调整内容投放,做好内容营销。
具体地,逻辑回归函数的预测函数可以为:
其中,x表示每个用户对内容集合中的每篇内容的时间衰减值向量,Y∈{0,1}表示用户是否是线索用户,w为该函数的权值参数向量,b为偏置。本过程使用的损失函数可以是L2范数损失函数,将目标值Yi与估计值f(xi)的差值的平方和S最小化:训练逻辑回归函数完成后,得到函数的权值参数向量,向量中每个参数值都对应一篇内容的权重值,该权重值反映了内容对最后用户是否下线索正负性取向影响程度的高低。
随后在步骤S230中,根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率。内容转化率指浏览过该内容的所有用户中下线索用户的占比,但是如果浏览过某篇内容的人过少,又恰巧有转化人群,就会导致这篇内容的转化率偏高。比如2个人浏览了内容A,1个留下了线索,转化率为50%,显然是偏高的,数据不可信。
为去掉上述极端数据情况,根据本发明的一个实施例,还需要对内容转化率进行平滑处理,以生成最终的内容转化率,平滑处理的公式如下:
其中,cvr是指要计算的每篇内容的转化率,pos指所有访问过这篇内容的下线索用户数,neg指所有访问过这篇内容的未下线索用户数,mean_cvr指所有访问用户中下线索用户数除以总用户数。确保不因内容的转化较少而导致某篇内容的转换率过高,从而导致其计算的贡献度结果偏高。
最后,在步骤S240中,对内容转化率和内容权重进行处理,以生成该篇内容的内容评分。其中,内容评分越高,表示所述内容对平台的贡献度越大。结合根据用户浏览时间获取的内容权重,内容权重表示该内容对最后用户是否下线索的正负影响程度高低,以及该内容最终的转换率,得到的内容评分相对于单一因素衡量得到的评分,评分结果更具可信度。避免类似一篇某产品近期爆发的负面新闻内容有可能点击转化率特别高,但是对于线索转化起到的作用却很可能是反向的事件的发生。
根据本发明的一个实施例,具体结合方式利用到了PAR(PopulationAttributable Risk,族群相差危险性)公式,其原本是病因学中用来反映某因素的暴露者中,单纯由于该因素引起发病的危险占整个病因的比例。具体地,PAR公式如下:
其中,w为该篇内容的权重值,cvr为该篇内容的转化率,contrib为该内容的评分。将该公式用在内容贡献度计算中,极好的反应了用户浏览某篇内容而产生的转化行为在总的转化影响因素中的占比。
为更好地适应业务场景中对内容评分的比较,对内容转化率和内容权重进行处理,以生成内容评分之前,还包括步骤:对所有内容的内容评分进行归一化处理。归一化处理的公式如下:
其中x'指要计算的某篇内容归一化后的贡献度,x指内容的原始贡献度,min指所有内容原始贡献度的最小值,max指所有内容原始贡献度的最大值。
根据本发明的技术方案,获取一个访问周期内,内容平台中多篇内容的访问数据,因为未被线索用户浏览过的内容对平台的贡献度较低,根据访问数据获取线索用户所访问的内容集合,缩小了内容评估的范围。再结合线索用户浏览时间和线索用户浏览过的内容,获取内容集合中每篇内容的权重值,通过模型结果分析出哪些内容对转化的影响较大,有利于识别出内容对最后用户是否下线索影响的正负性取向,及时调整内容投放,做好内容营销。
根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率,对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,其中,内容评分越高,表示该内容对平台的贡献度越大,将用户的历史访问内容记录与用户最终是否在内容平台留下线索进行关联,给出一个被访问过的内容对最终转化的量化评分,以此来分析用户的最终转化是受到哪些内容影响,以及影响程度的高低,提高贡献度高的内容的投放比例,能尽可能多识别真正有诉求的消费者,引导他们找到真正关心的产品相关的核心优质内容,将消费者与产品销售的成交周期缩短。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (12)
1.一种内容评估方法,所述方法在计算设备中执行,所述方法包括步骤:
获取一个访问周期内,内容平台中多篇内容的访问数据,根据所述访问数据获取线索用户所访问的内容集合,所述线索用户为在内容平台留下线索的用户,所述线索为用户在所述内容平台中留下的个人信息;
结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值;
根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率;
对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,其中,所述内容评分越高,表示所述内容对平台的贡献度越大。
2.如权利要求1所述的方法,所述结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值,包括步骤:
根据内容集合中每篇内容的访问数据,获取浏览过内容集合中内容的用户集合;
根据用户集合中用户浏览该内容的时间计算时间衰减值;
根据用户集合中每个用户对内容集合中内容的时间衰减值生成特征向量,以该用户是否留下线索为标签,训练逻辑回归函数;
将所述逻辑回归函数的参数值作为每篇内容的权重值。
3.如权利要求2所述的方法,所述根据用户集合中用户浏览该内容的时间计算时间衰减值,包括步骤:
若当前时间为t1,用户浏览该内容的时间为t2,半衰期为t3,
分别计算每个用户对该内容的
若用户未浏览过该内容,则该用户对该内容的时间衰减值为0。
4.如权利要求3所述的方法,所述根据用户集合中用户浏览该内容的时间计算时间衰减值,还包括步骤:
若用户存在多个浏览该内容的时间,则根据每个浏览时间计算多个时间衰减值,相加得每个用户对该内容的最终时间衰减值。
5.如权利要求2-4中任一项所述的方法,所述逻辑回归函数的预测函数为:
其中,x表示每个用户对内容集合中的每篇内容的时间衰减值向量,Y∈{0,1}表示用户是否是线索用户,w为该函数的权值参数向量,b为偏置。
6.如权利要求1-4中任一项所述的方法,根据每篇内容浏览用户数量和其中线索用户数量获取内容转化率,包括步骤:
计算浏览过该内容的所有用户中线索用户的占比,作为内容转化率。
7.如权利要求6所述的方法,还包括步骤:
对所述内容转化率进行平滑处理,以生成最终的内容转化率。
8.如权利要求1-4中任一项所述的方法,所述对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,包括步骤:
根据PAR公式计算每篇内容的内容评分,所述PAR公式为:
其中,w为该篇内容的权重值,cvr为该篇内容的转化率,contrib为该内容的评分。
9.如权利要求1-4中任一项所述的方法,所述结合内容集合中内容的浏览用户和浏览时间,获取内容集合中每篇内容的权重值之前,还包括步骤:
对所述用户访问记录去重。
10.如权利要求1-4中任一项所述的方法,所述对内容转化率和内容权重进行处理,以生成该篇内容的内容评分,还包括步骤:
对所有内容的内容评分进行归一化处理。
11.一种计算设备,包括:
至少一个处理器;
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-10所述的内容评估方法的指令。
12.一种存储有程序指令的可读存储介质,当所述程序指令被客户端读取并执行时,使得所述客户端执行如权利要求1-10中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010378926.XA CN111680121B (zh) | 2020-05-07 | 2020-05-07 | 一种内容评估方法、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010378926.XA CN111680121B (zh) | 2020-05-07 | 2020-05-07 | 一种内容评估方法、计算设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680121A CN111680121A (zh) | 2020-09-18 |
CN111680121B true CN111680121B (zh) | 2024-04-12 |
Family
ID=72451839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010378926.XA Active CN111680121B (zh) | 2020-05-07 | 2020-05-07 | 一种内容评估方法、计算设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680121B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230052216A1 (en) * | 2021-04-22 | 2023-02-16 | Throw App Co. | Systems and methods for investing in a communication platform that allows monetization based on a score |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011048445A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | Snsサーバ、コンテンツ通知方法およびそのプログラム |
CN103838885A (zh) * | 2014-03-31 | 2014-06-04 | 苏州大学 | 一种面向广告投放的潜在用户检索及用户模型排序方法 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN107194758A (zh) * | 2017-04-28 | 2017-09-22 | 杭州集盒网络技术有限公司 | 基于可信朋友的评价记录方法 |
CN107609958A (zh) * | 2017-10-16 | 2018-01-19 | 泰康保险集团股份有限公司 | 行为引导策略确定方法以及装置、存储介质以及电子设备 |
CN109240640A (zh) * | 2018-08-30 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 广告语音交互方法、装置及存储介质 |
JP2019079131A (ja) * | 2017-10-20 | 2019-05-23 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN110276012A (zh) * | 2019-06-26 | 2019-09-24 | 海南车智易通信息技术有限公司 | 一种可视化用户画像的生成方法、装置和计算设备 |
CN110287415A (zh) * | 2019-06-26 | 2019-09-27 | 海南车智易通信息技术有限公司 | 一种内容推荐方法、装置和计算设备 |
CN110288370A (zh) * | 2019-05-09 | 2019-09-27 | 北京善义善美科技有限公司 | 一种广告渠道评估方法及系统 |
CN110765312A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 人机交互及内容搜索方法、装置、设备以及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160071118A1 (en) * | 2014-09-09 | 2016-03-10 | Fliptop Inc. | System and method for lead prioritization based on results from multiple modeling methods |
US20160071117A1 (en) * | 2014-09-09 | 2016-03-10 | Fliptop Inc. | System and method for using marketing automation activity data for lead prioritization and marketing campaign optimization |
-
2020
- 2020-05-07 CN CN202010378926.XA patent/CN111680121B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011048445A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | Snsサーバ、コンテンツ通知方法およびそのプログラム |
CN103838885A (zh) * | 2014-03-31 | 2014-06-04 | 苏州大学 | 一种面向广告投放的潜在用户检索及用户模型排序方法 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN107194758A (zh) * | 2017-04-28 | 2017-09-22 | 杭州集盒网络技术有限公司 | 基于可信朋友的评价记录方法 |
CN107609958A (zh) * | 2017-10-16 | 2018-01-19 | 泰康保险集团股份有限公司 | 行为引导策略确定方法以及装置、存储介质以及电子设备 |
JP2019079131A (ja) * | 2017-10-20 | 2019-05-23 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN110765312A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 人机交互及内容搜索方法、装置、设备以及存储介质 |
CN109240640A (zh) * | 2018-08-30 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 广告语音交互方法、装置及存储介质 |
CN110288370A (zh) * | 2019-05-09 | 2019-09-27 | 北京善义善美科技有限公司 | 一种广告渠道评估方法及系统 |
CN110276012A (zh) * | 2019-06-26 | 2019-09-24 | 海南车智易通信息技术有限公司 | 一种可视化用户画像的生成方法、装置和计算设备 |
CN110287415A (zh) * | 2019-06-26 | 2019-09-27 | 海南车智易通信息技术有限公司 | 一种内容推荐方法、装置和计算设备 |
Non-Patent Citations (1)
Title |
---|
社会化商务环境下消费者在线冲动购买行为研究;陈艳红;中国博士学位论文全文数据库 经济与管理科学辑;20190515(第05期);J157-1 * |
Also Published As
Publication number | Publication date |
---|---|
CN111680121A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108885624B (zh) | 信息推荐系统及方法 | |
US8280829B2 (en) | Efficient algorithm for pairwise preference learning | |
CN103268317A (zh) | 对图像进行语义注释的系统和方法 | |
CN109558541B (zh) | 一种信息处理的方法、装置及计算机存储介质 | |
US20200082434A1 (en) | Systems and methods of generating digital campaigns | |
CN111639247B (zh) | 用于评估评论的质量的方法、装置、设备以及计算机可读存储介质 | |
US10678831B2 (en) | Page journey determination from fingerprint information in web event journals | |
US10831809B2 (en) | Page journey determination from web event journals | |
US20200192921A1 (en) | Suggesting text in an electronic document | |
Helles et al. | Infrastructures of tracking: Mapping the ecology of third-party services across top sites in the EU | |
WO2018171295A1 (zh) | 一种给文章标注标签的方法、装置、终端及计算机可读存储介质 | |
CN111680121B (zh) | 一种内容评估方法、计算设备及存储介质 | |
WO2019242453A1 (zh) | 信息处理方法及装置、存储介质、电子装置 | |
WO2019144035A1 (en) | Systems and methods for collecting and processing alternative data sources for risk analysis and insurance | |
CN111858686A (zh) | 数据显示方法、装置、终端设备及存储介质 | |
WO2020057237A1 (zh) | 适用于关注对象的影响力检测方法、电子终端及存储介质 | |
JP5933863B1 (ja) | データ分析システム、制御方法、制御プログラム、および記録媒体 | |
CN114463052A (zh) | 用户关注指数生成方法、装置、设备及存储介质 | |
US20140324523A1 (en) | Missing String Compensation In Capped Customer Linkage Model | |
Yan et al. | Semantic-aware multi-task learning for image aesthetic quality assessment | |
US11157535B2 (en) | Method and system for subject-based ranking considering writer-reader interaction | |
KR102578243B1 (ko) | 프랜차이즈 가맹점을 추천하는 서비스 제공 장치, 방법 및 프로그램 | |
US20240160852A1 (en) | Domain-specific text labelling using natural language inference model | |
JP5762480B2 (ja) | 情報処理装置及び方法 | |
KR102572280B1 (ko) | 전자 결제 정보에 기반하여 구매자에게 온라인 상품을 마케팅하는 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |