CN110020200A - 一种基于历史素材的个性化推荐方法与系统 - Google Patents
一种基于历史素材的个性化推荐方法与系统 Download PDFInfo
- Publication number
- CN110020200A CN110020200A CN201910198650.4A CN201910198650A CN110020200A CN 110020200 A CN110020200 A CN 110020200A CN 201910198650 A CN201910198650 A CN 201910198650A CN 110020200 A CN110020200 A CN 110020200A
- Authority
- CN
- China
- Prior art keywords
- keyword
- matching
- matching material
- information
- characteristic element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供基于历史素材的个性化推荐方法与系统,其中,所述方法包括:根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。通过上述方案解决了现有推荐方法个性化不足、缺乏基于历史素材通过建模实现素材推荐的问题,达到了充分考虑应用场景与网络媒体特性、有效利用历史素材的技术效果。
Description
技术领域
本发明涉及互联网广告推荐领域,尤其涉及一种基于历史素材的个性化推荐方法与系统。
背景技术
目前,经常采用的推荐方法一般包括内容推荐算法和协同过滤算法。其中内容推荐算法主要通过分析用户所产生的内容信息,从中挖掘出用户的兴趣爱好,最终完成对用户商品推荐的目的;协同过滤算法是基于用户的协同过滤算法是通过用户的历史行为数据(如商品购买,收藏,内容评论或分享)发现用户对商品或内容的喜欢,并对这些喜好进行度量和打分,根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系,从而在有相同喜好的用户之间进行商品推荐。
显然,目前的推荐系统被推荐的对象是使用该商品或内容的用户,主要依据用户在网站的历史行为记录或多个用户历史行为记录之间的相互关系,挖掘用户的兴趣点或者用户之间的联系,从而完成对用户进行推荐商品或内容的目的。
然而,目前的推荐方法主要存在以下不足:
(1)目前的推荐方法针对的对象主要是使用该商品或内容的用户,缺乏基于发布商品的广告主或发布推荐内容的商家或博主的推荐方法。基于目前互联网平台的高速发展,商品或内容的推荐者往往不再仅仅是生产或制造该产品的商家,还可以是众多的微博博主或公众号的号主等推荐产品或内容的群体类型,且该类型的群体也越来越多的受到用户的关注。然后,目前的推荐方法缺乏对该类群体进行推荐的方法,存在明显的个性化不足;
(2)目前的推荐方法大多数是依据对现有素材库中的素材通过一些现有的模型进行算法建模,从而实现推荐的目的。如协同推荐算法即是根据用户的行为历史记录,发现商品与商品之间的联系,在新的用户下一次浏览该商品的时候,推荐给他所需要的商品。然而,现有的这种推荐方法并没有对所推荐的素材进行处理,即缺乏基于推荐库素材本身特征的算法建模处理方式,没有充分利用现
有的素材数据,不能达到最佳的推荐效果。
针对上述不足,目前还没有提出有效的解决方案。
发明内容
本发明提供一种基于历史素材的个性化推荐方法与系统,以实现基于信息发布者的个性化推荐的目标,达到充分考虑应用场景与网络媒体特性、有效利用历史素材的技术效果。
一方面,本发明提供了一种基于历史素材的个性化推荐方法,包括:
根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括与所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;
根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
在一个实施例中,所述关键词的确定还包括:根据所述信息发布者的个人信息,确定至少一个关键词。
在一个实施例中,提取所述匹配素材与所述关键词的相似度的方法,具体包括:
对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
在一个实施例中,根据所述特征元素对所述匹配素材进行排序,具体进一步包括:
对每一个匹配素材的各特征元素进行加权计算,并根据所述加权计算的结果对所有匹配素材进行排序。
在一个实施例中,根据所述特征元素对所述匹配素材进行排序,进一步包括:
所述匹配素材的各特征元素在所述加权计算时的权重根据所述匹配素材的属性确定从匹配素材中提取出的特征元素在所述加权计算时的权重,其中,所述匹配素材的属性包括原创素材、转发的非所述信息发布者的原创素材和转发的所述信息发布者的原创素材。
另一方面,本发明还提供了一种基于历史素材的个性化推荐系统,包括:
关键词确定模块,用于根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
特性元素提取模块,用于从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;
素材推荐模块,用于根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
在一个实施例中,关键词确定模块,还用于根据所述信息发布者的个人信息,确定至少一个关键词。
在一个实施例中,所述特征元素提取模块具体包括:
相似度提取子模块,用于对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
在一个实施例中,所述素材推荐模块具体包括:
加权排序子模块,用于对每一个匹配素材的特征元素进行加权计算,并根据所述加权计算的结果对所有匹配素材进行排序。
在一个实施例中,所述加权排序子模块中,所述匹配素材的各特征元素在所述加权计算时的权重根据所述匹配素材的属性确定,其中,所述匹配素材的属性包括原创素材、转发的非所述信息发布者的原创素材和转发的所述信息发布者的原创素材。
本发明通过采用根据信息发布者投放信息的关键词,从历史素材中提取与关键词相关的匹配素材,并对匹配素材进行排序的方法,实现了基于信息发布者的推荐方法与系统的构建,从而解决了现有的推荐方法个性化不足、没有充分利用现有的素材资源、没有充分考虑网络媒体特性的技术问题,达到充分考虑应用场景与网络媒体特性、有效利用历史素材的技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种基于历史素材的个性化推荐方法的流程图;
图2是一种对匹配素材进行特征元素提取的流程图;
图3是一种获取匹配素材排序列表的流程图;
图4是一种基于历史素材的个性化推荐方法的实施例流程图;
图5是一种基于历史素材的个性化推荐系统结构图;
图6是又一种基于历史素材的个性化推荐系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书中,诸如第一和第二这样的形容词仅可以用于将一个元素或动作与另一元素或动作进行区分,而不必要求或暗示任何实际的这种关系或顺序。在环境允许的情况下,参照元素或部件或步骤(等)不应解释为局限于仅元素、部件、或步骤中的一个,而可以是元素、部件、或步骤中的一个或多个等。
在本说明书中,为了便于描述,附图中所示的各个部分的尺寸并不是按照实际的比例关系绘制的。
图1是一种基于历史素材的个性化推荐方法的流程图,包括:
S11:根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
S12:从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;
S13:根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
具体的,所述信息发布者同样也是信息的发布者。例如,当该方法应用于网络平台广告素材的推荐时,信息发布者可以是发布广告信息的制造商家,也可以是发布广告信息微博博主、公众号号主或推荐广告的任一用户,平台根据预设的投放时间提取信息发布者在预设时间范围内的所有历史投放信息。
步骤S11中根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词,其中,该关键词是从信息发布者的历史投放信息中提取的具有特定含义的名词信息,假设某一信息发布者的历史投放信息为若干条旅游景点的宣传信息,则可以从该投放信息中提取的关键词包括但不限于旅游、旅游目的地、景点名称、游乐项目、宾馆名称等类型的名词信息;假设信息发布者的历史投放信息是某一品牌护肤品的广告,则该关键词可以是品牌、护肤品名词、产地、突出功效等。当然,该推荐方法能够提取的关键词还需要根据具体的历史投放信息而定。
另外,需要注意的是,现有的关键词提取方法只包含根据历史投放信息确定关键词,却没有基于该投放该信息的信息发布者进行关键词提取的策略。在很多情况下,信息发布者往往是公众人物,其也具有一定的品牌效力。基于此,在本发明中,关键词的确定方法还包括根据信息发布者的个人信息,例如该信息发布者为某品牌的代理人或代言人,则可以将该品牌也设置为关键词。
需要说明的是,在具有的应用中,确定的关键词可能有很多个,这样根据关键词提取出的匹配素材就会很多,严重影响后续的计算和排序。此时,可以对关键词的数目进行限定,只选取比较重要的关键词。另外,还存在一种情况,在当今这个信息爆炸的时代,如何吸引浏览者关注信息发布者投放的信息就显得尤为重要。因此,投放信息者或广告的发布者为了吸引浏览者的眼球,其投放的内容也更加多元化和多样化。然而,与之对应的,推荐方法往往很难从信息发布者投放的内容中找到对应的名词信息作为关键词。在这种情况下,需要补充确定关键词的逻辑,进而获取至少一个关键词。在本发明中,还包括根据所述历史投放信息进行关联定向,进而确定关键词。其中,需要考虑的关联定向包括且不限于投放信息的来源、信息所投放的平台、投放信息所关注的话题等。
例如,可以从该历史投放信息所投放的平台出发寻找关键词,如历史投放信息所投放的APP软件或网站;或根据该历史投放信息所引用或参考的素材出发寻找关键词;或根据该历史投放信息所针对的话题角度出发寻找关键词。所述预设时间可以是该方法应用的平台设定的,也可以是投放信息者自定义设置的,在此不对其进行限定。
一种具体的应用实例为:假设某一英语培训机构在微博上投放了一则感人至深的励志故事,且在文末通过图片的方式引入了需要宣传该英语培训机构的广告软文,则根据上述推荐方法无法确定相关度较高的关键词。在这种情况下,可以在网络上查找该英语培训机构的所有历史投放信息,进而对所查找到的上述历史投放信息进行关联定向,如定向到该英语培训机构发布的网站或APP是诸如“小站雅思”、“沪江英语”、“扇贝”等网站或APP软件,则可以将关键词确定为“雅思”、“沪江”、“英语”、“扇贝”等。
当提取好关键词后,还可以对所述关键词进行权重计算并排序,其中,所述权重指标包括所述关键词随时间的衰减或/和所述关键词消耗的资源信息。
其中,关键词随时间的衰减是指在预设投放时间内,信息发布者投放信息中该关键词在文章中出现的频次随着时间的推移而衰减;关键词消耗的资源信息是指所述关键词消耗的成本信息,包括物力、人力和财力,其中,所述财力不仅包括投入该关键词的制造成本,也包括投入该关键词的广告或其他隐形成本。如应用该推荐方法的网络平台可以根据关键词所消耗的推广费用、预算费用、制造成本或品牌效应,通过一定的算法推算该关键词的消息信息。
例如,该推荐方法根据信息发布者A在预设投放时间内的投放信息,提取了关键词:品牌a1,a2,a3、物品b1,b2,b3;其中,预设投放时间为从当前时间算起,前3天的同一时刻。
一种实施方式为根据上述关键词在近3天出现的频次衰减进行排序。例如,近3天上述关键词出现的频次从大到小排序为:a1>b1>a3>a2>b2>b3,则得出关键词列表:a1,b1,a3,a2,b2,b3,然后根据推荐方法所占用的内存大小或信息发布者A的自定义设置,从关键词列表中选取排名靠前的若干位关键词,从而得到确定的关键词。则这种情况下,“关键词随时间的衰减”的权重值为1,“关键词消耗的资源”的权重值为0。
另一种实施方式为,综合考虑“关键词随时间的衰减”和“关键词消耗的资源”,对提取的关键词根据权重指标设定权重值。需要说明的是,很多关键词,如“英语”、“考试”、“面膜”等这类比较范的名词无法给出其消耗的资源信息,同样,根据这种类型的关键词也往往无法给出一个比较明确的、符合信息发布者需求的素材信息。因此,对这种无法计算其消耗的资源信息的关键词,可以将“关键词消耗的资源”的权重值设置为零。
例如,在上次实施例中,将权重指标“关键词随时间的衰减”的权重值设置为8,将可计算的“关键词消耗的资源”的权重值设置为2,将不可计算的“关键词消耗的资源”的权重值设置为0。若上述b1物品是某一品牌的主打产品,商家对其投入了大量的广告费用和推广费用,则b1这个关键词所消耗的资源就是可计算的,应将其权重设置为2。
则对上述提取的关键词进行加权计算的算法为:
8╳(关键词出现的频次)+2╳(关键词所消耗的资源,该消耗的资源可计算)。
对所提取的关键词都进行上述加权计算后,得到关键词列表。然后,从上述关键词列表中根据该推荐方法应用的平台内存或信息发布者的自定义设定,选取排名靠前若干位关键词,从而得到确定的关键词。
其中,这里所指的预设投放时间可以是由该推荐方法所应用的网络平台所确定的,也可以是信息发布者自定义设定的。例如,一种预设投放时间的设定逻辑为:网络平台请求信息发布者设置相应的预设投放时间范围,若信息发布者未设置相应的预设投放时间,则系统根据相关的算法进行设置默认的预设投放时间,具体地,该默认的预设投放时间可以是从当前时间算起,前3天的时间段;也可以是根据关键词的具体类型,执行相应的算法推算出一个具体的时间范围。例,某一关键词在网络平台上占据热搜的时间很长,则可以根据该关键词在网络平台上占据热搜的时间,确定预设投放时间的时间范围。
从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取。其中,从历史素材库中提取与关键词相关的匹配素材的方法在现有的很多方法中都有诸多介绍,这里不做过多的阐述。然而,由于现在网络环境的特点,当根据确定好的关键词从历史素材查找匹配素材时,即便设置了预设的提取时间范围,也会检索到大量良莠不齐的匹配素材,信息发布者往往很难从中找到高质量的推荐素材。
基于此,在本发明中,需要对所获取的匹配素材进行特征提取。在本发明中,特征元素包括:所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量。
具体的特征元素的提取方法如图2所示:
S21:从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材;
S22:黑名单过滤;
S23:对所述匹配素材根据关键指标进行特性提取,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量。
其中,相似度定义为关键词与所述匹配素材的相似程度,主要采用的方法为对关键词进行同义扩展,包括但不限于广泛匹配、短语匹配、别称、简称、别字等,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度;因此,提取所述匹配素材与所述关键词的相似度的方法,具体为:对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
匹配素材发布者的影响力是指该匹配素材的信息发布者的粉丝人数或者该信息发布者关注人数的多寡;素材质量包括但不限于该匹配素材的语义通顺度、图文匹配度、负反馈率等指标。
步骤S13中,需要根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给信息发布者。
其中,根据所述特征元素对所述匹配素材进行排序,要实现该步骤,首先,需要获取的匹配素材根据特征元素进行评分,特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量。具体的,对所述获取的每一个匹配素材计算上述三项特征元素的评分结果,例如,根据某一匹配素材与关键词的相似程度,得出评分结果S1;根据该匹配素材信息发布者的粉丝数或关注人数进行评判,进而得出评分结果S2;根据该匹配素材的语义通顺度、图文匹配度、负反馈率等进行评判,从而得到评分结果S3,然后对这3项指标进行相加,得出该匹配素材对应的得分。然后对所有获取的匹配素材进行上述方法计算,得出所有匹配素材的得分结果。然后,根据所有匹配素材的得分结果,对所有匹配素材根据得分的多少进行排序,并将排序靠前的部分匹配素材推荐给该信息发布者。
另外,由于信息发布者对这3个特征元素的关注程度可能不同,如果简单的求总分的话,很大概率提取不出信息发布者所需的优质内容。因此,我们可以对着3项特征元素的评分结果进行加权平均,然后根据加权平均的数值对匹配素材进行排序。这里加权平均的权值可以是信息发布者自定义的,也可以是应用该推荐方法的网络平台设定的。应当明确的是,上述根据加权平均对匹配素材进行排序的方法仅为一项实施例,这里不排除通过其他算法进行特征提取,获取匹配素材排序列表的方式。
另外,由于网络环境中有大量的转发内容,因此,根据上述方法得到的匹配素材排序列表中很可能会有重复的素材。一种优化的获取匹配素材排序列表的实施方式如图3所示:
S31:从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材;
S32:黑名单过滤;
S33:对所述匹配素材进行属性确定,判断其为原创素材、转发的非所述信息发布者的原创素材还是转发的所述信息发布者的原创素材;
S34:对所述匹配素材根据特征元素进行特征提取,并根据匹配素材属性和特征元素评分结果得到匹配素材排序列表。
在这个实施例中,提到了三种网络上的素材,分别为“原创素材”、“转发的非所述信息发布者的原创素材”和“转发的所述信息发布者的原创素材”,这3中素材基本可以覆盖整个素材库中的素材内容。“原创素材”是指没有经过转发的,由信息发布者本人第一次发布的素材,对于这类素材来说,往往更加注重原创性和内容的新颖性,但是对于信息发布者的影响力或者素材质量来说,就显得不是那么重要了。
但是,对于“转发的素材”来说,存在一次转发和大于一次转发的情况,对于只转发了一次的素材,即为“转发的所述信息发布者的原创素材”,而对于转发了2次及2次以上的素材来说,即为“转发的非所述信息发布者的原创素材”。
对于“转发的素材”而言,我们就不能简单的只考虑素材内容的创造性和新颖性了,例如,对于“转发的所述信息发布者的原创素材”,由于在预设提取时间内,只转发了一次,我们可以大概率的推测,这篇素材的质量可能不是很好或者受众面很小,因此,我们更加注重该信息发布者的影响力,如果该信息发布者的影响力比较大,那说明这篇素材还是具有一定推荐价值的。
另外,对于“转发的非所述信息发布者的原创素材”来说,由于转发的次数比较多,我们可以推测这篇素材很受大众的欢迎,而一篇素材受欢迎的因素很多,这里我们便需要综合考虑3项特征元素:所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量。
即,在该实施例中,需要综合考虑“匹配素材属性”和“特征元素的评分结果”,对于原创素材,为获取相似度最接近的匹配结果,可以重点考虑相似度这项关键指标,而对于转发的原创素材,为了扩大推荐内容的受众面,可以重点考虑信息发布者的影响力以及综合3项特征元素,充分利用历史素材资源和影响力等数据资源。
具体地,步骤S34中,一种根据匹配素材属性和特征元素的评分结果得到匹配素材排序的方式为:
对于原创素材,适用排序模型1:相似度的权重设为6,信息发布者的影响力权重设为2,素材内容的质量权重设为2;
对于转发的非信息发布者的原创素材,适用排序模型2:相似度的权重设为2,信息发布者影响力的权重设为3,素材内容质量的权重设为2;这里所指的信息发布者是指转发该素材的信息发布者的影响力,相似度的评分结果为该原创素材相似度评分结果的2/3,素材内容质量的评分结果与该原创素材内容质量评分结果相同。
对于转发的信息发布者的原创素材,适用排序模型3:信息发布者的影响力权重设为1,其他两项关键指标的权重设为0。
根据该实施例,可以根据不同的匹配素材属性,应用不同的排序模型,从而可得到符合信息发布者需要的、高质量的匹配素材列表。
即,对于“原创素材”,重点考虑“相似度”和“素材内容的质量”的特征元素;而对于“转发的非信息发布者的原创素材”,需综合考虑“相似度”、“信息发布者影响力”和“素材内容的质量”这3项特征元素;对于“转发的信息发布者的原创素材”,则仅考虑“信息发布者的影响力”这项特征元素。这样,可以综合兼顾到系统运行的速度和匹配素材提取的质量。当然,上述的匹配素材排序模型仅仅是一个实施例,在实际的使用过程中,可以根据需求进行排序模型权重数值的调整,从而达到最佳的使用效果。
图4为应用上述排序模型的一个具体的实施例。
假设“预设提取时间”为从当前时刻算起前3天;“预设投放时间”为从当前时间算起的前3天;确定的关键词数目为5个。
S401:获取该广告主在近3天的广告投放信息;
S402:从该广告投放信息中提取关键词;
S403:判断该关键词的数目是否大于等于5;
S404:若关键词数目小于5,则从该广告主的历史投放信息进行关联定向,其中,考虑的关联定向为投放平台APP或网站名称、关注的话题等;
S405:对提取的关键词根据权重指标进行排序,其中,关键词随时间的衰减的权重值为8,关键词消耗的资源的权重值为2;
S406:获取排序前5的关键词;
S407:从历史素材中提取与关键词相关的匹配素材;
S408:黑名单过滤、内容正向筛选;
S409:对匹配素材进行分析,判断其是否为原创素材、转发的非信息发布者的原创素材还是转发的信息发布者的原创素材;
S410:若为原创素材,适用排序模型1;若为转发的非信息发布者的原创素材,适用排序模型2,若为转发的信息发布者的原创素材,适用排序模型3;
S411:生成匹配素材的最终得分,并按照其排列次序将匹配素材推荐给该广告主。
根据本实施例,可以通过采用根据信息发布者投放信息的关键词,从历史素材中提取与关键词相关的匹配素材,并对匹配素材进行排序,实现个性化、充分有效利用历史素材的技术效果。
另外,本发明还提供了一种基于历史素材的个性化推荐系统,如图5所示,其中,所示系统包括关键词确定模块51、特性元素提取模块52、素材推荐模块53。
关键词确定模块,用于根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
特性元素提取模块,用于从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;
素材推荐模块,用于根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
其中,上述所指的信息发布者同时也是消息的投放者,例如,该信息发布者可以是某一产品的宣传厂商,也可以是微博博主、公众号的号主、微商或推荐广告或消息的任一用户。
上述关键词确定模块中的关键词是从信息发布者投放信息中提取的名词信息,例如,当信息发布者投放的信息是某一品牌的护肤品的广告时,则该关键词可以是品牌、护肤品名词、产地、突出功效等。
具体地,关键词确定模块还用于根据所述信息发布者的个人信息,确定至少一个关键词。
上述所指的预设投放时间可以是由该推荐系统确定,也可以由信息发布者自定义设定。例如,一种设定逻辑为网络平台请求信息发布者设置相应的预设投放时间,若信息发布者未设置相应的预设投放时间,则系统根据相关的算法进行设置默认的预设投放时间,具体地,该默认的预设投放时间可以是统一设定的从当前算起的某一历史时间,也可以是根据关键词的关注度程度,进行相关算法推算的某一历史时间段范围。
具体地,上述特征元素提取模块具体包括相似度提取子模块61,如图6所示,用于对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
即,特征元素中,相似度定义为关键词与所述匹配素材的相似程度,主要采用的方法为对关键词进行拓展,包括广泛匹配、短语匹配、别称、简称、别字等;素材投放者的影响力是根据该匹配素材的信息发布者的粉丝数或关注人数进行评判;素材内容的质量主要根据语义通顺度、图文匹配度、负反馈率等进行评判。
具体地,所述素材推荐模块具体包括加权排序子模块62。
加权排序子模块,用于对每一个匹配素材的特征元素进行加权计算,并根据所述加权计算的结果对所有匹配素材进行排序。
另外,本发明还提供了另一种优化的加权排序子模块,其中,加权排序子模块中,所述匹配素材的各特征元素在所述加权计算时的权重根据所述匹配素材的属性确定,其中,所述匹配素材的属性包括原创素材、转发的非所述信息发布者的原创素材和转发的所述信息发布者的原创素材。即,对每一个匹配素材的特征元素进行加权计算的权重根据匹配素材的属性确定。
需要注意的是,在优化的加权排序子模块中,对历史素材根据特征指标进行提取的时候,需要综合考虑“匹配素材属性”和“特征元素的评分结果”。对于原创素材,为获取相似度最接近的匹配结果,可以重点考虑相似度这项特征指标,而对于转发的原创素材,为了扩大推荐内容的受众面,可以重点考虑信息发布者的影响力这项特征指标,充分利用历史素材资源和影响力等数据资源。
从以上的描述中,可以看出,本发明通过采用根据信息发布者的历史投放信息关键词,从历史素材库中提取与上述关键词相关的匹配素材,并对匹配素材进行排序的方法,实现了基于信息发布者的推荐方法与系统的构建,从而解决了现有的推荐方法个性化不足、没有充分利用现有的素材资源、没有充分考虑当前媒体特性的技术问题,达到充分考虑应用场景与网络媒体特性、有效利用历史素材的技术效果。
至此,已详细描述了本发明。为了避免蒙蔽本发明的构思,没有对本领域所公知的一些细节进行描述。本领域技术人员根据上面的描述,完全可以明白如何实施本发明公开的技术方案。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于历史素材的个性化推荐方法,其特征在于,包括:
根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;
根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
2.根据权利要求1所述的方法,其特征在于,所述关键词的确定还包括:根据所述信息发布者的个人信息,确定至少一个关键词。
3.根据权利要求1所述的方法,其特征在于,提取所述匹配素材与所述关键词的相似度的方法,具体包括:
对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
4.根据权利要求1所述的方法,其特征在于,根据所述特征元素对所述匹配素材进行排序,具体包括:
对每一个匹配素材的各特征元素进行加权计算,并根据所述加权计算的结果对所有匹配素材进行排序。
5.根据权利要求4所述的方法,其特征在于,所述匹配素材的各特征元素在所述加权计算时的权重根据所述匹配素材的属性确定,其中,所述匹配素材的属性包括原创素材、转发的非所述信息发布者的原创素材和转发的所述信息发布者的原创素材。
6.一种基于历史素材的个性化推荐系统,其特征在于,包括:
关键词确定模块,用于根据信息发布者在预设投放时间内的历史投放信息,确定至少一个关键词;
特性元素提取模块,用于从历史素材库中获取预设提取时间内与所述关键词相关联的匹配素材,对所述匹配素材进行特征元素的提取;其中,所述特征元素包括所述匹配素材与所述关键词的相似度、所述匹配素材发布者的影响力和所述匹配素材的素材质量;
素材推荐模块,用于根据所述特征元素对所述匹配素材进行排序,并将排好序的匹配素材推荐给所述信息发布者。
7.根据权利要求6所述的系统,其特征在于,关键词确定模块,还用于根据所述信息发布者的个人信息,确定至少一个关键词。
8.根据权利要求6所述的系统,其特征在于,所述特征元素提取模块具体包括:
相似度提取子模块,用于对所述关键词进行同义扩展,并将所述同义扩展之后的词句与所述匹配素材进行匹配,获取所述关键词与所述匹配素材的相似度。
9.根据权利要求6所述的系统,其特征在于,所述素材推荐模块具体包括:
加权排序子模块,用于对每一个匹配素材的特征元素进行加权计算,并根据所述加权计算的结果对所有匹配素材进行排序。
10.根据权利要求9所述的系统,其特征在于,所述加权排序子模块中,所述匹配素材的各特征元素在所述加权计算时的权重根据所述匹配素材的属性确定,其中,所述匹配素材的属性包括原创素材、转发的非所述信息发布者的原创素材和转发的所述信息发布者的原创素材。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910198650.4A CN110020200A (zh) | 2019-03-15 | 2019-03-15 | 一种基于历史素材的个性化推荐方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910198650.4A CN110020200A (zh) | 2019-03-15 | 2019-03-15 | 一种基于历史素材的个性化推荐方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110020200A true CN110020200A (zh) | 2019-07-16 |
Family
ID=67189616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910198650.4A Pending CN110020200A (zh) | 2019-03-15 | 2019-03-15 | 一种基于历史素材的个性化推荐方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110020200A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080361A (zh) * | 2019-12-16 | 2020-04-28 | 上海风秩科技有限公司 | 一种广告投放方法、装置、电子设备及可读存储介质 |
CN111177620A (zh) * | 2019-12-20 | 2020-05-19 | 上海淇玥信息技术有限公司 | 一种基于时间维度的页面展示的方法、装置和电子设备 |
CN111523030A (zh) * | 2020-04-22 | 2020-08-11 | 贝壳技术有限公司 | 报盘信息推荐方法、装置及计算机可读存储介质 |
CN113284256A (zh) * | 2021-05-25 | 2021-08-20 | 成都威爱新经济技术研究院有限公司 | 一种mr混合现实三维场景素材库生成方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8359285B1 (en) * | 2009-09-18 | 2013-01-22 | Amazon Technologies, Inc. | Generating item recommendations |
CN104978346A (zh) * | 2014-04-09 | 2015-10-14 | 阿里巴巴集团控股有限公司 | 提供用户评价信息的方法及系统 |
CN105740468A (zh) * | 2016-03-07 | 2016-07-06 | 达而观信息科技(上海)有限公司 | 一种结合内容发布方信息的个性化推荐方法及系统 |
CN105809464A (zh) * | 2014-12-31 | 2016-07-27 | 中国电信股份有限公司 | 信息投放方法和装置 |
CN106355429A (zh) * | 2016-08-16 | 2017-01-25 | 北京小米移动软件有限公司 | 图像素材的推荐方法及装置 |
-
2019
- 2019-03-15 CN CN201910198650.4A patent/CN110020200A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8359285B1 (en) * | 2009-09-18 | 2013-01-22 | Amazon Technologies, Inc. | Generating item recommendations |
CN104978346A (zh) * | 2014-04-09 | 2015-10-14 | 阿里巴巴集团控股有限公司 | 提供用户评价信息的方法及系统 |
CN105809464A (zh) * | 2014-12-31 | 2016-07-27 | 中国电信股份有限公司 | 信息投放方法和装置 |
CN105740468A (zh) * | 2016-03-07 | 2016-07-06 | 达而观信息科技(上海)有限公司 | 一种结合内容发布方信息的个性化推荐方法及系统 |
CN106355429A (zh) * | 2016-08-16 | 2017-01-25 | 北京小米移动软件有限公司 | 图像素材的推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
马述忠等: "《跨境电商理论与实务》", 31 August 2018, 中国言实出版社 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080361A (zh) * | 2019-12-16 | 2020-04-28 | 上海风秩科技有限公司 | 一种广告投放方法、装置、电子设备及可读存储介质 |
CN111177620A (zh) * | 2019-12-20 | 2020-05-19 | 上海淇玥信息技术有限公司 | 一种基于时间维度的页面展示的方法、装置和电子设备 |
CN111177620B (zh) * | 2019-12-20 | 2024-03-01 | 上海淇玥信息技术有限公司 | 一种基于时间维度的页面展示的方法、装置和电子设备 |
CN111523030A (zh) * | 2020-04-22 | 2020-08-11 | 贝壳技术有限公司 | 报盘信息推荐方法、装置及计算机可读存储介质 |
CN111523030B (zh) * | 2020-04-22 | 2023-10-13 | 贝壳技术有限公司 | 报盘信息推荐方法、装置及计算机可读存储介质 |
CN113284256A (zh) * | 2021-05-25 | 2021-08-20 | 成都威爱新经济技术研究院有限公司 | 一种mr混合现实三维场景素材库生成方法及系统 |
CN113284256B (zh) * | 2021-05-25 | 2023-10-31 | 成都威爱新经济技术研究院有限公司 | 一种mr混合现实三维场景素材库生成方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909176B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
Dzyabura et al. | Visual elicitation of brand perception | |
US20180144367A1 (en) | Method and system for creating user based summaries for content distribution | |
CN110020200A (zh) | 一种基于历史素材的个性化推荐方法与系统 | |
CA2682585C (en) | Open profile content identification | |
CN108876526A (zh) | 商品推荐方法、装置和计算机可读存储介质 | |
CN104809632A (zh) | 一种基于模板的动态广告的生成方法和装置 | |
US20140278916A1 (en) | Building Product-Based Advertising Campaigns | |
CN112131472B (zh) | 信息推荐方法、装置、电子设备和存储介质 | |
WO2008000046A1 (en) | Social intelligence | |
JP7099589B2 (ja) | サーバ、通信制御方法、およびプログラム | |
CN110348920A (zh) | 一种推荐产品的方法及装置 | |
CN109360020A (zh) | 一种广告的生成方法及装置 | |
WO2014099558A2 (en) | Targeting objects to users based on search results in an online system | |
US9672269B2 (en) | Method and system for automatically identifying related content to an electronic text | |
US20220122147A1 (en) | Emotion calculation device, emotion calculation method, and program | |
CN109272390A (zh) | 融合评分和标签信息的个性化推荐方法 | |
US20140280178A1 (en) | Systems and Methods for Labeling Sets of Objects | |
CN110175892A (zh) | 基于消费者行为的热力球双向推荐方法及系统 | |
CN116823410A (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
US20160092922A1 (en) | Targeted advertisements from intended recipient predictions derived from user information | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
CN113450134A (zh) | 一种广告投放方法、装置、设备及存储介质 | |
Xie et al. | Graphical modeling of macro behavioral targeting in social networks | |
Munaro et al. | Does your style engage? Linguistic styles of influencers and digital consumer engagement on YouTube |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190716 |