CN117132330A - 一种基于大数据的智能广告方法、装置、设备及存储介质 - Google Patents

一种基于大数据的智能广告方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117132330A
CN117132330A CN202311371174.4A CN202311371174A CN117132330A CN 117132330 A CN117132330 A CN 117132330A CN 202311371174 A CN202311371174 A CN 202311371174A CN 117132330 A CN117132330 A CN 117132330A
Authority
CN
China
Prior art keywords
advertisement
word
networking
browsing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311371174.4A
Other languages
English (en)
Other versions
CN117132330B (zh
Inventor
张钰琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blue Flame Technology Chengdu Co ltd
Original Assignee
Blue Flame Technology Chengdu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blue Flame Technology Chengdu Co ltd filed Critical Blue Flame Technology Chengdu Co ltd
Priority to CN202311371174.4A priority Critical patent/CN117132330B/zh
Publication of CN117132330A publication Critical patent/CN117132330A/zh
Application granted granted Critical
Publication of CN117132330B publication Critical patent/CN117132330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种基于大数据的智能广告方法、装置、设备及存储介质,涉及智能广告技术领域。所述方法是在获取目标用户的历史联网大数据后,提取模型输入输出项数据并对基于机器学习算法的人工智能模型进行率定验证建模,得到广告浏览时长预测模型,然后应用该预测模型得到目标用户与目标广告内容的当前广告浏览预测时长,再然后应用该预测时长计算得到目标用户与各个待推送广告内容的当前广告浏览预测时长,最后将具有最长时长的某个广告内容添加到待加载展示页面中并进行下发,如此通过在单词出现率维度等上对近期单词以及在用户浏览时长维度等上对植入广告内容进行用户关注度评估,可以确保最终广告内容推送结果的准确性以及广告投放效果。

Description

一种基于大数据的智能广告方法、装置、设备及存储介质
技术领域
本发明属于智能广告技术领域,具体涉及一种基于大数据的智能广告方法、装置、设备及存储介质。
背景技术
随着社会以及经济的不断发展,人们联网获取网络数据已成为主要的信息获取方式,并且已经占据了人们日常生活的绝大部分时间,例如人们经常通过智能手机来刷微博、刷知乎以及刷朋友圈等。在这种时代背景下,基于广告机或报纸等媒介的传统广告方式已逐步衰退,使得广告商们更注重将广告植入到联网下发数据的加载展示页面中以进行推广,例如在刷新网页中插入广告图片或小视频等广告内容。
目前,上述这种新广告方式的广告内容推荐方案主要是基于在用户搜索记录数据或用户浏览记录数据中的关键词与广告内容的匹配结果来进行广告内容推送,但是其对于关键词以及植入广告内容还缺少在多维度上的用户关注度评估,使得广告内容推送准确性以及广告投放效果还有待进一步提高。
发明内容
本发明的目的是提供一种基于大数据的智能广告方法、装置、计算机设备及计算机可读存储介质,用以解决现有广告内容推荐方案因针对关键词以及植入广告内容还缺少在多维度上的用户关注度评估,进而导致广告内容推送准确性以及广告投放效果还有待提高的问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供了一种基于大数据的智能广告方法,包括:
获取目标用户的历史联网大数据,其中,所述历史联网大数据包含有在各个历史联网时段的所有联网上传数据以及所有联网下发数据,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差;
根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长;
针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率;
将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型;
根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词;
根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组;
将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长;
针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长;
将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
基于上述发明内容,提供了一种基于历史联网大数据和机器学习算法对广告浏览时长进行准确预测并推送广告的新方案,即在获取目标用户的历史联网大数据后,将提取得到目标广告内容的各次广告浏览事件的近期单词出现率数组作为输入项,以及将提取得到的所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到广告浏览时长预测模型,然后将当前的近期单词出现率数组输入该预测模型,输出得到目标用户与目标广告内容的当前广告浏览预测时长,再然后应用该预测时长计算得到所述目标用户与各个待推送广告内容的当前广告浏览预测时长,最后将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中并进行下发,如此通过在单词出现率维度等上对近期单词以及在用户浏览时长维度等上对植入广告内容进行用户关注度评估,可以确保最终广告内容推送结果的准确性以及广告投放效果,便于实际应用和推广。
在一个可能的设计中,根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长,包括:
针对所述各个历史联网时段,从对应的所述所有联网上传数据中提取出对应的所有上传单词和在所述所有上传单词中的各个上传单词的上传时间戳;
针对所述各个历史联网时段,从对应的所述所有联网下发数据中提取出对应的所有加载展示页面、在所述所有加载展示页面中的各个加载展示页面的下发时间戳、所有加载展示单词和在所述所有加载展示单词中的各个加载展示单词的下发时间戳,其中,所述加载展示页面是指在一份所述联网下发数据中的且会在数据下发后被所述目标用户的用户终端加载展示的页面,所述加载展示单词是指出现在所述加载展示页面中的单词;
针对所述各个加载展示页面,判断在对应页面中是否存在有目标广告内容,若有,则记录所述目标广告内容的一次广告浏览事件,并将上传时间戳早于对应的下发时间戳未超过第二预设时长的所述上传单词选入到与该广告浏览事件对应的近期上传单词集合中,以及还将下发时间戳早于对应的下发时间戳未超过第三预设时长的所述加载展示单词选入到与该广告浏览事件对应的近期展示单词集合中,以及还当对应页面为在对应历史联网时段中的最后一个加载展示页面时,将所述第一预设时长或在前页面平均浏览时长作为该广告浏览事件的用户浏览时长,或者当对应页面不为在对应历史联网时段中的最后一个加载展示页面时,将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为该广告浏览事件的用户浏览时长,其中,所述在前页面平均浏览时长是指所有相邻页面时差的平均值,所述相邻页面时差是指在对应历史联网时段中的且时序相邻的后一个加载展示页面与前一个加载展示页面的下发时间戳的时间差。
在一个可能的设计中,针对在所述多次广告浏览事件中的某次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,包括:
针对在多个单词类别中的各个单词类别,根据所述某次广告浏览事件的所述近期上传单词集合,按照如下公式计算得到对应的上传出现率:
式中,、/>和/>分别表示正整数,/>表示在所述多个单词类别中的第/>个单词类别的上传出现率,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数;
针对所述各个单词类别,根据所述某次广告浏览事件的所述近期展示单词集合,按照如下公式计算得到对应的展示出现率:
式中,、/>、/>和/>分别表示正整数,/>表示所述第/>个单词类别的展示出现率,表示在所述某次广告浏览事件的所述近期展示单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的单词总数,表示在所述某次广告浏览事件的所述近期展示单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长;
针对所述各个单词类别,按照如下公式计算得到对应的出现率:
式中,表示所述第/>个单词类别的出现率,/>和/>分别表示预设权重系数且有
汇总所述各个单词类别的出现率,得到所述某次广告浏览事件的近期单词出现率数组。
在一个可能的设计中,与某个单词的某次选入对应的单词浏览时长按照如下方式确定:
根据与所述某个单词的所述某次选入对应的下发时间戳,将具有该下发时间戳的某个加载展示页面确定为单词所属加载展示页面;
针对所述单词所属加载展示页面,若对应页面为在对应历史联网时段中的最后一个加载展示页面,则将所述第一预设时长或所述在前页面平均浏览时长作为与所述某个单词的所述某次选入对应的单词浏览时长,否则将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为与所述某个单词的所述某次选入对应的单词浏览时长。
在一个可能的设计中,所述近期联网上传数据是指上传时间戳早于当前时刻未超过所述第二预设时长的联网上传数据,所述近期联网下发数据是指下发时间戳早于当前时刻未超过所述第三预设时长的联网下发数据。
在一个可能的设计中,所述机器学习算法采用基于Python sklearn库的线性回归算法,以及在所述人工智能模型的率定验证建模过程中,采用基于树结构的贝叶斯优化算法对模型参数进行调优。
在一个可能的设计中,针对某个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长,包括:
针对所述某个待推送广告内容,提取得到对应的多个第一广告素材;
针对在不同的个目标广告内容中的各个目标广告内容,提取得到对应的多个第二广告素材,并根据所述多个第二广告素材与所述多个第一广告素材的匹配结果,确定对应广告内容与所述某个待推送广告内容的相似度,其中,/>表示大于等于2的正整数;
按照如下公式计算得到所述目标用户与所述某个待推送广告内容的当前广告浏览预测时长
式中,表示正整数,/>表示在所述/>个目标广告内容中的第/>个目标广告内容与所述某个待推送广告内容的相似度,/>表示所述目标用户与所述第/>个目标广告内容的当前广告浏览预测时长。
第二方面,提供了一种基于大数据的智能广告装置,包括有大数据获取模块、信息提取模块、出现率统计模块、模型训练模块、模型应用模块、时长计算模块和广告下发模块;
所述大数据获取模块,用于获取目标用户的历史联网大数据,其中,所述历史联网大数据包含有在各个历史联网时段的所有联网上传数据以及所有联网下发数据,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差;
所述信息提取模块,通信连接所述大数据获取模块,用于根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长;
所述出现率统计模块,通信连接所述信息提取模块,用于针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率;
所述模型训练模块,分别通信连接所述信息提取模块和所述出现率统计模块,用于将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型;
所述信息提取模块,还用于根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词;
所述出现率统计模块,还用于根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组;
所述模型应用模块,分别通信连接所述模型训练模块和所述出现率统计模块,用于将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长;
所述时长计算模块,通信连接所述模型应用模块,用于针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长;
所述广告下发模块,通信连接所述时长计算模块,用于将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
第三方面,本发明提供了一种计算机设备,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意可能设计所述的智能广告方法。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意可能设计所述的智能广告方法。
第五方面,本发明提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如第一方面或第一方面中任意可能设计所述的智能广告方法。
上述方案的有益效果:
(1)本发明创造性提供了一种基于历史联网大数据和机器学习算法对广告浏览时长进行准确预测并推送广告的新方案,即在获取目标用户的历史联网大数据后,将提取得到目标广告内容的各次广告浏览事件的近期单词出现率数组作为输入项,以及将提取得到的所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到广告浏览时长预测模型,然后将当前的近期单词出现率数组输入该预测模型,输出得到目标用户与目标广告内容的当前广告浏览预测时长,再然后应用该预测时长计算得到所述目标用户与各个待推送广告内容的当前广告浏览预测时长,最后将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中并进行下发,如此通过在单词出现率维度等上对近期单词以及在用户浏览时长维度等上对植入广告内容进行用户关注度评估,可以确保最终广告内容推送结果的准确性以及广告投放效果,便于实际应用和推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于大数据的智能广告方法的流程示意图。
图2为本申请实施例提供的基于大数据的智能广告装置的结构示意图。
图3为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图和实施例或现有技术的描述对本发明作简单地介绍,显而易见地,下面关于附图结构的描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。
应当理解,尽管本文可能使用术语第一和第二等等来描述各种对象,但是这些对象不应当受到这些术语的限制。这些术语仅用于区分一个对象和另一个对象。例如可以将第一对象称作第二对象,并且类似地可以将第二对象称作第一对象,同时不脱离本发明的示例实施例的范围。
应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A、单独存在B或者同时存在A和B等三种情况;又例如,A、B和/或C,可以表示存在A、B和C中的任意一种或他们的任意组合;对于本文中可能出现的术语“/和”,其是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A或者同时存在A和B等两种情况;另外,对于本文中可能出现的字符“/”,一般表示前后关联对象是一种“或”关系。
实施例:
如图1所示,本实施例第一方面提供的且基于大数据的智能广告方法,可以但不限于由具有一定计算资源的计算机设备执行,例如由平台服务器、个人计算机(PersonalComputer,PC,指一种大小、价格和性能适用于个人使用的多用途计算机;台式机、笔记本电脑到小型笔记本电脑和平板电脑以及超级本等都属于个人计算机)、智能手机、个人数字助理(Personal Digital Assistant,PDA)或可穿戴设备等电子设备执行。如图1所示,所述智能广告方法,可以但不限于包括有如下步骤S1~S9。
S1.获取目标用户的历史联网大数据,其中,所述历史联网大数据包含但不限于有在各个历史联网时段的所有联网上传数据以及所有联网下发数据等,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括但不限于有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差等。
在所述步骤S1中,所述目标用户即为广告内容推送对象。所述历史联网大数据可以但不限于从用户终端侧或网络侧常规获取。由于所述目标用户的上网时段是不连续的,例如人们一般会在上班途中时段、午休时段和下班途中时段等时段通过智能手机来刷微博、刷知乎以及刷朋友圈等,因此会有离散的所述各个历史联网时段。此外,所述第一预设时长可具体举例为5分钟,即若在5分钟内没有新的联网下发数据,则默认当前联网时段已结束。
S2.根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长。
在所述步骤S2中,所述目标广告内容即为已经多次推送给所述目标用户的历史广告内容,由于历史广告内容是植入到联网下发数据的加载展示页面中来予以推广,因此可以根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件以及用户浏览时长。所述近期上传单词集合用于囊括在单次广告浏览事件发生前一段时间内出现在所述联网上传数据中的所有单词,因此可以根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与所述各次广告浏览事件对应的近期上传单词集合;以及由于所述近期展示单词集合用于囊括在单次广告浏览事件发生前一段时间内出现在所述联网下发数据的加载展示页面中的所有单词,因此根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合。优选的,根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长,包括但不限于有如下步骤S21~S23。
S21.针对所述各个历史联网时段,从对应的所述所有联网上传数据中提取出对应的所有上传单词和在所述所有上传单词中的各个上传单词的上传时间戳。
在所述步骤S21中,具体提取方式可以但不限于包括:先将联网上传数据常规转换为文本,然后采用诸如Jieba分词工具等来对该文本进行分词处理,得到上传单词。此外,所述各个上传单词的上传时间戳即为提取出对应单词的联网上传数据的上传时间戳。
S22.针对所述各个历史联网时段,从对应的所述所有联网下发数据中提取出对应的所有加载展示页面、在所述所有加载展示页面中的各个加载展示页面的下发时间戳、所有加载展示单词和在所述所有加载展示单词中的各个加载展示单词的下发时间戳,其中,所述加载展示页面是指在一份所述联网下发数据中的且会在数据下发后被所述目标用户的用户终端加载展示的页面,所述加载展示单词是指出现在所述加载展示页面中的单词。
在所述步骤S22中,具体提取方式可以但不限于包括:先将联网下发数据常规转换为加载展示页面,并将该联网下发数据的下发时间戳作为该加载展示页面的下发时间戳,然后采用诸如Jieba分词工具等来对该加载展示页面中的文本内容进行分词处理,和/或采用诸如ORC(Optical Character Recognition, 光学字符识别)文字识别工具等来对该加载展示页面中的图片或视频帧图像进行单词识别处理,等等,最终得到加载展示单词。此外,所述各个加载展示单词的下发时间戳即为提取出对应单词的加载展示页面的下发时间戳。
S23.针对所述各个加载展示页面,判断在对应页面中是否存在有目标广告内容,若有,则记录所述目标广告内容的一次广告浏览事件,并将上传时间戳早于对应的下发时间戳未超过第二预设时长的所述上传单词选入到与该广告浏览事件对应的近期上传单词集合中,以及还将下发时间戳早于对应的下发时间戳未超过第三预设时长的所述加载展示单词选入到与该广告浏览事件对应的近期展示单词集合中,以及还当对应页面为在对应历史联网时段中的最后一个加载展示页面时,将所述第一预设时长或在前页面平均浏览时长作为该广告浏览事件的用户浏览时长,或者当对应页面不为在对应历史联网时段中的最后一个加载展示页面时,将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为该广告浏览事件的用户浏览时长,其中,所述在前页面平均浏览时长是指所有相邻页面时差的平均值,所述相邻页面时差是指在对应历史联网时段中的且时序相邻的后一个加载展示页面与前一个加载展示页面的下发时间戳的时间差。
在所述步骤S23中,所述第二预设时长可以举例为10分钟,所述第三预设时长可以举例为15分钟,如此举例的,针对存在有目标广告内容的某个加载展示页面,若该某个加载展示页面的下发时间戳为10:00,则可将上传时间戳介于9:50~10:00的所有上传单词选入到所述近期上传单词集合中,以及可将下发时间戳介于9:45~10:00的所有加载展示单词选入到所述近期展示单词集合中。另外,考虑在用户终端侧加载后一个加载展示页面后,会使前一个加载展示页面不再展示,因此所述目标用户对在该前一个加载展示页面中的目标广告内容的用户浏览时长可以默认为所述后一个加载展示页面的下发时间戳与所述前一个加载展示页面的下发时间戳的时间差,以及针对在历史联网时段中的且存在有目标广告内容的最后一个加载展示页面,默认所述第一预设时长或所述在前页面平均浏览时长为所述用户浏览时长。即继续举例的,若在所述某个加载展示页面的对应历史联网时段中还有下发时间戳分别为9:42、9:45、9:48、9:52、9:55和9:58的其它6个加载展示页面,则当所述某个加载展示页面为在对应历史联网时段中的最后一个加载展示页面时,可以将5分钟(即所述第一预设时长)或3分钟(即所述在前页面平均浏览时长)作为所述用户浏览时长,或者当所述某个加载展示页面不为在对应历史联网时段中的最后一个加载展示页面时,若后一个加载展示页面的下发时间戳为10:04,则可将4分钟(即所述时间差)作为所述用户浏览时长。
S3.针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率。
在所述步骤S3中,所述出现率可以从单词被选频次维度(即基于单词的被选入次数与所有单词的总被选入次数的比值来计算出现率)来具体衡量,也可以从单词被选频次维度和单词浏览时长维度等来具体衡量,以便用更多维度来反映所述目标用户对所述各个单词类别的近期关注程度,进而利于后续准确预估广告浏览时长。优选的,针对在所述多次广告浏览事件中的某次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,包括但不限于有如下步骤S31~S34。
S31.针对在多个单词类别中的各个单词类别,根据所述某次广告浏览事件的所述近期上传单词集合,按照如下公式计算得到对应的上传出现率:
式中,、/>和/>分别表示正整数,/>表示在所述多个单词类别中的第/>个单词类别的上传出现率,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数。
在所述步骤S31中,所述多个单词类别可以但不限于基于从所述历史联网大数据中提取的所有单词,通过常规的k均值聚类算法分析得到。
S32.针对所述各个单词类别,根据所述某次广告浏览事件的所述近期展示单词集合,按照如下公式计算得到对应的展示出现率:
式中,、/>、/>和/>分别表示正整数,/>表示所述第/>个单词类别的展示出现率,表示在所述某次广告浏览事件的所述近期展示单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的单词总数,表示在所述某次广告浏览事件的所述近期展示单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长。
在所述步骤S32中,所述单词浏览时长可具体参照所述用户浏览时长来得到,即具体的,与某个单词的某次选入对应的单词浏览时长可以但不限于按照如下方式确定:先根据与所述某个单词的所述某次选入对应的下发时间戳,将具有该下发时间戳的某个加载展示页面确定为单词所属加载展示页面;然后针对所述单词所属加载展示页面,若对应页面为在对应历史联网时段中的最后一个加载展示页面,则将所述第一预设时长或所述在前页面平均浏览时长作为与所述某个单词的所述某次选入对应的单词浏览时长,否则将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为与所述某个单词的所述某次选入对应的单词浏览时长。
S33.针对所述各个单词类别,按照如下公式计算得到对应的出现率:
式中,表示所述第/>个单词类别的出现率,/>和/>分别表示预设权重系数且有
在所述步骤S33中,举例的,和/>分别为0.62和0.38,即所述上传单词较所述加载展示单词更重要一些。
S34.汇总所述各个单词类别的出现率,得到所述某次广告浏览事件的近期单词出现率数组。
前述步骤S31~S34即为从单词被选频次维度和单词浏览时长维度等来具体衡量所述出现率的一种具体方式,以便实现用更多维度来反映所述目标用户对所述各个单词类别的近期关注程度的目的。
S4.将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型。
在所述步骤S4中,所述机器学习算法是一种专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的人工智能核心算法,是使计算机具有智能的根本途径;具体的,所述机器学习算法优选采用基于Python sklearn库的线性回归算法,以便快速并准确地找出数据中的规律。所述率定验证建模的具体过程包括有模型的率定过程和校核过程,即是先通过对比模型模拟结果与实测数据,然后根据对比结果调整模型参数,使得模拟结果与实际吻合的过程,因此可以通过常规的率定验证建模方式,得到所述广告浏览时长预测模型。优选的,在所述人工智能模型的率定验证建模过程中,采用基于树结构的贝叶斯优化算法对模型参数进行调优。此外,所述人工智能模型还可以但不限于采用诸如支持向量机、K最邻近法、随机梯度下降法、多层感知机、决策树、反向传播神经网络或径向基函数网络等机器学习算法来实现。
S5.根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词。
在所述步骤S5中,为了使所述所有近期上传单词与所述近期上传单词集合保持时间一致,以及使所述所有近期加载单词与所述近期展示单词集合保持时间一致,具体的,所述近期联网上传数据是指上传时间戳早于当前时刻未超过所述第二预设时长的联网上传数据,所述近期联网下发数据是指下发时间戳早于当前时刻未超过所述第三预设时长的联网下发数据。此外,所述近期上传单词和所述近期展示单词的具体提取方式可参照前述步骤S21~S22常规推导得到,于此不再赘述。
S6.根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组。
在所述步骤S6中,具体统计方式可参照前述步骤S31~S34常规推导得到,于此不再赘述。
S7.将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长。
S8.针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长。
在所述步骤S8中,所述相似度可以但不限于根据两广告内容的素材匹配结果来常规确定。另外,考虑所述目标广告内容的数目存在多个的情况,为了综合得到所述目标用户与某个待推送广告内容的当前广告浏览预测时长,优选的,针对某个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长,包括但不限于有如下步骤S81~S83。
S81.针对所述某个待推送广告内容,提取得到对应的多个第一广告素材。
在所述步骤S81中,所述多个第一广告素材可以但不限于包含有诸如文字、图像、视频或声音等的信息元素。
S82.针对在不同的个目标广告内容中的各个目标广告内容,提取得到对应的多个第二广告素材,并根据所述多个第二广告素材与所述多个第一广告素材的匹配结果,确定对应广告内容与所述某个待推送广告内容的相似度,其中,/>表示大于等于2的正整数。
在所述步骤S82中,所述多个第二广告素材可以但不限于包含有诸如文字、图像、视频或声音等的信息元素。
S83.按照如下公式计算得到所述目标用户与所述某个待推送广告内容的当前广告浏览预测时长
式中,表示正整数,/>表示在所述/>个目标广告内容中的第/>个目标广告内容与所述某个待推送广告内容的相似度,/>表示所述目标用户与所述第/>个目标广告内容的当前广告浏览预测时长。
S9.将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
在所述步骤S9中,所述某个待推送广告内容即是被评估为当前会被所述目标用户最关注的广告内容,因此可以适合将其添加到所述待加载展示页面中。此外,若所述最长的当前广告浏览预测时长小于等于第四预设时长(例如30秒),则还可以中止进行广告内容添加,以免引起所述目标用户对推送的广告内容产生反感。
由此基于前述步骤S1~S9所描述的且基于大数据的智能广告方法,提供了一种基于历史联网大数据和机器学习算法对广告浏览时长进行准确预测并推送广告的新方案,即在获取目标用户的历史联网大数据后,将提取得到目标广告内容的各次广告浏览事件的近期单词出现率数组作为输入项,以及将提取得到的所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到广告浏览时长预测模型,然后将当前的近期单词出现率数组输入该预测模型,输出得到目标用户与目标广告内容的当前广告浏览预测时长,再然后应用该预测时长计算得到所述目标用户与各个待推送广告内容的当前广告浏览预测时长,最后将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中并进行下发,如此通过在单词出现率维度等上对近期单词以及在用户浏览时长维度等上对植入广告内容进行用户关注度评估,可以确保最终广告内容推送结果的准确性以及广告投放效果,便于实际应用和推广。
如图2所示,本实施例第二方面提供了一种实现第一方面所述的智能广告方法的虚拟装置,包括有大数据获取模块、信息提取模块、出现率统计模块、模型训练模块、模型应用模块、时长计算模块和广告下发模块;
所述大数据获取模块,用于获取目标用户的历史联网大数据,其中,所述历史联网大数据包含有在各个历史联网时段的所有联网上传数据以及所有联网下发数据,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差;
所述信息提取模块,通信连接所述大数据获取模块,用于根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长;
所述出现率统计模块,通信连接所述信息提取模块,用于针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率;
所述模型训练模块,分别通信连接所述信息提取模块和所述出现率统计模块,用于将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型;
所述信息提取模块,还用于根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词;
所述出现率统计模块,还用于根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组;
所述模型应用模块,分别通信连接所述模型训练模块和所述出现率统计模块,用于将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长;
所述时长计算模块,通信连接所述模型应用模块,用于针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长;
所述广告下发模块,通信连接所述时长计算模块,用于将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
本实施例第二方面提供的前述装置的工作过程、工作细节和技术效果,可以参见第一方面所述的智能广告方法,于此不再赘述。
如图3所示,本实施例第三方面提供了一种执行如第一方面所述的智能广告方法的计算机设备,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面所述的智能广告方法。具体举例的,所述存储器可以但不限于包括随机存取存储器(Random-Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、闪存(FlashMemory)、先进先出存储器(First Input First Output,FIFO)和/或先进后出存储器(First Input Last Output,FILO)等等;所述处理器可以但不限于采用型号为STM32F105系列的微处理器。此外,所述计算机设备还可以但不限于包括有电源模块、显示屏和其它必要的部件。
本实施例第三方面提供的前述计算机设备的工作过程、工作细节和技术效果,可以参见第一方面所述的智能广告方法,于此不再赘述。
本实施例第四方面提供了一种存储包含如第一方面所述的智能广告方法的指令的计算机可读存储介质,即所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面所述的智能广告方法。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等计算机可读存储介质,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。
本实施例第四方面提供的前述计算机可读存储介质的工作过程、工作细节和技术效果,可以参见如第一方面所述的智能广告方法,于此不再赘述。
本实施例第五方面提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如第一方面所述的智能广告方法。其中,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的智能广告方法,其特征在于,包括:
获取目标用户的历史联网大数据,其中,所述历史联网大数据包含有在各个历史联网时段的所有联网上传数据以及所有联网下发数据,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差;
根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长;
针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率;
将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型;
根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词;
根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组;
将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长;
针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长;
将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
2.根据权利要求1所述的智能广告方法,其特征在于,根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长,包括:
针对所述各个历史联网时段,从对应的所述所有联网上传数据中提取出对应的所有上传单词和在所述所有上传单词中的各个上传单词的上传时间戳;
针对所述各个历史联网时段,从对应的所述所有联网下发数据中提取出对应的所有加载展示页面、在所述所有加载展示页面中的各个加载展示页面的下发时间戳、所有加载展示单词和在所述所有加载展示单词中的各个加载展示单词的下发时间戳,其中,所述加载展示页面是指在一份所述联网下发数据中的且会在数据下发后被所述目标用户的用户终端加载展示的页面,所述加载展示单词是指出现在所述加载展示页面中的单词;
针对所述各个加载展示页面,判断在对应页面中是否存在有目标广告内容,若有,则记录所述目标广告内容的一次广告浏览事件,并将上传时间戳早于对应的下发时间戳未超过第二预设时长的所述上传单词选入到与该广告浏览事件对应的近期上传单词集合中,以及还将下发时间戳早于对应的下发时间戳未超过第三预设时长的所述加载展示单词选入到与该广告浏览事件对应的近期展示单词集合中,以及还当对应页面为在对应历史联网时段中的最后一个加载展示页面时,将所述第一预设时长或在前页面平均浏览时长作为该广告浏览事件的用户浏览时长,或者当对应页面不为在对应历史联网时段中的最后一个加载展示页面时,将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为该广告浏览事件的用户浏览时长,其中,所述在前页面平均浏览时长是指所有相邻页面时差的平均值,所述相邻页面时差是指在对应历史联网时段中的且时序相邻的后一个加载展示页面与前一个加载展示页面的下发时间戳的时间差。
3.根据权利要求2所述的智能广告方法,其特征在于,针对在所述多次广告浏览事件中的某次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,包括:
针对在多个单词类别中的各个单词类别,根据所述某次广告浏览事件的所述近期上传单词集合,按照如下公式计算得到对应的上传出现率:
式中,、/>和/>分别表示正整数,/>表示在所述多个单词类别中的第/>个单词类别的上传出现率,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的单词总数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期上传单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数;
针对所述各个单词类别,根据所述某次广告浏览事件的所述近期展示单词集合,按照如下公式计算得到对应的展示出现率:
式中,、/>、/>和/>分别表示正整数,/>表示所述第/>个单词类别的展示出现率,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的单词总数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的单词总数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的第/>个单词的被选入次数,/>表示在所述某次广告浏览事件的所述近期展示单词集合中的且属于所述第/>个单词类别的第/>个单词的被选入次数,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长,/>表示与所述第/>个单词的第/>次选入对应的单词浏览时长;
针对所述各个单词类别,按照如下公式计算得到对应的出现率:
式中,表示所述第/>个单词类别的出现率,/>和/>分别表示预设权重系数且有
汇总所述各个单词类别的出现率,得到所述某次广告浏览事件的近期单词出现率数组。
4.根据权利要求3所述的智能广告方法,其特征在于,与某个单词的某次选入对应的单词浏览时长按照如下方式确定:
根据与所述某个单词的所述某次选入对应的下发时间戳,将具有该下发时间戳的某个加载展示页面确定为单词所属加载展示页面;
针对所述单词所属加载展示页面,若对应页面为在对应历史联网时段中的最后一个加载展示页面,则将所述第一预设时长或所述在前页面平均浏览时长作为与所述某个单词的所述某次选入对应的单词浏览时长,否则将对应的后一个加载展示页面的下发时间戳与对应的下发时间戳的时间差作为与所述某个单词的所述某次选入对应的单词浏览时长。
5.根据权利要求2所述的智能广告方法,其特征在于,所述近期联网上传数据是指上传时间戳早于当前时刻未超过所述第二预设时长的联网上传数据,所述近期联网下发数据是指下发时间戳早于当前时刻未超过所述第三预设时长的联网下发数据。
6.根据权利要求1所述的智能广告方法,其特征在于,所述机器学习算法采用基于Python sklearn库的线性回归算法,以及在所述人工智能模型的率定验证建模过程中,采用基于树结构的贝叶斯优化算法对模型参数进行调优。
7.根据权利要求1所述的智能广告方法,其特征在于,针对某个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长,包括:
针对所述某个待推送广告内容,提取得到对应的多个第一广告素材;
针对在不同的个目标广告内容中的各个目标广告内容,提取得到对应的多个第二广告素材,并根据所述多个第二广告素材与所述多个第一广告素材的匹配结果,确定对应广告内容与所述某个待推送广告内容的相似度,其中,/>表示大于等于2的正整数;
按照如下公式计算得到所述目标用户与所述某个待推送广告内容的当前广告浏览预测时长
式中,表示正整数,/>表示在所述/>个目标广告内容中的第/>个目标广告内容与所述某个待推送广告内容的相似度,/>表示所述目标用户与所述第/>个目标广告内容的当前广告浏览预测时长。
8.一种基于大数据的智能广告装置,其特征在于,包括有大数据获取模块、信息提取模块、出现率统计模块、模型训练模块、模型应用模块、时长计算模块和广告下发模块;
所述大数据获取模块,用于获取目标用户的历史联网大数据,其中,所述历史联网大数据包含有在各个历史联网时段的所有联网上传数据以及所有联网下发数据,所述历史联网时段是指进行所述联网上传数据上传以及所述联网下发数据下发的且所有相邻数据时差均小于等于第一预设时长的历史时段,所述相邻数据时差包括有时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网上传数据的上传时间戳的时间差/和时序相邻的后一份所述联网下发数据的下发时间戳与前一份所述联网下发数据的下发时间戳的时间差;
所述信息提取模块,通信连接所述大数据获取模块,用于根据在所述各个历史联网时段的所述所有联网下发数据,确定目标广告内容的多次广告浏览事件,并根据在所述各个历史联网时段的所述所有联网上传数据,提取得到与在所述多次广告浏览事件中的各次广告浏览事件对应的近期上传单词集合,以及根据在所述各个历史联网时段的所述所有联网下发数据,提取得到与所述各次广告浏览事件对应的近期展示单词集合以及用户浏览时长;
所述出现率统计模块,通信连接所述信息提取模块,用于针对所述各次广告浏览事件,根据对应的所述近期上传单词集合以及所述近期展示单词集合,统计得到对应的近期单词出现率数组,其中,所述近期单词出现率数组包含有在多个单词类别中的各个单词类别的出现率;
所述模型训练模块,分别通信连接所述信息提取模块和所述出现率统计模块,用于将所述各次广告浏览事件的所述单词出现率数组作为输入项,以及将所述各次广告浏览事件的用户浏览时长作为输出项,对基于机器学习算法的人工智能模型进行率定验证建模,得到所述目标用户与所述目标广告内容的广告浏览时长预测模型;
所述信息提取模块,还用于根据所述目标用户的近期联网上传数据提取得到所有近期上传单词,以及根据所述目标用户的近期联网下发数据提取得到所有近期展示单词;
所述出现率统计模块,还用于根据所述所有近期上传单词以及所述所有近期展示单词,统计得到当前的所述近期单词出现率数组;
所述模型应用模块,分别通信连接所述模型训练模块和所述出现率统计模块,用于将当前的所述近期单词出现率数组输入所述广告浏览时长预测模型,输出得到所述目标用户与所述目标广告内容的当前广告浏览预测时长;
所述时长计算模块,通信连接所述模型应用模块,用于针对各个待推送广告内容,根据所述目标用户与所述目标广告内容的当前广告浏览预测时长和对应广告内容与所述目标广告内容的相似度,计算得到所述目标用户与对应广告内容的当前广告浏览预测时长;
所述广告下发模块,通信连接所述时长计算模块,用于将具有最长的当前广告浏览预测时长的某个待推送广告内容添加到待加载展示页面中,并将包含有所述待加载展示页面的新联网下发数据下发给所述目标用户的用户终端。
9.一种计算机设备,其特征在于,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~7中任意一项所述的智能广告方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~7中任意一项所述的智能广告方法。
CN202311371174.4A 2023-10-23 2023-10-23 一种基于大数据的智能广告方法、装置、设备及存储介质 Active CN117132330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311371174.4A CN117132330B (zh) 2023-10-23 2023-10-23 一种基于大数据的智能广告方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311371174.4A CN117132330B (zh) 2023-10-23 2023-10-23 一种基于大数据的智能广告方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117132330A true CN117132330A (zh) 2023-11-28
CN117132330B CN117132330B (zh) 2024-01-30

Family

ID=88858437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311371174.4A Active CN117132330B (zh) 2023-10-23 2023-10-23 一种基于大数据的智能广告方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117132330B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117495459A (zh) * 2024-01-02 2024-02-02 蓝色火焰科技成都有限公司 基于大数据的人机互动广告方法、装置、设备及存储介质
CN117541331A (zh) * 2024-01-10 2024-02-09 蓝色火焰科技成都有限公司 一种广告发布方法、系统、电子设备及介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169842A (zh) * 2007-08-11 2008-04-30 腾讯科技(深圳)有限公司 广告管理方法、广告计费方法及广告系统
CN101207805A (zh) * 2006-12-20 2008-06-25 北京汉辰科技有限公司 一种利用p2p机顶盒技术的流媒体传输系统及其方法
CN101216825A (zh) * 2007-12-29 2008-07-09 朱廷劭 标引关键词提取/预测方法、在线广告推荐方法和装置
CN101329675A (zh) * 2007-06-19 2008-12-24 百度在线网络技术(北京)有限公司 网页广告匹配方法及系统
CN101599156A (zh) * 2008-06-05 2009-12-09 阿里巴巴集团控股有限公司 一种广告展现方法、装置和系统
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN102819804A (zh) * 2011-06-07 2012-12-12 阿里巴巴集团控股有限公司 一种商品信息的推送方法及设备
CN103258288A (zh) * 2013-06-05 2013-08-21 珠海市横琴因行思智能科技有限公司 广告推送方法及系统
CN104980772A (zh) * 2014-04-14 2015-10-14 北京酷云互动科技有限公司 植入广告的监测方法和监测装置
CN105049895A (zh) * 2015-07-06 2015-11-11 无锡天脉聚源传媒科技有限公司 一种广告投放策略的推荐方法及装置
CN110366858A (zh) * 2017-01-17 2019-10-22 图特拉技术有限公司 用于评估无线装置和/或无线网络性能的系统和方法
CN112348602A (zh) * 2021-01-07 2021-02-09 浙江争游网络科技有限公司 一种基于大数据的广告自动化投放管理系统
CN114971726A (zh) * 2022-05-31 2022-08-30 成都新潮传媒集团有限公司 一种广告点位筛选方法、装置、计算机设备及计算机可读存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101207805A (zh) * 2006-12-20 2008-06-25 北京汉辰科技有限公司 一种利用p2p机顶盒技术的流媒体传输系统及其方法
CN101329675A (zh) * 2007-06-19 2008-12-24 百度在线网络技术(北京)有限公司 网页广告匹配方法及系统
CN101169842A (zh) * 2007-08-11 2008-04-30 腾讯科技(深圳)有限公司 广告管理方法、广告计费方法及广告系统
CN101216825A (zh) * 2007-12-29 2008-07-09 朱廷劭 标引关键词提取/预测方法、在线广告推荐方法和装置
CN101599156A (zh) * 2008-06-05 2009-12-09 阿里巴巴集团控股有限公司 一种广告展现方法、装置和系统
CN102819804A (zh) * 2011-06-07 2012-12-12 阿里巴巴集团控股有限公司 一种商品信息的推送方法及设备
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN103258288A (zh) * 2013-06-05 2013-08-21 珠海市横琴因行思智能科技有限公司 广告推送方法及系统
CN104980772A (zh) * 2014-04-14 2015-10-14 北京酷云互动科技有限公司 植入广告的监测方法和监测装置
CN105049895A (zh) * 2015-07-06 2015-11-11 无锡天脉聚源传媒科技有限公司 一种广告投放策略的推荐方法及装置
CN110366858A (zh) * 2017-01-17 2019-10-22 图特拉技术有限公司 用于评估无线装置和/或无线网络性能的系统和方法
CN112348602A (zh) * 2021-01-07 2021-02-09 浙江争游网络科技有限公司 一种基于大数据的广告自动化投放管理系统
CN114971726A (zh) * 2022-05-31 2022-08-30 成都新潮传媒集团有限公司 一种广告点位筛选方法、装置、计算机设备及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MATTHEW RICHARDSON 等: "Predicting Clicks:Estimating the Click-Through Rate for New Ads", 《WWW07》, pages 521 - 529 *
陆枫;王子锐;廖小飞;金海;: "基于细粒度标签的在线视频广告投放机制研究", 计算机研究与发展, no. 12, pages 2733 - 2745 *
陈远, 成全, 钟晓星: "基于搜索引擎的关键词广告及策略", 情报理论与实践, no. 02, pages 169 - 172 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117495459A (zh) * 2024-01-02 2024-02-02 蓝色火焰科技成都有限公司 基于大数据的人机互动广告方法、装置、设备及存储介质
CN117495459B (zh) * 2024-01-02 2024-03-19 蓝色火焰科技成都有限公司 基于大数据的人机互动广告方法、装置、设备及存储介质
CN117541331A (zh) * 2024-01-10 2024-02-09 蓝色火焰科技成都有限公司 一种广告发布方法、系统、电子设备及介质
CN117541331B (zh) * 2024-01-10 2024-04-02 蓝色火焰科技成都有限公司 一种广告发布方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN117132330B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN117132330B (zh) 一种基于大数据的智能广告方法、装置、设备及存储介质
CN111538912B (zh) 内容推荐方法、装置、设备及可读存储介质
WO2023108980A1 (zh) 基于文本对抗样例的信息推送方法及装置
CN115002200B (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
CN114666663A (zh) 用于生成视频的方法和装置
CN111177538B (zh) 一种基于无监督权值计算的用户兴趣标签构建方法
CN110390052A (zh) 搜索推荐方法、ctr预估模型的训练方法、装置及设备
JP2011248831A (ja) 情報処理装置および方法、並びに、プログラム
CN112287238B (zh) 用户特征的确定方法和装置、存储介质及电子设备
CN110955750A (zh) 评论区域和情感极性的联合识别方法、装置、电子设备
CN110046251A (zh) 社区内容风险评估方法及装置
CN110880127A (zh) 消费水平的预测方法、装置、电子设备及存储介质
CN112053184B (zh) 推广信息投放方法、装置、电子设备以及存储介质
CN111931073B (zh) 内容推送方法、装置、电子设备及计算机可读介质
CN112633690A (zh) 服务人员信息分配方法、装置、计算机设备和存储介质
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
CN112995690A (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN117795502A (zh) 消息传递系统中主题的演进
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
Voronov et al. Forecasting popularity of news article by title analyzing with BN-LSTM network
CN113076450B (zh) 一种目标推荐列表的确定方法和装置
CN110020120A (zh) 内容投放系统中的特征词处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant