CN112348602B - 一种基于大数据的广告自动化投放管理系统 - Google Patents

一种基于大数据的广告自动化投放管理系统 Download PDF

Info

Publication number
CN112348602B
CN112348602B CN202110015560.4A CN202110015560A CN112348602B CN 112348602 B CN112348602 B CN 112348602B CN 202110015560 A CN202110015560 A CN 202110015560A CN 112348602 B CN112348602 B CN 112348602B
Authority
CN
China
Prior art keywords
advertisement
user
module
category
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110015560.4A
Other languages
English (en)
Other versions
CN112348602A (zh
Inventor
潘红静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhengyou Network Technology Co ltd
Original Assignee
Zhejiang Zhengyou Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhengyou Network Technology Co ltd filed Critical Zhejiang Zhengyou Network Technology Co ltd
Priority to CN202110015560.4A priority Critical patent/CN112348602B/zh
Publication of CN112348602A publication Critical patent/CN112348602A/zh
Application granted granted Critical
Publication of CN112348602B publication Critical patent/CN112348602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据的广告自动化投放管理系统,其特征在于,包括广告服务器、后台管理模块和手机客户端;所述广告服务器包括广告抓取模块、广告分类模块、广告数据库、广告投放管理模块以及存储模块;所述广告抓取模块用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类;所述访问统计模块用于统计广告数据库中每条广告在系统当前时间前3天内的点击信息并将点击信息传输到广告评估模块;所述广告评估模块用于对点击信息作出分析。本发明能够进行用户行为定位分析,有效提高广告投放精准度。

Description

一种基于大数据的广告自动化投放管理系统
技术领域
本发明涉及广告投放技术领域,具体涉及一种基于大数据的广告自动化投放管理系统。
背景技术
广告是为了某种特定的需要,通过一定形式的媒体,公开而广泛地向公众传递信息的宣传手段。我国《广告法》对广告的定义为:广告,是指商品经营者或者服务提供者承担费用,通过一定媒介和形式直接或者间接地介绍自己所推销的商品或者所提供的服务的商业广告。
目前,广告主对于精准投放的认识逐渐形成,精准投放的需求日益强烈,现有的广告终端普遍采用直接从服务器获取广告进行本地投放的模式。广告主基于市场成本的考虑,想要基于现有广告投放的效果来进行下一次广告投放的策略制定,一定需要尽可能全面和客观的广告投放效果反馈。另外随着广告终端形式的多样化和视频类广告成为主流广告形式,广告投放数据量也呈现指数级增长,如何利用大数据进行广告精准投放以及用户行为分析,已经成为广告投放领域需要研究的重要课题。
传统的广告投放方式投资大、成本高,且只能提供内容展示,而缺乏对显示内容的收视量、位置、时段等参数的管理,不具有数据管理功能,不能分析和优化广告内容,无法根据大数据的管理和分析,满足对不同群体精准投放广告的需求。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于大数据的广告自动化投放管理系统,以满足广告投放日益递增的海量数据要求,能够进行用户行为定位分析,有效提高广告投放精准度。
本发明的目的可以通过以下技术方案实现:一种基于大数据的广告自动化投放管理系统,包括广告服务器、后台管理模块和手机客户端;
所述广告服务器包括广告抓取模块、广告分类模块、广告数据库、广告投放管理模块以及存储模块;
所述广告抓取模块用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类;
所述系统还包括访问统计模块和广告评估模块;
所述访问统计模块用于统计广告数据库中每条广告在系统当前时间前3天内的点击信息并将点击信息传输到广告评估模块;所述广告评估模块用于对点击信息作出分析,具体步骤如下:
S31:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被点击的次数标记为Bm,每次点击的观看时间标记为Tmi,每天被评论的次数标记为Cm,每天被转发的次数标记为Dm,每天被收藏的次数标记为Em,每天被点赞的次数标记为Fm;m=1,2,3;i=1,2,…,n;
S32:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被观看的时间标记为Tm;
Figure DEST_PATH_IMAGE002
S33:利用公式
Figure DEST_PATH_IMAGE004
计算得出该条广告每天的热度值,其中,a1、a2、a3、r1、r2、r3和r4均为系数因子;
S34:按照平均值计算公式得出该条广告当前时间前3天内的平均热度值L;按照标准差计算公式得出前3天内该条广告每天热度值的标准差α,利用公式
Figure DEST_PATH_IMAGE006
;计算得出该条广告的持续热度值β,其中
Figure DEST_PATH_IMAGE008
均为系数因子;
S35:当β超过预设值时,广告评估模块将持续热度值β传输到存储模块,所述存储模块根据持续热度值β对广告信息做降序排列并将持续热度值β、对应的广告以及广告所属主题类别融合形成推荐表之后进行存储;
所述广告评估模块用于将持续热度值β前十对应的广告传输至广告投放管理模块,所述广告投放管理模块用于接收持续热度值β前十对应的广告并将持续热度值β前十对应的广告推送给用户;
所述后台管理模块包括用户信息数据库、记忆模块和用户行为分析模块;所述用户信息数据库用于存储、管理客户的基本信息;所述记忆模块用于存储用户的广告历史浏览记录并将用户的广告历史浏览记录传输到用户行为分析模块;所述用户行为分析模块根据用户的广告历史浏览记录对用户的浏览偏好进行分析,具体分析步骤如下:
S41:获取系统当前时间前10天内用户的广告历史浏览记录;将每条记录的浏览时间标记为Hx,持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取系统当前时间,将当前时间标记为T0,利用公式
Figure DEST_PATH_IMAGE010
计算得出该条记录的时效值
Figure DEST_PATH_IMAGE012
;其中b1为系数因子,Hx与T0越接近,则
Figure DEST_PATH_IMAGE012A
值越大;
S43:若用户对该广告有评论,则S(C)=1,否则S(C)=0;若用户对该广告有转发,则S(D)=1,否则S(D)=0;若用户对该广告有收藏,则S(E)=1,否则S(E)=0,若用户对该广告有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure DEST_PATH_IMAGE014
计算得出用户对该广告的兴趣值
Figure DEST_PATH_IMAGE016
;其中b2为预设系数因子;
S45:按照广告的主题类别将同一主题类别的广告历史浏览记录整合,依次计算出该主题类别中每条广告的用户兴趣值
Figure DEST_PATH_IMAGE016A
,利用求和公式得出用户对该主题类别广告的兴趣值
Figure DEST_PATH_IMAGE018
S46:取
Figure DEST_PATH_IMAGE018A
最大的广告主题类别,即为用户最近的广告浏览偏好类别。
进一步地,所述广告分类模块进行增量计算分类的具体步骤如下:
步骤一:根据广告的主题类别建立种子词典,所述种子词典中包括主题类别和种子关键词,一个种子关键词对应一个主题类别,每个主题类别对应有多个种子关键词;
步骤二:对广告标题进行分词处理,提取广告标题中字符个数大于I的词元作为标题关键词;
步骤三:通过多个基于互联网的搜索引擎服务器对所述标题关键词进行元搜索;包括:
S11:根据搜索引擎的字符编码对查询关键词进行编码处理;
S12:拼接向搜索引擎服务器提交的请求URL;
S13:利用编程语言提供的网络通讯工具包向搜索引擎服务器提交URL请求并返回搜索结果;
S14:合并多个搜索引擎返回的搜索结果,以作为元搜索的结果;
步骤四:在元搜索的结果中对所述种子关键词进行频次统计;
步骤五:根据元搜索的结果中种子关键词出现的频次判定广告最终的主题类别;具体过程如下:
S21:对于任意一个主题类别,先计算所述主题类别对应的每个种子关键词在元搜索的结果中出现的频次,然后统计所有种子关键词在元搜索的结果中出现的总频次,将所述总频次作为该主题类别在元搜索的结果中出现的频次;
S22:重复步骤S21,直到得到每一个主题类别在元搜索的结果中出现的频次;
S23:如果所述元搜索的结果中存在一个出现频次最多的主题类别,则判定所述出现频次最多的主题类别作为该广告最终的主题类别;如果所述元搜索的结果中存在多个频次并列最多的主题类别,则将所述频次并列最多的主题类别均作为该广告最终的主题类别;
S24:所述广告分类模块对广告信息进行分类保存并将分类保存的广告信息传输到广告数据库。
进一步地,所述用户行为分析模块用于将分析结果传输到广告投放管理模块,所述广告投放管理模块接收用户行为分析模块传输的分析结果得到用户最近的广告浏览偏好类别并根据用户最近的广告浏览偏好类别从存储模块内存储的推荐表中得到匹配的广告信息后推送给用户;所述广告投放管理模块的具体工作步骤为:
FF1:获取用户最近的广告浏览偏好类别,并标记为目标广告类别;
FF2:根据目标广告类别从存储模块内存储的推荐表中获取该目标广告类别的广告,并标记为初选广告;
FF3:获取初选广告的持续热度值,并标记为DR;
按照持续热度值DR从大到小的顺序将对应的初选广告进行排序;
FF4:根据初选广告的排序获取排名前十的初选广告并标记为目标广告;
FF5:将目标广告推送给用户;
进一步地,所述手机客户端包括登录注册模块、输入模块和推荐模块;其中,所述输入模块用于用户输入需要查询的内容,包括广告标题和关键词;所述登录注册模块用于用户进行登录或注册;所述推荐模块用于将推荐的广告发送到手机客户端;其推荐方法包括如下步骤:
S51:用户通过登录注册模块进行登录或者注册;
S52:用户通过输入模块输入需要查询的内容,包括广告标题和关键词;
S53:广告服务器通过广告分类模块来分析用户输入广告标题和关键词来确定广告的主题类别;
S54:广告投放管理模块获取广告的主题类别并从存储模块内存储的推荐表中得到匹配的广告信息推荐给用户;
S54:判断用户是否为首次登录,若是首次登录,则采取冷启动的方式,向用户推送不同类别的广告;若不是首次登录,则根据此次用户输入的广告标题和关键词或根据用户之前的广告历史浏览记录来分析用户最近的广告浏览偏好类别,来为用户推荐其需要或者感兴趣的广告;
进一步地,所述广告信息包括广告标题;所述点击信息包括点击次数、每次点击的观看时间、以及评论、转发、收藏和点赞的行为特征;所述广告历史浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征。
本发明的有益效果是:
(1)广告抓取模块用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类,打上标签;将冗杂的广告进行精准分类,以便有针对性的进行广告推送,及时快速地向用户进行推荐;
(2)通过访问统计模块统计广告数据库中每条广告在系统当前时间前3天内的点击信息,广告评估模块对点击信息作出分析,根据相应算法得出每条广告的持续热度值β,当β超过预设值时,广告评估模块将持续热度值β传输到存储模块,所述存储模块将持续热度值β、对应的广告以及广告所属主题类别融合形成推荐表之后进行存储,供广告管理人员参考;
(3)记忆模块用于存储用户的广告历史浏览记录并将用户的广告历史浏览记录传输到用户行为分析模块,所述用户行为分析模块根据用户的广告历史浏览记录对用户的浏览偏好进行分析;所述用户行为分析模块用于将分析结果传输到广告投放管理模块,所述广告投放管理模块接收用户行为分析模块传输的分析结果得到用户最近的广告浏览偏好类别并根据用户最近的广告浏览偏好类别从存储模块内存储的推荐表中得到匹配的广告信息后推送给用户;满足对不同群体精准投放广告的需求。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图。
图2为本发明实施例1的系统框图。
图3为本发明实施例2的系统框图。
图4为本发明实施例3的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1-4所示,一种基于大数据的广告自动化投放管理系统,包括广告服务器、后台管理模块和手机客户端;
所述广告服务器包括广告抓取模块、广告分类模块、广告数据库、广告投放管理模块以及存储模块;
实施例1
如图2所示,所述广告抓取模块,用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类,具体步骤如下:
步骤一:根据广告的主题类别建立种子词典,所述种子词典中包括主题类别和种子关键词,一个种子关键词对应一个主题类别,每个主题类别对应有多个种子关键词;
步骤二:对广告的标题进行分词处理,提取广告标题中字符个数大于I的词元作为标题关键词;其中I为预设值;
步骤三:通过多个基于互联网的搜索引擎服务器对所述标题关键词进行元搜索;包括:
S11:根据搜索引擎的字符编码对查询关键词进行编码处理;
S12:拼接向搜索引擎服务器提交的请求URL;
S13:利用编程语言提供的网络通讯工具包向搜索引擎服务器提交URL请求并返回搜索结果;
S14:合并多个搜索引擎返回的搜索结果,以作为元搜索的结果;
步骤四:在元搜索的结果中对所述种子关键词进行频次统计;
步骤五:根据元搜索的结果中种子关键词出现的频次判定广告最终的主题类别;具体过程如下:
S21:对于任意一个主题类别,先计算所述主题类别对应的每个种子关键词在元搜索的结果中出现的频次,然后统计所有种子关键词在元搜索的结果中出现的总频次,将所述总频次作为该主题类别在元搜索的结果中出现的频次;
S22:重复步骤S21,直到得到每一个主题类别在元搜索的结果中出现的频次;
S23:如果所述元搜索的结果中存在一个出现频次最多的主题类别,则判定所述出现频次最多的主题类别作为该广告最终的主题类别;如果所述元搜索的结果中存在多个频次并列最多的主题类别,则将所述频次并列最多的主题类别均作为该广告最终的主题类别;
S24:所述广告分类模块对广告信息进行分类保存并将分类保存的广告信息传输到广告数据库;
广告分类模块接收广告信息并对广告信息进行增量计算分类,打上标签;将冗杂的广告进行精准分类,以便有针对性的进行广告推送,及时快速地向用户进行推荐;
实施例2
如图3所示;所述访问统计模块用于统计广告数据库中每条广告在系统当前时间前3天内的点击信息并将点击信息传输到广告评估模块;所述点击信息包括点击次数、每次点击的观看时间、以及评论、转发、收藏和点赞的行为特征;所述广告评估模块用于对点击信息作出分析,具体步骤如下:
S31:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被点击的次数标记为Bm,每次点击的观看时间标记为Tmi,每天被评论的次数标记为Cm,每天被转发的次数标记为Dm,每天被收藏的次数标记为Em,每天被点赞的次数标记为Fm;m=1,2,3;i=1,2,…,n;
S32:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被观看的时间标记为Tm;
Figure DEST_PATH_IMAGE020
S33:利用公式
Figure DEST_PATH_IMAGE022
计算得出该条广告每天的热度值,其中,a1、a2、a3、r1、r2、r3和r4均为系数因子;
S34:按照平均值计算公式得出该条广告当前时间前3天内的平均热度值L;按照标准差计算公式得出前3天内该条广告每天热度值的标准差α,利用公式
Figure DEST_PATH_IMAGE024
;计算得出该条广告的持续热度值β,其中
Figure DEST_PATH_IMAGE008A
均为系数因子;
S35:当β超过预设值时,广告评估模块将持续热度值β传输到存储模块,所述存储模块将持续热度值β、对应的广告以及广告所属主题类别融合形成推荐表之后进行存储,供广告管理人员参考;
所述广告评估模块用于将持续热度值β前十对应的广告传输至广告投放管理模块,所述广告投放管理模块用于接收持续热度值β前十对应的广告并将持续热度值β前十对应的广告推送给用户;
实施例3
如图4所示;所述后台管理模块包括用户信息数据库、记忆模块和用户行为分析模块;所述用户信息数据库用于存储、管理客户的基本信息,记忆模块用于存储用户的广告历史浏览记录并将用户的广告历史浏览记录传输到用户行为分析模块,所述广告历史浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征;所述用户行为分析模块根据用户的广告历史浏览记录对用户的浏览偏好进行分析,具体分析步骤如下:
S41:获取系统当前时间前10天内用户的广告历史浏览记录;将每条记录的浏览时间标记为Hx,持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取系统当前时间,将当前时间标记为T0,利用公式
Figure DEST_PATH_IMAGE026
计算得出该条记录的时效值
Figure DEST_PATH_IMAGE028
;其中b1为系数因子,Hx与T0越接近,则
Figure DEST_PATH_IMAGE028A
值越大;
Figure DEST_PATH_IMAGE030
为预设因子;
S43:若用户对该广告有评论,则S(C)=1,否则S(C)=0;若用户对该广告有转发,则S(D)=1,否则S(D)=0;若用户对该广告有收藏,则S(E)=1,否则S(E)=0,若用户对该广告有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure DEST_PATH_IMAGE032
计算得出用户对该广告的兴趣值
Figure DEST_PATH_IMAGE034
S45:按照广告的主题类别将同一主题类别的广告历史浏览记录整合,依次计算出该主题类别中每条广告的用户兴趣值
Figure DEST_PATH_IMAGE034A
,利用求和公式得出用户对该主题类别广告的兴趣值
Figure DEST_PATH_IMAGE036
S46:取
Figure DEST_PATH_IMAGE036A
最大的广告主题类别,即为用户最近的广告浏览偏好类别;
所述用户行为分析模块用于将分析结果传输到广告投放管理模块,所述广告投放管理模块接收用户行为分析模块传输的分析结果得到用户最近的广告浏览偏好类别并根据用户最近的广告浏览偏好类别从存储模块内存储的推荐表中得到匹配的广告信息后推送给用户;所述广告投放管理模块的具体工作步骤为:
FF1:获取用户最近的广告浏览偏好类别,并标记为目标广告类别;
FF2:根据目标广告类别从存储模块内存储的推荐表中获取该目标广告类别的广告,并标记为初选广告;
FF3:获取初选广告的持续热度值,并标记为DR;
按照持续热度值DR从大到小的顺序将对应的初选广告进行排序;
FF4:根据初选广告的排序获取排名前十的初选广告并标记为目标广告;
FF5:将目标广告推送给用户;
所述手机客户端包括登录注册模块、输入模块和推荐模块;其中,所述输入模块用于用户输入需要查询的内容,包括广告标题和关键词;所述登录注册模块用于用户进行登录或注册;所述推荐模块用于将推荐的广告发送到手机客户端;其推荐方法包括如下步骤:
S51:用户通过登录注册模块进行登录或者注册;
S52:用户通过输入模块输入需要查询的内容,包括广告标题和关键词;
S53:广告服务器通过广告分类模块来分析用户输入广告标题和关键词来确定广告的主题类别;
S54:广告投放管理模块获取广告的主题类别并从存储模块内存储的推荐表中得到匹配的广告信息推荐给用户;
S54:判断用户是否为首次登录,若是首次登录,则采取冷启动的方式,向用户推送不同类别的广告;若不是首次登录,则根据此次用户输入的广告标题和关键词或根据用户之前的广告历史浏览记录来分析用户最近的广告浏览偏好类别,来为用户推荐其需要或者感兴趣的广告;
本发明的推荐模块,一方面从广告本身出发,能够根据用户输入的的广告标题和输入的关键词,从而分析出用户最需要获得的广告类别,再通过广告服务器得到最近三天内该广告类别中持续热度值β超过预设值的广告信息,从而在冗杂的广告类别里有针对性的进行广告推送,及时快速地向用户进行推荐;
另一方面从用户行为出发,通过用户行为分析模块,对用户浏览某一类广告的时间以及时长,评论、转发、点赞和收藏的行为特征进行记忆分析,得到用户最近的广告浏览偏好类别,然后向用户推荐该广告类别中持续热度值β超过预设值的广告信息;这样不仅能节约时间,同时还能避免用户在自己搜索过程中错看漏看的情况;随着时间的推移,推荐的广告类别会衰减,用户浏览的广告类别越来越单一,此时动态增加多类别,丰富广告资讯;可以及时的实现特殊手段和特殊干预的消息推送。
本发明的工作原理:
首先广告抓取模块用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类,打上标签:根据广告的主题类别建立种子词典,所述种子词典中包括主题类别和种子关键词,一个种子关键词对应一个主题类别,每个主题类别对应有多个种子关键词;对广告的标题进行分词处理,提取广告标题中字符个数大于I的词元作为标题关键词;通过多个基于互联网的搜索引擎服务器对所述标题关键词进行元搜索;在元搜索的结果中对所述种子关键词进行频次统计;根据元搜索的结果中种子关键词出现的频次判定广告最终的主题类别;
所述访问统计模块用于统计广告数据库中每条广告在系统当前时间前3天内的点击信息并将点击信息传输到广告评估模块,所述广告评估模块用于对点击信息作出分析,所述点击信息包括点击次数、每次点击的观看时间、以及评论、转发、收藏和点赞的行为特征,根据相关算法计算得出该条广告每天被观看的时间
Figure DEST_PATH_IMAGE038
该条广告每天的热度
Figure DEST_PATH_IMAGE040
;从而得到该条广告的持续热度值β,
Figure DEST_PATH_IMAGE042
,当β超过预设值时,广告评估模块将持续热度值β传输到存储模块,所述存储模块将持续热度值β、对应的广告以及广告所属主题类别融合形成推荐表之后进行存储,供广告管理人员参考;
用户通过登录注册模块进行登录或者注册,用户通过输入模块输入需要查询的内容,包括广告标题和关键词,广告服务器通过广告分类模块来分析用户输入广告标题和关键词来确定广告的主题类别,广告投放管理模块获取广告的主题类别并从存储模块内存储的推荐表中得到匹配的广告信息推荐给用户;若是首次登录,则采取冷启动的方式,向用户推送不同类别的新闻;
若不是首次登录,则根据此次用户输入的广告标题和关键词或根据用户之前的广告历史浏览记录分析用户最近的广告浏览偏好,所述广告历史浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征;所述用户行为分析模块通过相应的分析和处理,得出用户对该广告的兴趣值
Figure DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE046
;按照广告的主题类别将同一主题类别的广告历史浏览记录整合,依次计算出该主题类别中每条广告的用户兴趣值
Figure DEST_PATH_IMAGE044A
,利用求和公式得出用户对该主题类别广告的兴趣值
Figure DEST_PATH_IMAGE048
;取
Figure DEST_PATH_IMAGE048A
最大的广告主题类别,即为用户最近的广告浏览偏好类别;广告投放管理模块获取用户最近的广告浏览偏好类别并从存储模块内存储的推荐表中得到匹配的广告信息推荐给用户。
上述公式均是由采集大量数据进行软件模拟及相应专家进行参数设置处理,得到与真实结果符合的公式。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (2)

1.一种基于大数据的广告自动化投放管理系统,其特征在于,包括广告服务器、后台管理模块和手机客户端;
所述广告服务器包括广告抓取模块、广告分类模块、广告数据库、广告投放管理模块以及存储模块;
所述广告抓取模块用于实时获取广告信息并将获取的广告信息传输到广告分类模块;所述广告分类模块接收广告信息并对广告信息进行增量计算分类;
所述系统还包括访问统计模块和广告评估模块;
访问统计模块用于统计广告数据库中每条广告在系统当前时间前3天内的点击信息并将点击信息传输到广告评估模块;所述广告评估模块用于对点击信息作出分析,具体步骤如下:
S31:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被点击的次数标记为Bm,每次点击的观看时间标记为Tmi,每天被评论的次数标记为Cm,每天被转发的次数标记为Dm,每天被收藏的次数标记为Em,每天被点赞的次数标记为Fm;m=1,2,3;i=1,2,…,n;
S32:针对每条广告中的任一条广告,将系统当前时间前3天内该条广告每天被观看的时间标记为Tm;
Figure 668896DEST_PATH_IMAGE002
S33:利用公式
Figure 112602DEST_PATH_IMAGE004
计算得出该条广告每天的热度值,其中,a1、a2、a3、r1、r2、r3和r4均为系数因子;
S34:按照平均值计算公式得出该条广告当前时间前3天内的平均热度值L;按照标准差计算公式得出前3天内该条广告每天热度值的标准差α,利用公式
Figure 610448DEST_PATH_IMAGE006
;计算得出该条广告的持续热度值β,其中
Figure 254925DEST_PATH_IMAGE008
均为系数因子;
S35:当β超过预设值时,广告评估模块将持续热度值β传输到存储模块,所述存储模块根据持续热度值β对广告信息做降序排列并将持续热度值β、对应的广告以及广告所属主题类别融合形成推荐表之后进行存储;
所述广告评估模块用于将持续热度值β前十对应的广告传输至广告投放管理模块,所述广告投放管理模块用于接收持续热度值β前十对应的广告并将持续热度值β前十对应的广告推送给用户;
所述广告分类模块进行增量计算分类的具体步骤如下:
步骤一:根据广告的主题类别建立种子词典,所述种子词典中包括主题类别和种子关键词,一个种子关键词对应一个主题类别,每个主题类别对应有多个种子关键词;
步骤二:对广告标题进行分词处理,提取广告标题中字符个数大于I的词元作为标题关键词;其中I为预设值;
步骤三:通过多个基于互联网的搜索引擎服务器对所述标题关键词进行元搜索;包括:
S11:根据搜索引擎的字符编码对查询关键词进行编码处理;
S12:拼接向搜索引擎服务器提交的请求URL;
S13:利用编程语言提供的网络通讯工具包向搜索引擎服务器提交URL请求并返回搜索结果;
S14:合并多个搜索引擎返回的搜索结果,以作为元搜索的结果;
步骤四:在元搜索的结果中对所述种子关键词进行频次统计;
步骤五:根据元搜索的结果中种子关键词出现的频次判定广告最终的主题类别;具体过程如下:
S21:对于任意一个主题类别,先计算所述主题类别对应的每个种子关键词在元搜索的结果中出现的频次,然后统计所有种子关键词在元搜索的结果中出现的总频次,将所述总频次作为该主题类别在元搜索的结果中出现的频次;
S22:重复步骤S21,直到得到每一个主题类别在元搜索的结果中出现的频次;
S23:如果所述元搜索的结果中存在一个出现频次最多的主题类别,则判定所述出现频次最多的主题类别作为该广告最终的主题类别;如果所述元搜索的结果中存在多个频次并列最多的主题类别,则将所述频次并列最多的主题类别均作为该广告最终的主题类别;
S24:所述广告分类模块对广告信息进行分类保存并将分类保存的广告信息传输到广告数据库;
所述后台管理模块包括用户信息数据库、记忆模块和用户行为分析模块;所述用户信息数据库用于存储、管理客户的基本信息;所述记忆模块用于存储用户的广告历史浏览记录并将用户的广告历史浏览记录传输到用户行为分析模块;所述用户行为分析模块根据用户的广告历史浏览记录对用户的浏览偏好进行分析,具体分析步骤如下:
S41:获取系统当前时间前10天内用户的广告历史浏览记录;将每条记录的浏览时间标记为Hx,持续时长标记为Rx,评论行为值标记为S(C),转发行为值标记为S(D),收藏行为值标记为S(E),点赞行为值标记为S(F);
S42:获取系统当前时间,将当前时间标记为T0,利用公式
Figure 521827DEST_PATH_IMAGE010
计算得出该条记录的时效值
Figure 62399DEST_PATH_IMAGE012
;其中b1为系数因子,Hx与T0越接近,则
Figure 578700DEST_PATH_IMAGE012
值越大;
Figure 495709DEST_PATH_IMAGE014
为预设因子;
S43:若用户对该广告有评论,则S(C)=1,否则S(C)=0;若用户对该广告有转发,则S(D)=1,否则S(D)=0;若用户对该广告有收藏,则S(E)=1,否则S(E)=0,若用户对该广告有点赞,则S(F)=1,否则S(F)=0;
S44:利用公式
Figure 882697DEST_PATH_IMAGE016
计算得出用户对该广告的兴趣值
Figure 594170DEST_PATH_IMAGE018
;其中b2为预设系数因子;
S45:按照广告的主题类别将同一主题类别的广告历史浏览记录整合,依次计算出该主题类别中每条广告的用户兴趣值
Figure 78327DEST_PATH_IMAGE018
,利用求和公式得出用户对该主题类别广告的兴趣值
Figure 330186DEST_PATH_IMAGE020
S46:取
Figure 571680DEST_PATH_IMAGE020
最大的广告主题类别,即为用户最近的广告浏览偏好;
所述用户行为分析模块用于将分析结果传输到广告投放管理模块,所述广告投放管理模块接收用户行为分析模块传输的分析结果得到用户最近的广告浏览偏好类别并根据用户最近的广告浏览偏好类别从存储模块内存储的推荐表中得到匹配的广告信息后推送给用户;所述广告投放管理模块的具体工作步骤为:
FF1:获取用户最近的广告浏览偏好类别,并标记为目标广告类别;
FF2:根据目标广告类别从存储模块内存储的推荐表中获取该目标广告类别的广告,并标记为初选广告;
FF3:获取初选广告的持续热度值,并标记为DR;
按照持续热度值DR从大到小的顺序将对应的初选广告进行排序;
FF4:根据初选广告的排序获取排名前十的初选广告并标记为目标广告;
FF5:将目标广告推送给用户;
所述手机客户端包括登录注册模块、输入模块和推荐模块;其中,所述输入模块用于用户输入需要查询的内容,包括广告标题和关键词;所述登录注册模块用于用户进行登录或注册;所述推荐模块用于将推荐的广告发送到手机客户端;其推荐方法包括如下步骤:
S51:用户通过登录注册模块进行登录或者注册;
S52:用户通过输入模块输入需要查询的内容,包括广告标题和关键词;
S53:广告服务器通过广告分类模块来分析用户输入广告标题和关键词来确定广告的主题类别;
S54:广告投放管理模块获取广告的主题类别并从存储模块内存储的推荐表中得到匹配的广告信息推荐给用户;
S55:判断用户是否为首次登录,若是首次登录,则采取冷启动的方式,向用户推送不同类别的广告;若不是首次登录,则根据此次用户输入的广告标题和关键词或根据用户之前的广告历史浏览记录来分析用户最近的广告浏览偏好类别,来为用户推荐其需要或者感兴趣的广告。
2.根据权利要求1所述的一种基于大数据的广告自动化投放管理系统,其特征在于,所述广告信息包括广告标题;所述点击信息包括点击次数、每次点击的观看时间以及评论、转发、收藏和点赞的行为特征;广告历史浏览记录包括浏览时间、持续时长以及评论、转发、收藏和点赞的行为特征。
CN202110015560.4A 2021-01-07 2021-01-07 一种基于大数据的广告自动化投放管理系统 Active CN112348602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110015560.4A CN112348602B (zh) 2021-01-07 2021-01-07 一种基于大数据的广告自动化投放管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110015560.4A CN112348602B (zh) 2021-01-07 2021-01-07 一种基于大数据的广告自动化投放管理系统

Publications (2)

Publication Number Publication Date
CN112348602A CN112348602A (zh) 2021-02-09
CN112348602B true CN112348602B (zh) 2021-04-06

Family

ID=74427409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110015560.4A Active CN112348602B (zh) 2021-01-07 2021-01-07 一种基于大数据的广告自动化投放管理系统

Country Status (1)

Country Link
CN (1) CN112348602B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113112300A (zh) * 2021-04-19 2021-07-13 两比特(北京)科技有限公司 一种影视广告抓取和分析系统
CN113780885A (zh) * 2021-09-27 2021-12-10 江西省影票文化传媒有限公司 一种本地生活服务用智能动态实时管理系统
CN114997909A (zh) * 2022-05-20 2022-09-02 雨果网(厦门)跨境电商有限公司 一种自动化广告预算调额系统
CN115545779B (zh) * 2022-10-11 2023-09-01 西窗科技(苏州)有限公司 一种基于大数据的广告投放的预警管理方法及系统
CN115907866B (zh) * 2022-11-19 2023-10-13 深圳有为通讯科技有限公司 一种基于手机锁屏广告的数据分析推送系统
CN116468486B (zh) * 2023-04-26 2023-12-12 浙江联欣科技有限公司 一种基于互联网平台的推广优化管理系统
CN116957680A (zh) * 2023-08-03 2023-10-27 深圳花旦传媒有限公司 一种广告投放效果监控系统
CN116756623A (zh) * 2023-08-15 2023-09-15 尚德软件股份有限公司 一种信息分类方法及系统
CN117132330B (zh) * 2023-10-23 2024-01-30 蓝色火焰科技成都有限公司 一种基于大数据的智能广告方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统
CN112131459A (zh) * 2020-08-07 2020-12-25 广州工商学院 基于大数据的知识产权信息检索软件管理系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391883B (zh) * 2014-11-05 2017-06-20 北京航空航天大学 一种基于迁移学习的在线广告受众排序方法
CN105721905A (zh) * 2016-02-02 2016-06-29 林蔚 一种基于视频标签的广告推送方法
CN110473000A (zh) * 2019-07-17 2019-11-19 深圳市元征科技股份有限公司 一种信息推荐方法、服务器及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统
CN112131459A (zh) * 2020-08-07 2020-12-25 广州工商学院 基于大数据的知识产权信息检索软件管理系统及方法

Also Published As

Publication number Publication date
CN112348602A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN112348602B (zh) 一种基于大数据的广告自动化投放管理系统
US8015065B2 (en) Systems and methods for assigning monetary values to search terms
US7831474B2 (en) System and method for associating an unvalued search term with a valued search term
CA2635420C (en) An automated media analysis and document management system
US8346782B2 (en) Method and system of information matching in electronic commerce website
Ortiz‐Cordova et al. Classifying web search queries to identify high revenue generating customers
US6640218B1 (en) Estimating the usefulness of an item in a collection of information
CN100514337C (zh) 关键词的联想信息生成系统和生成方法
US20120078747A1 (en) Recommendation system capable of adapting to user feedback
US20140108427A1 (en) Mining of user event data to identify users with common interests
US7970754B1 (en) Optimizing, distributing, and tracking online content
CN108875022A (zh) 一种视频推荐方法及装置
CN1984115A (zh) 一种确定内容提供商优先级的系统和方法
CN101751422A (zh) 一种移动终端智能搜索的方法、移动终端和服务器
CN112131459B (zh) 基于大数据的知识产权信息检索软件管理系统及方法
JP2008181186A (ja) クエリーログを利用したキーワードとサイトの関連度を求める方法
CN104217031A (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN106126544B (zh) 一种互联网内容的投放方法及装置
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
CN112950256A (zh) 一种基于App推送定制广告形式的方法和系统
US20080243595A1 (en) Information processing device, information processing method and information processing program
CN111159559A (zh) 根据用户需求和用户行为构建推荐引擎的方法
US20140304252A1 (en) Method, apparatus and machine readable media for presenting mobile media information in mobile search system
CN116401459A (zh) 一种互联网信息处理方法、系统及记录介质
CN109543951A (zh) 一种网络营销方法、系统及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant