CN111062738A - 一种基于大数据及人工智能的音频平台推广广告题材生成方法 - Google Patents
一种基于大数据及人工智能的音频平台推广广告题材生成方法 Download PDFInfo
- Publication number
- CN111062738A CN111062738A CN201911097203.6A CN201911097203A CN111062738A CN 111062738 A CN111062738 A CN 111062738A CN 201911097203 A CN201911097203 A CN 201911097203A CN 111062738 A CN111062738 A CN 111062738A
- Authority
- CN
- China
- Prior art keywords
- user
- dnn
- onehot
- model
- advertisement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及基于大数据及人工智能的音频平台推广广告题材生成方法,包括算法步骤:步骤一,把从用户画像系统中提取出的用户特征信息字段转化为onehot编码;步骤二,把所有用户的user_onehot使用dnn‑autodecoder提取深层特征;步骤三,从广告推荐曝光及用户点击情况打点记录系统中;步骤四,使用模型为dnn模型进行广告创意选题。本发明能够自动的,针对于音频平台自身表现,通过大数据和人工智能的方式,为平台选择相关推广广告的素材。
Description
技术领域
本发明属于大数据及人工智能领域,具体涉及一种基于大数据及人工智能的音频平台推广广告题材生成方法。
背景技术
在当今社会,人们获取信息的方式多种多样,从传统的从文字获取信息,到现阶段通过音频、视频等获取各种各样的信息。音频作为人们获取信息的最主要的信息方式之一,越来越多的被大众所认可。随着移动互联网的发展,各大音频平台也如雨后春笋般涌现出来,而对于各大音频平台来说,广告推广成为在市场夺取中的重中之重。如何高质量、高效的创作出适合自己平台的广告推广题材,成为在广告推广中最重要的事情之一。
一般的,传统广告推广题材的创作方式主要是通过人工来判断,很明显,通过人工选题有如下缺点:
一、人工带有非常强烈的主管性,往往会相关题材不能达到预期的效果;
二、人工广告题材选择,相对较慢,很难适结合自身平台,快速适应市场变化。
针对上述缺点,本发明提供一种基于大数据及人工智能的音频平台推广广告题材生成方法,本案由此产生。
发明内容
本发明的目的在于提供一种基于大数据及人工智能的音频平台推广广告题材生成方法,针对于音频平台自身表现,通过大数据和人工智能的方式,为平台选择相关推广广告的素材。
为实现上述目的,本发明具体提供的技术方案为:一种基于大数据及人工智能的音频平台推广广告题材生成方法,包括算法步骤:
步骤一,把从用户画像系统中提取出的用户特征信息字段转化为 onehot编码;
步骤二,把所有用户的user_onehot使用dnn-autodecoder提取深层特征;
步骤三,从广告推荐曝光及用户点击情况打点记录系统中,查找所有从广告途径进入平台的用户的数据作为对广告选题生成模型的训练数据;
步骤四,使用模型为dnn模型进行广告创意选题,模型的层数和每一层的节点数根据模型的效果设计。
进一步,其中步骤一中:把转化后的所有字段的onehot编码按照固定顺序拼接;该字段信息无法获取,该onehot编码为0向量。
进一步,步骤二中:使用dnn对user_onehot进行编码,dnn的层数和每层的节点数作为超参根据效果调整。
进一步,还包括模型使用,获取预投放广告的用户的用户属性,生成用户特征向量u;dnn模型生成广告选题特征向量标签特征向量公式,将dnn最终生成的特征向量按顺序拆分。
进一步,还包括模型迭代优化;每月使用广告推荐曝光及用户点击情况打点记录系统的新增数据微调dnn神经网络;增加平台关键词实体词库。
本发明有益效果:本发明能够自动的,针对于音频平台自身表现,通过大数据和人工智能的方式,为平台选择相关推广广告的素材。
附图说明
图1为根据一示例性实施例示出的一种基于大数据及人工智能的音频平台推广广告题材生成方法的流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
如图1所示,一种基于大数据及人工智能的音频平台推广广告题材生成方法,包括算法步骤:
S100步骤一,把从用户画像系统中提取出的用户特征信息字段转化为onehot编码;
S101步骤二,把所有用户的user_onehot使用dnn-autodecoder 提取深层特征;
S102步骤三,从广告推荐曝光及用户点击情况打点记录系统中,查找所有从广告途径进入平台的用户的数据作为对广告选题生成模型的训练数据。
S103步骤四,使用模型为dnn模型进行广告创意选题,模型的层数和每一层的节点数根据模型的效果设计。
具体如下详细展开:
算法描述:根据用户的年龄,性别等属性判断自动预测音频平台用户最有可能点击什么选题(类别,场景,关键词实体词)的广告,以达到广告题材选题的目的。
使用的特征:用户的基础属性:用户性别,年龄段,所在省份,婚育情况广告的基础属性:类别,包含的关键词和实体词,广告内容描述的场景
使用的数据源:一、用户画像系统,使用到的字段包括:用户id, 用户性别,用户年龄层,用户省份,用户职业,用户婚姻情况,用户生育情况,用户是否是车主等。
二、广告推荐曝光及用户点击情况打点记录系统,使用到的字段包括:用户id,向该用户投放的广告类型及广告关键词和实体词,用户是否点击了该广告。
1.算法步骤:
1.把从用户画像系统中提取出的性别,年龄层,所在省份,职业,婚姻情况,生育情况,是否有车等字段转化为onehot编码。把转化后的所有字段的onehot编码按照固定顺序拼接。该字段信息无法获取,则该onehot编码为0向量。user_onehot= [x1,x2…,xn],其中n为属性数量,xi为第i个属性的onehot 编码特征向量。
2.把所有用户的user_onehot使用dnn-autodecoder提取深层特征。使用dnn对user_onehot进行编码,dnn的层数和每层的节点数作为超参根据效果调整。
Dnn_encoder:al=sigmoid(wlal-1+bl),u=sigmoid(al)
其中,al为dnn第i层的向量,wl为第i层特征,bl为第i层偏置。
把u输入解码dnn重构特征.Dnn_decoder计算方式与encoder 相同。
使用欧式距离计算user_onehot和重构后特征的距离作为损失函数。使用梯度下降调整模型参数。DAE为最终的用户特征提取算法。把所有用户的user_onehot输入训练后的DAE提取用户特征。
用户特征向量为训练后的DAE抽取的特征向量u。
3.从广告推荐曝光及用户点击情况打点记录系统中,查找所有从广告途径进入平台的用户的数据作为对广告选题生成模型的训练数据。训练数据生成方法:
输入模型的特征向量为2中的u。对应每一个u的标签数据生成方法:
Label=[onehot_category,word_em,onehot_scene]
onehot_category=[x1,x2…,xn]
word_em=[x1,x2…,xn]
onehot_scene=[x1,x2…,xn]
其中,onehot_category为广告类别的onehot编码,n为为广告类别的onehot编码向量长度。广告的类别根据平台设计,可能包括艺术类,音乐类等。Word_em为广告中涉及的关键词和实体词的词向量embedding,m为词向量特征长度,词向量 embedding算法可使用bert或word2vec Onehot_scene为场景onehot编码,k为场景onehot编码的长度。场景类别根据平台设计,可能包括通勤,晨练,哄睡等。
4.广告创意选题使用的模型为dnn模型,模型的层数和每一层的节点数根据模型的效果设计。Dnn模型的前向传播计算与2中相同。Dnn分类模型使用softmax作为输出层。Dnn分类模型输出层公式:
y′=softmax(al)
al为dnn第l层的向量。模型使用的损失函数为交叉熵损失,
模型权重优化方法为反向传播梯度下降。
2.模型使用:
1.获取预投放广告的用户的用户属性,使用1.1和1.2中的方法生成用户特征向量u。
使用1.3中训练的dnn模型生成广告选题特征向量。根据3中的标签特征向量公式,将dnn最终生成的特征向量按顺序拆分为onehot_category,word_em,onehot_scene。
2.对于onehot_category和onehot_scene,解析方法为:
f(x)=onehot(position(max(x))),其中max函数返回x中最大的值,position函数返回此最大值第一次出现的位置。
Onehot函数为生成一个onehot编码向量,函数输入为该向量值为1的位置,该向量其他位置为0。
3.对于word_em,匹配平台关键词与实体词词库中与word_em向量欧式距离最小的n个向量,n的大小可根据需求调整。找出的n个向量对应的词为模型预测的该用户可能点击的广告创意选题应该涵盖的关键词或者实体词。
4.将2.2中解析的onehot_category和onehot_scene的onehot 编码返回对应的类别,该类别为模型预测的广告的类别及场景。
模型迭代优化方法:
1.每月使用全量用户数据重新训练1.1,1.2中的DAE.
2.每月使用广告推荐曝光及用户点击情况打点记录系统的新增数据微调1.4中的dnn神经网络。
3.持续丰富平台关键词实体词库。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (5)
1.一种基于大数据及人工智能的音频平台推广广告题材生成方法,其特征在于,包括算法步骤:
步骤一,把从用户画像系统中提取出的用户特征信息字段转化为onehot编码;
步骤二,把所有用户的user_onehot使用dnn-autodecoder提取深层特征;
步骤三,从广告推荐曝光及用户点击情况打点记录系统中,查找所有从广告途径进入平台的用户的数据作为对广告选题生成模型的训练数据;
步骤四,使用模型为dnn模型进行广告创意选题,模型的层数和每一层的节点数根据模型的效果设计。
2.根据权利要求1所述的一种基于大数据及人工智能的音频平台推广广告题材生成方法,其特征在于,其中步骤一中:把转化后的所有字段的onehot编码按照固定顺序拼接;该字段信息无法获取,该onehot编码为0向量。
3.根据权利要求1所述的一种基于大数据及人工智能的音频平台推广广告题材生成方法,其特征在于,步骤二中:使用dnn对user_onehot进行编码,dnn的层数和每层的节点数作为超参根据效果调整。
4.根据权利要求1所述的一种基于大数据及人工智能的音频平台推广广告题材生成方法,其特征在于:还包括模型使用,获取预投放广告的用户的用户属性,生成用户特征向量u;dnn模型生成广告选题特征向量标签特征向量公式,将dnn最终生成的特征向量按顺序拆分。
5.根据权利要求1所述的一种基于大数据及人工智能的音频平台推广广告题材生成方法,其特征在于:还包括模型迭代优化;每月使用广告推荐曝光及用户点击情况打点记录系统的新增数据微调dnn神经网络;增加平台关键词实体词库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911097203.6A CN111062738A (zh) | 2019-11-11 | 2019-11-11 | 一种基于大数据及人工智能的音频平台推广广告题材生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911097203.6A CN111062738A (zh) | 2019-11-11 | 2019-11-11 | 一种基于大数据及人工智能的音频平台推广广告题材生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111062738A true CN111062738A (zh) | 2020-04-24 |
Family
ID=70297773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911097203.6A Pending CN111062738A (zh) | 2019-11-11 | 2019-11-11 | 一种基于大数据及人工智能的音频平台推广广告题材生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062738A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508612A (zh) * | 2020-12-11 | 2021-03-16 | 北京搜狗科技发展有限公司 | 训练广告创意生成模型、生成广告创意的方法及相关装置 |
CN112767024A (zh) * | 2021-01-15 | 2021-05-07 | 北京搜狗科技发展有限公司 | 一种广告创意生成的方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109447698A (zh) * | 2018-10-18 | 2019-03-08 | 广州云从人工智能技术有限公司 | 一种基于神经网络的推荐算法 |
CN109784973A (zh) * | 2018-12-14 | 2019-05-21 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法、装置及电子设备 |
CN109858625A (zh) * | 2019-02-01 | 2019-06-07 | 北京奇艺世纪科技有限公司 | 模型训练方法与设备、预测方法与设备、数据处理设备、介质 |
-
2019
- 2019-11-11 CN CN201911097203.6A patent/CN111062738A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109447698A (zh) * | 2018-10-18 | 2019-03-08 | 广州云从人工智能技术有限公司 | 一种基于神经网络的推荐算法 |
CN109784973A (zh) * | 2018-12-14 | 2019-05-21 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法、装置及电子设备 |
CN109858625A (zh) * | 2019-02-01 | 2019-06-07 | 北京奇艺世纪科技有限公司 | 模型训练方法与设备、预测方法与设备、数据处理设备、介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508612A (zh) * | 2020-12-11 | 2021-03-16 | 北京搜狗科技发展有限公司 | 训练广告创意生成模型、生成广告创意的方法及相关装置 |
CN112508612B (zh) * | 2020-12-11 | 2024-02-27 | 北京搜狗科技发展有限公司 | 训练广告创意生成模型、生成广告创意的方法及相关装置 |
CN112767024A (zh) * | 2021-01-15 | 2021-05-07 | 北京搜狗科技发展有限公司 | 一种广告创意生成的方法及相关装置 |
CN112767024B (zh) * | 2021-01-15 | 2024-02-20 | 北京搜狗科技发展有限公司 | 一种广告创意生成的方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7142737B2 (ja) | マルチモーダルに基づくテーマ分類方法、装置、機器及び記憶媒体 | |
CN108509465A (zh) | 一种视频数据的推荐方法、装置和服务器 | |
CN111382555B (zh) | 数据处理方法、介质、装置和计算设备 | |
CN112948708B (zh) | 一种短视频推荐方法 | |
CN112597296B (zh) | 一种基于计划机制和知识图谱引导的摘要生成方法 | |
CN109359297A (zh) | 一种关系抽取方法及系统 | |
CN110807324A (zh) | 一种基于IDCNN-crf与知识图谱的影视实体识别方法 | |
CN111950287A (zh) | 一种基于文本的实体识别方法及相关装置 | |
CN111062738A (zh) | 一种基于大数据及人工智能的音频平台推广广告题材生成方法 | |
CN111444367A (zh) | 一种基于全局与局部注意力机制的图像标题生成方法 | |
CN115238710B (zh) | 一种文档智能生成与管理方法及装置 | |
CN111651573A (zh) | 一种智能客服对话回复生成方法、装置和电子设备 | |
CN111723295A (zh) | 一种内容分发方法、装置和存储介质 | |
CN113076483A (zh) | 基于案件要素异构图的舆情新闻抽取式摘要方法 | |
CN112364168A (zh) | 一种基于多属性信息融合的舆情分类方法 | |
CN110110218B (zh) | 一种身份关联方法及终端 | |
CN111563161B (zh) | 一种语句识别方法、语句识别装置及智能设备 | |
CN115563982A (zh) | 广告文本优化方法及其装置、设备、介质、产品 | |
KR20230131787A (ko) | 세그먼트된 동영상의 벡터화를 이용하는 동영상 검색 방법 및 장치 | |
CN115687760A (zh) | 一种基于图神经网络的用户学习兴趣标签预测方法 | |
CN114281982A (zh) | 一种多模态融合技术的图书宣传摘要生成方法和系统 | |
Magdum et al. | Mining online reviews and tweets for predicting sales performance and success of movies | |
CN113742572A (zh) | 一种数据的推荐方法、装置、电子设备及存储介质 | |
CN117033558A (zh) | 一种融合bert-wwm与多特征的影评情感分析方法 | |
US11966440B2 (en) | Metadata tag identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |