CN111292134A - 一种微信公众号是否可投广告的判断方法及装置 - Google Patents
一种微信公众号是否可投广告的判断方法及装置 Download PDFInfo
- Publication number
- CN111292134A CN111292134A CN202010114709.XA CN202010114709A CN111292134A CN 111292134 A CN111292134 A CN 111292134A CN 202010114709 A CN202010114709 A CN 202010114709A CN 111292134 A CN111292134 A CN 111292134A
- Authority
- CN
- China
- Prior art keywords
- wechat public
- public number
- article data
- model
- articles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000013136 deep learning model Methods 0.000 claims abstract description 19
- 238000004140 cleaning Methods 0.000 claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Abstract
本发明适用于微信公众号广告投放领域,提供了一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm‑attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。
Description
技术领域
本发明属于微信公众号广告投放领域,尤其涉及一种微信公众号是否可投广告的判断方法及装置。
背景技术
微信公众平台主要面向名人、政府、媒体、企业等机构推出的合作推广业务。在这里可以通过渠道将品牌推广给线上平台作用。在微信公众号上进行广告推广是一种常见的广告推广方式。
但是企业在进行广告投放时需要考虑微信公众号是否符合投放标准,进而影响投资回报率,投资回报率是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报,因此需要一种能够对微信公众号进行判断是否可以投放的技术。
发明内容
本发明提供一种微信公众号是否可投广告的判断方法及装置,旨在解决现有技术不能对微信公众号进行判断是否可以投放进行准确判断的问题。
本发明是这样实现的,一种微信公众号是否可投广告的判断方法,包括以下步骤:
S1、提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章;
S2、清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding;
S3、训练bilstm-attention深度学习模型;
S4、获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果;
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
优选的,所述清洗文章数据具体为:对文章数据进行分词处理。
优选的,所述训练Word2Vec模型具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
优选的,所述训练bilstm-attention深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练模型以获得模型参数。
优选的,步骤S1中,还包括:构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
本发明还提供一种微信公众号是否可投广告的判断装置,包括:
数据采集模块,其用于人工标注的基于企业广投放业务划分的是否可以投放的文章;
数据处理模块,其用于清洗文章数据;
检测模型,其包括Word2Vec模型和bilstm-attention深度学习模型;Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding;bilstm-attention深度学习模型用于通过embedding进行模型训练,并在训练完成后检测待测微信公众号的文章数据是否可投放广告;
计算模块,其用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
优选的,所述清洗文章数据具体为:对文章数据进行分词处理。
优选的,所述Word2Vec模型对清洗后的文章数据进行处理具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
优选的,所述训练双向bilstm深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数。
优选的,所述数据处理模块还用于构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
优选的,所述抓斗上开设有多个漏液孔。
与现有技术相比,本发明的有益效果是:本发明的一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm-attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。精准判别公众号是否可以投放广告。
附图说明
图1为本发明的一种微信公众号是否可投广告的判断方法的流程示意图。
图2为本发明的一种微信公众号是否可投广告的判断装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明提供一种技术方案:一种微信公众号是否可投广告的判断方法及装置,微信公众号是否可投广告的判断方法包括以下步骤:
S1、在数据库内提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章。构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
S2、清洗文章数据,对文章数据进行分词处理,训练Word2Vec模型,根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量,将文章分词并获取embedding。
S3、训练bilstm-attention深度学习模型,搭建神经网络模型,通过获取的embedding训练模型以获得模型参数,并将模型参数传输到磁盘内进行存储。
S4、通过数据库获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果。
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
请参阅图2,本发明的微信公众号是否可投广告的判断装置包括文章采集模块、数据处理模块、判断模块、计算模块。
文章采集模块用于人工标注的基于企业广投放业务划分的是否可以投放的文章。
数据处理模块用于清洗文章数据,对文章数据进行分词处理,构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
判断模块包括Word2Vec模型和bilstm-attention深度学习模型。Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding,根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。bilstm-attention深度学习模型用于通过embedding进行模型训练,搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数,并在训练完成后检测待测微信公众号的文章数据是否可投放广告。
计算模块用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
本发明的一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm-attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。精准判别公众号是否可以投放广告。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种微信公众号是否可投广告的判断方法,其特征在于:包括以下步骤:
S1、提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章;
S2、清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding;
S3、训练bilstm-attention深度学习模型;
S4、获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果;
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
2.如权利要求1所述的一种微信公众号是否可投广告的判断方法,其特征在于:所述清洗文章数据具体为:对文章数据进行分词处理。
3.如权利要求1所述的一种微信公众号是否可投广告的判断方法,其特征在于:所述训练Word2Vec模型具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
4.如权利要求1所述的一种微信公众号是否可投广告的判断方法及装置,其特征在于:所述训练bilstm-attention深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练模型以获得模型参数。
5.如权利要求1所述的一种微信公众号是否可投广告的判断方法及装置,其特征在于:步骤S1中,还包括:构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
6.一种微信公众号是否可投广告的判断装置,其特征在于:包括:
文章采集模块,其用于人工标注的基于企业广投放业务划分的是否可以投放的文章;
数据处理模块,其用于清洗文章数据;
判断模块,其包括Word2Vec模型和bilstm-attention深度学习模型;Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding;bilstm-attention深度学习模型用于通过embedding进行模型训练,并在训练完成后检测待测微信公众号的文章数据是否可投放广告;
计算模块,其用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
7.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述清洗文章数据具体为:对文章数据进行分词处理。
8.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述Word2Vec模型对清洗后的文章数据进行处理具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
9.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述训练双向bilstm深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数。
10.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述数据处理模块还用于构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010114709.XA CN111292134A (zh) | 2020-02-25 | 2020-02-25 | 一种微信公众号是否可投广告的判断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010114709.XA CN111292134A (zh) | 2020-02-25 | 2020-02-25 | 一种微信公众号是否可投广告的判断方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111292134A true CN111292134A (zh) | 2020-06-16 |
Family
ID=71029239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010114709.XA Pending CN111292134A (zh) | 2020-02-25 | 2020-02-25 | 一种微信公众号是否可投广告的判断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292134A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090138351A1 (en) * | 2007-11-27 | 2009-05-28 | Institute For Information Industry | Advertisement selection systems and methods for internet articles |
CN104732414A (zh) * | 2013-12-24 | 2015-06-24 | 苏州开眼数据技术有限公司 | 微博广告投放方法和装置 |
CN105512916A (zh) * | 2015-12-18 | 2016-04-20 | 北京讯达网脉科技有限公司 | 广告精准投放方法和系统 |
CN107679031A (zh) * | 2017-09-04 | 2018-02-09 | 昆明理工大学 | 基于堆叠降噪自编码机的广告博文识别方法 |
CN107729401A (zh) * | 2017-09-21 | 2018-02-23 | 北京百度网讯科技有限公司 | 基于人工智能的高质量文章挖掘方法、装置及存储介质 |
US20180060913A1 (en) * | 2016-08-29 | 2018-03-01 | Nec Personal Computers, Ltd. | Information processing apparatus, information processing method, and program |
CN108259949A (zh) * | 2018-02-11 | 2018-07-06 | 北京未来媒体科技股份有限公司 | 一种广告推荐方法、装置及电子设备 |
CN109492157A (zh) * | 2018-10-24 | 2019-03-19 | 华侨大学 | 基于rnn、注意力机制的新闻推荐方法及主题表征方法 |
CN109783637A (zh) * | 2018-12-12 | 2019-05-21 | 国网浙江省电力有限公司杭州供电公司 | 基于深度神经网络的电力检修文本挖掘方法 |
CN110325986A (zh) * | 2017-12-15 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 文章处理方法、装置、服务器及存储介质 |
CN110597987A (zh) * | 2019-08-21 | 2019-12-20 | 微梦创科网络科技(中国)有限公司 | 一种搜索推荐方法及装置 |
-
2020
- 2020-02-25 CN CN202010114709.XA patent/CN111292134A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090138351A1 (en) * | 2007-11-27 | 2009-05-28 | Institute For Information Industry | Advertisement selection systems and methods for internet articles |
CN104732414A (zh) * | 2013-12-24 | 2015-06-24 | 苏州开眼数据技术有限公司 | 微博广告投放方法和装置 |
CN105512916A (zh) * | 2015-12-18 | 2016-04-20 | 北京讯达网脉科技有限公司 | 广告精准投放方法和系统 |
US20180060913A1 (en) * | 2016-08-29 | 2018-03-01 | Nec Personal Computers, Ltd. | Information processing apparatus, information processing method, and program |
CN107679031A (zh) * | 2017-09-04 | 2018-02-09 | 昆明理工大学 | 基于堆叠降噪自编码机的广告博文识别方法 |
CN107729401A (zh) * | 2017-09-21 | 2018-02-23 | 北京百度网讯科技有限公司 | 基于人工智能的高质量文章挖掘方法、装置及存储介质 |
CN110325986A (zh) * | 2017-12-15 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 文章处理方法、装置、服务器及存储介质 |
CN108259949A (zh) * | 2018-02-11 | 2018-07-06 | 北京未来媒体科技股份有限公司 | 一种广告推荐方法、装置及电子设备 |
CN109492157A (zh) * | 2018-10-24 | 2019-03-19 | 华侨大学 | 基于rnn、注意力机制的新闻推荐方法及主题表征方法 |
CN109783637A (zh) * | 2018-12-12 | 2019-05-21 | 国网浙江省电力有限公司杭州供电公司 | 基于深度神经网络的电力检修文本挖掘方法 |
CN110597987A (zh) * | 2019-08-21 | 2019-12-20 | 微梦创科网络科技(中国)有限公司 | 一种搜索推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
刘雨心;王莉;张昊;: "基于分层注意力机制的神经网络垃圾评论检测模型" * |
林杰;苗润生;: "专业社交媒体中的主题图谱构建方法研究――以汽车论坛为例" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107515873B (zh) | 一种垃圾信息识别方法及设备 | |
CN106328166B (zh) | 人机对话异常检测系统及方法 | |
CN109325116B (zh) | 一种基于深度学习的城市事件自动分类派发方法及装置 | |
CN110910901A (zh) | 一种情绪识别方法及装置、电子设备和可读存储介质 | |
CN108595706A (zh) | 一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置 | |
CN105335496A (zh) | 基于余弦相似度文本挖掘算法的客服重复来电处理方法 | |
CN110955690A (zh) | 一种基于大数据技术的自助数据标签平台及自助数据标签方法 | |
CN107943973A (zh) | 一种大数据智能清洗系统及云机器人智能清洗服务平台 | |
CN107291775A (zh) | 错误样本的修复语料生成方法和装置 | |
CN111190988A (zh) | 地址解析方法、装置、设备及计算机可读存储介质 | |
CN107766560A (zh) | 客服服务流程的评价方法和系统 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN113297365A (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN111292134A (zh) | 一种微信公众号是否可投广告的判断方法及装置 | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN113033909A (zh) | 携转用户分析方法、装置、设备及计算机存储介质 | |
CN105183806A (zh) | 一种不同平台间识别同一用户的方法与系统 | |
CN111199426B (zh) | 一种基于随机森林模型的微信公众号roi预估方法及装置 | |
CN113808574A (zh) | 基于语音信息的ai语音质检方法、装置、设备和存储介质 | |
CN115471148A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111178068B (zh) | 一种基于对话情绪检测的催收暴力倾向评价方法和装置 | |
CN111339251A (zh) | 一种微信公众号是否有敏感词汇的检测方法及装置 | |
CN114860788A (zh) | 一种技术推广信息服务系统及方法 | |
CN110362680B (zh) | 一种基于图网络结构分析的软广检测和广告抽取方法 | |
CN113808616A (zh) | 语音合规检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200616 |