CN111292134A - 一种微信公众号是否可投广告的判断方法及装置 - Google Patents

一种微信公众号是否可投广告的判断方法及装置 Download PDF

Info

Publication number
CN111292134A
CN111292134A CN202010114709.XA CN202010114709A CN111292134A CN 111292134 A CN111292134 A CN 111292134A CN 202010114709 A CN202010114709 A CN 202010114709A CN 111292134 A CN111292134 A CN 111292134A
Authority
CN
China
Prior art keywords
wechat public
public number
article data
model
articles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010114709.XA
Other languages
English (en)
Inventor
田东坡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Changtou Network Technology Co Ltd
Original Assignee
Shanghai Changtou Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Changtou Network Technology Co Ltd filed Critical Shanghai Changtou Network Technology Co Ltd
Priority to CN202010114709.XA priority Critical patent/CN111292134A/zh
Publication of CN111292134A publication Critical patent/CN111292134A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Abstract

本发明适用于微信公众号广告投放领域,提供了一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm‑attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。

Description

一种微信公众号是否可投广告的判断方法及装置
技术领域
本发明属于微信公众号广告投放领域,尤其涉及一种微信公众号是否可投广告的判断方法及装置。
背景技术
微信公众平台主要面向名人、政府、媒体、企业等机构推出的合作推广业务。在这里可以通过渠道将品牌推广给线上平台作用。在微信公众号上进行广告推广是一种常见的广告推广方式。
但是企业在进行广告投放时需要考虑微信公众号是否符合投放标准,进而影响投资回报率,投资回报率是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报,因此需要一种能够对微信公众号进行判断是否可以投放的技术。
发明内容
本发明提供一种微信公众号是否可投广告的判断方法及装置,旨在解决现有技术不能对微信公众号进行判断是否可以投放进行准确判断的问题。
本发明是这样实现的,一种微信公众号是否可投广告的判断方法,包括以下步骤:
S1、提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章;
S2、清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding;
S3、训练bilstm-attention深度学习模型;
S4、获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果;
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
优选的,所述清洗文章数据具体为:对文章数据进行分词处理。
优选的,所述训练Word2Vec模型具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
优选的,所述训练bilstm-attention深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练模型以获得模型参数。
优选的,步骤S1中,还包括:构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
本发明还提供一种微信公众号是否可投广告的判断装置,包括:
数据采集模块,其用于人工标注的基于企业广投放业务划分的是否可以投放的文章;
数据处理模块,其用于清洗文章数据;
检测模型,其包括Word2Vec模型和bilstm-attention深度学习模型;Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding;bilstm-attention深度学习模型用于通过embedding进行模型训练,并在训练完成后检测待测微信公众号的文章数据是否可投放广告;
计算模块,其用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
优选的,所述清洗文章数据具体为:对文章数据进行分词处理。
优选的,所述Word2Vec模型对清洗后的文章数据进行处理具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
优选的,所述训练双向bilstm深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数。
优选的,所述数据处理模块还用于构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
优选的,所述抓斗上开设有多个漏液孔。
与现有技术相比,本发明的有益效果是:本发明的一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm-attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。精准判别公众号是否可以投放广告。
附图说明
图1为本发明的一种微信公众号是否可投广告的判断方法的流程示意图。
图2为本发明的一种微信公众号是否可投广告的判断装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明提供一种技术方案:一种微信公众号是否可投广告的判断方法及装置,微信公众号是否可投广告的判断方法包括以下步骤:
S1、在数据库内提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章。构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
S2、清洗文章数据,对文章数据进行分词处理,训练Word2Vec模型,根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量,将文章分词并获取embedding。
S3、训练bilstm-attention深度学习模型,搭建神经网络模型,通过获取的embedding训练模型以获得模型参数,并将模型参数传输到磁盘内进行存储。
S4、通过数据库获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果。
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
请参阅图2,本发明的微信公众号是否可投广告的判断装置包括文章采集模块、数据处理模块、判断模块、计算模块。
文章采集模块用于人工标注的基于企业广投放业务划分的是否可以投放的文章。
数据处理模块用于清洗文章数据,对文章数据进行分词处理,构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
判断模块包括Word2Vec模型和bilstm-attention深度学习模型。Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding,根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。bilstm-attention深度学习模型用于通过embedding进行模型训练,搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数,并在训练完成后检测待测微信公众号的文章数据是否可投放广告。
计算模块用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
本发明的一种微信公众号是否可投广告的判断方法及装置,通过提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章,清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding,训练bilstm-attention深度学习模型,获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果,最后根据待预测的微信公众号的历史文章数据中可投放广告的文章数量比例计算历史文章的可投放广告的比例,从而判断公众号是否可投放广告,本发明通过判断微信公众号是否符合投放标准,为广告投放提供数据上的参考。精准判别公众号是否可以投放广告。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种微信公众号是否可投广告的判断方法,其特征在于:包括以下步骤:
S1、提取微信公号的10篇历史文章数据,人工标注的基于企业广投放业务划分的是否可以投放的文章;
S2、清洗文章数据,训练Word2Vec模型,将文章分词并获取embedding;
S3、训练bilstm-attention深度学习模型;
S4、获取待预测的微信公众号的10篇历史文章数据,清洗数据,获取embedding,使用训练好的模型进行预测,输出是否可以投放广告的预测结果;
S5、根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
2.如权利要求1所述的一种微信公众号是否可投广告的判断方法,其特征在于:所述清洗文章数据具体为:对文章数据进行分词处理。
3.如权利要求1所述的一种微信公众号是否可投广告的判断方法,其特征在于:所述训练Word2Vec模型具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
4.如权利要求1所述的一种微信公众号是否可投广告的判断方法及装置,其特征在于:所述训练bilstm-attention深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练模型以获得模型参数。
5.如权利要求1所述的一种微信公众号是否可投广告的判断方法及装置,其特征在于:步骤S1中,还包括:构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
6.一种微信公众号是否可投广告的判断装置,其特征在于:包括:
文章采集模块,其用于人工标注的基于企业广投放业务划分的是否可以投放的文章;
数据处理模块,其用于清洗文章数据;
判断模块,其包括Word2Vec模型和bilstm-attention深度学习模型;Word2Vec模型用于对清洗后的文章数据进行处理以获取embedding;bilstm-attention深度学习模型用于通过embedding进行模型训练,并在训练完成后检测待测微信公众号的文章数据是否可投放广告;
计算模块,其用于根据待预测的微信公众号的历史文章数据中可投放广告的文章数量,计算出可投放广告的文章数量占全部文章的比例是否大于预设比例,是则判定被测微信公众号可投放广告,否则判定被测微信公众号不可投放广告。
7.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述清洗文章数据具体为:对文章数据进行分词处理。
8.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述Word2Vec模型对清洗后的文章数据进行处理具体为:根据Word2Vec算法对所述的分词处理结果进行向量转换,得到分词结果向量。
9.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述训练双向bilstm深度学习模型结构具体为:搭建神经网络模型,通过获取的embedding训练bilstm深度学习模型以获得模型参数。
10.如权利要求6所述的一种微信公众号是否可投广告的判断装置,其特征在于:所述数据处理模块还用于构建预设关键词语料库,构建包括预设关键词的科技词典,将其作为分词的优选项加到分词词典中。
CN202010114709.XA 2020-02-25 2020-02-25 一种微信公众号是否可投广告的判断方法及装置 Pending CN111292134A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010114709.XA CN111292134A (zh) 2020-02-25 2020-02-25 一种微信公众号是否可投广告的判断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010114709.XA CN111292134A (zh) 2020-02-25 2020-02-25 一种微信公众号是否可投广告的判断方法及装置

Publications (1)

Publication Number Publication Date
CN111292134A true CN111292134A (zh) 2020-06-16

Family

ID=71029239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010114709.XA Pending CN111292134A (zh) 2020-02-25 2020-02-25 一种微信公众号是否可投广告的判断方法及装置

Country Status (1)

Country Link
CN (1) CN111292134A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090138351A1 (en) * 2007-11-27 2009-05-28 Institute For Information Industry Advertisement selection systems and methods for internet articles
CN104732414A (zh) * 2013-12-24 2015-06-24 苏州开眼数据技术有限公司 微博广告投放方法和装置
CN105512916A (zh) * 2015-12-18 2016-04-20 北京讯达网脉科技有限公司 广告精准投放方法和系统
CN107679031A (zh) * 2017-09-04 2018-02-09 昆明理工大学 基于堆叠降噪自编码机的广告博文识别方法
CN107729401A (zh) * 2017-09-21 2018-02-23 北京百度网讯科技有限公司 基于人工智能的高质量文章挖掘方法、装置及存储介质
US20180060913A1 (en) * 2016-08-29 2018-03-01 Nec Personal Computers, Ltd. Information processing apparatus, information processing method, and program
CN108259949A (zh) * 2018-02-11 2018-07-06 北京未来媒体科技股份有限公司 一种广告推荐方法、装置及电子设备
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109783637A (zh) * 2018-12-12 2019-05-21 国网浙江省电力有限公司杭州供电公司 基于深度神经网络的电力检修文本挖掘方法
CN110325986A (zh) * 2017-12-15 2019-10-11 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN110597987A (zh) * 2019-08-21 2019-12-20 微梦创科网络科技(中国)有限公司 一种搜索推荐方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090138351A1 (en) * 2007-11-27 2009-05-28 Institute For Information Industry Advertisement selection systems and methods for internet articles
CN104732414A (zh) * 2013-12-24 2015-06-24 苏州开眼数据技术有限公司 微博广告投放方法和装置
CN105512916A (zh) * 2015-12-18 2016-04-20 北京讯达网脉科技有限公司 广告精准投放方法和系统
US20180060913A1 (en) * 2016-08-29 2018-03-01 Nec Personal Computers, Ltd. Information processing apparatus, information processing method, and program
CN107679031A (zh) * 2017-09-04 2018-02-09 昆明理工大学 基于堆叠降噪自编码机的广告博文识别方法
CN107729401A (zh) * 2017-09-21 2018-02-23 北京百度网讯科技有限公司 基于人工智能的高质量文章挖掘方法、装置及存储介质
CN110325986A (zh) * 2017-12-15 2019-10-11 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN108259949A (zh) * 2018-02-11 2018-07-06 北京未来媒体科技股份有限公司 一种广告推荐方法、装置及电子设备
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109783637A (zh) * 2018-12-12 2019-05-21 国网浙江省电力有限公司杭州供电公司 基于深度神经网络的电力检修文本挖掘方法
CN110597987A (zh) * 2019-08-21 2019-12-20 微梦创科网络科技(中国)有限公司 一种搜索推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘雨心;王莉;张昊;: "基于分层注意力机制的神经网络垃圾评论检测模型" *
林杰;苗润生;: "专业社交媒体中的主题图谱构建方法研究――以汽车论坛为例" *

Similar Documents

Publication Publication Date Title
CN107515873B (zh) 一种垃圾信息识别方法及设备
CN106328166B (zh) 人机对话异常检测系统及方法
CN109325116B (zh) 一种基于深度学习的城市事件自动分类派发方法及装置
CN110910901A (zh) 一种情绪识别方法及装置、电子设备和可读存储介质
CN108595706A (zh) 一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置
CN105335496A (zh) 基于余弦相似度文本挖掘算法的客服重复来电处理方法
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN107943973A (zh) 一种大数据智能清洗系统及云机器人智能清洗服务平台
CN107291775A (zh) 错误样本的修复语料生成方法和装置
CN111190988A (zh) 地址解析方法、装置、设备及计算机可读存储介质
CN107766560A (zh) 客服服务流程的评价方法和系统
CN110750626B (zh) 一种基于场景的任务驱动的多轮对话方法及系统
CN113297365A (zh) 一种用户意向判定方法、装置、设备及存储介质
CN111292134A (zh) 一种微信公众号是否可投广告的判断方法及装置
CN110362828B (zh) 网络资讯风险识别方法及系统
CN113033909A (zh) 携转用户分析方法、装置、设备及计算机存储介质
CN105183806A (zh) 一种不同平台间识别同一用户的方法与系统
CN111199426B (zh) 一种基于随机森林模型的微信公众号roi预估方法及装置
CN113808574A (zh) 基于语音信息的ai语音质检方法、装置、设备和存储介质
CN115471148A (zh) 数据处理方法、装置、设备及存储介质
CN111178068B (zh) 一种基于对话情绪检测的催收暴力倾向评价方法和装置
CN111339251A (zh) 一种微信公众号是否有敏感词汇的检测方法及装置
CN114860788A (zh) 一种技术推广信息服务系统及方法
CN110362680B (zh) 一种基于图网络结构分析的软广检测和广告抽取方法
CN113808616A (zh) 语音合规检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200616