CN109615429A - 一种基于发票数据的精准广告投放系统及方法 - Google Patents
一种基于发票数据的精准广告投放系统及方法 Download PDFInfo
- Publication number
- CN109615429A CN109615429A CN201811509168.XA CN201811509168A CN109615429A CN 109615429 A CN109615429 A CN 109615429A CN 201811509168 A CN201811509168 A CN 201811509168A CN 109615429 A CN109615429 A CN 109615429A
- Authority
- CN
- China
- Prior art keywords
- user
- advertisement
- invoice data
- invoice
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0254—Targeted advertisements based on statistics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及了一种基于发票数据的精准广告投放系统和方法,该系统包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,发票数据采集存储模块采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器;用户画像分析模块下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;广告精准投放模块根据用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的点对点自动精准广告投放,大大增强了广告的切合度和转化效果。
Description
技术领域
本发明涉及大数据分析应用技术领域,具体涉及一种基于发票数据的精准广告投放系统及方法。
背景技术
随着社会科技进步,传统的广告介质如报纸、杂志、电台等对客户群体的影响力越发微弱,随之而来的是越来越广泛地利用广大的数字化设备比如手机、电子广告牌、楼宇自媒体屏幕等进行广告投放和宣传。
但是即便利用了数字化设备,目前大部分广告在进行投放时仍然存在诸多缺陷,比如在视频播放过程中插入广告、在楼宇自媒体屏幕播放广告,均是面对全部受众、全部用户群体进行投放,并非针对性地筛选特定目标用户群体,如此大量的、无目标的投放,使得广告与用户的匹配度非常低,广告的转化效果也很差。
发明内容
本发明针对现有广告投放方式下广告与受众的匹配度非常低、广告的转化效果也很差等缺陷提供了一种基于发票数据的精准广告投放系统,该系统充分地利用了电子发票的历史数据,在得到有效发票信息的基础上基于大数据分析技术采用KNN分类算法进行训练分析学习进而建立用户画像,然后根据用户画像筛选目标用户群体后通过接入的多种广告投放方式批量对目标用户群体进行精准广告投放,能够有效提升广告与用户的匹配度,提高广告的切合度和转化效果。本发明还提供了一种基于发票数据的精准广告投放方法。
本发明的技术方案如下:
一种基于发票数据的精准广告投放系统,包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,所述发票数据采集存储模块采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到所述云端服务器;所述用户画像分析模块从所述云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;所述广告精准投放模块根据所述用户画像分析模块输出的用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放。
优选地,所述用户画像分析模块基于大数据分析技术采用KNN分类算法并结合贪心算法进行训练分析学习。
优选地,所述发票数据采集存储模块包括依次连接的发票数据采集单元、发票数据索引建立单元和发票数据分布式存储单元,所述发票数据采集单元采集用户开具的电子发票或纸质发票的数据信息,所述发票数据索引建立单元对发票的数据信息建立索引后根据索引对应缓存入所述分布式存储单元,所述分布式存储单元将缓存的发票数据信息批量上传到云端服务器。
优选地,所述用户画像分析模块包括依次连接的发票数据下载单元、机器学习训练单元、用户关联单元、用户画像建立单元和用户画像输出单元,所述发票数据下载单元从所述云端服务器下载发票数据后传送至机器学习训练单元;所述机器学习训练单元基于大数据分析技术采用KNN分类算法进行训练分析学习;所述用户关联单元将训练分析学习后的发票数据信息进行用户关联以建立唯一用户;再由用户画像建立单元从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签、用户属性和用户行为后,构建用户画像;所述用户画像输出单元将建立好的用户画像输出。
优选地,所述用户画像分析模块还包括样本处理单元,所述样本处理单元设置于机器学习训练单元和用户关联单元之间,用于将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,所述用户关联单元将裁剪处理后的发票数据信息进行用户关联以建立唯一用户。
优选地,所述广告精准投放模块包括依次连接的目标用户群体筛选单元、广告模板建立单元和广告批量投放单元,所述目标用户群体筛选单元与用户画像分析模块中的所述用户画像输出单元相连接用于接收所述用户画像输出单元输出的用户画像后根据分类标签筛选出目标用户群体,所述广告模板建立单元针对所述目标用户群体建立相匹配的广告模板,所述广告批量投放单元将建立好的广告模板支持若干广告投放方式批量进行针对目标用户群体的广告的点对点投放。
优选地,所述发票数据采集单元采集的发票数据信息为结构化数据信息,包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱;
和/或,所述广告精准投放模块中建立的广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的所支持的若干广告投放方式包括但不限于短信、邮件、智能电子屏、手机APP、电子广告牌。
一种基于发票数据的精准广告投放方法,包括下述步骤:
发票数据采集存储步骤,采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器;
用户画像分析步骤,从云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户后再从若干维度分析发票数据信息来构建用户画像;
广告精准投放步骤,根据所述用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放。
优选地,在所述用户画像分析步骤中,基于大数据分析技术采用KNN分类算法进行训练分析学习时还结合采用贪心算法。
优选地,在所述用户画像分析步骤中,在训练分析学习后先将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,再将裁剪处理后的发票数据信息进行用户关联以建立唯一用户,并从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签、用户属性和用户行为后,构建用户画像;
和/或,所述发票数据采集存储步骤采集的发票数据信息为结构化数据信息,包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱;
和/或,所述广告精准投放步骤建立的广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的所支持的若干广告投放方式包括但不限于短信、邮件、智能电子屏、手机APP、电子广告牌。
本发明的技术效果如下:
本发明涉及了一种基于发票数据的精准广告投放系统,包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,发票数据采集存储模块采集尽可能多的海量的由用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器,通过分布式存储能够保障存储的稳定性,这些海量的发票数据信息为后续模块提供发票基础数据支撑,批量上传到云端服务器保证数据安全可靠以及数据及时共享,并使得系统工作更加简单高效;用户画像分析模块从云端服务器下载发票数据后基于大数据分析技术采用KNN分类算法进行训练分析学习,KNN分类算法(K-Nearest Neighbor,以K最近邻分类算法)对海量发票数据信息存储的结构化数据进行训练分析学习,利用KNN对异常值不敏感的特性,特别适用于面对海量发票数据信息存在多分类问题(multi-modal,对象具有多个类别标签)时的处理,将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;广告精准投放模块根据所述用户画像分析模块输出的用户画像筛选出目标用户群体后建立相匹配的广告模板并接入多种广告投放方式批量进行针对目标用户群体的精准广告投放,该系统充分有效地利用了用户的历史发票数据,支持海量数据以及数据稳定输出,提升系统的稳定性、可靠性,并创新性的引入大数据分析技术采用KNN分类算法进行训练分析学习,并在建立唯一用户后从不同维度分析发票数据后建立全面的用户画像,使得根据用户画像筛选出来的目标用户群体非常精准,实现广告的点对点自动精准投放,从而根据此做出的批量的精准广告投放更为有效,增强了用户体验感,提高了广告与用户的匹配度,更大大增强了广告的转化效果,实用性极强。
优选地,所述用户画像分析模块基于大数据分析技术采用KNN分类算法并结合贪心算法进行训练分析学习,即以KNN分类算法为主,以贪心算法为辅助,使得海量的发票数据信息根据某个优化测度获得局部最优选择,且无需回溯,增强分析的可靠效果,进一步提高了后续的数据计算处理的准确性。
优选地,本发明所述系统中的发票数据采集存储模块、用户画像分析模块和广告精准投放模块中均进一步包括特定单元组件,各单元组件协同工作,使得系统得到优化,进一步提高了系统的工作效率,达到广告自动投放、高匹配度、高转化率的效果。例如,发票数据采集存储模块中的发票数据索引建立单元对发票的数据信息建立索引后根据索引对应缓存入所述分布式存储单元;用户画像分析模块中的机器学习训练单元基于大数据分析技术采用KNN分类算法进行训练分析学习;用户画像分析模块中的用户画像建立单元从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签(比如是购买意向标签、消费品类别标签等)、用户属性(比如是用户年龄段、用户性别、用户所属地域、用户工作行业、用户身体情况、用户家庭情况等)和用户行为(比如是用户消费习惯、用户兴趣习惯等),构建用户画像,根据不同的用户标签、用户属性和用户行为能够判断出用户的消费倾向,进而能够精确确定该用户属于哪类广告的目标用户群体,用户标签可以理解为对发票数据的多种维度分析产生的各种用户分类标签,能够为用户画像建立和目标用户群体筛选提供精准的参考依据,便于建立出全面的用户画像和确定高匹配度的目标用户群体。
本发明还涉及了一种基于发票数据的精准广告投放方法,该方法与上述基于发票数据的精准广告投放系统相对应,可理解为是上述基于发票数据的精准广告投放系统的实现方法,该方法包括发票数据采集存储步骤、用户画像分析步骤和广告精准投放步骤,首先采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器,从云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户后再从若干维度分析发票数据信息来构建用户画像,最后根据用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放,将基于大数据分析技术采用KNN分类算法实现对海量的发票数据信息进行训练分析学习的过程应用于广告投放的参考依据,并充分地利用训练分析学习后的发票数据信息进行用户关联建立唯一用户后再构建用户画像,最终根据用户画像精准地筛选目标用户群体,从而有针对性的、具体的、精确的、实现广告点对点自动精准投放,增强了用户体验感,提高了广告营销的效果。
附图说明
图1:为本发明一种基于发票数据的精准广告投放系统的整体结构示意图。
图2:为本发明一种基于发票数据的精准广告投放系统的第一种优选结构示意图。
图3:为本发明一种基于发票数据的精准广告投放系统的第二种优选结构示意图。
图4:为本发明一种基于发票数据的精准广告投放方法的流程示意图。
具体实施方式
本发明涉及了一种基于发票数据的精准广告投放系统,包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,所述发票数据采集存储模块采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到所述云端服务器;所述用户画像分析模块从所述云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;所述广告精准投放模块根据所述用户画像分析模块输出的用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放,该系统创新性的引入大数据分析技术采用KNN分类算法进行训练分析学习,并在建立唯一用户后从不同维度分析发票数据后建立全面的用户画像,使得根据用户画像筛选出来的目标用户群体非常精准,实现广告的点对点自动精准投放,从而根据此做出的批量的精准广告投放更为有效,大大增强了广告的切合度和转化效果。本发明还涉及了一种基于发票数据的精准广告投放方法。
下面结合附图进一步对本发明进行详细说明。
图1是本发明一种基于发票数据的精准广告投放系统的整体结构示意图,如图所示,该系统包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,其中发票数据采集存储模块用于采集尽可能多的海量的由用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到所述云端服务器,通过分布式存储能够保障存储的稳定性,这些海量的发票数据信息为后续模块提供发票基础数据支撑,批量上传到云端服务器保证数据安全可靠以及数据及时共享,并使得系统工作更加简单高效;用户画像分析模块用于从云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法(K-Nearest Neighbor,以K最近邻分类算法)进行训练分析学习,利用KNN对异常值不敏感的特性,特别适用于面对海量发票数据信息存在多分类问题(multi-modal,对象具有多个类别标签)时的处理,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;而广告精准投放模块则用于根据用户画像分析模块输出的用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式(也即接入多种广告投放方式)批量进行针对目标用户群体的精准的广告投放,该系统充分有效地利用了用户的历史发票数据,并对发票数据信息进行集成的分布式存储,支持海量数据以及数据稳定输出,提升系统的稳定性、可靠性,并创新性的引入大数据分析技术采用KNN分类算法进行训练分析学习,并在建立唯一用户后从不同维度分析发票数据后建立全面的用户画像,使得根据用户画像筛选出来的目标用户群体非常精准,实现广告的点对点自动精准投放,从而根据此做出的批量的精准广告投放更为有效,增强了用户体验感,提高了广告与用户的匹配度,更大大增强了广告的切合度和转化效果,实用性极强。
优选地,所述用户画像分析模块基于大数据分析技术采用KNN分类算法并结合贪心算法进行训练分析学习,即以KNN分类算法为主,以贪心算法为辅助,使得海量的发票数据信息根据某个优化测度获得局部最优选择,且无需回溯,增强分析的可靠效果,进一步提高了后续的数据计算处理的准确性。
图2是本发明一种基于发票数据的精准广告投放系统的第一种优选结构示意图,如图所示,本发明所述系统中的发票数据采集存储模块、用户画像分析模块和广告精准投放模块中均进一步优选包括多个特定单元组件,具体地,发票数据采集存储模块包括依次连接的发票数据采集单元、发票数据索引建立单元和发票数据分布式存储单元,发票数据采集单元采集用户开具的电子发票或纸质发票的数据信息,发票数据信息优选具体包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱等等的结构化信息,发票数据索引建立单元对发票的数据信息建立索引后根据索引对应缓存入分布式存储单元,分布式存储单元将缓存的发票数据信息批量上传到云端服务器;也就是说,为保证数据的全面,发票数据采集存储模块将用户开具的纸质发票以及电子发票,尽可能的采集,并提取发票的结构化信息数据,进行存储;为保证存储的稳定性,存储在分布式单元中,为后续用户分析提供发票基础数据支撑。用户画像分析模块包括依次连接的发票数据下载单元、机器学习训练单元、用户关联单元、用户画像建立单元和用户画像输出单元,发票数据下载单元从云端服务器下载发票数据后传送至机器学习训练单元,机器学习训练单元基于大数据分析技术采用KNN分类算法进行训练分析学习,用户关联单元将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,比如依据开票的手机号、邮箱等数据信息进行用户关联确定与手机号、邮箱对应的唯一用户,再由用户画像建立单元从若干维度分析发票数据信息提取与唯一用户相匹配的用户标签(比如是购买意向标签、消费品类别标签等)、用户属性(比如是用户年龄段、用户性别、用户所属地域、用户工作行业、用户身体情况、用户家庭情况等)和用户行为(比如是用户消费习惯、用户兴趣习惯等)后构建用户画像从而为广告精准投放实现数据支撑,比如,将开票手机号相同的发票统一归于该手机号关联确定的唯一用户的账户中,然后依据该批发票常用的开票省份分析得出该用户所属省份地区,或者根据发票的商品明细分析是否包括大量某同类产品(如婴幼儿用品)、开票的时间分析得出该用户或者其家庭成员如子女等的年龄或身体情况等等,分析得出的结果均作为用户标签或用户属性或用户行为等构建用户画像的基础,依此构建全面的用户画像,用户画像输出单元将建立好的用户画像输出;广告精准投放模块包括依次连接的目标用户群体筛选单元、广告模板建立单元和广告批量投放单元,目标用户群体筛选单元与用户画像分析模块中的用户画像输出单元相连接用于接收所述用户画像输出单元输出的用户画像后根据分类标签筛选出目标用户群体,广告模板建立单元针对目标用户群体建立相匹配的广告模板,广告批量投放单元将建立好的广告模板支持若干广告投放方式批量进行针对目标用户群体的广告的点对点投放,且其中用户画像建立单元从若干维度分析发票数据信息然后提取与唯一用户相匹配的用户标签、用户属性和用户行为进而构建出全面的用户画像,其使得广告主能够根据不同的用户标签、用户属性和用户行为能够判断出用户的消费倾向,也即通过用户的历史发票数据分析出用户再衣食住行等各方面的消费习惯,进而能够精确确定该用户属于哪类广告的目标用户群体,同时用户标签可以理解为对发票数据的多种维度分析产生的各种用户分类标签,能够为用户画像建立和目标用户群体筛选提供精准的参考依据,便于建立出全面的用户画像和确定高匹配度的目标用户群体,具体地,根据用户画像筛选出目标用户群体后再依据要使用的广告投放方式建立与目标用户群体相匹配的广告模板,广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的本方法所支持的若干广告投放方式可以是支持或接入现有主流的各种途径的广告投放/推送方式,比如接入流量主或个性化广告需求、短信广告营销方式、邮件广告营销方式以及借助于多功能智能设备的电子广告营销方式如智能电子屏、手机app、电子广告牌等,例如,当接收到某企业的广告投放需求:需要对北京地区、对育儿产品有购买意向的目标用户群体进行广告投放,此时可以通过本方法从对海量历史发票数据信息分析建立的用户画像中筛选,寻找出符合“育儿产品类”用户标签且同时符合“北京地区”用户属性的目标用户群体,对该目标用户群体进行批量短信、批量邮件批量或者语音电话的方式,或者通过电影院、航空飞机、手机app等等渠道,对每个用户进行投放个性化电子广告,以实施精准的点对点广告投放,当然本系统也可以直接交由企业自行使用,企业在选择自己的目标用户群体自行建立短信、电话等模板然后利用本系统自动给目标用户群体发送广告实现精准投放,本系统中各单元组件协同工作,使得系统得到优化,进一步提高了系统的工作效率,达到广告自动投放、高匹配度、高转化率的效果。
图3是本发明一种基于发票数据的精准广告投放系统的第二种优选结构示意图,与图2实施例不同之处在于,本实施例所示的系统中用户画像分析模块还包括了样本处理单元且样本处理单元设置于机器学习训练单元和用户关联单元之间(直接连接于二者之间),用于将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,此时用户关联单元是利用裁剪处理后的发票数据信息进行用户关联以建立唯一用户,进而再由用户画像建立单元从若干维度分析发票数据信息提取与唯一用户相匹配的用户标签、用户属性和用户行为后构建用户画像,再用户画像输出单元将建立好的用户画像输出,经过样本集裁剪处理,能够保证数据分析的效率,更加快速准确。
本发明还涉及了一种基于发票数据的精准广告投放方法,该方法与上述基于发票数据的精准广告投放系统相对应,可理解为是上述基于发票数据的精准广告投放系统的实现方法,该方法包括发票数据采集存储步骤、用户画像分析步骤和广告精准投放步骤,如图4所示流程,首先是发票数据采集存储步骤,采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器;用户画像分析步骤,从云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户后再从若干维度分析发票数据信息来构建用户画像;最后由广告精准投放步骤根据用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放。本发明将基于大数据分析技术采用KNN分类算法实现对海量的发票数据信息进行训练分析学习的过程应用于广告投放的参考依据,并充分地利用训练分析学习后的发票数据信息进行用户关联建立唯一用户后再构建用户画像,最终根据用户画像精准地筛选目标用户群体,从而有针对性的、具体的、精确的、实现广告点对点自动精准投放,增强了用户体验感,提高了广告的切合度和转化效果。
优选地,在用户画像分析步骤中,基于大数据分析技术采用KNN分类算法对发票数据信息进行训练分析学习时还结合采用贪心算法,即以KNN分类算法为主,以贪心算法为辅助,使得海量的发票数据信息根据某个优化测度获得局部最优选择,且无需回溯,增强分析的可靠效果,进一步提高了后续的数据计算处理的准确性。
进一步优选地,在所述用户画像分析步骤中,在训练分析学习后先将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,再将裁剪处理后的发票数据信息进行用户关联以建立唯一用户,并从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签、用户属性和用户行为后,构建用户画像。本发明的精准广告投放方法通过用户发票数据收集并进行分析,产生用户标签、属性、行为模式等构建用户画像,基于上述分析结果实现广告精准投放,从而提高广告的切合度以及转化效果。
优选地,本方法的发票数据采集存储步骤中采集的发票数据信息为结构化数据信息,包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱,采集多种多样的结构化数据信息并尽可能多的、海量的进行采集,由此能够充分作为后续数据分析处理的数据基础,使得分析结果更为可靠和可用,本发明所述方法基于发票实现的精准广告投放,可通过用户的历史发票数据,分析出用户在衣食住行等各个方面的消费习惯,并更有效的构建出全面的用户画像,从而提升广告投放的匹配度以及转化效率;和/或,本方法的广告精准投放步骤中建立的广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的所支持的若干广告投放方式包括但不限于短信、邮件、智能电子屏、手机APP、电子广告牌,由此实现更多途径的广告推送方式,使得广告投放面更加广泛,投放效果也更好。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。
Claims (10)
1.一种基于发票数据的精准广告投放系统,其特征在于,包括发票数据采集存储模块、云端服务器、用户画像分析模块和广告精准投放模块,所述发票数据采集存储模块采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到所述云端服务器;所述用户画像分析模块从所述云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户,再从若干维度分析发票数据信息来构建用户画像;所述广告精准投放模块根据所述用户画像分析模块输出的用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放。
2.根据权利要求1所述的基于发票数据的精准广告投放系统,其特征在于,所述用户画像分析模块基于大数据分析技术采用KNN分类算法并结合贪心算法进行训练分析学习。
3.根据权利要求1或2所述的基于发票数据的精准广告投放系统,其特征在于,所述发票数据采集存储模块包括依次连接的发票数据采集单元、发票数据索引建立单元和发票数据分布式存储单元,所述发票数据采集单元采集用户开具的电子发票或纸质发票的数据信息,所述发票数据索引建立单元对发票的数据信息建立索引后根据索引对应缓存入所述分布式存储单元,所述分布式存储单元将缓存的发票数据信息批量上传到云端服务器。
4.根据权利要求3所述的基于发票数据的精准广告投放系统,其特征在于,所述用户画像分析模块包括依次连接的发票数据下载单元、机器学习训练单元、用户关联单元、用户画像建立单元和用户画像输出单元,所述发票数据下载单元从所述云端服务器下载发票数据后传送至机器学习训练单元;所述机器学习训练单元基于大数据分析技术采用KNN分类算法进行训练分析学习;所述用户关联单元将训练分析学习后的发票数据信息进行用户关联以建立唯一用户;再由用户画像建立单元从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签、用户属性和用户行为后,构建用户画像;所述用户画像输出单元将建立好的用户画像输出。
5.根据权利要求4所述的基于发票数据的精准广告投放系统,其特征在于,所述用户画像分析模块还包括样本处理单元,所述样本处理单元设置于机器学习训练单元和用户关联单元之间,用于将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,所述用户关联单元将裁剪处理后的发票数据信息进行用户关联以建立唯一用户。
6.根据权利要求4所述的基于发票数据的精准广告投放系统,其特征在于,所述广告精准投放模块包括依次连接的目标用户群体筛选单元、广告模板建立单元和广告批量投放单元,所述目标用户群体筛选单元与用户画像分析模块中的所述用户画像输出单元相连接用于接收所述用户画像输出单元输出的用户画像后根据分类标签筛选出目标用户群体,所述广告模板建立单元针对所述目标用户群体建立相匹配的广告模板,所述广告批量投放单元将建立好的广告模板支持若干广告投放方式批量进行针对目标用户群体的广告的点对点投放。
7.根据权利要求3所述的基于发票数据的精准广告投放系统,其特征在于,所述发票数据采集单元采集的发票数据信息为结构化数据信息,包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱;
和/或,所述广告精准投放模块中建立的广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的所支持的若干广告投放方式包括但不限于短信、邮件、智能电子屏、手机APP、电子广告牌。
8.一种基于发票数据的精准广告投放方法,其特征在于,所述方法包括下述步骤:
发票数据采集存储步骤,采集用户开具的发票数据信息后进行分布式存储并将发票数据信息批量上传到云端服务器;
用户画像分析步骤,从云端服务器下载发票数据信息后基于大数据分析技术采用KNN分类算法进行训练分析学习,并将训练分析学习后的发票数据信息进行用户关联以建立唯一用户后再从若干维度分析发票数据信息来构建用户画像;
广告精准投放步骤,根据所述用户画像筛选出目标用户群体后建立相匹配的广告模板并支持若干广告投放方式批量进行针对目标用户群体的广告投放。
9.根据权利要求8所述的基于发票数据的精准广告投放方法,其特征在于,在所述用户画像分析步骤中,基于大数据分析技术采用KNN分类算法进行训练分析学习时还结合采用贪心算法。
10.根据权利要求8或9所述的基于发票数据的精准广告投放方法,其特征在于,在所述用户画像分析步骤中,在训练分析学习后先将训练分析学习后的发票数据信息作为样本集进行样本集裁剪处理,再将裁剪处理后的发票数据信息进行用户关联以建立唯一用户,并从若干维度分析发票数据信息,提取与唯一用户相匹配的用户标签、用户属性和用户行为后,构建用户画像;
和/或,所述发票数据采集存储步骤采集的发票数据信息为结构化数据信息,包括但不限于发票抬头、发票时间、商品明细、商品金额、手机号、邮箱;
和/或,所述广告精准投放步骤建立的广告模板包括但不限于短信模板、邮件模板、电子广告模板、语言模板,同时与广告模板相对应的所支持的若干广告投放方式包括但不限于短信、邮件、智能电子屏、手机APP、电子广告牌。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811509168.XA CN109615429A (zh) | 2018-12-11 | 2018-12-11 | 一种基于发票数据的精准广告投放系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811509168.XA CN109615429A (zh) | 2018-12-11 | 2018-12-11 | 一种基于发票数据的精准广告投放系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109615429A true CN109615429A (zh) | 2019-04-12 |
Family
ID=66006959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811509168.XA Pending CN109615429A (zh) | 2018-12-11 | 2018-12-11 | 一种基于发票数据的精准广告投放系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109615429A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070123A (zh) * | 2019-04-16 | 2019-07-30 | 北京新意互动数字技术有限公司 | 一种目标用户识别装置及服务器 |
CN110135898A (zh) * | 2019-04-25 | 2019-08-16 | 上海淇毓信息科技有限公司 | 基于配置的客户营销召回方法、装置和电子设备 |
CN110310148A (zh) * | 2019-06-05 | 2019-10-08 | 上海易点时空网络有限公司 | 基于大数据和机器学习的广告精准投放方法 |
CN110766460A (zh) * | 2019-10-21 | 2020-02-07 | 海南高灯科技有限公司 | 一种用户画像的方法、装置、存储介质及计算机设备 |
CN110866791A (zh) * | 2019-11-25 | 2020-03-06 | 恩亿科(北京)数据科技有限公司 | 一种商品推送方法、装置、存储介质及电子设备 |
CN110992183A (zh) * | 2019-12-12 | 2020-04-10 | 深圳前海环融联易信息科技服务有限公司 | 企业交易信息分析方法、装置、计算机设备及存储介质 |
CN111191713A (zh) * | 2019-12-27 | 2020-05-22 | 大象慧云信息技术有限公司 | 基于发票数据的用户画像方法及装置 |
CN111415204A (zh) * | 2020-03-25 | 2020-07-14 | 中国—东盟信息港股份有限公司 | 一种基于隐私号平台信令与话单的广告投放系统及方法 |
CN111626774A (zh) * | 2020-05-21 | 2020-09-04 | 广州欢网科技有限责任公司 | 一种广告投放系统、方法和可读存储介质 |
CN111709812A (zh) * | 2020-06-19 | 2020-09-25 | 山东财经大学 | 基于用户动态分类的电商平台商品推荐方法及系统 |
CN112163088A (zh) * | 2020-09-02 | 2021-01-01 | 中国人民解放军战略支援部队信息工程大学 | 基于DenseNet的电信网短信用户信息挖掘方法、系统及设备 |
CN112288477A (zh) * | 2020-10-28 | 2021-01-29 | 衡阳市墨石网络科技有限公司 | 基于大数据分析的广告投放系统 |
CN112613902A (zh) * | 2020-12-15 | 2021-04-06 | 航天信息股份有限公司 | 一种建立用户画像的方法及系统 |
CN112788186A (zh) * | 2021-01-28 | 2021-05-11 | 深圳通联金融网络科技服务有限公司 | 一种基于开源软件开发的电话自动批量转接的方法及装置 |
CN114554257A (zh) * | 2020-06-30 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 资源分配方法、装置、电子设备及存储介质 |
CN115222461A (zh) * | 2022-09-19 | 2022-10-21 | 杭州数立信息技术有限公司 | 一种智能营销精准推荐方法 |
CN116595342A (zh) * | 2023-07-07 | 2023-08-15 | 北京数巅科技有限公司 | 人群圈选的方法、装置和设备及存储介质 |
CN116797282A (zh) * | 2023-08-28 | 2023-09-22 | 成都一心航科技有限公司 | 一种用于广告投放的实时监控系统以及监控方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170098259A1 (en) * | 2015-10-01 | 2017-04-06 | Choice Energy Services | System and method for managing invoice information |
CN107038237A (zh) * | 2017-04-18 | 2017-08-11 | 昆山数泰数据技术有限公司 | 基于大数据的用户画像系统及画像方法 |
CN107122995A (zh) * | 2017-04-25 | 2017-09-01 | 大象慧云信息技术有限公司 | 基于电子发票的信息推送方法及信息推送装置 |
CN108416620A (zh) * | 2018-02-08 | 2018-08-17 | 杭州浮云网络科技有限公司 | 一种基于大数据的画像数据的智能社交广告投放平台 |
-
2018
- 2018-12-11 CN CN201811509168.XA patent/CN109615429A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170098259A1 (en) * | 2015-10-01 | 2017-04-06 | Choice Energy Services | System and method for managing invoice information |
CN107038237A (zh) * | 2017-04-18 | 2017-08-11 | 昆山数泰数据技术有限公司 | 基于大数据的用户画像系统及画像方法 |
CN107122995A (zh) * | 2017-04-25 | 2017-09-01 | 大象慧云信息技术有限公司 | 基于电子发票的信息推送方法及信息推送装置 |
CN108416620A (zh) * | 2018-02-08 | 2018-08-17 | 杭州浮云网络科技有限公司 | 一种基于大数据的画像数据的智能社交广告投放平台 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070123A (zh) * | 2019-04-16 | 2019-07-30 | 北京新意互动数字技术有限公司 | 一种目标用户识别装置及服务器 |
CN110135898A (zh) * | 2019-04-25 | 2019-08-16 | 上海淇毓信息科技有限公司 | 基于配置的客户营销召回方法、装置和电子设备 |
CN110310148A (zh) * | 2019-06-05 | 2019-10-08 | 上海易点时空网络有限公司 | 基于大数据和机器学习的广告精准投放方法 |
CN110766460A (zh) * | 2019-10-21 | 2020-02-07 | 海南高灯科技有限公司 | 一种用户画像的方法、装置、存储介质及计算机设备 |
CN110866791A (zh) * | 2019-11-25 | 2020-03-06 | 恩亿科(北京)数据科技有限公司 | 一种商品推送方法、装置、存储介质及电子设备 |
CN110992183A (zh) * | 2019-12-12 | 2020-04-10 | 深圳前海环融联易信息科技服务有限公司 | 企业交易信息分析方法、装置、计算机设备及存储介质 |
CN111191713A (zh) * | 2019-12-27 | 2020-05-22 | 大象慧云信息技术有限公司 | 基于发票数据的用户画像方法及装置 |
CN111415204A (zh) * | 2020-03-25 | 2020-07-14 | 中国—东盟信息港股份有限公司 | 一种基于隐私号平台信令与话单的广告投放系统及方法 |
CN111415204B (zh) * | 2020-03-25 | 2023-04-14 | 中国—东盟信息港股份有限公司 | 一种基于隐私号平台信令与话单的广告投放系统及方法 |
CN111626774A (zh) * | 2020-05-21 | 2020-09-04 | 广州欢网科技有限责任公司 | 一种广告投放系统、方法和可读存储介质 |
CN111709812A (zh) * | 2020-06-19 | 2020-09-25 | 山东财经大学 | 基于用户动态分类的电商平台商品推荐方法及系统 |
CN114554257A (zh) * | 2020-06-30 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 资源分配方法、装置、电子设备及存储介质 |
CN112163088A (zh) * | 2020-09-02 | 2021-01-01 | 中国人民解放军战略支援部队信息工程大学 | 基于DenseNet的电信网短信用户信息挖掘方法、系统及设备 |
CN112288477A (zh) * | 2020-10-28 | 2021-01-29 | 衡阳市墨石网络科技有限公司 | 基于大数据分析的广告投放系统 |
CN112613902A (zh) * | 2020-12-15 | 2021-04-06 | 航天信息股份有限公司 | 一种建立用户画像的方法及系统 |
CN112613902B (zh) * | 2020-12-15 | 2024-06-07 | 航天信息股份有限公司 | 一种建立用户画像的方法及系统 |
CN112788186A (zh) * | 2021-01-28 | 2021-05-11 | 深圳通联金融网络科技服务有限公司 | 一种基于开源软件开发的电话自动批量转接的方法及装置 |
CN115222461A (zh) * | 2022-09-19 | 2022-10-21 | 杭州数立信息技术有限公司 | 一种智能营销精准推荐方法 |
CN116595342A (zh) * | 2023-07-07 | 2023-08-15 | 北京数巅科技有限公司 | 人群圈选的方法、装置和设备及存储介质 |
CN116595342B (zh) * | 2023-07-07 | 2023-09-29 | 北京数巅科技有限公司 | 人群圈选的方法、装置和设备及存储介质 |
CN116797282A (zh) * | 2023-08-28 | 2023-09-22 | 成都一心航科技有限公司 | 一种用于广告投放的实时监控系统以及监控方法 |
CN116797282B (zh) * | 2023-08-28 | 2023-10-27 | 成都一心航科技有限公司 | 一种用于广告投放的实时监控系统以及监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109615429A (zh) | 一种基于发票数据的精准广告投放系统及方法 | |
JP6991163B2 (ja) | 情報をプッシュする方法及びデバイス | |
CN103995889A (zh) | 图片分类方法及装置 | |
CN108985214A (zh) | 图像数据的标注方法和装置 | |
CN104036235B (zh) | 基于叶片hog特征和智能终端平台的植物物种识别方法 | |
CN107818105A (zh) | 应用程序的推荐方法及服务器 | |
CN105306495B (zh) | 用户识别方法和装置 | |
CN106886518A (zh) | 一种微博账号分类的方法 | |
CN104852892B (zh) | 一种新型物联网网站系统的自主登录方法 | |
CN109840793A (zh) | 推广信息的推送方法和装置、存储介质、电子装置 | |
CN108985360A (zh) | 基于扩展形态学与主动学习的高光谱分类方法 | |
CN106708940A (zh) | 用于处理图片的方法和装置 | |
CN105956083A (zh) | 应用软件分类系统、应用软件分类方法及服务器 | |
CN108256537A (zh) | 一种用户性别预测方法和系统 | |
CN106980667B (zh) | 一种给文章标注标签的方法和装置 | |
CN109284498A (zh) | 自提柜推荐方法、自提柜推荐装置和电子装置 | |
CN110610169A (zh) | 图片标注方法和装置、存储介质及电子装置 | |
CN102663435A (zh) | 基于半监督的垃圾图片过滤方法 | |
CN108648019A (zh) | 提升广告分析效率的方法、装置、电子设备及存储介质 | |
CN111506755A (zh) | 图片集的分类方法和装置 | |
CN110490237A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN107995285B (zh) | 信息显示方法、装置、服务器及可读存储介质 | |
CN113360768A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN115471283A (zh) | 广告批量投放方法、装置、设备及存储介质 | |
CN110147286B (zh) | 一种基于消息队列的定制信息发送方法、装置、系统和记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190412 |
|
WD01 | Invention patent application deemed withdrawn after publication |