CN107423315B - 一种户外媒体资源数据的挖掘处理方法及系统 - Google Patents
一种户外媒体资源数据的挖掘处理方法及系统 Download PDFInfo
- Publication number
- CN107423315B CN107423315B CN201710177880.3A CN201710177880A CN107423315B CN 107423315 B CN107423315 B CN 107423315B CN 201710177880 A CN201710177880 A CN 201710177880A CN 107423315 B CN107423315 B CN 107423315B
- Authority
- CN
- China
- Prior art keywords
- data
- media
- outdoor
- outdoor media
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/1824—Distributed file systems implemented using Network-attached Storage [NAS] architecture
- G06F16/1827—Management specifically adapted to NAS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种户外媒体资源数据的挖掘处理方法,包括步骤:S1、基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;S2、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;S3、采用多点并行方式对存储的用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;S4、将得到的每一所述户外媒体的受众数据分析模型进行显示。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种户外媒体资源数据挖掘处理方法及系统。
背景技术
传统户外媒体的典型营销模式,是根据行业经验进行投放点位的选择。由于缺乏数据支撑,媒体的价格,广告投放的效果一直缺乏有效的评估体系和手段。这一价值评价体系的缺失,极大的制约了户外媒体行业的发展。另外,移动运营商掌握大量的用户数据,却长期得不到有效的利用,数据的价值不能得到充分的挖掘,事实上造成了资源浪费。
随着技术手段的成熟,利用大数据技术,使得广告的曝光和交互可以被量化,户外媒体广告的精准投放成为可能。户外媒体转型升级的重要内容就是建立价值评估体系,提高精细化运营水平,从而提升传播价值。通过分析户外媒体的受众群体的消费偏好和行为特征,指导广告主合理选择投放点位,投放内容,提升广告的到达率,进而降低投放成本,获得更高的投资收益。
基于上述背景,提出一种有效的受众分析方法对于提高户外媒体的传播效果至关重要。身处大数据时代,如何开发及利用好潜在受众的信息交互习惯将成为解决现有技术问题的主要研究方向。现如今,手机作为日常通讯设备几乎达到了人手一部的普及程度,人们养成了用手机完成通讯、消费等信息交互过程,与移动运营商达成合作以获取户外媒体所在区域受众的相关信息、可作为数据挖掘及分析的基础,从而可有效提高信息投放的命中率。但如何从运营商庞大杂乱的数据中筛选出上述有效的数据,是当下急需解决的问题,也是本方法所能实现的目的所在。
发明内容
本发明实施例的目的是提供一种,能有效根据用户特征数据和行为数据提供户外媒体受众群体分析,从而实现户外广告的精确投放和个性化定制投放,提高广告投放效果的一种户外媒体资源数据挖掘方法,包括步骤:
S1、基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
S2、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
S3、采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;
S4、将得到的每一所述户外媒体的受众数据分析模型进行显示。
作为上述方案的改进,在所述步骤S4之前,还包括步骤:
S3’:重复N次执行步骤S1~S3,并将每次得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的媒体受众数据分析模型;
其中所述步骤S4显示的为修正后的每一所述户外媒体的受众数据分析模型。
作为上述方案的改进,还包括步骤:
S5、根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
作为上述方案的改进,所述步骤S1具体包括步骤:
S11、划定每一户外媒体的可视区域;
S12、基于WIFI热点连接确定每一户外媒体的可视区域内的全部移动终端用户;
S13、基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的用户数据信息。
作为上述方案的改进,所述步骤S3具体包括步骤:
设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型。
本发明实施例对应提供了一种户外媒体资源数据挖掘处理系统,包括多个户外媒体和后台服务器,每一所述户外媒体设置WIFI设备;其中,所述后台服务器包括:
数据采集模块,基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
数据存储模块,将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
数据挖掘模块,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;以及
显示模块,将得到的每一所述户外媒体的受众数据分析模型进行显示。
作为上述方案的改进,还包括:
数据修正模块,用于将多次得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的受众数据分析模型;
其中所述显示模块显示的为修正后的每一所述户外媒体的受众数据分析模型。
作为上述方案的改进,还包括:
媒体资源广告推送模块,用于根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
作为上述方案的改进,所述数据采集模块通过以下方式获取用户数据信息:
预先划定每一户外媒体的可视区域;
基于WIFI热点连接确定每一户外媒体的可视区域内的移动终端用户,并提取其用户数据;
基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的用户数据信息,此信息包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的。
作为上述方案的改进,所述数据挖掘模块通过以下步骤进行数据挖掘和分析:
设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型。
与现有技术相比,本发明公开的一种户外媒体资源数据挖掘处理方法及系统基于运营商大数据采集每一户外媒体的预设可视范围内的、通过WIFI热点方式与对应所述媒体实现连接的全部移动终端用户数据信息,并将采集的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型(媒体受众群体特征模型和媒体受众群体行为模型)并用于进行显示。因此,本发明实施例的户外媒体资源数据挖掘处理方法及系统根据不同的户外媒体的受众的用户特征数据和行为数据提供户外媒体受众群体分析,并根据分析结果推介媒体资源,同时实现广告的精确投放和个性化定制投放,提高广告投放效果。同时本发明实施例利用大数据为媒体价值评估提供了一套行之有效的测评手段,提高了评估效率和客观性,适应了时代发展的脉搏,可以持续的对媒体进行快速评估,可以有效地在统一的平台上进行不同户外媒体之间的比较,可以使广告主更有针对性的选择适合自身特性的户外媒体。
附图说明
图1是本发明实施例1中一种户外媒体资源数据挖掘处理方法的流程图。
图2是本发明实施例2中一种户外媒体资源数据挖掘处理方法的流程图。
图3是本发明实施例3中一种户外媒体资源数据挖掘处理方法的流程图。
图4是本发明实施例1中一种户外媒体资源数据挖掘处理方法的流程框图。
图5是本发明实施例4中一种户外媒体资源数据挖掘处理系统的后台服务器的结构框图。
图6是本发明实施例5中一种户外媒体资源数据挖掘处理系统的后台服务器的结构框图。
图7是本发明实施例6中一种户外媒体资源数据挖掘处理系统的后台服务器的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例1提供的一种户外媒体资源数据挖掘处理方法的流程示意图。本实施例的提供的一种户外媒体资源数据挖掘处理方法包括步骤S101~S104:
S101、基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息。
具体的,该步骤具体通过以下步骤获取用户数据信息:
S1011、划定每一户外媒体的可视区域;
S1012、基于WIFI热点连接确定每一户外媒体的可视区域内的全部移动终端用户;
S1013、基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的用户数据信息。
所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息三大类,其中:
用户基础数据信息包括:
(1)户外媒体受众基础属性。包括性别、年龄、收入、居住城市、详细居住地、社交圈。
(2)户外媒体受众的消费习惯。包括受众对各行业信息的关注度、受众对不同APP的安装程度,受众对不同产品的移动端消费情况。
用户流量数据信息包括:
(1)流量数据。从时间上来看,可细化到每秒、每分钟、每刻钟、每小时、每天、每周、每月、每年的人流量,或者截取任意时间段的人流量,只要该时间段在数据库的时间范围内即可。从内容上来看,可以提供不重复的人数,也可以提供重复的人次。从分类上来看,既可以输出总人流量,也可根据其它指标提供有特定属性的人流量,比如男性人流量、某年龄段的人流量、浏览过某网页的人流量、购买过某产品的人流量等。从重叠独占来看,可以提供只去过某户外媒体没有去过其它户外媒体的人数,也可以提供同时去过几个选定户外媒体的人数。
(2)户外媒体接触数据。包括经过户外媒体的频率,在户外媒体周边停留时长的数据,工作日高峰时段,周末高峰时段等。
用户行为数据信息包括统计每个时间段接入WIFI热点的用户的客户流量数据信息,分析用户的浏览历史和反馈、点击情况。
其中,上述计算重叠独占程度包括:1、可以进行户外媒体组合,计算多户外媒体同时投放的覆盖规模。2、计算多户外媒体同时覆盖的有效千人成本。
S102、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储。
具体的,Hadoop是一个平台,是一个适合大数据的分布式存储和计算的平台。通过实现Hadoop分布式文件系统(HDFS)来实现分布式存储,HDFS是设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。
本实施例通过Hadoop分布式文件系统(HDFS)来实现分布式存储,对需要监控的每一户外媒体所收集到海量数据进行存储,从而可以根据不同的数据存入不同的数据库中。例如,如图4所示,将用户基础数据信息存储到用户数据库中,将用户流量数据信息存储到用户流量数据库中,将用户行为数据信息存储到用户行为数据库中。
另外,本发明实施例还对数据库进行周期性更新数据集,并清除已经存储的数据。例如,可以以天为单位,每天对存在各个数据库中的数据进行更新。
S103、采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型。
其中,MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。MapReduce通过把对数据集的大规模操作发给网络上的每个结点实现可靠性,每个节点会周期性的返回它所完成的工作和最新的状态。
具体的,在该步骤中,具体通过以下步骤实现数据挖掘与分析:
S1031、设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
S1032、启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
S1033、在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型。
存储的数据中信息量很大,信息种类也很多,所以人工对其进行分析是不可能实现的,因此需要建立多个分析数据集的模型,在模型中需要考虑许多不同的指标:媒体受众的数量、类型、消费水平、消费习惯;不同地方对广告传输媒介的需求量大小,不同地段所在的媒体受众数量以及偏好;不同地区对不同的传播媒介的依赖程度和喜爱程度;不同媒介在不同地区的收益效果等等各种各样的指标都是模型中需要涉及到的部分。
通过实施上述步骤,得到包括每一户外媒体的受众年龄、性别、消费能力、消费偏好、工作地、居住地等信息的受众群体特征模型;根据用户流量数据分析统计每个时间段的用户流量特征,用户对推送广告的反馈和点击数据,分析其消费爱好以及消费类型,建立受众群体行为模型。
S104、将得到的每一所述户外媒体的受众数据分析模型进行显示。
根据数据得到的结果中信息量也是十分大的,所以需要根据需求来得到不同的结果,最后以图表的形式展现。在该步骤中,将经过上述步骤得到的信息以图表的形式输出,得到不同地点、不同时刻的人群的消费习惯、消费偏好。
可见,本实施例基于运营商大数据采集每一户外媒体的预设可视范围内的、通过WIFI热点方式与对应所述媒体实现连接的全部移动终端用户数据信息,并将采集的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型(媒体受众群体特征模型和媒体受众群体行为模型)并用于进行显示。本实施例能根据不同的户外媒体的受众的用户特征数据和行为数据提供户外媒体受众群体分析,并根据分析结果推介媒体资源,同时实现广告的精确投放和个性化定制投放,提高广告投放效果。
参见图2,是本发明实施例2提供的一种户外媒体资源数据挖掘处理方法的流程示意图。该方法包括步骤S201~S205:
S201、基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
S202、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
S203、采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;
S204、重复N次执行步骤S1~S3,并将每次得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的受众数据分析模型;其中,2≤N≤20。
S205、将修正后的每一所述户外媒体的受众数据分析模型进行显示。
本实施例能够实现实施例1的效果,而且本实施例在实施例1的基础上,在建立了相关数据分析模型之后,还需要在后续时间里根据新的数据集对模型进行修正,具体的实施方法是重复信息采集、数据存储以及数据挖掘的操作,从而将得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,提高数据分析结果的准确性。
参见图3,是本发明实施例3提供的一种户外媒体资源数据挖掘处理方法的流程示意图。该方法包括步骤S301~S305:
S301、基于运营商大数据,获取每一户外媒体的预设可视范围内的WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
S302、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
S303、采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;
S304、将得到的每一所述户外媒体的受众数据分析模型进行显示。
S305、根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
本实施例能够实现实施例1的效果,而且本实施例在实施例1的基础上,还通过根据每一所述户外媒体的受众数据分析模型结果,向每一所述户外媒体控制推送对应的媒体资源广告。其中,向每一所述户外媒体控制推送对应的媒体资源广告包括智能选户外媒体功能,例如,选择最适合投放相应行业广告的户外媒体并控制相应广告的推送。其中,选户外媒体依据包括:
1.可以依据广告主所处的行业的目标受众的多少选户外媒体,按照目标受众总量的多少由高到底推荐。
2.可以依据广告主选定的特定目标受众的性别选户外媒体,将各户外媒体按照受众性别由高到底推荐。
3.可以依据广告主选定的特定目标受众的年龄选户外媒体,提供目标受众的主要年龄段,将各户外媒体在该年龄段受众的比例由高到底推荐。
4.可以依据所处品牌的生命周期,如需要扩大知名度的时期,推荐受众数量大的户外媒体;如需要强化品牌印象的时期,推荐受众经过频率高的户外媒体。
5.可以配合广告主的其它投放进行策略性户外媒体推荐,比如广告主已通过其它途径花较大费用投放了机场媒体广告,为避免重复投放可以推荐受众去过机场比例低的户外媒体。
6.可以结合费用计算千人成本,按照千人成本由低到高的顺序进行户外媒体推荐。
可见,上述实施例公开的一种户外媒体资源数据挖掘处理方法,基于运营商大数据采集每一户外媒体的预设可视范围内的包括WIFI热点用户和移动运营商用户的全部用户数据信息,将采集的用户数据信息通过Hadoop分布式文件系统实现分布式存储,然后采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型(媒体受众群体特征模型和媒体受众群体行为模型)并用于进行显示。因此,本发明实施例的户外媒体资源数据挖掘处理方法及系统根据不同的户外媒体的受众的用户特征数据和行为数据提供户外媒体受众群体分析,并根据分析结果推介媒体资源,继而实现广告的精确投放和个性化定制投放,提高广告投放效果。同时本发明实施例利用大数据技术为媒体价值评估提供了一套行之有效的测评手段,提高了评估效率和客观性,适应了时代发展的脉搏,可以持续的对媒体进行快速评估,可以有效地在统一的平台上进行不同户外媒体之间的比较,可以使广告主更有针对性的选择适合自身特性的户外媒体。
本发明实施4提供了一种户外媒体资源数据挖掘处理系统,包括多个户外媒体和后台服务器,每一所述户外媒体设置WIFI设备;其中,如图5所示,所述后台服务器包括:
数据采集模块501,基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
数据存储模块502,将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
数据挖掘模块503,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的媒体受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;以及
显示模块504,将得到的每一所述户外媒体的媒体受众数据分析模型进行显示。
其中,所述数据采集模块501通过以下方式获取用户数据信息:
预先划定每一户外媒体的可视区域;
基于WIFI热点连接确定每一户外媒体的可视区域内的全部移动终端用户;
基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的用户数据信息。
另外,所述数据挖掘模块503通过以下步骤进行数据挖掘和分析:
设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型。
本实施例公开的一种户外媒体资源数据挖掘处理系统的工作原理及过程请参考上述实施例1,在此不再赘述。
本发明实施5提供了一种户外媒体资源数据挖掘处理系统,包括多个户外媒体和后台服务器,每一所述户外媒体设置WIFI设备;其中,如图6所示,所述后台服务器在实施例4的基础上,还包括:
数据修正模块603,用于将多次得到的每一所述户外媒体的媒体受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的媒体受众数据分析模型;
其中所述显示模块504显示的为修正后的每一所述户外媒体的受众数据分析模型。
本发明实施6提供了一种户外媒体资源数据挖掘处理系统,包括多个户外媒体和后台服务器,每一所述户外媒体设置WIFI设备;其中,如图7所示,所述后台服务器在实施例4的基础上,还包括:
媒体资源广告推送模块705,用于根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
可见,上述实施例公开的一种户外媒体资源数据挖掘处理系统基于运营商大数据采集每一户外媒体的预设可视范围内的、通过WIFI热点方式与对应所述媒体实现连接的全部移动终端用户数据信息,并将采集的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型(媒体受众群体特征模型和媒体受众群体行为模型)并用于进行显示。因此,本发明实施例的户外媒体资源数据挖掘处理方法及系统根据不同的户外媒体的受众的用户特征数据和行为数据提供户外媒体受众群体分析,并根据分析结果推介媒体资源,同时实现户外广告的精确投放和个性化定制投放,提高广告投放效果。同时本发明实施例通过大数据为媒体价值评估提供了一套行之有效的测评手段,提高了评估效率和客观性,适应了时代发展的脉搏,可以持续的对媒体进行快速评估,可以有效地在统一的平台上进行不同户外媒体之间的比较,可以使广告主更有针对性的选择适合自身特性的户外媒体。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (6)
1.一种户外媒体资源数据的挖掘处理方法,其特征在于,包括步骤:
S1、基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
所述步骤S1具体包括步骤:
S11、划定每一户外媒体的可视区域;
S12、基于WIFI热点连接确定每一户外媒体的可视区域内的全部移动终端用户;
S13、基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的用户数据信息;
S2、将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
S3、采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;
所述步骤S3具体包括步骤:
S31、设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
S32、启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
S33、在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型;
S4、将得到的每一所述户外媒体的受众数据分析模型进行显示。
2.如权利要求1所述的户外媒体资源数据挖掘处理方法,其特征在于,在所述步骤S4之前,还包括步骤:
S3’:重复N次执行步骤S1~S3,并将每次得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的受众数据分析模型;
其中所述步骤S4显示的为修正后的每一所述户外媒体的受众数据分析模型。
3.如权利要求1所述的户外媒体资源数据挖掘处理方法,其特征在于,还包括步骤:
S5、根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
4.一种户外媒体资源数据挖掘处理系统,其特征在于,包括多个户外媒体和后台服务器,每一所述户外媒体设置WIFI设备;其中,所述后台服务器包括:
数据采集模块,基于运营商大数据,获取每一户外媒体预设的可视范围内WIFI热点用户和移动运营商用户的用户数据信息;其中,所述用户数据信息包括用户基础数据信息、用户流量数据信息和用户行为数据信息;
所述数据采集模块通过以下方式获取用户数据信息:
预先划定每一户外媒体的可视区域;
基于WIFI热点连接确定每一户外媒体的可视区域内的全部移动终端用户;
基于运营商大数据,提取每一户外媒体的可视区域内的全部移动终端用户的包括当前的、或跟踪未来某段时间的、或追溯过去某段时间的用户数据信息;
数据存储模块,将获取到的每一户外媒体的预设可视范围内的用户数据信息通过Hadoop分布式文件系统实现分布式存储;
数据挖掘模块,采用多点并行方式对存储的所述用户数据信息进行数据挖掘和分析,从而得到基于每一所述户外媒体的受众数据分析模型;其中,所述媒体受众数据分析模型包括媒体受众群体特征模型和媒体受众群体行为模型;
所述数据挖掘模块通过以下步骤进行数据挖掘和分析:
设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;
启动所述工作流,并在所述多个并行的数据处理任务被触发时,为每个所述数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;
在执行节点执行每个所述数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,并将每个数据处理任务对应的Map任务的处理结果通过相应的Reduce任务进行合并处理后得到相应数据处理任务的处理结果;每一所述处理结果为一媒体受众数据分析模型;
以及显示模块,将得到的每一所述户外媒体的受众数据分析模型进行显示。
5.如权利要求4所述的户外媒体资源数据挖掘处理系统,其特征在于,还包括:
数据修正模块,用于将多次得到的每一所述户外媒体的受众数据分析模型对已建立的媒体受众数据分析模型进行修正,从而得到修正后的每一所述户外媒体的受众数据分析模型;
其中所述显示模块显示的为修正后的每一所述户外媒体的受众数据分析模型。
6.如权利要求4所述的户外媒体资源数据挖掘处理系统,其特征在于,还包括:
媒体资源广告推送模块,用于根据每一所述户外媒体的受众数据分析模型向每一所述户外媒体推送对应的媒体资源广告。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710177880.3A CN107423315B (zh) | 2017-03-23 | 2017-03-23 | 一种户外媒体资源数据的挖掘处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710177880.3A CN107423315B (zh) | 2017-03-23 | 2017-03-23 | 一种户外媒体资源数据的挖掘处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107423315A CN107423315A (zh) | 2017-12-01 |
CN107423315B true CN107423315B (zh) | 2018-11-06 |
Family
ID=60423485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710177880.3A Active CN107423315B (zh) | 2017-03-23 | 2017-03-23 | 一种户外媒体资源数据的挖掘处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423315B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020884A (zh) * | 2018-12-25 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 多媒体资源的计费方法、装置及系统 |
CN110245174A (zh) * | 2019-06-13 | 2019-09-17 | 浙江华坤道威数据科技有限公司 | 一种企业定制dmp系统及其使用方法 |
CN110364049B (zh) * | 2019-07-17 | 2021-03-30 | 石虹 | 一种具有偏离度自动反馈数据闭环纠偏控制的专业技能实训辅助教学系统及辅助教学方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN104574005A (zh) * | 2015-02-15 | 2015-04-29 | 蔡耿新 | 集增强现实、体感、抠绿技术的广告展示管理系统和方法 |
CN105205055A (zh) * | 2014-06-06 | 2015-12-30 | 上海商会网网络信息技术有限公司 | 大数据分析系统 |
CN105741134A (zh) * | 2016-01-26 | 2016-07-06 | 北京百分点信息科技有限公司 | 跨数据源的营销人群在市场营销中应用的方法及装置 |
CN106339891A (zh) * | 2015-07-13 | 2017-01-18 | 上海银橙文化传媒股份有限公司 | 一种基于大数据采集的智能分析方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558784B2 (en) * | 2004-04-26 | 2009-07-07 | Right90, Inc. | Operating plan data aggregation system with real-time updates |
CN103309990A (zh) * | 2013-06-18 | 2013-09-18 | 上海晶樵网络信息技术有限公司 | 基于互联网用户公开信息的用户多维度分析与监测方法 |
-
2017
- 2017-03-23 CN CN201710177880.3A patent/CN107423315B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN105205055A (zh) * | 2014-06-06 | 2015-12-30 | 上海商会网网络信息技术有限公司 | 大数据分析系统 |
CN104574005A (zh) * | 2015-02-15 | 2015-04-29 | 蔡耿新 | 集增强现实、体感、抠绿技术的广告展示管理系统和方法 |
CN106339891A (zh) * | 2015-07-13 | 2017-01-18 | 上海银橙文化传媒股份有限公司 | 一种基于大数据采集的智能分析方法及系统 |
CN105741134A (zh) * | 2016-01-26 | 2016-07-06 | 北京百分点信息科技有限公司 | 跨数据源的营销人群在市场营销中应用的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107423315A (zh) | 2017-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902849B (zh) | 用户行为预测方法及装置、行为预测模型训练方法及装置 | |
US11706645B2 (en) | Systems and methods for communications node upgrade and selection | |
CN104270429B (zh) | 一种推送应用到终端的方法和装置 | |
Meade et al. | Forecasting in telecommunications and ICT—A review | |
CN102591942B (zh) | 一种应用自动推荐的方法及装置 | |
CN104065565B (zh) | 推送消息的方法、服务器、客户端装置和系统 | |
CN105653545B (zh) | 在页面中提供业务对象信息的方法及装置 | |
CN109657138A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
US20160210657A1 (en) | Real-time marketing campaign stimuli selection based on user response predictions | |
US20170091810A1 (en) | Brand engagement touchpoint attribution using brand engagement event weighting | |
CN109522470A (zh) | 一种视频热度预测方法、装置、设备及存储介质 | |
CN105898209A (zh) | 视频平台监控分析系统 | |
CN111178954A (zh) | 一种广告投放方法、系统和电子设备 | |
CN104063801A (zh) | 一种基于聚类的移动广告推荐方法 | |
JP2013054736A (ja) | ユーザ端末で取得した情報に基づいてモバイルアプリケーションの順位を提供する方法及びそのシステム | |
CN105190665A (zh) | 移动创意管理系统 | |
CN110210883A (zh) | 群控账号识别方法、装置、服务器及存储介质 | |
CN107423315B (zh) | 一种户外媒体资源数据的挖掘处理方法及系统 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
CN101464984A (zh) | 一种利用广告位标签发布广告的广告发布控制系统及方法 | |
US10218575B2 (en) | Provision, configuration and use of a telecommunications network | |
CN111626779A (zh) | 一种媒体信息处理方法、装置和存储介质 | |
CN110753920A (zh) | 用于优化和模拟网页排序和流量的系统和方法 | |
US10586358B1 (en) | System and method for visualization of beacon clusters on the web | |
CN113592535A (zh) | 一种广告推荐方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |