CN107563807A - 一种基于数据挖掘的区域广告推送系统 - Google Patents

一种基于数据挖掘的区域广告推送系统 Download PDF

Info

Publication number
CN107563807A
CN107563807A CN201710755699.6A CN201710755699A CN107563807A CN 107563807 A CN107563807 A CN 107563807A CN 201710755699 A CN201710755699 A CN 201710755699A CN 107563807 A CN107563807 A CN 107563807A
Authority
CN
China
Prior art keywords
data
advertisement
module
algorithm
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710755699.6A
Other languages
English (en)
Inventor
范时平
余浩
宋亮
吴乾隆
马创
禹果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201710755699.6A priority Critical patent/CN107563807A/zh
Publication of CN107563807A publication Critical patent/CN107563807A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数据挖掘的区域广告推送系统,包括数据采集模块、数据处理模块、算法分析模块和消息推送模块,其中数据采集模块采集于运营商客户在某一区域的历史脱敏数据和广告的基本属性,经过数据处理模块进行初步的归纳处理后,再经算法模块进行运算分析,最后将聚类的结果和广告特征进行匹配,并输入到信息推送模块,后者根据获得的信息对该区域或类似区域的用户推送个性化广告。通过利用对数据挖掘算法的分析,对数据集的处理采用合适的算法并采用三角不等式加速算法收敛,最终实现向该区域及类似区域的游客精准推送商业广告,为实现景区数字化建设,提高广告推荐的准确度打下良好的基础。

Description

一种基于数据挖掘的区域广告推送系统
技术领域
本发明涉及一种数据挖掘的景区广告推送系统,主要用于实现景区信息化领域的数据挖掘。
背景技术
随着互联网的发展以及通讯设备的普及和更新,移动终端成为了人们不可或缺的设备,运营商的用户规模逐渐扩大。面对日益增加现有以及潜在的广告受众,越来越多的企业和广告商逐渐深入挖掘广告市场的价值。
借助于信息技术的高速发展以及存储技术的提高,使得人们获得的数据量急剧膨胀,数据逐渐成为企业和国家战略发展的重要资源。国内的电信行业所拥有庞大的用户数据,这些数据对电信行业来说是尚未彻底挖掘的重要资产和宝贵财富。如果对这些数据进行深入分析,往往可以从中获得大量有价值的信息,为企业带来一个又一个增长点。
目前,广告的投放主要对某一区域的人流量和基于内容的推荐,如在车流量多的收费站附近、广场、网吧以及其他人流量多的位置,通过大型的电子屏幕推送商业广告。这种投放方式是投放某种固定的广告,不能根据当前的用户属性和特征做出灵活地调整,降低了广告投放的效益。
当前比较主流的广告推荐技术主要是根据用户的浏览记录和关键词的搜索,根据这些信息将合适的广告推送给用户。通过对用户的上网日志进行挖掘,并分析出在搜索引擎上搜索的关键字或网页来给用户打上标签,当用户下一次登录到某个网页时,便在该网页的消息推送区把广告的关键字和链接推送给用户。
然而,这种推荐方法没有考虑到用户群体的分类,而没有针对某个人群的共同特征来针对性得进行广告投放,不能充分地反应用户的需求,同时也不能挖掘潜在的受众,用户也会对自己毫不感兴趣的广告产生反感,进而可能会关闭一个广告推送的渠道。
发明内容
针对上述问题,本发明将区域用户特点与广告推送相结合,提出了一种基于数据挖掘的区域广告推送系统,通过对区域内用户的历史数据的分析和计算,建立准确有效的广告推荐模型,从而有效提高该区域及类似区域中的广告投放的精准度。
该系统包括数据采集模块、数据处理模块、算法分析模块和消息推送模块。
所述数据采集模块,采集用户在区域内的历史脱敏数据和广告的特征及关键字,并传输到所述数据处理模块。
所述数据处理模块,接收数据采集模块采集的数据,先清除无效的用户数据,所述无效的用户数据是指历史脱敏数据中失效的数据,再通过数据存储区,存储并预处理数据。
所述算法分析模块,提取所述数据处理模块中存储并预处理的脱敏数据进行运算分析,并将聚类的结果和广告特征进行匹配,形成广告推荐模型;其步骤为:
S1:分析该区域内用户的属性,针对其不同的数据类型选用合适的算法;
S2:结合三角不等式加速所述算法的收敛,对脱敏数据进行聚类分析,并将聚类的结果和广告特征进行匹配,从而建立广告推荐模型。
所述S1中针对其不同的数据类型选用合适的算法包括K-Means、K-Modes和K-Prototypes算法。所述S2中结合三角不等式加速算法的收敛,对数据进行聚类分析,并将聚类的结果和广告特征进行匹配的方法为:
S21、将广告中的属性直接分类,并把该类的属性作为算法的聚类中心。
S22、对采集到的数据集进行聚类分析,首先计算一个聚类中心到另一个聚类中心的距离,记为d;
S23、计算一个点到距离为d的两个聚类中心中其中一个聚类中心a的距离,记为l1
S24、判断与l1的关系,以及l1与l2的关系,用于确定该计算点的广告聚类特征属性;其中,l2为该计算点到另一个聚类中心b的距离,该计算点与用户数据相对应。
所述消息推送模块,包括推送模块和优化模块;所述推送模块,提取所述算法分析模块中形成的准确有效的广告推荐模型,对区域内的用户发送有针对性的广告;所述优化模块,用于反馈区域内用户的选择,优化并完善系统。
本发明的优点及有益效果:
本发明通过对特定区域内用户的历史脱敏数据及广告的基本属性进行运算分析,形成一个针对该特定区域准确有效的广告推荐模型,使对该区域或类似区域的用户进行的广告推送更具针对性和准确性,有效地挖掘出潜在的受众,提高投放的效益,为商家有针对性的推送广告及决定其他商业决策建立依据。同时,在运算分析中通过针对不同的数据类型,提供不同的聚类算法,并结合三角不等式加速算法的收敛,实现每个模块地精准计算。加入的优化模块,反馈区域内用户的选择,优化并完善系统。
附图说明
图1是系统整体的模块框图;
图2算法分析模块流程图。
具体实施方式
下面将结合发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
如图1所示,本发明提供了一种基于数据挖掘的区域广告推送系统,包括包括数据采集模块、数据处理模块、算法分析模块和消息推送模块。
数据采集模块用于采集运营商客户在区域内的历史脱敏数据和广告数据,包括:运营商客户数据标签的收集、广告特征及关键字的收集。运营商的客户数据采集:数据来自于运营商的用户脱敏信息,以及用户的标签。广告的特征及关键字收集:数据主要来自于广告商对广告属性的挖掘。运营商客户数据,主要包括用户的基本属性(手机号、年龄、性别、话费套餐)。用户的标签(消费水平、兴趣标签)。
所述的广告商数据,主要包括广告的类型、广告费用、关键字以及广告所面向的对象。
收集到的数据,在通过数据处理模块,先进行数据清洗,将运营商中的欠费超过半年的用户以及非个人移动号码进行清除,以保证数据的可靠性。再通过数据存储区,收集并预处理所述数据采集模块收集到的内容。
存储到数据处理模块的数据,再通过算法分析模块,先基于运营商用户的脱敏数据分析用户的属性,判断属于哪种数据类型,运用基于聚类算法,针对不同的数据类型选用包括K-Means、K-Modes和K-Prototypes算法在内的合适的算法,对收集到的数据进行挖掘;根据用户的消费等级、标签、话费详单等信息,对整个区域的用户群体进行聚类分析,并结合三角不等式,计算一个点到距离为d的两个聚类中心中任意一个的距离,记为l1;如果d≥l1,则有该点到另外一个聚类中心的距离l2大于l1,因此不用计算l2;加速算法的收敛,从而建立准确有效的广告推荐模型,为商家有针对性的推送广告及决定其他商业决策建立依据。
该方法同时提高了算法的收敛速度,并可以处理整型、字符型和混合型数据。
最后由消息推送模块中的推送模块,根据所述算法分析模块中形成的一个准确有效的广告推荐模型,对区域内的用户发送有针对性的广告。而优化模块,则负责根据游客的选择及反馈,不断地对该系统进行优化,使得该系统不断完善,更好地向该区域内的用户进行个性化的广告推荐。
如图2所示,将聚类的结果和广告特征进行匹配的步骤为:
1.计算一个聚类中心a到另一个聚类中心b的距离,记为d;
2.计算一个点到距离为d的两个聚类中心中其中一个聚类中心a的距离,记为l1
3.判断与l1的关系。若成立,则该计算点属于聚类中心a;若不成立,则需判断l1≤l2。若该式成立,则该计算点属于聚类中心a;若不成立,则该计算点属于聚类中心b。其中,l2为该计算点到另一聚类中心b的距离。

Claims (5)

1.一种基于数据挖掘的区域广告推送系统,其特征在于:包括数据采集模块、数据处理模块、算法分析模块和消息推送模块;
所述数据采集模块,采集用户在区域内的历史脱敏数据和广告的特征及关键字,并传输到所述数据处理模块;
所述数据处理模块,接收数据采集模块采集的数据,先清除无效的用户数据,再通过数据存储区,存储并预处理数据;
所述算法分析模块,提取所述数据处理模块中存储并预处理的脱敏数据进行运算分析,并将聚类的结果和广告特征进行匹配,形成广告推荐模型;
所述消息推送模块,提取所述算法分析模块中形成的广告推荐模型,对区域内的用户发送有针对性的广告。
2.根据权利要求1所述的一种基于数据挖掘的区域广告推送系统,其特征在于:所述消息推送模块中还包括用于反馈区域内用户的选择,优化并完善系统的优化模块。
3.根据权利要求1或2所述的一种基于数据挖掘的区域广告推送系统,其特征在于:所述算法分析模块中形成广告推荐模型的步骤为:
S1:分析该区域内用户的属性,针对其不同的数据类型选用合适的算法;
S2:结合三角不等式加速所述算法的收敛,对脱敏数据进行聚类分析,并将聚类的结果和广告特征进行匹配,从而建立广告推荐模型。
4.根据权利要求3所述的一种基于数据挖掘的区域广告推送系统,其特征在于:所述S1中针对其不同的数据类型选用合适的算法包括K-Means、K-Modes和K-Prototypes算法。
5.根据权利要求3所述的一种基于数据挖掘的区域广告推送系统,其特征在于:所述S2中结合三角不等式加速算法的收敛,对脱敏数据进行聚类分析,并将聚类的结果和广告特征进行匹配的方法为:
S21、将广告中的属性直接分类,并把该类的属性作为算法的聚类中心;
S22、对采集到的数据集进行聚类分析,首先计算一个聚类中心到另一个聚类中心的距离,记为d;
S23、计算一个点到距离为d的两个聚类中心中其中一个聚类中心a的距离,记为l1
S24、判断与l1的关系,以及l1与l2的关系,用于确定该计算点的广告聚类特征属性;其中,l2为该计算点到另一个聚类中心b的距离,该计算点与用户数据相对应。
CN201710755699.6A 2017-08-29 2017-08-29 一种基于数据挖掘的区域广告推送系统 Pending CN107563807A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710755699.6A CN107563807A (zh) 2017-08-29 2017-08-29 一种基于数据挖掘的区域广告推送系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710755699.6A CN107563807A (zh) 2017-08-29 2017-08-29 一种基于数据挖掘的区域广告推送系统

Publications (1)

Publication Number Publication Date
CN107563807A true CN107563807A (zh) 2018-01-09

Family

ID=60977346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710755699.6A Pending CN107563807A (zh) 2017-08-29 2017-08-29 一种基于数据挖掘的区域广告推送系统

Country Status (1)

Country Link
CN (1) CN107563807A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175863A (zh) * 2019-04-18 2019-08-27 特斯联(北京)科技有限公司 一种基于大数据的个性化多用景区广告平台
CN110232600A (zh) * 2019-06-18 2019-09-13 浙江华坤道威数据科技有限公司 一种基于多源异构数据分析的大屏广告定向投放系统及方法
WO2019184502A1 (zh) * 2018-03-29 2019-10-03 上海掌门科技有限公司 一种基于用户性爱动作数据的广告推送方法、设备以及可读介质
CN110322270A (zh) * 2019-05-10 2019-10-11 福建微码信息科技有限公司 一种基于位置营销的广告推送系统
CN116205236A (zh) * 2023-05-06 2023-06-02 四川三合力通科技发展集团有限公司 基于实体命名识别的数据快速脱敏系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118706A (zh) * 2010-12-14 2011-07-06 北京星源无限传媒科技有限公司 一种基于手机广告用户细分的手机广告投放方法
CN103745383A (zh) * 2013-12-27 2014-04-23 北京集奥聚合科技有限公司 基于运营商数据实现重定向服务的方法和系统
CN105023175A (zh) * 2015-07-24 2015-11-04 金鹃传媒科技股份有限公司 一种基于消费者行为数据分析和分类技术的在线广告分类推送方法及其系统
CN105913342A (zh) * 2016-04-08 2016-08-31 上海旭薇物联网科技有限公司 一种基于大数据挖掘算法的智慧社区系统
CN106355442A (zh) * 2016-08-30 2017-01-25 杭州启冠网络技术有限公司 基于大数据驱动的在线广告精准投放方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118706A (zh) * 2010-12-14 2011-07-06 北京星源无限传媒科技有限公司 一种基于手机广告用户细分的手机广告投放方法
CN103745383A (zh) * 2013-12-27 2014-04-23 北京集奥聚合科技有限公司 基于运营商数据实现重定向服务的方法和系统
CN105023175A (zh) * 2015-07-24 2015-11-04 金鹃传媒科技股份有限公司 一种基于消费者行为数据分析和分类技术的在线广告分类推送方法及其系统
CN105913342A (zh) * 2016-04-08 2016-08-31 上海旭薇物联网科技有限公司 一种基于大数据挖掘算法的智慧社区系统
CN106355442A (zh) * 2016-08-30 2017-01-25 杭州启冠网络技术有限公司 基于大数据驱动的在线广告精准投放方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何春夏: "三角不等式原理对聚类算法的改进", 《中国优秀博硕士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019184502A1 (zh) * 2018-03-29 2019-10-03 上海掌门科技有限公司 一种基于用户性爱动作数据的广告推送方法、设备以及可读介质
CN110175863A (zh) * 2019-04-18 2019-08-27 特斯联(北京)科技有限公司 一种基于大数据的个性化多用景区广告平台
CN110175863B (zh) * 2019-04-18 2020-09-11 武汉特斯联智能工程有限公司 一种基于大数据的个性化多用景区广告平台
CN110322270A (zh) * 2019-05-10 2019-10-11 福建微码信息科技有限公司 一种基于位置营销的广告推送系统
CN110232600A (zh) * 2019-06-18 2019-09-13 浙江华坤道威数据科技有限公司 一种基于多源异构数据分析的大屏广告定向投放系统及方法
CN116205236A (zh) * 2023-05-06 2023-06-02 四川三合力通科技发展集团有限公司 基于实体命名识别的数据快速脱敏系统及方法
CN116205236B (zh) * 2023-05-06 2023-08-18 四川三合力通科技发展集团有限公司 基于实体命名识别的数据快速脱敏系统及方法

Similar Documents

Publication Publication Date Title
CN107563807A (zh) 一种基于数据挖掘的区域广告推送系统
CN104298719B (zh) 基于社交行为进行用户的类别划分、广告投放方法和系统
CN102033883B (zh) 一种提高网站数据传输速度的方法、装置及系统
CN101894134B (zh) 一种基于空间布局的钓鱼网页检测及其实现方法
CN106126582A (zh) 推荐方法及装置
CN108021929A (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN103955842B (zh) 一种面向大规模媒体数据的在线广告推荐系统及方法
CN108205766A (zh) 信息推送方法、装置及系统
CN106960006A (zh) 一种不同轨迹间相似度度量系统及其度量方法
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
CN106846061A (zh) 潜在用户挖掘方法以及装置
CN105389722A (zh) 恶意订单识别方法及装置
CN104035927A (zh) 一种基于用户行为的搜索方法及系统
CN103838754B (zh) 信息搜索装置及方法
CN103699594A (zh) 一种信息推送方法及系统
CN105447147A (zh) 一种数据处理方法及装置
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统
CN105303394A (zh) 一种基于网页搜索引擎的网络广告投放方法和系统
CN105160545A (zh) 投放信息样式确定方法及装置
CN112241489B (zh) 信息推送方法、装置、可读存储介质和计算机设备
CN106339891A (zh) 一种基于大数据采集的智能分析方法及系统
CN103440328B (zh) 一种基于鼠标行为的用户分类方法
CN102118711A (zh) 信息推送方法和信息推送装置
CN110675179A (zh) 营销信息处理方法、装置、电子设备及可读存储介质
CN105989077A (zh) 一种基于推荐的兴趣社区用户引导方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109