CN104899602A - 一种基于K-means算法的用户聚类分析系统 - Google Patents

一种基于K-means算法的用户聚类分析系统 Download PDF

Info

Publication number
CN104899602A
CN104899602A CN201510296227.XA CN201510296227A CN104899602A CN 104899602 A CN104899602 A CN 104899602A CN 201510296227 A CN201510296227 A CN 201510296227A CN 104899602 A CN104899602 A CN 104899602A
Authority
CN
China
Prior art keywords
user
analysis
tourist
dining
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510296227.XA
Other languages
English (en)
Inventor
陈勇
胡中骥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Science And Technology Co Ltd Is Swum In Jiangsu At Once
Original Assignee
Science And Technology Co Ltd Is Swum In Jiangsu At Once
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Science And Technology Co Ltd Is Swum In Jiangsu At Once filed Critical Science And Technology Co Ltd Is Swum In Jiangsu At Once
Priority to CN201510296227.XA priority Critical patent/CN104899602A/zh
Publication of CN104899602A publication Critical patent/CN104899602A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于K-means算法的用户聚类分析系统,旅游用户用餐偏好分析,通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况;旅游用户住宿偏好分析,通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐;旅游用户消费偏好分析,通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。本发明可以实现对旅游用户的喜好的聚类分析,建立旅游消费行为的用户画像,进行精细化营销。

Description

一种基于K-means算法的用户聚类分析系统
技术领域
本发明涉及一种聚类分析技术领域,特别是涉及一种基于K-means算法的用户聚类分析系统。
背景技术
自IBM公司于2008年提出“智慧地球”概念以来,作为其中的一个重要部分——“智慧旅游”引起了国内广泛的关注。之后国家政策的扶持以及互联网的发展,使得新兴的在线旅游市场发展势头迅猛。根据劲旅咨询最新发布《2013年中国在线旅游市场研究报告》,2013年中国旅游市场总交易额约为29475亿元,其中在线旅行市场交易额约为2522亿元,中国旅游市场在线渗透率为8.6%。
人们面对着大量的数据,却往往无法找到需要的信息,信息爆炸使得如何有效地利用和处理大量的数据成为当今世界共同关心的问题。随着数据库技术、人工智能、数理统计和云计算等技术的发展,数据挖掘技术在各行各业得到了迅速应用。
从技术角度来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中人们事先不知道但又是潜在有用的信息和知识的过程;从商业角度来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取有利于商业决策的关键信息和知识。
随着智能终端的普及、在线旅游市场的发展和旅游监管部门及景区的信息化,监管部门、景区和其它机构积攒了大量的数据,为数据挖掘技术的引入提供了充分的条件。
目前的旅游信息管理系统在基础数据统计、监测方面发挥了重要作用,却并未实现对隐藏知识的充分挖掘;从海量的数据中进行用户聚类分析,挖掘其中蕴含的巨大价值,成为目前亟待解决的问题之一。数据挖掘技术在旅游市场的应用,将使得现代旅游成为充满便捷、人性化、以及蕴含巨大经济市场的智慧旅游。
发明内容
本发明的目的是为了提升对具体旅游数据进行有效挖掘的能力,提供一种基于K-means算法的用户聚类分析系统。
本发明所采用的技术方案是:
本发明通过实时数据采集、实时分析技术,实时统计分析用户喜好,通过归属省份的分析,分析旅游用户的来源地特征,并基于用户特征数据,通过多维度的聚类,建立旅游消费行为的用户画像,进行精细化的营销。
1)旅游用户用餐偏好分析
通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况。
2)旅游用户住宿偏好分析
通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐。
3)旅游用户消费偏好分析
通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
基于K-means算法的用户聚类分析方法,
a、随机选取K个数据作为中心点,
b、然后计算每一个样本i与中心点的距离,选取最小的目标中心点即为所属的类,
c、对应每一个类,重新计算中心(该类别中所有样本的均值),
d、重复迭代b、c步骤直至收敛,即聚类中心不再变化。
本发明的有益效果是,
基于K-means算法的用户聚类分析系统,可以实现对旅游用户的喜好的聚类分析,建立旅游消费行为的用户画像,进行精细化营销。
具体实施方式
为了加深对本发明的理解,下面结合实施例对本发明作进一步详细的说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的具体实施例是,
本发明通过实时数据采集、实时分析技术,实时统计分析用户喜好,通过归属省份的分析,分析旅游用户的来源地特征,并基于用户特征数据,通过多维度的聚类,建立旅游消费行为的用户画像,进行精细化的营销。
1)旅游用户用餐偏好分析
通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况。
2)旅游用户住宿偏好分析
通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐。
3)旅游用户消费偏好分析
通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
基于K-means算法的用户聚类分析方法,
a、随机选取K个数据作为中心点,
b、然后计算每一个样本i与中心点的距离,选取最小的目标中心点即为所属的类,
c、对应每一个类,重新计算中心(该类别中所有样本的均值),
d、重复迭代b、c步骤直至收敛,即聚类中心不再变化。
要说明的是,以上所述实施例是对本发明技术方案的说明而非限制,所属技术领域普通技术人员的等同替换或者根据现有技术而做的其他修改,只要没超出本发明技术方案的思路和范围,均应包含在本发明所要求的权利范围之内。

Claims (1)

1.一种基于K-means算法的用户聚类分析系统,其特征在于:包括
旅游用户用餐偏好分析
通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况;
旅游用户住宿偏好分析
通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐;
旅游用户消费偏好分析
通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
CN201510296227.XA 2015-06-03 2015-06-03 一种基于K-means算法的用户聚类分析系统 Pending CN104899602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510296227.XA CN104899602A (zh) 2015-06-03 2015-06-03 一种基于K-means算法的用户聚类分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510296227.XA CN104899602A (zh) 2015-06-03 2015-06-03 一种基于K-means算法的用户聚类分析系统

Publications (1)

Publication Number Publication Date
CN104899602A true CN104899602A (zh) 2015-09-09

Family

ID=54032256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510296227.XA Pending CN104899602A (zh) 2015-06-03 2015-06-03 一种基于K-means算法的用户聚类分析系统

Country Status (1)

Country Link
CN (1) CN104899602A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092629A (zh) * 2017-01-18 2017-08-25 北京小度信息科技有限公司 推荐方法及装置
CN108268898A (zh) * 2018-01-19 2018-07-10 大象慧云信息技术有限公司 一种基于K-Means的电子发票用户聚类方法
CN109002549A (zh) * 2018-07-31 2018-12-14 国政通科技有限公司 一种精准命中高端旅游潜在用户的方法及装置
CN109785007A (zh) * 2019-01-24 2019-05-21 博拉网络股份有限公司 电商后台数据分析算法
CN109933583A (zh) * 2019-03-25 2019-06-25 山东浪潮云信息技术有限公司 一种客流统计及客群画像分析方法及系统
CN110163431A (zh) * 2019-05-13 2019-08-23 中船第九设计研究院工程有限公司 一种基于机器学习的邮轮游客需求预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092629A (zh) * 2017-01-18 2017-08-25 北京小度信息科技有限公司 推荐方法及装置
CN108268898A (zh) * 2018-01-19 2018-07-10 大象慧云信息技术有限公司 一种基于K-Means的电子发票用户聚类方法
CN109002549A (zh) * 2018-07-31 2018-12-14 国政通科技有限公司 一种精准命中高端旅游潜在用户的方法及装置
CN109785007A (zh) * 2019-01-24 2019-05-21 博拉网络股份有限公司 电商后台数据分析算法
CN109933583A (zh) * 2019-03-25 2019-06-25 山东浪潮云信息技术有限公司 一种客流统计及客群画像分析方法及系统
CN110163431A (zh) * 2019-05-13 2019-08-23 中船第九设计研究院工程有限公司 一种基于机器学习的邮轮游客需求预测方法
CN110163431B (zh) * 2019-05-13 2023-04-18 中船第九设计研究院工程有限公司 一种基于机器学习的邮轮游客需求预测方法

Similar Documents

Publication Publication Date Title
CN104899602A (zh) 一种基于K-means算法的用户聚类分析系统
CN109525595B (zh) 一种基于时间流特征的黑产账号识别方法及设备
CN103714139B (zh) 一种移动海量客户群识别的并行数据挖掘方法
CN107730389A (zh) 电子装置、保险产品推荐方法及计算机可读存储介质
CN109409677A (zh) 企业信用风险评估方法、装置、设备及存储介质
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及系统
CN107391582B (zh) 基于上下文本体树计算用户偏好相似度的信息推荐方法
CN104915334A (zh) 一种基于语义分析的招投标项目关键信息自动化提取方法
CN111325619A (zh) 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
CN113449046A (zh) 基于企业知识图谱的模型训练方法、系统及相关装置
CN106776859A (zh) 基于用户偏好的移动应用App推荐系统
CN106294676B (zh) 一种电子商务政务系统的数据检索方法
CN111782611B (zh) 预测模型建模方法、装置、设备及存储介质
CN111191099A (zh) 一种基于社交媒体的用户活动类型识别方法
CN111695019A (zh) 一种识别关联账号的方法及装置
CN106844588A (zh) 一种基于网络爬虫的用户行为数据的分析方法及系统
CN104866490B (zh) 一种视频智能推荐方法及其系统
Shen et al. Concerned or Apathetic? Exploring online public opinions on climate change from 2008 to 2019: A Comparative study between China and other G20 countries
CN101094481A (zh) 数据分析和挖掘系统与操作型crm系统的互动支撑方法
Domagala Internet of Things and Big Data technologises as an opportunity for organizations based on Knowledge Management
CN107945034A (zh) 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质
CN114417974B (zh) 模型训练方法、信息处理方法、装置、电子设备和介质
CN109828995A (zh) 一种基于视觉特征的图数据检测方法、系统
CN113010754B (zh) 目标行为识别系统
CN104156618A (zh) 基于地图的经济数据自动分析系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150909

WD01 Invention patent application deemed withdrawn after publication