CN116127342A - 一种基于酒店的信息聚类处理方法、系统及平台 - Google Patents

一种基于酒店的信息聚类处理方法、系统及平台 Download PDF

Info

Publication number
CN116127342A
CN116127342A CN202310346989.0A CN202310346989A CN116127342A CN 116127342 A CN116127342 A CN 116127342A CN 202310346989 A CN202310346989 A CN 202310346989A CN 116127342 A CN116127342 A CN 116127342A
Authority
CN
China
Prior art keywords
data
hotel
information
cluster
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310346989.0A
Other languages
English (en)
Other versions
CN116127342B (zh
Inventor
唐波
袁斌
王亮
陈培生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhulv Group Co.,Ltd.
Original Assignee
Guangzhou Travel Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Travel Information Technology Co ltd filed Critical Guangzhou Travel Information Technology Co ltd
Priority to CN202310346989.0A priority Critical patent/CN116127342B/zh
Publication of CN116127342A publication Critical patent/CN116127342A/zh
Application granted granted Critical
Publication of CN116127342B publication Critical patent/CN116127342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及酒店数据处理技术领域,具体公开了一种基于酒店的信息聚类处理方法、系统及平台,所述方法包括获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。本发明实现了酒店按不同维度分群,不同的分组可再次组合,按序排列,满足了各业务场景如:影视版面内容智能推送,营销活动精准推送,也可支持入住酒店推荐;按照不同业务场景,组装不同组合的群体酒店,可满足各种酒店信息推送业务场景获取对应酒店数据需求。

Description

一种基于酒店的信息聚类处理方法、系统及平台
技术领域
本发明涉及酒店数据处理技术领域,具体是一种基于酒店的信息聚类处理方法、系统及平台。
背景技术
现目前,合作酒店日益增多,酒店群体属性的业务场景使用越来越多元化,针对酒店不同维度属性分群,成为一些业务场景下必不可少的诉求。
但是,目前大多数酒店无法实现酒店分群数据化,酒店分群数据化指的是针对不同维度的数据进行分群,其要求为,分群后的子分组可自由组合,分群维度必须是可扩展的,以及分组的模型是可组合配置的;其中,不同维度的数据包括终端设备开机、活跃、付费、营收以及酒店合作时间等等。需要说明的是,最终的酒店群组中酒店需要满足唯一性,也就是所有数据均指向同一个酒店。
因此,针对以上无法实现的技术问题缺陷,急需设计和开发一种基于酒店的信息聚类处理方法、系统、平台及存储介质。
发明内容
本发明的目的在于提供一种基于酒店的信息聚类处理方法、系统及平台,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于酒店的信息聚类处理方法,所述方法包括:
获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
作为本发明进一步的方案:所述获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集的步骤包括:
接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
作为本发明进一步的方案:所述接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据的步骤包括:
接收用户输入的空间范围,获取空间范围内的各时刻的酒店数据信息;
以空间范围为基准,预设的数值为步长确定虚拟范围;
获取虚拟范围内的酒店数据信息,作为辅助信息;
计算辅助信息与空间范围内的酒店数据信息之间的差异量,根据所述差异量选取虚拟范围;
显示选取的虚拟范围对应的辅助信息,接收用户输入的确认信息,得到目标数据。
作为本发明进一步的方案:所述根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇的步骤包括:
读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
统计所述数据距离,得到距离矩阵;
遍历所述距离矩阵,实时生成簇关系数据。
作为本发明进一步的方案:所述遍历所述距离矩阵,实时生成簇关系数据的步骤包括:
遍历距离矩阵,实时生成簇间最小距离第一簇关系数据;
根据第一簇关系数据,生成与第一簇相应的编号;
合并距离最小距离且带有编号的第一簇,并生成第二簇数据;
根据预设的簇距离度量模型,实时更新第二簇间的距离。
作为本发明进一步的方案:所述根据预设的簇距离度量模型,实时更新第二簇间的距离的步骤包括:
删除第二簇数据对应的行和列,并将更新后的距离向量插入距离矩阵中。
本发明技术方案还提供了一种基于酒店的信息聚类处理系统,所述系统包括:
数据集建立模块,用于获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
数据聚类模块,用于根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
映射建立模块,用于实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
匹配显示模块,用于当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
作为本发明进一步的方案:所述数据集建立模块包括:
数据量计算单元,用于接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
时间扩充单元,用于根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
空间扩充单元,用于接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
数据统计单元,用于统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
作为本发明进一步的方案:所述数据聚类模块包括:
簇数据生成单元,用于读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
距离计算单元,用于将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
距离矩阵生成单元,用于统计所述数据距离,得到距离矩阵;
关系数据生成单元,用于遍历所述距离矩阵,实时生成簇关系数据。
本发明技术方案还提供了一种基于酒店的信息聚类处理平台,所述平台包括处理器、存储器以及基于酒店的信息聚类处理平台控制程序;
其中,在所述的处理器执行所述的基于酒店的信息聚类处理平台控制程序,所述的基于酒店的信息聚类处理平台控制程序被存储在所述存储器中,所述的基于酒店的信息聚类处理平台控制程序,实现所述的基于酒店的信息聚类处理方法。
与现有技术相比,本发明的有益效果是:本发明通过获取设定区域内现存与酒店相应数据信息,并生成与所述数据信息相应的数据集;根据生成的数据集,划分成至少两个数据信息相近的簇,并聚类处理所述数据信息相近的簇;生成满足酒店相应特定业务需求的簇,并推送与满足特定业务需求簇相应的数据信息,以及与所述方法相应的系统、平台及存储介质;实现了酒店按不同维度分群,不同的分组可再次组合,按序排列,满足了各业务场景如:影视版面内容智能推送,营销活动精准推送,也可支持入住酒店推荐;按照不同业务场景,组装不同组合的群体酒店,可满足各种酒店信息推送业务场景获取对应酒店数据需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为一种基于酒店的信息聚类处理方法的流程示意图;
图2为一种基于酒店的信息聚类处理方法的第一子流程示意图;
图3为一种基于酒店的信息聚类处理方法的第二流程示意图;
图4为一种基于酒店的信息聚类处理系统的组成结构框图;
图5为一种基于酒店的信息聚类处理平台架构示意图;
图6为一种实施例中计算机可读取存储介质架构示意图;
图7为一种基于酒店的信息聚类处理方法之具体实施例流程示意图;
图8为一种基于酒店的信息聚类处理方法之具体实施例层次聚类效果示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。其次,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
优选地,本发明一种基于酒店的信息聚类处理方法应用在一个或者多个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
图1为一种基于酒店的信息聚类处理方法的流程示意图,本发明实施例中,一种基于酒店的信息聚类处理方法,所述方法包括:
步骤S100:获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
步骤S200:根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
步骤S300:实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
步骤S400:当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
在本实施例中,所述基于酒店的信息聚类处理方法,可以应用于具备显示功能的终端或者固定终端中,所述终端并不限定于个人电脑、智能手机、平板电脑、安装有摄像头的台式机或一体机等。
所述基于酒店的信息聚类处理方法也可以应用于由终端和通过网络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于:广域网、城域网或局域网。本发明实施例的基于酒店的信息聚类处理方法可以由服务器来执行,也可以由终端来执行,还可以是由服务器和终端共同执行。
例如,对于需要进行基于酒店的信息聚类处理终端,可以直接在终端上集成本发明的方法所提供的基于酒店的信息聚类处理功能,或者安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以软件开发工具包(Software Development Kit,SDK)的形式运行在服务器等设备上,以SDK的形式提供基于酒店的信息聚类处理功能的接口,终端或其他设备通过所提供的接口即可实现基于酒店的信息聚类处理功能。
需要说明的是,本发明技术方案涉及到聚类算法,具体地,在本发明技术方案的一个实施例中,本发明使用层次聚类算法(hierarchical clustering)将酒店不同维度数据集划分为一层一层的簇(cluster),后面一层生成的簇基于前面一层的结果,最终输出酒店分类结果。
层次聚类算法一般分为两类:凝聚的(Agglomerative)层次聚类:又称自底向上(bottom-up)的层次聚类,每一个对象最开始都是一个簇,每次按一定的准则将最相近的两个簇合并生成一个新的簇,如此往复,直至最终所有的对象都属于一个簇。这里主要关注此类算法。
分裂的(Divisive)层次聚类:又称自顶向下(top-down)的层次聚类,最开始所有的对象均属于一个簇,每次按一定的准则将某个簇划分为多个簇,如此往复,直至每个对象均是一个簇。
层次聚类算法是一种贪心算法(greedy algorithm),因其每一次合并或划分都是基于某种局部最优的选择。
图2为一种基于酒店的信息聚类处理方法的第一子流程示意图,所述获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集的步骤包括:
步骤S101:接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
步骤S102:根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
步骤S103:接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
步骤S104:统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
上述内容对数据集的建立过程进行了具体的限定,数据集是一段时间内某一区域对应的数据,因此,它有两个参数,一是时间跨度,二是空间跨度,所述时间跨度与所述空间跨度均由工作人员输入,工作人员输入时间范围和空间范围后,系统会根据数据量对时间范围及空间范围进行自适应调整,比如,对于时间范围,如果一段时间内的数据量一直比较高,那么系统便会提示用户扩大时间范围,从而获取更多的数据,直至出现明显的数据量分界线(数据量明显增多或明显减少)。
时间范围确定后,结合工作人员输入的空间范围,即可获取到待处理的数据,进而建立数据集。
作为本发明技术方案的一个优选实施例,所述接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据的步骤包括:
接收用户输入的空间范围,获取空间范围内的各时刻的酒店数据信息;
以空间范围为基准,预设的数值为步长确定虚拟范围;
获取虚拟范围内的酒店数据信息,作为辅助信息;
计算辅助信息与空间范围内的酒店数据信息之间的差异量,根据所述差异量选取虚拟范围;
显示选取的虚拟范围对应的辅助信息,接收用户输入的确认信息,得到目标数据。
上述内容对空间范围的扩充过程进行了限定,其原理为,根据用户输入的空间范围,确定一些同心范围,在同心范围内查询酒店数据信息,作为辅助信息;当辅助信息生成后,会向工作人员展示,此时,由工作人员确定最终的空间范围。
需要说明的是,无论是时间范围还是空间范围,最终确定方都是工作人员。
图3为一种基于酒店的信息聚类处理方法的第二流程示意图,所述根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇的步骤包括:
步骤S201:读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
步骤S202:将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
步骤S203:统计所述数据距离,得到距离矩阵;
步骤S204:遍历所述距离矩阵,实时生成簇关系数据。
作为本发明技术方案的一个优选实施例,所述遍历所述距离矩阵,实时生成簇关系数据的步骤包括:
遍历距离矩阵,实时生成簇间最小距离第一簇关系数据;
根据第一簇关系数据,生成与第一簇相应的编号;
合并距离最小距离且带有编号的第一簇,并生成第二簇数据;
根据预设的簇距离度量模型,实时更新第二簇间的距离。
在本发明技术方案的一个实施中,所述根据预设的簇距离度量模型,实时更新第二簇间的距离的步骤包括:
删除第二簇数据对应的行和列,并将更新后的距离向量插入距离矩阵中。
在本发明技术方案的一个实施例中,提供了一种具体的聚类过程,如下:
给定数据集X={x(1),x(2),...,x(n)},x(1)到x(n)代表了酒店的不同维度,例如设备开机、活跃、付费、营收以及酒店合作时间,凝聚的层次聚类最简单的实现方法分为以下几步:
1、初始时每个酒店维度为一个簇,计算距离矩阵D,其中元整Dij为样本点Di和Dj之间的距离;
2、遍历距离矩阵D,找出其中的最小距离(对角线上的除外),并由此得到拥有最小距离的两个簇的编号,将这两个簇合并为一个新的簇并依据簇距离度量方法更新距离矩阵D (删除这两个簇对应的行和列,并把由新簇所算出来的距离向量插入D中),存储本次合并的相关信息;
3、重复2的过程,直至最终只剩下一个簇。
具体如图7和图8所示,图中分别使用了层次聚类中4个不同的簇度量方法,可以看到,使用简单连接法确实会造成一定的链式效应,而使用完全连接法则完全不会产生这种现象,使用平均连接法和方差平方和连接法则介于两者之间。
图4为一种基于酒店的信息聚类处理系统的组成结构框图,本发明实施例中,提供了一种基于酒店的信息聚类处理系统,所述系统10包括:
数据集建立模块11,用于获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
数据聚类模块12,用于根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
映射建立模块13,用于实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
匹配显示模块14,用于当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
所述数据集建立模块11包括:
数据量计算单元,用于接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
时间扩充单元,用于根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
空间扩充单元,用于接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
数据统计单元,用于统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
所述数据聚类模块12包括:
簇数据生成单元,用于读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
距离计算单元,用于将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
距离矩阵生成单元,用于统计所述数据距离,得到距离矩阵;
关系数据生成单元,用于遍历所述距离矩阵,实时生成簇关系数据。
如图5所示,作为本发明技术方案的一个优选实施例,提供了一种基于酒店的信息聚类处理平台,所述的基于酒店的信息聚类处理平台内置处理器,可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器利用各种接口和线路连接取各个部件,通过运行或执行存储在存储器内的程序或者单元,以及调用存储在存储器内的数据,以执行基于酒店的信息聚类处理各种功能和处理数据;
存储器用于存储程序代码和各种数据,安装在基于酒店的信息聚类处理平台中,并在运行过程中实现高速、自动地完成程序或数据的存取。
所述存储器包括只读存储器(Read-Only Memory,ROM),随机存储器(RandomAccess Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
请参阅图6,为实现上述目的,本发明还提供一种计算机可读取存储介质,所述计算机可读取存储介质存储有基于酒店的信息聚类处理平台控制程序,所述的基于酒店的信息聚类处理平台控制程序,实现所述的基于酒店的信息聚类处理方法步骤。
在本发明的实施方式的描述中,需要说明的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读取介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。
另外,计算机可读取介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
在本发明实施例中,为实现上述目的,本发明还提供一种芯片系统,所述芯片系统包括至少一个处理器,当程序指令在所述至少一个处理器中执行时,使得所述芯片系统执行所述的基于酒店的信息聚类处理方法步骤。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明通过方法获取设定区域内现存与酒店相应数据信息,并生成与所述数据信息相应的数据集;根据生成的数据集,划分成至少两个数据信息相近的簇,并聚类处理所述数据信息相近的簇;生成满足酒店相应特定业务需求的簇,并推送与满足特定业务需求簇相应的数据信息,以及与所述方法相应的系统、平台及存储介质;实现了酒店按不同维度分群,不同的分组可再次组合,按序排列,满足了各业务场景如:影视版面内容智能推送,营销活动精准推送,也可支持入住酒店推荐;按照不同业务场景,组装不同组合的群体酒店,可满足各种酒店信息推送业务场景获取对应酒店数据需求。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于酒店的信息聚类处理方法,其特征在于,所述方法包括:
获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
2.根据权利要求1所述的基于酒店的信息聚类处理方法,其特征在于,所述获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集的步骤包括:
接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
3.根据权利要求2所述的基于酒店的信息聚类处理方法,其特征在于,所述接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据的步骤包括:
接收用户输入的空间范围,获取空间范围内的各时刻的酒店数据信息;
以空间范围为基准,预设的数值为步长确定虚拟范围;
获取虚拟范围内的酒店数据信息,作为辅助信息;
计算辅助信息与空间范围内的酒店数据信息之间的差异量,根据所述差异量选取虚拟范围;
显示选取的虚拟范围对应的辅助信息,接收用户输入的确认信息,得到目标数据。
4.根据权利要求1所述的基于酒店的信息聚类处理方法,其特征在于,所述根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇的步骤包括:
读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
统计所述数据距离,得到距离矩阵;
遍历所述距离矩阵,实时生成簇关系数据。
5.根据权利要求4所述的基于酒店的信息聚类处理方法,其特征在于,所述遍历所述距离矩阵,实时生成簇关系数据的步骤包括:
遍历距离矩阵,实时生成簇间最小距离第一簇关系数据;
根据第一簇关系数据,生成与第一簇相应的编号;
合并距离最小距离且带有编号的第一簇,并生成第二簇数据;
根据预设的簇距离度量模型,实时更新第二簇间的距离。
6.根据权利要求5所述的基于酒店的信息聚类处理方法,其特征在于,所述根据预设的簇距离度量模型,实时更新第二簇间的距离的步骤包括:
删除第二簇数据对应的行和列,并将更新后的距离向量插入距离矩阵中。
7.一种基于酒店的信息聚类处理系统,其特征在于,所述系统包括:
数据集建立模块,用于获取设定区域内的酒店数据信息,根据所述酒店数据信息建立数据集;所述设定区域包含时间范围和空间范围;
数据聚类模块,用于根据预设的划分规则对数据集进行数据聚类,得到含有划分标签的簇;
映射建立模块,用于实时获取历史需求记录,建立所述历史需求记录与含有划分标签的簇的映射关系;
匹配显示模块,用于当接收到新的需求信息时,基于所述映射关系匹配并显示对应的簇。
8.根据权利要求7所述的基于酒店的信息聚类处理系统,其特征在于,所述数据集建立模块包括:
数据量计算单元,用于接收用户输入的时间范围,根据预设的采集频率获取各时刻的酒店数据信息,并计算数据量;
时间扩充单元,用于根据所述数据量对时间范围进行扩充,并接收用户输入的确认信息;
空间扩充单元,用于接收用户输入的空间范围,根据所述空间范围对各时刻的酒店数据信息进行筛选,得到目标数据;
数据统计单元,用于统计所述目标数据,得到数据集;
其中,所述酒店数据信息包括酒店设备开机、酒店网络活跃度、酒店付费、酒店营收以及酒店合作时间数据;不同数据对应不同的数据集。
9.根据权利要求7所述的基于酒店的信息聚类处理系统,其特征在于,所述数据聚类模块包括:
簇数据生成单元,用于读取建立好的数据集,以至少一个酒店维度为单位生成第一簇数据;所述酒店维度用于表征数据的类型;
距离计算单元,用于将所述第一簇数据输入预设的距离计算模型,得到各数据间的数据距离;所述数据距离用于表征各数据间的差异程度;
距离矩阵生成单元,用于统计所述数据距离,得到距离矩阵;
关系数据生成单元,用于遍历所述距离矩阵,实时生成簇关系数据。
10.一种基于酒店的信息聚类处理平台,其特征在于,所述平台包括处理器、存储器以及基于酒店的信息聚类处理平台控制程序;
其中,在所述的处理器执行所述的基于酒店的信息聚类处理平台控制程序,所述的基于酒店的信息聚类处理平台控制程序被存储在所述存储器中,所述的基于酒店的信息聚类处理平台控制程序,实现如权利要求1至6中任一项所述的基于酒店的信息聚类处理方法。
CN202310346989.0A 2023-04-04 2023-04-04 一种基于酒店的信息聚类处理方法、系统及平台 Active CN116127342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310346989.0A CN116127342B (zh) 2023-04-04 2023-04-04 一种基于酒店的信息聚类处理方法、系统及平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310346989.0A CN116127342B (zh) 2023-04-04 2023-04-04 一种基于酒店的信息聚类处理方法、系统及平台

Publications (2)

Publication Number Publication Date
CN116127342A true CN116127342A (zh) 2023-05-16
CN116127342B CN116127342B (zh) 2023-07-18

Family

ID=86295845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310346989.0A Active CN116127342B (zh) 2023-04-04 2023-04-04 一种基于酒店的信息聚类处理方法、系统及平台

Country Status (1)

Country Link
CN (1) CN116127342B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399916A (zh) * 2013-07-31 2013-11-20 清华大学 基于产品特征的互联网评论观点挖掘方法及系统
CN104537029A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 查询处理方法及装置
CN104809141A (zh) * 2014-01-29 2015-07-29 携程计算机技术(上海)有限公司 酒店数据的匹配系统及方法
CN107291939A (zh) * 2017-07-06 2017-10-24 携程计算机技术(上海)有限公司 酒店信息的聚类匹配方法及系统
CN108364088A (zh) * 2018-01-24 2018-08-03 北京穷游天下科技发展有限公司 旅游行程的优化方法和电子设备
CN109242606A (zh) * 2018-08-16 2019-01-18 浙江口碑网络技术有限公司 基于地理位置的门店推荐方法以及装置
CN109428929A (zh) * 2017-08-31 2019-03-05 阿里巴巴集团控股有限公司 目标对象的位置信息的确定方法、服务器及用户客户端
US10531226B1 (en) * 2015-07-10 2020-01-07 WeWork Companies Inc. Determining qualified devices using zone information
CN110866790A (zh) * 2019-11-26 2020-03-06 上海景域文化传播股份有限公司 一种景点门票销量预测系统及方法
CN113011618A (zh) * 2019-12-21 2021-06-22 上海鸿鹊信息科技有限公司 一种酒店收益管理系统及方法
US20210304084A1 (en) * 2018-08-20 2021-09-30 Rose Angela MARAZITA Lounge chair reservation system and destination recommendation system
CN114090634A (zh) * 2021-11-27 2022-02-25 北京奇天大胜网络科技有限公司 一种基于数据仓库的酒店数据管理方法及装置
CN114943462A (zh) * 2022-06-02 2022-08-26 上海华客信息科技有限公司 酒店群数据处理方法、系统、设备及存储介质
CN114942993A (zh) * 2022-06-02 2022-08-26 上海华客信息科技有限公司 酒店评价指标获取方法、系统、设备及存储介质
CN114969113A (zh) * 2022-04-22 2022-08-30 远光软件股份有限公司 信息搜索方法、装置、存储介质及服务器

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399916A (zh) * 2013-07-31 2013-11-20 清华大学 基于产品特征的互联网评论观点挖掘方法及系统
CN104809141A (zh) * 2014-01-29 2015-07-29 携程计算机技术(上海)有限公司 酒店数据的匹配系统及方法
CN104537029A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 查询处理方法及装置
US10531226B1 (en) * 2015-07-10 2020-01-07 WeWork Companies Inc. Determining qualified devices using zone information
CN107291939A (zh) * 2017-07-06 2017-10-24 携程计算机技术(上海)有限公司 酒店信息的聚类匹配方法及系统
CN109428929A (zh) * 2017-08-31 2019-03-05 阿里巴巴集团控股有限公司 目标对象的位置信息的确定方法、服务器及用户客户端
CN108364088A (zh) * 2018-01-24 2018-08-03 北京穷游天下科技发展有限公司 旅游行程的优化方法和电子设备
CN109242606A (zh) * 2018-08-16 2019-01-18 浙江口碑网络技术有限公司 基于地理位置的门店推荐方法以及装置
US20210304084A1 (en) * 2018-08-20 2021-09-30 Rose Angela MARAZITA Lounge chair reservation system and destination recommendation system
CN110866790A (zh) * 2019-11-26 2020-03-06 上海景域文化传播股份有限公司 一种景点门票销量预测系统及方法
CN113011618A (zh) * 2019-12-21 2021-06-22 上海鸿鹊信息科技有限公司 一种酒店收益管理系统及方法
CN114090634A (zh) * 2021-11-27 2022-02-25 北京奇天大胜网络科技有限公司 一种基于数据仓库的酒店数据管理方法及装置
CN114969113A (zh) * 2022-04-22 2022-08-30 远光软件股份有限公司 信息搜索方法、装置、存储介质及服务器
CN114943462A (zh) * 2022-06-02 2022-08-26 上海华客信息科技有限公司 酒店群数据处理方法、系统、设备及存储介质
CN114942993A (zh) * 2022-06-02 2022-08-26 上海华客信息科技有限公司 酒店评价指标获取方法、系统、设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GRAZIANO ABRATE 等: "Strategic and tactical price decisions in hotel revenue management", 《TOURISM MANAGEMENT JOURNAL》, pages 123 - 132 *
HAO REN 等: "Efficient Privacy-Preserving Circular Range Search on Outsourced Spatial Data", 《IEEE ICC 2016 COMMUNICATION AND INFORMATION SYSTEMS SECURITY SYMPOSIUM》, pages 1 - 7 *
娄小丰: "基于多属性打分的酒店推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 1257 *
李致磊: "基于 K 均值聚类分析的星级饭店区域发展水平实证研究", 《经济研究导刊》, no. 15, pages 21 - 23 *
石梅华: "基于层次聚类分析的中国大陆地区星级饭店分类初探", 《教育教学论坛》, no. 45, pages 62 - 63 *

Also Published As

Publication number Publication date
CN116127342B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN111427971B (zh) 用于计算机系统的业务建模方法、装置、系统和介质
CN110750654A (zh) 知识图谱获取方法、装置、设备和介质
CN113282795B (zh) 数据结构图生成及更新方法、装置、电子设备及存储介质
CN111967467A (zh) 图像目标检测方法、装置、电子设备和计算机可读介质
CN109345166B (zh) 用于生成信息的方法和装置
WO2015038444A2 (en) Strength based modeling for recommendation system
CN109981311B (zh) 图布局的实现方法及装置
CN113393553A (zh) 生成流程图的方法、装置和电子设备
CN114219023A (zh) 数据聚类方法、装置、电子设备及可读存储介质
CN116594683A (zh) 一种代码注释信息生成方法、装置、设备及存储介质
CN111415168B (zh) 一种交易告警的方法和装置
CN116127342B (zh) 一种基于酒店的信息聚类处理方法、系统及平台
CN111597256A (zh) 一种交易异步处理方法
CN111049988A (zh) 移动设备的亲密度预测方法、系统、设备及存储介质
CN113515332B (zh) 一种数据生成方法、装置、设备及存储介质
CN112506976B (zh) 数据流向的展示方法、装置、电子设备及存储介质
US9129318B2 (en) System and method for allocating suppliers using geographical information system and supplier capability
US20230049322A1 (en) Information processing method, device, system, and computer-readable storage medium
CN113762864A (zh) 一种物流站点的选址方法和装置
CN113869455A (zh) 无监督聚类方法、装置、电子设备及介质
CN112508284A (zh) 展示物料预处理方法、投放方法、系统、装置与设备
US10891664B2 (en) System and method for facilitating non-parametric weighted correlation analysis
CN109634827A (zh) 用于生成信息的方法和装置
CN113760521B (zh) 一种虚拟资源的分配方法和装置
CN114429510B (zh) 漏斗图生成方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 303, 203 Kezhu Road, Guangzhou High tech Industrial Development Zone, Guangzhou, Guangdong Province, 510000

Patentee after: Guangzhou Zhulv Group Co.,Ltd.

Country or region after: China

Address before: 303, 203 Kezhu Road, Guangzhou High tech Industrial Development Zone, Guangzhou, Guangdong Province, 510000

Patentee before: Guangzhou Travel Information Technology Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A hotel based information clustering processing method, system, and platform

Granted publication date: 20230718

Pledgee: Industrial and Commercial Bank of China Limited Guangzhou Wuyang sub branch

Pledgor: Guangzhou Zhulv Group Co.,Ltd.

Registration number: Y2024980031922

PE01 Entry into force of the registration of the contract for pledge of patent right