CN113628003A - 酒店匹配方法、系统、终端及存储介质 - Google Patents
酒店匹配方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN113628003A CN113628003A CN202110832389.6A CN202110832389A CN113628003A CN 113628003 A CN113628003 A CN 113628003A CN 202110832389 A CN202110832389 A CN 202110832389A CN 113628003 A CN113628003 A CN 113628003A
- Authority
- CN
- China
- Prior art keywords
- hotel
- dimension
- matching
- data
- room
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013480 data collection Methods 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000007405 data analysis Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 8
- 230000008901 benefit Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 14
- 235000012054 meals Nutrition 0.000 description 13
- 230000011218 segmentation Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供酒店匹配方法、系统、终端及存储介质,收集并存储来自一或多个数据源的酒店数据;对所述酒店数据进行酒店主体维度和酒店房型维度的匹配;将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。本发明通过Logstash+Elasticsearch的方式大大提高了现有酒店匹配过程耗时长的问题,Logstash+Elasticsearch方式通过前期对数据的清洗并利用Elasticsearch对大数据检索的优势解决了在海量酒店匹配中的耗时问题。另外,通过前期数据清洗及多维度多权重等级的匹配方式提高了自动匹配的精准度问题,再配合人工审核及推荐酒店房型匹配功能可以很好的解决人工匹配错误率高,匹配难度大以及在数据不完整时导致自动匹配覆盖率低的问题。
Description
技术领域
本申请涉及OTA网站、酒店管理技术领域,特别是涉及酒店匹配方法、系统、终端及存储介质。
背景技术
酒店自动匹配是指将来自不同渠道不同平台的酒店通过多维度酒店属性和不同的权重比例建立起相互之间的映射关系,通过多渠道酒店聚合和比价来为酒店平台化销售提供基础。
现有的酒店匹配技术有如下不足之处:1)酒店及房型名称不一致导致匹配难度大且匹配错误率高;2)酒店地址信息不完整导致酒店匹配率低且错误率高;3)酒店属性信息不完整导致酒店匹配率低且错误率高;4)在海量酒店匹配时存在耗时长、难度大且错误率高的问题;5)人本成本高,匹配耗时长,匹配率低。
因此,本领域亟需一种匹配错误率低、人工成本低、匹配耗时短的酒店智能匹配方案。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供酒店匹配方法、系统、终端及存储介质,用于解决现有的酒店智能匹配方案匹配错误率高、人工成本高、匹配耗时长。
为实现上述目的及其他相关目的,本申请的第一方面提供一种酒店匹配方法,包括:收集并存储来自一或多个数据源的酒店数据;对所述酒店数据进行酒店主体维度和酒店房型维度的匹配;将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
于本申请的第一方面的一些实施例中,所述收集一或多个数据源的酒店数据并存至搜索与数据分析引擎包括:利用数据收集引擎从供应商和目标平台收集酒店数据,并存储至搜索与数据分析引擎中;所述数据收集引擎包括Logstash引擎,所述搜索与数据分析引擎包括ElasticSearch引擎。
于本申请的第一方面的一些实施例中,对所述酒店数据进行酒店主体维度的匹配包括:利用酒店所在地维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功;其中,用以描述酒店主体的多个基础维度至少包括酒店名称维度、经纬度维度和地址维度。
于本申请的第一方面的一些实施例中,所述酒店所在地维度的匹配方式包括:以国家、省份、城市、辖区为匹配顺序进行逐级匹配,且后级维度基于前级维度计算匹配值。
于本申请的第一方面的一些实施例中,所述将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功,包括:通过判断任一种语言的匹配度是否超过预设阈值来分别设定酒店名称维度、经纬度维度和地址维度的权重;计算所述酒店名称维度、经纬度维度和地址维度的权重之和,并通过判断权重之和是否超过预设阈值来判断酒店主体是否匹配成功。
于本申请的第一方面的一些实施例中,对所述酒店数据进行酒店房型维度的匹配包括:利用所述酒店主体维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功;其中,用以描述酒店房型的多个基础维度至少包括房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度。
于本申请的第一方面的一些实施例中,所述将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功,包括:通过判断任一种语言的匹配度是否超过预设阈值来分别设定房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度的权重;计算所述房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度的权重之和,并通过判断权重之和是否超过预设阈值来判断酒店房型是否匹配成功。
为实现上述目的及其他相关目的,本申请的第二方面提供一种酒店匹配系统,包括:收集模块,用于收集并存储来自一或多个数据源的酒店数据;匹配模块,用于对所述酒店数据进行酒店主体维度和酒店房型维度的匹配;推荐模块,用于将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述酒店匹配方法。
为实现上述目的及其他相关目的,本申请的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述酒店匹配方法。
如上所述,本申请的酒店匹配方法、系统、终端及存储介质,具有以下有益效果:本发明通过Logstash+Elasticsearch的方式大大提高了现有酒店匹配过程耗时长的问题,Logstash+Elasticsearch方式通过前期对数据的清洗并利用Elasticsearch对大数据检索的优势解决了在海量酒店匹配中的耗时问题。另外,通过前期数据清洗及多维度多权重等级的匹配方式提高了自动匹配的精准度问题,再配合人工审核及推荐酒店房型匹配功能可以很好的解决人工匹配错误率高,匹配难度大以及在数据不完整时导致自动匹配覆盖率低的问题。
附图说明
图1显示为本申请一实施例中酒店匹配方法的流程示意图。
图2显示为本申请一实施例中酒店匹配系统的结构示意图。
图3显示为本申请一实施例中电子终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在本申请中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。应当进一步理解,此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本发明提供一种匹配错误率低、人工成本低、匹配耗时短的酒店智能匹配方案,为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
如图1所示,展示了本发明一实施例中酒店匹配方法的流程示意图。
需说明的是,本实施例中的酒店匹配方法可应用于计算机设备(如台式电脑、笔记本电脑、平板电脑、智能手机、智能手环、智能手表、智能头盔等),所述计算机设备包括存储器、存储控制器、一个或多个处理单元(CPU)、外设接口、RF电路、音频电路、扬声器、麦克风、输入/输出(I/O)子系统、显示屏、其他输出或控制设备,以及外部端口等组件;还可应用于服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成。
本实施例的酒店匹配方法包括步骤S11~S13,下文将对各个步骤做进一步的解释说明。
步骤S11:收集并存储来自一或多个数据源的酒店数据。
具体而言,在酒店数据收集阶段,可通过主动或被动的方式获取到酒店数据,例如在每天的固定时间以增量方式将各个供应商和目标平台的酒店数据通过数据收集引擎存储到数据分析引擎中,以作为酒店自动匹配的数据源。
在一些示例中,所述数据收集引擎包括但不限于Logstash数据收集引擎、Filebeat数据收集引擎、Flume数据收集引擎、Logagent数据收集引擎等。其中,Logstash数据收集引擎是一款开源的数据收集引擎,具备实时管道处理能力,Logstash作为数据源与数据存储分析工具之间的桥梁,结合ElasticSearch以及Kibana,能够极大方便数据的处理与分析;Filebeat数据收集引擎是用于转发和集中日志数据的轻量级传送工具,Filebeat监视指定的日志文件或位置,收集日志事件,并转发到ElasticSearch或Logstash进行索引;Flume数据收集引擎是一种分布式的海量日志采集、聚合和传输系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接收方的能力。Logagent数据收集引擎可以获取/var/log下的所有信息,解析各种格式(Elasticsearch,Solr,MongoDB,Apache HTTPD等等)。
在一些示例中,所述搜索与数据分析引擎包括Elasticsearch引擎,Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎,能很方便的使大量数据具有搜索、分布和探索的能力,其实现原理包括:首先将用户数据提交到Elasticsearch数据库中,再通过分词控制器将对应的语句进行分词处理,将其权重和分词结果一并存入数据,当用户搜索数据时,再根据权重将结果排名和打分,再将返回结果呈现给用户。
在一些示例中,所述方法还包括对收集到的酒店数据进行数据清洗。
具体而言,在数据收集的时候同时对不同供应商数据进行清洗,为自动匹配速度及精度提供基础。应理解,数据清洗是对数据进行重复审查和校验的过程,目的在于删除重复信息并纠正存在的错误,提供数据一致性,其原理是利用数据处理技术如数理统计、数据挖掘或预定义的清理规则将脏数据转化为满足数据质量要求的数据,所谓脏数据主要是指残缺数据、错误数据和重复数据等。
在一些示例中,酒店数据维度包括酒店所在地维度、酒店主体维度、酒店房型维度、酒店床型维度、酒店服务维度等。具体而言,酒店所在地维度包括酒店所在的国家、省份、城市、辖区等,可通过供应商国家ID、国家中文及外文名称、供应商省份ID、省份中文及外文名称、供应商城市ID、城市中文及外文名称、供应商辖区ID、辖区中文及外文名称等信息来设定。酒店主体维度包括酒店区域位置和酒店基本信息等;酒店区域位置可通过供应商国家ID、供应商省份ID、供应商城市ID、供应商辖区ID、经度、维度等信息来设定;酒店基本信息可通过供应商酒店ID、酒店中文及外文名称、酒店联系电话、酒店中文及外文详细地址等信息来设定。酒店房型维度包括房型基础信息和房型属性信息;房型基础信息通过酒店ID、房型ID、房型中外文名称等信息来设定;房型属性信息通过床型、餐食、是否带窗、房型特色等信息来设定。酒店床型维度包括床型基础信息,通过床型ID、床型中外文名称等信息来设定。酒店服务维度包括酒店餐食、酒店娱乐、酒店健身等;酒店餐食通过餐食ID、餐食中外文名称等信息来设定;酒店娱乐通过娱乐项目ID、娱乐项目中外文名称等信息来设定;酒店健身通过健身项目ID、健身项目中外文名称等信息来设定。应理解的是,出于说明性目的而提供以上示例,并且以上示例不应被理解成是限制性的。
值得注意的是,本发明通过Logstash+Elasticsearch的方式大大提高了现有酒店匹配过程耗时长的问题,Logstash+Elasticsearch方式通过前期对数据的清洗并利用Elasticsearch对大数据检索的优势解决了在海量酒店匹配中的耗时问题。另外,通过前期数据清洗及多维度多权重等级的匹配方式提高了自动匹配的精准度问题,再配合人工审核及推荐酒店房型匹配功能可以很好的解决人工匹配错误率高,匹配难度大以及在数据不完整时导致自动匹配覆盖率低的问题。
步骤S12:对所述酒店数据进行酒店主体维度和酒店房型维度的匹配。
所述酒店主体维度的匹配方式包括:利用酒店所在地维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功;其中,用以描述酒店主体的多个基础维度包括但不限于酒店名称维度、经纬度维度和地址维度等。
所述酒店房型维度的匹配方式包括:利用所述酒店主体维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功;其中,用以描述酒店房型的多个基础维度包括但不限于房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度等。
需说明的是,在对各维度进行匹配时,实质上是在进行词组(如名称或地址等)匹配,因此需要使用分词器对比词组相似度,符合相似度阈值的词组被认为匹配成功,而不符合相似度阈值的词组被认为匹配不成功。分词器包括中文分词器(如IK-analyzer、Stanford分词器、Hanlp分词器等)和英文分词器(如Keras分词器、Spacy分词器等)。
在一些示例中,酒店所在地维度的匹配方式包括:以国家、省份、城市、辖区为匹配顺序进行逐级匹配,且后级维度需在前级维度的基础上计算匹配值。首先,判断国家名称是否匹配成功,若国家名称(任一种语言)匹配度≥预设阈值,则认为国家名称匹配成功,赋予相应的国家名称匹配权重。其次,判断省份名称是否匹配成功,若国家名称匹配成功并且省份名称(任一种语言)匹配度≥预设阈值,则认为省份名称匹配成功,赋予相应的省份名称匹配权重。随后,判断城市名称是否匹配成功,若国家名称和省份名称都匹配成功,且城市名称(任一种语言)匹配度≥预设阈值,则认为城市名称匹配成功,赋予相应的城市名称匹配权重。最后,判断辖区名称是否匹配成功,若国家名称、省份名称、城市名称都匹配成功,且辖区名称(任一种语言)匹配度≥预设阈值,则认为辖区名称匹配成功,赋予相应的辖区名称匹配权重。为便于理解,以下表为例进行说明:
在一些示例中,酒店床型维度的匹配方式包括,若酒店床型名称(任一种语言)匹配度≥预设阈值,则认为酒店床型名称匹配成功。需说明的是,酒店床型维度的匹配时一种基础匹配,用于为后期的酒店房型匹配的准确度提供基础。为便于理解,以下表为例进行说明:
名称 | 权重 |
床型名称(中文) | 1(中英文二选一) |
床型名称(英文) | 1(中英文二选一) |
在一些示例中,酒店服务维度的匹配方式包括:若酒店服务名称(任一种语言)匹配度≥预设阈值,则认为酒店服务名称匹配成功。酒店服务具体包括餐食、娱乐、健身等,以酒店餐食为例,餐食匹配成功=餐食名称(任一种语言)匹配度≥0.8。为便于理解,以下表为例进行说明:
名称 | 权重 |
餐食名称(中文) | 1(中英文二选一) |
餐食名称(英文) | 1(中英文二选一) |
在一些示例中,酒店主体维度的匹配方式包括:利用酒店所在地维度过滤筛选待匹配酒店,将筛选得到的待匹配酒店按照酒店名称、经纬度和地址来计算综合维度匹配值;若所述综合维度匹配值超过预设阈值,则认为酒店主体匹配成功,否则酒店主体匹配不成功。以下表为例来进行说明:
因此,酒店主体综合维度匹配值=(酒店名称权重+经纬度权重+详细地址权重)≥0.8,所以酒店主体匹配成功。
在一些示例中,酒店房型维度的匹配方式包括:利用所述酒店主体维度过滤筛选待匹配酒店,将筛选得到的酒店房型按照床型、酒店服务、房间配置、房型特色计算综合维度匹配值;若所述综合维度匹配值超过预设阈值,则认为酒店房型匹配成功,否则酒店房型匹配不成功。需说明的是,本实施例中的房间配置例如有是否有窗、是否有阳台、是否有按摩椅、是否有独立书房等,本实施例不做具体限定。为便于理解,以下表为例来进行说明:
名称 | 权重 |
酒店主体 | 不参与评分(仅作为过滤房型条件) |
房型名称(英文) | 0.5(中英文二选一) |
房型名称(中文) | 0.5(中英文二选一) |
床型 | 0.2 |
餐食 | 0.2 |
是否有窗 | 0.05 |
房型特色 | 0.05 |
因此,酒店房型综合维度匹配值=(床型权重+餐食权重+是否有窗权重+房型特色权重)≥0.8,所以酒店主体匹配成功。
步骤S13:将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
具体而言,在所有自动匹配完成以后通常需要人工介入审核是否可以在目标平台上线售卖,审核人员可以根据酒店和房型的匹配值数及匹配后给出的是否可上线的建议进行批量审核,也可导出EXCEL做后续其它操作。匹配后给出的上线建议可以大大提高审核速度并减少审核人员的工作量,更为准确迅速的上线可售卖酒店。另外,对于未能自动匹配的数据,也可人工介入使用推荐匹配功能对酒店房型进行匹配操作。
可选的,所述预设推荐规则包括:推荐相同城市预设距离范围内的按照酒店主体综合匹配值值排序的酒店,例如:推荐相同城市1平方公里范围内的按照酒店主体综合匹配值值倒叙排序的酒店,当然也可按照顺序排序,本实施例不做限定。
可选的,所述预设推荐规则包括:推荐相同酒店内的按照酒店房型综合匹配值值排序的房型,例如:相同酒店内按照酒店房型综合匹配值值倒叙排序的房型,当然也可按照顺序排序,本实施例不做限定。
如图2所示,展示了本发明一实施例中酒店匹配系统的结构示意图。本实施例的酒店匹配系统200包括收集模块201、匹配模块202、推荐模块203。
收集模块201用于收集并存储来自一或多个数据源的酒店数据。具体而言,收集模块201在酒店数据收集阶段,可通过主动或被动的方式获取到酒店数据,例如在每天的固定时间以增量方式将各个供应商和目标平台的酒店数据通过数据收集引擎存储到数据分析引擎中,以作为酒店自动匹配的数据源。
匹配模块202用于对所述酒店数据进行酒店主体维度和酒店房型维度的匹配。
所述匹配模块202对所述酒店数据进行酒店主体维度匹配的过程包括:利用酒店所在地维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功;其中,用以描述酒店主体的多个基础维度包括但不限于酒店名称维度、经纬度维度和地址维度等。
所述匹配模块202对所述酒店数据进行酒店房型维度匹配的过程包括:利用所述酒店主体维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功;其中,用以描述酒店房型的多个基础维度包括但不限于房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度等。
推荐模块203用于将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
可选的,所述预设推荐规则包括:推荐相同城市预设距离范围内的按照酒店主体综合匹配值值排序的酒店,例如:推荐相同城市1平方公里范围内的按照酒店主体综合匹配值值倒叙排序的酒店,当然也可按照顺序排序,本实施例不做限定。
可选的,所述预设推荐规则包括:推荐相同酒店内的按照酒店房型综合匹配值值排序的房型,例如:相同酒店内按照酒店房型综合匹配值值倒叙排序的房型,当然也可按照顺序排序,本实施例不做限定。
应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,匹配模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上匹配模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
如图3所示,展示了本发明一实施例中电子终端的结构示意图。本实施例提供的电子终端,包括:处理器31、存储器32、通信器33;存储器32通过系统总线与处理器31和通信器33连接并完成相互间的通信,存储器32用于存储计算机程序,通信器33用于和其他设备进行通信,处理器31用于运行计算机程序,使电子终端执行如上酒店匹配方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random AccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述酒店匹配方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本申请提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
综上所述,本申请提供酒店匹配方法、系统、终端及存储介质,本发明通过Logstash+Elasticsearch的方式大大提高了现有酒店匹配过程耗时长的问题,Logstash+Elasticsearch方式通过前期对数据的清洗并利用Elasticsearch对大数据检索的优势解决了在海量酒店匹配中的耗时问题。另外,通过前期数据清洗及多维度多权重等级的匹配方式提高了自动匹配的精准度问题,再配合人工审核及推荐酒店房型匹配功能可以很好的解决人工匹配错误率高,匹配难度大以及在数据不完整时导致自动匹配覆盖率低的问题。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (10)
1.一种酒店匹配方法,其特征在于,包括:
收集并存储来自一或多个数据源的酒店数据;
对所述酒店数据进行酒店主体维度和酒店房型维度的匹配;
将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
2.根据权利要求1所述的酒店匹配方法,其特征在于,所述收集一或多个数据源的酒店数据并存至搜索与数据分析引擎包括:利用数据收集引擎从供应商和目标平台收集酒店数据,并存储至搜索与数据分析引擎中;所述数据收集引擎包括Logstash引擎,所述搜索与数据分析引擎包括ElasticSearch引擎。
3.根据权利要求1所述的酒店匹配方法,其特征在于,对所述酒店数据进行酒店主体维度的匹配包括:利用酒店所在地维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功;其中,用以描述酒店主体的多个基础维度至少包括酒店名称维度、经纬度维度和地址维度。
4.根据权利要求3所述的酒店匹配方法,其特征在于,所述酒店所在地维度的匹配方式包括:以国家、省份、城市、辖区为匹配顺序进行逐级匹配,且后级维度基于前级维度计算匹配值。
5.根据权利要求3所述的酒店匹配方法,其特征在于,所述将筛选得到的待匹配酒店按照用以描述酒店主体的多个基础维度计算综合维度匹配值,据以判断酒店主体是否匹配成功,包括:
通过判断任一种语言的匹配度是否超过预设阈值来分别设定酒店名称维度、经纬度维度和地址维度的权重;
计算所述酒店名称维度、经纬度维度和地址维度的权重之和,并通过判断权重之和是否超过预设阈值来判断酒店主体是否匹配成功。
6.根据权利要求1所述的酒店匹配方法,其特征在于,对所述酒店数据进行酒店房型维度的匹配包括:利用所述酒店主体维度过滤筛选待匹配酒店;将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功;其中,用以描述酒店房型的多个基础维度至少包括房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度。
7.根据权利要求6所述的酒店匹配方法,其特征在于,所述将筛选得到的待匹配酒店按照用以描述酒店房型的多个基础维度计算综合维度匹配值,据以判断酒店房型是否匹配成功,包括:
通过判断任一种语言的匹配度是否超过预设阈值来分别设定房型名称维度、床型维度酒店服务维度、房间配置维度、房型特色维度的权重;
计算所述房型名称维度、床型维度、酒店服务维度、房间配置维度、房型特色维度的权重之和,并通过判断权重之和是否超过预设阈值来判断酒店房型是否匹配成功。
8.一种酒店匹配系统,其特征在于,包括:
收集模块,用于收集并存储来自一或多个数据源的酒店数据;
匹配模块,用于对所述酒店数据进行酒店主体维度和酒店房型维度的匹配;
推荐模块,用于将已匹配的且已审核的酒店及房型通过酒店服务平台向外展示,以供根据预设推荐规则展示推荐酒店和/或房型。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述酒店匹配方法。
10.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1至7中任一项所述酒店匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832389.6A CN113628003A (zh) | 2021-07-22 | 2021-07-22 | 酒店匹配方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832389.6A CN113628003A (zh) | 2021-07-22 | 2021-07-22 | 酒店匹配方法、系统、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113628003A true CN113628003A (zh) | 2021-11-09 |
Family
ID=78380564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110832389.6A Pending CN113628003A (zh) | 2021-07-22 | 2021-07-22 | 酒店匹配方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113628003A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114358979A (zh) * | 2022-01-12 | 2022-04-15 | 平安科技(深圳)有限公司 | 酒店匹配方法、装置、电子设备及存储介质 |
CN117194438A (zh) * | 2023-11-07 | 2023-12-08 | 苏州思客信息技术有限公司 | 酒店多供应商资源并行查询耗时的熔断方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140214461A1 (en) * | 2003-07-03 | 2014-07-31 | Priceline.Com Llc | Indexing travel accommodations in a network environment |
CN104751232A (zh) * | 2015-04-27 | 2015-07-01 | 携程计算机技术(上海)有限公司 | 酒店自动匹配方法 |
US20150248707A1 (en) * | 2014-03-03 | 2015-09-03 | Adara, Inc. | Hotel Recommendation Engine Based on Customer Data from Multiple Online Sources |
CN106909611A (zh) * | 2017-01-11 | 2017-06-30 | 北京众荟信息技术股份有限公司 | 一种基于文本信息抽取的酒店自动匹配方法 |
CN107463557A (zh) * | 2016-06-05 | 2017-12-12 | 贵州双龙数联科技有限公司 | 一种企业位置信息存储系统 |
CN109977131A (zh) * | 2019-04-03 | 2019-07-05 | 深圳市前海喜越科技有限公司 | 一种房型匹配系统 |
CN110263022A (zh) * | 2019-05-08 | 2019-09-20 | 深圳丝路天地电子商务有限公司 | 酒店数据匹配方法及装置 |
CN110990401A (zh) * | 2019-11-22 | 2020-04-10 | 上海景域文化传播股份有限公司 | 一种酒店搜索方法及系统 |
US20200211059A1 (en) * | 2014-12-16 | 2020-07-02 | Jpmorgan Chase Bank, N.A. | System and method for providing travel and lodging services |
-
2021
- 2021-07-22 CN CN202110832389.6A patent/CN113628003A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140214461A1 (en) * | 2003-07-03 | 2014-07-31 | Priceline.Com Llc | Indexing travel accommodations in a network environment |
US20150248707A1 (en) * | 2014-03-03 | 2015-09-03 | Adara, Inc. | Hotel Recommendation Engine Based on Customer Data from Multiple Online Sources |
US20200211059A1 (en) * | 2014-12-16 | 2020-07-02 | Jpmorgan Chase Bank, N.A. | System and method for providing travel and lodging services |
CN104751232A (zh) * | 2015-04-27 | 2015-07-01 | 携程计算机技术(上海)有限公司 | 酒店自动匹配方法 |
CN107463557A (zh) * | 2016-06-05 | 2017-12-12 | 贵州双龙数联科技有限公司 | 一种企业位置信息存储系统 |
CN106909611A (zh) * | 2017-01-11 | 2017-06-30 | 北京众荟信息技术股份有限公司 | 一种基于文本信息抽取的酒店自动匹配方法 |
CN109977131A (zh) * | 2019-04-03 | 2019-07-05 | 深圳市前海喜越科技有限公司 | 一种房型匹配系统 |
CN110263022A (zh) * | 2019-05-08 | 2019-09-20 | 深圳丝路天地电子商务有限公司 | 酒店数据匹配方法及装置 |
CN110990401A (zh) * | 2019-11-22 | 2020-04-10 | 上海景域文化传播股份有限公司 | 一种酒店搜索方法及系统 |
Non-Patent Citations (3)
Title |
---|
李钦 等: "基于ELK的日志分析平台搭建与优化", 《现代信息科技》, vol. 3, no. 15, 10 August 2019 (2019-08-10), pages 193 - 194 * |
陈和: "运用开源软件Logstash 和ElasticSearch实现DSpace日志实时统计分析", 《数据分析与知识发现》, no. 258, 31 May 2015 (2015-05-31), pages 88 - 93 * |
魏山林: "基于ELK的日志分析系统", 《电脑知识与技术》, vol. 13, no. 5, 28 February 2017 (2017-02-28), pages 69 - 70 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114358979A (zh) * | 2022-01-12 | 2022-04-15 | 平安科技(深圳)有限公司 | 酒店匹配方法、装置、电子设备及存储介质 |
CN117194438A (zh) * | 2023-11-07 | 2023-12-08 | 苏州思客信息技术有限公司 | 酒店多供应商资源并行查询耗时的熔断方法和系统 |
CN117194438B (zh) * | 2023-11-07 | 2024-01-23 | 苏州思客信息技术有限公司 | 酒店多供应商资源并行查询耗时的熔断方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9047369B2 (en) | Method and apparatus of determining product category information | |
CA3064137A1 (en) | Method and device for recommending information | |
CN113628003A (zh) | 酒店匹配方法、系统、终端及存储介质 | |
Kantam et al. | An economic reliability test plan: log-logistic distribution | |
US9881036B2 (en) | Avoid double counting of mapped database data | |
CN102667761A (zh) | 可扩展的集群数据库 | |
CN110709826B (zh) | 用于链接来自异构数据库的数据记录的方法及系统 | |
US9292571B1 (en) | Joining database tables | |
Khan et al. | Virtual community detection through the association between prime nodes in online social networks and its application to ranking algorithms | |
CN108280234B (zh) | 数据查询方法及装置 | |
US20160299903A1 (en) | Path analysis method and apparatus | |
CN111597174A (zh) | 一种分布式数据统计处理系统、方法、存储介质、终端 | |
Xie et al. | Big data validation case study | |
CN115599840A (zh) | 一种复杂业务数据治理方法和系统 | |
CN103605744B (zh) | 网站搜索引擎流量数据的分析方法及装置 | |
KR101621735B1 (ko) | 추천 검색어 제공 방법 및 시스템 | |
CN111813815B (zh) | 数据表显示方法、装置、电子设备和计算机可读介质 | |
CN113849702A (zh) | 一种确定目标数据的方法、装置、电子设备及存储介质 | |
CN115658680A (zh) | 数据存储方法、数据查询方法和相关装置 | |
CN110990401B (zh) | 一种酒店搜索方法及系统 | |
CN112131215A (zh) | 自底向上的数据库信息获取方法及装置 | |
CN111198893A (zh) | 一种数据更新方法、装置、可读介质及电子设备 | |
CN104778253A (zh) | 一种提供数据的方法和装置 | |
WO2022088084A1 (zh) | 数据处理方法、装置及系统、电子设备 | |
CN113190577B (zh) | 一种表连接查询方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |