CN106920151A - 酒店备选池的推荐方法和系统 - Google Patents

酒店备选池的推荐方法和系统 Download PDF

Info

Publication number
CN106920151A
CN106920151A CN201710128878.7A CN201710128878A CN106920151A CN 106920151 A CN106920151 A CN 106920151A CN 201710128878 A CN201710128878 A CN 201710128878A CN 106920151 A CN106920151 A CN 106920151A
Authority
CN
China
Prior art keywords
hotel
order
word
hotels
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710128878.7A
Other languages
English (en)
Inventor
刘金勇
陈毅鸿
马颖华
李生红
黄德双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Network Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Network Technology Shanghai Co Ltd filed Critical Ctrip Travel Network Technology Shanghai Co Ltd
Priority to CN201710128878.7A priority Critical patent/CN106920151A/zh
Publication of CN106920151A publication Critical patent/CN106920151A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种酒店备选池的推荐方法和系统,其中方法包括以下步骤:S1、根据所有酒店的历史订单采用BOW模型构建订单字典,所述订单字典包括N个订单字,每个所述订单字包括性别、年龄区间、酒店星级区间和/或酒店价格区间;S2、分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个所述订单字的距离,距离所述历史订单最近的所述订单字对应的所述直方图的计数加一;S3、使用酒店的所述直方图分别计算两两酒店之间的相似度;S4、分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。本发明提供的推荐方法和系统提高了酒店备选池选择的准确度。

Description

酒店备选池的推荐方法和系统
技术领域
本发明涉及OTA(Online Travel Agent,在线旅游社)技术领域,特别涉及一种酒店备选池的推荐方法和系统。
背景技术
随着互联网和大数据的技术的快速发展,推荐系统已经被越来越多的应用到各行各业,对于OTA行业来说,离线的周边酒店备选池对于整个酒店推荐系统起着至关重要的作用,备选池的准确度直接决定了整个推荐系统模型的性能和效率。
目前酒店推荐系统的备选池推荐算法大多采用协同过滤算法,包括基于用户的方法和基于物品的方法,两种方法采用用户对物品或者信息的偏好,发现用户和用户之间以及物品和物品之间的相似度。由于酒店是一种低频消费的商品,所以构造的用户对物品的评分矩阵就会异常稀疏,很难达到理想的推荐效果。
发明内容
本发明要解决的技术问题是为了克服现有技术中OTA行业的离线的周边酒店备选池的推荐效果不理想的缺陷,提供一种能够有效地提高酒店备选池的推荐的准确度的酒店备选池的推荐方法和系统。
本发明是通过下述技术方案来解决上述技术问题:
一种酒店备选池的推荐方法,其特点在于,包括以下步骤:S1、根据所有酒店的历史订单采用BOW(Bag Of Words,词袋)模型构建订单字典,所述订单字典包括N个订单字,每个所述订单字包括性别、年龄区间、酒店星级区间和/或酒店价格区间;S2、分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个所述订单字的距离,距离所述历史订单最近的所述订单字对应的所述直方图的计数加一;S3、使用酒店的所述直方图分别计算两两酒店之间的相似度;S4、分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
本方案中,通过所有酒店的历史订单全面综合酒店产品的各种特征及其表达方式,不仅考虑了酒店的星级、价格等因素,还充分利用了订购过酒店的每个用户的信息如性别、年龄等,运用BOW模型的方法把它们构建成订单字典,其中处理后的订单相当于BOW模型中的words(字),每家酒店可以作为装这些words的bag(袋子)。然后,再对每家酒店使用订单字典中的订单字进行直方图表示,最后对两两酒店的直方图进行相似度的计算,根据相似度的高低来选择酒店的备选池,在此基础上能够向用户推荐符合用户偏好的酒店。与现有的备选池推荐方法相比,本推荐方法对酒店这种低频消费的商品表现出很好的效果,构建的订单字典的准确性和充分性大大优于协同过滤算法的评分矩阵,达到理想的推荐效果,最终有效地提高了酒店备选池选择的准确度。
较佳地,步骤S1包括以下子步骤:S11、设置所述订单字典的大小为N个;S12、采用K-means(一种硬聚类算法)算法对所有酒店的所述历史订单进行聚类,以获取N个聚类中心,所述聚类中心为所述订单字。
本方案中,根据所有历史订单的情况设置适当的订单字典的大小,采用K-means算法对所有的历史订单进行聚类,等K均值收敛时,即得到每一个聚类的聚类中心,也就是订单字,从而完成订单字典的构建。
较佳地,步骤S11中采用直线搜索的方法设置所述订单字典的大小。
本方案中,订单字典的大小N的设置涉及到计算相似度的准确性,如果N设置的太大,每个订单就一个word,又会遇到数据异常稀疏的问题;如果N设置的比较小,又无法区分订单之间的区别(如N设置为2,那么所有的订单都用两个words来表示),因此N的设置对整个推荐方法的有效性影响非常大。本方案中,采用直线搜索的迭代方法,N从1开始,随着N的增大,推荐的准确性越来越高,直到达到一个最高值。
较佳地,步骤S3中采用余弦距离计算两两酒店之间的相似度,计算公式如下:
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,所述酒店的属性包括星级、订单量和/或评分。
本方案采用余弦距离计算两两酒店的相似度,计算时结合了酒店的直方图的值和酒店的属性两个维度,计算出的相似度更合理,进而能够有效地提高酒店备选池选择的准确度。
较佳地,步骤S1之前还包括以下步骤:获取酒店的历史订单,每张所述历史订单包括用户信息和酒店信息。
本方案中,采用酒店的历史订单中的用户信息和酒店信息,全面综合了酒店产品的各种特征及其表达方式,形成基于BOW的酒店产品表征,在此基础上能够向用户推荐符合用户偏好的酒店。
本发明还提供一种酒店备选池的推荐系统,其特点在于,包括:订单字典构建模块,用于根据所有酒店的历史订单采用BOW模型构建订单字典,所述订单字典包括N个订单字,每个所述订单字包括性别、年龄区间、酒店星级区间和/或酒店价格区间;酒店字典表示模块,用于分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个所述订单字的距离,距离所述历史订单最近的所述订单字对应的所述直方图的计数加一;相似度计算模块,用于使用酒店的所述直方图分别计算两两酒店之间的相似度;酒店备选池生成模块,用于分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
较佳地,所述订单字典构建模块包括:设置模块,用于设置所述订单字典的大小为N个;聚类模块,用于采用K-means算法对所有酒店的所述历史订单进行聚类,以获取N个聚类中心,所述聚类中心为所述订单字。
较佳地,所述设置模块采用直线搜索的方法设置所述订单字典的大小。
较佳地,所述相似度计算模块中采用余弦距离计算两两酒店之间的相似度,计算公式如下:
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,所述酒店的属性包括星级、订单量和/或评分。
较佳地,所述推荐系统还包括历史订单获取模块,所述历史订单获取模块用于获取酒店的历史订单,每张所述历史订单包括用户信息和酒店信息。
本发明的积极进步效果在于:本发明提供的酒店备选池的推荐方法和系统通过所有酒店的历史订单全面综合酒店产品的各种特征及其表达方式,不仅考虑了酒店的星级、价格等因素,还充分利用了订购过酒店的每个用户的信息如性别、年龄等,运用BOW模型的方法把它们构建成订单字典,对每家酒店使用订单字典中的订单字进行直方图表示,最后对两两酒店的直方图进行相似度的计算,根据相似度的高低来选择酒店的备选池,在此基础上能够向用户推荐符合用户偏好的酒店。与现有的备选池推荐方法相比,本推荐方法对酒店这种低频消费的商品表现出很好的效果,构建的订单字典的准确性和充分性大大优于协同过滤算法的评分矩阵,达到理想的推荐效果,最终有效地提高了酒店备选池选择的准确度。
附图说明
图1为本发明实施例1的酒店备选池的推荐方法的流程图。
图2为本发明实施例2的酒店备选池的推荐系统的示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图1所示,一种酒店备选池的推荐方法,包括以下步骤:
步骤101、获取酒店的历史订单,每张历史订单包括用户信息和酒店信息。
步骤102、根据所有酒店的历史订单采用BOW模型构建订单字典,具体步骤为采用直线搜索的方法设置订单字典的大小为N个;采用K-means算法对所有酒店的历史订单进行聚类,以获取N个聚类中心,其中聚类中心为订单字典中的订单字,每个订单字包括性别、年龄区间、酒店星级区间和酒店价格区间。
步骤103、分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个订单字,分别计算每家酒店中每个历史订单与每个订单字的距离,距离该历史订单最近的订单字对应的直方图的计数加一。
步骤104、使用酒店的直方图分别采用余弦距离计算两两酒店之间的相似度,计算公式如下:
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,所述酒店的属性包括酒店标识、星级、订单量、评分和销量等。
步骤105、分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
本实施例中,基于BOW模型进行酒店备选池推荐,将每个酒店看成一个bag,将历史订单进行聚类后生成字典中的字,也就是words,再对每家酒店的历史订单进行字典表示,生成该酒店的直方图表示,采用直方图结合酒店信息进行两两酒店的相似度计算,根据计算出的相似度的值选出若干家酒店作为酒店备选池,推荐给用户。
本实施例提供的酒店备选池的推荐方法采用所有酒店的历史订单全面综合酒店产品的各种特征及其表达方式,不仅考虑了酒店的星级、价格等因素,还充分利用了订购过酒店的每个用户的信息如性别、年龄等,运用BOW模型的方法把它们构建成订单字典,对每家酒店使用订单字典中的订单字进行直方图表示,最后对两两酒店的直方图进行相似度的计算,根据相似度的高低来选择酒店的备选池,在此基础上能够向用户推荐符合用户偏好的酒店。与现有的备选池推荐方法相比,本推荐方法对酒店这种低频消费的商品表现出很好的效果,构建的订单字典的准确性和充分性大大优于协同过滤算法的评分矩阵,达到理想的推荐效果,最终有效地提高了酒店备选池选择的准确度。
实施例2
如图2所示,一种酒店备选池的推荐系统,该系统包括历史订单获取模块1、订单字典构建模块2、酒店字典表示模块3、相似度计算模块4和酒店备选池生成模块5。
其中,历史订单获取模块1用于获取酒店的历史订单,每张历史订单包括用户信息和酒店信息。
订单字典构建模块2用于根据所有酒店的历史订单采用BOW模型构建订单字典,订单字典包括N个订单字,每个订单字包括性别、年龄区间、酒店星级区间和酒店价格区间;订单字典构建模块2包括设置模块201和聚类模块202,设置模块201用于采用直线搜索的方法设置订单字典的大小为N个;聚类模块202用于采用K-means算法对所有酒店的所述历史订单进行聚类,以获取N个聚类中心,聚类中心为所述订单字。
酒店字典表示模块3用于分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个订单字的距离,距离该历史订单最近的订单字对应的直方图的计数加一。
相似度计算模块4用于使用酒店的直方图采用余弦距离分别计算两两酒店之间的相似度,计算公式如下:
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,酒店的属性包括星级、订单量和/或评分。
酒店备选池生成模块5用于分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
下面继续通过具体的例子,进一步说明本发明的技术方案和技术效果。
当用户打开OTA客户端后,首先会进入主页菜单,此时系统会根据用户相应信息从数据库中获取该用户的信息。用户点击进入酒店模块,在对应的搜索页面中进行相应搜索。酒店推荐系统的周边酒店备选池是一个用于存放着与每家酒店相似度最高的K家酒店的备选集,当一家酒店被推荐为用户的最佳选择时,OTA客户端会从本推荐系统离线生成的酒店备选池中提取该酒店相似度最高的K家酒店,作为这家酒店的备选推荐进行展示。本推荐系统对酒店这种低频消费的商品表现出很好的效果,构建的订单字典的准确性和充分性大大优于协同过滤算法的评分矩阵,达到理想的推荐效果,最终有效地提高了酒店备选池选择的准确度。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种酒店备选池的推荐方法,其特征在于,包括以下步骤:
S1、根据所有酒店的历史订单采用BOW模型构建订单字典,所述订单字典包括N个订单字,每个所述订单字包括性别、年龄区间、酒店星级区间和/或酒店价格区间;
S2、分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个所述订单字的距离,距离所述历史订单最近的所述订单字对应的所述直方图的计数加一;
S3、使用酒店的所述直方图分别计算两两酒店之间的相似度;
S4、分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
2.如权利要求1所述的酒店备选池的推荐方法,其特征在于,步骤S1包括以下子步骤:
S11、设置所述订单字典的大小为N个;
S12、采用K-means算法对所有酒店的所述历史订单进行聚类,以获取N个聚类中心,所述聚类中心为所述订单字。
3.如权利要求2所述的酒店备选池的推荐方法,其特征在于,步骤S11中采用直线搜索的方法设置所述订单字典的大小。
4.如权利要求1所述的酒店备选池的推荐方法,其特征在于,步骤S3中采用余弦距离计算两两酒店之间的相似度,计算公式如下:
S i m i l a r y ( h i , h j ) = [ w i 1 , w i 2 , ...... , w i N , h i f 1 , h i f 2 , h i f 3 , ...... ] · [ w j 1 , w j 2 , ...... , w j N , h j f 1 , h j f 2 , h j f 3 , ...... ] [ w i 1 , w i 2 , ...... , w i N , h i f 1 , h i f 2 , h i f 3 , ...... ] * [ w j 1 , w j 2 , ...... , w j N , h j f 1 , h j f 2 , h j f 3 , ...... ] ,
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;
hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;
Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,所述酒店的属性包括星级、订单量和/或评分。
5.如权利要求1至4任一项所述的酒店备选池的推荐方法,其特征在于,步骤S1之前还包括以下步骤:
获取酒店的历史订单,每张所述历史订单包括用户信息和酒店信息。
6.一种酒店备选池的推荐系统,其特征在于,包括:
订单字典构建模块,用于根据所有酒店的历史订单采用BOW模型构建订单字典,所述订单字典包括N个订单字,每个所述订单字包括性别、年龄区间、酒店星级区间和/或酒店价格区间;
酒店字典表示模块,用于分别对每家酒店初始化总维数为N、值均为0的直方图,一个维数对应一个所述订单字,分别计算每家酒店中每个历史订单与每个所述订单字的距离,距离所述历史订单最近的所述订单字对应的所述直方图的计数加一;
相似度计算模块,用于使用酒店的所述直方图分别计算两两酒店之间的相似度;
酒店备选池生成模块,用于分别为每家酒店选取相似度最高的若干家酒店作为该酒店的酒店备选池。
7.如权利要求6所述的酒店备选池的推荐系统,其特征在于,所述订单字典构建模块包括:
设置模块,用于设置所述订单字典的大小为N个;
聚类模块,用于采用K-means算法对所有酒店的所述历史订单进行聚类,以获取N个聚类中心,所述聚类中心为所述订单字。
8.如权利要求7所述的酒店备选池的推荐系统,其特征在于,所述设置模块采用直线搜索的方法设置所述订单字典的大小。
9.如权利要求6所述的酒店备选池的推荐系统,其特征在于,所述相似度计算模块中采用余弦距离计算两两酒店之间的相似度,计算公式如下:
S i m i l a r y ( h i , h j ) = [ w i 1 , w i 2 , ...... , w i N , h i f 1 , h i f 2 , h i f 3 , ...... ] · [ w j 1 , w j 2 , ...... , w j N , h j f 1 , h j f 2 , h j f 3 , ...... ] [ w i 1 , w i 2 , ...... , w i N , h i f 1 , h i f 2 , h i f 3 , ...... ] * [ w j 1 , w j 2 , ...... , w j N , h j f 1 , h j f 2 , h j f 3 , ...... ] ,
其中hi=[wi1,wi2,……,wiN,hif1,hif2,hif3,……],hi(i=1,2,……,N)用于表示第i个酒店的直方图的值和酒店的属性,wik(k=1,2,……,N)代表每第i个酒店中对应的第k个订单字的计数个数,hifm(m=1,2,……)代表第i个酒店的第m个属性;
hj=[wj1,wj2,……,wjN,hjf1,hjf2,hjf3,……],hj(j=1,2,……,N)用于表示第j个酒店的直方图的值和酒店的属性,wjl(k=1,2,……,N)代表每第j个酒店中对应的第l个订单字的计数个数,hjfn(n=1,2,……)代表第j个酒店的第n个属性;
Similary(hi,hj)表示第i个酒店和第j个酒店的相似度,所述酒店的属性包括星级、订单量和/或评分。
10.如权利要求6至9任一项所述的酒店备选池的推荐系统,其特征在于,所述推荐系统还包括历史订单获取模块,所述历史订单获取模块用于获取酒店的历史订单,每张所述历史订单包括用户信息和酒店信息。
CN201710128878.7A 2017-03-06 2017-03-06 酒店备选池的推荐方法和系统 Pending CN106920151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710128878.7A CN106920151A (zh) 2017-03-06 2017-03-06 酒店备选池的推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710128878.7A CN106920151A (zh) 2017-03-06 2017-03-06 酒店备选池的推荐方法和系统

Publications (1)

Publication Number Publication Date
CN106920151A true CN106920151A (zh) 2017-07-04

Family

ID=59460690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710128878.7A Pending CN106920151A (zh) 2017-03-06 2017-03-06 酒店备选池的推荐方法和系统

Country Status (1)

Country Link
CN (1) CN106920151A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291939A (zh) * 2017-07-06 2017-10-24 携程计算机技术(上海)有限公司 酒店信息的聚类匹配方法及系统
CN109933716A (zh) * 2019-01-15 2019-06-25 深圳心跳智能科技有限公司 一种基于客户行为习惯偏好的个性化酒店智能推荐算法
CN113763134A (zh) * 2021-09-22 2021-12-07 携程旅游信息技术(上海)有限公司 信息推荐方法、系统、设备及存储介质
CN113947456A (zh) * 2021-10-19 2022-01-18 广州华多网络科技有限公司 线上商铺匹配方法及其装置、设备、介质、产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957826A (zh) * 2009-07-15 2011-01-26 财团法人工业技术研究院 教材自动扩充方法与相关学习教材扩充系统
KR20130097475A (ko) * 2012-02-24 2013-09-03 가천의과학대학교 산학협력단 의료 프로세스 모델링 및 검증 방법
CN103984984A (zh) * 2014-06-11 2014-08-13 张劲松 一种酒店订房系统及其实现方法
CN105005579A (zh) * 2015-05-28 2015-10-28 携程计算机技术(上海)有限公司 Ota网站中酒店房型个性化排序方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957826A (zh) * 2009-07-15 2011-01-26 财团法人工业技术研究院 教材自动扩充方法与相关学习教材扩充系统
KR20130097475A (ko) * 2012-02-24 2013-09-03 가천의과학대학교 산학협력단 의료 프로세스 모델링 및 검증 방법
CN103984984A (zh) * 2014-06-11 2014-08-13 张劲松 一种酒店订房系统及其实现方法
CN105005579A (zh) * 2015-05-28 2015-10-28 携程计算机技术(上海)有限公司 Ota网站中酒店房型个性化排序方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
X.S. GUO 等: "An Analysis Framework for Content-based Job Recommendation", 《22ND INTERNATIONAL CONFERENCE ON CASE-BASED REASONING (ICCBR)》 *
易旺: "酒店搜索推荐的设计与分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291939A (zh) * 2017-07-06 2017-10-24 携程计算机技术(上海)有限公司 酒店信息的聚类匹配方法及系统
CN107291939B (zh) * 2017-07-06 2020-08-21 携程计算机技术(上海)有限公司 酒店信息的聚类匹配方法及系统
CN109933716A (zh) * 2019-01-15 2019-06-25 深圳心跳智能科技有限公司 一种基于客户行为习惯偏好的个性化酒店智能推荐算法
CN113763134A (zh) * 2021-09-22 2021-12-07 携程旅游信息技术(上海)有限公司 信息推荐方法、系统、设备及存储介质
CN113947456A (zh) * 2021-10-19 2022-01-18 广州华多网络科技有限公司 线上商铺匹配方法及其装置、设备、介质、产品

Similar Documents

Publication Publication Date Title
CN103412948B (zh) 基于聚类的协同过滤的商品推荐方法及系统
CN103778214B (zh) 一种基于用户评论的商品属性聚类方法
CN106920151A (zh) 酒店备选池的推荐方法和系统
CN103870973B (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
CN111401936B (zh) 一种基于评论空间和用户偏好的推荐方法
CN105787770A (zh) 一种基于nmf算法的大数据商品及服务推荐方法及系统
CN101937549B (zh) 网络购物导航领域的图片导航系统
CN107329994A (zh) 一种基于用户特征的改进协同过滤推荐方法
CN109711925A (zh) 具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统
CN107256494A (zh) 一种物品推荐方法及装置
CN106022869A (zh) 一种消费对象的推荐方法及装置
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、系统
CN108595506A (zh) 需求匹配方法及装置、存储介质、终端
CN108198045A (zh) 基于电子商务网站数据挖掘的混合推荐系统的设计方法
CN104298787A (zh) 一种基于融合策略的个性化推荐方法及装置
CN106157156A (zh) 一种基于用户社区的协作推荐系统
CN106960044A (zh) 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
WO2019072098A1 (zh) 一种识别核心产品词的方法和系统
CN104794222B (zh) 网络表格语义恢复方法
CN104216993A (zh) 一种标签共现的标签聚类方法
CN103577472B (zh) 个人信息获得、推定、商品的分类、检索方法及系统
CN109670909A (zh) 一种基于概率矩阵分解和特征融合的旅游产品推荐方法
CN103353865B (zh) 一种基于位置的易货电子交易商品推荐方法
CN113052651A (zh) 一种基于大数据的智能零售管理方法及系统
CN106600357A (zh) 基于电子商务商品标题的商品搭配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170704

RJ01 Rejection of invention patent application after publication