CN104391847A - 一种基于用户行为的酒店排序方法、云端服务器及系统 - Google Patents
一种基于用户行为的酒店排序方法、云端服务器及系统 Download PDFInfo
- Publication number
- CN104391847A CN104391847A CN201410219006.8A CN201410219006A CN104391847A CN 104391847 A CN104391847 A CN 104391847A CN 201410219006 A CN201410219006 A CN 201410219006A CN 104391847 A CN104391847 A CN 104391847A
- Authority
- CN
- China
- Prior art keywords
- hotel
- data
- user behavior
- distributed
- daily record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000010276 construction Methods 0.000 claims abstract description 10
- 239000000284 extract Substances 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000011068 loading method Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 abstract description 20
- 238000007418 data mining Methods 0.000 abstract description 5
- 230000006399 behavior Effects 0.000 description 81
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 6
- 238000013480 data collection Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 229910001751 gemstone Inorganic materials 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种基于用户行为的酒店排序方法、云端服务器及系统,所述方法包括:获取收集的电商领域酒店预订产品的用户行为数据;对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。本技术发明的计算周期可以为一天,完全自动化,不需要任何人工干预;其数据计算方式为分布式,较之之前的单点数据库,具有良好的水平扩展性。同时中间数据层和抽象模型的构造为后续的其他数据挖掘工作提供了方便的数据接口,取得了转化率的大幅提升。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于用户行为的酒店排序方法、云端服务器及系统。
背景技术
对用户行为的理解和建模是互联网技术皇冠上的宝石。数据挖掘和机器学习方法在精准广告投放、搜索、个性化推荐等方面的成功应用,加深了这一领域的研究深度,同时坚定了各大互联网公司在此领域落地的决心。现有的搜索排序方法是基于人工手动调整的,工作量大,更新周期长且没有理论基础,使得互联网公司长期以来用户购买转化率稳定在较低的数值不能得到提升。
现有技术的酒店排序方法主要是靠人工经验、人工调整。订单数据库记录了历史订单的详细数据,由于订单数据库本质上是事务性数据库而非数据仓库,单机生成报表时间缓慢,周期长,一般的周期在半个月左右。
业务人员将每个酒店的订单量,点击量等数据形成报表之后,根据一些人工经验赋权,形成酒店排序表。现有技术方案的缺点:1.特征赋权方法为手工,公式和权重都没有可信度。2.人工调整资源消耗巨大。在商品、场景较少的情况下暂且可行,一旦增多,由于组合爆炸,人工调整是不可行的。3.数据处理量大,ETL(Extraction-Transformation-Loading,数据提取、转换和加载)更新周期慢(一个月),需要手工编辑,耗时耗力。4.无法在此基础上为后续的个性化推荐、分场景分query(问题)排序做出技术基础。5.实际数据证明,人工调整策略的转化率(CVR,Conversion Rate)稳定在8~9%之间,无法进一步提升,如下表1所示:
表1手工排序结果
发明内容
本发明实施例提供一种基于用户行为的酒店排序方法、云端服务器及系统,以利用用户行为提升用户转化率。
一方面,本发明实施例提供了一种基于用户行为的酒店排序方法,所述基于用户行为的酒店排序方法包括:
获取收集的电商领域酒店预订产品的用户行为数据;
对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
优选的,在本发明一实施例中,所述用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
优选的,在本发明一实施例中,所述获取收集的电商领域酒店预订产品的用户行为数据,包括:通过日志传输平台实时收集所述电商领域酒店预订产品的用户行为数据。
优选的,在本发明一实施例中,所述对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果,包括:对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
优选的,在本发明一实施例中,所述对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型,包括:对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型;所述根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果,包括:根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
另一方面,本发明实施例提供了一种基于用户行为的酒店排序的云端服务器,所述基于用户行为的酒店排序的云端服务器包括:
获取单元,用于获取收集的电商领域酒店预订产品的用户行为数据;
分布式数据处理单元,用于对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
发送单元,用于将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
优选的,在本发明一实施例中,所述获取单元获取的用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
优选的,在本发明一实施例中,所述分布式数据处理单元包括:模型构造模块,用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;计算模块,用于根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
优选的,在本发明一实施例中,所述模型构造模块,进一步用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型;所述计算模块,进一步用于根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
再一方面,本发明实施例还提供了一种基于用户行为的酒店排序系统,所述基于用户行为的酒店排序系统包括上述基于用户行为的酒店排序的云端服务器,所述基于用户行为的酒店排序系统还包括:日志传输平台,用于实时收集所述电商领域酒店预订产品的用户行为数据。
上述技术方案具有如下有益效果:因为采用所述基于用户行为的酒店排序方法包括:获取收集的电商领域酒店预订产品的用户行为数据;对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户的技术手段,所以达到了如下的技术效果:人工排序的方案除了转化率较低外,还存在计算耗时,人力资源消耗过多等问题,而本技术发明的计算周期可以为一天,完全自动化,不需要任何人工干预;其数据计算方式为分布式,较之之前的单点数据库,具有良好的水平扩展性。同时中间数据层和抽象模型的构造为后续的其他数据挖掘工作提供了方便的数据接口,取得了转化率的大幅提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种基于用户行为的酒店排序方法流程图;
图2为本发明实施例一种基于用户行为的酒店排序的云端服务器结构示意图;
图3为本发明实施例分布式数据处理单元结构示意图;
图4为本发明实施例一种基于用户行为的酒店排序系统组成示意图;
图5为本发明应用实例用户预定酒店时序示意图;
图6为本发明应用实例用户预定酒店查询示意图;
图7为本发明应用实例数据收集与传输示意图;
图8为本发明应用实例数据抽象模型六元组的构造示意图;
图9为本发明应用实例的整体架构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种基于用户行为的酒店排序方法、云端服务器及系统,以利用用户行为提升用户转化率。
如图1所示,为本发明实施例一种基于用户行为的酒店排序方法流程图,所述基于用户行为的酒店排序方法包括:
101、获取收集的电商领域酒店预订产品的用户行为数据;
102、对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
103、将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
优选的,所述用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
优选的,所述获取收集的电商领域酒店预订产品的用户行为数据,包括:通过日志传输平台实时收集所述电商领域酒店预订产品的用户行为数据。
优选的,所述对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果,包括:对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
优选的,所述对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型,包括:对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型。
优选的,所述根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果,包括:根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
如图2所示,为本发明实施例一种基于用户行为的酒店排序的云端服务器结构示意图,所述基于用户行为的酒店排序的云端服务器包括:
获取单元21,用于获取收集的电商领域酒店预订产品的用户行为数据;
分布式数据处理单元22,用于对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
发送单元23,用于将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
优选的,所述获取单元获取的用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
优选的,如图3所示,为本发明实施例分布式数据处理单元结构示意图,所述分布式数据处理单元22包括:模型构造模块221,用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;计算模块222,用于根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
优选的,所述模型构造模块221,进一步用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型。
优选的,所述计算模块222,进一步用于根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
如图4所示,为本发明实施例一种基于用户行为的酒店排序系统组成示意图,所述基于用户行为的酒店排序系统包括上述基于用户行为的酒店排序的云端服务器41。优选的,所述基于用户行为的酒店排序系统还包括:日志传输平台42,用于实时收集所述电商领域酒店预订产品的用户行为数据。
本发明实施例上述技术方案具有如下有益效果:因为采用所述基于用户行为的酒店排序方法包括:获取收集的电商领域酒店预订产品的用户行为数据;对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户的技术手段,所以达到了如下的技术效果:人工排序的方案除了转化率较低外,还存在计算耗时,人力资源消耗过多等问题,而本技术发明的计算周期可以为一天,完全自动化,不需要任何人工干预;其数据计算方式为分布式,较之之前的单点数据库,具有良好的水平扩展性。同时中间数据层和抽象模型的构造为后续的其他数据挖掘工作提供了方便的数据接口,取得了转化率的大幅提升。
以下通过应用实例对本发明实施例上述技术方案进行详细说明:
本发明应用实例实现该方案包括三部分:
1、用户行为数据收集系统。
2、数据建模与ETL(Extraction-Transformation-Loading,数据提取、转换和加载)。
3、图模型构造与方法实现。
以下进行详述:
1、用户行为数据收集系统
1.1、以用户预定酒店主流程为例:以下进行分析:如图5所示,为本发明应用实例用户预定酒店时序示意图,
假设用户行为的时序为:
A—>B—>C—>D—>E—>F—>G—>H—>I—>J—>K
现有分析方法的状况:
由于H前的序列式G,因此认为定单I是G带过来的,即query2带来了此订单。
但现实的情况时query1带来的订单,因为状态H是由状态D导出,即状态H的refer(关系到)是状态D,而D是由query1带来的,因此I是query1带来的。
为了解决此类问题并作出更细致的用户行为分析,于是有:
方案一:
时间戳+Refer_Url
存在的问题:
a、由于存在后端分布式系统、前后端网路传输等问题,记录不同行为的时间戳不可能完全保持精准的时序,仅通过时间戳不可能完全还原用户行为。显然地,用户的行为间隔越小,误差的可能性越大。
b、本发明应用实例注意到状态D和状态F都是属于同一个url,这种情况说明:同一个url对应了不同的状态,因此通过refer_url来还原用户行为同样也会存在偏差。
方案二:
如图6所示,为本发明应用实例用户预定酒店查询示意图。
引入Qid,针对以上情况,本发明应用实例提出对于酒店搜索页,在搜索行为的产生时生成一个全局的Qid,Qid的变化原则是:1)在酒店搜索列表页每次点击搜索按钮时,qid发生变化;2)在酒店搜索列表页每次选择筛选条件时,qid发生变化;3)在酒店搜索列表页每次翻页时,qid发生变化。
后续的整个搜索、点击进入详情页、点击进入预定页、点击成交行为,都会接收前个状态的qid并记录到日志中,并发送给后续流程中。以此来解决用户在“酒店搜索”频道的全流程跟踪问题,精确地计算酒店、房间的CTR(Click Through Rate,点击率)和CVR(Click Value Rate,转化率),并最终构造机器学习排序问题的输入,优化排序。
1.2数据收集与传输
如图7所示,为本发明应用实例数据收集与传输示意图。本发明应用实例在web server端收集了用户的搜索请求日志、点击事件日志、和展现日志。三种日志通过日志收集框架flume(水槽)实时进入到海量数据处理平台Hadoop中。
2、数据建模与ETL
2.1、数据建模
网页搜索可将用户的一次搜索行为根据时序抽象成三元组(Q,R,C),其中:
Q:检索query
R:返回的网页id ranking list
C:用户点击过的网页id集合
其中
而OTA电商的流程要更复杂,根据本发明应用实例的产品设计,可以通过qid,将搜索及后续行为串联并抽象成六元组以作为搜索评估、LearningTo Ranking的基础model。
QH:搜索条件(多维query)
RH:检索结果hotelid排序列表(ranking list)
C:点击item结果集(clicked items set)
QR:详情页检索条件(目前来看主要是时间段更改)
RR:详情页展现排序列表(room list)
O:预订结果集(ordered hotelid set,roomid set)
其中
2.2、ETL(Extraction-Transformation-Loading,数据提取、转换和加载)
如图8所示,为本发明应用实例数据抽象模型六元组的构造示意图。ETL通过收集的三种日志(搜索请求日志、点击事件日志、和展现日志),由于数据量较大,使用了MapReduce分布式计算实现了用户行为时间序列的增量构造、session(会话)切分和session内抽象模型六元组的构造。
3、方法实现
3.1、三种竞赛
设六元组
中,RH={h1,h2,...,hn}, 显然的,可通过方法1构造三种序关系如下:
本发明应用实例称此种序关系为pair。显然地,用户每进入下一个流程,说明对于这个流程的item对比上个流程的一系列item在某种程度上更能引起用户的兴趣。因此对于六元组来说本发明应用实例可以构造三种pair,表明了此用户对item之间的认可关系,即:
点击——展现竞赛
预订——点击竞赛
预订——展现竞赛
3.2、构造竞赛图
显然地,如果本发明应用实例能收集到大量的用户session内的行为,便可以构造出大量的三种竞赛关系pair。如果把每个item看做是一张图上的结点,那么图上的边便可以由这些pair构造出来。因此本发明应用实例构造一个双向带权图G,即:
设H为item的集合,G中有
设P={hi→hj}为pair的数据集,其中wij为pair:hi→hj的数量即:
wij=Count(hi→hj)。
3.3、迭代求解
由数据集P={hi→hj}本发明应用实例构造了双向带权图G,其邻接矩阵为:
AG 0=[wij]n×n
于是本发明应用实例有了酒店之间通过用户行为构造出的竞赛关系。显然地,根据竞赛图理论,若1结点“战胜”了实力较强的对手,则其得分应该较之其战胜的较弱对手的分值高,因此有迭代公式:
AG n+1=αAG n+(1-α)E
计算求出AG的对角实特征值即为item的全局得分List:L=[(hi,ri)]T 1×n。其中ri为hi得分,E为单位矩阵,α为避免链接黑洞的平滑因子,一般设为0.85。
根据Perron-Fobenius定理,若矩阵是本原的,则迭代必然收敛。本发明应用实例选取了200次作为迭代最大次数,此时特征值已收敛。
如图9所示,为本发明应用实例的整体架构示意图。
首先,获取收集的电商领域酒店预订产品的用户行为数据;其次,对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;最后,将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
本发明技术方案带来的有益效果:将L=[(hi,ri)]T 1×n排序list(酒店排序结果)应用于线上搜索系统后,整个产品线的预订转化率得到了一定程度的提升,如下表2所示:
表2 本发明应用实例排序结果
本发明应用实例将此方法命名为HotelRank。可以看到该方法对转化率的提升要比其他策略要大,相比于人工排序,其获胜置信度达到了98.06%,绝对转化率提升达到了1.54%,相对转化率提升达到了18.1%。人工排序的方案除了转化率较低外,还存在计算耗时,人力资源消耗过多等问题。本技术发明的计算周期为一天,且为完全自动化,不需要任何人工干预;其数据计算方式为分布式,较之之前的单点数据库,具有良好的水平扩展性。同时中间数据层和抽象模型的构造为后续的其他数据挖掘工作提供了方便的数据接口。本发明技术方案将海量数据的离线存储与计算由传统数据库迁移至分布式数据处理平台,将OTA产品用户行为主流程进行了抽象建模,利用MapReduce分布式处理进行了抽象模型的构造,创造性地利用抽象模型构造了酒店间基于用户行为的竞赛图模型并进行迭代计算求得ranking值,取得了转化率的大幅提升。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrativelogical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrativecomponents),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于用户行为的酒店排序方法,其特征在于,所述基于用户行为的酒店排序方法包括:
获取收集的电商领域酒店预订产品的用户行为数据;
对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
2.如权利要求1所述基于用户行为的酒店排序方法,其特征在于,
所述用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
3.如权利要求1所述基于用户行为的酒店排序方法,其特征在于,所述获取收集的电商领域酒店预订产品的用户行为数据,包括:
通过日志传输平台实时收集所述电商领域酒店预订产品的用户行为数据。
4.如权利要求1所述基于用户行为的酒店排序方法,其特征在于,所述对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果,包括:
对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;
根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
5.如权利要求4所述基于用户行为的酒店排序方法,其特征在于,
所述对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型,包括:对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型;
所述根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果,包括:根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
6.一种基于用户行为的酒店排序的云端服务器,其特征在于,所述基于用户行为的酒店排序的云端服务器包括:
获取单元,用于获取收集的电商领域酒店预订产品的用户行为数据;
分布式数据处理单元,用于对所述用户行为数据进行分布式数据处理,获取分布式处理后的酒店排序结果;
发送单元,用于将所述分布式处理后的酒店排序结果发送给电商领域酒店预订产品的搜索用户。
7.如权利要求6所述基于用户行为的酒店排序的云端服务器,其特征在于,
所述获取单元获取的用户行为数据为日志数据,该日志数据包括:搜索请求日志、点击事件日志、展现日志。
8.如权利要求6所述基于用户行为的酒店排序的云端服务器,其特征在于,所述分布式数据处理单元包括:
模型构造模块,用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL获取竞赛图模型;
计算模块,用于根据所述竞赛图模型,获取所述分布式处理后的酒店排序结果。
9.如权利要求8所述基于用户行为的酒店排序的云端服务器,其特征在于,
所述模型构造模块,进一步用于对所述用户行为数据进行分布式数据处理,通过数据建模与数据提取、转换和加载ETL进行六元组的主流程抽象模型构造,获取竞赛图模型;
所述计算模块,进一步用于根据所述竞赛图模型进行迭代计算求得排序值,以获取所述分布式处理后的酒店排序结果。
10.一种基于用户行为的酒店排序系统,其特征在于,所述基于用户行为的酒店排序系统包括权利要求6-9中任一项所述基于用户行为的酒店排序的云端服务器,所述基于用户行为的酒店排序系统还包括:
日志传输平台,用于实时收集所述电商领域酒店预订产品的用户行为数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410219006.8A CN104391847A (zh) | 2014-05-22 | 2014-05-22 | 一种基于用户行为的酒店排序方法、云端服务器及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410219006.8A CN104391847A (zh) | 2014-05-22 | 2014-05-22 | 一种基于用户行为的酒店排序方法、云端服务器及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104391847A true CN104391847A (zh) | 2015-03-04 |
Family
ID=52609751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410219006.8A Pending CN104391847A (zh) | 2014-05-22 | 2014-05-22 | 一种基于用户行为的酒店排序方法、云端服务器及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104391847A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291888A (zh) * | 2017-06-21 | 2017-10-24 | 苏州发飚智能科技有限公司 | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 |
CN111767201A (zh) * | 2020-06-29 | 2020-10-13 | 百度在线网络技术(北京)有限公司 | 用户行为分析方法、终端设备、服务器及存储介质 |
CN112232857A (zh) * | 2020-09-25 | 2021-01-15 | 上海淇毓信息科技有限公司 | 一种广告自动排序方法、装置和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101055587A (zh) * | 2007-05-25 | 2007-10-17 | 清华大学 | 一种基于用户行为信息的搜索引擎检索结果重排序方法 |
CN101067857A (zh) * | 2006-08-28 | 2007-11-07 | 腾讯科技(深圳)有限公司 | 物品售卖系统及其展示物品的方法 |
CN102073699A (zh) * | 2010-12-20 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于基于用户行为来改善搜索结果的方法、装置和设备 |
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN103793388A (zh) * | 2012-10-29 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
-
2014
- 2014-05-22 CN CN201410219006.8A patent/CN104391847A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067857A (zh) * | 2006-08-28 | 2007-11-07 | 腾讯科技(深圳)有限公司 | 物品售卖系统及其展示物品的方法 |
CN101055587A (zh) * | 2007-05-25 | 2007-10-17 | 清华大学 | 一种基于用户行为信息的搜索引擎检索结果重排序方法 |
CN102073699A (zh) * | 2010-12-20 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于基于用户行为来改善搜索结果的方法、装置和设备 |
CN102236867A (zh) * | 2011-08-15 | 2011-11-09 | 悠易互通(北京)广告有限公司 | 基于云计算的受众行为分析广告定向系统 |
CN103793388A (zh) * | 2012-10-29 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
Non-Patent Citations (2)
Title |
---|
刘艳: "基于协同过滤的酒店推荐系统研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
叶先一: "有向图的一种排序算法及其应用", 《厦门大学学术典藏库》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291888A (zh) * | 2017-06-21 | 2017-10-24 | 苏州发飚智能科技有限公司 | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 |
CN107291888B (zh) * | 2017-06-21 | 2020-12-01 | 苏州发飚智能科技有限公司 | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 |
CN111767201A (zh) * | 2020-06-29 | 2020-10-13 | 百度在线网络技术(北京)有限公司 | 用户行为分析方法、终端设备、服务器及存储介质 |
CN111767201B (zh) * | 2020-06-29 | 2023-08-29 | 百度在线网络技术(北京)有限公司 | 用户行为分析方法、终端设备、服务器及存储介质 |
CN112232857A (zh) * | 2020-09-25 | 2021-01-15 | 上海淇毓信息科技有限公司 | 一种广告自动排序方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107451861B (zh) | 一种大数据下用户上网特征识别的方法 | |
CN107066476A (zh) | 一种基于物品相似度的实时推荐方法 | |
CN104166668B (zh) | 基于folfm模型的新闻推荐系统及方法 | |
CN103646086B (zh) | 一种垃圾文件的清理方法和装置 | |
CN103729446B (zh) | 一种用户操作数据的处理方法、处理装置及服务器 | |
CN106326413A (zh) | 一种个性化视频推荐系统及方法 | |
CN106156127A (zh) | 选择数据内容向终端推送的方法及装置 | |
CN106339469A (zh) | 数据推荐方法及装置 | |
CN105260414B (zh) | 用户行为相似性计算方法及装置 | |
CN102122291A (zh) | 一种基于树形日志模式分析的博客好友推荐方法 | |
CN104182506A (zh) | 日志管理方法 | |
CN106682212A (zh) | 一种基于用户移动行为的社会关系分类方法与装置 | |
CN104216889B (zh) | 基于云服务的数据传播性分析预测方法及系统 | |
CN105608135A (zh) | 一种基于Apriori算法的数据挖掘方法及系统 | |
CN107527303A (zh) | 一种乡村旅游可视化推荐方法及系统 | |
CN103699534B (zh) | 系统目录中数据对象的显示方法及装置 | |
CN110009416A (zh) | 一种基于大数据清洗和ai精准营销的系统 | |
CN109828997A (zh) | 一种大学生行为数据分析及学业预警方法 | |
CN110457626A (zh) | 一种异常访问请求筛选方法及装置 | |
CN106603690A (zh) | 数据分析装置、数据分析处理系统和数据分析方法 | |
CN109003146A (zh) | 业务数据推广方法、装置、终端和计算机可读存储介质 | |
CN109635192A (zh) | 面向微服务的海量资讯热度排行更新方法及平台 | |
CN107153702A (zh) | 一种数据处理方法及装置 | |
CN104391847A (zh) | 一种基于用户行为的酒店排序方法、云端服务器及系统 | |
CN103595747A (zh) | 用户信息推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150304 |
|
RJ01 | Rejection of invention patent application after publication |