CN112131485A - 房源推荐方法及装置 - Google Patents

房源推荐方法及装置 Download PDF

Info

Publication number
CN112131485A
CN112131485A CN202010839064.6A CN202010839064A CN112131485A CN 112131485 A CN112131485 A CN 112131485A CN 202010839064 A CN202010839064 A CN 202010839064A CN 112131485 A CN112131485 A CN 112131485A
Authority
CN
China
Prior art keywords
user
house
room
interested
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010839064.6A
Other languages
English (en)
Inventor
孙永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN202010839064.6A priority Critical patent/CN112131485A/zh
Publication of CN112131485A publication Critical patent/CN112131485A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种房源推荐方法及装置,通过确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合,可以计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度,并结合用户聚类群对目标区域内第二部分房源的感兴趣程度,确定出目标用户对目标区域内差集部分房源的估计感兴趣程度;最后根据估计感兴趣程度,向目标用户进行房源推荐。结合了看过目标区域内大量房源的用户对不同房源的感兴趣程度,不仅可以避免存在数据稀疏性的问题,还可以保证推荐结果的准确性,提升用户体验。

Description

房源推荐方法及装置
技术领域
本发明涉及计算机软件应用技术领域,尤其涉及一种房源推荐方法及装置。
背景技术
随着房屋租售平台的大量涌现,为了缩短房源查找时间,用户往往会在实地看房前先在线上查询相关的房源信息。因此,房屋租售平台为用户推荐房源功能的开发至关重要。
通常,房屋租售平台在推荐房源时,主要利用海量的用户偏好数据,计算单个用户与目标用户的喜好相似度,并根据与目标用户喜好相似的用户的喜好,向目标用户推荐可能感兴趣的房源,从而提高用户粘性,提高房源的带看量及成交量等。
但是现有技术中的房源推荐方法,以单个用户的兴趣作为考量标准,为喜好相似的用户推荐房源,这样不仅推荐不准确,而且存在数据稀疏性的问题。
发明内容
为克服上述问题或者至少部分地解决上述问题,本发明实施例提供了一种房源推荐方法及装置。
第一方面,本发明实施例提供了一种房源推荐方法,包括:
确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
优选地,所述用户聚类群基于如下方式确定:
计算样本用户的喜好相似度矩阵以及度矩阵;
基于所述喜好相似度矩阵以及所述度矩阵,确定拉普拉斯矩阵以及所述拉普拉斯矩阵的特征向量矩阵;
基于所述特征向量矩阵,对样本用户的喜好进行聚类,得到所述用户聚类群。
优选地,所述计算样本用户的喜好相似度矩阵,具体包括:
确定所述样本用户的喜好变量;
计算每两个样本用户的喜好变量的差值;
基于所述差值,确定所述样本用户的喜好相似度矩阵。
优选地,所述基于所述特征向量矩阵,对样本用户进行聚类,得到所述用户聚类群,具体包括:
基于k-means算法,将所述特征向量矩阵中所有行聚类成多簇,每簇均为所述用户聚类群。
优选地,所述基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度,具体包括:
计算所述相似度与所述用户聚类群对所述目标区域内差集部分房源的感兴趣程度的乘积,得到第一数值;
将所有用户聚类群对应的第一数值之和作为所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度。
优选地,所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,具体通过如下方式确定:
确定所述用户聚类群对所述目标区域内第二部分房源的浏览次数以及关注次数;
基于所述浏览次数以及所述关注次数,确定所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度。
优选地,所述基于所述估计感兴趣程度,向所述目标用户进行房源推荐,具体包括:
将所述目标用户对所述目标区域内第二部分房源的估计感兴趣程度由大到小进行排序;
基于排序的结果,向所述目标用户进行房源推荐。
第二方面,本发明实施例还提供了一种房源推荐装置,包括:房源集合确定模块、估计感兴趣程度确定模块以及房源推荐模块。其中,
房源集合确定模块用于确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
估计感兴趣程度确定模块用于计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
房源推荐模块用于基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述房源推荐方法的步骤。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述房源推荐方法的步骤。
本发明实施例提供的房源推荐方法及装置,通过确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合,可以计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度,并结合用户聚类群对目标区域内第二部分房源的感兴趣程度,确定出目标用户对目标区域内差集部分房源的估计感兴趣程度;最后根据估计感兴趣程度,向目标用户进行房源推荐。结合了看过目标区域内大量房源的用户对不同房源的感兴趣程度,不仅可以避免存在数据稀疏性的问题,还可以保证推荐结果的准确性,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种房源推荐方法的流程示意图;
图2是本发明实施例提供的一种房源推荐装置的结构示意图;
图3是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现有技术中的房屋租售平台在推荐房源时,主要利用海量的用户偏好数据,计算单个用户与目标用户的喜好相似度,并根据与目标用户喜好相似的用户的喜好,向目标用户推荐可能感兴趣的房源,从而提高用户粘性,提高房源的带看量及成交量等。这种以单个用户的兴趣作为考量标准,为喜好相似的用户推荐房源,这样不仅推荐不准确,而且存在数据稀疏性的问题。为此,本发明实施例中提供了一种房源推荐方法。
图1为本发明实施例中提供的一种房源推荐方法的流程示意图。如图1所示,该房源推荐方法包括:
S1,确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
S2,计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
S3,基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
具体地,本发明实施例中提供的房源推荐方法,用以实现向目标用户进行房源推荐,目标用户是指具有房源推荐需求的用户,即需要向其推荐房源的用户。
首先执行步骤S1,确定出目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合。其中,第一感兴趣房源集合中的元素用于表征目标用户对目标区域内第一部分房源的感兴趣程度,目标区域是指待研究的区域,目标区域内包括目标用户已经看过的房源以及目标用户未看过的房源。第一部分房源是指目标区域内目标用户已经看过的房源,第一部分房源的具体数量可以包括一个或多个。目标用户对目标区域内第一部分房源的感兴趣程度具体可以通过目标用户对第一部分房源的关注次数或者浏览次数确定,还可以通过目标用户对第一部分房源的关注次数以及浏览次数共同确定。
第二感兴趣房源集合中的元素用于表征用户聚类群对目标区域内第二部分房源的感兴趣程度,第二部分房源是指目标区域内用户聚类群已经看过的房源,用户聚类群是指看过目标区域内大量房源的用户根据用户对房源的喜好聚类得到的簇,用户对房源的喜好可以包括房屋面积,价格,朝向,地段,年限,交通以及设施等。聚类的方式可以是谱聚类,也可以是普通聚类方式,本发明实施例中对此不作具体限定。用户聚类群的数量为至少两个,第二部分房源的具体数量可以包括一个或多个。目标用户对目标区域内第二部分房源的感兴趣程度具体可以通过目标用户对第二部分房源的关注次数或者浏览次数确定,还可以通过目标用户对第二部分房源的关注次数以及浏览次数共同确定。
然后执行步骤S2,计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度,这一相似度即表征目标用户与每一用户聚类群的喜好相似程度,相似度越高表示喜好相似程度越高,相似度越低表示喜好相似程度越低。在计算相似度时,可以先将第一感兴趣房源集合以及第二感兴趣房源集合扩展为相同元素数量的新的集合,即可以分别得到第三感兴趣房源集合以及第四感兴趣房源集合。其中,第三感兴趣房源集合由第一感兴趣房源集合扩展得到,第四感兴趣房源集合由第二感兴趣房源集合扩展得到,第三感兴趣房源集合与第四感兴趣房源集合中包含的元素数量相同。第三感兴趣房源集合中除包含有第一感兴趣房源集合中的元素之外,其他元素均可以取值为0或为空。第四感兴趣房源集合中除包含有第二感兴趣房源集合中的元素之外,其他元素可以取值为0或为空。如此可以保证顺利计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度。第一感兴趣房源集合与第二感兴趣房源集合的相似度具体可以采用余弦相似度公式计算得到,也可以通过计算闵可夫斯基距离、曼哈顿距离以及欧式距离等表示相似度,本发明实施例中对此不作具体限定。
由于用户聚类群可能不止一个,得到的第二感兴趣房源集合也可能不止一个,因此计算得到的第一感兴趣房源集合与第二感兴趣房源集合的相似度也可能不止一个,在计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度之后,可以根据计算得到的相似度以及用户聚类群对目标区域内第二部分房源的感兴趣程度,确定出目标用户对目标区域内差集部分房源的估计感兴趣程度。其中,目标区域内差集部分房源是指目标区域内目标用户未看过的房源,并且是较高相似度对应的用户聚类群看过的房源。估计感兴趣程度的确定方式具体可以是基于计算得到的相似度与每一用户聚类群对目标区域内第二部分房源的感兴趣程度的乘积确定,本发明实施例中对此不作具体限定。
最后执行步骤S3,根据步骤S2确定出的估计感兴趣程度,向目标用户进行房源推荐。在进行房源推荐时,具体可以将估计感兴趣程度最高的差集部分房源向目标用户进行推荐,也可以按估计感兴趣程度的高度对差集部分房源进行排序,并将排序结果向目标用户进行推荐。
本发明实施例中提供的房源推荐方法,通过确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合,可以计算出第一感兴趣房源集合与第二感兴趣房源集合的相似度,并结合用户聚类群对目标区域内第二部分房源的感兴趣程度,确定出目标用户对目标区域内差集部分房源的估计感兴趣程度;最后根据估计感兴趣程度,向目标用户进行房源推荐。结合了看过目标区域内大量房源的用户对不同房源的感兴趣程度,不仅可以避免存在数据稀疏性的问题,还可以保证推荐结果的准确性,提升用户体验。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,第一感兴趣房源集合与第二感兴趣房源集合的相似度,具体可以通过如下公式计算得到:
Figure BDA0002640744370000081
其中,wuv为目标用户u的第一感兴趣房源集合与用户聚类群v的第二感兴趣房源集合的相似度,N(u)为目标用户u的第三感兴趣房源集合,N(v)为用户聚类群v的第四感兴趣房源集合。n为目标区域内的房源总数,即第三感兴趣房源集合和第四感兴趣房源集合中均包含有n个元素,Nui为目标用户u对目标区域内第i个房源的感兴趣程度,Nvi为用户聚类群v对目标区域内第i个房源的感兴趣程度。感兴趣程度可以采用0-1之间的数值表示,本发明实施例中对此不作具体限定。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述用户聚类群基于如下方式确定:
计算样本用户的喜好相似度矩阵以及度矩阵;
基于所述喜好相似度矩阵以及所述度矩阵,确定拉普拉斯矩阵以及所述拉普拉斯矩阵的特征向量矩阵;
基于所述特征向量矩阵,对样本用户的喜好进行聚类,得到所述用户聚类群。
具体地,本发明实施例中,在通过聚类方式确定用户聚类群时,具体可以采用谱聚类的方式实现。即,选取看过目标区域内大量房源的多个样本用户,所有样本用户看过的房源可以是目标区域内的所有房源。其中,样本用户的数量具体可以根据需要进行设定,本发明实施例中可以用n表示样本用户的数量。样本用户对房源的喜好变量可以包括房屋面积,价格,朝向,地段,年限,交通以及设施等喜好。所有样本用户可以表示为X={x1,x2,…,xi,…,xn},其中,xi表示第i个样本用户的喜好变量集合。
样本用户的喜好相似度矩阵是指任意两个样本用户之间的喜好相似度,在计算样本用户的喜好相似度矩阵W时,W中第i行第j列的元素wij表示样本用户i与样本用户j之间的喜好相似度,具体可以采用如下公式表示:
wij=w(xi,xj)。
样本用户的度矩阵是指每个样本用户对应的对角矩阵,在计算样本用户的度矩阵D时,D中第i个元素di表示样本用户i与所有样本用户的喜好相似度之和,具体计算公式如下:
Figure BDA0002640744370000091
其中,度矩阵D是由di组成的n*n对角矩阵。
在计算出样本用户的喜好相似度矩阵以及度矩阵之后,根据喜好相似度矩阵以及度矩阵,确定出拉普拉斯矩阵L以及拉普拉斯矩阵L的特征向量矩阵U。其中,拉普拉斯矩阵L可以通过度矩阵D与喜好相似度矩阵W之差确定,具体表示为:
L=D-W。
计算拉普拉斯矩阵L的特征值,并将特征值从小到大进行排序。设谱聚类的聚类簇数量为K,则可以选取排序结果中前K个特征值,分别计算出前K个特征值中每个特征值的特征向量,分别表示为:
u1、u2、…、uK
其中,每个特征值的特征向量均为列向量;拉普拉斯矩阵L的特征向量矩阵U则可以表示为:
U={u1,u2,…,uK},U∈Rn*K
最后,根据特征向量矩阵U,即可对所有样本用户的喜好进行聚类,得到多个用户聚类群。
聚类方式可以是:首先,将特征向量矩阵U的第i行的向量用yi∈RK表示,其中,i=1,2,…,n。则特征向量矩阵U可以表示为:
U={y1;y2;…;yn}。
然后根据现有技术常用的聚类算法即可将特征向量矩阵U重新聚类成多簇,每个簇均表示一个用户聚类群。
本发明实施例中,通过谱聚类的方式确定出用户聚类簇,可以使得确定出的用户聚类群更加准确,可以用于表征具有相同或相近的喜好的所有样本用户。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述计算样本用户的喜好相似度矩阵,具体包括:
确定所述样本用户的喜好变量;
计算每两个样本用户的喜好变量的差值;
基于所述差值,确定所述样本用户的喜好相似度矩阵。
具体地,本发明实施例中在计算样本用户的喜好相似度矩阵时,具体可以先确定样本用户的喜好变量,即可以包括房屋面积,价格,朝向,地段,年限,交通以及设施等喜好。然后计算每两个样本用户的喜好变量的差值;并根据计算得到的所有差值确定出样本用户的喜好相似度矩阵。具体计算公式如下:
Figure BDA0002640744370000101
其中,σ为所有样本用户的喜好变量的方差。
本发明实施例中,给出了样本用户的喜好相似度矩阵的具体计算方式,可以更加快速方便的确定出样本用户的喜好相似度矩阵。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述基于所述特征向量矩阵,对样本用户进行聚类,得到所述用户聚类群,具体包括:
基于k-means算法,将所述特征向量矩阵中所有行聚类成多簇,每簇均为所述用户聚类群。
具体地,本发明实施例中在根据特征向量矩阵U对样本用户进行聚类得到用户聚类群时,具体可以将U={y1;y2;…;yn}按行进行聚类,即将U中的n行聚类成K行,即得到多个簇构成的簇集合C:
C=C1、C2、…、CK
其中,属于每个用户聚类群的所有样本用户具有相同或相近的喜好。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度,具体包括:
计算所述相似度与所述用户聚类群对所述目标区域内差集部分房源的感兴趣程度的乘积,得到第一数值;
将所有用户聚类群对应的第一数值之和作为所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度。
具体地,本发明实施例中,在确定目标用户对目标区域内差集部分房源的估计感兴趣程度时,首先可以计算相似度与用户聚类群对目标区域内差集部分房源的感兴趣程度的乘积,得到第一数值;然后将所有用户聚类群对应的第一数值之和作为目标用户对目标区域内差集部分房源的估计感兴趣程度,还可以从所有用户聚类群中选取看过第i个房源的、且与目标用户u的相似度最高的前K个用户聚类群,并将选取的前K个用户聚类群对应的第一数值之和作为目标用户对目标区域内差集部分房源的估计感兴趣程度。具体可以如下公式所示:
Figure BDA0002640744370000121
其中,v∈S(u,K)∩N(i)表示看过第i个房源的、且与目标用户u的相似度最高的前K个用户聚类群v。需要说明的是,上述公式中表示的是目标用户对目标区域内所有房源的估计感兴趣程度,既包括了与目标用户的相似度最高的前K个用户聚类群看过的,也包括目标用户u看过的,将二者相减,即得到目标用户对目标区域内差集部分房源的估计感兴趣程度。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,具体通过如下方式确定:
确定所述用户聚类群对所述目标区域内第二部分房源的浏览次数以及关注次数;
基于所述浏览次数以及所述关注次数,确定所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度。
具体地,本发明实施例中,在表示用户聚类群对目标区域内第二部分房源的感兴趣程度时,具体可以将浏览次数以及关注次数进行结合,即先确定用户聚类群对目标区域内第二部分房源的浏览次数以及关注次数,例如分别设为zvi和yvi,分别表示用户聚类群v对第二部分房源i的浏览次数以及用户聚类群v对第二部分房源i的关注次数。根据浏览次数zvi以及关注次数yvi,可以通过如下公式确定用户聚类群v对目标区域内第二部分房源i的感兴趣程度:
Nvi=kzvi+hyvi
其中,k和h均为常数。
本发明实施例中,同时考虑用户聚类群对第二部分房源i的浏览次数以及关注次数确定用户聚类群对目标区域内第二部分房源的感兴趣程度,可以使得确定的结果更加准确。
在上述实施例的基础上,本发明实施例中在确定目标用户对目标区域内第一部分房源的感兴趣程度时,也可以结合目标用户对第一部分房源的浏览次数以及关注次数确定目标用户对目标区域内第一部分房源的感兴趣程度确定,可以使得确定的结果更加准确。
需要说明的是,对于第三感兴趣房源集合以及第四感兴趣房源集合而言,其中的房源均可以用i表示,即不对第一部分房源以及第二部分房源进行区分,这是因为第三感兴趣房源集合以及第四感兴趣房源集合中的元素数量相同,其中既包括了第一部分房源也包括了第二部分房源,只是二者的查看对象不同而已。
在上述实施例的基础上,本发明实施例中提供的房源推荐方法,所述基于所述估计感兴趣程度,向所述目标用户进行房源推荐,具体包括:
将所述目标用户对所述目标区域内第二部分房源的估计感兴趣程度由大到小进行排序;
基于排序的结果,向所述目标用户进行房源推荐。
具体地,本发明实施例中在向目标用户进行房源推荐时,可以先将目标用户对目标区域内第二部分房源的估计感兴趣程度由大到小进行排序,然后选取排序结果中的前M个并按次序向目标用户推荐第二部分房源。可以同时向目标用户推荐M个房源且可以使目标用户先看到最可能感兴趣的房源。
图2为本发明实施例中提供的一种房源推荐装置的结构示意图,如图2所示,该房源推荐装置包括:房源集合确定模块21、估计感兴趣程度确定模块22以及房源推荐模块23。其中,
房源集合确定模块21用于确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
估计感兴趣程度确定模块22用于计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
房源推荐模块23用于基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
具体地,本发明实施例中提供的房源推荐装置中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,还包括:用户聚类群确定模块;所述用户聚类群包括:第一矩阵计算模块、第二矩阵计算模块以及用户聚类群确定子模块;
所述第一矩阵计算模块用于:计算样本用户的喜好相似度矩阵以及度矩阵;
所述第二矩阵计算模块用于:基于所述喜好相似度矩阵以及所述度矩阵,确定拉普拉斯矩阵以及所述拉普拉斯矩阵的特征向量矩阵;
所述用户聚类群确定子模块用于:基于所述特征向量矩阵,对样本用户的喜好进行聚类,得到所述用户聚类群。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,所述第一矩阵计算模块具体用于:
确定所述样本用户的喜好变量;
计算每两个样本用户的喜好变量的差值;
基于所述差值,确定所述样本用户的喜好相似度矩阵。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,所述用户聚类群确定子模块具体用于:
基于k-means算法,将所述特征向量矩阵中所有行聚类成多簇,每簇均为所述用户聚类群。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,所述估计感兴趣程度确定模块具体用于:
计算所述相似度与所述用户聚类群对所述目标区域内差集部分房源的感兴趣程度的乘积,得到第一数值;
将所有用户聚类群对应的第一数值之和作为所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,还包括:感兴趣程度确定模块;所述感兴趣程度确定模块用于:
确定所述用户聚类群对所述目标区域内第二部分房源的浏览次数以及关注次数;
基于所述浏览次数以及所述关注次数,确定所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度。
在上述实施例的基础上,本发明实施例中提供的房源推荐装置,所述房源推荐模块具体用于:
将所述目标用户对所述目标区域内第二部分房源的估计感兴趣程度由大到小进行排序;
基于排序的结果,向所述目标用户进行房源推荐。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行房源推荐方法,包括:确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
需要说明的是,本实施例中的电子设备在具体实现时可以为服务器,也可以为PC机,还可以为其他设备,只要其结构中包括如图3所示的处理器310、通信接口320、存储器330和通信总线340,其中处理器310、通信接口320和存储器330通过通信总线340完成相互间的通信,且处理器310可以调用存储器330中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的房源推荐方法,包括:确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的房源推荐方法,包括:确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种房源推荐方法,其特征在于,包括:
确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
2.根据权利要求1所述的房源推荐方法,其特征在于,所述用户聚类群基于如下方式确定:
计算样本用户的喜好相似度矩阵以及度矩阵;
基于所述喜好相似度矩阵以及所述度矩阵,确定拉普拉斯矩阵以及所述拉普拉斯矩阵的特征向量矩阵;
基于所述特征向量矩阵,对样本用户的喜好进行聚类,得到所述用户聚类群。
3.根据权利要求2所述的房源推荐方法,其特征在于,所述计算样本用户的喜好相似度矩阵,具体包括:
确定所述样本用户的喜好变量;
计算每两个样本用户的喜好变量的差值;
基于所述差值,确定所述样本用户的喜好相似度矩阵。
4.根据权利要求2所述的房源推荐方法,其特征在于,所述基于所述特征向量矩阵,对样本用户进行聚类,得到所述用户聚类群,具体包括:
基于k-means算法,将所述特征向量矩阵中所有行聚类成多簇,每簇均为所述用户聚类群。
5.根据权利要求1所述的房源推荐方法,其特征在于,所述基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度,具体包括:
计算所述相似度与所述用户聚类群对所述目标区域内差集部分房源的感兴趣程度的乘积,得到第一数值;
将所有用户聚类群对应的第一数值之和作为所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度。
6.根据权利要求1所述的房源推荐方法,其特征在于,所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,具体通过如下方式确定:
确定所述用户聚类群对所述目标区域内第二部分房源的浏览次数以及关注次数;
基于所述浏览次数以及所述关注次数,确定所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度。
7.根据权利要求1-6中任一项所述的房源推荐方法,其特征在于,所述基于所述估计感兴趣程度,向所述目标用户进行房源推荐,具体包括:
将所述目标用户对所述目标区域内第二部分房源的估计感兴趣程度由大到小进行排序;
基于排序的结果,向所述目标用户进行房源推荐。
8.一种房源推荐装置,其特征在于,包括:
房源集合确定模块,用于确定目标用户的第一感兴趣房源集合以及用户聚类群的第二感兴趣房源集合;所述第一感兴趣房源集合中的元素用于表征所述目标用户对目标区域内第一部分房源的感兴趣程度,所述第二感兴趣房源集合中的元素用于表征所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度;
估计感兴趣程度确定模块,用于计算所述第一感兴趣房源集合与所述第二感兴趣房源集合的相似度,并基于所述相似度以及所述用户聚类群对所述目标区域内第二部分房源的感兴趣程度,确定所述目标用户对所述目标区域内差集部分房源的估计感兴趣程度;
房源推荐模块,用于基于所述估计感兴趣程度,向所述目标用户进行房源推荐。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的房源推荐方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的房源推荐方法的步骤。
CN202010839064.6A 2020-08-19 2020-08-19 房源推荐方法及装置 Pending CN112131485A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010839064.6A CN112131485A (zh) 2020-08-19 2020-08-19 房源推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010839064.6A CN112131485A (zh) 2020-08-19 2020-08-19 房源推荐方法及装置

Publications (1)

Publication Number Publication Date
CN112131485A true CN112131485A (zh) 2020-12-25

Family

ID=73851097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010839064.6A Pending CN112131485A (zh) 2020-08-19 2020-08-19 房源推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112131485A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI786510B (zh) * 2021-01-08 2022-12-11 聚英企業管理顧問股份有限公司 對客戶的熟識度分析裝置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180075512A1 (en) * 2016-09-13 2018-03-15 Adobe Systems Incorporated Item recommendation techniques
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN111222960A (zh) * 2020-01-17 2020-06-02 青梧桐有限责任公司 基于公共流量带的房源推荐方法及系统
CN111310056A (zh) * 2020-03-11 2020-06-19 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180075512A1 (en) * 2016-09-13 2018-03-15 Adobe Systems Incorporated Item recommendation techniques
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN111222960A (zh) * 2020-01-17 2020-06-02 青梧桐有限责任公司 基于公共流量带的房源推荐方法及系统
CN111310056A (zh) * 2020-03-11 2020-06-19 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI786510B (zh) * 2021-01-08 2022-12-11 聚英企業管理顧問股份有限公司 對客戶的熟識度分析裝置

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
CN106651542B (zh) 一种物品推荐的方法及装置
CN108256568B (zh) 一种植物种类识别方法以及装置
CN107369075B (zh) 商品的展示方法、装置和电子设备
US10423648B2 (en) Method, system, and computer readable medium for interest tag recommendation
EP3039577B1 (en) Method and system for recommending online products
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN105956628B (zh) 数据分类方法和用于数据分类的装置
US20150039583A1 (en) Method and system for searching images
CN107330750B (zh) 一种推荐产品配图方法及装置,电子设备
US9088811B2 (en) Information providing system, information providing method, information providing device, program, and information storage medium
CN110008397B (zh) 一种推荐模型训练方法及装置
CN108021708B (zh) 内容推荐方法、装置与计算机可读存储介质
CN110175895B (zh) 一种物品推荐方法及装置
US20120296900A1 (en) Adaptively learning a similarity model
CN114820123A (zh) 团购商品推荐方法、装置、设备及存储介质
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN112529665A (zh) 基于组合模型的产品推荐方法、装置及计算机设备
CN111861605A (zh) 业务对象推荐方法
CN112907334A (zh) 一种对象推荐方法及装置
CN115271976A (zh) 一种顾问推荐的方法、装置及计算机可读存储介质
CN112131485A (zh) 房源推荐方法及装置
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN112529636A (zh) 商品推荐方法、装置、计算机设备及介质
CN111488479B (zh) 超图构建方法、装置以及计算机系统和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination