CN113034224A - 基于相似性的房源推荐方法、系统、设备及存储介质 - Google Patents

基于相似性的房源推荐方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113034224A
CN113034224A CN202110281489.4A CN202110281489A CN113034224A CN 113034224 A CN113034224 A CN 113034224A CN 202110281489 A CN202110281489 A CN 202110281489A CN 113034224 A CN113034224 A CN 113034224A
Authority
CN
China
Prior art keywords
purchased
unpurchased
user
house source
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110281489.4A
Other languages
English (en)
Inventor
李琦
宋卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Ruiyun Technology Co ltd
Original Assignee
Chongqing Ruiyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Ruiyun Technology Co ltd filed Critical Chongqing Ruiyun Technology Co ltd
Priority to CN202110281489.4A priority Critical patent/CN113034224A/zh
Publication of CN113034224A publication Critical patent/CN113034224A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于相似性的房源推荐方法、系统、设备及存储介质,其中,方法包括:提取已购买用户信息、未购买用户信息、已购买房源信息及未购买房源信息;对已购买用户信息、未购买用户信息、已购买房源信息及未购买房源信息依次进行特征提取和数值化处理,获取已购买用户特征数值、未购买用户特征数值、已购买房源特征数值和未购买房源特征数值;计算获取第一相似度,根据第一相似度筛选相似用户,根据相似用户获取对应的已购买房源信息,计算获取第二相似度,根据第二相似度筛选相似未购买房源信息,并推送至未购买用户。本发明能够根据未购买用户匹配相似已购买用户,从而更能满足未购买用户的需求,实现房源的精准推荐。

Description

基于相似性的房源推荐方法、系统、设备及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于相似性的房源推荐方法、系统、设备及存储介质。
背景技术
随着网络技术的不断发展,用户能够通过各类房源推荐系统查找到自己需要的房屋资源信息。在现有技术中,房源推荐系统主要是根据各类算法对用户的喜好进行分析,并根据用户的喜好生成对应的推荐模型,通过该推荐模型,房源推荐系统能够根据用户的喜好为用户进行房源推荐。
但是只有实际购买过的用户才能够通过其喜好对用户进行精准的房源推荐,而没有过购买记录的用户对各类房源的喜好程度难以确定,简单的通过喜好程度进行推荐是不能够满足未购买用户的需求的,甚至可能与未购买用户的实际需求相差较大,不够精准。
发明内容
基于此,有必要针对上述技术问题,提供一种基于相似性的房源推荐方法、系统、设备及存储介质。
一种基于相似性的房源推荐方法,包括以下步骤:提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表;对所述已购买用户信息进行用户特征提取,并对所述已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据;将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值;获取当前未购买用户信息,对所述未购买用户信息进行特征提取,获取未购买用户特征数据,并对所述未购买用户特征数据进行数值化处理,获取未购买用户特征数值;计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户;根据所述若干相似已购买用户的相似已购买房源特征数值,计算所述未购买房源特征数值与所述相似已购买房源特征数值之间的第二相似度,根据所述第二相似度筛选相似未购买房源信息,并所述相似未购买房源信息推送至所述未购买用户。
在其中一个实施例中,所述用户特征包括性别、年龄、月平均收入、置业次数、意向面积、意向户型、意向城市、居住城市、工作城市、家庭结构、婚姻情况和学历;所述房源特征包括建筑面积、套内面积、楼层、地区、单价、周边学校、周边交通、周边医疗、周边娱乐、建筑年限、户型、采光和小区环境。
在其中一个实施例中,所述将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值,具体包括:将已购买用户特征数值、已购买房源特征数据和未购买房源特征数据中的所有特征数据进行分类,获取离散型特征数据和连续型特征数据;将所述连续型特征数据转化为连续正整数,将所述离散型特征数据进行一位有效编码,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
在其中一个实施例中,所述计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户,具体包括:对所述已购买用户特征数值和所述未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素;对所述已购买用户特征数值和所述未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素;将所述第一相似度的主要因素和第一相似度的次要因素进行加权平均算法,获取所述第一相似度。
在其中一个实施例中,所述对所述已购买用户特征数值和所述未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素,采用的公式为:
Figure BDA0002978899580000021
其中,在所述次要因素相同的前提下,cos(θ)的值越接近于1,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
在其中一个实施例中,所述对所述已购买用户特征数值和所述未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素,采用的公式为:
Figure BDA0002978899580000031
其中,在所述主要因素相同的前提下,d(x,y)的值越小,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
在其中一个实施例中,还包括:采用Sigmoid函数对所述次要因素的数值范围进行压缩,所述Sigmoid函数的公式为:
Figure BDA0002978899580000032
通过所述Sigmoid函数将所述次要因素的数值范围压缩至0~1。
一种基于相似性的房源推荐系统,包括:信息提取模块,用于提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表;特征提取模块,用于对所述已购买用户信息进行用户特征提取,并对所述已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据;第一数值化处理模块,用于将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值;第二数值化处理模块,用于获取当前未购买用户信息,对所述未购买用户信息进行特征提取,获取未购买用户特征数据,并对所述未购买用户特征数据进行数值化处理,获取未购买用户特征数值;第一相似度计算模块,用于计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户;第二相似度计算模块,用于根据所述若干相似已购买用户的相似已购买房源特征数值,计算所述未购买房源特征数值与所述相似已购买房源特征数值之间的第二相似度,根据所述第二相似度筛选相似未购买房源信息,并所述相似未购买房源信息推送至所述未购买用户。
一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的基于相似性的房源推荐方法的步骤。
一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的基于相似性的房源推荐方法的步骤。
相比于现有技术,本发明的优点及有益效果在于:本发明能够根据未购买用户获取已购买用户的相似房源,从而能够基于相同需求对未购买用户进行房源推荐,更能够未购买用户的需求,实现房源的精准推荐。
附图说明
图1为一个实施例中一种基于相似性的房源推荐方法的流程示意图;
图2为一个实施例中一种基于相似性的房源推荐系统的结构示意图;
图3为一个实施例中设备的内部结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供了一种基于相似性的房源推荐方法,包括以下步骤:
步骤S101,提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表。
具体地,已购买用户信息也可以是具有建档记录或多次浏览记录的用户信息;未购买房源信息为现有房源或者即将开售的房源信息;将已购买用户信息和对应的已购买房源信息以及未购买房源信息进行提取,生成数据信息表,便于后续对数据信息查询或处理。
步骤S102,对已购买用户信息进行用户特征提取,并对已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据。
具体地,对已购买用户的信息进行用户特征提取,用户特征提取可以是年龄、性别或意向面积等等;并对已购买房源信息和未购买房源信息进行房源特征提取,房源特征提取可以是建筑面积、套内面积、楼层或单价等等,从而获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据。
其中,用户特征包括:性别、年龄、月平均收入、置业次数、意向面积、意向户型、意向城市、居住城市、工作城市、家庭结构、婚姻情况和学历;房源特征包括建筑面积、套内面积、楼层、地区、单价、周边学校、周边交通、周边医疗、周边娱乐、建筑年限、户型、采光和小区环境。
步骤S103,将已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
具体地,将已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,可以对根据特征数据具有的类别数为单个或多个进行分类,从而分别进行连续型或离散型数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
步骤S104,获取当前未购买用户信息,对未购买用户信息进行特征提取,获取未购买用户特征数据,并对未购买用户特征数据进行数值化处理,获取未购买用户特征数值。
具体地,当前未购买用户可以是单个用户,对该未购买用户信息进行特征提取,获取该未购买用户特征数据,并对未购买用户特征数据进行分类,分为离散型特征数据和连续型特征数据,并分别进行一位有效编码和连续正整数化,从而获取未购买用户特征数值。
其中,未购买用户的特征与已购买用户特征相同,包括有性别、年龄、月平均收入、置业次数、意向面积、意向户型、意向城市、居住城市、工作城市、家庭结构、婚姻情况和学历等。
步骤S105,计算已购买用户特征数值和未购买用户特征数值之间的第一相似度,根据第一相似度筛选出若干相似已购买用户。
具体地,根据已购买买用户特征数值和未购买用户特征数据获取第一相似度,并根据第一相似度的高低筛选与未购买用户相似的若干相似已购买用户,例如将第一相似度值降序排列在前五位的已购买用户作为相似用户,从而匹配到相似用户,便于进行一步获取相似用户之间的相同需求。
步骤S106,根据若干相似已购买用户的相似已购买房源特征数值,计算未购买房源特征数值与相似已购买房源特征数值之间的第二相似度,根据第二相似度筛选相似未购买房源信息,并将相似未购买房源信息推送至未购买用户。
具体地,获取若干相似已购买用户对应的相似已购买房源特征数值,以及所有未购买房源特征数值,根据未购买房源特征数值和相似已购买房源特征数值,计算出第二相似度,将第二相似度降序排列,获取排序位于前列(例如位于前五位的未购买房源信息)的相似未购买房源信息,将该相似未购买房源信息推送至未购买用户。
在本实施例中,提取已购买用户信息和对应的已购买房源信息及未购买房源信息,生成数据信息表,对已购买用户信息和未购买用户信息进行用户特征提取,分别获取已购买用户特征数据和未购买用户特征数据,对已购买房源信息和未购买房源信息进行房源特征提取,分别获取已购买房源特征数据和未购买房源特征数据;对已购买用户特征数据、未购买用户特征数据、已购买房源特征数据和未购买房源特征数据均进行数值化处理,获取已购买用户特征数值、未购买用户特征数值、已购买房源特征数值和未购买房源特征数值;根据已购买用户特征数据和未购买用户特征数据获取第一相似度,根据第一相似度筛选出若干相似已购买用户,根据若干相似已购买用户获取相似已购买房源特征数值,根据相似已购买房源特征数值和未购买房源特征数值获取第二相似度,根据第二相似度筛选相似未购买房源信息,并将相似未购买房源信息推送至未购买用户,从而实现相似用户之间基于相同需求下的精准房源推荐,能够实现房源的精准推荐,满足未购买用户的需求。
其中,步骤S101具体包括:将已购买用户特征数值、已购买房源特征数据和未购买房源特征数据中的所有特征数据进行分类,获取离散型特征数据和连续型特征数据,将连续型特征数据转化为连续正整数,将离散型特征数据进行一位有效编码,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
具体地,连续型特征数据为具有单个类别的特征数据,可以转换为连续正整数。例如用户学历情况为连续型,如表1所示,转化为连续型值,如表2所示。
表1用户学历情况表
用户\学历 学历
用户1 专科
用户2 本科
用户3 硕士
表2用户学历特征数值表
用户\学历 学历
用户1 1
用户2 2
用户3 3
具体地,离散型特征数据为具有两个及以上类别的特征数据,可以对其进行一位有效编码。例如,用户婚姻状况为离散型,分为已婚、未婚和单身,如表3所示;将婚姻状况进行一位有效编码,如表4所示。
表3用户婚姻状况表
用户\婚姻状况 婚姻状况
用户1 单身
用户2 已婚
用户3 未婚
表4用户婚姻状况特征数值表
用户\婚姻状况 已婚 未婚 单身
用户1 0 0 1
用户2 1 0 0
用户3 0 1 0
具体地,在实际运用中,也可以采用连续型值转化方式和离散值一位有效转换方式对已购买房源特征数据和未购买房源特征数据进行对应的数值转化
其中,步骤S105具体包括:对已购买用户特征数值和未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素;对已购买用户特征数值和未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素;将第一相似度的主要因素和第一相似度的次要因素进行加权平均算法,获取第一相似度。
具体地,由于余弦相似度是在方向上计算两个向量间的夹角余弦值,所以能够更好的体现用户或房源之间的相似性;而欧式距离体现的是数值上的差异,即距离,因此在对已购买用户和未购买用户进行相似度计算时,可以将余弦相似度作为主要因素,将欧式距离计算结果作为次要因素;并对主要因素和次要因素进行加权平均计算,获取第一相似度,例如可以将主要因素权重设置为0.7,次要因此的权重设置为0.3。
具体地,对已购买用户特征数值和未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素,采用的公式为:
Figure BDA0002978899580000081
其中,在所述次要因素相同的前提下,cos(θ)的值越接近于1,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
具体地,对已购买用户特征数值和未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素,采用的公式为:
Figure BDA0002978899580000082
其中,在所述主要因素相同的前提下,d(x,y)的值越小,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
其中,还包括:采用Sigmoid函数对所述次要因素的数值范围进行压缩,所述Sigmoid函数的公式为:
Figure BDA0002978899580000083
通过所述Sigmoid函数将所述次要因素的数值范围压缩至0~1。
在一个实施例中,将未购买用户通过上述步骤计算出与已购买用户的第一相似度,对第一相似度进行排序,选出相似度降序排列在前三位的相似已购买用户,分为三个梯度,计算相似已购买用户对应的已购买房源与现有未购买房源之间的第二相似度,选出相似度降序排列在前三的相似房源信息,并将相似房源信息推荐给未购买用户,从而实现基于相似用户之间的精准推荐。
如图2所示,提供了一种基于相似性的房源推荐系统20,包括:信息提取模块21、特征提取模块22、第一数值化处理模块23、第二数值化处理模块24、第一相似度计算模块25和第二相似度计算模块26,其中:
信息提取模块21,用于提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表;
特征提取模块22,用于对已购买用户信息进行用户特征提取,并对已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据;
第一数值化处理模块23,用于将已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值;
第二数值化处理模块24,用于获取当前未购买用户信息,对未购买用户信息进行特征提取,获取未购买用户特征数据,并对未购买用户特征数据进行数值化处理,获取未购买用户特征数值;
第一相似度计算模块25,用于计算已购买用户特征数值和未购买用户特征数值之间的第一相似度,根据第一相似度筛选出若干相似已购买用户;
第二相似度计算模块26,用于根据若干相似已购买用户的相似已购买房源特征数值,计算未购买房源特征数值与相似已购买房源特征数值之间的第二相似度,根据第二相似度筛选相似未购买房源信息,并相似未购买房源信息推送至未购买用户。
在一个实施例中,第一数值化处理模块23具体用于:将已购买用户特征数值、已购买房源特征数据和未购买房源特征数据中的所有特征数据进行分类,获取离散型特征数据和连续型特征数据;将连续型特征数据转化为连续正整数,将离散型特征数据进行一位有效编码,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
在一个实施例中,第一相似度计算模块25具体用于:对已购买用户特征数值和未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素;对已购买用户特征数值和未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素;将第一相似度的主要因素和第一相似度的次要因素进行加权平均算法,获取第一相似度。
在一个实施例中,提供了一种设备,该设备可以是服务器,其内部结构图可以如图3所示。该设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于相似性的房源推荐方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还可以提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的一种基于相似性的房源推荐系统的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于相似性的房源推荐方法,其特征在于,包括以下步骤:
提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表;
对所述已购买用户信息进行用户特征提取,并对所述已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据;
将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值;
获取当前未购买用户信息,对所述未购买用户信息进行特征提取,获取未购买用户特征数据,并对所述未购买用户特征数据进行数值化处理,获取未购买用户特征数值;
计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户;
根据所述若干相似已购买用户的相似已购买房源特征数值,计算所述未购买房源特征数值与所述相似已购买房源特征数值之间的第二相似度,根据所述第二相似度筛选相似未购买房源信息,并所述相似未购买房源信息推送至所述未购买用户。
2.根据权利要求1所述的基于相似性的房源推荐方法,其特征在于,所述用户特征包括性别、年龄、月平均收入、置业次数、意向面积、意向户型、意向城市、居住城市、工作城市、家庭结构、婚姻情况和学历;所述房源特征包括建筑面积、套内面积、楼层、地区、单价、周边学校、周边交通、周边医疗、周边娱乐、建筑年限、户型、采光和小区环境。
3.根据权利要求1所述的基于相似性的房源推荐方法,其特征在于,所述将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值,具体包括:
将已购买用户特征数值、已购买房源特征数据和未购买房源特征数据中的所有特征数据进行分类,获取离散型特征数据和连续型特征数据;将所述连续型特征数据转化为连续正整数,将所述离散型特征数据进行一位有效编码,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值。
4.根据权利要求1所述的基于相似性的房源推荐方法,其特征在于,所述计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户,具体包括:
对所述已购买用户特征数值和所述未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素;
对所述已购买用户特征数值和所述未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素;
将所述第一相似度的主要因素和第一相似度的次要因素进行加权平均算法,获取所述第一相似度。
5.根据权利要求4所述的基于相似性的房源推荐方法,其特征在于,所述对所述已购买用户特征数值和所述未购买用户特征数值进行余弦相似度计算,获取第一相似度的主要因素,采用的公式为:
Figure FDA0002978899570000021
其中,在所述次要因素相同的前提下,cos(θ)的值越接近于1,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
6.根据权利要求4所述的基于相似性的房源推荐方法,其特征在于,所述对所述已购买用户特征数值和所述未购买用户特征数值进行欧式距离计算,获取第一相似度的次要因素,采用的公式为:
Figure FDA0002978899570000022
其中,在所述主要因素相同的前提下,d(x,y)的值越小,表示所述已购买用户特征数值和所述未购买用户特征数值越相似。
7.根据权利要求6所述的基于相似性的房源推荐方法,其特征在于,还包括:采用Sigmoid函数对所述次要因素的数值范围进行压缩,所述Sigmoid函数的公式为:
Figure FDA0002978899570000023
通过所述Sigmoid函数将所述次要因素的数值范围压缩至0~1。
8.一种基于相似性的房源推荐系统,其特征在于,包括:
信息提取模块,用于提取已购买用户信息和对应的已购买房源信息以及未购买房源信息,并生成数据信息表;
特征提取模块,用于对所述已购买用户信息进行用户特征提取,并对所述已购买房源信息和未购买房源信息进行房源特征提取,获取已购买用户特征数据、已购买房源特征数据和未购买房源特征数据;
第一数值化处理模块,用于将所述已购买用户特征数据、已购买房源特征数据和未购买房源特征数据进行数值化处理,获取已购买用户特征数值、已购买房源特征数值和未购买房源特征数值;
第二数值化处理模块,用于获取当前未购买用户信息,对所述未购买用户信息进行特征提取,获取未购买用户特征数据,并对所述未购买用户特征数据进行数值化处理,获取未购买用户特征数值;
第一相似度计算模块,用于计算所述已购买用户特征数值和所述未购买用户特征数值之间的第一相似度,根据所述第一相似度筛选出若干相似已购买用户;
第二相似度计算模块,用于根据所述若干相似已购买用户的相似已购买房源特征数值,计算所述未购买房源特征数值与所述相似已购买房源特征数值之间的第二相似度,根据所述第二相似度筛选相似未购买房源信息,并所述相似未购买房源信息推送至所述未购买用户。
9.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110281489.4A 2021-03-16 2021-03-16 基于相似性的房源推荐方法、系统、设备及存储介质 Pending CN113034224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110281489.4A CN113034224A (zh) 2021-03-16 2021-03-16 基于相似性的房源推荐方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110281489.4A CN113034224A (zh) 2021-03-16 2021-03-16 基于相似性的房源推荐方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113034224A true CN113034224A (zh) 2021-06-25

Family

ID=76470973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110281489.4A Pending CN113034224A (zh) 2021-03-16 2021-03-16 基于相似性的房源推荐方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113034224A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115187150A (zh) * 2022-09-13 2022-10-14 绿城科技产业服务集团有限公司 一种基于智慧园区管理平台的人才公寓分配方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087177A (zh) * 2018-08-21 2018-12-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质
CN109636538A (zh) * 2018-12-20 2019-04-16 成都知数科技有限公司 银行产品推荐方法、装置及服务器
CN109658192A (zh) * 2018-12-20 2019-04-19 重庆锐云科技有限公司 一种房源推荐方法及服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087177A (zh) * 2018-08-21 2018-12-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质
CN109636538A (zh) * 2018-12-20 2019-04-16 成都知数科技有限公司 银行产品推荐方法、装置及服务器
CN109658192A (zh) * 2018-12-20 2019-04-19 重庆锐云科技有限公司 一种房源推荐方法及服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115187150A (zh) * 2022-09-13 2022-10-14 绿城科技产业服务集团有限公司 一种基于智慧园区管理平台的人才公寓分配方法及系统

Similar Documents

Publication Publication Date Title
WO2018103718A1 (zh) 应用推荐的方法、装置及服务器
Cao et al. Automatic selection of t-SNE perplexity
Tran et al. An effective and efficient approach to classification with incomplete data
CN111371858B (zh) 群控设备识别方法、装置、介质及电子设备
Mellor et al. Application of data mining to “big data” acquired in audiology: Principles and potential
CN111506723A (zh) 问答响应方法、装置、设备及存储介质
Marie et al. Boosting schema matchers
CN107818336A (zh) 一种基于城市特定人群和关联政策的匹配推荐方法及系统
EP3452916A1 (en) Large scale social graph segmentation
CN108320778A (zh) 病案icd编码方法及系统
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN113034224A (zh) 基于相似性的房源推荐方法、系统、设备及存储介质
CN111985578A (zh) 多源数据融合方法、装置、计算机设备及存储介质
AU2019305102B2 (en) System and method for genealogical entity resolution
CN111859117A (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN111667018A (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
Peyhardi et al. Partitioned conditional generalized linear models for categorical responses
CN116150690A (zh) DRGs决策树构建方法及装置、电子设备、存储介质
CN110765110A (zh) 泛化能力处理方法、装置、设备及存储介质
Gruca et al. Rule based functional description of genes–estimation of the multicriteria rule interestingness measure by the UTA method
CN113010759B (zh) 聚类集合的处理方法、装置、计算机可读介质及电子设备
JP6974878B2 (ja) 診療ガイドラインをコンピュータにて解釈可能なモデルに変換するための方法及びシステム
CN114862006A (zh) 一种基于人工智能的社会工作服务方案自动化生成方法和装置
CN114417165A (zh) 一种心理矫治方法、装置及终端设备
CN117194966A (zh) 对象分类模型的训练方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210625

RJ01 Rejection of invention patent application after publication