CN108256067A - 计算房源相似度的方法、装置、设备及存储介质 - Google Patents
计算房源相似度的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN108256067A CN108256067A CN201810042038.3A CN201810042038A CN108256067A CN 108256067 A CN108256067 A CN 108256067A CN 201810042038 A CN201810042038 A CN 201810042038A CN 108256067 A CN108256067 A CN 108256067A
- Authority
- CN
- China
- Prior art keywords
- source
- houses
- user
- data
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Abstract
本发明公开了一种计算房源相似度的方法,所述方法包括以下步骤:获取用户房源图像,并提取所述用户房源图像中的房源特征标签;根据所述房源特征标签爬取房源数据;计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送。本发明还公开了一种计算房源相似度的装置、设备及计算机可读存储介质。本发明能够根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间。
Description
技术领域
本发明涉及数据分析与处理领域,尤其涉及一种计算房源相似度的方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网的进步,人们在需要购买房子或者租赁房子时,越来越倾向于在网上进行查找房源,从而缩短查找房源的时间,提高查找房源的效率。
但目前市面上的房产信息平台通常采用的是用户主动搜索、筛选等方式,完全由用户主动来寻找适合自己的房源,而房产信息平台上的房源较多,这种方式通过用户自动搜索、筛选对用户而已费时费力,并且大量房源被淹没在海量数据中,而符合用户需求的房源无法快速到达用户。部分平台虽然也存在推荐但只是热门房源推荐,热门房源并不一定是用户需要的房源,而用户而言,推送并不智能,而如果采用人工介入,分析用户需要的房源,然后进行推送,会导致网站的运营成本变高。
发明内容
本发明的主要目的在于提出一种计算房源相似度的方法、装置、设备及计算机可读存储介质,旨在解决现有的房源推送不智能,而采用人工进行推送,会导致成本升高的技术问题。
为实现上述目的,本发明提供一种计算房源相似度的方法,所述方法包括:
获取用户房源画像,并提取所述用户房源画像中的房源特征标签;
根据所述房源特征标签爬取房源数据;
计算房源特征标签与爬取到的房源数据之间的相似度;
将相似度大于或等于预设值的房源数据向用户进行推送。
进一步地,所述计算的房源特征标签与爬取到的房源数据之间的相似度的步骤包括:
将所述房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量;
计算房源特征标签向量与房源数据特征向量之间的相似度。
进一步地,根据以下公式计算所述相似度:
其中,所述x为房源特征标签向量,y为房源数据特征向量,c1c2为预设系数。
进一步地,所述根据所述房源特征标签爬取房源数据的步骤包括:
启动系统中添加的数据采集器,根据接收到的房源特征标签,选取房源数据;
将选取到的房源数据进行下载保存,获得房源数据。
进一步地,所述将相似度大于或等于预设值的房源数据向用户进行推送的步骤包括:
将相似度大于或等于预设值的房源数据进行相似度排序,获得排序后的房源待推荐清单;
将房源待推荐清单上的房源向用户进行推送。
进一步地,所述获取用户房源图像的步骤之前,还包括:
获取用户在房源系统中填写资料记录以及浏览记录;
通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
根据所述用户填写的数据以及房源数据提取用户房源特征标签;
提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像。
进一步地,所述提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像的步骤包括:
监测生成用户画像后的用户填写的数据以及房源数据;
根据所述生成用户画像后的用户填写的数据以及房源数据对用户进行更新。
此外,为实现上述目的,本发明还提供一种计算房源相似度的装置,所述装置包括:
获取模块,用于获取用户房源图像,并提取所述用户房源图像中的房源特征标签;
爬取模块,用于根据所述房源特征标签爬取房源数据;
计算模块,用于计算房源特征标签与爬取到的房源数据之间的相似度;
推送模块,用于将相似度大于或等于预设值的房源数据向用户进行推送。
此外,为实现上述目的,本发明还提供一种计算房源相似度的设备,所述计算房源相似度的设备包括计算房源相似度的程序,所述计算房源相似度的程序被所述计算房源相似度的设备执行时实现如上所述的计算房源相似度的方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算房源相似度的程序,所述计算房源相似度的程序被处理器执行时实现如上所述的计算房源相似度的方法的步骤。
本发明提出的计算房源相似度的方法、装置、设备及计算机可读存储介质,通过获取用户房源图像,并提取所述用户房源图像中的房源特征标签;然后根据所述房源特征标签爬取房源数据;并计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送,从而提高推送房源的精准度,实现根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间,提高用户体验。
附图说明
图1为本发明计算房源相似度的方法第一实施例的流程示意图;
图2为本发明计算房源相似度的方法第二实施例中计算房源特征标签与爬取到的房源数据之间的相似度的步骤的细化流程示意图;
图3为本发明计算房源相似度的方法第四实施例中根据所述房源特征标签爬取房源数据的步骤的细化流程示意图;
图4为本发明计算房源相似度的方法第五实施例中将相似度大于或等于预设值的房源数据向用户进行推送的步骤的细化流程示意图;
图5为本发明计算房源相似度的方法第六实施例的流程示意图;
图6为本发明计算房源相似度的方法第七实施例的流程示意图;
图7为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:通过获取用户房源图像,并提取所述用户房源图像中的房源特征标签;然后根据所述房源特征标签爬取房源数据;计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送,从而提高推送房源的精准度,实现根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间,提高用户体验。
本发明实施例考虑到,目前市面上的房产信息平台通常采用的是用户主动搜索、筛选等方式,完全由用户主动来寻找适合自己的房源,而房产信息平台上的房源较多,这种方式通过用户自动搜索、筛选对用户而已费时费力,并且大量房源被淹没在海量数据中,而符合用户需求的房源无法快速到达用户。部分平台虽然也存在推荐但只是热门房源推荐,热门房源并不一定是用户需要的房源,而用户而言,推送并不智能,而如果采用人工介入,分析用户需要的房源,然后进行推送,会导致网站的运营成本变高。
为此,本发明实施例提出一种计算房源相似度的方法,通过获取用户房源图像,并提取所述用户房源图像中的房源特征标签;然后根据所述房源特征标签爬取房源数据;计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送,从而提高推送房源的精准度,实现根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间,提高用户体验。
本发明提供一种计算房源相似度的方法。
参照图1,图1为本发明计算房源相似度的方法第一实施例的流程示意图。
在本实施例中,该方法包括:
步骤S10,获取用户房源画像,并提取所述用户房源画像中的房源特征标签;
在本实施例中,首先需要获取用户房源画像,其中,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。因此,用户房源画像是指勾画目标用户、联系用户房源诉求与设计方向的有效工具,是根据用户的房源需求进行构建的,因此,可以通过所述用户房源画像提取用户的房源特征标签,其中,所述房源特征标签即为用户的房源需求,比如若提取到的房源特征标签为300万,80m2,即说明用户的房源需求为总价300万,大小为80m2。
步骤S20,根据所述房源特征标签爬取房源数据;
在提取到得到房源特征标签之后,即可根据所述房源特征标签爬取房源数据,具体地,首先启动房源系统中添加的数据采集器,其中所述数据采集器也可以为安装在浏览器中的数据采集器,其中,数据采集器是用来批量采集网页,论坛等的内容,直接保存到数据或发布到网络的一种信息化工具。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容,现在发展成也可以对数据进行处理的工具(系统)。如SQL Server 2008性能数据采集器可以让我们创建一个中心数据库来存储性能数据;它包含三个内置数据收集组来收集和存储数据;为了帮助我们识别和排除SQL Server性能相关的问题,我们可以使用其内置的三个报表来查看收集存储的数据。然后根据接收到的房源特征标签,选取需要爬取的房源数据,即可获取房源系数据。
步骤S30,计算房源特征标签与爬取到的房源数据之间的相似度;
在爬取到房源数据之后,即可计算房源特征标签与爬取到的房源数据之间的相似度;具体地,首先将所述房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量;然后计算房源特征标签向量与房源数据特征向量之间的相似度。比如,若用户的需求房源为总价位于400-450万,并且总价位于400-450万的房源占的权重为0.7,则用户在位于400-450万的房源特征标签向量为(400-450万,0.7),当获取到的房源数据的总价位于400-450万时,总价的向量为(400-450万,1),假设获取到的房源数据总价为300-350万,则获取到的房源数据总价的向量为(300-350万,0);然后根据房源特征标签向量与房源数据特征向量计算房源之间的相似度。
进一步地,具体公式为
其中,所述x为房源特征标签向量,y为房源数据特征向量,c1c2为预设系数。c1与c2不为0,其中,最优取值为1,具体实施过程中,可以根据数据噪声进行取具体的值,在此不做限制。
步骤S40,将相似度大于或等于预设值的房源数据向用户进行推送。
在计算得到用户房源特征标签与爬取到的房源数据之间的相似度之后,即可获取各个房源与用户房源特征标签之间的相似度,其中,相似度越高,说明与用户的需求房源越接近,因此,可以将各个房源与用户房源特征标签之间的相似度进行排序,然后挑取排序顺序中大于预设排名的房源,并将挑选到的房源向用户进行推送,或者直接将各个房源与用户房源特征标签之间的相似度与预设的相似度进行对比,然后将大于或等于预设相似度的房源向用户进行推送,从而提高向用户推送房源的精准度,提高用户体验。
本实施例提出的计算房源相似度的方法,通过获取用户房源图像,并提取所述用户房源图像中的房源特征标签;然后根据所述房源特征标签爬取房源数据;计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送,从而提高推送房源的精准度,实现根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间,提高用户体验。
进一步地,参照图2,基于本发明计算房源相似度的方法第一实施例提出本发明计算房源相似度的方法第二实施例。
在本实施例中,所述步骤S30包括:
步骤S31,将所述房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量;
在本实施例中,在计算房源特征标签与爬取到的房源数据之间的相似度之前,首先需要将房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量,比如若用户的需求房源为总价位于400-450万,并且总价位于400-450万的房源占的权重为0.7,则用户在位于400-450万的房源特征标签向量为(400-450万,0.7),当获取到的房源数据的总价位于400-450万时,总价的向量为(400-450万,1),假设获取到的房源数据总价为300-350万,则获取到的房源数据总价的向量为(300-350万,0)。
步骤S32,计算房源特征标签向量与房源数据特征向量之间的相似度。
在进行转化之后,即可计算房源特征标签向量与房源数据特征向量之间的相似度,比如假设用户各个一级标签及与对应的权重相乘后的分数为:(A区1分,B区2分,一室户3分,两室户1分,300-400万5分,400-500万1分),则用户A的房源画像对应向量为:A=(1,2,3,1,5,1);爬取到的房源B对应的数据为房源B(A区1分,B区0分,一室户1分,两室户0分,300-400万1分,400-500万0分),则b=(1,0,1,0,1,0);则房源B与用户房源特征标签向量之间的相似度为:
进一步地,参照图3,基于本发明计算房源相似度的方法第一实施例提出本发明计算房源相似度的方法第四实施例。
在本实施例中,所述步骤S20包括:
步骤S21,启动系统中添加的数据采集器,根据接收到的房源特征标签,选取房源数据;
在本实施例中,在提取到得到房源特征标签之后,即可根据所述房源特征标签爬取房源数据,具体地,首先启动房源系统中添加的数据采集器,其中所述数据采集器也可以为安装在浏览器中的数据采集器,其中,数据采集器是用来批量采集网页,论坛等的内容,直接保存到数据或发布到网络的一种信息化工具。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容,现在发展成也可以对数据进行处理的工具(系统)。如SQLServer2008性能数据采集器可以让我们创建一个中心数据库来存储性能数据;它包含三个内置数据收集组来收集和存储数据;为了帮助我们识别和排除SQLServer性能相关的问题,我们可以使用其内置的三个报表来查看收集存储的数据。然后根据接收到的房源特征标签,选取需要爬取的房源数据,即可获取房源系数据。
步骤S22,将选取到的房源数据进行下载保存,获得房源数据。
在爬取到房源数据之后,可以将爬取到的房源数据进行下载保存,或者直接保存至预设的数据库或服务器中,从而获得房源数据。
进一步地,参照图4,基于本发明计算房源相似度的方法第一实施例提出本发明计算房源相似度的方法第五实施例。
在本实施例中,所述步骤S40包括:
步骤S41,将相似度大于或等于预设值的房源数据进行相似度排序,获得排序后的房源待推荐清单;
在本实施例中,在计算得到各个房源与用户房源特征标签之间相似度之后,即可根据所述相似度向用户推送房源,其中,相似度越高,说明与用户的需求房源越接近,因此,可以将各个房源与用户房源特征标签之间的相似度进行排序,然后挑取排序顺序中大于预设排名的房源,获得排序后的房源待推荐清单;
步骤S42,将房源待推荐清单上的房源向用户进行推送。
并将房源待推荐清单上的房源向用户进行推送;进一步地,还可以直接将各个房源与用户房源特征标签之间的相似度与预设的相似度进行对比,然后将大于或等于预设相似度的房源向用户进行推送,从而提高向用户推送房源的精准度,提高用户体验。
进一步地,参照图5,基于本发明计算房源相似度的方法第一实施例提出本发明计算房源相似度的方法第六实施例。
在本实施例中,所述步骤S10之前的步骤,还包括:
步骤S50,获取用户在房源系统中填写资料记录以及浏览记录;
在本实施例中,首先获取用户在房源系统中的填写资料记录以及浏览记录,比如由用户主动填写找房需求的记录及资料,或者用户触发的浏览行为,关注行为,电话咨询行为等;然后可以进一步将用户的记录进行分类,具体地,将用户的历史行为区分为显性行为和隐性行为。显性行为即由用户主动填写找房需求的记录,其中,房源系统中会预设好房需求并在用户访问首页时引导用户填写。隐性行为则为系统日志记录的用户浏览行为,关注行为,电话咨询行为等。在隐性行为中不同的行为会有不同的权重得分,其中,具体的得分大小比为:电话咨询>关注>浏览。
步骤S60,通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
在获取到用户在房源系统中填写资料记录以及浏览记录之后,即可通过所述填写资料记录获取用户填写的资料,比如,用户填写的房源总价,房源户型,房源所在区域等资料,通过所述浏览记录获取用户浏览的房源数据,比如用户浏览的房源的面积,房源总价等,其中,通过所述填写资料记录获取用户填写的资料可以通过用户填写的资料直接获得,而通过所述浏览记录获取用户浏览的房源数据,需要提取用户浏览的房源记录,找到相应的房源页面,然后提取对应的页面数据,然后从所述页面数据中分析用户的房源数据,比如当页面中显示用户浏览的房源的总价为300万,区域为南山区时,即可获知用户的房源数据为总价为300万,区域为南山区。
步骤S70,根据所述用户填写的数据以及房源数据提取用户房源特征标签;
在获得用户填写的数据以及房源数据之后,即可根据所述用户填写的数据以及房源数据提取用户房源特征标签,比如用户填写的数据为房源的总价为300万,房源面积为80m2,则用户房源特征标签为300万,80m2。
步骤S80,提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像。
在获得房源特征标签之后,即可根据所述房源特征标签提取对应的标签分值,比如用户填写的数据为房源的总价为300万,房源面积为80m2,则总价为300万的房源得分为1分,房源面积为80m2的房源得分也是1分,总价为300万且房源面积为80m2的房源得分为2分。同理,用户浏览的房源数据的标签分值与用户填写的数据的标签分值划分原理一样,在此不再赘述。然后根据用户房源特征标签及标签分值即可生成用户画像,即建立用户账户或用户ID,然后将用户房源特征标签以及所述房源特征标签对应的标签分值与用户账户或用户ID进行关联,以便直观地获知用户的房源需求,从而提高向用户推送房源的精准度。进一步地,为了便于直观地获知用户的房源需求,可以对用户的最终标签得分进行归一化处理,比如若用户在总价为300万且房源面积为80m2的房源得分为2分,在总价为200万且房源面积为80m2的房源得分为1分,可以将用户的得分进行归一化,比如,假设用户所有的得分为1,则通过归一化处理,用户在总价为300万且房源面积为80m2的房源得分为2/(2+1)=0.67分,用户在总价为200万且房源面积为80m2的房源得分为1/(2+1)=0.33分,从而更加直观地获知用户的房源需求。
本实施例提出的计算房源相似度的方法,通过获取用户在房源系统中填写资料记录以及浏览记录;然后通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;根据所述用户填写的数据以及房源数据提取用户房源特征标签;提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像,从而获得清晰可分析的用户画像,为推荐房源提供更加精准的数据。
进一步地,参照图6,基于本发明计算房源相似度的方法第六实施例提出本发明计算房源相似度的方法第七实施例。
在本实施例中,所述步骤S80之后的步骤,还包括:
步骤S90,监测生成用户画像后的用户填写的数据以及房源数据;
在本实施例中,由于用户后续的房源需求有可能会发生更改,因此在生成用户画像之后,需要监测生成用户画像后的用户填写的数据以及房源数据,以便了解用户的房源需求是否发生更改;
步骤S100,根据所述生成用户画像后的用户填写的数据以及房源数据对用户进行更新。
在监测到生成用户画像后的用户填写的数据以及房源数据之后,可以首先将监测到的用户填写的数据以及房源数据与生成用户画像前的用户填写的数据以及房源数据进行对比,从而判断用户的房源需求是否发生更改,若监测到的用户填写的数据以及房源数据与生成用户画像前的用户填写的数据以及房源数据一致,则确定用户的房源需求没有发生更改,不需要对用户的画像进行更新,若监测到的用户填写的数据以及房源数据与生成用户画像前的用户填写的数据以及房源数据不一致,则确定用户的房源需求发生了更改,此时需要根据监测到的用户填写的数据以及房源数据对用户图像进行更改。
本发明实施例进一步提供一种计算房源相似度的装置,所述装置包括:
获取模块,用于获取用户房源图像,并提取所述用户房源图像中的房源特征标签;
爬取模块,用于根据所述房源特征标签爬取房源数据;
计算模块,用于计算房源特征标签与爬取到的房源数据之间的相似度;
推送模块,用于将相似度大于或等于预设值的房源数据向用户进行推送。
本发明计算房源相似度的装置的具体实施例与上述计算房源相似度的方法各实施例基本相同,在此不作赘述。
本发明实施例进一步提供一种计算房源相似度的设备。
参照图7,图7为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
如图7所示,该计算房源相似度的设备可以包括:处理器1001,例如CPU,网络接口1002,用户接口1003,存储器1004。这些组件之间的连接通信可以通过通信总线实现。网络接口1002可选的可以包括标准的有线接口(用于连接有线网络)、无线接口(如WI-FI接口、蓝牙接口、红外线接口等,用于连接无线网络)。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口(例如用于连接有线键盘、有线鼠标等)和/或无线接口(例如用于连接无线键盘、无线鼠标)。存储器1004可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1004可选的还可以是独立于前述处理器1001的存储装置。
可选地,该计算房源相似度的设备还可以包括摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图中示出的计算房源相似度的设备结构并不构成对计算房源相似度的设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图7所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、用户接口模块以及计算房源相似度的程序。其中,操作系统是管理和控制计算房源相似度的设备硬件与软件资源的程序,支持网络通信模块、用户接口模块、计算房源相似度的程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图7所示的计算房源相似度的设备中,网络接口1002主要用于连接数据库,与数据库进行数据通信;用户接口1003主要用于连接客户端(可以理解为用户端),与客户端进行数据通信,如通过窗口展示信息给客户端,或者接收客户端发送的操作信息;而处理器1001可以用于执行存储器1004中存储的计算房源相似度的程序,以实现上述计算房源相似度的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述计算房源相似度的方法的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种计算房源相似度的方法,其特征在于,所述方法包括以下步骤:
获取用户房源图像,并提取所述用户房源图像中的房源特征标签;
根据所述房源特征标签爬取房源数据;
计算房源特征标签与爬取到的房源数据之间的相似度;
将相似度大于或等于预设值的房源数据向用户进行推送。
2.如权利要求1所述的计算房源相似度的方法,其特征在于,所述计算房源特征标签与爬取到的房源数据之间的相似度的步骤包括:
将所述房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量;
计算房源特征标签向量与房源数据特征向量之间的相似度。
3.如权利要求1所述的计算房源相似度的方法,其特征在于,所述计算房源特征标签与爬取到的房源数据之间的相似度包括:
根据以下公式计算所述相似度,
其中,所述x为房源特征标签向量,y为房源数据特征向量,c1c2为预设系数。
4.如权利要求1所述的计算房源相似度的方法,其特征在于,所述根据所述房源特征标签爬取房源数据的步骤包括:
启动系统中添加的数据采集器,根据接收到的房源特征标签,选取房源数据;
将选取到的房源数据进行下载保存,获得房源数据。
5.如权利要求1所述的计算房源相似度的方法,其特征在于,所述将相似度大于或等于预设值的房源数据向用户进行推送的步骤包括:
将相似度大于或等于预设值的房源数据进行相似度排序,获得排序后的房源待推荐清单;
将房源待推荐清单上的房源向用户进行推送。
6.如权利要求1-5任一项所述的计算房源相似度的方法,其特征在于,所述获取用户房源图像的步骤之前,还包括:
获取用户在房源系统中填写资料记录以及浏览记录;
通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
根据所述用户填写的数据以及房源数据提取用户房源特征标签;
提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像。
7.如权利要求6所述的计算房源相似度的方法,其特征在于,所述提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户画像的步骤包括:
监测生成用户画像后的用户填写的数据以及房源数据;
根据所述生成用户画像后的用户填写的数据以及房源数据对用户进行更新。
8.一种计算房源相似度的装置,其特征在于,所述装置包括:
获取模块,用于获取用户房源图像,并提取所述用户房源图像中的房源特征标签;
爬取模块,用于根据所述房源特征标签爬取房源数据;
计算模块,用于计算房源特征标签与爬取到的房源数据之间的相似度;
推送模块,用于将相似度大于或等于预设值的房源数据向用户进行推送。
9.一种计算房源相似度的设备,其特征在于,所述计算房源相似度的设备包括计算房源相似度的程序,所述计算房源相似度的程序被所述计算房源相似度的设备执行时实现如权利要求1至7中任一项所述的计算房源相似度的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算房源相似度的程序,所述计算房源相似度的程序被处理器执行时实现如权利要求1至7中任一项所述的计算房源相似度的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810042038.3A CN108256067B (zh) | 2018-01-16 | 2018-01-16 | 计算房源相似度的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810042038.3A CN108256067B (zh) | 2018-01-16 | 2018-01-16 | 计算房源相似度的方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108256067A true CN108256067A (zh) | 2018-07-06 |
CN108256067B CN108256067B (zh) | 2021-07-06 |
Family
ID=62740989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810042038.3A Active CN108256067B (zh) | 2018-01-16 | 2018-01-16 | 计算房源相似度的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256067B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508423A (zh) * | 2018-12-14 | 2019-03-22 | 平安科技(深圳)有限公司 | 基于语义识别的房源推荐方法、装置、设备及存储介质 |
CN109658192A (zh) * | 2018-12-20 | 2019-04-19 | 重庆锐云科技有限公司 | 一种房源推荐方法及服务器 |
CN109670113A (zh) * | 2018-12-20 | 2019-04-23 | 重庆锐云科技有限公司 | 一种房源推荐方法、装置及服务器 |
CN109685614A (zh) * | 2018-12-19 | 2019-04-26 | 广州易起行信息技术有限公司 | 旅游产品推荐方法、装置、计算机设备和存储介质 |
CN110033018A (zh) * | 2019-03-06 | 2019-07-19 | 平安科技(深圳)有限公司 | 图形相似度判断方法、装置及计算机可读存储介质 |
CN110046303A (zh) * | 2019-04-09 | 2019-07-23 | 有光创新(北京)信息技术有限公司 | 一种基于需求匹配平台实现的信息推荐方法及装置 |
CN110096634A (zh) * | 2019-04-29 | 2019-08-06 | 成都理工大学 | 一种基于粒子群优化的房产数据向量对齐方法 |
CN110889045A (zh) * | 2019-10-12 | 2020-03-17 | 平安科技(深圳)有限公司 | 标签分析方法、装置及计算机可读存储介质 |
CN110968905A (zh) * | 2019-11-27 | 2020-04-07 | 贝壳技术有限公司 | 房屋空间区域分配方法、装置、存储介质及电子设备 |
CN111028044A (zh) * | 2019-10-22 | 2020-04-17 | 贝壳技术有限公司 | 一种拼租方法、装置、电子设备和存储介质 |
CN111611499A (zh) * | 2020-05-28 | 2020-09-01 | 贝壳技术有限公司 | 协同过滤方法、协同过滤装置及系统 |
CN110889045B (zh) * | 2019-10-12 | 2024-04-23 | 平安科技(深圳)有限公司 | 标签分析方法、装置及计算机可读存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329683A (zh) * | 2008-07-25 | 2008-12-24 | 华为技术有限公司 | 推荐系统及方法 |
CN102446225A (zh) * | 2012-01-11 | 2012-05-09 | 深圳市爱咕科技有限公司 | 一种实时搜索的方法、装置和系统 |
CN103729777A (zh) * | 2013-12-12 | 2014-04-16 | 福建伊时代信息科技股份有限公司 | 基于图像识别技术的网络购物方法、购物装置及购物系统 |
CN104239466A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 向用户推荐项目的方法、装置及设备 |
CN105162996A (zh) * | 2014-07-18 | 2015-12-16 | 上海触乐信息科技有限公司 | 智能服务交互平台装置、系统及其实现方法 |
CN105205699A (zh) * | 2015-09-17 | 2015-12-30 | 北京众荟信息技术有限公司 | 基于酒店点评的用户标签和酒店标签匹配方法及装置 |
CN106022497A (zh) * | 2016-05-23 | 2016-10-12 | 北京依依科技有限公司 | 一种房源的推荐方法、服务器和房源推荐系统 |
CN106339818A (zh) * | 2016-08-30 | 2017-01-18 | 李壮志 | 一种房产中介服务系统及客户与经纪人匹配方法 |
US20170076005A1 (en) * | 2010-06-03 | 2017-03-16 | Sony Corporation | Content recommendation system, content recommendation device, and content recommendation method |
CN106570015A (zh) * | 2015-10-09 | 2017-04-19 | 杭州海康威视数字技术股份有限公司 | 图像搜索方法和装置 |
CN106934498A (zh) * | 2017-03-14 | 2017-07-07 | 携程旅游网络技术(上海)有限公司 | Ota网站中酒店房型的推荐方法及系统 |
CN107169150A (zh) * | 2017-06-30 | 2017-09-15 | 努比亚技术有限公司 | 图片推送方法、移动终端以及计算机可读介质 |
CN107256512A (zh) * | 2017-06-08 | 2017-10-17 | 贵州优联博睿科技有限公司 | 一种购房个性化推荐方法及系统 |
CN107516237A (zh) * | 2017-07-22 | 2017-12-26 | 长沙兔子代跑网络科技有限公司 | 一种根据用户画像挖掘代跑客户的方法及装置 |
-
2018
- 2018-01-16 CN CN201810042038.3A patent/CN108256067B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329683A (zh) * | 2008-07-25 | 2008-12-24 | 华为技术有限公司 | 推荐系统及方法 |
US20170076005A1 (en) * | 2010-06-03 | 2017-03-16 | Sony Corporation | Content recommendation system, content recommendation device, and content recommendation method |
CN102446225A (zh) * | 2012-01-11 | 2012-05-09 | 深圳市爱咕科技有限公司 | 一种实时搜索的方法、装置和系统 |
CN103729777A (zh) * | 2013-12-12 | 2014-04-16 | 福建伊时代信息科技股份有限公司 | 基于图像识别技术的网络购物方法、购物装置及购物系统 |
CN105162996A (zh) * | 2014-07-18 | 2015-12-16 | 上海触乐信息科技有限公司 | 智能服务交互平台装置、系统及其实现方法 |
CN104239466A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 向用户推荐项目的方法、装置及设备 |
CN105205699A (zh) * | 2015-09-17 | 2015-12-30 | 北京众荟信息技术有限公司 | 基于酒店点评的用户标签和酒店标签匹配方法及装置 |
CN106570015A (zh) * | 2015-10-09 | 2017-04-19 | 杭州海康威视数字技术股份有限公司 | 图像搜索方法和装置 |
CN106022497A (zh) * | 2016-05-23 | 2016-10-12 | 北京依依科技有限公司 | 一种房源的推荐方法、服务器和房源推荐系统 |
CN106339818A (zh) * | 2016-08-30 | 2017-01-18 | 李壮志 | 一种房产中介服务系统及客户与经纪人匹配方法 |
CN106934498A (zh) * | 2017-03-14 | 2017-07-07 | 携程旅游网络技术(上海)有限公司 | Ota网站中酒店房型的推荐方法及系统 |
CN107256512A (zh) * | 2017-06-08 | 2017-10-17 | 贵州优联博睿科技有限公司 | 一种购房个性化推荐方法及系统 |
CN107169150A (zh) * | 2017-06-30 | 2017-09-15 | 努比亚技术有限公司 | 图片推送方法、移动终端以及计算机可读介质 |
CN107516237A (zh) * | 2017-07-22 | 2017-12-26 | 长沙兔子代跑网络科技有限公司 | 一种根据用户画像挖掘代跑客户的方法及装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508423A (zh) * | 2018-12-14 | 2019-03-22 | 平安科技(深圳)有限公司 | 基于语义识别的房源推荐方法、装置、设备及存储介质 |
CN109685614A (zh) * | 2018-12-19 | 2019-04-26 | 广州易起行信息技术有限公司 | 旅游产品推荐方法、装置、计算机设备和存储介质 |
CN109658192A (zh) * | 2018-12-20 | 2019-04-19 | 重庆锐云科技有限公司 | 一种房源推荐方法及服务器 |
CN109670113A (zh) * | 2018-12-20 | 2019-04-23 | 重庆锐云科技有限公司 | 一种房源推荐方法、装置及服务器 |
CN110033018A (zh) * | 2019-03-06 | 2019-07-19 | 平安科技(深圳)有限公司 | 图形相似度判断方法、装置及计算机可读存储介质 |
CN110033018B (zh) * | 2019-03-06 | 2023-10-31 | 平安科技(深圳)有限公司 | 图形相似度判断方法、装置及计算机可读存储介质 |
CN110046303B (zh) * | 2019-04-09 | 2022-05-17 | 有光创新(北京)信息技术有限公司 | 一种基于需求匹配平台实现的信息推荐方法及装置 |
CN110046303A (zh) * | 2019-04-09 | 2019-07-23 | 有光创新(北京)信息技术有限公司 | 一种基于需求匹配平台实现的信息推荐方法及装置 |
CN110096634A (zh) * | 2019-04-29 | 2019-08-06 | 成都理工大学 | 一种基于粒子群优化的房产数据向量对齐方法 |
CN110096634B (zh) * | 2019-04-29 | 2023-02-24 | 成都理工大学 | 一种基于粒子群优化的房产数据向量对齐方法 |
CN110889045A (zh) * | 2019-10-12 | 2020-03-17 | 平安科技(深圳)有限公司 | 标签分析方法、装置及计算机可读存储介质 |
CN110889045B (zh) * | 2019-10-12 | 2024-04-23 | 平安科技(深圳)有限公司 | 标签分析方法、装置及计算机可读存储介质 |
CN111028044A (zh) * | 2019-10-22 | 2020-04-17 | 贝壳技术有限公司 | 一种拼租方法、装置、电子设备和存储介质 |
CN111028044B (zh) * | 2019-10-22 | 2023-10-27 | 贝壳技术有限公司 | 一种拼租方法、装置、电子设备和存储介质 |
CN110968905A (zh) * | 2019-11-27 | 2020-04-07 | 贝壳技术有限公司 | 房屋空间区域分配方法、装置、存储介质及电子设备 |
CN111611499A (zh) * | 2020-05-28 | 2020-09-01 | 贝壳技术有限公司 | 协同过滤方法、协同过滤装置及系统 |
CN111611499B (zh) * | 2020-05-28 | 2021-08-17 | 贝壳找房(北京)科技有限公司 | 协同过滤方法、协同过滤装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108256067B (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256067A (zh) | 计算房源相似度的方法、装置、设备及存储介质 | |
US20210103779A1 (en) | Mobile image search system | |
CN108230113A (zh) | 用户画像生成方法、装置、设备及可读存储介质 | |
US8718383B2 (en) | Image and website filter using image comparison | |
CN109684575A (zh) | 网页数据的处理方法及装置、存储介质、计算机设备 | |
KR102222087B1 (ko) | 증강 현실에 기초한 이미지 인식 방법 및 장치 | |
CN103942712A (zh) | 基于产品相似度的电子商务推荐系统及其方法 | |
US20220383053A1 (en) | Ephemeral content management | |
US20080270549A1 (en) | Extracting link spam using random walks and spam seeds | |
CN108288208B (zh) | 基于图像内容的展示对象确定方法、装置、介质及设备 | |
CN108197311A (zh) | 房源数据聚合展示方法、装置、设备及可读存储介质 | |
CN104503988B (zh) | 搜索方法及装置 | |
CN111581479B (zh) | 一站式数据处理的方法、装置、存储介质及电子设备 | |
CN102521257A (zh) | 一种用于根据缩略图提供对应的在线图片的方法与设备 | |
CN112613938A (zh) | 模型训练方法、装置及计算机设备 | |
CN110502692A (zh) | 基于搜索引擎的信息检索方法、装置、设备和存储介质 | |
JP2017157193A (ja) | 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 | |
CN108230114A (zh) | 选取用户特征标签的方法、装置、设备及可读存储介质 | |
CN110083762A (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 | |
CN113590968A (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN101959178A (zh) | 一种用于识别无线终端的终端属性的方法与设备 | |
CN105550179A (zh) | 一种网页收藏方法和浏览器插件 | |
CN103324641A (zh) | 信息记录推荐方法和装置 | |
CN111352676A (zh) | 帮助信息推送方法、帮助系统及可读存储介质 | |
KR101976816B1 (ko) | SaaS 어플리케이션 연동 서비스의 제공장치 및 그 제공방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |