CN110083762B - 房源搜索方法、装置、设备及计算机可读存储介质 - Google Patents

房源搜索方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110083762B
CN110083762B CN201910202673.8A CN201910202673A CN110083762B CN 110083762 B CN110083762 B CN 110083762B CN 201910202673 A CN201910202673 A CN 201910202673A CN 110083762 B CN110083762 B CN 110083762B
Authority
CN
China
Prior art keywords
source
house
house source
room
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910202673.8A
Other languages
English (en)
Other versions
CN110083762A (zh
Inventor
刘朦月
胡家义
钟亮
田磊
孙文宇
王昊
谢树铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910202673.8A priority Critical patent/CN110083762B/zh
Publication of CN110083762A publication Critical patent/CN110083762A/zh
Application granted granted Critical
Publication of CN110083762B publication Critical patent/CN110083762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及图像检测领域,提供一种房源搜索方法、装置、设备及计算机可读存储介质,该方法包括:在接收到搜索终端发送的房源搜索指令时,获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。本发明可接收用户提供房源图片,并实现以图搜房,提高了用户的使用体验。

Description

房源搜索方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及图像检测领域,尤其涉及一种房源搜索方法、装置、设备及计算机可读存储介质。
背景技术
随着社会的不断发展,越来越多的房产中介将卖房与租房的服务通过互联网的方式进行推广,当租房者或购房者欲查找待租赁或者待出售的房屋时,可通过房产中介运营的房产网站搜索房源信息并进行租房或买房。
目前用户在房产中介网站上进行房源信息搜索时,通常需要依靠房源所在小区名称、价格等因素进行房源搜索;但当用户只有某个房源的图片,却不知该房源的名称时,无法在房产中介网站时查找到该房源信息,这就为用户带来了不便。
发明内容
本发明的主要目的在于提供一种房源搜索方法、装置、设备及计算机可读存储介质,旨在解决无法通过房源图片来搜索房源的技术问题。
为实现上述目的,本发明提供一种房源搜索方法,所述房源搜索方法包括:
在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;
基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;
根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。
此外,为实现上述目的,本发明还提供一种房源搜索装置,所述房源搜索装置包括:
图片获取模块,用于在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;
一次搜索模块,用于基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;
二次搜索模块,用于根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
第一发送模块,用于获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。
此外,为实现上述目的,本发明还提供一种房源搜索设备,所述房源搜索设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的房源搜索程序,其中所述房源搜索程序被所述处理器执行时,实现如上述的房源搜索方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有房源搜索程序,其中所述房源搜索程序被处理器执行时,实现如上述的房源搜索方法的步骤。
本发明可接收用户提供的房源图片,并对该房源图片进行特征提取,然后根据提取的特征在已知房源库中进行房源搜索,最终返回相关推荐房源信息,从而解决当前必须要输入具体房源位置或名称才能进行房源检索的痛点,方便用户在不知道房源具体信息时进行房源搜索,提高了用户的使用体验;而在进行房源检索时,先结合敏感哈希和倒排索引的方式进行一次搜索,初步减少房源搜索的范围,再通过具体特征确定推荐房源,从而提高了海量房源数据下的房源搜索速度,缩短了服务响应时间,进一步提高了用户体验。
附图说明
图1为本发明实施例方案中涉及的房源搜索设备的硬件结构示意图;
图2为本发明房源搜索方法第一实施例的流程示意图;
图3为本发明房源搜索装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的房源搜索方法主要应用于房源搜索设备,该房源搜索设备可以是由个人计算机(personal computer,PC)、服务器等具有数据处理功能的设备实现的。
参照图1,图1为本发明实施例方案中涉及的房源搜索设备的硬件结构示意图。本发明实施例中,该房源搜索设备可以包括处理器1001(例如中央处理器CentralProcessing Unit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及房源搜索程序。在图1中,网络通信模块主要用于连接数据库,与数据库进行数据通信;而处理器1001可以调用存储器1005中存储的房源搜索程序,并执行本发明实施例提供的房源搜索方法。
本发明实施例提供了一种房源搜索方法。
参照图2,图2为本发明房源搜索方法第一实施例的流程示意图。
本实施例中,所述房源搜索方法包括以下步骤:
步骤S10,在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;
随着社会的不断发展,越来越多的房产中介将卖房与租房的服务通过互联网的方式进行推广,当租房者或购房者欲查找待租赁或者待出售的房屋时,可通过房产中介运营的房产网站搜索房源信息并进行租房或买房。目前用户在房产中介网站上进行房源信息搜索时,通常需要依靠房源所在小区名称、价格等因素进行房源搜索;但当用户只有某个房源的图片,却不知该房源的名称时,无法在房产中介网站时查找到该房源信息,这就为用户带来了不便。对此,本实施例中提出一种房源搜索方法,可接收用户提供房源图片,并对该房源图片进行特征提取,然后根据提取的特征在已知房源库中进行房源搜索,最终返回相关推荐房源信息,从而解决当前必须要输入具体房源位置或名称才能进行房源检索的痛点,方便用户在不知道房源具体信息时进行房源搜索,提高了用户的使用体验。
本实施例的房源搜索方法是由房源搜索设备实现的,该设备以搜索服务器为例进行说明。本实施例中,当用户(如客户、工作人员等)需要通过图片的方式搜索对应的房源信息时,可在搜索终端进行操作,从本地上传或指定某张网络上的房源图片作为需求房源图片,并触发房源搜索请求;其中,该搜索终端可以是个人计算机PC、手机、平板电脑等。搜索终端在接收到该房源搜索请求时,即可向搜索服务器发送对应的房源搜索指令,该房源搜索指令中包括该从本地上传的需求房源图片或该需求房源图片的网络存储地址。当搜索服务器接收到搜索终端发送的房源搜索指令时,即可根据该房源搜索指令获取需要识别的需求房源图片。
值得说明的是,为了进一步提高后续的图片处理的效率以及房源检索的效率,对于用户上传的房源图片,可以对其图片分辨率、图片尺寸、文件格式等图片属性进行要求;搜索服务器在获取到需求房源图片时,先检测该需求房源图片是否满足要求,若不满足,则可向搜索终端返回重新上传提示,以提示用户重新上传房源图片;若满足,则进行下一处理步骤。
本实施例中,搜索服务器在获取到该需求房源图片时,可根据实际情况对该需求房源图片进行预处理,如图片尺寸的统一、像素值归一化(例如线性函数归一化、对数函数归一化)等,当然也可以不进行预处理;然后对该需求房源图片进行特征提取,获得对应的房源图片特征;其中本实施例在进行特征提取时,可以是通过机器学习(训练)得到的特征提取模型进行,该特征提取模型可以根据实际情况采用不同的方式构建,例如可以是卷积神经网络,尺度不变特征变换sift(Scale-invariant feature transform,SIFT)等。又考虑到不同的房产,其附近的自然环境、建筑等也会有所区别,而这些自然环境、建筑等特征也可作为房源检索的一个线索,对此,本实施例中所提取得到的房源图片特征可以包括房源主体特征(房源本身)和非房源主体特征,其中非房源主体特征包括环境特征(如树、草坪)、相邻建筑(如隔壁小区、电线杆、地标)特征等。当然,对于用户上传的房源图片,所提取到的非房源主体特征可能只包括上述中的一类,例如只包括树木环境特征。
步骤S20,基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;
本实施例中,考虑到提取的房源图片特征可能是高维向量(数据)的形式,例如基于sift算法所得到的每个房源图片特征是128维度的向量,而每张需求房源图片可能会提取多个(如2000个)特征;若直接在预设房源库中以高维向量的特征搜索相似的样本房源,则会非常耗时,从而导致对用户的响应缓慢。其中,上述预设房源库中包括有预先收集的若干样本房源,还包括有这些样本房源的样本房源图片和样本房源图片各自的样本图片特征,对于这些样本图片特征,也是通过上述同一个的特征提取模型对样本房源图片进行提取得到;类似的,该样本图片特征也可以包括房源主体特征(房源本身)和非房源主体特征,其中非房源主体特征包括环境特征(如树、草坪等)、相邻建筑(如小区)特征等。为了提高房源检索的效率,本实施例中可通过局部敏感哈希LSH(Locality-Sensitive Hashing)的方式可先将该房源图片特征由高维向量转化为低维向量,先以低维向量的方式在预设倒排索引表中寻找相似的样本房源作为备选房源,再以原房源图片特征(高维向量)在这些备选房源中进行进一步的筛选和搜索,提高房源搜索的效率。其中,局部敏感哈希的基本思想是:对于在原始数据空间(高维空间)中的两个数据点(特征点),若这两个数据点相邻(距离小于一定阈值),则基于一定的局部敏感哈希算法对这两个数据点进行相同的映射或投影变换(projection)后,这两个数据点在新的数据空间(低维度空间)中依然相邻的概率很大(大于一定阈值);而若这两个数据点在原始数据空间不相邻(距离大于或等于一定阈值),则这两个数据点在新的数据空间的相邻概率也很小。倒排索引则是根据特征来查找具有该特征的样本图片(样本房源)的搜索方式;用于倒排索引的倒排索引表中的每一项都包括一个特征和具有该特征的样本图片地址,由于不是由样本图片来确定特征,而是由特征来确定样本图片的位置,因而称为倒排索引(inverted index)。
具体的,步骤20之前还包括:
获取所述预设房源库中各样本房源图片的样本图片特征,并基于所述预设局部敏感哈希算法将所述样本图片特征映射至对应的样本哈希桶中;
本实施例中,搜索服务器首先会对预设房源库中各样本房源的样本房源图片进行特征提取,获取样本图片特征;值得说明的是,该样本图片特征提取过程所使用的方法或模型,与上述步骤S10中提取房源图片特征所采用的方法或模型是一致的。在得到样本图片特征时,搜索服务器将通过预设局部敏感哈希算法对各样本图片特征进行哈希映射,从而将各样本图片特征分别映射至对应的样本哈希桶中;其中该样本哈希桶包括两个以上。为了方便管理和后续查询,搜索服务器还可记录下每个样本图片特征在映射后对于的哈希桶编号。
根据所述样本哈希桶的样本图片特征构建所述预设倒排索引表;
本实施例中,在将各样本图片特征映射至对应的样本哈希桶后,搜索服务器将会对各样本哈希桶所包括样本图片特征进行统计,构建得到预设倒排索引表,该预设倒排索引表中记录有各样本哈希桶包括的样本图片特征、以及具有该样本图片特征的样本图片地址和样本房源编号,如下表1所示
表1预设倒排索引表
Figure GDA0002060905930000061
Figure GDA0002060905930000071
当然,在实际中,该预设倒排索引表的字段内容可以根据实际情况进行调整。
步骤S20包括:
基于所述预设敏感哈希算法对所述房源图片特征进行映射,并根据映射结果在所述样本哈希桶中确定目标哈希桶;
本实施例中,搜索服务器在得到需求房源图片的房源图片特征时,可通过相同的预设敏感哈希算法对房源图片特征进行映射,从而也将房源图片特征映射至对应的样本哈希桶中;当映射完成时,可将房源图片特征所对应的样本哈希桶确定为目标哈希桶。
确定所述目标哈希桶中包括的目标特征,并所述目标特征查询所述预设倒排索引表,确定所述目标特征所属的样本房源图片;
本实施例中,在确定目标哈希桶时,该目标哈希桶所包括的样本图片特征即有较高的概率是与房源图片特征相邻(距离接近),这些样本图片特征可称为目标特征;此时搜索服务器可查询预先构建的预设倒排索引表,确定这些目标特征所属的样本房源图片,确定具有这些目标特征的样本房源。例如,需求房源图片中的特征包括FeatureX1,在通过将预设敏感哈希算法对FeatureX1进行映射后,其被映射至bucket-1的样本哈希桶中,该bucket-1的样本哈希桶可称为目标哈希桶,而bucket-1的目标哈希桶中包括Feature1和Feature2两个目标特征;此时可查询如表1的预设倒排索引表,可知Feature1所属的样本房源图片包括房源1的样本房源图片(样本房源图片的地址为add1)和房源2的样本房源图片(样本房源图片的地址为add2),Feature2所属的样本房源图片包括房源1的样本房源图片(样本房源图片的地址为add1)、房源2的样本房源图片(样本房源图片的地址为add2)和房源3的样本房源图片(样本房源图片的地址为add3)。
分别统计所述预设房源库中各样本房源图片包括的目标特征数,并根据所述目标特征数在预设房源库中确定备选房源。
本实施例中,在确定各目标特征所属的样本房源图片时,搜索服务器将分别统计各样本房源图片所包括的目标特征数,例如,对于上述的房源图片特征Feature0,对应的目标特征(同一样本哈希桶)为Feature1和Feature2;而房源1的样本房源图片和房源2的样本房源图片所包括的目标特征数均为2个(同时包括Feature1和Feature2),而房源3的样本房源图片仅包括1个目标特征(仅包括Feature2)。此时搜索服务器可根据各样本房源图片包括的目标特征数在预设房源库中确定备选房源,例如将包括目标特征数最多的k个样本房源图片所对应的样本房源确定为备选房源,其中k≥2;当k取2时,上述举例的目标房源为房源1和房源2。
进一步的,本实施例中,若搜索服务器能获取到该需求房源图片所对应需求房源的位置概况信息,则还可以通过需求房源位置概况信息进行房源预筛选,再进行一次搜索。具体的,搜索服务器在获取到需求房源图片之后,还可向所述搜索终端发送需求房源位置请求,以尝试获取搜索需求房源图片对应的需求房源位置概况。用户在通过搜索终端看到该房源位置请求时,可以是输入该需求房源图片的拍摄地址、又或者是手动录入或选择该需求房源的大致位置信息,以使得搜索终端向搜索服务器发送对应的需求房源位置概况信息;搜索服务器若接收到搜索终端发送的需求房源位置概况信息,则可先根据该需求房源位置概况信息在预设房源库中进行预筛选,获取到符合该需求房源位置概况信息的预筛选房源,例如该需求房源图片的拍摄地址为addP,则可以距离addP为1km内的样本房源作为预筛选房源,再在该预筛选房源中进行相关的一次搜索操作,从而进一步缩小搜索的范围,减少数据搜索量,提高搜索的效率。当然若用户无法提供需求房源位置概况信息,则可通过搜索终端向搜索服务器发送无概况信息,此时搜索服务器将执行上述步骤S20的相关操作。
步骤S30,根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
本实施例中,在确定备选房源时,即可认为是初步缩小了检索的范围,此时将根据原来提取的房源图片特征在这些备选房源中进行二次搜索,确定与需求房源图片对应的推荐房源。在该推荐房源的确定过程中,需要将房源图片特征与备选房源图片中对应的目标特征进行比对,得出两者的特征距离,并根据该特征距离以及目标特征的数量共同确定推荐房源。
具体的,步骤S30包括:
获取备选房源的备选房源图片所包括的目标特征,并确定所述备选房源图片所包括的目标特征数;
本实施例中,在确定备选房源时,搜索服务器可获取各备选房源的备选房源图片所包括的目标特征,并确定各备选房源图片所包括的目标特征数。例如,对于步骤S20中的目标房源为房源1和房源2,其包括的目标特征为Feature1和Feature2;两个目标房源的目标特征数均为2。
计算所述房源图片特征与所述备选房源图片的目标特征之间的特征距离;
本实施例中,在得到备选房源图片的目标特征时,搜索服务器将计算房源图片特征与备选房源图片的目标特征之间的特征距离;该特征距离可以是根据实际情况采用不同的方式进行计算,例如当两个特征为向量形式时,可以是计算欧式距离、马氏距离Mahalanobis Distance等,当两个特征为字符串形式时,可以是计算汉明距离。值得说明的是,当备选房源图片具有两个以上的房源图片特征时,则是分别将各房源图片特征与位于同一目标哈希桶的目标特征进行特征距离的计算;例如当预设倒排索引表为上表1,房源图片特征包括FeatureX1和FeatureX2,,FeatureX1映射后落入bucket-1中,FeatureX2映射后落入bucket-1中,备选房源为房源1、房源2和房源3;则在计算特征举例时,将分别计算FeatureX1与Feature1的特征距离、FeatureX1与Feature2的特征距离、FeatureX2与Feature3的特征距离。
根据所述备选房源图片所包括的目标特征数和所述特征距离在所述备选房源中确定与所述需求房源图片对应的推荐房源。
本实施例中,在得到房源图片特征与各备选房源图片的目标特征之间的特征距离时,即可跟各备选房源图片所包括的目标特征数以及特征距离在备选房源中确定推荐房源。本实施例在确定推荐房源时,既考虑备选房源所具有的目标特征数(相似特征数量),又考虑特征的具体相似程度;对此,可以是将各备选房源图片的目标特征数以及特征距离代入至预设评分公式中计算各备选房源图片的综合评分,该预设评分公式为
Figure GDA0002060905930000091
其中,P为备选房源图片的综合评分;
n为该备选房源图片的目标特征数;
Q为预设特征加成,Q>0;
Di为该备选房源图片第i个目标特征与样本房源特征之间的特征距离,1≤i≤n。
在计算得到各备选房源图片的综合评分时,可将综合评分最高的若干个(至少一个)备选房源图片作为推荐房源图片,其所对应的备选房源即确定为推荐房源。
步骤S40,获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。
在确定推荐房源时,在确定推荐房源时,搜索服务器将会获取该推荐房源的推荐房源信息,该推荐房源信息包括推荐房源所属小区、小区更多的图片、小区地址、小区建成时间、小区房源房价、小区交通信息等。对于这些推荐房源信息,可以是预先存储在上述预设房源库中,也可以是搜索服务器在确定推荐房源后再从网络中进行查询和获取。搜索服务器在得到该推荐房源信息时,还可以根据步骤S30中的综合评分确定房源推荐顺序,并根据该顺序将这些推荐房源信息发送至搜索终端中,例如得分最高的推荐房源的信息在最顶端,依次类推,以供用户通过搜索终端了解该房源(小区)信息。
进一步的,本实施例中,考虑到用户通过搜索终端浏览了发送的推荐房源信息后,可能会有疑问,为了方便待用户进行咨询,本实施例中还可以为待用户提供人工中介咨询服务。具体的,搜索服务器所推送的推荐房源信息中包括有中介服务链接;用户在通过搜索终端浏览了推荐房源信息后,若需要中介服务,则可通过搜索终端点击该中介服务链接,从而触发对应的中介服务请求;搜索终端根据用户的操作将该中介服务请求发送至搜索服务器。搜索服务器在接收到该中介服务请求时,首先将根据该推荐房源信息查询对应的中介客服端(负责该推荐的中介人员、房产经理等人的终端),并向所述中介客服端发送对应的中介任务信息;其中该中介任务信息可以包括搜索终端的IP地址、用户进行房源搜索所使用的账号、用户的联系方式等,从而使得中介客服人员能够通过中介客服端与用户进行联系,为用户提供人工服务,提升用户的服务体验。
再进一步的,本实施例中,在向搜索终端发送推荐房源信息后,为了方便用户获知更多的房源信息,搜索服务器还可以根据推荐房源信息的特点向用户推送更多的房源信息。具体的,搜索服务器获取的推荐房源信息中还包括有推荐房源地址和/或推荐房源房价,搜索服务器可根据该推荐房源的推荐房源地址和/或推荐房源房价获取与该推荐房源匹配的相似房源,例如以该推荐房源为中心、1km半径进行房源搜索,将与该推荐房源的距离为1km之内的房源作为相似房源;又例如搜索与推荐房源具有相同房价范围(如同为10000-12000元/平米)的房源作为相似房源。然后搜索服务器将获取该相似房源的相似房源信息,并将该相似房源发送至搜索终端。
本实施例中,在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。通过以上方式,本实施例可接收用户提供的房源图片,并对该房源图片进行特征提取,然后根据提取的特征在已知房源库中进行房源搜索,最终返回相关推荐房源信息,从而解决当前必须要输入具体房源位置或名称才能进行房源检索的痛点,方便用户在不知道房源具体信息时进行房源搜索,提高了用户的使用体验;而进行房源检索时,先结合敏感哈希和倒排索引的方式进行一次搜索,初步减少房源搜索的范围,再通过具体特征确定推荐房源,从而提高了海量房源数据下的房源搜索速度,缩短了服务响应时间,进一步提高了用户体验。
基于上述图2所示实施例,提出本发明房源搜索方法第二实施例。
本实施例中,步骤S40之后还包括:
在接收到所述搜索终端发送的导航指令时,根据所述导航指令在所述推荐房源中确定目标房源,并获取所述目标房源的目标地址和所述搜索终端的终端地址;
本实施例中,在向搜索终端发送推荐房源信息后,为了方便推荐用户获知其意向房源的所在以及到达该房源的方法,搜索服务器还可为用户提供导航功能。具体的,搜索服务器发送至搜索终端的推荐房源信息中,还包括有导航选项;用户在通过搜索终端查看推荐房源信息时,若对某一推荐房源感兴趣,可点击该导航选项;搜索终端则根据用户的操作向搜索服务器发送对应的导航指令。搜索服务器在接收到该导航指令时,即根据该导航指令在推荐房源中确定目标房源,并获取该目标房源所在的目标地址;同时搜索服务器还将获取搜索终端当前的终端地址,该终端地址可认为是用户当前的所在地。对于该终端地址,可以是搜索终端通过自身GPS装置采集得到,并在向搜索服务器发送导航指令时一起发送,也可以是搜索服务器根据搜索终端的IP地址进行定位得到,当然还可以是其它的方式获取得到(例如用户手动填写等)。
根据所述目标地址和所述终端地址生成导航路线,并将导航路线返回至所述搜索终端。
本实施例中,搜索服务器在得到目标地址和终端地址时,即可根据该目标地址和终端地址生成导航路线,并将该导航路线返回至搜索终端,以供用户根据该导航路线获取到达该目标房源的方法。当然该导航路线可以是包括多种出行方式和多种出行路线,例如驾车路线、公交路线、步行路线等,还可以包括各出行方式和出行路线的预计出行耗时等。通过以上方式,可为用户提供导航功能,方便推荐用户获知其意向房源的所在以及到达该房源的方法,有利于提高用户的使用体验。
此外,本发明实施例还提供一种房源搜索装置。
参照图3,图3为本发明房源搜索装置第一实施例的功能模块示意图。
本实施例中,所述房源搜索装置包括:
图片获取模块10,用于在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;
一次搜索模块20,用于基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源;
二次搜索模块30,用于根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
第一发送模块40,用于获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端。
其中,上述房源搜索装置的各虚拟功能模块存储于图1所示房源搜索设备的存储器1005中,用于实现房源搜索程序的所有功能;各模块被处理器1001执行时,可实现基于搜索终端发送的房源搜索指令进行以图搜房的功能。
进一步的,所述房源搜索装置还包括:
样本映射模块,用于获取所述预设房源库中各样本房源图片的样本特征,并基于所述预设局部敏感哈希算法将所述样本特征映射至对应的样本哈希桶中;
索引表构建模块,用于根据所述样本哈希桶的样本特征构建所述预设倒排索引表;
所述一次搜索模块20包括:
目标桶确定单元,用于基于所述预设敏感哈希算法对所述房源图片特征进行映射,并根据映射结果在所述样本哈希桶中确定目标哈希桶;
索引表查询单元,用于确定所述目标哈希桶中包括的目标特征,并所述目标特征查询所述预设倒排索引表,确定所述目标特征所属的样本房源图片;
特征数统计单元,用于分别统计所述预设房源库中各样本房源图片包括的目标特征数,并根据所述目标特征数在预设房源库中确定备选房源。
进一步的,所述二次搜索模块30包括:
特征获取单元,用于获取备选房源的备选房源图片所包括的目标特征,并确定所述备选房源图片所包括的目标特征数;
距离计算单元,用于计算所述房源图片特征与所述备选房源图片的目标特征之间的特征距离;
房源确定单元,用于根据所述备选房源图片所包括的目标特征数和所述特征距离在所述备选房源中确定与所述需求房源图片对应的推荐房源。
进一步的,所述房源搜索装置还包括:
请求发送模块,用于向所述搜索终端发送需求房源位置请求,以尝试获取所述需求房源图片对应的需求房源位置概况;
预筛选模块,用于若接收到所述搜索终端发送的需求房源位置概况信息,则根据所述需求房源位置概况信息在所述预设房源库中进行预筛选,获得预筛选房源;
所述一次搜索模块20,还用于基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在所述预筛选房源中进行一次搜索;
所述一次搜索模块20,若接收到所述搜索终端发送的无概况信息,则执行步骤基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索。
进一步的,所述推荐房源信息包括中介服务链接,所述房源搜索装置还包括:
任务发送模块,用于在接收到所述搜索终端基于所述中介服务链接发送的中介服务请求时,根据所述推荐房源信息查询对应的中介客服端,并向所述中介客服端发送对应的中介任务信息。
进一步的,所述推荐房源信息包括推荐房源地址和/或推荐房源房价,所述房源搜索装置还包括:
房源获取模块,用于根据所述推荐房源地址和/或推荐房源房价获取与所述推荐房源匹配的相似房源,并获取所述相似房源的相似房源信息;
第二发送模块,用于将所述相似房源信息发送至所述搜索终端。
进一步的,所述房源搜索装置还包括:
地址获取模块,用于在接收到所述搜索终端发送的导航指令时,根据所述导航指令在所述推荐房源中确定目标房源,并获取所述目标房源的目标地址和所述搜索终端的终端地址;
路线生成模块,用于根据所述目标地址和所述终端地址生成导航路线,并将导航路线返回至所述搜索终端。
其中,上述基于房源搜索装置中各个模块的功能实现与上述房源搜索方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有房源搜索程序,其中所述房源搜索程序被处理器执行时,实现如上述的房源搜索方法的步骤。
其中,房源搜索程序被执行时所实现的方法可参照本发明房源搜索方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种房源搜索方法,其特征在于,所述房源搜索方法包括:
在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征,所述需求房源图片具有属性要求,需要判断所述需求房源图片是否满足属性要求;
基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源,所述局部敏感哈希算法可将所述房源图片特征由高维向量转化为低维向量,以低维向量的方式在所述预设倒排索引表中寻找相似的样本房源作为初始备选房源,再以原房源图片特征在所述初始备选房源中进行进一步的筛选和搜索;
根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端;
其中,所述基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源的步骤,包括:
基于预设局部敏感哈希算法对所述房源图片特征进行映射,并根据映射结果在样本哈希桶中确定目标哈希桶;
确定所述目标哈希桶中包括的目标特征,并根据所述目标特征查询所述预设倒排索引表,确定所述目标特征所属的样本房源图片;
分别统计所述预设房源库中各样本房源图片包括的目标特征数,并根据所述目标特征数在预设房源库中确定备选房源;
其中,所述根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源的步骤,包括:
获取备选房源的备选房源图片所包括的目标特征,并确定所述备选房源图片所包括的目标特征数;
计算所述房源图片特征与所述备选房源图片的目标特征之间的特征距离;
将所述目标特征数以及所述特征距离代入至预设评分公式中确定所述备选房源图片的综合评分;
将评分高于预设分值的备选房源图片对应的备选房源作为推荐房源。
2.如权利要求1所述的房源搜索方法,其特征在于,所述根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源的步骤之前,还包括:
获取所述预设房源库中各样本房源图片的样本图片特征,并基于所述预设局部敏感哈希算法将所述样本图片特征映射至对应的样本哈希桶中;
根据所述样本哈希桶的样本图片特征构建所述预设倒排索引表。
3.如权利要求1所述的房源搜索方法,其特征在于,所述在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征的步骤之后还包括:
向所述搜索终端发送需求房源位置请求,以尝试获取所述需求房源图片对应的需求房源位置概况;
若接收到所述搜索终端发送的需求房源位置概况信息,则根据所述需求房源位置概况信息在所述预设房源库中进行预筛选,获得预筛选房源;
所述基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索的步骤包括:
基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在所述预筛选房源中进行一次搜索;
若接收到所述搜索终端发送的无概况信息,则执行步骤基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索。
4.如权利要求1所述的房源搜索方法,其特征在于,所述推荐房源信息包括中介服务链接,
所述获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端的步骤之后,还包括:
在接收到所述搜索终端基于所述中介服务链接发送的中介服务请求时,根据所述推荐房源信息查询对应的中介客服端,并向所述中介客服端发送对应的中介任务信息。
5.如权利要求1所述的房源搜索方法,其特征在于,所述推荐房源信息包括推荐房源地址和/或推荐房源房价,
所述获取所述推荐房源的推荐房源信息,并将所述推荐房源信息返回所述搜索终端的步骤之后,还包括:
根据所述推荐房源地址和/或推荐房源房价获取与所述推荐房源匹配的相似房源,并获取所述相似房源的相似房源信息;
将所述相似房源信息返回所述搜索终端。
6.如权利要求1至5中任一项所述的房源搜索方法,其特征在于,所述获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端的步骤之后,还包括:
在接收到所述搜索终端发送的导航指令时,根据所述导航指令在所述推荐房源中确定目标房源,并获取所述目标房源的目标地址和所述搜索终端的终端地址;
根据所述目标地址和所述终端地址生成导航路线,并将导航路线返回至所述搜索终端。
7.一种房源搜索装置,其特征在于,所述房源搜索装置包括:
图片获取模块,用于在接收到搜索终端发送的房源搜索指令时,根据所述房源搜索指令获取需求房源图片,并对所述需求房源图片进行特征提取,获得对应的房源图片特征;
一次搜索模块,用于基于预设局部敏感哈希算法对所述房源图片特征进行哈希映射,并根据映射结果和预设倒排索引表在预设房源库中进行一次搜索,获得备选房源,所述备选房源包括两个以上的样本房源,所述局部敏感哈希算法可将所述房源图片特征由高维向量转化为低维向量,以低维向量的方式在所述预设倒排索引表中寻找相似的样本房源作为初始备选房源,再以原房源图片特征在所述初始备选房源中进行进一步的筛选和搜索;
二次搜索模块,用于根据所述房源图片特征在所述备选房源中进行二次搜索,确定与所述需求房源图片对应的推荐房源;
第一发送模块,用于获取所述推荐房源的推荐房源信息,并将所述推荐房源信息发送至所述搜索终端;
其中,所述一次搜索模块,还用于:
基于预设局部敏感哈希算法对所述房源图片特征进行映射,并根据映射结果在样本哈希桶中确定目标哈希桶;
确定所述目标哈希桶中包括的目标特征,并根据所述目标特征查询所述预设倒排索引表,确定所述目标特征所属的样本房源图片;
分别统计所述预设房源库中各样本房源图片包括的目标特征数,并根据所述目标特征数在预设房源库中确定备选房源;
其中,所述二次搜索模块,还用于:
获取备选房源的备选房源图片所包括的目标特征,并确定所述备选房源图片所包括的目标特征数;
计算所述房源图片特征与所述备选房源图片的目标特征之间的特征距离;
将所述目标特征数以及所述特征距离代入至预设评分公式中确定所述备选房源图片的综合评分;
将评分高于预设分值的备选房源图片对应的备选房源作为推荐房源。
8.一种房源搜索设备,其特征在于,所述房源搜索设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的房源搜索程序,其中所述房源搜索程序被所述处理器执行时,实现如权利要求1至6中任一项所述的房源搜索方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有房源搜索程序,其中所述房源搜索程序被处理器执行时,实现如权利要求1至6中任一项所述的房源搜索方法的步骤。
CN201910202673.8A 2019-03-15 2019-03-15 房源搜索方法、装置、设备及计算机可读存储介质 Active CN110083762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910202673.8A CN110083762B (zh) 2019-03-15 2019-03-15 房源搜索方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910202673.8A CN110083762B (zh) 2019-03-15 2019-03-15 房源搜索方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110083762A CN110083762A (zh) 2019-08-02
CN110083762B true CN110083762B (zh) 2023-01-24

Family

ID=67413205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910202673.8A Active CN110083762B (zh) 2019-03-15 2019-03-15 房源搜索方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110083762B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241106B (zh) * 2020-01-15 2023-08-29 平安科技(深圳)有限公司 近似数据处理方法、装置、介质及电子设备
CN111311358B (zh) * 2020-01-20 2023-05-30 北京有竹居网络技术有限公司 信息处理方法、装置和电子设备
CN111681087B (zh) * 2020-06-16 2023-10-03 贝壳技术有限公司 信息处理方法、装置、计算机可读存储介质及电子设备
CN111522989B (zh) * 2020-07-06 2020-10-30 南京梦饷网络科技有限公司 用于图像检索的方法、计算设备和计算机存储介质
CN116737777B (zh) * 2023-08-16 2023-11-28 北京壁仞科技开发有限公司 对目标算子进行搜索的方法、计算设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104081435A (zh) * 2014-04-29 2014-10-01 中国科学院自动化研究所 一种基于级联二值编码的图像匹配方法
CN106649715A (zh) * 2016-12-21 2017-05-10 中国人民解放军国防科学技术大学 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法
CN106682233A (zh) * 2017-01-16 2017-05-17 华侨大学 一种基于深度学习与局部特征融合的哈希图像检索方法
CN108416066A (zh) * 2018-03-29 2018-08-17 平安好房(上海)电子商务有限公司 图片搜索方法、用户设备、存储介质及图片搜索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104081435A (zh) * 2014-04-29 2014-10-01 中国科学院自动化研究所 一种基于级联二值编码的图像匹配方法
CN106649715A (zh) * 2016-12-21 2017-05-10 中国人民解放军国防科学技术大学 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法
CN106682233A (zh) * 2017-01-16 2017-05-17 华侨大学 一种基于深度学习与局部特征融合的哈希图像检索方法
CN108416066A (zh) * 2018-03-29 2018-08-17 平安好房(上海)电子商务有限公司 图片搜索方法、用户设备、存储介质及图片搜索装置

Also Published As

Publication number Publication date
CN110083762A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN110083762B (zh) 房源搜索方法、装置、设备及计算机可读存储介质
US20220245118A1 (en) Refining Location Estimates and Reverse Geocoding Based on a User Profile
US20090083275A1 (en) Method, Apparatus and Computer Program Product for Performing a Visual Search Using Grid-Based Feature Organization
US9020529B2 (en) Computer based location identification using images
JP5457434B2 (ja) モバイル装置により記録された画像のコンテンツに基づくデータアクセス
CN109086394B (zh) 搜索排序方法、装置、计算机设备和存储介质
CN102147815B (zh) 图片搜索方法和图片搜索系统
CN108256067B (zh) 计算房源相似度的方法、装置、设备及存储介质
US20080270378A1 (en) Method, Apparatus and Computer Program Product for Determining Relevance and/or Ambiguity in a Search System
US9171011B1 (en) Building search by contents
WO2016149918A1 (zh) 用户地理位置的确定
US20130205196A1 (en) Location-based mobile application marketplace system
US20130328931A1 (en) System and Method for Mobile Identification of Real Property by Geospatial Analysis
CN110069654A (zh) 房源搜索方法、装置、设备及计算机可读存储介质
WO2016199662A1 (ja) 画像情報処理システム
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US20110173150A1 (en) Methods and system for associating locations with annotations
WO2010075155A2 (en) Method and system for searching for information pertaining target objects
CN106255966A (zh) 使用店面辨识来识别待考察实体
CN106682146B (zh) 一种根据关键词检索景区评价的方法及系统
CN114372133A (zh) 查询信息问答方法、相关装置及计算机程序产品
CN110096609A (zh) 房源搜索方法、装置、设备及计算机可读存储介质
JP2009123160A (ja) コンテンツ情報配信装置、コンテンツ情報配信システムおよびコンテンツ情報配信方法
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
US20220207289A1 (en) Device selection apparatus, data set selection apparatus, method for selecting device, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant