CN111581490A - 一种信息搜索方法、装置、存储介质及电子设备 - Google Patents
一种信息搜索方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN111581490A CN111581490A CN201910117446.5A CN201910117446A CN111581490A CN 111581490 A CN111581490 A CN 111581490A CN 201910117446 A CN201910117446 A CN 201910117446A CN 111581490 A CN111581490 A CN 111581490A
- Authority
- CN
- China
- Prior art keywords
- search
- database
- information
- word list
- preset word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种信息搜索方法、装置、存储介质及电子设备。该方法包括:获取用户搜索请求对应的搜索信息;将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合;根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。采用本公开实施例的技术方案,可以实现搜索结果与用户搜索请求的高度匹配,避免出现搜索结果中包含较多干扰项或者漏检的情况,提高了信息搜索的准确度。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种信息搜索方法、装置、存储介质及电子设备。
背景技术
随着互联网及移动技术的发展,用户可以在任何地方通过网络使用搜索引擎搜索自己需要的信息。例如,用户想要了解A市二手房的相关信息,可以通过在搜索引擎中输入A市的二手房的方式查询到相关信息。
相关技术的搜索方案是:在获取到用户于搜索引擎中输入的搜索信息后,对搜索信息进行分词处理,以分词结果作为关键词进行检索,返回所有具有上述关键词的检索结果。然而,上述检索结果包含较多的与用户真实的搜索意图不匹配的干扰数据,并且对于一些不包含上述关键词的信息存在漏检的问题。由此可知,相关技术中的搜索方案存在查询准确率不高的问题。
发明内容
本公开实施例提供一种信息搜索方法、装置、存储介质及电子设备,可以提高信息搜索的准确度。
第一方面,本公开实施例提供了一种信息搜索方法,包括:
获取用户搜索请求对应的搜索信息;
将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
上述方案中,可选的是,所述设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向。
进一步的,还包括:
在获取用户搜索请求对应的搜索信息之前,基于所述设定字段和数据库标识生成所述设定字段对应的预设词表,由所述预设词表构成预设词表集合。
上述方案中,可选的是,将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,包括:
基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序;
基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。
进一步的,还包括:
在基于预设词表集合中的预设词表的优先级之前,获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
进一步的,还包括:
在获取用户搜索请求对应的搜索信息之后,基于所述设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息;
以及,基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合,包括:
基于所述匹配顺序,分别采用所述搜索子信息遍历与所述设定字段对应的预设词表,以基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围;
根据各个所述搜索子信息对所述预设词表的遍历结果确定所述搜索信息对应的数据库标识;
基于所述匹配顺序为所述数据库标识进行排序,得到数据库标识组合。
上述方案中,可选的是,根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果,包括:
基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录;
若是,则将所述房源记录作为所述用户搜索请求对应的搜索结果。
第二方面,本公开实施例还提供了一种信息搜索装置,该装置包括:
搜索信息获取模块,用于获取用户搜索请求对应的搜索信息;
搜索信息匹配模块,用于将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
结果确定模块,用于根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
上述方案中,可选的是,所述设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向。
进一步的,还包括:
词表生成模块,用于在获取用户搜索请求对应的搜索信息之前,基于所述设定字段和数据库标识生成所述设定字段对应的预设词表,由所述预设词表构成预设词表集合。
上述方案中,可选的是,搜索信息匹配模块包括:
顺序确定子模块,用于基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序;
词表匹配子模块,用于基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。
进一步的,还包括:
优先级确定模块,用于在基于预设词表集合中的预设词表的优先级之前,获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
进一步的,还包括:
搜索子信息确定模块,用于在获取用户搜索请求对应的搜索信息之后,基于所述设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息;
以及,词表匹配子模块具体用于:
基于所述匹配顺序,分别采用所述搜索子信息遍历与所述设定字段对应的预设词表,以基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围;
根据各个所述搜索子信息对所述预设词表的遍历结果确定所述搜索信息对应的数据库标识;
基于所述匹配顺序为所述数据库标识进行排序,得到数据库标识组合。
上述方案中,可选的是,结果确定模块具体用于:
基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录;
若是,则将所述房源记录作为所述用户搜索请求对应的搜索结果。
第三方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的信息搜索方法。
第四方面,本公开实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个存储器执行,使得所述一个或多个处理器实现如本公开实施例所述的信息搜索方法。
本公开实施例提供一种信息搜索方案,在获取用户搜索请求对应的搜索信息之后,将该搜索信息与预设词表集合中的各个预设词表进行匹配,确定与该用户搜索请求对应的数据库标识组合,根据该数据库标识组合查询房源数据库,得到与该用户搜索请求对应的搜索结果。采用本公开实施例的技术方案,在基于用户搜索请求对应的搜索信息查询房源数据库之前,由搜索信息中获取与用户搜索请求对应的数据库标识组合,进而,基于数据库标识组合查询房源数据库,得到与用户搜索请求对应的搜索结果,实现搜索结果与用户搜索请求的高度匹配,避免出现搜索结果中包含较多干扰项或者漏检的情况,提高了信息搜索的准确度。
附图说明
图1为本公开实施例提供的一种信息搜索方法的流程图;
图2为本公开实施例提供的另一种信息搜索方法的流程图;
图3为本公开实施例提供的又一种信息搜索方法的流程图;
图4为本公开实施例提供的一种信息搜索装置的结构框图;
图5为本公开实施例提供的一种电子设备的结构框图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
图1为本公开实施例提供的一种信息搜索方法的流程图,该方法可以由信息搜索装置来执行,该装置可由硬件和/或软件组成,并一般可集成在诸如智能手机、平板电脑、个人计算机、笔记本电脑、掌上电脑及智能家电等电子设备中。如图1所示,该方法可以包括如下步骤:
步骤110、获取用户搜索请求对应的搜索信息。
需要说明的是,搜索信息通常包括城市、市辖区、商圈、房产所属小区、户型或朝向等属性字段,以及二手房业务或者新房业务等业务字段。可选的,业务字段还可以包括车辆业务、家居业务或电器业务等。可以理解的是,搜索信息可以是至少一个属性字段与至少一个业务字段的组合。例如,搜索信息可以是A市C区的二手房以及新房。又如,搜索信息可以是A市XX商圈的二室一厅的二手房等等。
示例性的,在检测到用户通过设定搜索引擎发送的用户搜索请求时,获取该用户搜索请求包含的搜索信息。
步骤120、将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合。
需要说明的是,预设词表可以是设定字段与数据库标识的关联关系表,用于存储设定字段与数据库标识的关联关系。其中,设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向等。在房源数据库中,数据库标识用于代表房源记录。例如,预设词表可以是城市与数据库标识的关联关系表,即每个城市均有一个唯一标识该城市的数据库标识,如,可以采用ID1代表城市A,采用ID2代表城市B,采用ID3代表城市C等等。又如,预设词表还可以是商圈与数据库标识的关联关系表,即可以采用ID a代表a商圈,可以采用ID b代表b商圈,还可以采用ID c代表c商圈等等。又如,可以采用ID A代表市辖区A,还可以采用ID B代表市辖区B,以及还可以采用ID C代表市辖区C等等。又如,预设词表还可以是户型与数据库标识的关联关系表,即可以采用ID 11代表一室一厅。还可以采用ID 21代表两室一厅。还可以采用ID 31代表三室一厅。还可以采用ID 32代表三室两厅等等。又如,预设词表还可以是房产所属小区与数据库标识的关联关系表,即可以采用ID-b1表示b商圈内第一房产所属小区的小区名,还可以采用ID-a2表示a商圈内第二房产所属小区的小区名,还可以采用ID-c3表示c商圈内第三房产所属小区的小区名等等。需要说明的是,房源记录在房源数据库中的存储形式可以是键值对的形式,即以数据库标识为键,以房源记录为值。例如,以ID1+ID b+ID-b3+ID 21为键,对A市b商圈的第三房产所属小区中的两室一厅的房源记录进行存储。可选的,房源数据库可以包括二手房数据库和新房数据库,从而,可以基于用户搜索信息从对应的房源数据库中进行查询,有效地缩小了查询范围。
需要说明的是,可以基于城市、商圈、市辖区、房产所属小区、户型和朝向等设定字段生成多个预设词表,可以采用上述设定字段中的至少一个设定字段生成预设词表。例如,可以是每个设定字段对应一个预设词表,由多个预设词表构成预设词表集合。如预设词表集合可以包括城市词表、商圈词表、市辖区词表、房产所属小区词表、户型词表和朝向词表等等。又如,可以生成城市预设词表,再以该城市和城市范围内的商圈为设定字段,生成商圈预设词表,该商圈预设词表具有城市和商圈两个属性。还可以再以该商圈内的房产所属小区作为设定字段,生成房产所属小区的预设词表,该房产所属小区的预设词表具有城市、商圈和房产所属小区三个属性等等。
示例性的,将搜索信息与预设词表集合中的预设词表进行匹配,可以逐步缩小搜索范围,以排除一些干扰信息。例如,一些二手房的房源描述信息中可能是A商圈附近的二室一厅的房子,但是这类房子根本就不属于A商圈。如果用户搜索请求是A商圈中的二室一厅的房子,对搜索信息进行分词后,以分词结果作为关键词进行检索,则可能将A商圈附近的二室一厅的房子也作为搜索结果进行反馈,从而引入了一些干扰信息。然而,本公开实施例的技术方案可以基于用户搜索请求对应的搜索信息包含的设定字段逐项匹配预设词表,得到每一个设定字段下对应于用户搜索请求的数据库标识,从而,基于各个设定字段下的数据库标识得到与用户搜索请求对应的数据库标识组合。例如,若用户搜索请求对应的搜索信息是A市B区幸福里小区的二室一厅的房子,则将该搜索信息与预设词表集合中的各个预设词表进行匹配可以是:将该搜索信息依据设定字段分别与城市词表、市辖区词表、房产所属小区词表和户型词表进行匹配,分别由上述预设词表中匹配得到的城市ID、市辖区ID、房产所属小区ID和户型ID等等,其中,上述城市ID、市辖区ID、房产所属小区ID和户型ID均是数据库标识。以搜索信息是A市B区幸福里小区的二室一厅的房子为例,在搜索信息与预设词表匹配后得到的数据库标识组合可以是:ID1,ID B,ID-B5(代表B区内的幸福里小区)和ID 21。
步骤130、根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
需要说明的是,房源数据库可以是以数据库标识的组合的形式作为键,采用键值对的形式对房源记录进行存储的数据库。也就是说,在房源数据库中,以数据库标识组合作为键(以key表示),以房源记录作为值(以value表示),采用键值对的形式存储房源记录。
示例性的,可以采用数据库标识组合中的各个数据库标识分别查询房源数据库,得到与各个数据库标识匹配的参考房源记录。比对与各个数据库标识匹配的参考房源记录,确定与所有数据库标识均匹配的目标参考房源记录,将目标参考房源记录作为用户搜索请求对应的搜索结果。
可选的,还可以按照设定顺序,逐个获取数据库标识组合中的数据库标识,并基于数据库标识搜索房源数据库,以缩小下一次采用数据库标识搜索房源数据库的搜索范围,提高了搜索效率。例如,以搜索信息是A市B区幸福里小区的二室一厅的房子为例,采用代表城市的数据库标识搜索整个房源数据库,得到该数据库标识匹配的第一房源记录,排除了其它城市中的房源记录的干扰。再采用代表市辖区的数据库标识搜索第一房源记录(是房源数据库中的部分数据),得到A市B区内的所有二手房和新房的房源记录,作为第二房源记录。再采用代表房产所属小区的数据库标识搜索第二房源记录,得到A市B区幸福里小区内的所有二手房或新房的房源记录,作为第三房源记录。最后,采用代表户型的数据库标识搜索第三房源记录,得到A市B区幸福里小区内二室一厅的所有二手房或新房的房源记录,也就是说得到了与用户搜索请求对应的搜索结果。
需要说明的是,上述设定顺序可以是根据预先为各个预设词表设置的优先级确定的,该优先级可以依据预设词表对应的设定字段在由房源数据库中排除干扰房源记录的贡献率大小确定。例如,对于城市预设词表可以将搜索范围圈定在某一城市中,避免因市辖区或商圈重名而引入干扰房源记录,可以为城市预设词表分配较高优先级。对于户型预设词表,由于其仅能区分户型,不能区分不同城市、不同市辖区或者不同商圈等,可以为户型预设词表分配较低优先级等等。
本公开实施例的技术方案,在获取用户搜索请求对应的搜索信息之后,将该搜索信息与预设词表集合中的各个预设词表进行匹配,确定与该用户搜索请求对应的数据库标识组合,根据该数据库标识组合查询房源数据库,得到与该用户搜索请求对应的搜索结果。采用本公开实施例的技术方案,在基于用户搜索请求对应的搜索信息查询房源数据库之前,由搜索信息中获取与用户搜索请求对应的数据库标识组合,进而,基于数据库标识组合查询房源数据库,得到与用户搜索请求对应的搜索结果,实现搜索结果与用户搜索请求的高度匹配,避免出现搜索结果中包含较多干扰项或者漏检的情况,提高了信息搜索的准确度。
图2为本公开实施例提供的另一种信息搜索方法的流程图,本实施例可以与上述一个或者多个实施例中各个可选方案集合,在本实施例中将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合可以为:基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序;基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。如图2所示,该方法包括:
步骤210、获取用户搜索请求对应的搜索信息。
示例性的,获取用户搜索请求,分析该搜索请求提取搜索信息。
需要说明的是,在获取用户搜索请求对应的搜索信息之前,本公开实施例还包括下述附加技术特征,即基于设定字段和数据库标识生成该设定字段对应的预设词表,由上述预设词表构成预设词表集合。其中,设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向等等。
可选的,可以依据预设词表对应的设定字段由房源数据库中排除干扰房源记录的贡献率大小,为预设词表分配优先级。可以采用预设白名单存储各个预设词表的优先级。
步骤220、获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
步骤230、基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序。
示例性的,根据预设词表的优先级顺序,确定与搜索信息进行匹配的预设词表的匹配顺序。假设预设词表的优先级顺序是城市、市辖区、商圈、房产所属小区、户型和朝向,则可以按照上述优先级顺序将搜索信息与上述预设词表进行匹配。
步骤240、基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。
示例性的,根据上述确定的匹配顺序分别将预设词表与搜素信息进行匹配,得到与搜索信息对应的至少两个数据库标识,按照匹配顺序对上述至少两个数据库标识进行组合,得到与搜索信息匹配的数据库标识组合。
步骤250、基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录,若是,则执行步骤260,否则执行步骤270。
步骤260、将所述房源记录作为所述用户搜索请求对应的搜索结果。
若在房源数据库中存在与搜索信息对应的数据库标识组合匹配的房源记录,则将该房源记录作为该搜索信息对应的用户搜索请求对应的搜索结果。
步骤270、输出在房源数据库中未搜索到与用户搜索请求匹配的搜索结果的提示信息。
若在房源数据库中不存在与搜索信息对应的数据库标识组合匹配的房源记录,则输出提示信息,以提示用户在房源数据库中未搜索到与用户搜索请求匹配的搜索结果。
本公开实施例的技术方案,在获取用户搜索请求对应的搜索信息之后,基于预设词表集合中的预设词表的优先级,确定与该搜索信息进行匹配的预设词表的匹配顺序,基于匹配顺序分别匹配该搜索信息与预设词表,确定与该搜索信息对应的至少两个数据库标识,并根据匹配顺序对数据库标识进行组合,得到数据库标识组合。采用上述技术方案,可以根据预设词表的优先级分别匹配预设词表和搜索信息,以在每次执行匹配操作后缩小相邻的下一次匹配操作的匹配范围,提高数据库标识的确定效率。
图3为本公开实施例提供的又一种信息搜索方法的流程图,本实施例可以与上述一个或者多个实施例中各个可选方案结合,在本实施例中,在获取用户搜索请求对应的搜索信息之后,还包括:基于所述设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息。如图3所示,该方法包括:
步骤301、获取用户搜索请求对应的搜索信息。
步骤302、基于设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息。
需要说明的是的,搜索子信息是搜索信息中的部分内容,可以根据设定字段确定。若搜索信息中不包含某一设定字段对应的搜索子信息,则可以将该设定字段对应的搜索子信息标记为空信息。
例如,设定字段是城市,则由搜索信息中提取代表城市的搜索子信息。又如,设定字段是商圈,则由搜索信息中提取代表商圈的搜索子信息。又如,设定字段是房产所属小区,则由搜索信息中提取代表房产所属小区的搜索子信息。又如,设定字段是户型,则由搜索信息中提取代表户型的搜索子信息。又如,设定字段是朝向,则由搜索信息中提取代表朝向的搜索子信息等等。
步骤303、获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
步骤304、基于预设词表集合中的预设词表的优先级,确定与所述搜索子信息进行匹配的预设词表的匹配顺序。
示例性的,根据预设词表集合中的预设词表的优先级顺序,确定搜索子信息的匹配顺序,以便于根据该匹配顺序依次匹配搜索子信息和预设词表。
步骤305、基于所述匹配顺序,分别采用所述搜索子信息遍历与所述设定字段对应的预设词表。
示例性的,由于搜索子信息与设定字段存在关联关系,并且设定字段与预设词表也存在关联关系,因此,搜索子信息与预设词表具有对应关系。可以基于上述匹配顺序,依次根据搜索子信息遍历对应的预设词表,可以实现基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围的效果。例如,在基于商圈相关的搜索子信息遍历商圈预设词表,得到对应的商圈内的所有二手房和新房的数据。若相邻的下一次遍历是基于房产所属小区遍历对应的预设词表,则实际上可以仅遍历房产所属小区的预设词表中该商圈内的小区(预设词表的部分数据),而不用遍历房产所属小区的整个预设词表。
步骤306、根据各个所述搜索子信息对所述预设词表的遍历结果确定所述搜索信息对应的数据库标识。
示例性的,根据搜索子信息遍历对应的预设词表,基于遍历结果确定与该搜索子信息匹配的数据库标识。
步骤307、基于所述匹配顺序为所述数据库标识进行排序,得到数据库标识组合。
示例性的,在确定各个搜索子信息对应的数据库标识之后,根据匹配顺序对上述数据库标识进行排序,将排序结果作为数据库标识组合。
步骤308、基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录,若是,则执行步骤309,否则执行步骤310。
步骤309、将所述房源记录作为所述用户搜索请求对应的搜索结果。
步骤310、输出在房源数据库中未搜索到与用户搜索请求匹配的搜索结果的提示信息。
本公开实施例的技术方案,在获取用户搜索请求对应的搜索信息之后,基于设定字段由搜索信息中提取与该设定字段对应的搜索子信息;基于预设词表集合中的预设词表的优先级,确定各个搜索子信息与预设词表进行匹配的匹配顺序,基于该匹配顺序,分别采用搜索子信息遍历对应的预设词表,以基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围,实现快速确定与搜索信息匹配的数据库标识组合的效果,从而基于该数据库标识组合查询房源数据库,得到与用户搜索请求对应的搜索结果。
图4为本公开实施例提供的一种信息搜索装置的结构框图,本实施例可适用于基于用户搜索请求执行信息搜索的情况。该装置可以采用软件和/或硬件的方式实现,该装置可以配置在诸如智能手机、平板电脑、个人计算机、笔记本电脑、掌上电脑及智能家电等电子设备中。如图4所示,该装置可以包括:
搜索信息获取模块410,用于获取用户搜索请求对应的搜索信息;
搜索信息匹配模块420,用于将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
结果确定模块430,用于根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
本公开实施例的技术方案,在获取用户搜索请求对应的搜索信息之后,将该搜索信息与预设词表集合中的各个预设词表进行匹配,确定与该用户搜索请求对应的数据库标识组合,根据该数据库标识组合查询房源数据库,得到与该用户搜索请求对应的搜索结果。采用本公开实施例的技术方案,在基于用户搜索请求对应的搜索信息查询房源数据库之前,由搜索信息中获取与用户搜索请求对应的数据库标识组合,进而,基于数据库标识组合查询房源数据库,得到与用户搜索请求对应的搜索结果,实现搜索结果与用户搜索请求的高度匹配,避免出现搜索结果中包含较多干扰项或者漏检的情况,提高了信息搜索的准确度。
上述方案中,可选的是,所述设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向。
进一步的,还包括:
词表生成模块,用于在获取用户搜索请求对应的搜索信息之前,基于所述设定字段和数据库标识生成所述设定字段对应的预设词表,由所述预设词表构成预设词表集合。
上述方案中,可选的是,搜索信息匹配模块420包括:
顺序确定子模块,用于基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序;
词表匹配子模块,用于基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。
进一步的,还包括:
优先级确定模块,用于在基于预设词表集合中的预设词表的优先级之前,获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
进一步的,还包括:
搜索子信息确定模块,用于在获取用户搜索请求对应的搜索信息之后,基于所述设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息;
以及,词表匹配子模块具体用于:
基于所述匹配顺序,分别采用所述搜索子信息遍历与所述设定字段对应的预设词表,以基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围;
根据各个所述搜索子信息对所述预设词表的遍历结果确定所述搜索信息对应的数据库标识;
基于所述匹配顺序为所述数据库标识进行排序,得到数据库标识组合。
上述方案中,可选的是,结果确定模块430具体用于:
基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录;
若是,则将所述房源记录作为所述用户搜索请求对应的搜索结果。
本公开实施例还提供了一种电子设备,该电子设备中可集成本公开实施例提供的信息搜索装置。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
图5为本公开实施例提供的一种电子设备的结构框图。该电子设备可以包括:一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个存储器执行,使得所述一个或多个处理器实现如下方法:
获取用户搜索请求对应的搜索信息;
将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
应该理解的是,图示电子设备500仅仅是一个范例,并且电子设备500可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
下面就本实施例提供的集成有信息搜索装置的电子设备进行详细的描述。
如图5所示,电子设备500可以包括处理器(例如中央处理器等)520,其可以根据存储在只读存储器(ROM)530中的程序或者从存储器510加载到随机访问存储器(RAM)540中的程序而执行各种适当的动作和处理。在RAM540中,还存储有电子设备500操作所需的各种程序和数据。处理器520、ROM530以及RAM540通过总线550彼此相连。输入/输出(I/O)接口560也连接至总线550。
通常,以下装置可以连接至I/O接口560:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置580;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置590;包括例如磁带、硬盘等的存储器510;电子设备500还可以包括通信装置570。通信装置570可以允许电子设备500与其它设备进行无线或有线通信以交换数据。
特别地,根据本公开实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行本公开实施例提供的信息搜索方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储器被安装,或者从ROM被安装。在该计算机程序被处理器执行时,执行本公开实施例的搜索方法中限定的上述功能。
需要说明的是,本公开实施例中计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如下方法:
获取用户搜索请求对应的搜索信息;
将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的信息搜索操作,还可以执行本公开任意实施例所提供的信息搜索方法中的相关操作。
上述实施例中提供的信息搜索装置、存储介质及电子设备可执行本公开任意实施例所提供的信息搜索方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本公开任意实施例所提供的信息搜索方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块、单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块、单元的名称在某种情况下并不构成对该模块或单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种信息搜索方法,其特征在于,包括:
获取用户搜索请求对应的搜索信息;
将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述设定字段包括城市、商圈、市辖区、房产所属小区、户型和朝向。
3.根据权利要求2所述的方法,其特征在于,在获取用户搜索请求对应的搜索信息之前,还包括:
基于所述设定字段和数据库标识生成所述设定字段对应的预设词表,由所述预设词表构成预设词表集合。
4.根据权利要求1所述的方法,其特征在于,将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,包括:
基于预设词表集合中的预设词表的优先级,确定与所述搜索信息进行匹配的预设词表的匹配顺序;
基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合。
5.根据权利要求4所述的方法,其特征在于,在基于预设词表集合中的预设词表的优先级之前,还包括:
获取存储预设词表的优先级的预设白名单,根据所述预设白名单确定所述预设词表集合中各个所述预设词表的优先级。
6.根据权利要求4所述的方法,其特征在于,在获取用户搜索请求对应的搜索信息之后,还包括:
基于所述设定字段由所述搜索信息中提取各个所述设定字段对应的搜索子信息;
以及,基于所述匹配顺序分别匹配所述搜索信息与所述预设词表,确定与所述搜索信息对应的至少两个数据库标识,并对所述数据库标识进行组合,得到数据库标识组合,包括:
基于所述匹配顺序,分别采用所述搜索子信息遍历与所述设定字段对应的预设词表,以基于当前遍历过程缩小与所述当前遍历过程相邻的下一次遍历过程中所述搜索子信息的遍历范围;
根据各个所述搜索子信息对所述预设词表的遍历结果确定所述搜索信息对应的数据库标识;
基于所述匹配顺序为所述数据库标识进行排序,得到数据库标识组合。
7.根据权利要求6所述的方法,其特征在于,根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果,包括:
基于所述数据库标识组合查询所述房源数据库,判断所述房源数据库中是否存在与所述数据库标识组合匹配的房源记录;
若是,则将所述房源记录作为所述用户搜索请求对应的搜索结果。
8.一种信息搜索装置,其特征在于,包括:
搜索信息获取模块,用于获取用户搜索请求对应的搜索信息;
搜索信息匹配模块,用于将所述搜索信息与预设词表集合中的各个预设词表进行匹配,确定与所述用户搜索请求对应的数据库标识组合,其中,所述预设词表包含设定字段与数据库标识的关联关系,且在房源数据库中,所述数据库标识与房源记录具有关联关系;
结果确定模块,用于根据所述数据库标识组合查询所述房源数据库,得到与所述用户搜索请求对应的搜索结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的信息搜索方法。
10.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个存储器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的信息搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117446.5A CN111581490A (zh) | 2019-02-15 | 2019-02-15 | 一种信息搜索方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910117446.5A CN111581490A (zh) | 2019-02-15 | 2019-02-15 | 一种信息搜索方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111581490A true CN111581490A (zh) | 2020-08-25 |
Family
ID=72110805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910117446.5A Pending CN111581490A (zh) | 2019-02-15 | 2019-02-15 | 一种信息搜索方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581490A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112463798A (zh) * | 2020-12-08 | 2021-03-09 | 中国人寿保险股份有限公司 | 跨数据库数据提取方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101667309A (zh) * | 2009-09-25 | 2010-03-10 | 广东高新兴通信股份有限公司 | 一种基于门禁的进出管理系统及管理方法 |
CN102880721A (zh) * | 2012-10-15 | 2013-01-16 | 瑞庭网络技术(上海)有限公司 | 垂直搜索引擎的实现方法 |
US20130151548A1 (en) * | 2011-12-07 | 2013-06-13 | Verizon Patent And Licensing Inc. | Media content searching |
CN107092642A (zh) * | 2017-03-06 | 2017-08-25 | 广州神马移动信息科技有限公司 | 一种信息搜索方法、设备、客户端设备及服务器 |
CN108572949A (zh) * | 2018-04-18 | 2018-09-25 | 链家网(北京)科技有限公司 | 一种房屋信息搜索处理方法及装置 |
-
2019
- 2019-02-15 CN CN201910117446.5A patent/CN111581490A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101667309A (zh) * | 2009-09-25 | 2010-03-10 | 广东高新兴通信股份有限公司 | 一种基于门禁的进出管理系统及管理方法 |
US20130151548A1 (en) * | 2011-12-07 | 2013-06-13 | Verizon Patent And Licensing Inc. | Media content searching |
CN102880721A (zh) * | 2012-10-15 | 2013-01-16 | 瑞庭网络技术(上海)有限公司 | 垂直搜索引擎的实现方法 |
CN107092642A (zh) * | 2017-03-06 | 2017-08-25 | 广州神马移动信息科技有限公司 | 一种信息搜索方法、设备、客户端设备及服务器 |
CN108572949A (zh) * | 2018-04-18 | 2018-09-25 | 链家网(北京)科技有限公司 | 一种房屋信息搜索处理方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112463798A (zh) * | 2020-12-08 | 2021-03-09 | 中国人寿保险股份有限公司 | 跨数据库数据提取方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967357B (zh) | 一种好友的推送方法、系统及终端设备 | |
CN111522927B (zh) | 基于知识图谱的实体查询方法和装置 | |
CN109344336A (zh) | 搜索方法、搜索集生成方法、装置、介质、终端及服务器 | |
CN110633381B (zh) | 一种识别虚假房源的方法、装置、存储介质及电子设备 | |
US11310066B2 (en) | Method and apparatus for pushing information | |
US9659052B1 (en) | Data object resolver | |
CN111813804B (zh) | 一种数据查询方法、装置、电子设备及存储介质 | |
CN110619039A (zh) | 一种房产信息的校验方法、装置、存储介质及电子设备 | |
CN112115153A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112417318A (zh) | 一种兴趣点的状态确定方法、装置、电子设备及介质 | |
CN110083677B (zh) | 联系人的搜索方法、装置、设备及存储介质 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN109597996B (zh) | 一种语义解析方法、装置、设备和介质 | |
CN110895587B (zh) | 用于确定目标用户的方法和装置 | |
CN109582906B (zh) | 数据可靠度的确定方法、装置、设备和存储介质 | |
CN114385772A (zh) | 位置信息生成方法、装置、设备和计算机可读介质 | |
CN111126422A (zh) | 行业模型的建立及行业的确定方法、装置、设备及介质 | |
CN106549860B (zh) | 信息获取方法和装置 | |
CN111581490A (zh) | 一种信息搜索方法、装置、存储介质及电子设备 | |
CN110765238A (zh) | 数据加密查询方法及装置 | |
CN111488386A (zh) | 数据查询方法和装置 | |
CN111581228A (zh) | 更正搜索条件的搜索方法、装置、存储介质及电子设备 | |
CN111382365B (zh) | 用于输出信息的方法和装置 | |
CN114925680A (zh) | 物流兴趣点信息生成方法、装置、设备和计算机可读介质 | |
CN112148751B (zh) | 用于查询数据的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230406 Address after: Room 802, Information Building, 13 Linyin North Street, Pinggu District, Beijing, 101299 Applicant after: Beijing youzhuju Network Technology Co.,Ltd. Address before: No. 715, 7th floor, building 3, 52 Zhongguancun South Street, Haidian District, Beijing 100081 Applicant before: Beijing infinite light field technology Co.,Ltd. |
|
TA01 | Transfer of patent application right |