CN115203598A - 房产领域的信息排序方法、电子设备及存储介质 - Google Patents
房产领域的信息排序方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115203598A CN115203598A CN202210863202.3A CN202210863202A CN115203598A CN 115203598 A CN115203598 A CN 115203598A CN 202210863202 A CN202210863202 A CN 202210863202A CN 115203598 A CN115203598 A CN 115203598A
- Authority
- CN
- China
- Prior art keywords
- query
- candidate
- semantic relevance
- intention
- intent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000004590 computer program Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 12
- 239000000463 material Substances 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种房产领域的信息排序方法,包括:基于查询条件获取用户的查询意图;基于查询意图获取候选查询结果;对候选查询结果进行语义相关性评分,获得候选查询结果与查询条件之间的语义相关性分数;基于查询意图及语义相关性分数,对候选查询结果进行排序。本公开还提供了一种房产领域的信息排序装置、电子设备、可读存储介质及计算机程序产品。
Description
技术领域
本公开涉及房产领域搜索结果信息的排序技术,本公开尤其涉及一种房产领域的信息排序方法、电子设备、可读存储介质及计算机程序产品。
背景技术
房产领域的搜索场景,相关性通常是基于query(查询词)和候选物料的排序。用户在APP内使用搜索功能,会输入query词,结果展示多个tab(标签),每个tab内的候选物料按照一定顺序展示。其一,物料基于业务线会被聚合到不同tab下,用户根据需求进行tab切换和选择;其二,每个tab下的候选物料,与query都是具有一定的相关性。
现有技术中,基于用户query的搜索结果,搜索结果页大部分是基于点击率预估模型进行全局排序。query会作为其中的特征,但是这种特征并不能完全将query下强相关的结果都展示在弱相关的结果之前。同时,对于搜索结果如何进行tab之间的排序也是非常困难的。
发明内容
为了解决上述技术问题中的至少一个,本公开提供了一种房产领域的信息排序方法、电子设备、可读存储介质及计算机程序产品。
根据本公开的一个方面,提供一种房产领域的信息排序方法,包括:
基于查询条件获取用户的查询意图;
基于所述查询意图获取候选查询结果;
对所述候选查询结果进行语义相关性评分,获得所述候选查询结果与所述查询条件之间的语义相关性分数;
基于所述查询意图及语义相关性分数,对所述候选查询结果进行排序。
根据本公开至少一个实施方式的房产领域的信息排序方法,基于查询条件获取用户的查询意图之前,还包括:
对所述查询条件进行实验分流,包括将所述查询条件与用户信息进行关联;和/或
对所述查询条件进行规范化处理,所述规范化处理包括去除查询条件中的标点符号、将查询条件中的大/小写字母转换成统一格式和/或将查询条件中包含的不同类型的数字字符转换成成统一格式。
根据本公开至少一个实施方式的房产领域的信息排序方法,基于查询条件获取用户的查询意图,包括:
判断查询条件中是否包含特色标签;
如果查询条件中包含特色标签,则通过特色标签与意图类型的关联关系判断查询条件的意图类型;
如果查询条件中不包含特色标签,则通过业务相关性评分获得意图类型;
其中,所述意图类型包括第一查询意图和第二查询意图。
根据本公开至少一个实施方式的房产领域的信息排序方法,对所述候选结果进行语义相关性评分,获得各个候选查询结果与查询条件之间的语义相关性分数,包括:
计算候选结果与查询条件之间的中文/英文的匹配度;
通过查询语义相关性评分表,基于所述匹配度查询获得语义相关性分数及分数对应的关联度级别。
根据本公开至少一个实施方式的房产领域的信息排序方法,所述语义相关性评分表包括:
中文/英文匹配规则及在满足匹配规则下的分数及匹配规则对应的关联度等级。
根据本公开至少一个实施方式的房产领域的信息排序方法,通过业务相关性评分获得查询意图类型,包括:
获得查询条件在各个意图类型下的候选查询结果的语义相关性分数;
如果第一查询意图的候选查询结果的语义相关性分数大于第二查询意图的候选查询结果的语义相关性分数,则将第一查询意图确定为用户查询意图;
如果第一查询意图的候选查询结果的语义相关性分数小于第二查询意图的候选查询结果的语义相关性分数,则将第二查询意图确定为用户查询意图;
如果第一查询意图的候选查询结果的语义相关性分数等于第二查询意图的候选查询结果的语义相关性分数,则基于查询条件的房源所在地的预设规则策略,将第一查询意图或第二擦查询意图确定为用户查询意图。
根据本公开至少一个实施方式的房产领域的信息排序方法,基于所述查询意图及语义相关性分数,将所述候选查询结果进行排序,包括:
对查询意图的类型进行排序,将所述用户查询意图排在第一位;
在各个查询意图类型下,将查询意图类型对应的候选查询结果按照语义相关性分数进行排序;
在语义相关性分数相同的情况下,基于CTR得分对候选查询结果进行排序。
根据本公开的又一个方面,提供一种房产领域的信息排序装置,包括:
查询意图获取模块,基于查询条件获取用户的查询意图;
候选查询结果获取模块,基于所述查询意图获取候选查询结果;
语义相关性计算模块,对所述候选查询结果进行语义相关性评分,获得候选查询结果与查询条件之间的语义相关性分数;
业务相关性计算模块,对所述候选查询结果进行业务相关性评分,获得候选查询结果与查询条件之间的业务相关性分数;
排序模块,基于所述查询意图及语义相关性分数,对所述候选查询结果进行排序。
根据本公开的又一个方面,提供一种电子设备,包括:
存储器,所述存储器存储执行指令;处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行本公开任一个实施方式的信息排序方法。
根据本公开的又一个方面,提供一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现本公开任一个实施方式的信息排序方法。
根据本公开的又一个方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本公开任一个实施方式的信息排序方法。
附图说明
附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
图1是本公开一个实施方式的房产领域的信息排序方法的流程示意图。
图2是本公开一个实施方式的基于查询条件获取用户的查询意图的方法的流程示意图。
图3是本公开一个实施方式的通过业务相关性评分获得查询意图类型的方法的流程示意图。
图4是本公开一个实施方式的基于查询意图及语义相关性分数将候选查询结果进行排序的方法的流程示意图。
图5是本公开的一个实施方式的语义相关性评分表的示意图。
图6是本公开的又一个实施方式的语义相关性评分表的示意图。
图7是本公开的一个实施方式的房产领域的信息排序装置的结构示意框图。
附图标记说明
1000 房产领域的信息排序装置
1002 查询意图获取模块
1004 候选查询结果获取模块
1006 语义相关性计算模块
1008 业务相关性计算模块
1010 排序模块
1100 总线
1200 处理器
1300 存储器
1400 其他电路。
具体实施方式
下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开的技术方案。
除非另有说明,否则示出的示例性实施方式/实施例将被理解为提供可以在实践中实施本公开的技术构思的一些方式的各种细节的示例性特征。因此,除非另有说明,否则在不脱离本公开的技术构思的情况下,各种实施方式/实施例的特征可以另外地组合、分离、互换和/或重新布置。
在附图中使用交叉影线和/或阴影通常用于使相邻部件之间的边界变得清晰。如此,除非说明,否则交叉影线或阴影的存在与否均不传达或表示对部件的具体材料、材料性质、尺寸、比例、示出的部件之间的共性和/或部件的任何其它特性、属性、性质等的任何偏好或者要求。此外,在附图中,为了清楚和/或描述性的目的,可以夸大部件的尺寸和相对尺寸。当可以不同地实施示例性实施例时,可以以不同于所描述的顺序来执行具体的工艺顺序。例如,可以基本同时执行或者以与所描述的顺序相反的顺序执行两个连续描述的工艺。此外,同样的附图标记表示同样的部件。
当一个部件被称作“在”另一部件“上”或“之上”、“连接到”或“结合到”另一部件时,该部件可以直接在所述另一部件上、直接连接到或直接结合到所述另一部件,或者可以存在中间部件。然而,当部件被称作“直接在”另一部件“上”、“直接连接到”或“直接结合到”另一部件时,不存在中间部件。为此,术语“连接”可以指物理连接、电气连接等,并且具有或不具有中间部件。
本文使用的术语是为了描述具体实施例的目的,而不意图是限制性的。如这里所使用的,除非上下文另外清楚地指出,否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外,当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时,说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组,但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是,如这里使用的,术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语,如此,它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。
图1是本公开的一个实施方式的房产领域的信息排序方法的流程示意图。
如图1所示,本实施方式的房产领域的信息排序方法S100,包括:
S102、基于查询条件获取用户的查询意图;
S104、基于查询意图获取候选查询结果;
S106、对候选查询结果进行语义相关性评分,获得候选查询结果与查询条件之间的语义相关性分数;
S108、基于查询意图及语义相关性分数,对候选查询结果进行排序。
优选地,在步骤S102之前,即在基于查询条件获取用户的查询意图之前,还包括:
S101、对查询条件进行实验分流,包括将查询条件与用户信息进行关联;和/或对查询条件进行规范化处理,规范化处理包括去除查询条件中的标点符号、将查询条件中的大/小写字母转换成统一格式和/或将查询条件中包含的不同类型的数字字符转换成成统一格式。
其中,上述步骤S102,基于查询条件获取用户的查询意图,具体实施方式如图2所示。
如图2所示,优选地,基于查询条件获取用户的查询意图的方法S102,包括:
S1022、获取查询条件中包含的标签;
S1024、判断标签是否属于第一查询意图类型的标签,如果是,则将第一查询意图类型确定为用户查询意图,否则,到步骤S1024;
S1026、判断标签是否属于第二查询意图类型的标签,如果是,则将第二查询意图类型确定为用户查询意图,否则,到步骤S1026;
S1028、判断查询条件中不包含特色标签,此时,通过业务相关性评分获得意图类型。
其中,意图类型包括第一查询意图和第二查询意图。第一查询意图为新房,表示用户通过查询条件希望得到新房相关的查询结果。第二查询意图为二手房,表示用户通过查询条件希望得到二手房相关的查询结果。新房标签,如“现房”、“低密度”、“在售”等。二手房标签,如“满五”、“唯一”等。通过对应的标签,可以获得用户查询意图。优选的,查询意图通过json等规范化格式进行组织。S1026具体实施方式如图3所示。
其中,对于上述步骤S106,对候选结果进行语义相关性评分,获得各个候选查询结果与查询条件之间的语义相关性分数,包括:
计算候选结果与查询条件之间的中文/英文的匹配度;
通过查询语义相关性评分表,基于匹配度查询获得语义相关性分数、及分数对应的关联度级别。
在本公开的一些实施方式中,优选地,语义相关性评分表包括:
中文/英文匹配规则、在满足匹配规则下的分数及匹配规则对应的关联度等级。
图5是本公开的一个实施方式的语义相关性评分表的示意图。图5示出了新房楼盘的语义相关性评分表。
相关性分档为三个级别,即强相关、弱相关和不相关,三个级别的优先级关系为:强相关>弱相关>不相关;
如果相关性分档相同,接下来进行内部分级,其优先级:1级>2级>3级;
如果内部分级相同,接下来根据定义计算语义相关性分值;
如果相关性分值相同,最后根据CTR(即CTR预估模型,可以采用现有技术中的CTR预估模型)打分进行最终展示的排序。
其中,语义相关性分值计算规则如图5中所示。强相关分值范围为1.6至2.0,包括小区匹配或开发商/地铁线/地铁站匹配的情况。
当查询条件属于小区类型的前提下,首先判断查询条件是中文字符串或英文字符串,然后,再通过中文或拼音与候选结果匹配,符合不同匹配规则,得分不同,对应的内部分级和相关性分档也不同。查询条件是开发商、地铁线或地铁站时,内部分级为3级。根据查询条件与候选结果的中文/拼音不同的匹配度,得分不同。弱相关分值范围为1.1至1.55,内部分级为3级,分别对应的匹配类型如:1级包括C类房源、车库类型、无户型图、无图房源(无图类型),2级包括基于地铁、基于二手小区、公交站、地铁站等位置相关房源,3级包括基于embedding等技术召回的房源。不相关的分值为0至1.0,分级只有1级。另外,需要在弱相关的2级和3级相应的规则下,通过扩展召回获得更多候选结果。
图6是本公开的又一个实施方式的语义相关性评分表的示意图。图6示出了二手房源/二手小区的语义相关性评分表。
二手房源和新房楼盘的相关性分数计算逻辑是相同的,具体如下:
相关性分档为三个级别,即强相关、弱相关和不相关,三个级别的优先级关系为:强相关>弱相关>不相关;
如果相关性分档相同,接下来进行内部分级,其优先级:小区名>商圈名>城区名;
如果内部分级相同,接下来根据定义计算语义相关性分值;
如果相关性分值相同,最后根据精排模块的CTR打分进行最终展示的排序。
需要说明的是,对于本公开涉及的语义相关性,指的是字面相关性,在给定用户查询条件(Query)和候选查询结果(候选房源),计算两者之间的相关性得分,相关性得分用于在每个tab内部的排序。Query与房源的字面相关性的计算方式包括字面命中、覆盖程度、TF-IDF、BM25等。本公开涉及的业务相关性则是在字面相关性的基础上同时依赖Query特征、房源特征、用户特征、用户和房源的交叉特征,通过深度模型(如Bert),得到语义相关性的排序结果。
其中,对于上述步骤S1028,通过业务相关性评分获得查询意图类型,具体实施方式如图3所示。
图3是本公开的一个实施方式的通过业务相关性评分获得查询意图类型的方法S1028的流程示意图,包括:
S10282、获得查询条件在各个意图类型下的候选查询结果的语义相关性分数;
S10284、如果第一查询意图的候选查询结果的语义相关性分数大于第二查询意图的候选查询结果的语义相关性分数,则将第一查询意图确定为用户查询意图;
S10286、如果第一查询意图的候选查询结果的语义相关性分数小于第二查询意图的候选查询结果的语义相关性分数,则将第二查询意图确定为用户查询意图;
S10288、如果第一查询意图的候选查询结果的语义相关性分数等于第二查询意图的候选查询结果的语义相关性分数,则基于查询条件的房源所在地的预设规则策略,将第一查询意图或第二查询意图确定为用户查询意图。
其中,对于上述步骤S10288,第一查询意图的候选查询结果的语义相关性分数等于第二查询意图的候选查询结果的语义相关性分数的情况下,根据不同城市的楼盘具体销售情况,预先配置或调整相关数据信息并根据需要进行展示。例如,在某一特定城市A市,用户输入的查询条件是某一楼盘名称,该楼盘虽然是新盘,但是房源已经售罄,则在查询结果显示时,不会将第一意图(新房)的查询结果进行展示。
其中,对于上述步骤S108,具体实施方式如图4所示。
图4是本公开的一个实施方式的基于查询意图及语义相关性分数,将候选查询结果进行排序的方法的流程示意图。
如图4所示,基于查询意图及语义相关性分数,将候选查询结果进行排序的方法S108,包括:
S1082、对查询意图的类型进行排序,将用户查询意图排在第一位;
S1084、在各个查询意图类型下,将查询意图类型对应的候选查询结果按照语义相关性分数进行排序;
S1086、在语义相关性分数相同的情况下,基于CTR得分对候选查询结果进行排序。
本实施方式中,基于查询意图及语义相关性分数,将候选结果进行排序。首先,基于查询条件(query词)进行意图理解,得到不同用户意图,对应不同的tab,在不同tab下聚合候选结果;其次,每个tab下的候选结果会进行相关性排序之后进行分档,依次为强相关、相关、不相关;在每个分档内部,基于CTR预估的排序。最后,会基于query在每个tab下得到最高相关性的得分,作为每个tab的相关性得分,按照tab的得分进行tab间的相关性排序,最后将结果展示给用户。一方面,利用业务背景知识进行分档,另一方面,每个分档之间可比较,也就是量纲必须在同一个标准之上。本实施方式解决了查询条件的语义相关性和业务相关性的问题。
图7是本公开的一个实施方式的房产领域的信息排序装置的结构示意框图。
如图7所示,本实施方式的房产领域的信息排序装置1000,包括:
查询意图获取模块1002,基于查询条件获取用户的查询意图;
候选查询结果获取模块1004,基于查询意图获取候选查询结果;
语义相关性计算模块1006,对候选查询结果进行语义相关性评分,获得候选查询结果与查询条件之间的语义相关性分数;
业务相关性计算模块1008,对候选查询结果进行业务相关性评分,获得候选查询结果与查询条件之间的业务相关性分数;
排序模块1010,基于查询意图及语义相关性分数,对候选查询结果进行排序。
需要说明的是,本实施方式中各个模块对应的技术实施细节,与本公开提供的产领域综合搜索场景的相关性排序方法实施细节对应,此处不再一一赘述。
根据本公开的又一个方面,提供一种电子设备,包括:存储器,存储器存储执行指令;以及处理器,处理器执行存储器存储的执行指令,使得处理器执行上述任一项的信息排序方法。
根据本公开的又一个方面,提供一种可读存储介质,可读存储介质中存储有执行指令,执行指令被处理器执行时用于实现上述任一项的信息排序方法。
本公开提供的房产领域的信息排序方法/装置,基于查询条件获取用户的查询意图,根据获取的不同的查询意图进行不同的搜索结果的呈现。当查询条件更多的是搜索小区/楼盘的意图,搜索场景会将相关的搜索信息,搜索信息包括房源信息和房源内容相关信息,展示在同一个页面。当用户查询条件的意图是区域类,搜索场景会将该查询条件地理位置相关的结果展示在地图上,用户可以通过地图找房的方式寻找想要的信息。本公开提供的房产领域的信息排序方法/装置,提高了搜索效率,提升了用户搜索体验和满意度。
图7示出了采用处理系统的硬件实现方式的信息排序装置的结构示意框图。该装置可以包括执行上述流程图中各个或几个步骤的相应模块。因此,可以由相应模块执行上述流程图中的每个步骤或几个步骤,并且该装置可以包括这些模块中的一个或多个模块。模块可以是专门被配置为执行相应步骤的一个或多个硬件模块、或者由被配置为执行相应步骤的处理器来实现、或者存储在计算机可读介质内用于由处理器来实现、或者通过某种组合来实现。
该硬件结构可以利用总线架构来实现。总线架构可以包括任何数量的互连总线和桥接器,这取决于硬件的特定应用和总体设计约束。总线1100将包括一个或多个处理器1200、存储器1300和/或硬件模块的各种电路连接到一起。总线1100还可以将诸如外围设备、电压调节器、功率管理电路、外部天线等的各种其他电路1400连接。
总线1100可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,该图中仅用一条连接线表示,但并不表示仅有一根总线或一种类型的总线。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如,本公开中的方法实施方式可以被实现为软件程序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中,软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之一。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体实现在任何可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
就本说明书而言,“可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在存储器中。
应当理解,本公开的各部分可以用硬件、软件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施方式方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种可读存储介质中,该程序在执行时,包括方法实施方式的步骤之一或其组合。
此外,在本公开各个实施方式中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读存储介质中。存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施方式/方式”、“一些实施方式/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施方式/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式/方式或示例中。在本说明书中,对上述术语的示意性表述不必须的是相同的实施方式/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施方式/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施方式/方式或示例以及不同实施方式/方式或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。
Claims (10)
1.一种房产领域的信息排序方法,其特征在于,包括:
基于查询条件获取用户的查询意图;
基于所述查询意图获取候选查询结果;
对所述候选查询结果进行语义相关性评分,获得所述候选查询结果与所述查询条件之间的语义相关性分数;以及
基于所述查询意图及语义相关性分数,对所述候选查询结果进行排序。
2.根据权利要求1所述的房产领域的信息排序方法,其特征在于,基于查询条件获取用户的查询意图之前,还包括:
对所述查询条件进行实验分流,包括将所述查询条件与用户信息进行关联;和/或
对所述查询条件进行规范化处理,所述规范化处理包括去除查询条件中的标点符号、将查询条件中的大/小写字母转换成统一格式和/或将查询条件中包含的不同类型的数字字符转换成成统一格式。
3.根据权利要求1所述的房产领域的信息排序方法,其特征在于,基于查询条件获取用户的查询意图,包括:
判断查询条件中是否包含特色标签;
如果查询条件中包含特色标签,则通过特色标签与意图类型的关联关系判断查询条件的意图类型;以及
如果查询条件中不包含特色标签,则通过业务相关性评分获得意图类型;
其中,所述意图类型包括第一查询意图和第二查询意图。
4.根据权利要求1所述的房产领域的信息排序方法,其特征在于,对所述候选结果进行语义相关性评分,获得各个候选查询结果与查询条件之间的语义相关性分数,包括:
计算候选结果与查询条件之间的中文/英文的匹配度;以及
通过查询语义相关性评分表,基于所述匹配度查询获得语义相关性分数及分数对应的关联度级别。
5.根据权利要求4所述的房产领域的信息排序方法,其特征在于,所述语义相关性评分表包括:
中文/英文匹配规则及在满足匹配规则下的分数及匹配规则对应的关联度等级。
6.根据权利要求5所述的房产领域的信息排序方法,其特征在于,通过业务相关性评分获得查询意图类型,包括:
获得查询条件在各个意图类型下的候选查询结果的语义相关性分数;
如果第一查询意图的候选查询结果的语义相关性分数大于第二查询意图的候选查询结果的语义相关性分数,则将第一查询意图确定为用户查询意图;
如果第一查询意图的候选查询结果的语义相关性分数小于第二查询意图的候选查询结果的语义相关性分数,则将第二查询意图确定为用户查询意图;
如果第一查询意图的候选查询结果的语义相关性分数等于第二查询意图的候选查询结果的语义相关性分数,则基于查询条件的房源所在地的预设规则策略,将第一查询意图或第二擦查询意图确定为用户查询意图。
7.根据权利要求6所述的房产领域的信息排序方法,其特征在于,基于所述查询意图及语义相关性分数,将所述候选查询结果进行排序,包括:
对查询意图的类型进行排序,将所述用户查询意图排在第一位;
在各个查询意图类型下,将查询意图类型对应的候选查询结果按照语义相关性分数进行排序;以及
在语义相关性分数相同的情况下,基于CTR得分对候选查询结果进行排序。
8.一种电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;以及
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如权利要求1至7中任一项所述的信息排序方法。
9.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的信息排序方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至7中任一项所述的信息排序方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210863202.3A CN115203598B (zh) | 2022-07-20 | 2022-07-20 | 房产领域的信息排序方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210863202.3A CN115203598B (zh) | 2022-07-20 | 2022-07-20 | 房产领域的信息排序方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115203598A true CN115203598A (zh) | 2022-10-18 |
CN115203598B CN115203598B (zh) | 2023-09-19 |
Family
ID=83584456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210863202.3A Active CN115203598B (zh) | 2022-07-20 | 2022-07-20 | 房产领域的信息排序方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115203598B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163222A (zh) * | 2011-04-02 | 2011-08-24 | 中国医学科学院医学信息研究所 | 基于标引关联关系的信息检索排序方法 |
WO2013030823A2 (en) * | 2011-08-29 | 2013-03-07 | Jobookit Technologies Ltd. | An intelligent job recruitment system and method |
WO2014098561A1 (en) * | 2012-12-18 | 2014-06-26 | Mimos Berhad | A semantic query system and method thereof |
CN104063523A (zh) * | 2014-07-21 | 2014-09-24 | 焦点科技股份有限公司 | 一种电子商务搜索评分与排名的方法及系统 |
CN109033244A (zh) * | 2018-07-05 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法和装置 |
CN111782965A (zh) * | 2020-06-29 | 2020-10-16 | 北京百度网讯科技有限公司 | 意图推荐方法、装置、设备及存储介质 |
CN112434072A (zh) * | 2021-01-27 | 2021-03-02 | 浙江口碑网络技术有限公司 | 搜索方法、装置、电子设备及存储介质 |
-
2022
- 2022-07-20 CN CN202210863202.3A patent/CN115203598B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163222A (zh) * | 2011-04-02 | 2011-08-24 | 中国医学科学院医学信息研究所 | 基于标引关联关系的信息检索排序方法 |
WO2013030823A2 (en) * | 2011-08-29 | 2013-03-07 | Jobookit Technologies Ltd. | An intelligent job recruitment system and method |
WO2014098561A1 (en) * | 2012-12-18 | 2014-06-26 | Mimos Berhad | A semantic query system and method thereof |
CN104063523A (zh) * | 2014-07-21 | 2014-09-24 | 焦点科技股份有限公司 | 一种电子商务搜索评分与排名的方法及系统 |
CN109033244A (zh) * | 2018-07-05 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法和装置 |
CN111782965A (zh) * | 2020-06-29 | 2020-10-16 | 北京百度网讯科技有限公司 | 意图推荐方法、装置、设备及存储介质 |
CN112434072A (zh) * | 2021-01-27 | 2021-03-02 | 浙江口碑网络技术有限公司 | 搜索方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115203598B (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825957B (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN106202186B (zh) | 基于人工智能的服务推荐方法和装置 | |
CN110297935A (zh) | 图像检索方法、装置、介质及电子设备 | |
CN110543592A (zh) | 信息搜索方法、装置以及计算机设备 | |
CN114723528A (zh) | 基于知识图谱的商品个性化推荐方法及系统 | |
CN109271509B (zh) | 直播间话题的生成方法、装置、计算机设备和存储介质 | |
CN110737774A (zh) | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 | |
CN110909222A (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
CN112818111B (zh) | 文档推荐方法、装置、电子设备和介质 | |
CN113239295A (zh) | 搜索方法、装置、电子设备以及存储介质 | |
CN104572733A (zh) | 用户兴趣标签分类的方法及装置 | |
US20080243482A1 (en) | Method for performing effective drill-down operations in text corpus visualization and exploration using language model approaches for key phrase weighting | |
CN112100493B (zh) | 文档排序方法、装置、设备及存储介质 | |
CN109635004A (zh) | 一种数据库的对象描述提供方法、装置及设备 | |
JP2020004217A (ja) | 情報表示方法、情報表示プログラムおよび情報表示装置 | |
CN110866122B (zh) | 一种基于知识图谱的实体词映射的方法及装置 | |
CN115203598B (zh) | 房产领域的信息排序方法、电子设备及存储介质 | |
CN115936017B (zh) | 一种支持界面多语言和数据多语言的主数据管理方法 | |
CN117033534A (zh) | 地理信息处理方法、装置、计算机设备和存储介质 | |
CN111506715B (zh) | 查询方法、装置、电子设备及存储介质 | |
CN110807330B (zh) | 语义理解模型评估方法、装置及存储介质 | |
CN109002446A (zh) | 一种智能排序方法、终端与计算机可读存储介质 | |
CN112784046A (zh) | 文本聚簇的方法、装置、设备及存储介质 | |
CN109492214B (zh) | 属性词识别及其层次构建方法、装置、设备及存储介质 | |
CN111931480A (zh) | 文本主要内容的确定方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |