CN110377831B - 检索方法、装置、可读存储介质和电子设备 - Google Patents
检索方法、装置、可读存储介质和电子设备 Download PDFInfo
- Publication number
- CN110377831B CN110377831B CN201910675124.2A CN201910675124A CN110377831B CN 110377831 B CN110377831 B CN 110377831B CN 201910675124 A CN201910675124 A CN 201910675124A CN 110377831 B CN110377831 B CN 110377831B
- Authority
- CN
- China
- Prior art keywords
- candidate object
- matching
- candidate
- matching coefficient
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012937 correction Methods 0.000 claims description 82
- 238000012549 training Methods 0.000 claims description 29
- 238000012986 modification Methods 0.000 claims description 22
- 230000004048 modification Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 235000012149 noodles Nutrition 0.000 description 27
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 241000238565 lobster Species 0.000 description 4
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000000813 small intestine Anatomy 0.000 description 2
- 241000238017 Astacoidea Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 235000013322 soy milk Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种检索方法、装置、可读存储介质和电子设备,所述方法通过检索词和目标候选对象名称的相关度确定修正因子,进一步通过所述修正因子判断目标候选对象与检索词的匹配度,最后根据各候选对象与检索词的匹配度进行排序,输出检索结果。通过所述方法得到的检索结果能够更好的和用户的意图匹配,提升用户体验和信息检索的准确率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种检索方法、装置、可读存储介质和电子设备。
背景技术
随着互联网的迅速发展,目前人们在进行酒店预订、订餐、购物等活动时都会在互联网先进行相关的服务或信息检索。在进行检索的过程中,由于互联网的数据量庞大,需要确定不同检索结果和用户检索词的匹配程度,按照用户匹配程度从高到低进行排序并输出。但当用户输入的检索词可以同时检索到多个不同名称的检索结果时难以确定与用户意图匹配的检索结果。例如检索词为“冷面”时可以检索到名称为“冷面”和“烤冷面”的两种不同商品,现有技术仅凭名称难以对这两种商品进行区分,因此会导致返回的结果和用户的匹配度较差。
发明内容
有鉴于此,本发明实施例提供一种检索方法、装置、可读存储介质和电子设备,所述方法旨在建立检索对象和检索词之间的关联度,提升用户体验和信息检索的准确率。
第一方面,本发明实施例公开了一种检索方法,所述方法包括:
接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数;
根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子;
根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
进一步地,所述根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子具体为:
分别将所述检索词和所述各候选对象名称输入预测模型中以确定所述各候选对象的修正因子,所述预测模型通过预先训练获得。
进一步地,所述预测模型根据所述用户终端对应用户的历史信息预先训练得到,所述用户的历史信息包括所述用户历史检索词、根据所述检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述预测模型根据预定用户集合的历史信息预先训练得到,所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数包括:
将所述候选对象的修正因子和第一匹配系数输入匹配模型以确定所述候选对象的第二匹配系数,所述匹配模型根据所述各候选对象的修正因子、第一匹配系数和后续对所述各候选对象的操作状态训练得到。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数还包括:
计算所述修正因子与所述候选对象的第一匹配系数的乘积以确定所述候选对象的第二匹配系数。
第二方面,本发明实施例公开了一种检索装置,所述装置包括:
检索模块,用于接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数。
计算模块,用于根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子。
修正模块,用于根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数。
排序模块,用于根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
第三方面,本发明实施例公开了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中任一项所述的方法。
第四方面,本发明实施例公开了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如下所述步骤:
接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数;
根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子;
根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
进一步地,所述根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子具体为:
分别将所述检索词和所述各候选对象名称输入预测模型中以确定所述各候选对象的修正因子,所述预测模型通过预先训练获得。
进一步地,所述预测模型根据所述用户终端对应用户的历史信息预先训练得到,所述用户的历史信息包括所述用户历史检索词、根据所述检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述预测模型根据预定用户集合的历史信息预先训练得到,所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数包括:
将所述候选对象的修正因子和第一匹配系数输入匹配模型以确定所述候选对象的第二匹配系数,所述匹配模型根据所述各候选对象的修正因子、第一匹配系数和后续对所述各候选对象的操作状态训练得到。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数还包括:
计算所述修正因子与所述候选对象的第一匹配系数的乘积以确定所述候选对象的第二匹配系数。
所述方法通过检索词和目标候选对象名称的相关度确定修正因子,进一步通过所述修正因子判断目标候选对象与检索词的匹配度,最后根据各候选对象与检索词的匹配度进行排序,输出检索结果。通过所述方法得到的检索结果能够更好的和用户的意图匹配,提升用户体验和信息检索的准确率。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1为本发明实施例的检索方法的流程图;
图2为本发明实施例的检索方法的数据流向示意图;
图3为本发明实施例的检索装置的示意图;
图4为本发明实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则整个说明书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
图1为本发明实施例的检索方法的流程图,如图1所示,所述方法包括:
步骤S100:接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数。
具体地,所述用户终端包括移动终端和固网终端,所述移动终端例如可以是手机、平板电脑、智能手表等移动电子设备,所述固网终端例如可以是台式电脑等电子设备。所述检索请求包括用于本次检索过程的检索词,所述检索词用于在对象集合中检索相关的数据作为候选对象,例如,在外卖软件或购物软件中输入检索词“冷面”进行检索,根据所述检索词在所述外卖软件或购物软件的数据库中确定包含“冷面”、“烤冷面”、“冷面调料”等名称相关的数据或“韩国料理”、“凉面”等其他属性相关的数据作为候选对象输出。所述候选对象为根据检索词确定的检索结果,可以以候选对象名称的形式显示。可选的,所述检索请求还包括用户标识,所述用户标识例如可以是用户名称、用户ID、用户代码或IP地址等用于识别用户身份的信息。
所述候选对象例如可以包括商户、商品、服务项目等,所述候选对象的名称用于表征所述候选对象。可选的,还可以通过其他字符、代码等标识表征所述候选对象,所述代码例如可以是“001”、“002”、“003”等与候选对象一一对应的数字编码或字符串。仍以输入检索词“冷面”为例进行说明,所述检索结果可以包括名称为“韩国冷面”、“小张冷面”、“东北烤冷面”等商户和/或名称为“冷面”、“韩国冷面”、“烤冷面”、“豆浆冷面”等商品。
每个所述候选对象对应一个第一匹配系数,所述第一匹配系数用于表征所述候选对象与所述检索词的匹配程度,通过以距离、人气、好评、销量等参数作为参考值计算确定。在本实施例中,当所述第一匹配系数越大时,所述候选对象与所述检索词的匹配程度越高。所述确定第一匹配系数的方法包括多种,例如可以是获取所述全部对象的距离、人气、好评、销量等参数构建训练集合,通过所述训练集合训练匹配度模型。在需要确定目标候选对象的第一匹配系数时,将所述对象的距离、人气、好评、销量等参数输入所述匹配度模型中,即可输出所述候选对象对应的第一匹配系数。或通过计算预先确定所述距离、人气、好评、销量等参数的权重,在需要确定目标候选对象的第一匹配系数时,通过计算所述对象的距离、人气、好评、销量等参数的加权和得到所述候选对象对应的第一匹配系数。例如,当所述第一匹配系数通过距离A、人气B、好评C和销量D四个参数作为参考值确定时。预先设定所述距离、人气、好评和销量的权重分别为μ、μ1、μ2、μ3,则第一匹配系数的计算公式为S=μA+μ1B+μ2C+μ3D,所述第一匹配系数为S。
步骤S200:根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子。
具体地,所述步骤S100中检索到的候选对象通过距离、人气、好评、销量等候选对象本身的属性参数作为参考值计算确定第一匹配系数。使得所述第一匹配系数的确定过程并未考虑检索词和每个候选对象名称之间的匹配关系,导致返回的结果和用户的匹配度较差。例如当用户在外卖软件上输入检索词“肠粉”时,获取到的候选对象名称包括“广东肠粉”、“牛肠粉”、“猪血肠粉条”等完全不同的商品。仅通过距离、人气、好评、销量等候选对象本身的属性确定获取到的各候选对象第一匹配系数,可能导致用户不想购买的商品“广东肠粉”和“猪血肠粉条”在最终输出的检索结果中排序靠前,用户想要购买的商品“牛肠粉”在所述检索结果中的排序靠后。所述修正因子用于对所述第一匹配系数进行修正,将所述检索词和所述候选对象名称之间的关联度作为一项参数,进一步确定所述检索词和每个候选对象之间匹配程度。
进一步地,在本实施例中将所述检索词和候选对象名称输入预测模型中以确定所述候选对象的修正因子,所述预测模型预先训练获得。所述预测模型例如可以是卷积神经网络模型。所述预测模型可以通过当前所述用户的历史信息构建训练集合对所述预测模型进行训练,其中所述用户的历史信息包括所述用户历史输入的检索词、根据所述检索词曝光的对象名称和后续对所述候选对象的操作状态。所述曝光的对象名称为用户读取过的候选对象名称。所述操作状态可以通过文字或数字来表示,当用文字表示操作状态时,所述文字例如可以是“下单”、“未下单”,当用数字表示操作状态时,所述数值例如可以是代表下单操作的“1”和未下单操作的“0”。在训练预测模型时,将所述用户历史输入的检索词和根据所述检索词曝光的对象名称作为输入,将所述操作状态作为输出。当用户曾经输入检索词“冷面”,且在检索到的候选对象中购买了商品“烤冷面”时将“冷面”和“烤冷面”作为所述预测模型的输入,将“1”或“下单”作为所述预测模型的输出;当用户曾经输入检索词“冷面”,且在检索到的候选对象中购买了商户“小张冷面”的商品,将“冷面”和“小张冷面”作为所述预测模型的输入,将“1”或“下单”作为所述预测模型的输出。当所述预测模型的输出为数字“1”或“0”,且“1”表征下单状态,“0”表征未下单状态时,在本次检索过程中,将本次检索过程的检索词和目标候选对象名称输入所述训练好的预测模型,输出一个“1”和“0”之间的数值作为修正因子,当所述修正因子越大时,表征所述候选对象名称与所述检索词的关联度越高。可选的,所述预测模型的训练过程可以先根据所述检索请求获取用户标识,根据所述用户标识确定用户的历史信息,然后再通过当前所述用户的历史信息构建训练集合对所述预测模型进行训练。
可选的,因单个用户的数据量小,不能包括所有检索词的类别,仅通过一个用户的历史信息构建训练集合可能无法覆盖用户本次检索的检索词,导致通过预测模型得到的结果不准确。因此,所述预测模型的训练集合还可以根据预定用户集合的历史信息构建。所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的对象名称和后续对所述候选对象的操作状态。所述预定用户集合可以是发生所述检索过程的软件中的全部用户,或进一步对所述检索过程的软件中的全部用户进行分类,确定本次检索用户所在的类别中用户组成预定用户集合。其中所述全部用户可以根据用户的行为习惯、用户属性信息、历史订单等作为参数进行分类。例如,当根据全部用户的行为习惯对所述用户进行分类时,先获取全部用户的行为习惯,再根据目标用户的行为习惯对目标用户进行分类,例如在外卖软件中根据用户历史的订单将用户分类为“甜食爱好者”、“麻辣爱好者”、“面食爱好者”等。若本次检索的用户属于“麻辣爱好者”,则确定所述“麻辣爱好者”分类中的全体用户为预定用户集合。在训练预测模型时,将所述预定用户集合中各用户历史输入的检索词和根据所述检索词曝光的对象名称作为输入,将所述操作状态作为输出。当所述预定用户集合中的某用户曾经输入检索词“冷面”,且在检索到的候选对象中购买了商品“烤冷面”时,将“冷面”和“烤冷面”作为所述预测模型的输入,将“1”或“下单”作为所述预测模型的输出;当所述预定用户集合中某用户曾经输入检索词“冷面”,且在检索到的候选对象中购买了商户“小张冷面”的商品,将“冷面”和“小张冷面”作为所述预测模型的输入,将“1”或“下单”作为所述预测模型的输出。当所述预测模型的输出为数字“1”或“0”,且“1”表征下单状态,“0”表征未下单状态时,在本次检索过程中,将本次检索过程的检索词和目标候选对象名称输入所述训练好的预测模型,输出一个“1”和“0”之间的数值作为修正因子,当所述修正因子越大时,表征所述候选对象名称与所述检索词的关联度越高。
步骤S300:根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数。
具体地,所述第二匹配系数通过修正因子对所述第一匹配系数修正得到,与所述第一匹配系数相比进一步增加了对所述检索词和所述候选对象名称关联度的考虑,使得各候选对象与用户的匹配程度更加精准。所述根据修正因子对第一匹配系数进行修正的方法包括将所述候选对象对应的修正因子和第一匹配系数输入匹配模型以确定所述第二匹配系数的方案,具体的,将所述候选对象的修正因子和第一匹配系数输入匹配模型,输出本次检索过程对所述候选对象下单的概率值,确定所述概率值为第二匹配系数。其中所述匹配模型根据目标候选对象的修正因子、第一匹配系数和后续对所述候选对象的操作状态训练得到,所述操作状态例如可以通过数字“1”和“0”表示,其中“1”用于表征下单状态,“0”用于表征未下单状态。即先确定所述用户的历史检索过程中的各候选对象对应的第一匹配系数和修正因子,将所述第一匹配系数和修正因子作为所述匹配模型的输入,当下单所述候选对象时将“1”作为所述匹配模型的输出,当未下单所述候选对象时将“0”作为所述匹配模型的输出。当确定一个候选对象的第二匹配系数时,将所述候选对象的修正因子和第一匹配系数输入所述匹配模型,输出一个“0-1”之间的数字作为第二匹配系数,所述第二匹配系数越大表征本次检索过程中对所述候选对象下单的概率越高。可选的,所述匹配模型还可以根据预定用户集合中用户在检索过程中检索到的各候选对象的修正因子、第一匹配系数和后续对所述候选对象的操作状态训练得到。所述预定用户集合可以是发生所述检索过程的软件中的全部用户,或进一步对所述检索过程的软件中的全部用户进行分类,确定本次检索用户所在的类别中用户组成预定用户集合。
作为本实施例的另一个可选的实现方式,所述根据修正因子对第一匹配系数进行修正的方法还包括计算所述修正因子与所述第一匹配系数的加权和以确定第二匹配系数的方案。例如当所述目标候选对象的第一匹配系数为S,所述修正系数为c时,所述目标候选对象的第二匹配系数T=μS+μ1c,所述第一匹配系数和修正系数的权重μ、μ1可以是预先计算出的常数。可选的,所述根据修正因子对第一匹配系数进行修正的方法还可以包括直接计算所述修正因子和第一匹配系数乘积等方案,例如当所述目标候选对象的第一匹配系数为S,所述修正系数为c时,所述目标候选对象的第二匹配系数T=Sc。
步骤S400:根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
具体地,根据步骤S300进一步修正后,每一个候选对象有对应的第二匹配系数,根据所述第二匹配系数对所述候选对象集合中的对象进行排序。根据匹配系数的表征方式不同,所述排序过程不同,例如当所述匹配系数越大表示越匹配时,将所述候选对象按照对应的匹配系数从大到小的顺序进行排序。即将第二匹配系数高的候选对象排列在前,第二匹配系数低的候选对象排列在后输出检索结果。当所述匹配系数越小表示越匹配时,将所述候选对象按照对应的匹配系数从小到大的顺序进行排序。即将第二匹配系数低的候选对象排列在前,第二匹配系数高的候选对象排列在后输出检索结果。因计算所述第二匹配系数的过程中引入了修正因子,所述排序过程可以改变输出的检索结果,使最终用户获取的检索结果和用户的意图更加匹配。
所述方法通过检索词和目标候选对象名称的相关度确定修正因子,进一步通过所述修正因子判断目标候选对象与检索词的匹配度,最后根据各候选对象与检索词的匹配度进行排序,输出检索结果。通过所述方法得到的检索结果能够更好的和用户的意图匹配,提升用户体验和信息检索的准确率。
图2为本发明实施例的检索方法的数据流向示意图,如图2所示,用户根据检索词检索到候选对象及对应的第一匹配系数,再根据所述修正因子确定第二匹配系数,最后根据第二匹配系数对所述候选对象排序并输出。
具体地,用户根据所述检索词在检索软件数据库中包含的对象集合中确定与所述检索词相关的候选对象,所述候选对象例如可以是商户、商品、信息等。例如在外卖软件中进行检索,输入检索词“龙虾”时检索到的候选对象可以包括“麻辣小龙虾”、“波士顿龙虾”、“香辣龙虾味泡面”、“龙虾饭”等商品。每个候选对象包括对应的第一匹配系数S,用于表示所述候选对象与所述用户输入的检索词的匹配程度。所述目标候选对象对应的修正因子通过所述检索词和目标候选对象名称确定,具体为将所述检索词和目标候选对象名称输入预测模型中以确定所述目标候选对象的修正因子,所述预测模型预先训练获得。根据所述各候选对象对应的修正因子修正各候选对象的第一匹配系数S包括将所述候选对象对应的修正因子和第一匹配系数输入匹配模型以确定所述第二匹配系数、计算所述修正因子与所述第一匹配系数的乘积以确定第二匹配系数、直接计算所述修正因子和第一匹配系数乘积或其他可选的方案。当所述第二匹配系数通过计算所述修正因子与所述第一匹配系数的加权和得出时。例如,所述修正系数为c时,所述目标候选对象的第二匹配系数T=μS+μ1c,所述第一匹配系数和修正系数的权重μ、μ1可以是预先计算出的常数。当通过将所述候选对象对应的修正因子和第一匹配系数输入匹配模型确定所述第二匹配系数时,所述匹配模型根据目标候选对象的修正因子、第一匹配系数和后续对所述候选对象的操作状态预先训练得到。确定个候选对象对应的所述第二匹配系数后根据对应的第二匹配系数对所述候选对象进行排序,得到并输出按照所述用户对价格的偏好进行排序的检索结果。根据第二匹配系数的表征方式不同,所述排序过程不同,例如当所述第二匹配系数越大表示越匹配时,将所述候选对象按照对应的第二匹配系数从大到小的顺序进行排序。当所述第二匹配系数越小表示越匹配时,将所述候选对象按照对应的第二匹配系数从小到大的顺序进行排序。
图3为本发明实施例的检索装置的示意图,如图3所示,所述装置包括检索模块30、计算模块31、修正模块32和排序模块33。
具体地,所述检索模块30用于根据预先确定的检索词确定各候选对象的名称和对应的第一匹配系数。所述计算模块31用于根据所述检索词和目标候选对象名称确定对应的修正因子。所述修正模块32用于根据各候选对象对应的修正因子对第一匹配系数进行修正以确定第二匹配系数。所述排序模块33用于根据所述第二匹配系数对所述候选对象进行排序并输出检索结果。
所述装置能够实现图1所述的检索方法,通过检索词和目标候选对象名称的相关度确定修正因子,进一步通过所述修正因子判断目标候选对象与检索词的匹配度,最后根据各候选对象与检索词的匹配度进行排序,输出检索结果。使最终得到的检索结果能够更好的和用户的意图匹配,提升用户体验和信息检索的准确率。
图4为本发明实施例的电子设备示意图,如图4所示,在本实施例中,所述电子设备包括服务器、终端等。如图所示,所述电子设备包括:至少一个处理器42;与至少一个处理器通信连接的存储器41;以及与存储介质通信连接的通信组件43,所述通信组件43在处理器的控制下接收和发送数据;其中,存储器41存储有可被至少一个处理器42执行的指令,指令被至少一个处理器42执行以实现如下所述的步骤:
接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数;
根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子;
根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
进一步地,所述根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子具体为:
分别将所述检索词和所述各候选对象名称输入预测模型中以确定所述各候选对象的修正因子,所述预测模型通过预先训练获得。
进一步地,所述预测模型根据所述用户终端对应用户的历史信息预先训练得到,所述用户的历史信息包括所述用户历史检索词、根据所述检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述预测模型根据预定用户集合的历史信息预先训练得到,所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数包括:
将所述候选对象的修正因子和第一匹配系数输入匹配模型以确定所述候选对象的第二匹配系数,所述匹配模型根据所述各候选对象的修正因子、第一匹配系数和后续对所述各候选对象的操作状态训练得到。
进一步地,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数还包括:
计算所述修正因子与所述候选对象的第一匹配系数的乘积以确定所述候选对象的第二匹配系数。
具体地,所述存储器41作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器42通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述检索方法。
存储器41可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器41可选包括相对于处理器42远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器41中,当被一个或者多个处理器42执行时,执行上述任意方法实施例中的检索方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
本发明还涉及一种计算机可读存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(proceSSor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random AcceSS Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种检索方法,其特征在于,所述方法包括:
接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数,所述第一匹配系数用于表征所述候选对象与所述检索词的匹配程度,以包括距离、人气、好评、销量的参数输入匹配度模型确定或计算加权和确定;
根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子,所述各候选对象的修正因子表征所述检索词和所述候选对象名称之间的关联度;
根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子具体为:
分别将所述检索词和所述各候选对象名称输入预测模型中以确定所述各候选对象的修正因子,所述预测模型通过预先训练获得。
3.根据权利要求2所述的方法,其特征在于,所述预测模型根据所述用户终端对应用户的历史信息预先训练得到,所述用户的历史信息包括所述用户历史检索词、根据所述检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
4.根据权利要求2所述的方法,其特征在于,所述预测模型根据预定用户集合的历史信息预先训练得到,所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
5.根据权利要求1所述的方法,其特征在于,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数包括:
将所述候选对象的修正因子和第一匹配系数输入匹配模型以确定所述候选对象的第二匹配系数,所述匹配模型根据所述各候选对象的修正因子、第一匹配系数和后续对所述各候选对象的操作状态训练得到。
6.根据权利要求1所述的方法,其特征在于,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数还包括:
计算所述修正因子与所述候选对象的第一匹配系数的乘积以确定所述候选对象的第二匹配系数。
7.一种检索装置,其特征在于,所述装置包括:
检索模块,用于接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数,所述第一匹配系数用于表征所述候选对象与所述检索词的匹配程度,以包括距离、人气、好评、销量的参数输入匹配度模型确定或计算加权和确定;
计算模块,用于根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子,所述各候选对象的修正因子表征所述检索词和所述候选对象名称之间的关联度;
修正模块,用于根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
排序模块,用于根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
8.一种计算机可读存储介质,用于存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如下步骤:
接收来自用户终端的检索请求,根据所述检索请求中的检索词确定各候选对象的名称和所述候选对象的第一匹配系数,所述第一匹配系数用于表征所述候选对象与所述检索词的匹配程度,以包括距离、人气、好评、销量的参数输入匹配度模型确定或计算加权和确定;
根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子,所述各候选对象的修正因子表征所述检索词和所述候选对象名称之间的关联度;
根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正,以确定所述候选对象的第二匹配系数;
根据所述候选对象的第二匹配系数对所述候选对象进行排序并向所述用户终端输出检索结果。
10.根据权利要求9所述的电子设备,其特征在于,所述根据所述检索词和所述各候选对象名称分别确定所述各候选对象的修正因子具体为:
分别将所述检索词和所述各候选对象名称输入预测模型中以确定所述各候选对象的修正因子,所述预测模型通过预先训练获得。
11.根据权利要求10所述的电子设备,其特征在于,所述预测模型根据所述用户终端对应用户的历史信息预先训练得到,所述用户的历史信息包括所述用户历史检索词、根据所述检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
12.根据权利要求10所述的电子设备,其特征在于,所述预测模型根据预定用户集合的历史信息预先训练得到,所述预定用户集合的历史信息包括预定用户集合中的用户历史输入的相关检索词、根据所述相关检索词曝光的候选对象名称和后续对所述候选对象的操作状态。
13.根据权利要求9所述的电子设备,其特征在于,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数包括:
将所述候选对象的修正因子和第一匹配系数输入匹配模型以确定所述候选对象的第二匹配系数,所述匹配模型根据所述各候选对象的修正因子、第一匹配系数和后续对所述各候选对象的操作状态训练得到。
14.根据权利要求9所述的电子设备,其特征在于,所述根据所述候选对象的修正因子对所述候选对象的第一匹配系数进行修正以确定所述候选对象的第二匹配系数还包括:
计算所述修正因子与所述候选对象的第一匹配系数的乘积以确定所述候选对象的第二匹配系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910675124.2A CN110377831B (zh) | 2019-07-25 | 2019-07-25 | 检索方法、装置、可读存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910675124.2A CN110377831B (zh) | 2019-07-25 | 2019-07-25 | 检索方法、装置、可读存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110377831A CN110377831A (zh) | 2019-10-25 |
CN110377831B true CN110377831B (zh) | 2022-05-17 |
Family
ID=68255889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910675124.2A Active CN110377831B (zh) | 2019-07-25 | 2019-07-25 | 检索方法、装置、可读存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377831B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541960A (zh) * | 2010-12-31 | 2012-07-04 | 北大方正集团有限公司 | 一种模糊检索的方法及装置 |
CN104077306A (zh) * | 2013-03-28 | 2014-10-01 | 阿里巴巴集团控股有限公司 | 一种搜索引擎的结果排序方法及系统 |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN109657044A (zh) * | 2018-12-14 | 2019-04-19 | 北京向上心科技有限公司 | 数据检索方法、数据排序方法、装置、终端以及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7562068B2 (en) * | 2004-06-30 | 2009-07-14 | Microsoft Corporation | System and method for ranking search results based on tracked user preferences |
EP2126741A1 (en) * | 2007-01-24 | 2009-12-02 | Google Inc. | Blending mobile search results |
CN101556603A (zh) * | 2009-05-06 | 2009-10-14 | 北京航空航天大学 | 一种用于对检索结果重新排序的协同检索方法 |
CN102193999A (zh) * | 2011-05-09 | 2011-09-21 | 北京百度网讯科技有限公司 | 一种对搜索结果进行排序的方法及设备 |
US9064016B2 (en) * | 2012-03-14 | 2015-06-23 | Microsoft Corporation | Ranking search results using result repetition |
CN103631794B (zh) * | 2012-08-22 | 2019-05-07 | 百度在线网络技术(北京)有限公司 | 一种用于对搜索结果进行排序的方法、装置与设备 |
CN102902755A (zh) * | 2012-09-21 | 2013-01-30 | 北京百度网讯科技有限公司 | 一种对检索结果项的排序进行调整的方法及装置 |
CN107818109A (zh) * | 2016-09-13 | 2018-03-20 | 北京优朋普乐科技有限公司 | 一种显示电视节目检索结果的方法及装置 |
CN108959644B (zh) * | 2018-07-27 | 2020-04-14 | 北京字节跳动网络技术有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
-
2019
- 2019-07-25 CN CN201910675124.2A patent/CN110377831B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541960A (zh) * | 2010-12-31 | 2012-07-04 | 北大方正集团有限公司 | 一种模糊检索的方法及装置 |
CN104077306A (zh) * | 2013-03-28 | 2014-10-01 | 阿里巴巴集团控股有限公司 | 一种搜索引擎的结果排序方法及系统 |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN109657044A (zh) * | 2018-12-14 | 2019-04-19 | 北京向上心科技有限公司 | 数据检索方法、数据排序方法、装置、终端以及存储介质 |
Non-Patent Citations (3)
Title |
---|
Ranking Web Search Results from Personalized Perspective;Wen-Chih Peng et al.;《The 8th IEEE International Conference on E-Commerce Technology and The 3rd IEEE International Conference on Enterprise Computing, E-Commerce, and E-Services (CEC/EEE"06)》;20060710;第1-8页 * |
一种新的基于用户交易记录的个性化搜索方法;许凯等;《电脑知识与技术》;20151222;第11卷(第31期);第156-159页 * |
科研社交网站中基于相似兴趣的学者推荐研究;熊回香 等;《情报科学》;20170930;第35卷(第09期);第3-11页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110377831A (zh) | 2019-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107481114B (zh) | 商品推荐方法、装置、电子商务系统及存储介质 | |
CN109118336B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN110427560B (zh) | 一种应用于推荐系统的模型训练方法以及相关装置 | |
CN109064293B (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
CN109635198B (zh) | 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备 | |
CN111400507B (zh) | 实体匹配方法及其装置 | |
CN108230009B (zh) | 一种用户偏好的预测方法及装置,电子设备 | |
CN110264291B (zh) | 信息推荐方法和装置 | |
CN111737473B (zh) | 文本分类方法、装置及设备 | |
CN111340566B (zh) | 一种商品分类方法、装置、电子设备及存储介质 | |
CN112424812A (zh) | 计算电子处理平台上的用户特定物品相关值 | |
CN112488781A (zh) | 搜索推荐方法、装置、电子设备及可读存储介质 | |
CN114581175A (zh) | 商品推送方法、装置、存储介质及电子设备 | |
CN110929764A (zh) | 图片审核方法和装置,电子设备及存储介质 | |
CN114820123A (zh) | 团购商品推荐方法、装置、设备及存储介质 | |
CN115168700A (zh) | 一种基于预训练算法的信息流推荐方法、系统及介质 | |
CN110111186A (zh) | 信息处理方法、装置、电子设备及计算机可读存储介质 | |
CN110851702B (zh) | 信息推送的方法、装置、终端及计算机可读介质 | |
CN110377831B (zh) | 检索方法、装置、可读存储介质和电子设备 | |
CN116228342B (zh) | 一种商品推荐方法、装置及计算机可读存储介质 | |
JP6979902B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110377830B (zh) | 检索方法、装置、可读存储介质和电子设备 | |
CN115937341A (zh) | 一种基于ai技术的电商海报生成系统及其生成方法 | |
CN112328918B (zh) | 商品排序方法、计算设备和计算机可读存储介质 | |
CN111639989B (zh) | 商品推荐方法和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |