CN110659422A - 检索方法、装置、电子设备及存储介质 - Google Patents
检索方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110659422A CN110659422A CN201910926704.4A CN201910926704A CN110659422A CN 110659422 A CN110659422 A CN 110659422A CN 201910926704 A CN201910926704 A CN 201910926704A CN 110659422 A CN110659422 A CN 110659422A
- Authority
- CN
- China
- Prior art keywords
- resource
- feature similarity
- determining
- keyword
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Abstract
本申请公开了检索方法、装置、电子设备和存储介质,涉及计算机技术领域。具体实现方案为:获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;确定第一资源相对于各个词槽的第一特征相似度,并确定第一资源相对于至少一个关键词的第二特征相似度;利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度;在第一资源与请求的匹配度满足预设条件的情况下,返回第一资源。本申请提高了检索质量,提升用户体验。
Description
技术领域
本申请涉及一种计算机技术领域,尤其涉及一种信息检索技术领域。
背景技术
在实际场景中,由于用户表述不准确、语音识别错误、语义解析错误等问题,使得系统理解到的用户需求和用户的真实需求存在差异。此时如果直接基于用户请求的解析结果进行数据库查询检索,并将检索结果直接返回给用户,检索质量低,严重影响用户体验。
发明内容
本申请实施例提供检索方法、装置、电子设备及存储介质,以解决或缓解现有技术中的以上一个或多个技术问题。
第一方面,本申请实施例提供了检索方法,包括:
获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
确定第一资源相对于各个词槽的第一特征相似度,并确定第一资源相对于至少一个关键词的第二特征相似度;
利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度;
在第一资源与请求的匹配度满足预设条件的情况下,返回第一资源。
通过上述实施方式,对于请求对应的相关资源,结合请求中各个词槽和关键词与资源的相似度进一步计算了请求与资源匹配度,返回满足匹配度的资源,提高了检索质量,提升用户体验。
在一种实施方式中,确定第一资源相对于单个词槽的第一特征相似度的方式为:
确定词槽分别与第一资源的至少一个资源字段的特征相似度,得到词槽的特征相似度集合;
利用词槽的特征相似度集合,确定第一资源相对于词槽的第一特征相似度。
在一种实施方式中,利用词槽的特征相似度集合,确定第一资源相对于词槽的第一特征相似度,包括:
确定词槽的特征相似度集合中的各个特征相似度的权重值;
根据各个特征相似度的权重值,对词槽的特征相似度集合中的特征相似度进行加权处理,得到词槽的加权特征相似度集合;
选取词槽的加权特征相似度集合中的最大加权特征相似度,得到第一资源相对于词槽的第一特征相似度。
通过上述实施方式,对于一个请求中,单个词槽只输出一个值来表示词槽到资源的匹配关系,避免在排序时,当词槽在资源的多个字段出现时各个特征值被累加。
在一种实施方式中,确定第一资源相对于至少一个关键词的第二特征相似度,包括:
确定至少一个关键词与第一资源的资源字段的特征相似度,得到至少一个关键词的特征相似度集合;
利用至少一个关键词的特征相似度集合,确定第一资源相对于至少一个关键词的第二特征相似度。
在一种实施方式中,利用关键词的特征相似度集合,确定第一资源相对于关键词的第二特征相似度,包括:从至少一个关键词的特征相似度集合中选取最大特征相似度作为第一资源相对于至少一个关键词的第二特征相似度。
通过上述实施方式,对于一个请求的关键词只输出一个值来表示关键词到资源的匹配关系,避免在排序时,当关键词在资源的多个字段出现时各个特征值被累加。
在一种实施方式中,利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度,包括:
确定词槽的权重值和关键词的权重值;
利用第一特征相似度和词槽的权重值,确定第一资源与词槽的第一匹配度;
利用第二特征相似度和关键词的权重值,确定第一资源与关键词的第二匹配度;
根据第一匹配度和第二匹配度,确定第一资源与请求的匹配度。
通过上述实施方式,为词槽和关键词分配不同的权重,优化了根据第一特征相似度和第二特征相似度所计算的第一资源与请求的匹配度结果。
在一种实施方式中,利用第一特征相似度和词槽的权重值,确定第一资源与词槽的第一匹配度,包括:
确定各个第一特征相似度的权重值;
利用第一特征相似度的权重值,对第一特征相似度进行加权求和处理,得到初始匹配度;
利用词槽的权重值对初始匹配度进行加权处理,得到第一资源与词槽的第一匹配度。
在一种实施方式中,还包括:根据第一资源与请求的匹配度,确定第一资源的返回策略。
通过上述实施方式,利用匹配度进一步确定资源的返回策略,使得资源检索更加智能化,提高用户体验。
在一种实施方式中,还包括:
记录第一资源与请求的匹配信息;
根据匹配信息,确定第一资源的返回结果决策;
其中,第一资源与请求的匹配信息包括:第一特征相似度的相关信息、第二特征相似度的相关信息和第一资源与请求的匹配度中的至少一项。
通过上述实施方式,对匹配信息进行记录,包括记录了各个第一特征相似度、第二特征相似度等相关信息,可以有利上层模块具体获知使得资源匹配度的满足信息,从而进行更智能、更准确的返回资源决策,提升检索质量。
第二方面,本申请实施例提供了检索装置,包括:
获取模块,用于获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
特征相似度确定模块,用于确定第一资源相对于各个词槽的第一特征相似度,并确定所述第一资源相对于所述至少一个关键词的第二特征相似度;
资源匹配度确定模块,用于利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度;
返回模块,用于在第一资源与请求的匹配度满足预设条件的情况下,返回第一资源。
在一种实施方式中,特征相似度确定模块,包括:
词槽特征相似度子模块,用于确定词槽分别与第一资源的至少一个资源字段的特征相似度,得到词槽的特征相似度集合;
第一特征相似度子模块,用于利用词槽的特征相似度集合,确定第一资源相对于词槽的第一特征相似度;
关键词特征相似度子模块,用于确定至少一个关键词与第一资源的资源字段的特征相似度,得到至少一个关键词的特征相似度集合;
第二特征相似度子模块,用于利用至少一个关键词的特征相似度集合,确定第一资源相对于至少一个关键词的第二特征相似度。
在一种实施方式中,资源匹配度确定模块,包括:
权重子模块,用于确定词槽的权重值和关键词的权重值;
第一匹配度子模块,用于利用第一特征相似度和词槽的权重值,确定第一资源与词槽的第一匹配度;
第二匹配度子模块,用于利用第二特征相似度和关键词的权重值,确定第一资源与关键词的第二匹配度;
资源匹配度子模块,用于根据第一匹配度和第二匹配度,确定第一资源与请求的匹配度。
在一种实施方式中,还包括:
返回策略模块,用于根据第一资源与请求的匹配度,确定第一资源的返回策略。
在一种实施方式中,还包括:
记录模块,用于记录第一资源与请求的匹配信息;
返回结果决策模块,用于根据匹配信息,确定第一资源的返回结果决策;
其中,第一资源与请求的匹配信息包括:第一特征相似度的相关信息、第二特征相似度的相关信息和第一资源与请求的匹配度中的至少一项。
第三方面,本申请实施例提供了电子设备,电子设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,电子设备中包括处理器和存储器,存储器用于电子设备执行上述检索方法的程序,处理器被配置为用于执行存储器中存储的程序。电子设备还可以包括通信接口,用于电子设备与其他设备或通信网络通信。
第四方面,本申请实施例还提供一种计算机可读存储介质,用于检索装置所用的计算机软件指令,其中包括用于执行上述检索方法所涉及的程序。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的检索方法的流程图;
图2是根据本申请实施例的检索方法中,步骤S102中确定第一资源相对于单个词槽的第一特征相似度的流程图;
图3是根据本申请实施例的检索方法中,步骤S202的流程图;
图4是根据本申请实施例的检索方法中,步骤S102中的确定第一资源相对于至少一个关键词的第二特征相似度的流程图;
图5是根据本申请实施例的检索方法中,步骤S103的流程图;
图6是根据本申请实施例的检索方法中,步骤S502的流程图;
图7是根据本申请实施例的检索装置的结构框图一;
图8是根据本申请实施例的检索装置中,特征相似度确定模块702的结构框图;
图9是根据本申请实施例的检索装置中,资源匹配度确定模块703的结构框图;
图10是根据本申请实施例的检索装置的结构框图二;
图11是用来实现本申请实施例的检索方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出根据本申请实施例提供的检索方法的流程示例图。参见图1,该方法包括:
S101、获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
S102、确定第一资源相对于各个词槽的第一特征相似度,并确定第一资源相对于至少一个关键词的第二特征相似度;
S103、利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度;
S104、在第一资源与请求的匹配度满足预设条件的情况下,返回第一资源。
通过上述实施方式,对于请求对应的相关资源,计算请求中各个词槽和关键词与资源的相似度,并利用各个词槽和关键词与资源的相似度表征了请求与资源的匹配度,对满足匹配度的资源进行返回,提高了检索质量,提升用户体验。
在一种实施方式中,在步骤S101之前,还包括:接收请求,确定与请求对应的至少一个词槽、至少一个关键词和多个相关资源,其中,第一资源为与请求对应的多个相关资源中的一个资源。
一种示例,请求为用户输入设备的请求,包括用户向设备(例如智能音箱、手机、平板、电脑或智能手表等智能设备)输入的请求或者用户手动输入的文字请求。可以通过语音识别技术、语义理解技术和资源检索技术确定与请求对应的词槽、关键词和多个相关资源。设备将请求上传至云端或者服务器,可以由云端系统或者服务器来完成语音识别、语义理解和资源检索等操作。
一种示例,请求为语音输入请求,通过语音识别技术将语音输入请求转化为文字请求,通过语义理解技术对文字请求进行意图识别、槽位识别和关键词识别,确定与请求对应的意图、至少一个词槽和至少一个关键词。根据上述语义理解所解析的信息,在资源库中进行检索得到多个资源,即请求对应的多个资源。
需要说明的是,词槽包含了词语的属性,关键词不包含词语的属性。以请求“我想听贝多芬的第五交响曲”为例,请求所对应的意图可以包括播放音频文件。请求所对应的词槽集合为{歌曲:第五交响曲,作曲家:贝多芬},“歌曲”表示“第五交响曲”的属性、“作曲家”表示“贝多芬”的属性。关键词集合为{第五交响曲,贝多芬}。
对于多个相关资源中的任意资源,可以分别获取该资源的资源字段,资源字段可以是对资源的文字描述信息或者是索引信息。例如,第一资源的资源字段可以包括资源的作者、资源的名称、资源所属的专辑、资源存放的时间和/或资源的大小等文字描述信息。
在一种实施方式中,在检索到与请求对应的多个相关资源后还包括:对多个相关资源进行排序,获得相关资源排序列表。运用本实施例确定请求分别与相关资源排序列表中的多个资源的匹配度。
在一种实施方式中,参见图2,步骤S102中确定第一资源相对于单个词槽的第一特征相似度的方式为:
S201、确定词槽分别与第一资源的至少一个资源字段的特征相似度,得到词槽的特征相似度集合;
S202、利用词槽的特征相似度集合,确定第一资源相对于词槽的第一特征相似度。
在一种实施方式中,步骤S201中通过预设算法确定词槽分别与第一资源的至少一个资源字段的特征相似度。预设算法可以包括预定算法包括以下多种算法中的至少一种:编辑距离算法、精确包含算法、字粒度匹配算法、拼音匹配算法、交叉包含算法、带权重的关键词匹配算法、最佳匹配算法。一个词槽的特征相似度集合称为一个特征组。
例如,对于单个词槽{作曲家:贝多芬},第一资源的资源字段出现在资源的作者字段、专辑字段、节目字段;采用预设算法包括:编辑距离算法、字粒度匹配算法。那么词槽{作曲家:贝多芬}的特征相似度集合为:{作曲家:贝多芬}与作者字段的编辑距离值,{作曲家:贝多芬}与作者字段的字粒度匹配值,{作曲家:贝多芬}与专辑字段的编辑距离值,{作曲家:贝多芬}与专辑字段的字粒度匹配值,{作曲家:贝多芬}与节目字段的编辑距离值,{作曲家:贝多芬}与节目字段的字粒度匹配值。
在一种实施方式中,参见图3,步骤S202,包括:
S301、确定词槽的特征相似度集合中的各个特征相似度的权重值;
S302、根据各个特征相似度的权重值,对词槽的特征相似度集合中的特征相似度进行加权处理,得到词槽的加权特征相似度集合;
S303、选取词槽的加权特征相似度集合中的最大加权特征相似度,得到第一资源相对于词槽的第一特征相似度。
步骤S301中,每一特征相似度具有各自的权重值。步骤S302中每一特征相似度进行加权处理为计算每一特征相似度和对应的权重值的乘积值。步骤S303中选取最大加权特征相似度即为选取最大乘积值。
通过上述步骤S201和S202建立各个词槽的特征相似度集合,也可以称为特征组,对于一个请求中的词槽只输出一个值来表示它到资源的匹配关系,避免在排序时,当词槽在资源的多个字段出现时各个特征值被累加的特征相似度集合。
在一种实施方式中,参见图4,步骤S102中的确定第一资源相对于至少一个关键词的第二特征相似度包括:
S401、确定至少一个关键词与第一资源的资源字段的特征相似度,得到至少一个关键词的特征相似度集合;
S402、利用至少一个关键词的特征相似度集合,确定第一资源相对于至少一个关键词的第二特征相似度。
在一种实施方式中,步骤S401通过预设算法确定关键词与第一资源的资源字段的特征相似度。预设算法可以包括预定算法包括以下多种算法中的至少一种:编辑距离算法、精确包含算法、字粒度匹配算法、拼音匹配算法、交叉包含算法、带权重的关键词匹配算法、最佳匹配算法。
在一种实施方式中,步骤S402包括:从关键词的特征相似度集合中选取最大特征相似度作为第一资源相对于关键词的第二特征相似度。
一种示例,步骤S402通过下述公式(1)实现:
X2=max(fk1,....fkm)...(1)
其中,X2表示第二特征相似度,(fk1,....,fkm)表示关键词的特征相似度集合,m表示关键词的特征相似度的个数,max(fk1,....,fkm)表示从关键词的特征相似度集合中选取最大特征相似度作为第二特征相似度。
在一种实施方式中,参见图5,步骤S103,包括:
S501、确定词槽的权重值和关键词的权重值;
S502、利用第一特征相似度和词槽的权重值,确定第一资源与词槽的第一匹配度;
S503、利用第二特征相似度和关键词的权重值,确定第一资源与关键词的第二匹配度;
S504、根据第一匹配度和第二匹配度,确定第一资源与请求的匹配度。
需要说明的是,图5中的步骤顺序仅为一种示例。在其它实施方式中,步骤S502和步骤S503的执行顺序可以同步进行,也可以先执行步骤S503再执行步骤S502。
在一种实施方式中,参见图6,步骤S502,包括:
S601、确定各个第一特征相似度的权重值;
S602、利用第一特征相似度的权重值,对第一特征相似度进行加权求和处理,得到初始匹配度;
一种示例,步骤S602通过公式(2)实现:
其中,Y0表示初始匹配度;h表示请求所对应的词槽个数;i表示词槽的序列号,i∈[1,h];wi表示第i个词槽的第一特征相似度的权重值;(fi1,....fin)表示第i个词槽的特征相似度集合,n表示第i个词槽的特征相似度集合中的特征相似度的个数;Si表示利用第i个词槽的特征相似度集合确定第i个词槽的第一特征相似度的函数,即Si(fi1,....fin)表示第i个词槽的第一特征相似度。
需要说明的是,虽然公式中用n表示第i个词槽的特征相似度集合中的特征相似度的个数,但并不限制各个词槽的特征相似度集合中的特征相似度的个数必须一致。第i个词槽的特征相似度集合中的特征相似度的个数n由参与计算的资源字段个数和算法种类数所决定的。
S603、利用词槽的权重值对初始匹配度进行加权处理,得到第一资源与词槽的第一匹配度。
在一种示例中,步骤S503包括:利用关键词的权重值对第二特征相似度进行加权处理,得到第一资源与关键词的第二匹配度。
在一种示例中,步骤S504包括:对第一匹配度和第二匹配度进行求和,得到的求和结果作为第一资源与请求的匹配度。
一种示例,步骤S102~步骤S103通过如下公式实现:
其中,P表示第一资源与请求的匹配度,Wslots表示词槽的权重值,Wkeyword表示关键词的权重值。
在一种实施方式中,在步骤S103之后,还可以包括:在第一资源与请求的匹配度不满足预设条件的情况下,不返回第一资源。
在一种实施方式中,还包括:根据第一资源与请求的匹配度,确定第一资源的返回策略。
在一种示例中,返回策略包括返回话术。例如“已为您检索到XX歌曲,将为你播放XX歌曲”的确定话术,或者是“我猜您是不是想检索XX”的中置信话术。
在一种实施方式中,上述确定第一资源的返回策略可以是在步骤S104之后才执行的。
在一种示例中,可以预先设定三个匹配度范围:第一资源与请求的匹配度在第一匹配度范围内的,表示第一资源与请求的匹配度不满足预设条件,无需返回第一资源。第一资源与请求的匹配度在第二匹配度范围内的,表示第一资源与请求的匹配度满足预设条件,可以返回第一资源,但在返回第一资源时可以插入类似“我猜你是不是喜欢”的中置信话术。第一资源与请求的匹配度在第三匹配度范围内的,表示第一资源与请求的匹配度满足预设条件,可以直接返回第一资源或者返回第一资源并插入确定话术。
在一种实施方式中,还包括:记录第一资源与请求的匹配信息;根据匹配信息,确定第一资源的返回结果决策。
其中,第一资源与请求的匹配信息包括:第一特征相似度的相关信息、第二特征相似度的相关信息和第一资源与请求的匹配度中的至少一项。
在一种实施方式中,第一特征相似度的相关信息包括第一特征相似度、第一特征相似度所对应的词槽和第一特征相似度所对应的第一资源的资源字段中的至少一项;第二特征相似度的相关信息包括第二特征相似度和第二特征相似度所对应的关键词中的至少一项。
在上述实施方式中,对匹配信息进行记录,包括记录了各个第一特征相似度、第二特征相似度等相关信息,可以有利上层模块具体获知使得资源匹配度满足返回条件的词槽、关键词和资源字段等信息,从而进行更智能、更准确的返回决策,提升检索质量。
在一种实施方式中,记录多个资源与请求的匹配信息,根据多个资源与请求的匹配信息,可以确定对多个资源的返回结果决策。
在上述实施方式中,对多个资源的匹配信息进行记录,可以有利上层模块具体获知使得各个资源匹配度满足返回条件的词槽、关键词和资源字段等信息,从而确定对整个列表的资源的返回策略,返回结果决策更智能更准确,提升检索质量。
进一步的,根据多个资源与请求的匹配信息,可以确定对多个资源的返回结果决策,包括:获取多个资源的资源类别信息,根据资源与请求的匹配信息,对不同类别的资源进行比较,确定对多个资源的返回结果决策。基于资源与请求的匹配信息,对不同类别的资源进行横向比较,确定的返回结果决策更加准确有效。
图7示出根据本申请实施例提供的检索装置的结构框图。参见图7,该检索装置700包括:
获取模块701,用于获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
特征相似度确定模块702,用于确定第一资源相对于各个词槽的第一特征相似度,并确定第一资源相对于至少一个关键词的第二特征相似度;
资源匹配度确定模块703,用于利用第一特征相似度和第二特征相似度,确定第一资源与请求的匹配度;
返回模块704,用于在第一资源与请求的匹配度满足预设条件的情况下,返回第一资源。
在一种实施方式中,参见图8,特征相似度确定模块702,包括:
词槽特征相似度子模块801,用于确定词槽分别与第一资源的至少一个资源字段的特征相似度,得到词槽的特征相似度集合;
第一特征相似度子模块802,用于利用词槽的特征相似度集合,确定第一资源相对于词槽的第一特征相似度。
关键词特征相似度子模块803,用于确定至少一个关键词与第一资源的资源字段的特征相似度,得到至少一个关键词的特征相似度集合;
第二特征相似度子模块804,用于利用至少一个关键词的特征相似度集合,确定第一资源相对于至少一个关键词的第二特征相似度。
在一种实施方式中,参见图9,资源匹配度确定模块703,包括:
权重子模块901,用于确定词槽的权重值和关键词的权重值;
第一匹配度子模块902,用于利用第一特征相似度和词槽的权重值,确定第一资源与词槽的第一匹配度;
第二匹配度子模块903,用于利用第二特征相似度和关键词的权重值,确定第一资源与关键词的第二匹配度;
资源匹配度子模块904,用于根据第一匹配度和第二匹配度,确定第一资源与请求的匹配度。
在一种实施方式中,参见图10,检索装置1000包括:
返回策略模块1001,用于根据第一资源与请求的匹配度,确定第一资源的返回策略。
在一种实施方式中,检索装置1000还包括:
记录模块1002,用于记录第一资源与请求的匹配信息;
返回结果决策模块1003,用于根据匹配信息,确定第一资源的返回结果决策;
其中,第一资源与请求的匹配信息包括:第一特征相似度的相关信息、第二特征相似度的相关信息和第一资源与请求的匹配度中的至少一项。
根据本申请实施例的技术方案,对于请求对应的相关资源,结合请求中各个词槽和关键词与资源的相似度进一步计算了请求与资源匹配度,对满足匹配度的资源进行返回,提高了检索质量,提升用户体验。
根据本申请的实施例,本申请还提了一种电子设备和一种可读存储介质。
如图11所示,图11是实现本申请实施例的检索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图11所示,该电子设备包括:一个或多个处理器1101、存储器1102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图11中以一个处理器1101为例。
存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的检索方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的检索方法。
存储器1102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的检索方法对应的程序指令/模块(例如,附图7所示的获取模块701、相似度确定模块702、资源匹配度确定模块703、返回模块704)。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的检索方法。
存储器1102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据检索方法的电子设备的使用所创建的数据等。此外,存储器1102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1102可选包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至声学配置参数获取电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
检索方法的电子设备还可以包括:输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接,图11中以通过总线连接为例。
输入装置1103可接收输入的数字或字符信息,以及产生与实现检索方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、发光二极管(Light EmittingDiode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ray Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,对于请求对应的相关资源,结合请求中各个词槽和关键词与资源的相似度进一步计算了请求与资源匹配度,对满足匹配度的资源进行返回,提高了检索质量,提升用户体验。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (16)
1.一种检索方法,其特征在于,包括:
获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
确定所述第一资源相对于各个所述词槽的第一特征相似度,并确定所述第一资源相对于所述至少一个关键词的第二特征相似度;
利用所述第一特征相似度和所述第二特征相似度,确定所述第一资源与所述请求的匹配度;
在所述第一资源与所述请求的匹配度满足预设条件的情况下,返回所述第一资源。
2.根据权利要求1所述的方法,其特征在于,确定所述第一资源相对于单个词槽的第一特征相似度的方式为:
确定所述词槽分别与所述第一资源的至少一个资源字段的特征相似度,得到所述词槽的特征相似度集合;
利用所述词槽的特征相似度集合,确定所述第一资源相对于所述词槽的第一特征相似度。
3.根据权利要求2所述的方法,其特征在于,所述利用所述词槽的特征相似度集合,确定所述第一资源相对于所述词槽的第一特征相似度,包括:
确定所述词槽的特征相似度集合中的各个特征相似度的权重值;
根据所述各个特征相似度的权重值,对所述词槽的特征相似度集合中的所述特征相似度进行加权处理,得到所述词槽的加权特征相似度集合;
选取所述词槽的加权特征相似度集合中的最大加权特征相似度,得到所述第一资源相对于所述词槽的第一特征相似度。
4.根据权利要求1所述的方法,其特征在于,所述确定所述第一资源相对于所述至少一个关键词的第二特征相似度,包括:
确定所述至少一个关键词与所述第一资源的资源字段的特征相似度,得到所述至少一个关键词的特征相似度集合;
利用所述至少一个关键词的特征相似度集合,确定所述第一资源相对于所述至少一个关键词的第二特征相似度。
5.根据权利要求4所述的方法,其特征在于,所述利用所述关键词的特征相似度集合,确定所述第一资源相对于所述关键词的第二特征相似度,包括:从所述至少一个关键词的特征相似度集合中选取最大特征相似度作为所述第一资源相对于所述至少一个关键词的第二特征相似度。
6.根据权利要求1所述的方法,其特征在于,所述利用所述第一特征相似度和所述第二特征相似度,确定所述第一资源与所述请求的匹配度,包括:
确定所述词槽的权重值和所述关键词的权重值;
利用所述第一特征相似度和所述词槽的权重值,确定所述第一资源与所述词槽的第一匹配度;
利用所述第二特征相似度和所述关键词的权重值,确定所述第一资源与所述关键词的第二匹配度;
根据所述第一匹配度和所述第二匹配度,确定所述第一资源与所述请求的匹配度。
7.根据权利要求6所述的方法,其特征在于,所述利用所述第一特征相似度和所述词槽的权重值,确定所述第一资源与所述词槽的第一匹配度,包括:
确定各个所述第一特征相似度的权重值;
利用所述第一特征相似度的权重值,对所述第一特征相似度进行加权求和处理,得到初始匹配度;
利用所述词槽的权重值对所述初始匹配度进行加权处理,得到所述第一资源与所述词槽的第一匹配度。
8.根据权利要求1至7任一项所述的方法,其特征在于,还包括:根据所述第一资源与所述请求的匹配度,确定所述第一资源的返回策略。
9.根据权利要求1至7任一项所述的方法,其特征在于,还包括:
记录所述第一资源与所述请求的匹配信息;
根据所述匹配信息,确定所述第一资源的返回结果决策;
其中,所述第一资源与所述请求的匹配信息包括:所述第一特征相似度的相关信息、所述第二特征相似度的相关信息和所述第一资源与所述请求的匹配度中的至少一项。
10.一种检索装置,其特征在于,包括:
获取模块,用于获取请求中的至少一个词槽和至少一个关键词,并获取第一资源;
特征相似度确定模块,用于确定所述第一资源相对于各个所述词槽的第一特征相似度,并确定所述第一资源相对于所述至少一个关键词的第二特征相似度;
资源匹配度确定模块,用于利用所述第一特征相似度和所述第二特征相似度,确定所述第一资源与所述请求的匹配度;
返回模块,用于在所述第一资源与所述请求的匹配度满足预设条件的情况下,返回所述第一资源。
11.根据权利要求10所述的装置,其特征在于,所述特征相似度确定模块,包括:
词槽特征相似度子模块,用于确定所述词槽分别与所述第一资源的至少一个资源字段的特征相似度,得到所述词槽的特征相似度集合;
第一特征相似度子模块,用于利用所述词槽的特征相似度集合,确定所述第一资源相对于所述词槽的第一特征相似度;
关键词特征相似度子模块,用于确定所述至少一个关键词与所述第一资源的资源字段的特征相似度,得到所述至少一个关键词的特征相似度集合;
第二特征相似度子模块,用于利用所述至少一个关键词的特征相似度集合,确定所述第一资源相对于所述至少一个关键词的第二特征相似度。
12.根据权利要求10所述的装置,其特征在于,所述资源匹配度确定模块,包括:
权重子模块,用于确定所述词槽的权重值和所述关键词的权重值;
第一匹配度子模块,用于利用所述第一特征相似度和所述词槽的权重值,确定所述第一资源与所述词槽的第一匹配度;
第二匹配度子模块,用于利用所述第二特征相似度和所述关键词的权重值,确定所述第一资源与所述关键词的第二匹配度;
资源匹配度子模块,用于根据所述第一匹配度和所述第二匹配度,确定所述第一资源与所述请求的匹配度。
13.根据权利要求10至12任一项所述的装置,其特征在于,还包括:
返回策略模块,用于根据所述第一资源与所述请求的匹配度,确定所述第一资源的返回策略。
14.根据权利要求10至12任一项所述的装置,其特征在于,还包括:
记录模块,用于记录所述第一资源与所述请求的匹配信息;
返回结果决策模块,用于根据所述匹配信息,确定所述第一资源的返回结果决策;
其中,所述第一资源与所述请求的匹配信息包括:所述第一特征相似度的相关信息、所述第二特征相似度的相关信息和所述第一资源与所述请求的匹配度中的至少一项。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910926704.4A CN110659422A (zh) | 2019-09-27 | 2019-09-27 | 检索方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910926704.4A CN110659422A (zh) | 2019-09-27 | 2019-09-27 | 检索方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110659422A true CN110659422A (zh) | 2020-01-07 |
Family
ID=69039565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910926704.4A Pending CN110659422A (zh) | 2019-09-27 | 2019-09-27 | 检索方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659422A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268618A (zh) * | 2020-02-17 | 2021-08-17 | 北京百度网讯科技有限公司 | 一种搜索信息评分方法、装置和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012016457A1 (zh) * | 2010-08-06 | 2012-02-09 | 华为技术有限公司 | 一种数据源的选择方法及系统 |
CN102651032A (zh) * | 2012-03-31 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 一种用于提供搜索结果的方法与设备 |
CN103309886A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种基于交易平台的结构化信息搜索方法和装置 |
CN104035980A (zh) * | 2014-05-26 | 2014-09-10 | 王和平 | 一种面向结构化医药信息的检索方法和系统 |
CN106844528A (zh) * | 2016-12-29 | 2017-06-13 | 广州酷狗计算机科技有限公司 | 获取多媒体文件的方法和装置 |
CN108920657A (zh) * | 2018-07-03 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109670033A (zh) * | 2019-02-01 | 2019-04-23 | 青岛海信电器股份有限公司 | 内容的检索方法、装置、设备及存储介质 |
-
2019
- 2019-09-27 CN CN201910926704.4A patent/CN110659422A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012016457A1 (zh) * | 2010-08-06 | 2012-02-09 | 华为技术有限公司 | 一种数据源的选择方法及系统 |
CN103309886A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种基于交易平台的结构化信息搜索方法和装置 |
CN102651032A (zh) * | 2012-03-31 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 一种用于提供搜索结果的方法与设备 |
CN104035980A (zh) * | 2014-05-26 | 2014-09-10 | 王和平 | 一种面向结构化医药信息的检索方法和系统 |
CN106844528A (zh) * | 2016-12-29 | 2017-06-13 | 广州酷狗计算机科技有限公司 | 获取多媒体文件的方法和装置 |
CN108920657A (zh) * | 2018-07-03 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109670033A (zh) * | 2019-02-01 | 2019-04-23 | 青岛海信电器股份有限公司 | 内容的检索方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268618A (zh) * | 2020-02-17 | 2021-08-17 | 北京百度网讯科技有限公司 | 一种搜索信息评分方法、装置和电子设备 |
CN113268618B (zh) * | 2020-02-17 | 2023-07-25 | 北京百度网讯科技有限公司 | 一种搜索信息评分方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110517785B (zh) | 相似病例的查找方法、装置及设备 | |
JP6799152B1 (ja) | クリックグラフ上のベクトル伝播モデルに基づくインテリジェントなカスタマーサービス | |
CN108304444B (zh) | 信息查询方法及装置 | |
US10698654B2 (en) | Ranking and boosting relevant distributable digital assistant operations | |
EP3876114A2 (en) | Method for recommending a search term, method for training a target model, apparatus for recommending a search term, apparatus for training a target model, electronic device and program product | |
CN112507715A (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
US8874558B1 (en) | Promoting fresh content for authoritative channels | |
CN110674320B (zh) | 一种检索方法、装置和电子设备 | |
US20170242861A1 (en) | Music Recommendation Method and Apparatus | |
EP3879415A1 (en) | Method and apparatus for query auto-completion, device and computer storage medium | |
JP7093825B2 (ja) | マンマシン対話方法、装置、及び機器 | |
US10453477B2 (en) | Method and computer system for performing audio search on a social networking platform | |
CN114549874A (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
JP2023520483A (ja) | 検索コンテンツ表示方法、装置、電子機器及び記憶媒体 | |
US10460229B1 (en) | Determining word senses using neural networks | |
CN111368153A (zh) | 搜索方法及装置 | |
CN111309872B (zh) | 搜索处理方法、装置及设备 | |
CN111563198B (zh) | 一种物料召回方法、装置、设备及存储介质 | |
CN111078849B (zh) | 用于输出信息的方法和装置 | |
US9747891B1 (en) | Name pronunciation recommendation | |
JP7241122B2 (ja) | スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN110659422A (zh) | 检索方法、装置、电子设备及存储介质 | |
US20200117691A1 (en) | Search mining method, apparatus, storage medium, and electronic device | |
CN111291184A (zh) | 表情的推荐方法、装置、设备及存储介质 | |
WO2017074808A1 (en) | Single unified ranker |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210511 Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. Applicant after: Shanghai Xiaodu Technology Co.,Ltd. Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200107 |
|
RJ01 | Rejection of invention patent application after publication |