CN109213937B - 智能搜索方法及装置 - Google Patents

智能搜索方法及装置 Download PDF

Info

Publication number
CN109213937B
CN109213937B CN201811449689.0A CN201811449689A CN109213937B CN 109213937 B CN109213937 B CN 109213937B CN 201811449689 A CN201811449689 A CN 201811449689A CN 109213937 B CN109213937 B CN 109213937B
Authority
CN
China
Prior art keywords
matching
instant
value
weights
subject information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811449689.0A
Other languages
English (en)
Other versions
CN109213937A (zh
Inventor
李千
熊立志
郑颖强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dream Chasing Technology Co ltd
Original Assignee
Shenzhen Iask Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Iask Technology Co ltd filed Critical Shenzhen Iask Technology Co ltd
Priority to CN201811449689.0A priority Critical patent/CN109213937B/zh
Publication of CN109213937A publication Critical patent/CN109213937A/zh
Application granted granted Critical
Publication of CN109213937B publication Critical patent/CN109213937B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及信息处理技术领域,具体而言,涉及一种智能搜索方法及装置。该方法能够基于识别得到的主题信息以及预设主题库中多个即有主题信息计算出多个匹配权值,并根据多个匹配权值中的第一匹配权值的数量判断是否需要将第一设定阈值进行调整进而获得多个第二匹配权值,然后将第一匹配权值对应的即有主题信息和第二匹配权值对应的即有主题信息进行展示,如此,能够实现层级化搜索,进而提高搜索结果的质量。

Description

智能搜索方法及装置
技术领域
本发明实施例涉及信息处理技术领域,具体而言,涉及一种智能搜索方法及装置。
背景技术
随着互联网技术的发展,越来越多的用户通过互联网获取资讯,而搜索引擎是其中最热门的查询搜索服务之一,给用户获取信息带来了极大的便利,能够为用户提供搜索服务,从而使得用户可以获得想要的讯息。但是通过现有技术获得的搜索结果质量较差。
发明内容
有鉴于此,本发明提供了一种智能搜索方法及装置。
本发明实施例提供了一种智能搜索方法,应用于服务端,所述服务端预设有主题库,所述主题库中包括有多个即有主题信息,所述方法包括:
获取用户输入的提问信息;
对所述提问信息进行识别以获得所述提问信息对应的主题信息;
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值;根据第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量,其中,所述第一匹配权值小于所述第一设定阈值;
判断所述第一匹配权值的数量是否小于第一预定值,若所述第一匹配权值的数量小于所述第一预定值,对所述第一设定阈值进行调整以获得第二设定阈值,根据所述第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量,其中,所述第二匹配权值不小于所述第一设定阈值且小于所述第二设定阈值;
判断所述第一匹配权值的数量与所述第二匹配权值的数量的总和是否小于所述第一预定值,若所述总和不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示。
可选地,所述方法还包括:
若所述第一匹配权值的数量不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息进行展示。
可选地,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示的步骤,包括:
每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息按照设定序列进行展示,其中,所述第一匹配权值对应的即有主题信息的序列靠前。
可选地,所述匹配权值中包括编辑距离值和相似度值,针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值的步骤,包括:
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间编辑距离值和相似度值。
可选地,所述第一设定阈值包括第一编辑距离设定值和第一相似度设定值,根据所述第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量的步骤,包括:
针对计算得到的多个匹配权值中的每个匹配权值,若该匹配权值中包括的编辑距离值小于所述第一编辑距离设定值且相似度值小于所述第一相似度设定值,将该匹配权值作为第一匹配权值并进行统计。
本发明实施例还提供了一种智能搜索装置,应用于服务端,所述服务端预设有主题库,所述主题库中包括有多个即有主题信息,所述装置包括:
提问信息获取模块,用于获取用户输入的提问信息;
主题信息识别模块,用于对所述提问信息进行识别以获得所述提问信息对应的主题信息;
匹配权值计算模块,用于针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值;根据第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量,其中,所述第一匹配权值小于所述第一设定阈值;
第一判断模块,用于判断所述第一匹配权值的数量是否小于第一预定值,若所述第一匹配权值的数量小于所述第一预定值,对所述第一设定阈值进行调整以获得第二设定阈值,根据所述第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量,其中,所述第二匹配权值不小于所述第一设定阈值且小于所述第二设定阈值;
第二判断模块,用于判断所述第一匹配权值的数量与所述第二匹配权值的数量的总和是否小于所述第一预定值,若所述总和不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示。
可选地,所述第一判断模块还用于:
若所述第一匹配权值的数量不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息进行展示。
可选地,所述第二判断模块通过以下方式将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示:
每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息按照设定序列进行展示,其中,所述第一匹配权值对应的即有主题信息排序靠前。
可选地,所述匹配权值中包括编辑距离值和相似度值,所述匹配权值计算模块通过以下方式针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值:
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间编辑距离值和相似度值。
可选地,所述第一设定阈值包括第一编辑距离设定值和第一相似度设定值,所述匹配权值计算模块通过以下方式根据所述第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量:
针对计算得到的多个匹配权值中的每个匹配权值,若该匹配权值中包括的编辑距离值小于所述第一编辑距离设定值且相似度值小于所述第一相似度设定值,将该匹配权值作为第一匹配权值并进行统计。
本发明实施例还提供了一种服务端,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的智能搜索方法。
本发明实施例还提供了一种计算机可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在服务端执行上述的智能搜索方法。
有益效果
本发明实施例提供的智能搜索方法及装置,能够基于识别得到的主题信息以及预设主题库中多个即有主题信息计算出多个匹配权值,并根据多个匹配权值中的第一匹配权值的数量判断是否需要将第一设定阈值进行调整进而获得多个第二匹配权值,然后将第一匹配权值对应的即有主题信息和第二匹配权值对应的即有主题信息进行展示,如此,能够实现层级化搜索,进而提高搜索结果的质量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种服务端10的方框示意图。
图2为本发明实施例所提供的一种智能搜索方法的流程图。
图3为一实施方式中图2所示的步骤S27包括的子步骤的示意图。
图4为本发明实施例所提供的一种智能搜索装置20的模块框图。
图标:
10-服务端;11-存储器;12-处理器;13-网络模块;
20-智能搜索装置;21-提问信息获取模块;22-主题信息识别模块;23-匹配权值计算模块;24-第一判断模块;25-第二判断模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
发明人经调查发现,通过现有技术获得的搜索结果质量较差。现有技术大多通过关键词精确匹配和模糊匹配的方式对用户输入的提问信息进行搜索进而获得搜索结果,一方面,采用关键词精确匹配方式对提问信息进行处理时,系统内的关键词必须与提问信息中的关键词完全匹配才会将系统内的关键词所对应的内容进行展示,如果提问信息中的关键词与系统内的关键词顺序/长度不一致或存在包含关系,均不展示对应的内容,这样会限制展现量,降低获取潜在客户的机会,另一方面,模糊匹配则会检索到大量无关的内容,真正有用的内容可能也掺杂与无关的内容中并与无关的内容一并展示,而用户的搜索习惯一般只关注展示页面前端的部分,并不会花大量时间和精力查看所有内容,这样会导致模糊匹配不能获得精准的客户。
以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。
基于上述研究,本发明实施例提供了一种智能搜索方法及装置,通过层级化搜索的方式提高搜索结果的质量。
图1示出了本发明实施例所提供的一种服务端10的方框示意图。本发明实施例中的服务端10具有数据存储、传输、处理功能,如图1所示,服务端10包括:存储器11、处理器12、网络模块13和智能搜索装置20。
存储器11、处理器12和网络模块13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有智能搜索装置20,所述智能搜索装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本发明实施例中的智能搜索装置20,从而执行各种功能应用以及数据处理,即实现本发明实施例中的智能搜索方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络模块13用于通过网络建立服务端10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,服务端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本发明实施例还提供一种计算机可读存储介质,所述可读存储介质包括计算机程序。所述计算机程序运行时控制所述可读存储介质所在服务端10执行下面的智能搜索方法。
图2示出了本发明实施例所提供的一种智能搜索方法的流程图。所述方法有关的流程所定义的方法步骤应用于服务端10,可以由所述处理器12实现。该服务端10中预存有主题库,该主题库中包括有多个即有主题信息下面将对图2所示的具体流程进行详细阐述:
步骤S21,获取用户输入的提问信息。
在本实施例中,提问信息包括提问标题和提问内容。
步骤S22,对提问信息进行识别以获得提问信息对应的主题信息。
在本实施例中,通过预设的字段长度标准对提问信息进行识别,例如,设定字段长度标准为[2,12],通过该字段长度标准对提问信息进行识别,提取主题信息。
其中,提取出的主题信息可能有多个,对提取出的多个主题信息进行筛选,例如,优先选取百度指数最高的主题信息,百度指数相同时选取移动指数最高的主题信息,移动指数相同时选取好搜指数最高的主题信息,若全部指数均相同,随机选取。
可以理解,在识别主题信息阶段进行字段长度标准的设定以及通过指数进行筛选能够从多个主题信息中筛选出一个最合适的主题信息,进而能够保证后续搜索的准确性。
步骤S23,针对主题库中的每个即有主题信息,计算该即有主题信息与主题信息之间的匹配权值。
其中,匹配权值中包括编辑距离值和相似度值,编辑距离值是指将两个不同的字段通过增删改查转变成相同的字段所需要的步骤数,相似度值是指两个不同字段之间的余弦相似度值。
例如,主题库中的即有主题信息为Mn,提问信息的主题信息为QM,其中,n为正整数。
计算得到的编辑距离值为Ei,计算得到的相似度值为Xi,其中i为小于等于n的正整数,Ei表示QM与Mi之间的编辑距离值,Xi表示QM与Mi之间的相似度值。
又例如,若即有主题信息的字段长度超过12,此时会优先计算该即有主题信息与提问信息之间的相似度值,如此,能够提高计算效率,避免一开始计算编辑距离值导致的卡顿或计算压力过大。
步骤S24,根据第一设定阈值统计第一匹配权值的数量。
例如,针对某个匹配权值,若Ei<Es-1且Xi<Xs-1,则将该匹配权值作为第一匹配权值,由此统计第一匹配权值的数量,其中Es-1为第一编辑距离设定值,Xs-1为第一相似度设定值,Es-1和Xs-1可以视为第一设定阈值。
步骤S25,判断第一匹配权值的数量是否小于第一预定值。
在本实施例中,对第一匹配权值的数量进行分析的目的是为了实现层级化搜索,进一步地,第一匹配权值的数量决定是否对第一设定阈值进行调整。
若第一匹配权值的数量小于第一预定值,转向步骤S26。
若第一匹配权值的数量不小于第一预定值,转向步骤S28。
步骤S26,对第一设定阈值进行调整以获得第二设定阈值,根据第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量。
在本实施例中,假设第一预定值的数量为5,第一匹配权值的数量为t1
若t1<5,表明第一匹配权值的数量较少,第一匹配权值对应的即有主题较少,若将较少的即有主题展示给客户,可能会流失部分潜在客户,因此,需要获取其他即有主题,而获取其他即有主题的方式是通过对第一设定阈值进行调整实现。
具体地,对Es-1和Xs-1进行调整得到Es-2和Xs-2,其中,Es-2>Es-1,Xs-2>Xs-1,可以理解,增大第一编辑距离设定值和第一相似度设定值以获得第二编辑距离设定值和第二相似度设定值,能够匹配出更多符合条件的匹配权值。
可以理解,第二匹配权值中的Es-1<=Ej<Es-2,Xs-1<=Xj<Xs-2,j为小于等于n的正整数且j不等于i。相应地,第二匹配权值的数量为t2
然后计算第一匹配权值的数量与第二匹配权值的数量的总和。例如,计算总和sum=t1+t2
步骤S27,判断第一匹配权值的数量与第二匹配权值的数量的总和是否小于第一预定值,根据判断结果进行处理。
请结合参阅图3,本实施例中通过步骤S271、步骤S272和步骤S273列举了步骤S27的其中一种实现方式。
步骤S271,判断第一匹配权值的数量与第二匹配权值的数量的总和是否小于第一预定值。
若小于,转向步骤S272。
若不小于,转向步骤S273。
步骤S272,若sum仍然小于5,继续调整第二设定阈值,并继续查找出符合条件的匹配权值。
可以理解,若第二设定阈值增大到预先设定的上限,计算求得的符合条件的匹配权值数量总和仍小于5,直接显示所有符合条件的匹配权值对应的即有主题信息。
步骤S273,若sum大于等于5,将每个第一匹配权值对应的即有主题信息以及每个第二匹配权值对应的即有主题信息进行展示。
需要注意的是,在将即有主题信息进行展示之前,还需要判断sum是否超过第二预定值:
若sum没有超过第二预定值,展示顺序为:第一匹配权值对应的即有主题信息(t1个),第二匹配权值对应的即有主题信息(t2个)。
其中,针对第一匹配权值对应的即有主题信息和第二匹配权值对应的即有主题信息分别采用以下排序规则进行二次排序然后展示:
1)答案总赞数最高;
2)是自然提问;
3)回答时间最近;
4)有好评回答;
5)答案数量多;
6)答案字数多(以最高的答案数为准)。
如此,能够将搜索结果层级化,保证与主题信息QM最接近的即有主题信息在最前端进行展示,提高了搜索结果的质量。
若sum超过第二预定值,会对多个第二匹配权值进行筛选,例如,以相似度值从高到低的顺序进行排序选取部分第二匹配权值,又例如,假设第二预定值为30,t1为3,t2为40,此时3+40>30,因此会从40个第二匹配权值中按照相似度值从高到低的顺序选取27个第二匹配权值,进而将3个第一匹配权值和27个第二匹配权值按照上述的展示规则进行展示。
步骤S28,将每个第一匹配权值对应的即有主题信息进行展示。
可以理解,在展示之前,也会判断t1是否超过30,若超过30,会将t1个第一匹配权值按照相似度值由高到低排序选取30个第一匹配权值,并按照上述排序规则进行二次排序之后再展示。
可选地,若t1=0,且第一设定阈值增大到预先设定的上限,计算求得的符合条件的匹配权值数量总和仍小于5,表明没有搜索到与主题信息QM相关的即有主题信息,此时直接返回主题信息QM
可以理解,通过上述方式,能够将根据用户的主题信息进行层级化搜索,如此,既能够避免限制展现量,又能够避免展示太多无关紧要的内容,进而保证了搜索结果的质量。
在上述基础上,如图4所示,本发明实施例提供了一种智能搜索装置20,所述智能搜索装置20包括:提问信息获取模块21、主题信息识别模块22、匹配权值计算模块23、第一判断模块24和第二判断模块25。
提问信息获取模块21,用于获取用户输入的提问信息。
由于提问信息获取模块21和图2中步骤S21的实现原理类似,因此在此不作更多说明。
主题信息识别模块22,用于对所述提问信息进行识别以获得所述提问信息对应的主题信息。
由于主题信息识别模块22和图2中步骤S22的实现原理类似,因此在此不作更多说明。
匹配权值计算模块23,用于针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值;根据第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量,其中,所述第一匹配权值小于所述第一设定阈值。
由于匹配权值计算模块23和图2中步骤S23和步骤S24的实现原理类似,因此在此不作更多说明。
第一判断模块24,用于判断所述第一匹配权值的数量是否小于第一预定值,若所述第一匹配权值的数量小于所述第一预定值,对所述第一设定阈值进行调整以获得第二设定阈值,根据所述第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量,其中,所述第二匹配权值不小于所述第一设定阈值且小于所述第二设定阈值。
由于第一判断模块24和图2中步骤S25、步骤S26和步骤S28的实现原理类似,因此在此不作更多说明。
第二判断模块25,用于判断所述第一匹配权值的数量与所述第二匹配权值的数量的总和是否小于所述第一预定值,若所述总和不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示。
由于第二判断模块25和图2中步骤S27的实现原理类似,因此在此不作更多说明。
综上,本发明实施例所提供的智能搜索方法及装置,能够实现层级化搜索,进而提高搜索结果的质量。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务端10,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种智能搜索方法,其特征在于,应用于服务端,所述服务端预设有主题库,所述主题库中包括有多个即有主题信息,所述方法包括:
获取用户输入的提问信息;
对所述提问信息进行识别以获得所述提问信息对应的主题信息;
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值;根据第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量,其中,所述第一匹配权值小于所述第一设定阈值;
判断所述第一匹配权值的数量是否小于第一预定值,若所述第一匹配权值的数量小于所述第一预定值,对所述第一设定阈值进行调整以获得第二设定阈值,根据所述第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量,其中,所述第二匹配权值不小于所述第一设定阈值且小于所述第二设定阈值;
判断所述第一匹配权值的数量与所述第二匹配权值的数量的总和是否小于所述第一预定值,若所述总和不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示;
所述匹配权值中包括编辑距离值和相似度值,针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值的步骤,包括:
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间编辑距离值和相似度值;
所述第一设定阈值包括第一编辑距离设定值和第一相似度设定值,根据所述第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量的步骤,包括:
针对计算得到的多个匹配权值中的每个匹配权值,若该匹配权值中包括的编辑距离值小于所述第一编辑距离设定值且相似度值小于所述第一相似度设定值,将该匹配权值作为第一匹配权值并进行统计。
2.根据权利要求1所述的智能搜索方法,其特征在于,所述方法还包括:
若所述第一匹配权值的数量不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息进行展示。
3.根据权利要求1所述的智能搜索方法,其特征在于,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示的步骤,包括:
每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息按照设定序列进行展示,其中,所述第一匹配权值对应的即有主题信息的序列靠前。
4.一种智能搜索装置,其特征在于,应用于服务端,所述服务端预设有主题库,所述主题库中包括有多个即有主题信息,所述装置包括:
提问信息获取模块,用于获取用户输入的提问信息;
主题信息识别模块,用于对所述提问信息进行识别以获得所述提问信息对应的主题信息;
匹配权值计算模块,用于针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值;根据第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量,其中,所述第一匹配权值小于所述第一设定阈值;
第一判断模块,用于判断所述第一匹配权值的数量是否小于第一预定值,若所述第一匹配权值的数量小于所述第一预定值,对所述第一设定阈值进行调整以获得第二设定阈值,根据所述第二设定阈值统计计算得到的多个匹配权值中的第二匹配权值的数量,其中,所述第二匹配权值不小于所述第一设定阈值且小于所述第二设定阈值;
第二判断模块,用于判断所述第一匹配权值的数量与所述第二匹配权值的数量的总和是否小于所述第一预定值,若所述总和不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示;
所述匹配权值中包括编辑距离值和相似度值,所述匹配权值计算模块通过以下方式针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间的匹配权值:
针对所述主题库中的每个即有主题信息,计算该即有主题信息与所述主题信息之间编辑距离值和相似度值;
所述第一设定阈值包括第一编辑距离设定值和第一相似度设定值,所述匹配权值计算模块通过以下方式根据所述第一设定阈值统计计算得到的多个匹配权值中的第一匹配权值的数量:
针对计算得到的多个匹配权值中的每个匹配权值,若该匹配权值中包括的编辑距离值小于所述第一编辑距离设定值且相似度值小于所述第一相似度设定值,将该匹配权值作为第一匹配权值并进行统计。
5.根据权利要求4所述的智能搜索装置,其特征在于,所述第一判断模块还用于:
若所述第一匹配权值的数量不小于所述第一预定值,将每个所述第一匹配权值对应的即有主题信息进行展示。
6.根据权利要求4所述的智能搜索装置,其特征在于,所述第二判断模块通过以下方式将每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息进行展示:
每个所述第一匹配权值对应的即有主题信息以及每个所述第二匹配权值对应的即有主题信息按照设定序列进行展示,其中,所述第一匹配权值对应的即有主题信息排序靠前。
CN201811449689.0A 2018-11-29 2018-11-29 智能搜索方法及装置 Active CN109213937B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811449689.0A CN109213937B (zh) 2018-11-29 2018-11-29 智能搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811449689.0A CN109213937B (zh) 2018-11-29 2018-11-29 智能搜索方法及装置

Publications (2)

Publication Number Publication Date
CN109213937A CN109213937A (zh) 2019-01-15
CN109213937B true CN109213937B (zh) 2020-07-24

Family

ID=64994592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811449689.0A Active CN109213937B (zh) 2018-11-29 2018-11-29 智能搜索方法及装置

Country Status (1)

Country Link
CN (1) CN109213937B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10564626B2 (en) * 2016-01-29 2020-02-18 Sandvik Intellectual Property Ab Planning of computer numerical control (CNC) machining operations with the aid of a digital computer

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214169A (zh) * 2010-04-02 2011-10-12 阿里巴巴集团控股有限公司 关键词信息与目标信息的提供方法及装置
CN104899322A (zh) * 2015-06-18 2015-09-09 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法
CN105488077A (zh) * 2014-10-10 2016-04-13 腾讯科技(深圳)有限公司 生成内容标签的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8326820B2 (en) * 2009-09-30 2012-12-04 Microsoft Corporation Long-query retrieval
CN103886034B (zh) * 2014-03-05 2019-03-19 北京百度网讯科技有限公司 一种建立索引及匹配用户的查询输入信息的方法和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214169A (zh) * 2010-04-02 2011-10-12 阿里巴巴集团控股有限公司 关键词信息与目标信息的提供方法及装置
CN105488077A (zh) * 2014-10-10 2016-04-13 腾讯科技(深圳)有限公司 生成内容标签的方法和装置
CN104899322A (zh) * 2015-06-18 2015-09-09 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法

Also Published As

Publication number Publication date
CN109213937A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109815314B (zh) 一种意图识别方法、识别设备及计算机可读存储介质
CN110598086B (zh) 文章推荐方法、装置、计算机设备及存储介质
CN107341268B (zh) 一种热搜榜排序方法及系统
CN109241451B (zh) 一种内容组合推荐方法、装置及可读存储介质
CN105787025B (zh) 网络平台公共账号分类方法及装置
US20140172415A1 (en) Apparatus, system, and method of providing sentiment analysis result based on text
US20130339373A1 (en) Method and system of filtering and recommending documents
WO2014148948A1 (ru) Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
CN107180093A (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
KR20130092310A (ko) 상품 추천 시스템
CN108604248B (zh) 利用基于人工智能的相关性计算的笔记提供方法及装置
CN109558531A (zh) 新闻信息推送方法、装置以及计算机设备
CN111241400B (zh) 一种信息搜索方法及装置
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
CN114780606A (zh) 一种大数据挖掘方法及系统
CN109213937B (zh) 智能搜索方法及装置
JP2013054606A (ja) 文書検索装置及び方法及びプログラム
CN110020102B (zh) 对象推荐方法、装置、存储介质、处理器和系统
CN105893397A (zh) 一种视频推荐方法及装置
KR101958555B1 (ko) 검색 결과 제공 장치 및 방법
CN116089616A (zh) 主题文本获取方法、装置、设备及存储介质
CN113177061B (zh) 一种搜索方法、装置和电子设备
KR101918358B1 (ko) 맞춤형 정보를 제공하는 데이터 센터 시스템
CN115292478A (zh) 一种推荐搜索内容的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240207

Address after: 518000, Building B, Zhongshen Garden, No. 2010 Caitian Road, Fushan Community, Futian Street, Futian District, Shenzhen, Guangdong Province, China, 2901

Patentee after: Shenzhen Dream Chasing Technology Co.,Ltd.

Country or region after: China

Address before: 518000, Building T3B4-B, T-3, North High tech Industrial Village, Keyuan Road, East Baishi Road, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, China

Patentee before: SHENZHEN IASK TECHNOLOGY Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right