CN110737755A - 检索方法和装置 - Google Patents
检索方法和装置 Download PDFInfo
- Publication number
- CN110737755A CN110737755A CN201810717387.0A CN201810717387A CN110737755A CN 110737755 A CN110737755 A CN 110737755A CN 201810717387 A CN201810717387 A CN 201810717387A CN 110737755 A CN110737755 A CN 110737755A
- Authority
- CN
- China
- Prior art keywords
- retrieved
- faq
- retrieval
- module
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 30
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提出一种检索方法,包括:根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;根据所述待检索问题进行表格检索,得到表格检索结果;对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。本发明实施例采用FAQ检索和表格检索结合,能够扩大可检索到的问题的范围,得到的答案更加符合用户的意图,能够满足用户更多方面的检索需求。
Description
技术领域
本发明涉及信息检索技术领域,尤其涉及一种检索方法和装置。
背景技术
常用的问答系统,大部分是以实现FAQ(Frequently-Asked Questions,常问问题)问答为主的。FAQ包括客户常见的问题。基于FAQ进行检索,主要能够检索到常见的典型问题,支持的问题类型与数量较少,很多用户想要提问的问题无法得到答案,无法满足用户需求。
发明内容
本发明实施例提供一种检索方法和装置,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种检索方法,包括:
根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
根据所述待检索问题进行表格检索,得到表格检索结果;
对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,还包括:
对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;
如果是,则根据所述待检索问题触发FAQ检索步骤和表格检索步骤。
结合第一方面,本发明实施例在第一方面的第二种实现方式中,还包括:
对所述待检索问题进行敏感词过滤和/或同义改写。
结合第一方面,本发明实施例在第一方面的第三种实现方式中,根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果,包括:
对预先选取的FAQ进行语义向量化,得到FAQ向量;
对所述待检索问题进行语义向量化,得到待检索问题向量;
根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
获取与所述待检索问题的相似性最高的FAQ的答案。
结合第一方面,本发明实施例在第一方面的第四种实现方式中,根据所述待检索问题进行表格检索,得到表格检索结果,包括:
通过自然语言理解NLU对待检索问题进行识别,得到待检索问题对应的槽位和意图;
根据所述槽位和意图进行表格检索,得到表格检索结果。
结合第一方面或其任意一种实现方式,本发明实施例在第一方面的第五种实现方式中,对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案,包括:
根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
第二方面,本发明实施例提供了一种检索装置,包括:
FAQ检索模块,用于根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
表格检索模块,用于根据所述待检索问题进行表格检索,得到表格检索结果;
排序模块,用于对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
结合第二方面,本发明实施例在第二方面的第一种实现方式中,还包括:
预处理模块,用于对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;
触发模块,用于如果查询语句中包括待检索问题,则根据所述待检索问题触发所述FAQ检索模块执行FAQ检索步骤,触发表格检索模块执行表格检索步骤。
结合第二方面,本发明实施例在第二方面的第二种实现方式中,所述预处理模块还用于对所述待检索问题进行敏感词过滤和/或同义改写。
结合第二方面,本发明实施例在第二方面的第三种实现方式中,所述FAQ检索模块包括:
FAQ向量化子模块,用于对预先选取的FAQ进行语义向量化,得到FAQ向量;
问题向量化子模块,用于对所述待检索问题进行语义向量化,得到待检索问题向量;
相似性计算子模块,用于根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
答案获取子模块,用于获取与所述待检索问题的相似性最高的FAQ的答案。
结合第二方面,本发明实施例在第二方面的第四种实现方式中,所述表格检索模块包括:
NLU子模块,用于通过NLU算法对待检索问题进行识别,得到待检索问题对应的槽位和意图;
表格检索子模块,用于根据所述槽位和意图进行表格检索,得到表格检索结果。
结合第二方面或其任意一种实现方式,本发明实施例在第二方面的第五种实现方式中,所述排序模块包括:
置信度计算子模块,用于根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
答案确定子模块,用于将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
第三方面,本发明实施例提供了一种检索装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述检索方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储检索装置所用的计算机软件指令,其包括用于执行上述检索方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:采用FAQ检索和表格检索结合,能够扩大可检索到的问题的范围,得到的答案更加符合用户的意图,能够满足用户更多方面的检索需求。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的检索方法的流程图。
图2示出根据本发明实施例的检索方法的流程图。
图3示出根据本发明实施例的检索方法的流程图。
图4示出根据本发明实施例的检索方法的流程图。
图5示出根据本发明实施例的检索方法的流程图。
图6示出根据本发明实施例的检索装置的结构框图。
图7示出根据本发明实施例的检索装置的结构框图。
图8示出根据本发明实施例的检索装置的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的检索方法的流程图。如图1所示,该检索方法包括以下步骤:
步骤101、根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
步骤102、根据所述待检索问题进行表格检索,得到表格检索结果;
步骤103、对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
在采用FAQ建立的数据库中,可以先对待检索问题进行检索。例如,计算待检索问题与每个常见问题即FAQ根据相似性进行排序。如果数据库中存在与数据库中的FAQ相似性高的表项,则根据该表项获得FAQ检索结果。FAQ检索结果中可以包括命中的FAQ及其对应的答案。如果数据库中不存在与数据库中的FAQ相似性高的其他表项,则可以停止FAQ检索。
在一种示例中,可以基于知识图谱等方式形成多个表格,根据表格中的槽位可以对问题进行检索。表格中可以包括多个槽位,例如,在关于车的表格中可以包括“价格”、“颜色”、“厂商”、“型号”等槽位。根据待检索问题可以确定需要使用的表格的槽位和槽位对应的值。例如,待检索问题包括“30万的车有哪些”,使用表格的“价格”槽位,以价格=30万为检索条件,在表格中进行检索。获得价格=30万的槽位对应的答案。此外,可以从问题中获取多个槽位,结合起来进行表格检索;还可以与用户侧多次交互获取多个槽位,再结合进行表格检索。
在本发明实施例中,不限定步骤101和步骤102的时序,既可以先执行步骤101,也可以先执行步骤102,或者二者同时执行。
在一种可能的实现方式中,如图2所示,该方法还包括:
步骤201、对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;如果是,则根据所述待检索问题触发执行步骤101的FAQ检索步骤和步骤102的表格检索步骤;否则可以结束检索流程。
在一种可能的实现方式中,在触发执行步骤101和步骤102之前,该方法还包括:
步骤202、对所述待检索问题进行敏感词过滤和/或同义改写。获取用户的查询语句后,可以对该查询语句进行预处理。判断查询语句中是否包括问题。如果该查询语句包括问题,可以过滤该问题中的敏感词,并对该问题进行同义改写,获得与该问题具有同义的多个关联问题。然后再对这多个问题进行FAQ检索,判断数据库中是否存在相似的问题。
例如,如果待检索问题中包括“电脑”,与“电脑”含义相同或相似的词包括“计算机”、“笔记本电脑”、“PC”等,因此,可以将待检索问题中的“电脑”替换为“计算机”、“笔记本电脑”或“PC”等,从而实现同义改写。
在一种可能的实现方式中,如图3所示,根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果,包括:
步骤301、对预先选取的FAQ进行语义向量化,得到FAQ向量;
步骤302、对所述待检索问题进行语义向量化,得到待检索问题向量;
步骤303、根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
步骤304、获取与所述待检索问题的相似性最高的FAQ的答案。
举例而言,可以从数据库中选取一个FAQ,对这个FAQ进行语义向量化,得到FAQ向量。并且,对查询语句中包括的待检索问题进行语义向量化,得到待检索问题向量。然后计算FAQ向量与待检索问题向量的语义相似性,例如计算二者的余弦距离、欧式距离等。计算出数据库中的多个FAQ与待检索问题向量的语义相似性后,可以从中选取相似性最高的一个或多个FAQ,将相似性最高的FAQ对应的答案作为FAQ检索结果。
在一种可能的实现方式中,如图4所示,根据所述待检索问题进行表格检索,得到表格检索结果,包括:
步骤401、通过NLU(nature language understanding,自然语言理解)对待检索问题进行识别,得到待检索问题对应的槽位和意图;
步骤401、根据所述槽位和意图进行表格检索,得到表格检索结果。
在本发明实施例中,可以基于知识图谱技术建立表格。通过NLU对查询语句中的待检索问题进行理解,识别出问题所表示的用户意图以及对应的表格的槽位。然后,根据识别出的意图和槽位,在表格中进行检索。
例如,如果待检索问题为“蓝色车有哪些”,可以识别出用户意图是需要查找“车”,槽位则是车的“颜色”。因此,可以在关于车辆的表格中检索“颜色”槽位为蓝色的车。
在一种可能的实现方式中,如图5所示,对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案,包括:
步骤501、根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
步骤502、将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
在一种示例中,FAQ检索结果可能包括一个或多个FAQ对应的答案及其置信度,表格检索结果可能包括某个表格的某一个或多个槽位对应的答案及其置信度。将每个FAQ检索结果和表格检索结果对应的置信度作为初始置信度,按照一定的权重进行计算,得到每个检索结果对应的最终置信度。然后,可以选取最终置信度最高的检索结果,作为待检索问题最优的答案。
在本发明实施例中,采用FAQ检索和表格检索结合,能够扩大可检索到的问题的范围,得到的答案更加符合用户的意图,以提供更加准确的回答,能够满足用户更多方面的检索需求。
图6示出根据本发明实施例的检索装置的结构框图。如图6所示,该检索装置包括以下步骤:
FAQ检索模块41,用于根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
表格检索模块43,用于根据所述待检索问题进行表格检索,得到表格检索结果;
排序模块45,用于对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
在一种可能的实现方式中,如图7所示,该装置还包括:
预处理模块51,用于对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;
触发模块53,用于如果查询语句中包括待检索问题,则根据所述待检索问题触发所述FAQ检索模块执行FAQ检索步骤。
在一种可能的实现方式中,所述预处理模块还用于对所述待检索问题进行敏感词过滤和/或同义改写。
在一种可能的实现方式中,所述FAQ检索模块41包括:
FAQ向量化子模块,用于对预先选取的FAQ进行语义向量化,得到FAQ向量;
问题向量化子模块,用于对所述待检索问题进行语义向量化,得到待检索问题向量;
相似性计算子模块,用于根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
答案获取子模块,用于获取与所述待检索问题的相似性最高的FAQ的答案。
在一种可能的实现方式中,所述表格检索模块43包括:
NLU子模块,用于通过NLU算法对待检索问题进行识别,得到待检索问题对应的槽位和意图;
表格检索子模块,用于根据所述槽位和意图进行表格检索,得到表格检索结果。
在一种可能的实现方式中,所述排序模块45包括:
置信度计算子模块,用于根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
答案确定子模块,用于将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
在一种应用示例中,可以采用本发明实施例的检索方法构建智能问答系统。该系统结合知识表格问答和FAQ问答的智能知识库进行信息检索,同时具备知识表格回答的能力和FAQ问答的能力,能够将最符合用户需求的结果返回给用户。本发明实施例提供的检索方法、装置和系统,可应用于通用领域的智能问答系统,能够智能判断用户问题该由FAQ或表格进行回答,错误回答率低。
智能问答系统的系统输入为用户问题,系统输出为表格答案或FAQ答案。
智能问答系统的主要模块包括:US(Universal Search,中控检索)模块、auto-QA(自动问答)模块、KG-server(知识图谱服务器)、ranker(排序)模块。
其中,US作为整个系统的中控,可以对问题进行预处理。例如,进行判断查询语句(Query)是否为问题、黄反敏感词触发、同义改写等步骤。然后通过后端auto-QA模块进行FAQ答案检索,通过KG-server进行表格检索。得到auto-QA和KG-server的检索结果后,请求ranker模块进行统一的排序,最后返回置信度最高的结果。
auto-QA模块是进行FAQ的检索模块,采取语义检索技术,将所有准备好的FAQ进行语义向量化;将用户问题进行语义向量化;计算用户问题和FAQ的语义相似性;然后选取相似性最高的FAQ对应的答案。
KG-server包括表格问答模块,先对用户问题进行NLU,接着进行槽位抽取和意图识别,然后根据槽位和意图进行表格检索,然后返回检索结果。
ranker模块:对auto-QA模块的检索结果和KG-server的检索结果进行排序,选择最符合用户需求的答案返回。
图8示出根据本发明实施例的检索装置的结构框图。如图8所示,该装置包括:存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。所述处理器920执行所述计算机程序时实现上述实施例中的检索方法。所述存储器910和处理器920的数量可以为一个或多个。
该装置还包括:
通信接口930,用于与外界设备进行通信,进行数据交互传输。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920和通信接口930独立实现,则存储器910、处理器920和通信接口930可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种检索方法,其特征在于,包括:
根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
根据所述待检索问题进行表格检索,得到表格检索结果;
对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
2.根据权利要求1所述的方法,其特征在于,还包括:
对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;
如果是,则根据所述待检索问题触发FAQ检索步骤和表格检索步骤。
3.根据权利要求1所述的方法,其特征在于,还包括:
对所述待检索问题进行敏感词过滤和/或同义改写。
4.根据权利要求1所述的方法,其特征在于,根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果,包括:
对预先选取的FAQ进行语义向量化,得到FAQ向量;
对所述待检索问题进行语义向量化,得到待检索问题向量;
根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
获取与所述待检索问题的相似性最高的FAQ的答案。
5.根据权利要求1所述的方法,其特征在于,根据所述待检索问题进行表格检索,得到表格检索结果,包括:
通过自然语言理解NLU对待检索问题进行识别,得到待检索问题对应的槽位和意图;
根据所述槽位和意图进行表格检索,得到表格检索结果。
6.根据权利要求1至5中任一项所述的方法,其特征在于,对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案,包括:
根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
7.一种检索装置,其特征在于,包括:
FAQ检索模块,用于根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;
表格检索模块,用于根据所述待检索问题进行表格检索,得到表格检索结果;
排序模块,用于对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。
8.根据权利要求7所述的装置,其特征在于,还包括:
预处理模块,用于对查询语句进行预处理,判断所述查询语句中是否包括待检索问题;
触发模块,用于如果查询语句中包括待检索问题,则根据所述待检索问题触发所述FAQ检索模块执行FAQ检索步骤,触发表格检索模块执行表格检索步骤。
9.根据权利要求7所述的装置,其特征在于,所述预处理模块还用于对所述待检索问题进行敏感词过滤和/或同义改写。
10.根据权利要求7所述的装置,其特征在于,所述FAQ检索模块包括:
FAQ向量化子模块,用于对预先选取的FAQ进行语义向量化,得到FAQ向量;
问题向量化子模块,用于对所述待检索问题进行语义向量化,得到待检索问题向量;
相似性计算子模块,用于根据所述待检索问题向量和所述FAQ向量,计算所述FAQ与所述待检索问题的语义相似性;
答案获取子模块,用于获取与所述待检索问题的相似性最高的FAQ的答案。
11.根据权利要求7所述的装置,其特征在于,所述表格检索模块包括:
NLU子模块,用于通过NLU算法对待检索问题进行识别,得到待检索问题对应的槽位和意图;
表格检索子模块,用于根据所述槽位和意图进行表格检索,得到表格检索结果。
12.根据权利要求7至11中任一项所述的装置,其特征在于,所述排序模块包括:
置信度计算子模块,用于根据FAQ检索结果和表格检索结果及其对应的初始置信度,计算最终置信度;
答案确定子模块,用于将最终置信度最高的检索结果,作为所述待检索问题对应的答案。
13.一种检索装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810717387.0A CN110737755A (zh) | 2018-07-03 | 2018-07-03 | 检索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810717387.0A CN110737755A (zh) | 2018-07-03 | 2018-07-03 | 检索方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110737755A true CN110737755A (zh) | 2020-01-31 |
Family
ID=69234319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810717387.0A Pending CN110737755A (zh) | 2018-07-03 | 2018-07-03 | 检索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110737755A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625635A (zh) * | 2020-05-27 | 2020-09-04 | 北京百度网讯科技有限公司 | 问答处理、语言模型的训练方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答系统实现方法 |
CN106776532A (zh) * | 2015-11-25 | 2017-05-31 | 中国移动通信集团公司 | 一种知识问答方法及装置 |
CN107169105A (zh) * | 2017-05-17 | 2017-09-15 | 北京品智能量科技有限公司 | 用于车辆的问答装置及方法 |
-
2018
- 2018-07-03 CN CN201810717387.0A patent/CN110737755A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答系统实现方法 |
CN106776532A (zh) * | 2015-11-25 | 2017-05-31 | 中国移动通信集团公司 | 一种知识问答方法及装置 |
CN107169105A (zh) * | 2017-05-17 | 2017-09-15 | 北京品智能量科技有限公司 | 用于车辆的问答装置及方法 |
Non-Patent Citations (1)
Title |
---|
黄晓鹂: "《医学信息检索与利用》", 29 January 2003 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625635A (zh) * | 2020-05-27 | 2020-09-04 | 北京百度网讯科技有限公司 | 问答处理、语言模型的训练方法、装置、设备及存储介质 |
US11645316B2 (en) | 2020-05-27 | 2023-05-09 | Beijing Baidu Netcom Science Technology Co., Ltd. | Question answering method and language model training method, apparatus, device, and storage medium |
CN111625635B (zh) * | 2020-05-27 | 2023-09-29 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11727066B2 (en) | Apparatus, system, and method for natural language processing | |
CN109189991B (zh) | 重复视频识别方法、装置、终端及计算机可读存储介质 | |
CN110334272B (zh) | 基于知识图谱的智能问答方法、装置及计算机存储介质 | |
CN110532368B (zh) | 问答方法、电子设备及计算机可读存储介质 | |
CN107704506B (zh) | 智能应答的方法和装置 | |
WO2017181834A1 (zh) | 一种智能问答方法及装置 | |
CN109918487A (zh) | 基于网络百科全书的智能问答方法和系统 | |
US10747961B2 (en) | Method and device for identifying a sentence | |
CN109033244B (zh) | 搜索结果排序方法和装置 | |
CN109325108B (zh) | 查询处理方法、装置、服务器及存储介质 | |
CN101305368A (zh) | 语义可视搜索引擎 | |
CN109710732B (zh) | 信息查询方法、装置、存储介质和电子设备 | |
CN111898643A (zh) | 一种语义匹配方法及装置 | |
CN111046147A (zh) | 一种问答方法、装置及终端设备 | |
CN109492085B (zh) | 基于数据处理的答案确定方法、装置、终端及存储介质 | |
CN112182178A (zh) | 智能问答方法、装置、设备及可读存储介质 | |
CN111444321B (zh) | 问答方法、装置、电子设备和存储介质 | |
CN110737755A (zh) | 检索方法和装置 | |
CN113486182A (zh) | 一种意图识别的方法、系统、电子设备及可读存储介质 | |
CN108549666A (zh) | 一种数据表的排序方法、装置、设备及存储介质 | |
CN110287284B (zh) | 语义匹配方法、装置及设备 | |
CN114970559B (zh) | 智能应答方法及装置 | |
CN115344673A (zh) | 一种对话系统对话方法、装置及存储介质 | |
CN113609373A (zh) | 知识推荐方法、装置、电子设备及存储介质 | |
CN113434653A (zh) | 处理查询语句的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200131 |
|
RJ01 | Rejection of invention patent application after publication |