CN112818102A - 基于上下文的faq知识库的快速问答方法 - Google Patents

基于上下文的faq知识库的快速问答方法 Download PDF

Info

Publication number
CN112818102A
CN112818102A CN202110137707.7A CN202110137707A CN112818102A CN 112818102 A CN112818102 A CN 112818102A CN 202110137707 A CN202110137707 A CN 202110137707A CN 112818102 A CN112818102 A CN 112818102A
Authority
CN
China
Prior art keywords
user
answer
context
question
answering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110137707.7A
Other languages
English (en)
Inventor
詹威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tanyu Technology Co ltd
Original Assignee
Hangzhou Weier Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Weier Network Technology Co ltd filed Critical Hangzhou Weier Network Technology Co ltd
Priority to CN202110137707.7A priority Critical patent/CN112818102A/zh
Publication of CN112818102A publication Critical patent/CN112818102A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于上下文的FAQ知识库的快速问答方法,该方法包含以下步骤:接收用户输入的问题;对问题进行信息补全;根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案;对若干匹配答案进行排序得到最佳答案;将最佳答案作为最终答案发送至用户。本发明的基于上下文的FAQ知识库的快速问答方法,具有上下文自动识别能力,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。

Description

基于上下文的FAQ知识库的快速问答方法
技术领域
本发明涉及一种基于上下文的FAQ知识库的快速问答方法。
背景技术
随着人工智能的发展和普及,智能客服机器人在各个行业的应用也越来越多了。对于所有领域的智能客服机器人来说,常见问答库是不可或缺的。常见问答库即给出了很多的问答对,如何根据真实的人工客服历史聊天记录的问答对,自动构建出基于知识库给出准确、有效答案的客服机器人,是智能客服机器人的研究热点和难点。
由于现有的FAQ机器人很多都是采用关键字等字面信息检索(如浏览器信息检索、电商商品检索等),或则规则模板式的检索对答案进行排序并返回。此种方式存在很大的语义鸿沟问题,很多时候检索出来的答案并不是用户需要的答案。现有FAQ机器人回复精度差、经常性的答非所问,而且没有上下文能力理解与推理能力,这些都是现有FAQ机器人的缺陷。
发明内容
本发明提供了一种基于上下文的FAQ知识库的快速问答方法,采用如下的技术方案:
一种基于上下文的FAQ知识库的快速问答方法,包含以下步骤:
接收用户输入的问题;
对问题进行信息补全;
根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案;
对若干匹配答案进行排序得到最佳答案;
将最佳答案作为最终答案发送至用户。
进一步地,对问题进行信息补全的具体方法为:
获取与该用户之前沟通的历史记录,历史记录包含该用户之前提出的所有问题以及对这些问题的回复;
根据历史记录对问题进行信息补全。
进一步地,对该用户分配一个用户ID,根据用户ID识别该用户的历史记录。
进一步地,通过缓存对该用户的历史记录进行保存;
当需要对问题进行信息补全时从缓存中调取历史记录。
进一步地,缓存为Redis缓存。
进一步地,根据历史记录对问题进行信息补全的具体方法为:
对问题和历史记录进行语义分析;
根据语义分析结果自动从历史记录中获取补充信息对问题进行信息补全。
进一步地,语义分析包含句法分析、句子成分分析和指代消解。
进一步地,在将最佳答案作为最终答案发送至用户之前,基于上下文的FAQ知识库的快速问答方法还包括:
通过意图识别模型识别补全后的问题的意图;
根据识别出的意图匹配预先设置的话术答案;
将最佳答案作为最终答案发送至用户的具体方法为:
根据预先设置的优先级配置从最佳答案和话术答案中选择一个作为最终答案发送至用户。
进一步地,优先级配置为:
当同时得到最佳答案和话术答案时,将话术答案作为最终答案发送至用户。
本发明的有益之处在于所提供的基于上下文的FAQ知识库的快速问答方法,具有上下文自动识别能力,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。
附图说明
图1是本发明的基于上下文的FAQ知识库的快速问答方法的流程图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
如图1所示为本发明的一种基于上下文的FAQ(Frequently Asked Questions,常见问题解答)知识库的快速问答方法,主要包含以下步骤:S1:接收用户输入的问题。S2:对问题进行信息补全。S3:根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案。S4:对若干匹配答案进行排序得到最佳答案。S5:将最佳答案作为最终答案发送至用户。通过以上步骤,能够对用户的提问进行自动补充,能够更好的识别用户的意图,从而更加准确的回答用户提出的问题。以下具体介绍上述步骤。
对于步骤S1:接收用户输入的问题。
具体的,用户通过智能终端向智能机器人发送问题。
对于步骤S2:对问题进行信息补全。
对问题进行信息补全的具体方法为:获取与该用户之前沟通的历史记录,历史记录包含该用户之前提出的所有问题以及对这些问题的回复。根据历史记录对问题进行信息补全。
具体的,每个用户均被分配一个用户ID,根据用户ID识别该用户的历史记录。当用户与智能机器人进行沟通时,通过缓存对用户的历史记录进行保存。当需要对问题进行信息补全时从缓存中调取历史记录。在本发明中,缓存为Redis缓存。
其中,根据历史记录对问题进行信息补全的具体方法为:对问题和历史记录进行语义分析。根据语义分析结果自动从历史记录中获取补充信息对问题进行信息补全。其中,语义分析包含句法分析、句子成分分析和指代消解等。
对于智能机器人的上下文能力评估,需要抽取出大量包含省略句、指代句的对话数据,以对话的形式评测其上下文信息处理与推理能力。以对话数据为单位,统计出智能机器人能够正确处理的上下文的对话数作为精度值,即机器人的上下文处理能力。
对于步骤S3:根据补全后的问题从FAQ数据库中进行检索得到若干匹配答案。
具体的,将收集到的所有FAQ数据写信息检索工具库,如ES(Elasticsearch)等,通过ES字面检索、模糊查询等方式召回若干与问题相关性大的FAQ数据,即若干匹配答案。
对于步骤S4:对若干匹配答案进行排序得到最佳答案。
在步骤S3的基础上,再通过如孪生网络Siamese Network、基于交互矩阵的MatchPyramid等深度语义匹配方式打分,还可以加上词移距离相似度得分、编辑距离得分、关键词得分等各种得分进行结果归并和重排序,最后得到得分最高的最佳答案。
在本发明中,对于检索结果的评价,可以采用平行语料的方式给予评价。平行语料构建方法如下:对于知识库里的每一条知识的问题,构建N条相似问句,从N条相同语义的问句中随机挑选一条作为用户的问题,其他的数据作为FAQ知识库的内容,这样对于每一个问题即可计算出基于信息检索与语义重排序的答案的TOP精度与top N精度值。可以以计算出的TOP精度与top N精度值作为评价标准。
对于步骤S5:将最佳答案作为最终答案发送至用户。
将步骤S4中得到的最佳答案发送至用户。
作为一种可选的实施方式,在将最佳答案作为最终答案发送至用户之前,基于上下文的FAQ知识库的快速问答方法还包括:通过意图识别模型识别补全后的问题的意图。根据识别出的意图匹配预先设置的话术答案。具体而言,将所有的FAQ数据进行特征抽取、语义聚类等抽取出FAQ数据中的头部经常询问的问题,并归纳出一些头部问题对应的意图和对应的代表性数据,以此构造出一个训练集训练意图识别模型。为了提高意图识别模型的效果,增加人工数据清洗、打标工作。对于头部的高频问题,可以通过意图识别的方案在每个意图下配置一个高质量的话术作为答案,以增加用户使用体感。意图识别模型即为一个多分类器,可以采用分类常用的指标准确率、召回率、F1值等指标作为评估标准。
此时,步骤S5的将最佳答案作为最终答案发送至用户的具体方法为:根据预先设置的优先级配置从最佳答案和话术答案中选择一个作为最终答案发送至用户。
作为一种优选的实施方式,优先级配置为:当同时得到最佳答案和话术答案时,将话术答案作为最终答案发送至用户。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (9)

1.一种基于上下文的FAQ知识库的快速问答方法,其特征在于,包含以下步骤:
接收用户输入的问题;
对所述问题进行信息补全;
根据补全后的所述问题从FAQ数据库中进行检索得到若干匹配答案;
对若干所述匹配答案进行排序得到最佳答案;
将所述最佳答案作为最终答案发送至用户。
2.根据权利要求1所述的基于上下文的FA知识库的快速问答方法,其特征在于,
对所述问题进行信息补全的具体方法为:
获取与该用户之前沟通的历史记录,所述历史记录包含该用户之前提出的所有问题以及对这些问题的回复;
根据所述历史记录对所述问题进行信息补全。
3.根据权利要求2所述的基于上下文的FAQ知识库的快速问答方法,其特征在于,
对该用户分配一个用户ID,根据所述用户ID识别该用户的所述历史记录。
4.根据权利要求2所述的基于上下文的FQ知识库的快速问答方法,其特征在于,
通过缓存对该用户的历史记录进行保存;
当需要对所述问题进行信息补全时从所述缓存中调取所述历史记录。
5.根据权利要求4所述的基于上下文的AQ知识库的快速问答方法,其特征在于,
所述缓存为Redis缓存。
6.根据权利要求4所述的基于上下文的FQ知识库的快速问答方法,其特征在于,
所述根据所述历史记录对所述问题进行信息补全的具体方法为:
对所述问题和所述历史记录进行语义分析;
根据语义分析结果自动从所述历史记录中获取补充信息对所述问题进行信息补全。
7.根据权利要求6所述的基于上下文的FA知识库的快速问答方法,其特征在于,
所述语义分析包含句法分析、句子成分分析和指代消解。
8.根据权利要求1所述的基于上下文的FAQ知识库的快速问答方法,其特征在于,
在所述将所述最佳答案作为最终答案发送至用户之前,所述基于上下文的FAQ知识库的快速问答方法还包括:
通过意图识别模型识别补全后的所述问题的意图;
根据识别出的意图匹配预先设置的话术答案
所述将所述最佳答案作为最终答案发送至用户的具体方法为:
根据预先设置的优先级配置从所述最佳答案和所述话术答案中选择一个作为所述最终答案发送至用户。
9.根据权利要求8所述的基于上下文的AQ知识库的快速问答方法,其特征在于,
所述优先级配置为:
当同时得到所述最佳答案和所述话术答案时,将所述话术答案作为所述最终答案发送至用户。
CN202110137707.7A 2021-02-01 2021-02-01 基于上下文的faq知识库的快速问答方法 Pending CN112818102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110137707.7A CN112818102A (zh) 2021-02-01 2021-02-01 基于上下文的faq知识库的快速问答方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110137707.7A CN112818102A (zh) 2021-02-01 2021-02-01 基于上下文的faq知识库的快速问答方法

Publications (1)

Publication Number Publication Date
CN112818102A true CN112818102A (zh) 2021-05-18

Family

ID=75861142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110137707.7A Pending CN112818102A (zh) 2021-02-01 2021-02-01 基于上下文的faq知识库的快速问答方法

Country Status (1)

Country Link
CN (1) CN112818102A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115080720A (zh) * 2022-06-29 2022-09-20 壹沓科技(上海)有限公司 基于rpa及ai的文本处理方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN110263141A (zh) * 2019-06-25 2019-09-20 杭州微洱网络科技有限公司 一种基于bert的客服问答系统
CN110347808A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站智能机器人客服构建方法
US10489712B2 (en) * 2016-02-26 2019-11-26 Oath Inc. Quality-based scoring and inhibiting of user-generated content
CN112035730A (zh) * 2020-11-05 2020-12-04 北京智源人工智能研究院 一种语义检索方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10489712B2 (en) * 2016-02-26 2019-11-26 Oath Inc. Quality-based scoring and inhibiting of user-generated content
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN110347808A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站智能机器人客服构建方法
CN110263141A (zh) * 2019-06-25 2019-09-20 杭州微洱网络科技有限公司 一种基于bert的客服问答系统
CN112035730A (zh) * 2020-11-05 2020-12-04 北京智源人工智能研究院 一种语义检索方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115080720A (zh) * 2022-06-29 2022-09-20 壹沓科技(上海)有限公司 基于rpa及ai的文本处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN110196901B (zh) 对话系统的构建方法、装置、计算机设备和存储介质
CN107729468B (zh) 基于深度学习的答案抽取方法及系统
CN112069298A (zh) 基于语义网和意图识别的人机交互方法、设备及介质
CN112487140A (zh) 问答对话评测方法、装置、设备及存储介质
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN111177310A (zh) 电力服务机器人智能场景会话方法及装置
CN110096572B (zh) 一种样本生成方法、装置及计算机可读介质
CN112463944B (zh) 一种基于多模型融合的检索式智能问答方法及装置
CN114036281B (zh) 基于知识图谱的柑橘管控问答模块构建方法及问答系统
CN108763355B (zh) 一种基于用户的智能机器人交互数据处理系统及方法
CN113569023A (zh) 一种基于知识图谱的中文医药问答系统及方法
CN113590778A (zh) 智能客服意图理解方法、装置、设备及存储介质
CN108920603B (zh) 一种基于客服机器模型的客服引导方法
CN115292461A (zh) 基于语音识别的人机交互学习方法及系统
CN116340530A (zh) 基于机械知识图谱的智能设计方法
CN112818102A (zh) 基于上下文的faq知识库的快速问答方法
CN113190692B (zh) 一种知识图谱的自适应检索方法、系统及装置
CN112328773A (zh) 基于知识图谱的问答实现方法和系统
CN109684357B (zh) 信息处理方法及装置、存储介质、终端
CN111708870A (zh) 基于深度神经网络的问答方法、装置及存储介质
CN117131383A (zh) 一种提高双塔模型搜索精排性能的方法
CN114328846B (zh) 一种用于高校政策咨询的智能客服应答系统及方法
CN115714030A (zh) 一种基于疼痛感知和主动交互的医疗问答系统及方法
CN114238595A (zh) 一种基于知识图谱的冶金知识问答方法及系统
CN114911903A (zh) 一种面向社交群的智能助手问答方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230411

Address after: 104058, No. 2-10, No. 311 Huangpu Avenue Middle, Tianhe District, Guangzhou City, Guangdong Province, 510000

Applicant after: Guangzhou Tanyu Technology Co.,Ltd.

Address before: 601-5, 1382 Wenyi West Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: Hangzhou Weier Network Technology Co.,Ltd.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210518