CN108153876A - 智能问答方法及系统 - Google Patents

智能问答方法及系统 Download PDF

Info

Publication number
CN108153876A
CN108153876A CN201711429799.6A CN201711429799A CN108153876A CN 108153876 A CN108153876 A CN 108153876A CN 201711429799 A CN201711429799 A CN 201711429799A CN 108153876 A CN108153876 A CN 108153876A
Authority
CN
China
Prior art keywords
answer
question
user
matching
candidate question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711429799.6A
Other languages
English (en)
Other versions
CN108153876B (zh
Inventor
吴金龙
王守崑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aids Interactive Technology Development (beijing) Co Ltd
Original Assignee
Aids Interactive Technology Development (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aids Interactive Technology Development (beijing) Co Ltd filed Critical Aids Interactive Technology Development (beijing) Co Ltd
Priority to CN201711429799.6A priority Critical patent/CN108153876B/zh
Publication of CN108153876A publication Critical patent/CN108153876A/zh
Application granted granted Critical
Publication of CN108153876B publication Critical patent/CN108153876B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种智能问答方法及系统。该智能问答系统(100)包括:对话引擎(101),用于接收用户提出的问题;分析模块(102),用于对用户的问题进行分析;候选问答库(103);检索模块(104),用于基于所述分析模块(102)对问题分析的结果,在所述候选问答库(103)中检索出与用户问题相关的问答对;匹配模块(105),用于计算所述检索模块(104)检索出的候选问答对与用户问题的匹配度值;重排序模块(106),用于综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序。所述对话引擎(101)进一步被配置为从所述重排序模块(106)重新排序的候选问答对中选择对用户的答复。

Description

智能问答方法及系统
技术领域
本发明涉及人工智能,更具体涉及机器人智能问答方法及系统。
背景技术
当前的问答机器人系统主要基于搜索引擎的信息检索框架,利用关键词进行检索和匹配排序。但对话中用户的问题和要匹配的问答对有些非常简短,有些需要进行语义理解后进行回答,这类问题使用传统的信息检索技术都无法获得较好结果。
因此,需要提供一种智能问答系统,通过对用户问题进行细致分析,自动且智能地进行答复。
发明内容
如上所述,本发明的目的在于提出一种智能问答系统,扩展传统的信息检索框架,通过对用户问题进行细致分析,自动且智能地进行答复。
本系统利用自然语言处理(NLP)、机器学习和深度学习等技术从候选问答库中查找与用户的提问语义最接近的问答对,把其中的答案作为答复结果返回给用户。
根据本发明的第一方面,提供一种智能问答方法。该方法可以包括:对用户的问题进行分析;基于对问题分析的结果,在候选问答库中检索出与用户问题相关的问答对;计算检索出的候选问答对与用户问题的匹配度值;综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序;以及从重新排序的候选问答对中选择对用户的答复。
在根据本发明第一方面的方法中,可以进一步包括:为用户的问题设定特定的背景信息。
优选地,在根据本发明第一方面的方法中,可以进一步包括:获取问题的参数信息,其中,所述参数信息包括提出问题的用户的用户画像或该问题的背景信息;检索出的与用户问题相关的问答对中的答案是带有参数变量的,将这些参数变量替换为所获取的参数信息,以得到个性化的答案。
以上提到的用户画像是指根据用户注册信息或者根据与用户的交互而获取的用户个人信息和偏好信息。更具体地,用户画像包括:人口统计学信息,用户历史行为,授权得到的用户地理位置,手机号码,通讯录,朋友列表,社交网络上的信息等等。
在根据本发明第一方面的方法中,可以利用多个检索器,并行地检索出可能的相关候选问答对。
在根据本发明第一方面的方法中,可以利用多个匹配器,并行地计算检索出的候选问答对与用户问题的匹配度值。优选地,每个匹配器计算候选中每个问答对与用户问题的匹配度,保留这些匹配度的值供后续流程使用。
在根据本发明第一方面的方法中,可以利用多个匹配器,以级联方式计算检索出的候选问答对与用户问题的匹配度值。优选地,每个匹配器计算候选中每个问答对与用户问题的匹配度,依据匹配度的高低对候选问答对排序,然后只保留匹配度最高的部分候选问答对,这些保留的问答对将会传送给下一匹配器计算匹配度。
优选地,所述的多个匹配器包括以下至少一个:基于关键词的匹配模型、基于词向量的匹配模型、基于深度学习的语义匹配模型。
优选地,根据排序最靠前的一个或多个候选问答对来答复用户。
根据本发明的第二方面,提供一种智能问答系统。该系统可以包括:对话引擎,用于接收用户提出的问题;分析模块,用于对用户的问题进行分析;候选问答库;检索模块,用于基于所述分析模块对问题分析的结果,在所述候选问答库中检索出与用户问题相关的问答对;匹配模块,用于计算所述检索模块检索出的候选问答对与用户问题的匹配度值;重排序模块,用于综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序。其中,所述对话引擎进一步被配置为从所述重排序模块重新排序的候选问答对中选择对用户的答复。
根据本发明的第三方面,提供一种计算机可读介质,用于记录可由处理器执行的指令,所述指令在被处理器执行时,使得处理器执行智能问答方法,包括如下操作:对用户的问题进行分析;基于对问题分析的结果,在候选问答库中检索出与用户问题相关的问答对;计算检索出的候选问答对与用户问题的匹配度值;综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序;以及从重新排序的候选问答对中选择对用户的答复。
根据本发明,首先会对用户问题进行细致的分析,包括基于领域的用户意图识别和实体识别等,在用户问题较短或语义较复杂时可以有效提升系统精度。本发明的技术方案中,在问题分析阶段,引入了较多的模块功能,从而具备强大的问题分析能力。在问题分析后,引入了多级检索和匹配模块。传统的信息检索系统主要使用基于关键词的模型,而本发明的系统会使用到词/句子向量表达模型和深度学习匹配模型。具体地说,各种检索器和匹配器可以进行并行或串行的连接以协同工作。在匹配阶段,可以使用基于关键词的匹配模型和/或基于词向量的匹配模型,这一点与现有技术存在很大区别。之后多个匹配模型的计算结果进入重排序模块进行分数融合,最终的结果按融合后的分数从高到低进行排序。
用户的问题允许设定特定的背景信息,如当前问题所涉及到的产品,提问的平台渠道等。
问题对应的答案支持参数定制,即模板化。其中参数可以与背景信息或者用户画像相关。如针对“保费多少钱?”这个问题,不同年龄段的用户会得到不同的答复。
附图说明
下面参考附图结合实施例说明本发明。
图1是根据本发明的智能问答系统的示意框图。
图2是根据本发明的智能问答方法的流程图。
具体实施方式
附图仅用于示例说明,不能理解为对本发明的限制。下面结合附图和实施例对本发明的技术方案做进一步的说明。
图1是根据本发明的智能问答系统100的示意框图。
以下结合图1来详细描述根据本发明的智能问答系统100及其方法。
如图1中所示,本发明的智能问答系统100包括对话引擎101。对话引擎101与用户进行对话,从而提取/接收用户的问题,并最终给出对用户问题的答复。
除了对话引擎101,本发明的智能问答系统100还包括分析模块102、候选问答库(知识库/知识图谱,或KB/KG)103、检索模块104、匹配模块105、重排序模块106。下面将详细对这些模块的功能进行介绍。
首先来看分析模块102。该分析模块102用于对用户的问题(query)进行分析。所涉及的分析的方面主要包括以下这些方面:
●分词;
●词性标注;
●句法分析;
●实体识别;
●指代消解/省略消解;
●关系抽取;
●意图识别;
●问句类型;
●答案类型;
●关键词识别;
●焦点词识别;
●背景识别;
●问句改写。
例如,利用指代消解和省略消解技术,此系统能够支持多轮对话。
以上分析的结果将用于之后流程的算法之中。
举例来说,用户可能在对话中问到“保费多少钱?”这样的问题是不完善的,需要进行问题补全。由于这样的提问可能是在保险咨询平台上发出,且之前的对话中涉及的是保险产品A,则将这样的信息带入到问题分析阶段,就能够自动地将问题完善,即“(保险产品A)保费多少钱?”
此外,这里,可能需要为用户的问题设定特定的背景信息。也就是说,用户的问题允许设定特定的背景信息,如当前问题所涉及到的产品分类,提问的平台渠道等。这样的背景信息将会应用于后续的检索阶段,以便进一步细化所要检索的范围。
检索模块104基于分析模块102对问题分析的结果,在候选问答库103中检索出与用户问题相关的问答对。
这里,可以利用多个检索器在候选问答库中检索出与用户问题相关的问答对。如果包含多个检索器,它们可能使用不同的自然语言处理(NLP)和机器学习算法,以并行的方式独立工作。每个检索器检索出可能的相关候选问答对。
例如,多个检索器可以是基于以下各方面的检索器:词/同义词、词向量、复述句、句向量等等。
在本发明中,问题对应的答案支持参数定制,即模板化。其中参数可以与背景信息或者用户画像相关。如针对“保费多少钱?”这个问题,不同年龄段的用户会得到不同的答复。也就是说,在检索模块104进行检索时,可以考虑获取用户问题的参数信息。这里,所述参数信息包括提出问题的用户的用户画像或该问题的背景信息。检索出的与用户问题相关的问答对中的答案是带有参数变量的,将这些参数变量替换为所获取的参数信息,以得到个性化的答案。例如,在用户画像或背景信息可以表明用户的年龄、性别等参数时,可以在候选问答对中选择与这样的年龄、性别等参数更相关的问答。
举例来说,在KB/KG 103中,存储的问答对中的答案是这样的:“您{{age}}岁,每年的保费是{{cost}}元”,那针对15岁的人,代入参数信息后的答案是“您15岁,每年的保费是100元”;针对75岁的人,代入参数信息后的答案是“您75岁,每年的保费是900元”。
以上提到的用户画像是指根据用户注册信息或者根据与用户的交互而获取的用户个人信息和偏好信息。更具体地,用户画像包括:人口统计学信息,用户历史行为,授权得到的用户地理位置,手机号码,通讯录,朋友列表,社交网络上的信息等等。
匹配模块105计算检索模块104检索出的候选问答对与用户问题的匹配度值。
这里,可以利用多个匹配器计算上一步获得的候选问答对与用户问题的匹配度值。如果包含多个匹配器,它们可能使用不同的NLP、机器学习和深度学习算法,以并行的方式独立工作,或者以级联的方式串行工作。
当以并行的方式独立工作时,每个匹配器计算候选中每个问答对与用户问题的匹配度,保留这些匹配度的值供后续流程使用。
当以级联的方式串行工作时,每个匹配器计算候选中每个问答对与用户问题的匹配度。依据匹配度的高低从高到低对候选问答对排序,然后只保留匹配度最高的部分候选问答对,这些保留的问答对会传给下一个匹配器计算匹配度。
可能的匹配器包括:TF-IDF、QQ match、QA match等等。TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频,IDF意思是逆向文件频率。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。QQ match就是问题(query)与候选问题之间的匹配。QA match就是问题(query)与候选答案之间的匹配。
匹配模型可以是各种排序或者评分模型。下面列举了三个常用的模型。
(一)基于关键词的匹配模型
候选问答对包含N个问答对{(q_i,a_i)}(i=1,...,N),其中有些问题会对应到某个相同的答案,所以它们是多对一的关系。称对应到某个答案的所有问题为一个问题类或问题簇,也即{q_i|for any(q_i,a_i),a_i=a}为一个问题类或问题簇。
我们使用下面的公式计算一个关键词w的权重weight(w):
weight(w)=log(N/num_q(w))^a*log(M/num_c(w))^b,
其中N为候选库中问题的数量,num_q(w)为包含关键词w的问题数量,M为问题类的数量,num_c(w)为包含关键词w的问题类数量,a和b是大于0的两个实数(这两个变量的取值可以利用项目数据调优获得,我们发现a=0.3,b=0.7通常能产生不错的结果)。幂次项a、b,以及log(M/num_c(w))项的引入是我们区别于传统TF-IDF模型的地方。
我们使用下面的公式计算一个问题(query)与候选问答库中某个问题cand_q的匹配分数:
score(query,cand_q)=sum_j(freq(w_j)*weight(w)),
其中w_j表示query和cand_q共同包含的关键词,freq(w)为query中关键词w出现的频次。
(二)基于词向量的匹配模型
词的向量表示通过word2vec或者fasttext等词向量表示模型训练得到。获得了词向量表示后,利用下面的公式获得一个句子sent的向量表示:
vec(sent)=sum_j(freq(w_j)*log(N/num_q(w))^a*log(M/num_c(w))^b*vec(w_j)),
其中w_j表示sent中包含的关键词,vec(w_j)是w_j的词向量,其他符号的定义同上。
利用上面公式获得了候选问题cand_q和query的句子向量表达后,它们之间的相似度可以使用一个匹配函数获得:
score(query,cand_q)=F(vec(query),vec(cand_q)).
常用的匹配函数包括cosine、点积、sigmoid,或者使用DNN进行拟合。
(三)基于深度学习的语义匹配模型
基于深度学习的语义匹配模型首先利用卷积神经网络(CNN)或者循环神经网络(RNN)等模型获取句子的向量表达,然后再使用匹配函数(如上所述)计算两个句子向量表达的匹配分数。
接下来看重排序模块106。重排序模块106综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序。
这里,可以利用融合(Ensemble)模型,综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序。
可能的重排序机制或算法包括:业务需求(Business)、学习到排序(LtR)、深度神经网络(DNN)等等。
需要说明的是,这里,几种重排序机制或算法可以级联,也就是说,将所有的候选问答对经过全部的重排序机制或算法,以得到一个综合的排序结果。
例如,仍然是针对以用户问题“保费多少钱?”为例进行说明。
检索模块104可能从KG/KB 103中检索出以下几个候选问答对:
1)“保费要怎么交?/您可以使用在线支付,或者银行转账……”;
2)“保费一年交要多少钱?/您{{age}}岁,每年的保费是{{cost}}元”;
3)“保费要交多少年呢?/保费需要持续缴纳XX年哦”。
在匹配模块105中,基于关键词的匹配模型针对这三个候选问答对可能给出如下预测分数:1)0.5、2)0.8、3)0.4;基于词向量的匹配模型可能给出如下预测分数:1)0.4、2)0.85、3)0.3;基于深度学习的语义匹配模型可能给出如下预测分数:1)0.3、2)0.9、3)0.2。上面所列举的预测分数可以根据之前描述的匹配模型中的公式而分别得出。
重排模块106利用前面三个匹配模型获得的三组预测分数作为输入,产生这三个候选问答对的最终得分:1)0.35、2)0.9、3)0.25。然后按得分从高到低排序为:2)0.9、1)0.35、3)0.25。
最终,对话引擎101从重排序模块106重新排序的候选问答对中选择对用户的答复。
例如,选择排在最高位置的候选问答对中的回答来作为对用户的答复。例如,当排在最高位置的候选问答对的置信度高于一定阈值时,可以直接输出该问答对的回答作为对用户的答复。
然而,当最高位置的候选问答对的置信度没那么高时,也就是说,系统对于用户问题的把握并没有那么自信,则可以选择排在前N个的候选问答对返回给用户作为回复。在此情况下,用户可以选择自己实际需要的答复来进行详细观看或了解。
图2是根据本发明的智能问答方法的流程图。
如图2中所示,根据本发明的智能问答方法200开始于步骤S210,在此步骤,对用户的问题进行分析。步骤S210在图1中是由分析模块102完成的。
如上所述,在此步骤,可以为用户的问题设定特定的背景信息。
接下来,在步骤S220,基于对问题分析的结果,在图1的候选问答库103中检索出与用户问题相关的问答对。步骤S220在图1中是由检索模块104完成的。
步骤S220可以进一步包括获取问题的参数信息。所述参数信息包括提出问题的用户的用户画像或该问题的背景信息。检索出的与用户问题相关的问答对中的答案可以是带有参数变量的,将这些参数变量替换为所获取的参数信息,以得到个性化的答案。
在步骤S220中,可以利用多个检索器,并行地检索出可能的相关候选问答对。
然后,在步骤S230,计算检索出的候选问答对与用户问题的匹配度值。步骤S230在图1中是由匹配模块105完成的。
在步骤S230中,可以利用多个匹配器,并行地计算检索出的候选问答对与用户问题的匹配度值。每个匹配器计算候选中每个问答对与用户问题的匹配度,保留这些匹配度的值供后续流程使用。
另一种情况下,多个匹配器可以以级联方式计算检索出的候选问答对与用户问题的匹配度值。这时,每个匹配器计算候选中每个问答对与用户问题的匹配度,依据匹配度的高低对候选问答对排序,然后只保留匹配度最高的部分候选问答对,这些保留的问答对将会传送给下一匹配器计算匹配度。
优选地,多个匹配器中至少包括以上所述的基于关键词的匹配模型和/或基于词向量的匹配模型。
在步骤S240,综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序。步骤S240在图1中是由重排序模块106完成的。
在步骤S240中,可以利用融合模型,对候选问答对重新排序。
最后,在步骤S250,从重新排序的候选问答对中选择对用户的答复。步骤S250可以由图1中的对话引擎101来完成。
具体地说,可以根据排序最靠前的一个或多个候选问答对来答复用户。
在步骤S250完成之后,方法200可以结束。
本领域普通技术人员应该认识到,本发明的方法可以实现为计算机程序。如上结合图1和2所述,通过一个或多个程序执行上述实施例的方法,包括指令来使得计算机或处理器执行结合附图所述的算法。这些程序可以使用各种类型的非瞬时计算机可读介质存储并提供给计算机或处理器。非瞬时计算机可读介质包括各种类型的有形存贮介质。非瞬时计算机可读介质的示例包括磁性记录介质(诸如软盘、磁带和硬盘驱动器)、磁光记录介质(诸如磁光盘)、CD-ROM(紧凑盘只读存储器)、CD-R、CD-R/W以及半导体存储器(诸如ROM、PROM(可编程ROM)、EPROM(可擦写PROM)、闪存ROM和RAM(随机存取存储器))。进一步,这些程序可以通过使用各种类型的瞬时计算机可读介质而提供给计算机。瞬时计算机可读介质的示例包括电信号、光信号和电磁波。瞬时计算机可读介质可以用于通过诸如电线和光纤的有线通信路径或无线通信路径提供程序给计算机。
因此,根据本发明,还可以提议一种计算机程序或一种计算机可读介质,用于记录可由处理器执行的指令,所述指令在被处理器执行时,使得处理器执行智能问答方法,包括如下操作:对用户的问题进行分析;基于对问题分析的结果,在候选问答库中检索出与用户问题相关的问答对;计算检索出的候选问答对与用户问题的匹配度值;综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序;以及从重新排序的候选问答对中选择对用户的答复。
上面已经描述了本发明的各种实施例和实施情形。但是,本发明的精神和范围不限于此。本领域技术人员将能够根据本发明的教导而做出更多的应用,而这些应用都在本发明的范围之内。
也就是说,本发明的上述实施例仅仅是为清楚说明本发明所做的举例,而非对本发明实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、替换或改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种智能问答方法,包括:
对用户的问题进行分析;
基于对问题分析的结果,在候选问答库中检索出与用户问题相关的问答对;
计算检索出的候选问答对与用户问题的匹配度值;
综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序;以及
从重新排序的候选问答对中选择对用户的答复。
2.如权利要求1所述的方法,其中,所述的对用户的问题进行分析的步骤进一步包括:为用户的问题设定特定的背景信息。
3.如权利要求1所述的方法,其中,所述的检索出与用户问题相关的问答对的步骤进一步包括:
获取问题的参数信息,其中,所述参数信息包括提出问题的用户的用户画像或该问题的背景信息;
检索出的与用户问题相关的问答对中的答案是带有参数变量的,将这些参数变量替换为所获取的参数信息,以得到个性化的答案。
4.如权利要求1所述的方法,其中,所述的检索出与用户问题相关的问答对的步骤进一步包括:利用多个检索器,并行地检索出可能的相关候选问答对。
5.如权利要求1所述的方法,其中,所述的计算检索出的候选问答对与用户问题的匹配度值的步骤进一步包括:利用多个匹配器,并行地计算检索出的候选问答对与用户问题的匹配度值,
其中,每个匹配器计算候选中每个问答对与用户问题的匹配度,保留这些匹配度的值供后续流程使用。
6.如权利要求1所述的方法,其中,所述的计算检索出的候选问答对与用户问题的匹配度值的步骤进一步包括:利用多个匹配器,以级联方式计算检索出的候选问答对与用户问题的匹配度值,
其中,每个匹配器计算候选中每个问答对与用户问题的匹配度,依据匹配度的高低对候选问答对排序,然后只保留匹配度最高的部分候选问答对,这些保留的问答对将会传送给下一匹配器计算匹配度。
7.如权利要求5或6所述的方法,其中,所述的多个匹配器包括以下至少一个:
基于关键词的匹配模型,
基于词向量的匹配模型,
基于深度学习的语义匹配模型。
8.如权利要求1所述的方法,其中,所述的从重新排序的候选问答对中选择对用户的答复的步骤进一步包括:
根据排序最靠前的一个或多个候选问答对来答复用户。
9.一种智能问答系统,包括:
对话引擎,用于接收用户提出的问题;
分析模块,用于对用户的问题进行分析;
候选问答库;
检索模块,用于基于所述分析模块对问题分析的结果,在所述候选问答库中检索出与用户问题相关的问答对;
匹配模块,用于计算所述检索模块检索出的候选问答对与用户问题的匹配度值;
重排序模块,用于综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序,
其中,所述对话引擎进一步被配置为从所述重排序模块重新排序的候选问答对中选择对用户的答复。
10.一种计算机可读介质,用于记录可由处理器执行的指令,所述指令在被处理器执行时,使得处理器执行智能问答方法,包括如下操作:
对用户的问题进行分析;
基于对问题分析的结果,在候选问答库中检索出与用户问题相关的问答对;
计算检索出的候选问答对与用户问题的匹配度值;
综合考虑问题分析、检索和匹配获得的结果,并结合业务需求,对候选问答对重新排序;以及
从重新排序的候选问答对中选择对用户的答复。
CN201711429799.6A 2017-12-26 2017-12-26 智能问答方法及系统 Expired - Fee Related CN108153876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711429799.6A CN108153876B (zh) 2017-12-26 2017-12-26 智能问答方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711429799.6A CN108153876B (zh) 2017-12-26 2017-12-26 智能问答方法及系统

Publications (2)

Publication Number Publication Date
CN108153876A true CN108153876A (zh) 2018-06-12
CN108153876B CN108153876B (zh) 2021-07-23

Family

ID=62462915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711429799.6A Expired - Fee Related CN108153876B (zh) 2017-12-26 2017-12-26 智能问答方法及系统

Country Status (1)

Country Link
CN (1) CN108153876B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033244A (zh) * 2018-07-05 2018-12-18 百度在线网络技术(北京)有限公司 搜索结果排序方法和装置
CN109033428A (zh) * 2018-08-10 2018-12-18 深圳市磐创网络科技有限公司 一种智能客服方法及系统
CN109033229A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 问答处理方法和装置
CN109033277A (zh) * 2018-07-10 2018-12-18 广州极天信息技术股份有限公司 基于机器学习的类脑系统、方法、设备及存储介质
CN109145102A (zh) * 2018-09-06 2019-01-04 杭州安恒信息技术股份有限公司 智能问答方法及其知识图谱系统构建方法、装置、设备
CN109145168A (zh) * 2018-07-11 2019-01-04 广州极天信息技术股份有限公司 一种专家服务机器人云平台
CN109271505A (zh) * 2018-11-12 2019-01-25 深圳智能思创科技有限公司 一种基于问题答案对的问答系统实现方法
CN109325132A (zh) * 2018-12-11 2019-02-12 平安科技(深圳)有限公司 专家知识推荐方法、装置、计算机设备及存储介质
CN109658271A (zh) * 2018-12-19 2019-04-19 前海企保科技(深圳)有限公司 一种基于保险专业场景的智能客服系统及方法
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN110069612A (zh) * 2019-04-28 2019-07-30 河北省讯飞人工智能研究院 一种回复生成方法及装置
CN110110062A (zh) * 2019-04-30 2019-08-09 贝壳技术有限公司 机器智能问答方法、装置与电子设备
CN110209780A (zh) * 2018-08-07 2019-09-06 腾讯科技(深圳)有限公司 一种问题模板生成方法、装置、服务器及存储介质
CN110232920A (zh) * 2019-06-21 2019-09-13 百度在线网络技术(北京)有限公司 语音处理方法和装置
CN110516051A (zh) * 2019-07-26 2019-11-29 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110597971A (zh) * 2019-08-22 2019-12-20 卓尔智联(武汉)研究院有限公司 基于神经网络的自动问答装置、方法及可读存储介质
CN110597968A (zh) * 2019-04-28 2019-12-20 河北省讯飞人工智能研究院 一种回复选择方法及装置
CN110659091A (zh) * 2018-06-29 2020-01-07 国际商业机器公司 会话代理对话流用户界面
WO2020024452A1 (zh) * 2018-07-31 2020-02-06 平安科技(深圳)有限公司 基于深度学习的应答方法、装置及可读存储介质
CN110866093A (zh) * 2018-08-10 2020-03-06 珠海格力电器股份有限公司 机器问答方法及装置
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111309878A (zh) * 2020-01-19 2020-06-19 支付宝(杭州)信息技术有限公司 检索式问答方法、模型训练方法、服务器及存储介质
CN111508611A (zh) * 2020-03-19 2020-08-07 平安国际智慧城市科技股份有限公司 多解决方案的智能选择方法、装置及相关设备
WO2020181800A1 (zh) * 2019-03-12 2020-09-17 平安科技(深圳)有限公司 预测问答内容的评分的装置、方法及存储介质
CN112182196A (zh) * 2020-11-03 2021-01-05 海信视像科技股份有限公司 应用于多轮对话的服务设备及多轮对话方法
WO2021082982A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 基于图谱化知识库的问答方法、设备、存储介质及装置
CN112905747A (zh) * 2021-03-08 2021-06-04 国能大渡河流域水电开发有限公司 一种基于语义分析技术的专业制度档案问答机器人系统
CN112989038A (zh) * 2021-02-08 2021-06-18 浙江连信科技有限公司 句子级用户画像生成方法、装置及存储介质
CN113420139A (zh) * 2021-08-24 2021-09-21 北京明略软件系统有限公司 一种文本匹配方法、装置、电子设备及存储介质
CN113590790A (zh) * 2021-07-30 2021-11-02 北京壹心壹翼科技有限公司 应用于多轮问答的问题检索方法、装置、设备及介质
CN113590789A (zh) * 2021-07-30 2021-11-02 北京壹心壹翼科技有限公司 应用于智能问答系统的问题检索方法、装置、设备及介质
CN113821621A (zh) * 2021-09-28 2021-12-21 中电万维信息技术有限责任公司 一种基于深度学习的开放式智能客服系统
CN115238101A (zh) * 2022-09-23 2022-10-25 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN116308686A (zh) * 2023-05-19 2023-06-23 北京未来链技术有限公司 一种基于区块链的用于元宇宙去中心化的电子商务平台

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN104731895A (zh) * 2015-03-18 2015-06-24 北京京东尚科信息技术有限公司 自动应答的方法和装置
CN104933084A (zh) * 2015-05-04 2015-09-23 上海智臻网络科技有限公司 一种用于获得答案信息的方法、装置和设备
CN106095872A (zh) * 2016-06-07 2016-11-09 北京高地信息技术有限公司 用于智能问答系统的答案排序方法及装置
US20170124432A1 (en) * 2015-11-03 2017-05-04 Baidu Usa Llc Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering
CN106997376A (zh) * 2017-02-28 2017-08-01 浙江大学 一种基于多级特征的问题和答案句子相似度计算方法
CN107153639A (zh) * 2016-03-04 2017-09-12 北大方正集团有限公司 智能问答方法及系统
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107391623A (zh) * 2017-07-07 2017-11-24 中国人民大学 一种融合多背景知识的知识图谱嵌入方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN104731895A (zh) * 2015-03-18 2015-06-24 北京京东尚科信息技术有限公司 自动应答的方法和装置
CN104933084A (zh) * 2015-05-04 2015-09-23 上海智臻网络科技有限公司 一种用于获得答案信息的方法、装置和设备
US20170124432A1 (en) * 2015-11-03 2017-05-04 Baidu Usa Llc Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering
CN107153639A (zh) * 2016-03-04 2017-09-12 北大方正集团有限公司 智能问答方法及系统
CN106095872A (zh) * 2016-06-07 2016-11-09 北京高地信息技术有限公司 用于智能问答系统的答案排序方法及装置
CN106997376A (zh) * 2017-02-28 2017-08-01 浙江大学 一种基于多级特征的问题和答案句子相似度计算方法
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107391623A (zh) * 2017-07-07 2017-11-24 中国人民大学 一种融合多背景知识的知识图谱嵌入方法

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033229A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 问答处理方法和装置
CN110659091A (zh) * 2018-06-29 2020-01-07 国际商业机器公司 会话代理对话流用户界面
CN109033244A (zh) * 2018-07-05 2018-12-18 百度在线网络技术(北京)有限公司 搜索结果排序方法和装置
CN109033244B (zh) * 2018-07-05 2020-10-16 百度在线网络技术(北京)有限公司 搜索结果排序方法和装置
CN109033277A (zh) * 2018-07-10 2018-12-18 广州极天信息技术股份有限公司 基于机器学习的类脑系统、方法、设备及存储介质
CN109145168A (zh) * 2018-07-11 2019-01-04 广州极天信息技术股份有限公司 一种专家服务机器人云平台
WO2020024452A1 (zh) * 2018-07-31 2020-02-06 平安科技(深圳)有限公司 基于深度学习的应答方法、装置及可读存储介质
CN110209780A (zh) * 2018-08-07 2019-09-06 腾讯科技(深圳)有限公司 一种问题模板生成方法、装置、服务器及存储介质
CN110209780B (zh) * 2018-08-07 2023-03-10 腾讯科技(深圳)有限公司 一种问题模板生成方法、装置、服务器及存储介质
CN109033428A (zh) * 2018-08-10 2018-12-18 深圳市磐创网络科技有限公司 一种智能客服方法及系统
CN110866093A (zh) * 2018-08-10 2020-03-06 珠海格力电器股份有限公司 机器问答方法及装置
CN109033428B (zh) * 2018-08-10 2021-09-10 深圳市磐创网络科技有限公司 一种智能客服方法及系统
CN109145102B (zh) * 2018-09-06 2021-02-09 杭州安恒信息技术股份有限公司 智能问答方法及其知识图谱系统构建方法、装置、设备
CN109145102A (zh) * 2018-09-06 2019-01-04 杭州安恒信息技术股份有限公司 智能问答方法及其知识图谱系统构建方法、装置、设备
CN109271505B (zh) * 2018-11-12 2021-04-30 深圳智能思创科技有限公司 一种基于问题答案对的问答系统实现方法
CN109271505A (zh) * 2018-11-12 2019-01-25 深圳智能思创科技有限公司 一种基于问题答案对的问答系统实现方法
WO2020119063A1 (zh) * 2018-12-11 2020-06-18 平安科技(深圳)有限公司 专家知识推荐方法、装置、计算机设备及存储介质
CN109325132A (zh) * 2018-12-11 2019-02-12 平安科技(深圳)有限公司 专家知识推荐方法、装置、计算机设备及存储介质
CN109658271A (zh) * 2018-12-19 2019-04-19 前海企保科技(深圳)有限公司 一种基于保险专业场景的智能客服系统及方法
CN109918560B (zh) * 2019-01-09 2024-03-12 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
WO2020181800A1 (zh) * 2019-03-12 2020-09-17 平安科技(深圳)有限公司 预测问答内容的评分的装置、方法及存储介质
CN110597968A (zh) * 2019-04-28 2019-12-20 河北省讯飞人工智能研究院 一种回复选择方法及装置
CN110069612A (zh) * 2019-04-28 2019-07-30 河北省讯飞人工智能研究院 一种回复生成方法及装置
CN110110062A (zh) * 2019-04-30 2019-08-09 贝壳技术有限公司 机器智能问答方法、装置与电子设备
CN110232920B (zh) * 2019-06-21 2021-11-19 阿波罗智联(北京)科技有限公司 语音处理方法和装置
CN110232920A (zh) * 2019-06-21 2019-09-13 百度在线网络技术(北京)有限公司 语音处理方法和装置
CN110516051A (zh) * 2019-07-26 2019-11-29 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110597971A (zh) * 2019-08-22 2019-12-20 卓尔智联(武汉)研究院有限公司 基于神经网络的自动问答装置、方法及可读存储介质
WO2021082982A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 基于图谱化知识库的问答方法、设备、存储介质及装置
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111143539B (zh) * 2019-12-31 2023-06-23 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111309878B (zh) * 2020-01-19 2023-08-22 支付宝(杭州)信息技术有限公司 检索式问答方法、模型训练方法、服务器及存储介质
CN111309878A (zh) * 2020-01-19 2020-06-19 支付宝(杭州)信息技术有限公司 检索式问答方法、模型训练方法、服务器及存储介质
CN111508611A (zh) * 2020-03-19 2020-08-07 平安国际智慧城市科技股份有限公司 多解决方案的智能选择方法、装置及相关设备
CN112182196A (zh) * 2020-11-03 2021-01-05 海信视像科技股份有限公司 应用于多轮对话的服务设备及多轮对话方法
CN112989038A (zh) * 2021-02-08 2021-06-18 浙江连信科技有限公司 句子级用户画像生成方法、装置及存储介质
CN112989038B (zh) * 2021-02-08 2022-06-21 浙江连信科技有限公司 句子级用户画像生成方法、装置及存储介质
CN112905747A (zh) * 2021-03-08 2021-06-04 国能大渡河流域水电开发有限公司 一种基于语义分析技术的专业制度档案问答机器人系统
CN113590790A (zh) * 2021-07-30 2021-11-02 北京壹心壹翼科技有限公司 应用于多轮问答的问题检索方法、装置、设备及介质
CN113590789A (zh) * 2021-07-30 2021-11-02 北京壹心壹翼科技有限公司 应用于智能问答系统的问题检索方法、装置、设备及介质
CN113590790B (zh) * 2021-07-30 2023-11-28 北京壹心壹翼科技有限公司 应用于多轮问答的问题检索方法、装置、设备及介质
CN113420139A (zh) * 2021-08-24 2021-09-21 北京明略软件系统有限公司 一种文本匹配方法、装置、电子设备及存储介质
CN113821621A (zh) * 2021-09-28 2021-12-21 中电万维信息技术有限责任公司 一种基于深度学习的开放式智能客服系统
CN113821621B (zh) * 2021-09-28 2023-10-27 中电万维信息技术有限责任公司 一种基于深度学习的开放式智能客服系统
CN115238101B (zh) * 2022-09-23 2023-01-03 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN115238101A (zh) * 2022-09-23 2022-10-25 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN116308686A (zh) * 2023-05-19 2023-06-23 北京未来链技术有限公司 一种基于区块链的用于元宇宙去中心化的电子商务平台
CN116308686B (zh) * 2023-05-19 2024-02-13 北京未来链技术有限公司 一种基于区块链的用于元宇宙去中心化的电子商务平台

Also Published As

Publication number Publication date
CN108153876B (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN108153876A (zh) 智能问答方法及系统
US11734319B2 (en) Question answering method and apparatus
CN110162611B (zh) 一种智能客服应答方法及系统
CN109885660B (zh) 一种知识图谱赋能的基于信息检索的问答系统和方法
CN110046221B (zh) 一种机器对话方法、装置、计算机设备及存储介质
CN109885672B (zh) 一种面向在线教育的问答式智能检索系统及方法
CN108304437B (zh) 一种自动问答方法、装置及存储介质
Yu et al. Modelling domain relationships for transfer learning on retrieval-based question answering systems in e-commerce
CN107491547A (zh) 基于人工智能的搜索方法和装置
CN110298028B (zh) 一种文本段落的关键句提取方法和装置
CN106874441A (zh) 智能问答方法和装置
CN110990533B (zh) 确定查询文本所对应标准文本的方法及装置
US11481387B2 (en) Facet-based conversational search
US10922342B2 (en) Schemaless systems and methods for automatically building and utilizing a chatbot knowledge base or the like
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN106951503A (zh) 信息提供方法、装置、设备以及存储介质
CN111753527A (zh) 基于自然语言处理的数据分析方法、装置和计算机设备
US11599666B2 (en) Smart document migration and entity detection
CN110795527A (zh) 候选实体排序方法、训练方法及相关装置
KR20200119393A (ko) 챗봇을 위한 학습 데이터 추천 장치 및 방법
CN113064980A (zh) 一种智能问答方法、装置、计算机设备及存储介质
CN111125491A (zh) 商品信息的搜索方法和装置、存储介质及电子装置
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN115470313A (zh) 信息检索及模型训练方法、装置、设备和存储介质
CN112597292B (zh) 问题回复推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210723