CN109271505B - 一种基于问题答案对的问答系统实现方法 - Google Patents
一种基于问题答案对的问答系统实现方法 Download PDFInfo
- Publication number
- CN109271505B CN109271505B CN201811338116.0A CN201811338116A CN109271505B CN 109271505 B CN109271505 B CN 109271505B CN 201811338116 A CN201811338116 A CN 201811338116A CN 109271505 B CN109271505 B CN 109271505B
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- candidate
- model
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明一种基于问题答案对的问答系统实现方法包括:问题分析、问题检索、答案选择。用户向问答系统提交自然语言表述的问题之后,问答系统会利用问题向量化、关键词提取、关键词拓展等自然语言处理技术去理解用户的提问意图,然后利用检索引擎的方法在问题答案对数据库中获取与问题相关的候选问题答案对集合,并利用匹配算法和排序算法从这些候选集合中准确地挑选出最佳答案。本发明通过综合不同算法和模型学习得到问题与答案之间的匹配度评分的函数,实现从候选问题答案对中选取出最佳答案的方法,完成了一种基于卷积神经网络、Xgboost特征融合的答案选择方法,为问答系统的答案选择提供了一种更好的方法。
Description
技术领域
本发明涉及一种基于问题答案对的问答系统实现方法,属于自然语言处理技术领域。
背景技术
搜索引擎技术在信息检索方面可以满足用户的信息需求,但是搜索引擎存在许多不完善的地方,主要体现在两个方面:一是搜索引擎对于用户输入的查询经过检索返回一系列相关网页,网页包含的内容过多,用户往往需要阅读这些网页才能定位自己的需求;二是搜索引擎采取关键词匹配对进行信息检索,关键词匹配技术只对句子进行语法解析而没有语义解析。对于难以用关键词表述的复杂需求,搜索无法给出令人满意的查询结果。为了改善信息检索的用户体验,直接以自然语言作为输入与输出的问答系统成为了研究热点。在众多问答系统中,有一类建立在已配对的问题答案对列表的问答系统,这类问答叫做基于问题答案对的问答系统。
用户向问答系统提交自然语言表述的问题之后,系统首先会对问题进行分析,利用各种自然语言处理的技术去理解问题的意图或者主题,例如对问题按意图或主题进行分类、提取问题中的关键词、根据关键词生成关联词,然后将自然语言表述的问题转换成检索所需要的查询语句。接下来,在检索得到的相关候选问题答案对中,通过复杂匹配度计算,选择最佳答案。
基于问题答案对的问答系统同时具有搜索引擎和问答系统的优点:
1)通过训练得到的关联词来获取相似问题集合,增强问题的特征。
2)建立问题与候选问题答案对之间更加复杂语义层面的匹配模型,融合了多个计算问题与候选问题答案对之间的相似度的算法和模型给出置信度更高的相似度评分,其中包括传统的统计分布、结构和语义相似度特征以及深度神经网络特征。
3)卷积神经网络模型允许网络捕获更长的距离依赖性,训练高效,在网络结构中加入传统相似度特征能够提高准确性。4)能够利用自然语言进行更加人性化的交互。
不足之处:
1)模型对比传统的检索模型更加复杂,训练模型的过程需要花费时间调参。
2)基于卷积神经网络的模型中两个句子在建模过程中是完全独立的,没有任何参数交互行为,一直到最后生成抽象向量表示后才有交互行为。
3)问题答案对中数据库更新之后,需要在之前模型的基础上继续训练。
基于上述缺陷,本发明专注于中文基于问题答案对的问答技术。答案选择模块是基于问题答案对的问答系统中最重要也最难的部分。本发明分别优化了答案选择模块的关键技术:基于卷积神经网络、Xgboost特征融合的候选问题答案对排序方法。
发明内容
本发明技术解决问题:针对用户可能提交的问题,提出了一种新的基于问题答案对的问答系统实现方法,在答案选择模块训练一个答案句子选择模型,这个模型能够学习问题答案对数据集中配对的问题和答案的相关性进行评分的函数,使得相关性强的答案评分排在前面。
本发明技术解决方案:一种基于问题答案对的问答系统实现方法,包括如下步骤:问题分析、问题检索和答案选择。具体步骤如下:
S1.问题分析,负责分析用户提出的问题,从而领会用户的提问意图。该步骤在分析用户的问题时,包括将问题向量化、从问题中提取关键词、关键词拓展等操作。这些分析结果会对后续的步骤S2问题检索和步骤S3答案选择产生帮助。
S2.问题检索,负责根据问题检索问题答案对的数据库,获得候选问题答案对集合。具体是在问题答案对的数据库上搭建一个搜索引擎,查询结果是按照BM25模型匹配度计算结果排序。
S3.答案选择,负责训练问题和基于步骤S2得到的候选问题答案对集合,通过对问题与候选问题答案对匹配度评分排序的方式得到最佳答案。
进一步的,步骤S1问题分析,具体包括以下子步骤:
S1.1问题向量化:
问题的文本表示可以方便人们的阅读,问题的向量表示则可以方便计算机的使用。将问题转化为向量之后,所得到的问题向量能够为其他步骤提供帮助;具体采用word2vec工具对问题进行向量化操作;
S1.2提取关键词:抽取出文本中的实体名词,作为关键词。
S1.3关键词拓展:训练词对词的关联概率,得到与关键词相关度高的词语。
进一步的,步骤S2问题检索,具体包括以下子步骤:
S2.1相似问题拓展:
通过将问题中关键词替换为相关度高的词语,将一个原问题拓展为相似问题的集合,相似问题与原问题的相似度由词之间的相关度决定。
S2.2候选问题答案对抽取:
在问题答案对的数据库上搭建一个搜索引擎,通过搜索引擎获得与每个问题相关的候选问题答案对集合,搜索结果的分数是按照BM25模型匹配度计算得到,在这个分数的基础上加权相似问题与原问题的相似度,按新评分重新排序,得到最终的候选问题答案对集合。
进一步的,步骤S3答案选择,具体包括以下子步骤:
S3.1提取传统特征:
从统计分布、结构和语义角度提取问题与候选问题、问题与候选答案匹配度特征,其中包括TF-IDF、BM25、TopNOverlap、最长公共子序列LCS、编辑距离ED、语言模型LM以及Word2Vec模型的特征。
S3.2提取深度学习特征:
训练基于卷积神经网络的文本相似度模型,计算问题与候选答案的相关度,其中对基于卷积神经网络的句子建模进行改进,在句子向量矩阵中添加Overlap的特征。首先,使用word2vec工具预训练词表获得词向量,把词向量连接起来得到句子向量,完成句子表示的建模。然后问题向量和候选答案向量分别经过获取句子的序列信息的卷积层,压缩句子向量维度的池化层,然后构建问题向量和候选答案向量的匹配矩阵,经过连接层将问题和候选答案向量转换为一个向量,最后输入到逻辑斯蒂分类模型,最后得到的结果为问题和候选答案匹相似度。
S3.3训练Xgboost:
使用步骤S3.1和S3.2中的算法和模型计算出相似度评分,作为Xgboost排序模型的特征输入,通过Xgboost模型综合所有特征计算得到问题与候选问题答案对的相似度,然后排序得到最佳的答案。
本发明一种基于问题答案对的问答系统实现方法,其优点及功效在于:建立问题与候选问题答案对之间更加复杂的语义层面的匹配模型,提高检索的准确性。
附图说明
图1为本发明系统的总体框架。
图2为本发明系统中的问题分析模块框架。
图3为本发明系统中的问题检索模块框架。
图4为本发明系统中的基于Solr检索系统的字段定义。
图5为本发明系统中的答案选择模块框架。
图6为本发明系统中的基于卷积神经网络匹配模型框架。
具体实施方式
下面结合附图,对本发明的技术方案做进一步的说明。
如图1所示,本发明一种基于问题答案对的问答系统实现方法,包括:问题分析、问题检索和答案选择。
下面分别对各部分进行详细说明。
S1.问题分析
问题分析的主要目标是理解用户的查询意图。主要包括三个任务:1)问题向量化:问题的文本表示可以方便人们的阅读,问题的向量表示则可以方便计算机的使用。将问题转化为向量之后,所得到的问题向量能够为问题分析的其他步骤提供帮助;2)问题关键词提取:问题的关键词能够很好地反应用户的查询意图,这些关键词也是问题检索所需要的关键信息;3)拓展关联词生成:通过从问题中提取出关键词能够获得关联度大的词语,帮助检索得到相似问题的候选问题答案对。
问题分析模块的框架图如图2所示。
S1.1问题向量化
计算机无法理解文本,但是可以理解数字。将问题向量化,就通过将文本转换为一系列数字的方式,使得计算机能够理解文本的含义,并能根据文本的含义进行一些语义方面的深度操作。本文利用了word2vec工具对问题进行了向量化操作。由问题转换而来的问题向量可以计算句子相似度,同时问题向量也是卷积神经网络句子矩阵的基础。
S1.2问题关键词提取
关键词作为问题中的重要组成成分,可以非常好地刻画用户的提问意图。本文利用开源自然语言处理工具Stanford CoreNLP对问题进行处理,并提取问题的实体名词,作为关键词。
S1.3拓展关联词生成
问题中提取出的关键词通过关联词词表获得关联度大的词语,帮助得到相似问题并检索得到相似问题的候选问题答案对集合。本文利用MGIZA++训练词对词的关联概率,得到一个词对词关联概率的词表。
S2.问题检索
问题检索构建问题答案对的语料库,并提供检索服务。信息检索主要负责检索与问题相关的候选问题答案对集合。本文所实现的问题检索通过以下步骤实现功能:1)相似问题拓展:通过关键词拓展获得相似问题,相似问题能够增加候选问题答案对的数量;2)候选问题答案对抽取:对问题集合中每个问题进行检索,得到候选问题答案对集合。
问题检索模块的框架图如图3所示。
S2.1相似问题拓展
通过将问题中关键词替换为与之相关度高的词语,将一个问题拓展为相似问题的集合,相似问题与原问题的相似度由词之间的关联概率决定。
S2.2候选问题答案对抽取
本文利用基于Solr全文搜索引擎构建了问答数据的语料库,并利用其查询功能进行与用户输入的查询问句相似历史问答数据的初步检索工作。Solr导入数据时,首先需要配置schema,定义数据的字段、类型以及文本分析方式。具体定义如图4所示,其中IK_text为自定义类型,表示该值的解析方式需要使用IK analyzer分词器解析,故还需配置IKanalyzer分词器。同时设置IK的分词模式为细粒度,以防止不恰当的分词结果忽略了某些相关文档。
本文设计并定义Solr的字段,并为qtext(问题)字段建立索引;通过索引文件,系统可以迅速的检索出语料库中最相似的前100个问题及对应答案作为候选项,作为下一步的输入。Solr使用BM25算法来衡量查询问题与候选问题的相似度。
本文从百度知道社区问答平台爬取了问题答案对作为实验的语料库。
通过搜索引擎获得与每个问题相关的候选问题答案对集合,搜索结果的分数是按照BM25模型匹配度计算得到,在这个分数的基础上乘上相似问题与原问题的相似度,对新评分重新排序,得到前100的候选问题答案对集合。
S3.答案选择
步骤S1问题分析的分析结果和步骤S2信息检索的检索结果都是答案选择的重要依赖。问题分析模块的分析结果包含问题向量、问题关键词、拓展关键词等重要信息,这些信息能够很好地描述用户的提问意图。候选问题答案对集合作为问题检索模块的检索结果,是答案选择模块选择最佳答案的主要来源。答案选择模块通过对上述信息的综合利用,从而得到用户所需要的最佳答案。答案选择模块分为以下步骤完成上述功能:1)提取传统特征:从统计分布、结构和语义角度提取了问题与候选问题、问题与候选答案匹配度特征,其中包括TF-IDF、BM25、TopNOverlap、最长公共子序列LCS、编辑距离ED、语言模型LM以及Word2Vec模型的特征;2)提取深度学习特征:训练基于卷积神经网络的文本相似度模型,计算问题与候选答案的相关度,其中对基于卷积神经网络的句子建模进行改进,在句子向量矩阵中添加Overlap的特征;3)训练Xgboost:使用传统特征和深度学习特征匹配度训练Xgboost,通过Xgboost综合所有特征计算得到问题和候选问题答案对的相似度,然后排序得到最佳的答案。
答案抽取模块的框架图如图5所示。
S3.1提取传统特征
本文从统计分布、结构和语义角度提取了问题与候选问题、问题与候选答案匹配度特征,其中包括TF-IDF、BM25、TopNOverlap、最长公共子序列LCS、编辑距离ED、语言模型LM以及Word2Vec模型的特征。其中TF-IDF、BM25和TopNCross从统计分布角度提出,基于统计分布的特征考察了每个单词在问答语料库中分布情况,并根据词频等分布特征设定单词的权重;最长公共子序列LCS和编辑距离ED考察了两个句子的结构相一致性,基于结构的特征是指利用两个句子中单词顺序、句法结构、单词词性等句子本身内在联系信息来判断两个句子相似;语言模型LM从词汇角度利用生成概率来定义相似度;Word2Vec把词转换成词向量,进而把句子转换成句向量,并使用余弦相似值来直接定义问题与候选问题、问题与候选答案之间的Word2Vec相似性。本文把利用语言模型LM、Word2Vec提取的特征归类为基于语义的特征。
S3.2提取深度学习特征
卷积神经网络是一类功能强大的人工神经网络,基于卷积神经网络的分布句子模型在许多自然语言处理任务中已经取得了成功,如情绪分析、释义检测和文档分类。本文的句子模型基于卷积神经网络并使用较大宽度的卷积过滤器,从而允许网络捕获更长的距离依赖性。此外,深度学习模型的架构以及问答相似性分数也对模型中的问题和答案的向量特征表示进行了编码。因此,本文的模型构建并学习了问题答案对的更丰富的表示,从而在答案句子选择数据集上取得了较好的结果。本文基于卷积神经网络的匹配模型如图6所示。
对于一个文本相似度排序系统,该系统的输入是一个特征向量而不是包含自然语言的词或句子,所以能将原始语句转换成能够充分表达其语义的特征向量是其基本的处理。而本文答案句子选择任务模型的核心假设是:对于询问语句对应的正确答案的文本文档,它在语义上应当和该问题语义具有极高的相似度。因此,把询问语句和包含答案的文本映射到一个共同的特征空间中去可以更有效地描绘它们之间的联系。
特别地,卷积神经网络的句子模型,在句子向量矩阵上添加了一维问题与候选答案句子之间Overlap的特征,使句子向量矩阵维度由变为其中d为词向量的维度,|s|为句子长度(分词后)。这一维Overlap特征的定义为:若问题语句中的词在候选答案语句中出现了,该词增加的这一维度的值为1,否则为0。同理,若候选答案语句中的词在问题语句中出现了,该词增加的这一维度的值为1,否则为0。这样修改的目的是提供多余的问题语句和候选答案语句之间的关联信息,这些信息可能在网络后面信息特征压缩被丢掉。为了学习将给定句子中的单个词的特征从低级词嵌入转换到高级语义中,卷积神经网络对句子矩阵S进行一系列转换,包括卷积、非线性和池化操作。最后,本文的深度学习再排序系统是端对端的训练,最后将神经网络的输出用于单一的逻辑斯蒂分类模型。
最主要的模块就是两个基于卷积神经网络的分布式句子模型。这两个句子模型并行运作将问题和答案语句映射为分布式向量,然后通过这两个分布式向量计算原问答对在语义上的匹配程度。
S3.3训练Xgboost
本文利用(eXtreme Gradient Boosting,Xgboost)来训练候选问题答案对的排序。基于传统特征和深度学习的8种算法和模型计算出相似度评分作为Xgboost排序模型的特征输入。本文利用Xgboost工具综合这些特征并利用训练出的排序模型给出最终预测结果。
本文中需要使用Xgboost做排序,因此需要设置参数objective为“rank:pairwise”,并且使用平均准确率(Mean Average Precision,MAP)作为模型验证的评价指标。本文采用交叉验证的方式来进行模型训练。
对于用户输入的查询问句,系统经过问题预处理和Solr检索模块后得到100条可能相似的问题答案对。此时的排序结果是Solr使用BM25算法得出的,在Xgboost重排序模型,本文将使用Xgboost排序模型重新评估这100条候选问题与查询问句的语义相似度。在该模块,将根据语言模型、翻译模型、最长公共子序列等算法以及卷积神经网络模型提取出对应的相似度作为Xgboost排序模型的特征输入训练模型。系统将利用训练好的Xgboost模型预测出最终的相似度,并按照预测的相似度按照从大到小的进行排序,最终选取经过重新排序的100条问题答案对中的前3条问答作为系统输出返回给用户。
本文最终利用传统特征、卷积神经网络、Xgboost实现了候选问题答案对的排序,从而得到最佳答案。
Claims (4)
1.一种基于问题答案对的问答系统实现方法,其特征在于:该方法包括如下步骤:问题分析、问题检索和答案选择,具体如下:
S1.问题分析,分析用户提出的问题,从而领会用户的提问意图;该步骤在分析用户的问题时,包括将问题向量化、从问题中提取关键词、关键词拓展的操作;
S2.问题检索,根据问题检索问题答案对的数据库,获得候选问题答案对集合;具体是在问题答案对的数据库上搭建一个搜索引擎,查询结果是按照BM25模型匹配度计算结果排序;
S3.答案选择,训练问题和基于步骤S2得到的候选问题答案对集合,通过对问题与候选问题答案对匹配度评分排序的方式得到最佳答案;
步骤S3答案选择,具体包括以下子步骤:
S3.1提取传统特征:
从统计分布、结构和语义角度提取问题与候选问题、问题与候选答案匹配度特征,其中包括TF-IDF、BM25、TopNOverlap、最长公共子序列LCS、编辑距离ED、语言模型LM以及Word2Vec模型的特征;
S3.2提取深度学习特征:
训练基于卷积神经网络的文本相似度模型,计算问题与候选答案的相关度,其中对基于卷积神经网络的句子建模进行改进,在句子向量矩阵中添加Overlap的特征;
S3.3训练Xgboost:
使用步骤S3.1和S3.2中的算法和模型计算出相似度评分,作为Xgboost排序模型的特征输入,通过Xgboost模型综合所有特征计算得到问题与候选问题答案对的相似度,然后排序得到最佳的答案。
2.根据权利要求1所述的一种基于问题答案对的问答系统实现方法,其特征在于:步骤S1问题分析,具体包括以下子步骤:
S1.1问题向量化;
S1.2提取关键词:抽取出文本中的实体名词,作为关键词;
S1.3关键词拓展:训练词对词的关联概率,得到与关键词相关度高的词语。
3.根据权利要求1所述的一种基于问题答案对的问答系统实现方法,其特征在于:步骤S2问题检索,具体包括以下子步骤:
S2.1相似问题拓展:
将问题中关键词替换为相关度高的词语,将一个原问题拓展为相似问题的集合,相似问题与原问题的相似度由词之间的相关度决定;
S2.2候选问题答案对抽取:
在问题答案对的数据库上搭建一个搜索引擎,通过搜索引擎获得与每个问题相关的候选问题答案对集合,搜索结果的分数是按照BM25模型匹配度计算得到,在这个分数的基础上加权相似问题与原问题的相似度,按新评分重新排序,得到最终的候选问题答案对集合。
4.根据权利要求1所述的一种基于问题答案对的问答系统实现方法,其特征在于:S3.2提取深度学习特征,具体过程如下:
首先,使用word2vec工具预训练词表获得词向量,把词向量连接起来得到句子向量,完成句子表示的建模;然后问题向量和候选答案向量分别经过获取句子的序列信息的卷积层,压缩句子向量维度的池化层,然后构建问题向量和候选答案向量的匹配矩阵,经过连接层将问题和候选答案向量转换为一个向量,最后输入到逻辑斯蒂分类模型,最后得到的结果为问题和候选答案相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811338116.0A CN109271505B (zh) | 2018-11-12 | 2018-11-12 | 一种基于问题答案对的问答系统实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811338116.0A CN109271505B (zh) | 2018-11-12 | 2018-11-12 | 一种基于问题答案对的问答系统实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109271505A CN109271505A (zh) | 2019-01-25 |
CN109271505B true CN109271505B (zh) | 2021-04-30 |
Family
ID=65192934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811338116.0A Active CN109271505B (zh) | 2018-11-12 | 2018-11-12 | 一种基于问题答案对的问答系统实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109271505B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795018A (zh) * | 2023-02-13 | 2023-03-14 | 广州海昇计算机科技有限公司 | 一种面向电网领域的多策略智能搜索问答方法及系统 |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109783516A (zh) * | 2019-02-19 | 2019-05-21 | 北京奇艺世纪科技有限公司 | 一种查询语句检索回复方法及装置 |
CN110088748B (zh) * | 2019-03-19 | 2023-11-14 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
CN109933660B (zh) * | 2019-03-25 | 2019-11-12 | 广东石油化工学院 | 面向自然语言形式基于讲义和网站的api信息检索方法 |
CN109977213B (zh) * | 2019-03-29 | 2022-11-01 | 南京邮电大学 | 一种面向智能问答系统的最优答案选择方法 |
CN109977294B (zh) * | 2019-04-03 | 2020-04-28 | 三角兽(北京)科技有限公司 | 信息/查询处理装置、查询处理/文本查询方法、存储介质 |
CN109977421A (zh) * | 2019-04-15 | 2019-07-05 | 南京邮电大学 | 一种程序设计类课程课后答疑系统的知识库建立方法 |
CN110032635B (zh) * | 2019-04-22 | 2023-01-20 | 齐鲁工业大学 | 一种基于深度特征融合神经网络的问题对匹配方法和装置 |
CN110069614A (zh) * | 2019-04-28 | 2019-07-30 | 北京车薄荷科技有限公司 | 一种问答交互方法及装置 |
CN110263135B (zh) * | 2019-05-20 | 2022-12-16 | 北京字节跳动网络技术有限公司 | 一种数据交换匹配方法、装置、介质和电子设备 |
CN110309503A (zh) * | 2019-05-21 | 2019-10-08 | 昆明理工大学 | 一种基于深度学习bert--cnn的主观题评分模型及评分方法 |
CN110287296A (zh) * | 2019-05-21 | 2019-09-27 | 平安科技(深圳)有限公司 | 一种问题答案选取方法、装置、计算机设备及存储介质 |
CN110413961B (zh) * | 2019-06-21 | 2021-02-09 | 平安国际智慧城市科技股份有限公司 | 基于分类模型进行文本评分的方法、装置和计算机设备 |
CN110263346B (zh) * | 2019-06-27 | 2023-01-24 | 卓尔智联(武汉)研究院有限公司 | 基于小样本学习的语意分析方法、电子设备及存储介质 |
CN110334196B (zh) * | 2019-06-28 | 2023-06-27 | 同济大学 | 基于笔画和自注意力机制的神经网络中文问题生成系统 |
CN110502620B (zh) * | 2019-07-02 | 2023-05-30 | 平安科技(深圳)有限公司 | 导诊相似问题对生成方法、系统及计算机设备 |
CN110390005A (zh) * | 2019-07-23 | 2019-10-29 | 北京香侬慧语科技有限责任公司 | 一种数据处理方法和装置 |
CN110310620B (zh) * | 2019-07-23 | 2021-07-13 | 苏州派维斯信息科技有限公司 | 基于原生发音强化学习的语音融合方法 |
CN112328800A (zh) * | 2019-08-05 | 2021-02-05 | 上海交通大学 | 自动生成编程规范问题答案的系统及方法 |
CN110413761A (zh) * | 2019-08-06 | 2019-11-05 | 浩鲸云计算科技股份有限公司 | 一种基于知识库的领域性单独对话的方法 |
CN112395396A (zh) * | 2019-08-12 | 2021-02-23 | 科沃斯商用机器人有限公司 | 问答匹配和搜索方法、设备、系统及存储介质 |
CN110597971B (zh) * | 2019-08-22 | 2022-04-29 | 卓尔智联(武汉)研究院有限公司 | 基于神经网络的自动问答装置、方法及可读存储介质 |
CN110674252A (zh) * | 2019-08-26 | 2020-01-10 | 银江股份有限公司 | 一种面向司法领域的高精度语义搜索系统 |
CN110598078B (zh) * | 2019-09-11 | 2022-09-30 | 京东科技控股股份有限公司 | 数据检索方法及装置、计算机可读存储介质、电子设备 |
CN110727764A (zh) * | 2019-10-10 | 2020-01-24 | 珠海格力电器股份有限公司 | 一种话术生成方法、装置及话术生成设备 |
CN110750616B (zh) * | 2019-10-16 | 2023-02-03 | 网易(杭州)网络有限公司 | 检索式聊天方法、装置以及计算机设备 |
CN110825930A (zh) * | 2019-11-01 | 2020-02-21 | 北京邮电大学 | 基于人工智能自动识别社区问答论坛中的正确回答的方法 |
CN110941695A (zh) * | 2019-11-05 | 2020-03-31 | 泰康保险集团股份有限公司 | 一种问答信息获取方法、装置、电子设备及存储介质 |
CN111753062A (zh) * | 2019-11-06 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 一种会话应答方案确定方法、装置、设备及介质 |
CN110866102A (zh) * | 2019-11-07 | 2020-03-06 | 浪潮软件股份有限公司 | 检索处理方法 |
CN110909139A (zh) * | 2019-11-08 | 2020-03-24 | 出门问问信息科技有限公司 | 一种问答方法、装置及电子设备 |
CN110990528A (zh) * | 2019-11-27 | 2020-04-10 | 出门问问(苏州)信息科技有限公司 | 一种问答方法、装置及电子设备 |
CN110908919B (zh) * | 2019-12-02 | 2021-03-26 | 上海市软件评测中心有限公司 | 一种基于人工智能的应答测试系统及其应用 |
CN110968674B (zh) * | 2019-12-04 | 2023-04-18 | 电子科技大学 | 基于词向量表征的问题评论对的构建方法 |
CN111159366A (zh) * | 2019-12-05 | 2020-05-15 | 重庆兆光科技股份有限公司 | 一种基于正交主题表示的问答优化方法 |
CN111104503A (zh) * | 2019-12-24 | 2020-05-05 | 华中科技大学 | 一种建筑工程质量验收规范问答系统及其构建方法 |
CN113127612A (zh) * | 2019-12-31 | 2021-07-16 | 深圳市优必选科技股份有限公司 | 一种答复反馈方法、答复反馈装置及智能设备 |
CN111309878B (zh) * | 2020-01-19 | 2023-08-22 | 支付宝(杭州)信息技术有限公司 | 检索式问答方法、模型训练方法、服务器及存储介质 |
CN111427995B (zh) * | 2020-02-26 | 2023-05-26 | 平安科技(深圳)有限公司 | 基于内部对抗机制的语义匹配方法、装置及存储介质 |
CN111353290B (zh) * | 2020-02-28 | 2023-07-14 | 支付宝(杭州)信息技术有限公司 | 一种自动响应用户询问的方法和系统 |
CN111368034A (zh) * | 2020-03-02 | 2020-07-03 | 复旦大学 | 双向语义特征匹配方法及供给内容推荐装置 |
CN111508611A (zh) * | 2020-03-19 | 2020-08-07 | 平安国际智慧城市科技股份有限公司 | 多解决方案的智能选择方法、装置及相关设备 |
CN111488441B (zh) * | 2020-04-08 | 2023-08-01 | 北京百度网讯科技有限公司 | 问题解析方法、装置、知识图谱问答系统和电子设备 |
CN111538830B (zh) * | 2020-04-28 | 2023-09-05 | 清华大学 | 法条检索方法、装置、计算机设备及存储介质 |
CN113569885A (zh) * | 2020-04-29 | 2021-10-29 | 阿里巴巴集团控股有限公司 | 问题相关性检测方法和服务器 |
CN111666376B (zh) * | 2020-05-21 | 2023-07-18 | 武汉大学 | 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置 |
CN111444329B (zh) * | 2020-06-12 | 2020-10-09 | 支付宝(杭州)信息技术有限公司 | 智能对话方法、装置和电子设备 |
CN111782789A (zh) * | 2020-07-03 | 2020-10-16 | 江苏瀚涛软件科技有限公司 | 智能问答方法与系统 |
CN112184021B (zh) * | 2020-09-28 | 2023-09-05 | 中国人民解放军国防科技大学 | 一种基于相似支持集的答案质量评估方法 |
CN112131353A (zh) * | 2020-10-12 | 2020-12-25 | 吉林大学 | 一种解决有关全文解读分析问题的方法 |
CN112256833B (zh) * | 2020-10-23 | 2024-02-27 | 清华大学深圳国际研究生院 | 一种基于大数据和ai算法的手机问题智能问答方法 |
CN112380330A (zh) * | 2020-11-13 | 2021-02-19 | 四川大学 | 一种精分阴性症状背景下的训练用机器人系统和方法 |
CN112380329A (zh) * | 2020-11-13 | 2021-02-19 | 四川大学 | 一种精分阳性症状背景下的训练用机器人系统和方法 |
CN112380231A (zh) * | 2020-11-13 | 2021-02-19 | 四川大学 | 一种具有抑郁障碍特征的训练用机器人系统和方法 |
CN112434152B (zh) * | 2020-12-01 | 2022-10-14 | 北京大学 | 基于多通道卷积神经网络的教育类选择题解答方法和装置 |
CN112507097B (zh) * | 2020-12-17 | 2022-11-18 | 神思电子技术股份有限公司 | 一种提高问答系统泛化能力的方法 |
CN112905768A (zh) * | 2021-02-08 | 2021-06-04 | 中国工商银行股份有限公司 | 一种数据交互方法、装置及存储介质 |
CN112949297A (zh) * | 2021-02-25 | 2021-06-11 | 深圳追一科技有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
CN112836034A (zh) * | 2021-02-25 | 2021-05-25 | 北京润尼尔网络科技有限公司 | 虚拟教学方法、装置和电子设备 |
CN113065356B (zh) * | 2021-03-19 | 2023-10-31 | 南方电网调峰调频发电有限公司信息通信分公司 | 一种基于语义分析算法的it设备运维故障建议处理方法 |
CN113609830A (zh) * | 2021-04-07 | 2021-11-05 | 新大陆数字技术股份有限公司 | 基于nlp技术的文学作品问答方法、系统及存储介质 |
CN113468300B (zh) * | 2021-05-28 | 2024-01-23 | 南京城市职业学院(南京开放大学) | 一种基于微信交互的智能消息处理系统及方法 |
CN113392321A (zh) * | 2021-06-02 | 2021-09-14 | 北京三快在线科技有限公司 | 一种信息推荐方法、装置、电子设备及存储介质 |
CN113326420B (zh) * | 2021-06-15 | 2023-10-27 | 北京百度网讯科技有限公司 | 问题检索方法、装置、电子设备和介质 |
CN113590789A (zh) * | 2021-07-30 | 2021-11-02 | 北京壹心壹翼科技有限公司 | 应用于智能问答系统的问题检索方法、装置、设备及介质 |
CN114490965B (zh) * | 2021-12-23 | 2022-11-08 | 北京百度网讯科技有限公司 | 问题处理方法、装置、电子设备和存储介质 |
CN114003709A (zh) * | 2021-12-30 | 2022-02-01 | 中国电子科技集团公司第二十八研究所 | 一种基于问句匹配的智能问答系统和方法 |
CN114547282B (zh) * | 2022-02-25 | 2022-09-09 | 广州中医药大学(广州中医药研究院) | 一种植物分类动态检索方法 |
CN114780672A (zh) * | 2022-03-23 | 2022-07-22 | 清华大学 | 一种基于网络资源的医学问题问答处理方法及装置 |
CN115810422B (zh) * | 2022-12-07 | 2023-12-29 | 深圳市维康致远科技有限公司 | 基于ai技术的互联网智能自动诊疗应答系统 |
CN117313748B (zh) * | 2023-11-24 | 2024-03-12 | 中电科大数据研究院有限公司 | 面向政务问答的多特征融合语义理解方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018102238A1 (en) * | 2016-12-02 | 2018-06-07 | Microsoft Technology Licensing, Llc | Systems and methods for automated query answer generation |
CN108153876A (zh) * | 2017-12-26 | 2018-06-12 | 爱因互动科技发展(北京)有限公司 | 智能问答方法及系统 |
CN108304437A (zh) * | 2017-09-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种自动问答方法、装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170295131A1 (en) * | 2016-04-12 | 2017-10-12 | Dell Software Inc. | Resource identification through dynamic domain name system (dns) labels |
-
2018
- 2018-11-12 CN CN201811338116.0A patent/CN109271505B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018102238A1 (en) * | 2016-12-02 | 2018-06-07 | Microsoft Technology Licensing, Llc | Systems and methods for automated query answer generation |
CN108304437A (zh) * | 2017-09-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种自动问答方法、装置及存储介质 |
CN108153876A (zh) * | 2017-12-26 | 2018-06-12 | 爱因互动科技发展(北京)有限公司 | 智能问答方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795018A (zh) * | 2023-02-13 | 2023-03-14 | 广州海昇计算机科技有限公司 | 一种面向电网领域的多策略智能搜索问答方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109271505A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271505B (zh) | 一种基于问题答案对的问答系统实现方法 | |
CN109885672B (zh) | 一种面向在线教育的问答式智能检索系统及方法 | |
CN111611361B (zh) | 抽取式机器智能阅读理解问答系统 | |
CN108153876B (zh) | 智能问答方法及系统 | |
CN111475623B (zh) | 基于知识图谱的案件信息语义检索方法及装置 | |
CN109829104B (zh) | 基于语义相似度的伪相关反馈模型信息检索方法及系统 | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
CN111291188B (zh) | 一种智能信息抽取方法及系统 | |
CN111914062B (zh) | 一种基于关键词的长文本问答对生成系统 | |
CN104408173A (zh) | 一种基于b2b平台的核心关键词自动提取方法 | |
CN115048447B (zh) | 一种基于智能语义补全的数据库自然语言接口系统 | |
CN113377897B (zh) | 基于深度对抗学习的多语言医疗术语规范标准化系统及方法 | |
CN112307182B (zh) | 一种基于问答系统的伪相关反馈的扩展查询方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN110516145B (zh) | 一种基于句向量编码的信息搜索方法 | |
CN112036178A (zh) | 一种配网实体相关的语义搜索方法 | |
CN111581364B (zh) | 一种面向医疗领域的中文智能问答短文本相似度计算方法 | |
CN110851584B (zh) | 一种法律条文精准推荐系统和方法 | |
CN117312499A (zh) | 一种基于语义的大数据分析系统及方法 | |
CN111581365B (zh) | 一种谓词抽取方法 | |
CN111382333A (zh) | 基于案件相关性联合学习与图卷积的新闻文本句中案件要素抽取方法 | |
CN115238705A (zh) | 语义解析结果重排序方法及系统 | |
CN114417863A (zh) | 词权重生成模型训练方法及装置、词权重生成方法及装置 | |
CN113961686A (zh) | 问答模型的训练方法及装置、问答方法及装置 | |
CN114003706A (zh) | 关键词组合生成模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: 518000 Nanshan Software Park a2108-2107, 10128 Shennan Avenue, Liancheng community, Nantou street, Nanshan District, Shenzhen City, Guangdong Province Patentee after: SHENZHEN INTELLIGENT STRONG TECHNOLOGY Co.,Ltd. Address before: 518000 2c, building 6, building 5-6, brocade beach, Shenzhen Bay, Nanshan District, Shenzhen City, Guangdong Province Patentee before: SHENZHEN INTELLIGENT STRONG TECHNOLOGY Co.,Ltd. |