CN104050256B - 基于主动学习的问答方法及采用该方法的问答系统 - Google Patents

基于主动学习的问答方法及采用该方法的问答系统 Download PDF

Info

Publication number
CN104050256B
CN104050256B CN201410264111.3A CN201410264111A CN104050256B CN 104050256 B CN104050256 B CN 104050256B CN 201410264111 A CN201410264111 A CN 201410264111A CN 104050256 B CN104050256 B CN 104050256B
Authority
CN
China
Prior art keywords
question
answer
confidence level
module
answering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410264111.3A
Other languages
English (en)
Other versions
CN104050256A (zh
Inventor
高传清
杨少毅
褚智威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suanni Technology Investment Management Partnership LP
Original Assignee
Xi'an Mashed Garlic Electronics Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Mashed Garlic Electronics Technology Ltd filed Critical Xi'an Mashed Garlic Electronics Technology Ltd
Priority to CN201410264111.3A priority Critical patent/CN104050256B/zh
Publication of CN104050256A publication Critical patent/CN104050256A/zh
Application granted granted Critical
Publication of CN104050256B publication Critical patent/CN104050256B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于主动学习的问答方法及采用该方法的问答系统,其中,所述基于主动学习的问答方法,其包含以下步骤:(1)输入提问;(2)预处理;(3)特征提取;(4)问题理解;(5)置信度,阈值门限和可信水平判断;(6)信息检索和信息处理;(7)答案抽取;(8)主动学习;(9)当置信度低于可信水平时,根据问句具体类别进行引导性提问,主动引导用户进行消除二义性的提问,进行新一轮更有效的问答。本发明公开的问答系统,其包含输入提问模块,预处理模块,语义理解模块和主动学习及输出答案模块,共计五个模块。

Description

基于主动学习的问答方法及采用该方法的问答系统
技术领域
本发明属于人工智能领域,具体涉及智能问答方法及其问答系统。
背景技术
最近几年,随着网络和信息技术的快速发展,同时人们想更快更准确地获取信息的愿望也重新促进了自动问答技术的发展。最近有越来越多的公司和科研院所参与了自动问答技术的研究。譬如谷歌、微软、苹果和IBM等著名的跨国公司。在每年一度的文本信息检索(TREC)会议上,自动问答(Question Answering Track)渐渐成为最受关注的主题之一。越来越多的大学和科研机构参与了TREC会议的Question AnsweringTrack。在2000年10月召开的ACL2000国际计算语言学学术会议上,有一个专题讨论会,题目是“Open-DomainQuestion Answering”。目前,国外已经开发出一些相对成熟的问答系统。麻省理工(MIT)就开发出一个问答系统Start,从1993年开始发布在Internet上,网址如下:http://www.ai.mit.edu/projects/infolab/。可以回答一些有关地理、历史、文化、科技、娱乐等方面的简单问题。比如:对于问题“What is the longest river in the world?”,Start将会回答“With a length of 4180miles,the Nile River is the longest river in theworld”,此外,还有一个相对来讲比较成熟的多语种自动智能问答系统,Answer Bus是个多语种的自动问答系统,它不仅可以回答英语的问题,还可以回答法语、西班牙语、德语、意大利语和葡萄牙语的问题。国内也有一些研究机构参与了自动问答技术的研究:中科院计算所、复旦大学、香港科技大学。但是参与中文自动问答技术研究的科研机构比较少,而且基本没有成型的中文自动问答系统。
从这些系统来看,它们的结构基本上都分为三个模块:问题分析与理解,信息检索,答案抽取。这种结构模式也为国内外大多数研究机构所采用,方案算是比较成熟的。差别之处就在于,首先,由于语言本身的原因,国外的研究不需要考虑对句子的分词,英语的疑问词可以作为问题分类的标记,问题类型的确定也就变得容易了。在中文系统中分词和词性标注贯穿始终,如果分词不准确则系统的每一步理解都会有误差,以至于最后得到的答案将答非所问,这也是中文自然语言处理的难点所在。其次,由于检索技术的不一样,也会影响回答的准确率。答案抽取基本上是以权重排序,并从最大的文档中抽取答案,句子、词、短语,甚至多文档自动文摘都可以作为答案。鉴于目前这些方面的研究都还比较初级,所以回答准确率也比较低。
目前的问答系统在遇到二义性复杂结构时无法准确进行识别和分析。通常语义理解的结果是孤立的,而不是联系用户需求的,所以无法获知问题理解的意图。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于主动学习的问答方法及采用该方法的问答系统,其利用统计学习的思想和方法,以信息检索系统为基础,通过主动学习不断丰富本地结构化数据库,使得系统可以从本地和Web端择优进行答案抽取,从而能更准确地回答用户用自然语言提出的问题。
本发明解决其技术问题所采用的技术方案是:基于主动学习的问答方法,其包含以下步骤:
(1)输入提问;在输入提问前根据可能的问题种类进行分类,分类录入问答模板并进行结构化存储,形成问答知识库索引,该问答知识库索引对应FAQ库;
(2)预处理;对步骤(1)中输入的问句预处理,将问句进行分词、词性标注、合并疑问词组,去除表义较低的停用词,识别主题词,进行关键词扩展和同义词扩充,形成结构化的语法树;
(3)特征提取;对预处理的结果进行特征提取,其本质是通过计算结构化语法树的TF-IDF值形成基于字典的特征向量;
(4)问题理解;通过SVM分类器对步骤(3)提取的特征进行分类,确定问句所属类别,然后通过计算从问句提取的特征向量和知识库特征向量的修正余弦相似度作为置信度,与阈值门限进行对比,如果高于阈值则在FAQ库中检索知识,形成答案后输出;如果低于阈值则执行步骤(5);
(5)如果置信度低于阈值门限,则判断置信度是否大于可信水平,当置信度大于可信水平则顺序执行步骤(6),步骤(7)和步骤(8);当置信度小于可信水平则执行步骤(9);
(6)信息检索和信息处理;在Web端进行信息检索,为克服布尔逻辑式不能完整反映用户意图的缺陷,采用布尔模型对布尔理论进行改造,然后再通过相关度排序建立索引;
(7)答案抽取;抽取与问句语义相关度较大的文档,通过对文档分割和过滤抽取答案,并且对答案进行整合,形成最后的回答;
(8)主动学习;当步骤(7)中形成的回答是涉及实时事实的求知性提问,则直接给出结果,否则将问句和回答根据类别录入问答模板,更新知识库,实现主动学习;
(9)当置信度低于可信水平时,根据问句具体类别进行引导性提问,主动引导用户进行消除二义性的提问,进行新一轮更有效的问答。
作为上述基于主动学习的问答方法中可信水平的优选,所述步骤(5)中的可信水平为0.1。
作为上述步骤(1)的一种改进,所述步骤(1)是通过语音转化模块将语音转化为文字。
作为上述基于主动学习的问答方法的具体实施方式,所述SVM分类器构造如下:
假设问答系统中话题类别种类有M类,建立M个支持向量机,识别输入的特征向量x的分类时,选择gj(x)最大的分类:
所述修正余弦相似度计算公式如下:
本发明还公开了采用上述基于主动学习的问答方法的问答系统,其包含输入提问模块,预处理模块,语义理解模块和主动学习及输出答案模块,共计五个模块。
作为上述问答系统的一种优选实施方式,所述输入提问模块采用实时唤醒机制,即在系统任何运行状态,用户通过对系统呼喊关键词,可以实时唤醒系统;当系统完成回答会话后,系统会自动进入监听状态,等待下一轮回答会话,该过程完全由语音控制,不需要人为按键触发;输入提问模块把语音识别结果作为所述预处理模块的输入;
所述预处理模块首先根据输入的内容进行分词和词性标注,根据训练语料库合并疑问词组,去除表义较低的停用词;接下来识别问句中包含的疑问词短语,根据疑问词短语找到对应的句型模式集;然后与模式集中的句型规则进行匹配,从而得到问题标准型,由此得知问题的类型;最后根据主题词在语料库中的相关问题类型进行扩展,并由扩充的同义词确定问题领域,实现对问题的有效分类,确定搜索答案时所需要的访问方式,形成结构化的语义树表示;
所述语义理解模块进行特征提取和问题理解;具体地,在确知问题类别的条件下,使用长度为500的相应问题类别字典向量对结构化的语义树进行标记,向量的维度表示该类别的实词个数,相应维度上的值表示经过预处理扩充后结构化语义树的关键词TF-IDF信息;对标记后的特征向量使用SVM分类器进行分类,确定所属类别;
所述主动学习模块主要包含置信度判断和可信水平判断,在相应的选择分支中分别进行信息检索、信息处理和答案抽取。
作为上述优选实施方式的一种改进,所述语义理解模块中,对语义理解结果采用结构化存储方式,具体地采用Json格式标记存储;该结构存储结果包含文本内容、理解置信度、服务名称、操作名称以及语义结果;其中,文本内容是语音识别结果,理解置信度是对语义结果可信程度的度量,服务名称是系统提供的查询的种类说明,操作名称是在该服务语境下可以执行的功能,语义结果包含涉及操作的具体细节条目。
本发明的有益效果如下:
本发明结合聊天机器人问答系统、基于Web的开放式回答系统以及基于知识的问答系统的优点,通过结构化的语义理解数据库存储,对系统进行主动学习,区分用户问句种类,扩展本地问答知识库,实现更有效、更准确的问答功能;
本发明同时通过把计算的置信度与阈值进行比较,选择合理的信息检索方式综合了多种问答系统的优点,既可以通过监督学习方式利用本地知识库的问答模板,也可以提取Web端的有效信息以主动学习方式更新问答模板。此外,在计算出的置信度低于可信水平时,确定原始问句的所属类别向用户提出引导性问句,使用户以更易于系统理解的方式用自然语言处理提出规范化问句。本发明通过主动学习方式不断提高系统性能,同时通过引导性提问和用户交互主动消除语义理解上的缺陷,不仅在原理上较之通常的问答系统更加合理有效,并且在实际测试中具有更高的准确率和查全率。
附图说明
图1表示基于主动学习的问答系统的模块结构图;
图2表示部分停用词示例;
图3表示模式匹配表示例;
图4表示基于主动学习的问答方法的流程图。
具体实施方式
下面结合附图及实施例具体描述本发明具体实施方式:
如图4示出了本发明基于主动学习的问答方法的一种具体实施例的流程图,如图所示,本发明基于主动学习的问答方法,其采用的步骤如下:
(1)根据可能的问题种类进行分类,分类录入问答模板并进行结构化存储,形成问答知识库索引(即形成图4中的FAQ库);
(2)对输入的问句预处理,将问句进行分词、词性标注、合并疑问词组,去除表义较低的停用词,识别主题词,进行关键词扩展和同义词扩充,形成结构化的语法树;
(3)对预处理的结果进行特征提取,本质是通过计算结构化语法树的TF-IDF值形成基于字典的特征向量;
(4)通过SVM分类器对特征进行分类,确定问句所属类别,然后通过计算从问句提取的特征向量和知识库特征向量的修正余弦相似度作为置信度,与阈值门限进行对比,如果高于阈值则在FAQ库中检索知识,形成答案;
(5)如果置信度低于阈值门限,则需要进行信息检索,为克服布尔逻辑式不能完整反映用户意图的缺陷,采用布尔模型对布尔理论进行改造,然后再通过相关度排序建立索引;
(6)抽取与问句语义相关度较大的文档,通过对文档分割和过滤抽取答案,并且对答案进行整合,形成最后的回答;
(7)如果问句是涉及实时事实的求知性提问,则直接给出结果,否则将问句和回答根据类别录入问答模板,更新知识库,实现主动学习;
(8)在置信度低于可信水平时,根据问句具体类别进行引导性提问,主动引导用户进行消除二义性的提问,进行新一轮更有效的问答。
上述基于主动学习的问答方法通过把计算的置信度与阈值进行比较,选择合理的信息检索方式综合了多种问答系统的优点,既可以通过监督学习方式利用本地知识库的问答模板,也可以提取Web端的有效信息以主动学习方式更新问答模板。此外,在计算出的置信度低于可信水平时,确定原始问句的所属类别向用户提出引导性问句,使用户以更易于系统理解的方式用自然语言处理提出规范化问句。上述问答方法通过主动学习方式不断提高系统性能,同时通过引导性提问和用户交互主动消除语义理解上的缺陷,不仅在原理上较之通常的问答系统更加合理有效,并且在实际测试中具有更高的准确率和查全率。
本发明还公开了采用上述基于主动学习的问答方法的问答系统,图1,图2和图3示出了该问答系统的一种具体实施方式,其中,图1是问答系统的功能模块图,本发明基于主动学习的问答系统包括输入提问模块,预处理模块,语义理解模块和主动学习及输出答案模块,共计五个模块;具体的,
所述输入提问模块采用实时唤醒机制,即在系统任何运行状态,用户通过对系统呼喊关键词,可以实时唤醒系统;当系统完成回答会话后,系统会自动进入监听状态,等待下一轮回答会话,该过程完全由语音控制,不需要人为按键触发。输入提问模块把语音识别结果作为所述预处理模块的输入;
所述预处理模块首先根据输入的内容进行分词和词性标注,根据训练语料库合并疑问词组,去除表义较低的停用词,部分停用词示例可以参见图2所示;接下来识别问句中包含的疑问词短语,根据疑问词短语找到对应的句型模式集,其中模式集包含一系列问题模式匹配表,如图3所示;然后与模式集中的句型规则进行匹配,从而得到问题标准型,由此得知问题的类型;问题标准型是为了保证相同的问题都能得到相同的处理,实现多(多种提问方式)对一(问题标准型),一(问题标准型)对多(多种答案抽取规则)的映射。问题标准型不仅是同种类型问题的唯一标识,也是某一问题类型的代表性结构表达式,可看作是一个直观的三元表达式:对象-属性-值。“对象”就是提问的主题;“属性”是对象的属性;“值”是属性的值,就是系统要搜索的问题答案;再根据主题词在语料库中的相关问题类型进行扩展,并由扩充的同义词确定问题领域,实现对问题的有效分类,确定搜索答案时所需要的访问方式,形成结构化的语义树表示;
所述语义理解模块主要进行特征提取和问题理解。具体地,在确知问题类别的条件下,使用长度为500的相应问题类别字典向量对结构化的语义树进行标记,向量的维度表示该类别的实词个数,相应维度上的值表示经过预处理扩充后结构化语义树的关键词TF-IDF信息。对标记后的特征向量使用SVM分类器进行分类,确定所属类别。所述的SVM分类器构造如下:
假设问答系统中话题类别种类有M类,建立M个支持向量机,识别输入的特征向量x的分类时,选择gj(x)最大的分类;
通过SVM分类器对特征进行分类,确定问句所属类别,然后通过计算从问句提取的特征向量和知识库特征向量的修正余弦相似度作为置信度,与阈值门限进行对比,如果高于阈值则在FAQ库中检索知识,形成答案,其中修正余弦相似度计算公式如下:
优选的,为了有效、方便、快捷地对机器理解的语义进行标记,我们对语义理解结果采用结构化存储方式,具体地采用Json格式标记存储。该结构存储结果包含文本内容、理解置信度、服务名称、操作名称以及语义结果。其中,文本内容是语音识别结果,理解置信度是对语义结果可信程度的度量,服务名称是系统提供的查询的种类说明,操作名称是在该服务语境下可以执行的功能,语义结果包含涉及操作的具体细节条目。
所述主动学习模块主要包含置信度判断和可信水平判断,在相应的选择分支中分别进行信息检索、信息处理和答案抽取;根据上述语义理解模块中的语义理解结构存储规则,在系统运行之前首先要录入问答模板形成问答知识库,并对问答知识库进行索引处理。本发明在答案抽取过程中通过特征矢量计算理解结果中的理解置信度,来区分具体采用的答案抽取方式,当理解置信度较高时,就直接从录入的问答知识库进行索引,否则通过Web进行查询,如果不涉及实时性质数据,则将Web的查询结果通过结构化形式录入知识索引库,如果涉及实时性质的数据,则不进行录入操作。
本发明将可信水平设置为0.1,当置信度低于可信水平时,问答系统会按照系统可以理解的方式进行引导性提问,直至消除用户提问的二义性,达到准确洞悉用户意图的目的。
上面结合附图对本发明优选实施方式作了详细说明,但是本发明不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解,本发明不限于特定的实施方式,本发明的范围由所附权利要求限定。

Claims (6)

1.基于主动学习的问答方法,其包含以下步骤:
(1)输入提问;在输入提问前根据可能的问题种类进行分类,分类录入问答模板并进行结构化存储,形成问答知识库索引,该问答知识库索引对应FAQ库;
(2)预处理;对步骤(1)中输入的问句预处理,将问句进行分词、词性标注、合并疑问词组,去除表义较低的停用词,识别主题词,进行关键词扩展和同义词扩充,形成结构化的语法树;
(3)特征提取;对预处理的结果进行特征提取,其本质是通过计算结构化语法树的TF-IDF值形成基于字典的特征向量;
(4)问题理解;通过SVM分类器对步骤(3)提取的特征进行分类,确定问句所属类别,然后通过计算从问句提取的特征向量和知识库特征向量的修正余弦相似度作为置信度,与阈值门限进行对比,如果高于阈值则在FAQ库中检索知识,形成答案后输出;如果低于阈值则执行步骤(5);
(5)如果置信度低于阈值门限,则判断置信度是否大于可信水平,当置信度大于可信水平则顺序执行步骤(6),步骤(7)和步骤(8);当置信度小于可信水平则执行步骤(9);
(6)信息检索和信息处理;在Web端进行信息检索,为克服布尔逻辑式不能完整反映用户意图的缺陷,采用布尔模型对布尔理论进行改造,然后再通过相关度排序建立索引;
(7)答案抽取;抽取与问句语义相关度较大的文档,通过对文档分割和过滤抽取答案,并且对答案进行整合,形成最后的回答;
(8)主动学习;当步骤(7)中形成的回答是涉及实时事实的求知性提问,则直接给出结果,否则将问句和回答根据类别录入问答模板,更新知识库,实现主动学习;
(9)当置信度低于可信水平时,根据问句具体类别进行引导性提问,主动引导用户进行消除二义性的提问,进行新一轮更有效的问答;
所述SVM分类器构造如下:
假设问答系统中话题类别种类有M类,建立M个支持向量机,识别输入的特征向量x的分类时,选择gj(x)最大的分类:
fj(x)=sign(gj(x)),j∈[1,M]
g j ( x ) = Σ i = 1 l α i j y i K ( x i , x ) + b i
所述修正余弦相似度计算公式如下:
S I M ( i , j ) = Σ c ∈ I ( i , j ) | ( R i c - R i ‾ ) ( R j c - R j ‾ ) | Σ c ∈ I ( R i c - R i ‾ ) 2 Σ c ∈ I ( R j c - R j ‾ ) 2 .
2.如权利要求1所述的基于主动学习的问答方法,其特征在于:步骤(5)中的可信水平为0.1。
3.如权利要求1所述的基于主动学习的问答方法,其特征在于:所述步骤(1)是通过语音转化模块将语音转化为文字。
4.采用权利要求1~3所述的基于主动学习的问答方法的问答系统,其包含输入提问模块,预处理模块,语义理解模块和主动学习及输出答案模块,共计五个模块。
5.如权利要求4所述的问答系统,其特征在于:所述输入提问模块采用实时唤醒机制,即在系统任何运行状态,用户通过对系统呼喊关键词,可以实时唤醒系统;当系统完成回答会话后,系统会自动进入监听状态,等待下一轮回答会话,该过程完全由语音控制,不需要人为按键触发;输入提问模块把语音识别结果作为所述预处理模块的输入;
所述预处理模块首先根据输入的内容进行分词和词性标注,根据训练语料库合并疑问词组,去除表义较低的停用词;接下来识别问句中包含的疑问词短语,根据疑问词短语找到对应的句型模式集;然后与模式集中的句型规则进行匹配,从而得到问题标准型,由此得知问题的类型;最后根据主题词在语料库中的相关问题类型进行扩展,并由扩充的同义词确定问题领域,实现对问题的有效分类,确定搜索答案时所需要的访问方式,形成结构化的语义树表示;
所述语义理解模块进行特征提取和问题理解;具体地,在确知问题类别的条件下,使用长度为500的相应问题类别字典向量对结构化的语义树进行标记,向量的维度表示该类别的实词个数,相应维度上的值表示经过预处理扩充后结构化语义树的关键词TF-IDF信息;对标记后的特征向量使用SVM分类器进行分类,确定所属类别;
所述主动学习模块主要包含置信度判断和可信水平判断,在相应的选择分支中分别进行信息检索、信息处理和答案抽取。
6.如权利要求5所述的问答系统,其特征在于:所述语义理解模块中,对语义理解结果采用结构化存储方式,具体地采用Json格式标记存储;该结构存储结果包含文本内容、理解置信度、服务名称、操作名称以及语义结果;其中,文本内容是语音识别结果,理解置信度是对语义结果可信程度的度量,服务名称是系统提供的查询的种类说明,操作名称是在该服务语境下可以执行的功能,语义结果包含涉及操作的具体细节条目。
CN201410264111.3A 2014-06-13 2014-06-13 基于主动学习的问答方法及采用该方法的问答系统 Expired - Fee Related CN104050256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410264111.3A CN104050256B (zh) 2014-06-13 2014-06-13 基于主动学习的问答方法及采用该方法的问答系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410264111.3A CN104050256B (zh) 2014-06-13 2014-06-13 基于主动学习的问答方法及采用该方法的问答系统

Publications (2)

Publication Number Publication Date
CN104050256A CN104050256A (zh) 2014-09-17
CN104050256B true CN104050256B (zh) 2017-05-24

Family

ID=51503088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410264111.3A Expired - Fee Related CN104050256B (zh) 2014-06-13 2014-06-13 基于主动学习的问答方法及采用该方法的问答系统

Country Status (1)

Country Link
CN (1) CN104050256B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951558A (zh) * 2017-03-31 2017-07-14 广东睿盟计算机科技有限公司 一种基于深度搜索的税务智能咨询平台的数据处理方法

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016081401A (ja) * 2014-10-21 2016-05-16 株式会社日立製作所 情報検索提示装置、及び情報検索提示方法
US10565508B2 (en) * 2014-12-12 2020-02-18 International Business Machines Corporation Inferred facts discovered through knowledge graph derived contextual overlays
CN104657463B (zh) * 2015-02-10 2018-04-27 乐娟 应用于自动问答系统的问句分类方法及装置
US10079785B2 (en) * 2015-02-12 2018-09-18 Google Llc Determining reply content for a reply to an electronic communication
US9165057B1 (en) 2015-03-10 2015-10-20 Bank Of America Corporation Method and apparatus for extracting queries from webpages
CN104820681A (zh) * 2015-04-17 2015-08-05 清华大学 一种用于线上问答服务的应答方法及系统
JP6618735B2 (ja) * 2015-08-31 2019-12-11 国立研究開発法人情報通信研究機構 質問応答システムの訓練装置及びそのためのコンピュータプログラム
CN105206284B (zh) * 2015-09-11 2019-06-18 清华大学 疏导青少年心理压力的虚拟聊天方法与系统
CN105260178A (zh) * 2015-09-21 2016-01-20 上海智臻智能网络科技股份有限公司 一种智能云服务应用开发方法及系统
CN105279274B (zh) * 2015-10-30 2018-11-02 北京京东尚科信息技术有限公司 基于自然语义问答系统的答案合成与匹配的方法和系统
CN105471712A (zh) * 2015-11-25 2016-04-06 深圳狗尾草智能科技有限公司 一种机器人答复系统及其答复方法
CN105512104A (zh) * 2015-12-02 2016-04-20 上海智臻智能网络科技股份有限公司 词典降维方法及装置、信息分类方法及装置
CN105389307A (zh) * 2015-12-02 2016-03-09 上海智臻智能网络科技股份有限公司 语句意图类别识别方法及装置
CN105653619B (zh) * 2015-12-25 2019-01-25 上海智臻智能网络科技股份有限公司 智能问答系统中正确日志库的更新方法和装置
CN105677795B (zh) * 2015-12-31 2019-09-06 上海智臻智能网络科技股份有限公司 抽象语义的推荐方法、推荐装置及推荐系统
CN105760452B (zh) * 2016-02-04 2020-03-10 深圳市嘉力达实业有限公司 一种高并发海量数据的采集、处理和存储的方法及系统
CN107092602B (zh) * 2016-02-18 2021-02-05 朗新科技集团股份有限公司 一种自动应答方法及系统
CN105786798B (zh) * 2016-02-25 2018-11-02 上海交通大学 一种人机交互中自然语言意图理解方法
CN107180029A (zh) * 2016-03-09 2017-09-19 阿里巴巴集团控股有限公司 一种基于咨询业务的信息处理方法及装置
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及系统
CN105912697B (zh) * 2016-04-25 2019-08-27 北京光年无限科技有限公司 一种对话系统知识库的优化方法及装置
CN107315731A (zh) * 2016-04-27 2017-11-03 北京京东尚科信息技术有限公司 文本相似度计算方法
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
US10606952B2 (en) * 2016-06-24 2020-03-31 Elemental Cognition Llc Architecture and processes for computer learning and understanding
CN107545003B (zh) * 2016-06-28 2022-03-04 中兴通讯股份有限公司 自动问答方法及系统
CN106663128A (zh) * 2016-06-29 2017-05-10 深圳狗尾草智能科技有限公司 一种聊天对话系统的扩充学习方法及聊天对话系统
CN106227740A (zh) * 2016-07-12 2016-12-14 北京光年无限科技有限公司 一种面向对话系统的数据处理方法及装置
CN107632987B (zh) 2016-07-19 2018-12-07 腾讯科技(深圳)有限公司 一种对话生成方法及装置
CN106446022A (zh) * 2016-08-29 2017-02-22 华东师范大学 一种基于形式语义推理和深度学习的自然语言知识挖掘方法
CN106383835A (zh) * 2016-08-29 2017-02-08 华东师范大学 一种基于形式语义推理和深度学习的自然语言知识挖掘系统
US20180082184A1 (en) * 2016-09-19 2018-03-22 TCL Research America Inc. Context-aware chatbot system and method
CN106503189B (zh) * 2016-10-31 2020-03-03 北京百度网讯科技有限公司 基于人工智能的搜索系统优化方法和装置
CN107784048B (zh) * 2016-11-14 2020-05-15 平安科技(深圳)有限公司 问答语料库的问题分类方法及装置
CN106599215A (zh) * 2016-12-16 2017-04-26 广州索答信息科技有限公司 一种基于深度学习的问句生成方法和问句生成系统
CN106528540A (zh) * 2016-12-16 2017-03-22 广州索答信息科技有限公司 一种种子问句的分词方法和分词系统
CN106649706A (zh) * 2016-12-20 2017-05-10 北京云知声信息技术有限公司 自然语言知识学习及装置
CN106649762A (zh) * 2016-12-27 2017-05-10 竹间智能科技(上海)有限公司 基于追问问题与反馈信息的意图识别方法、系统
CN106649768B (zh) * 2016-12-27 2021-03-16 北京百度网讯科技有限公司 基于深度问答的问答澄清方法和装置
CN106847279A (zh) * 2017-01-10 2017-06-13 西安电子科技大学 基于机器人操作系统ros的人机交互方法
CN106951491A (zh) * 2017-03-14 2017-07-14 广东工业大学 一种应用于机器人的智能对话控制方法及装置
CN108628882A (zh) * 2017-03-20 2018-10-09 北京京东尚科信息技术有限公司 用于预判问题的方法和系统
CN107092692A (zh) * 2017-04-24 2017-08-25 深圳市云软信息技术有限公司 知识库的更新方法及智能客服系统
CN106911812A (zh) * 2017-05-05 2017-06-30 腾讯科技(上海)有限公司 一种会话信息的处理方法、服务器及计算机可读存储介质
CN107220300B (zh) * 2017-05-05 2018-07-20 平安科技(深圳)有限公司 信息挖掘方法、电子装置及可读存储介质
CN107329967B (zh) * 2017-05-12 2019-09-24 北京邮电大学 基于深度学习的问答系统以及方法
CN107193798B (zh) * 2017-05-17 2019-06-04 南京大学 一种基于规则的试题类自动问答系统中的试题理解方法
CN107169104A (zh) * 2017-05-17 2017-09-15 北京品智能量科技有限公司 车辆故障问答方法及装置
CN107247868B (zh) * 2017-05-18 2020-05-12 深思考人工智能机器人科技(北京)有限公司 一种人工智能辅助问诊系统
CN107291828B (zh) * 2017-05-27 2021-06-11 北京百度网讯科技有限公司 基于人工智能的口语查询解析方法、装置及存储介质
CN108959327B (zh) * 2017-05-27 2021-03-05 中国移动通信有限公司研究院 一种业务处理方法、装置及计算机可读存储介质
WO2018226779A1 (en) * 2017-06-06 2018-12-13 Google Llc End of query detection
CN107315787A (zh) * 2017-06-13 2017-11-03 北京品智能量科技有限公司 用于车辆故障问答系统的数据处理方法及装置
CN107391614A (zh) * 2017-07-04 2017-11-24 重庆智慧思特大数据有限公司 一种基于wmd的中文问答匹配方法
CN107562774A (zh) * 2017-07-13 2018-01-09 同济大学 小语种词嵌入模型的生成方法、系统及问答方法和系统
CN107330120B (zh) * 2017-07-14 2018-09-18 三角兽(北京)科技有限公司 询问应答方法、询问应答装置及计算机可读存储介质
CN107423440B (zh) * 2017-08-04 2020-09-01 逸途(北京)科技有限公司 一种基于情感分析的问答上下文切换与强化选择方法
CN107609096B (zh) * 2017-09-11 2020-07-10 武汉科技大学 一种智能律师专家应答方法
CN107562907B (zh) * 2017-09-11 2020-10-02 武汉科技大学 一种智能律师专家案件应答装置
CN107766483A (zh) * 2017-10-13 2018-03-06 华中科技大学 一种基于知识图谱的交互式问答方法及系统
CN107862005A (zh) * 2017-10-25 2018-03-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN109840534B (zh) * 2017-11-29 2021-10-01 北京京东尚科信息技术有限公司 处理事件的方法和装置
CN107958059B (zh) * 2017-12-01 2020-07-10 北京百度网讯科技有限公司 智能问答方法、装置、终端和计算机可读存储介质
CN108021691B (zh) * 2017-12-18 2021-09-07 深圳前海微众银行股份有限公司 答案查找方法、客服机器人以及计算机可读存储介质
CN110019728B (zh) * 2017-12-25 2024-07-26 上海智臻智能网络科技股份有限公司 自动交互方法及存储介质、终端
CN108170780A (zh) * 2017-12-26 2018-06-15 北京邦邦共赢网络科技有限公司 一种自助问答的问题匹配方法及装置
CN107958091A (zh) * 2017-12-28 2018-04-24 北京贝塔智投科技有限公司 一种基于金融垂直知识图谱的nlp人工智能方法及交互系统
CN108280218A (zh) * 2018-02-07 2018-07-13 逸途(北京)科技有限公司 一种基于检索和生产混合问答的流程系统
CN108053351A (zh) * 2018-02-08 2018-05-18 南京邮电大学 智能高考志愿推荐系统和推荐方法
CN109447266B (zh) * 2018-03-12 2021-10-01 南京农业大学 一种基于大数据的农业科技服务智能分拣方法
CN108804521B (zh) * 2018-04-27 2021-05-14 南京柯基数据科技有限公司 一种基于知识图谱的问答方法及农业百科问答系统
CN108932278B (zh) * 2018-04-28 2021-05-18 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN108804529A (zh) * 2018-05-02 2018-11-13 深圳智能思创科技有限公司 一种基于Web的问答系统实现方法
CN108984655B (zh) * 2018-06-28 2021-01-01 厦门快商通信息技术有限公司 一种客服机器人智能客服引导方法
CN110659354B (zh) * 2018-06-29 2023-07-14 阿里巴巴(中国)有限公司 问答系统的建立方法、装置、存储介质及电子设备
CN109002501A (zh) * 2018-06-29 2018-12-14 北京百度网讯科技有限公司 用于处理自然语言对话的方法、装置、电子设备以及计算机可读存储介质
CN110750626B (zh) * 2018-07-06 2022-05-06 中国移动通信有限公司研究院 一种基于场景的任务驱动的多轮对话方法及系统
CN109741642A (zh) * 2018-07-11 2019-05-10 北京美高森教育科技有限公司 用于句子拓展的自问自答检测方法、装置及系统
CN109189897B (zh) * 2018-07-27 2020-07-31 什伯(上海)智能技术有限公司 一种基于数据内容匹配的聊天方法及聊天装置
CN108932350A (zh) * 2018-08-17 2018-12-04 沈阳农业大学 基于多策略的水稻病虫害智能问答方法
CN109388697A (zh) * 2018-10-10 2019-02-26 成都小多科技有限公司 处理问答语料的方法、装置及电子终端
CN109446304A (zh) * 2018-10-10 2019-03-08 长沙师范学院 智能客服会话方法及系统
CN109460459B (zh) * 2018-10-31 2020-09-22 神思电子技术股份有限公司 一种基于日志学习的对话系统自动优化方法
CN109743346B (zh) * 2018-11-19 2021-04-06 众安信息技术服务有限公司 会话流程配置方法、装置及计算机可读存储介质
CN111382240B (zh) * 2018-12-27 2024-03-12 上海智臻智能网络科技股份有限公司 一种语义推理方法及其装置
CN109753561B (zh) * 2019-01-16 2021-04-27 长安汽车金融有限公司 一种自动回复的生成方法及装置
CN109710747B (zh) * 2019-01-16 2021-04-06 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN109829047A (zh) * 2019-01-21 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能助手系统及实现方法
CN110164447B (zh) * 2019-04-03 2021-07-27 苏州驰声信息科技有限公司 一种口语评分方法及装置
CN110060686B (zh) * 2019-04-15 2021-06-22 广东小天才科技有限公司 语音交互方法及装置、终端设备、计算机可读存储介质
CN110113635B (zh) * 2019-04-25 2021-05-25 广州智伴人工智能科技有限公司 一种自动播放推送消息的方法及系统
CN110378485B (zh) * 2019-06-03 2021-05-11 广东幽澜机器人科技有限公司 一种机器人自学习新业务知识方法及装置
CN112115239A (zh) * 2019-06-20 2020-12-22 北京京东尚科信息技术有限公司 一种人机对话的方法、装置和存储介质
CN110516063A (zh) * 2019-07-11 2019-11-29 网宿科技股份有限公司 一种服务系统的更新方法、电子设备及可读存储介质
CN110543553B (zh) * 2019-07-31 2024-06-14 平安科技(深圳)有限公司 问题生成方法、装置、计算机设备及存储介质
US12014284B2 (en) 2019-12-27 2024-06-18 Industrial Technology Research Institute Question-answering learning method and question-answering learning system using the same and computer program product thereof
CN111460123B (zh) * 2020-04-07 2020-10-20 中国搜索信息科技股份有限公司 一种针对青少年聊天机器人的对话意图识别方法及装置
CN111898384A (zh) * 2020-05-30 2020-11-06 中国兵器科学研究院 一种文本情感识别方法、装置、存储介质及电子设备
CN111930911B (zh) * 2020-08-12 2024-03-29 杭州东方通信软件技术有限公司 一种快速领域问答方法及其装置
CN112115244B (zh) * 2020-08-21 2024-05-03 深圳市欢太科技有限公司 对话交互方法、装置、存储介质及电子设备
TWI754445B (zh) * 2020-11-05 2022-02-01 碩網資訊股份有限公司 智慧信息處理系統與方法
CN114121260A (zh) * 2021-10-19 2022-03-01 上海清赟医药科技有限公司 基于意图识别的医疗问答方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132308A1 (en) * 2011-11-22 2013-05-23 Gregory Jensen Boss Enhanced DeepQA in a Medical Environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951558A (zh) * 2017-03-31 2017-07-14 广东睿盟计算机科技有限公司 一种基于深度搜索的税务智能咨询平台的数据处理方法
CN106951558B (zh) * 2017-03-31 2020-06-12 广东睿盟计算机科技有限公司 一种基于深度搜索的税务智能咨询平台的数据处理方法

Also Published As

Publication number Publication date
CN104050256A (zh) 2014-09-17

Similar Documents

Publication Publication Date Title
CN104050256B (zh) 基于主动学习的问答方法及采用该方法的问答系统
US20180341871A1 (en) Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains
CN106776532B (zh) 一种知识问答方法及装置
JP5936698B2 (ja) 単語意味関係抽出装置
CN102737013B (zh) 基于依存关系来识别语句情感的设备和方法
CN113505209A (zh) 一种面向汽车领域的智能问答系统
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
CN101599071A (zh) 对话文本主题的自动提取方法
Gokul et al. Sentence similarity detection in Malayalam language using cosine similarity
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN109472022B (zh) 基于机器学习的新词识别方法及终端设备
CN109614620B (zh) 一种基于HowNet的图模型词义消歧方法和系统
KR20160067102A (ko) 모순 표현 수집장치 및 그를 위한 컴퓨터 프로그램
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
Ruiz-Casado et al. Using context-window overlapping in synonym discovery and ontology extension
CN106897274B (zh) 一种跨语种的点评复述方法
Sukumar et al. Semantic based sentence ordering approach for multi-document summarization
Li et al. Neural factoid geospatial question answering
CN114064901B (zh) 一种基于知识图谱词义消歧的书评文本分类方法
CN107797986A (zh) 一种基于lstm‑cnn的混合语料分词方法
CN112711666B (zh) 期货标签抽取方法及装置
CN107562907B (zh) 一种智能律师专家案件应答装置
CN110750632B (zh) 一种改进的中文alice智能问答方法及系统
CN107609096B (zh) 一种智能律师专家应答方法
Kamath et al. Sarcasm detection approaches survey

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180315

Address after: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Patentee after: SHENZHEN SUANNI TECHNOLOGY INVESTMENT MANAGEMENT PARTNERSHIP (L.P.)

Address before: Weiyang District of Fengcheng city of Xi'an province Shaanxi ten road 710018 No. 99

Patentee before: XI'AN SUANIER ELECTRONIC TECHNOLOGY Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170524