CN114461764A - 一种基于文本蕴含的多源答案校验方法 - Google Patents

一种基于文本蕴含的多源答案校验方法 Download PDF

Info

Publication number
CN114461764A
CN114461764A CN202011229720.7A CN202011229720A CN114461764A CN 114461764 A CN114461764 A CN 114461764A CN 202011229720 A CN202011229720 A CN 202011229720A CN 114461764 A CN114461764 A CN 114461764A
Authority
CN
China
Prior art keywords
question
answer
text
implication
answering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011229720.7A
Other languages
English (en)
Inventor
张宇
蒋润宇
施琦
齐乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202011229720.7A priority Critical patent/CN114461764A/zh
Publication of CN114461764A publication Critical patent/CN114461764A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明是一种基于文本蕴含的多源答案校验方法。本发明涉及复杂智能问答系统环境技术领域,本发明通过基于文本蕴含的答案校验模块,在整个问答项目中处于下游位置,用来作为收尾,根据前期多意图识别及问答模块,针对一个问题输入得到多个不同来源的答案,通过答案校验模块对返回给用户具体回答进行筛选。本发明是基于文本蕴含的多源答案校验技术。原生性地适合于任何的问答系统。本发明使用的训练任务不是由单一的基于阅读理解的问答系统提出的不够完备的训练集所确定,而是使用了一种比较开放的通用文本理解任务,即文本蕴含识别任务。通过这样的方式,能够很轻松地训练出能够校验所有问答系统的,训练集便于获取也足够完备的答案校验系统。

Description

一种基于文本蕴含的多源答案校验方法
技术领域
本发明涉及复杂智能问答系统环境技术领域,是一种基于文本蕴含的多源答案校验方法。
背景技术
在复杂智能问答系统环境中,为了保证答案的多样性,以确保正确答案会包含在答案集 合中,往往会存在多个不同种类的问答模块。这些问答模块往往相互独立,且各自的结构, 实现方法也并不一致。自动问答系统有望改变人类的信息获取方式,具有重要的理论和实际 应用价值。如何提高问答系统返回正确答案的能力是问答系统要解决的核心问题。
现有的问答系统实现,大多是基于深度学习方法,根据用户的提问以及系统中的实际问 答模块的原理,返回给用户最有可能的答案。由于这些方法只关心了答案的可能性,并没有 对得到的答案进行进一步的校验,例如:1)答案是否与问题相匹配,即答案的合理性。例如 问日期的问题,答案内容中应该包含有日期词。2)答案是否符合常识,即答案的合法性。例 如询问乒乓球比赛的比赛,答案如果类似于30:1,那就非常不合理。因此未来提高正确答案 的获得效果,非常有必要在现有方法的基础上,进一步对答案的正确性进行校验。
目前,面向问答系统的答案验证方法的研究还相对较少。现有提出的在阅读理解问答方 法返回最可能的答案的同时,返回答案所在句,通过进一步分析问题和答案所在句的关系, 来判断该问题是否得到了充分的回答。如果该问题已经被完整回答,则将答案返回给用户。 文献针对开放域问答系统,从多个阅读材料中获得的多个答案,提出利用答案之间的相互印 证关系,从中筛选出正确答案。这些方法都没有考虑答案与问题、问答对和上下文之间的关 系,无法提高正确答案的获取效果。针对阅读理解中选择题,首先根据问题和候选答案之间 的关系,得到候选答案的语义表示,再根据问题与阅读材料之间的关系,得到阅读材料的语 义表示,最后通过比较阅读材料和候选答案之间的关系,从多个候选答案中选择一个最可能 的答案。一方面由于一般的问答系统没有所谓的“候选答案”,因此无法直接使用。另一方 面,也没有考虑问答对与阅读材料之间的关系,效果有待提升。
1.目前的校验技术基本局限于基于阅读理解的问答系统。不能够处理其他类型的问答系 统(例如基于知识图谱或常见问题库的问答系统)。
2.目前的校验技术基本局限于训练语料,深度学习在训练语料规模不够大的情况下难以 学习到足够的语言信息,更难以学到问答对之间的逻辑关系。
3.基于深度学习的方法能够学到的全部信息都来自于训练集,并没有任何引入外部信息 的机制,导致了在处理分布和训练集不一致的测试集时,效果较差。
发明内容
本发明为了能够对复杂问答系统提供答案校验服务,本发明充分利用知识图谱的知识信 息,本发明提供了以下技术方案:
一种基于文本蕴含的多源答案校验方法,通过基于文本蕴含的答案校验模块,在整个问 答项目中处于下游位置,用来作为收尾,根据前期多意图识别以及问答模块,针对一个问题 输入得到多个不同来源的答案,通过答案校验模块对返回给用户具体回答进行筛选;
所述答案校验模块的输入为上游所有问答模块的输出,原始的问题以及被分类出的意图; 输出为部分经过筛选出的答案以及顺序,进行收尾统合,将不合格的答案进行筛选掉,并且 通过排序的方式给出用户最想看到的答案。
优选地,基于文本蕴含的答案校验模块基于文本蕴含识别任务,通过分析两个句子,包 括问题和其中一个回答之间的逻辑关系,判断文本蕴含性,进而确定问答的得分;
将每组的得分进行排序,加上问题意图对模块的加权,当询问运动员身高时,知识图谱 的可信度比文档问答要高,最终输出得分最高的那项。
优选地,以Bert模型为基础的文本蕴含识别模型,作为计算两个句子之间蕴含性大小的 模型,所述模型的输入为两个句子,并通过特殊标记符号予以分割,得到的输出即为一串向 量序列,取其中的第一个标记,作为最终的输出。
优选地,选择描述问答对之间的文本蕴含关系的语料集,选择了QNLI数据集作为构造 训练集的基础,给定一个问句,需要判断给定文本中是否包含该问句的正确答案,属于句子 对的文本二分类任务,需要一个中文的训练集,使用爬虫翻译为中文,构造出了需要的CQNLI 语料集,并用作训练集。
本发明具有以下有益效果:
本发明是基于文本蕴含的多源答案校验技术。原生性地适合于任何的问答系统。本发明 使用的训练任务不是由单一的基于阅读理解的问答系统提出的不够完备的训练集所确定的。 而是使用了一种比较开发的通用文本理解任务,即文本蕴含识别任务。通过这样的方式,能 够很轻松地训练出能够校验所有问答系统的,训练集便于获取也足够完备的答案校验系统。 实际上,仅仅通过一个简单的问答文本蕴含训练集CQNLI,的答案校验系统便能够将一个在 特定领域能够达到40%准确率的基于阅读理解的问答系统,提升到62%的准确率。
同时,本发明也注意到了,不同的问答系统原理上的不同,会导致在实际用户视角中, 其可信度有着一定的差别。所以本发明针对各类不同的提问意图,分别给出了不同的置信度。 通过这样的形式对于各种不同的问答系统进行整合。从而提高答案校验的效果。
附图说明
图1是常见的复杂智能问答系统;
图2是多源答案验证模块原理图;
图3是多源答案验证模块的算法流程;
图4是Bert模型的使用方法;
图5是Bert模型架构;
图6是Bert模型中一个Transformer结构的构成。
具体实施方式
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
根据图1至图6所示,本发明提供一种基于文本蕴含的多源答案校验方法,一种基于文 本蕴含的多源答案校验方法,通过基于文本蕴含的答案校验模块,在整个问答项目中处于下 游位置,用来作为收尾,根据前期多意图识别以及问答模块,针对一个问题输入得到多个不 同来源的答案,通过答案校验模块对返回给用户具体回答进行筛选;
答案校验模块的输入为上游所有问答模块的输出,原始的问题以及被分类出的意图;输 出为部分经过筛选出的答案以及顺序,进行收尾统合,将不合格的答案进行筛选掉,并且通 过排序的方式给出用户最想看到的答案。
基于文本蕴含的答案校验模块基于文本蕴含识别任务,通过分析两个句子,包括问题和 其中一个回答之间的逻辑关系,判断文本蕴含性,进而确定问答的得分;
将每组的得分进行排序,加上问题意图对模块的加权,当询问运动员身高时,知识图谱 的可信度比文档问答要高,最终输出得分最高的那项。
以Bert模型为基础的文本蕴含识别模型,作为计算两个句子之间蕴含性大小的模型,所 述模型的输入为两个句子,并通过特殊标记符号予以分割,得到的输出即为一串向量序列, 取其中的第一个标记,作为最终的输出。
选择描述问答对之间的文本蕴含关系的语料集,选择了QNLI数据集作为构造训练集的 基础,给定一个问句,需要判断给定文本中是否包含该问句的正确答案,属于句子对的文本 二分类任务,需要一个中文的训练集,使用爬虫翻译为中文,构造出了需要的CQNLI语料集, 并用作训练集。
具体实施例二:
文本蕴含,即文本蕴含识别任务。因为问题与候选答案、问题与支持文档间一般都存在 推理蕴含关系,文本蕴含识别技术成为答案验证的有力工具。文本蕴含,是两个文本间的有 方向的二元关系,用T表示一个文本(Text,T),H表示另一个文本(Hypothesis, H),如果根据T的语义和外部知识,可以从T的含义中推断出H的含义,则称T蕴含 H,写做T-->H。例如:
T:“小明周末开车带我去兜风”。
H:“小明会开车”。
由于小明能开车去兜风,则他一定会开车,所以T蕴含H。
将文本蕴含识别技术应用于答案验证任务,通过判断问题与支持文档、问题与答案间的 蕴含关系,可以合理的排除掉不相关的问答系统答案,显著提高问答系统的性能。
多源答案校验,即本发明不仅可以针对基于阅读理解的问答系统进行校验,还可以为其 他所有类型的问答系统进行答案校验。
如图1所示,在复杂智能问答系统环境中,为了保证答案的多样性,以确保正确答案会 包含在答案集合中,往往会存在多个不同种类的问答模块。这些问答模块往往相互独立,且 各自的结构,实现方法也并不一致。如图所示,该问答系统中包含有三种问答模块KBQA、 DBQA、FAQ,以及一些第三方问答模块。KBQA模块,即基于知识图谱的问答模块,意即在相关领域的知识图谱上寻找最可能是答案的点或者边。DBQA模块,即基于文档(阅读理解)的问答模块,意即在相关领域的文档中,寻找最可能是答案的段落或句子或短语。FAQ模块,即基于常见问题库的问答模块,意即在提前准备的常见问题库中,寻找最相似的问题, 并且输出由专家提前给出相关的答案。第三方问答模块,即一些比较专业的问答模块。例如 针对地点和路线提问的地图问答模块,保证了问答系统的时效性、可靠性,以及可拓展性。 为了能够对这样的复杂问答系统提供答案校验服务,本发明提出了多源答案校验方法。
基于文本蕴含的答案校验模块,在整个问答项目中处于下游位置,基本用来作为最后的 收尾。根据前期多意图识别以及后续多种问答模块,针对一个问题输入能够得到多个不同来 源的答案,那么返回给用户具体哪种回答就需要答案校验模块对回答进行筛选。
模块的整体思路如图2所示,答案校验模块的输入为上游所有具体问答模块的输出,原 始的问题以及其被分类出的意图。而输出为部分经过筛选出的答案,以及其顺序。也就是在 整个问答系统中用于最后的收尾统合,将不合格的答案进行筛选掉,并且通过排序的方式给 出用户最想看到的答案。
答案校验模块基于文本蕴含识别任务,通过分析两个句子(问题和其中一个回答)之间 的逻辑关系,判断其文本蕴含性,进而确定该问答对的得分。将每组的得分进行排序,再加 上问题意图对具体模块的加权(例如当询问运动员身高时,知识图谱的可信度就会比文档问 答要高),最终输出得分最高的那项。
其中,作为计算两个句子之间蕴含性大小的模型,即是以Bert模型为基础的文本蕴含识 别模型。模型的输入为两个句子,并通过特殊标记符号予以分割。而得到的输出即为一串向 量序列。取其中的第一个标记,作为最终的输出。
分解来看,作为基础的Bert,其内部结构即,其将一串输入序列,通过一共12层的双向 Transformer结构网络,最终得到一串输出序列。由于网络是双向连接的,并且层数足够深, 模型能够学习到足够的语言学信息。将每个Transformer展开,其内部结构可以看出,其内 部分为两层。第一层通过一个多头注意力层,并且与原始输入做一个残差连接和正则化。第 二层通过一个前向神经网络,并且与输入做一个残差连接并且通过正则化,得到输出。这样 的结构能够充分地捕捉到句子内部词与词之间的联系。
以上是模型部分。而有了合适的模型,还需要足够并且相关的语料进行训练。
为了选择能够更好地描述问答对之间的文本蕴含关系的语料集,选择了QNLI数据集作为 构造训练集的基础。
QNLI(Question Natural Language Inference),其前身是SQuAD 1.0数据集,给定一 个问句,需要判断给定文本中是否包含该问句的正确答案。属于句子对的文本二分类任务。
由于的问答系统是基于中文环境的。所以需要一个中文的训练集。因此使用爬虫对其翻 译为中文,即构造出了需要的CQNLI语料集。并将其用作训练集。
CQNLI语料的数据形如下表1所示:
--------------------------------------------------------------
表1 CQNLI数据集
Figure BDA0002764770950000051
最后,从用户的角度来说,在对路线进行提问时,地图类的问答模块往往相比其他的问 答模块更加可信,无论它回答内容如何。
根据这点,提出了基于用户提问意图的问答模块置信度规则。根据用户在不同提问意图 情况下,对于每一个QA模块赋予不同的置信度。而最终每一个问答对的得分,即模型给出的 得分加上模块的置信度。该最终得分即作为对答案进行排序的依据。
最终,对于单一问答对,先由模型给出一个基础得分,再加上一个模块的置信度得分。 最终的得分即作为用来筛选和排序的依据。
具体实施例三:
以一个完整的QA系统为例,用户输入的问题为:“今天北京的天气如何?”
就得到了这样一些回答,如下表2所示:
表2各个QA模块对问题的回答
Figure BDA0002764770950000061
将其中的每一对问答对输入多源答案验证模型,就能得到每一个问答对的得分。结果如下 表3所示:
表3多源答案校验模型对问答对的打分
Figure BDA0002764770950000062
接着查询对于“天气相关”类型的问题,各个模块的置信度得分为如下表4所示:
表4多源答案校验模块对问答对类型的打分
模块类型 问题类型 模块置信度
DBQA 天气相关 0.6
KBQA 天气相关 0.7
FAQ 天气相关 0.7
天气类API 天气相关 0.9
将得分相加,即可得到各个问答对的最终得分,如下表5所示:
表5多源答案校验模块最终得分
模块类型 问答对得分 模块置信度 最终得分
DBQA 0.9 0.6 1.5
KBQA 0.8 0.7 1.5
FAQ 0.7 0.7 1.4
天气类API 0.9 0.9 1.8
可以看出,第三方天气类API给出的回答:“19~27℃小雨转阴,北风微风”,即最符合 这个问题的回答。
基于文本蕴含的答案校验模型,不仅仅可以使用Bert模型,还可以使用任何深度学习模 型,例如LSTM、GPT等。
模块置信度与问答对得分的融合方式,不仅仅可以使用简单相加相乘,还可以通过简单 训练的模型给出结果等。
以上所述仅是一种基于文本蕴含的多源答案校验方法的优选实施方式,一种基于文本蕴 含的多源答案校验方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均 属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提 下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (4)

1.一种基于文本蕴含的多源答案校验方法,其特征是:通过基于文本蕴含的答案校验模块,在整个问答项目中处于下游位置,用来作为收尾,根据前期多意图识别以及问答模块,针对一个问题输入得到多个不同来源的答案,通过答案校验模块对返回给用户具体回答进行筛选;
所述答案校验模块的输入为上游所有问答模块的输出,原始的问题以及被分类出的意图;输出为部分经过筛选出的答案以及顺序,进行收尾统合,将不合格的答案进行筛选掉,并且通过排序的方式给出用户最想看到的答案。
2.根据权利要求1所述的一种基于文本蕴含的多源答案校验方法,其特征是:基于文本蕴含的答案校验模块基于文本蕴含识别任务,通过分析两个句子,包括问题和其中一个回答之间的逻辑关系,判断文本蕴含性,进而确定问答的得分;
将每组的得分进行排序,加上问题意图对模块的加权,当询问运动员身高时,知识图谱的可信度比文档问答要高,最终输出得分最高的那项。
3.根据权利要求2所述的一种基于文本蕴含的多源答案校验方法,其特征是:
以Bert模型为基础的文本蕴含识别模型,作为计算两个句子之间蕴含性大小的模型,所述模型的输入为两个句子,并通过特殊标记符号予以分割,得到的输出即为一串向量序列,取其中的第一个标记,作为最终的输出。
4.根据权利要求1所述的一种基于文本蕴含的多源答案校验方法,其特征是:
选择描述问答对之间的文本蕴含关系的语料集,选择了QNLI数据集作为构造训练集的基础,给定一个问句,需要判断给定文本中是否包含该问句的正确答案,属于句子对的文本二分类任务,需要一个中文的训练集,使用爬虫翻译为中文,构造出了需要的CQNLI语料集,并用作训练集。
CN202011229720.7A 2020-11-06 2020-11-06 一种基于文本蕴含的多源答案校验方法 Pending CN114461764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011229720.7A CN114461764A (zh) 2020-11-06 2020-11-06 一种基于文本蕴含的多源答案校验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011229720.7A CN114461764A (zh) 2020-11-06 2020-11-06 一种基于文本蕴含的多源答案校验方法

Publications (1)

Publication Number Publication Date
CN114461764A true CN114461764A (zh) 2022-05-10

Family

ID=81404836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011229720.7A Pending CN114461764A (zh) 2020-11-06 2020-11-06 一种基于文本蕴含的多源答案校验方法

Country Status (1)

Country Link
CN (1) CN114461764A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556920A (zh) * 2023-10-23 2024-02-13 星环信息科技(上海)股份有限公司 一种大模型幻觉治理方法、装置、设备及存储介质
CN117556920B (zh) * 2023-10-23 2024-05-31 星环信息科技(上海)股份有限公司 一种大模型幻觉治理方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020010A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法、装置及电子设备
CN110929015A (zh) * 2019-12-06 2020-03-27 北京金山数字娱乐科技有限公司 一种多文本分析方法及装置
CN111538819A (zh) * 2020-03-27 2020-08-14 北京工商大学 一种基于文档集多跳推理的问答系统的构建方法
CN111681765A (zh) * 2020-04-29 2020-09-18 华南师范大学 一种医学问答系统的多模型融合方法
CN111782786A (zh) * 2020-07-01 2020-10-16 中关村科学城城市大脑股份有限公司 用于城市大脑的多模型融合问答方法及系统、介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020010A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法、装置及电子设备
CN110929015A (zh) * 2019-12-06 2020-03-27 北京金山数字娱乐科技有限公司 一种多文本分析方法及装置
CN111538819A (zh) * 2020-03-27 2020-08-14 北京工商大学 一种基于文档集多跳推理的问答系统的构建方法
CN111681765A (zh) * 2020-04-29 2020-09-18 华南师范大学 一种医学问答系统的多模型融合方法
CN111782786A (zh) * 2020-07-01 2020-10-16 中关村科学城城市大脑股份有限公司 用于城市大脑的多模型融合问答方法及系统、介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556920A (zh) * 2023-10-23 2024-02-13 星环信息科技(上海)股份有限公司 一种大模型幻觉治理方法、装置、设备及存储介质
CN117556920B (zh) * 2023-10-23 2024-05-31 星环信息科技(上海)股份有限公司 一种大模型幻觉治理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110147436B (zh) 一种基于教育知识图谱与文本的混合自动问答方法
US9218390B2 (en) Query parser derivation computing device and method for making a query parser for parsing unstructured search queries
CN101251862B (zh) 一种基于内容的问题自动分类方法及其系统
Devitt Intuitions in linguistics
CN101599071B (zh) 对话文本主题的自动提取方法
CN110489760A (zh) 基于深度神经网络文本自动校对方法及装置
CN108363743A (zh) 一种智能问题生成方法、装置和计算机可读存储介质
CN112749265B (zh) 一种基于多信息源的智能问答系统
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN110276069A (zh) 一种中国盲文错误自动检测方法、系统及存储介质
CN111783428A (zh) 基于深度学习的应急管理类客观题自动生成系统
Kozareva et al. Combining data-driven systems for improving named entity recognition
Agarwal et al. Autoeval: A nlp approach for automatic test evaluation system
CN110222344A (zh) 一种针对小学生作文辅导的作文要素分析算法
Yogish et al. Survey on trends and methods of an intelligent answering system
Ma et al. Latexify math: Mathematical formula markup revision to assist collaborative editing in math Q&A sites
CN110390050B (zh) 一种基于深度语义理解的软件开发问答信息自动获取方法
CN115438152B (zh) 一种基于多神经网络与知识图谱的简答题评分方法及系统
CN114461764A (zh) 一种基于文本蕴含的多源答案校验方法
Murugathas et al. Domain specific question & answer generation in tamil
Schlobach et al. Data-driven type checking in open domain question answering
Chen et al. A POST parser-based learner model for template-based ICALL for Japanese-English writing skills
Huang et al. Characterizing the influence of features on reading difficulty estimation for non-native readers
CN111259650A (zh) 基于类标序列生成式对抗模型的文本自动生成方法
Suta et al. Matching question and answer using similarity: an experiment with stack overflow

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination