CN117407515A

CN117407515A - 一种基于人工智能的答题系统

Info

Publication number: CN117407515A
Application number: CN202311725242.2A
Authority: CN
Inventors: 梁艳美; 袁平
Original assignee: Hunan Sanxiang Bank Co Ltd
Current assignee: Hunan Sanxiang Bank Co Ltd
Priority date: 2023-12-15
Filing date: 2023-12-15
Publication date: 2024-01-16
Anticipated expiration: 2043-12-15
Also published as: CN117407515B

Abstract

本发明涉及线上答题系统技术领域，尤其涉及一种基于人工智能的答题系统，包括采集模块、问答模块以及分析模块。本发明通过设置问答模块，将输入的提问数据转化为文本提问数据，用以分析模块对输入文本长度进行分析，将文本提问数据与历史数据库或关键词数据库进行匹配，选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据，将文本提问数据进行预处理，提高匹配答案的精准性，并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取，或在历史数据库中的历史提问数据中进行匹配，能够快速精准地筛选出相似度高的答案数据，输出至所述问答模块。

Description

一种基于人工智能的答题系统

技术领域

本发明涉及线上答题系统技术领域，尤其涉及一种基于人工智能的答题系统。

背景技术

问答系统不仅能用自然语言句子提问，还能为用户直接返回所需的答案，而不是相关的网页。显然，问答系统能更好地表达用户的信息需求，同时也能更有效地满足用户的信息需求；问答系统适于通过分析问题并在数据库中找到答案来提供问题的答案；因此，问答系统的框架可以被视为类似于搜索引擎的框架；随着互联网的普及，互联网上的信息越来越丰富，人们能够通过搜索引擎方便地得到自己想要的各种信息；但是搜索引擎存在很多不足，主要由于返回结果太多，导致用户很难快速准确地定位到所需的信息，且搜索引擎的技术基础，即关键字匹配，只关注语言的语法形式，没有涉及语义，同时用户采用简单的查询词很难准确地表达信息需求，使得检索效果一般。

中国专利公开号：CN114144774A，公开了一种问答系统，其技术点是通过分析不正确答案及不正确分类，相应地修改问答系统的算法或算法选择过程；由此可见，现有答题系统技术中，若系统本身语料库不足或低质量标签会导致不准确的返回结果，同时由于关键字匹配，只关注语言的语法形式，没有涉及语义，导致很难快速准确地匹配到所需的答案信息，且缺乏记录以前输入的问题信息，并统计同一问题信息的搜索频率。

发明内容

为此，本发明提供一种基于人工智能的答题系统，用以克服现有技术中无法根据原始数据库、历史数据库以及关键词数据库快速准确地匹配到所需的答案数据的问题。

为实现上述目的，本发明提供一种基于人工智能的答题系统，包括，

采集模块，其与外部的若干云平台相连，用以在各云平台内提取行业相关数据，所述采集模块包括原始数据库、历史数据库以及关键词数据库，所述原始数据库用以储存采集模块在各云平台内提取行业相关数据，所述历史数据库用以储存历史问答数据项，历史问答数据项包括历史提问数据、对应的历史答案数据、对应的历史问答次数以及对应的提问文本长度，所述关键词数据库用以储存若干行业关键词；

问答模块，其与外部的客户端相连，用以将外部客户端输入的提问数据转化为文本提问数据，所述问答模块还能够输出答案数据以及错误问题提示；

分析模块，其与所述采集模块以及所述问答模块分别相连；所述分析模块用以通过对输入文本长度进行判定，将文本提问数据与历史数据库、原始数据库或关键词数据库进行匹配，选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据，并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取，或在历史数据库中的历史提问数据中进行匹配，能够选择答案数据输出至所述问答模块。

进一步地，所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度，根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度，在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时，分析模块将获取所述问答模块转化的文本提问数据的输入文本长度，根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定，

若输入文本长度小于第一预设文本长度，所述分析模块将在所述关键词数据库中对当前文本提问数据进行匹配，以确定是否将错误问题提示输出至所述问答模块；

若输入文本长度在第一预设文本长度与第二预设文本长度之间，所述分析模块将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算，以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出；

若输入文本长度大于第二预设文本长度，所述分析模块将对当前的文本提问数据进行拆分与合并，将文本提问数据输入文本长度调整至不超出第二预设文本长度。

进一步地，所述分析模块能够在输入文本长度小于第一预设文本长度时，根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配，

若文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项时，所述分析模块将获取匹配项对应的行业关键词，并根据匹配项对应的行业关键词在所述历史数据库中进行问题匹配；

若文本提问数据在所述关键词数据库中储存的各行业关键词中不存在匹配项时，所述分析模块判定当前的文本提问数据输入无效，并将错误问题提示输出至所述问答模块。

进一步地，所述分析模块在第一预设条件下时，根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配，选取包含该行业关键词的各历史提问数据作为待选择数据，并对待选择数据的数量进行判定，

若待选择数据的数量为零，所述分析模块判定所述历史数据库中暂无匹配项对应的行业关键词对应的历史问答数据项，分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取；

若待选择数据的数量不为零，所述分析模块判定所述历史数据库中存在匹配项对应的行业关键词对应的历史问答数据项，分析模块将对各待选择数据对应的历史问答次数进行判定，以确定是否输出对应的历史答案数据；

其中，第一预设条件为输入文本长度小于第一预设文本长度且文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项。

进一步地，所述分析模块内设置有模糊匹配最小问答次数，分析模块能够获取各待选择数据对应的历史问答次数，并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比，

若各待选择数据对应的历史问答次数均低于模糊匹配最小问答次数，所述分析模块判定各待选择数据均不符合答案输出标准，分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取；

若各待选择数据中存在历史问答次数不低于模糊匹配最小问答次数的各待选择数据，所述分析模块将提取历史问答次数不低于模糊匹配最小问答次数的各待选择数据对应的历史答案数据输出至问答模块，并按历史问答次数由高到低进行排序。

进一步地，所述分析模块在判定输入文本长度大于第二预设文本长度时，将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取，并将从文本提问数据提取出的各行业关键词进行合并，形成修正后的文本提问数据，分析模块获取修正后的文本提问数据的修正文本长度，并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比，

若修正文本长度小于第一预设文本长度，所述分析模块判定修正完成，将在所述关键词数据库中对修正后的文本提问数据进行匹配，以确定是否将错误问题提示输出至所述问答模块；

若修正文本长度在第一预设文本长度与第二预设文本长度之间，所述分析模块判定修正完成，将修正后的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算，以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出；

若修正文本长度大于第二预设文本长度，所述分析模块判定修正后的文本提问数据的文本长度仍超出第二预设文本长度，分析模块将修正后的文本提问数据在所述原始数据库中进行答案提取。

进一步地，所述分析模块内设置有选取相似度，分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时，将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算，选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据，并对选取的候选数据的数量进行判定，

若选取的候选数据的数量为零，所述分析模块判定当前的文本提问数据与所述历史数据库中的各历史提问数据的实时相似度均小于选取相似度，将当前的文本提问数据在所述原始数据库中进行答案提取。

若选取的候选数据的数量等于1，所述分析模块判定当前的文本提问数据与所述历史数据库中的唯一历史提问数据的实时相似度大于或等于选取相似度，分析模块将该候选数据对应的历史答案数据作为答案进行输出，并将对应的问答数据项中的历史问答次数更新；

若选取的候选数据的数量大于1，分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度，分析模块将分别提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词，并根据标准差异词占比依次分别对各差异词占比进行判定，以确定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出；

其中，实时相似度为文本提问数据中与任意一历史提问数据中相同的词占文本提问数据中总词数的占比；

差异词占比为一历史提问数据中与文本提问数据不同的词占该历史提问数据总词数的比值。

进一步地，所述分析模块内设置有标准差异词占比，当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时，分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度，提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词，计算出对应的若干差异词占比，并根据标准差异词占比依次分别对各差异词占比进行判定，

若存在差异词占比小于或等于标准差异词占比，将对应的若干候选数据作为答案进行输出，根据对应的历史回答次数对若干候选数据进行排序，并将对应的问答数据项中的历史问答次数更新；

若差异词占比均大于标准差异词占比，在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出，以及选取差异词占比最小候选数据作为答案进行输出，并将对应的问答数据项中的历史问答次数更新；

其中，差异词占比为选取的一候选数据对应的一历史提问数据的差异词与该历史提问数据中总词数的比值。

进一步地，所述分析模块内设置有标准语义相似度，所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时，将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算，并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度，并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。

进一步地，所述分析模块能够对选取出的若干答案文本进行对比整合，将各答案文本以标点符合拆分为若干答案数据项，并将各答案文本内对应的答案数据项进行判定，

若各答案文本内存在若干相同的答案数据项时，将在相同的答案数据项中保留其中一答案数据项，并将其他相同答案数据项删除；

若各答案文本内不存在相同的答案数据项时，则不对任意一答案数据项删除；

所述分析模块将各答案文本内保留的各答案数据项进行整合，生成答案数据输出至所述问答模块。

与现有技术相比，本发明的有益效果在于，通过设置采集模块，将行业内的各个云平台数据进行抽取，建设原始数据库，将历史问答信息进行储存，用以分析模块随时选取历史提问数据与文本提问数据对比，通过设置问答模块，将输入的提问数据为非文本数据时，转化为文本提问数据，用以分析模块对输入文本长度进行分析，将文本提问数据与历史数据库或关键词数据库进行匹配，选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据，将文本提问数据进行预处理，提高匹配答案的精准性，并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取，或在历史数据库中的历史提问数据中进行匹配，能够选择答案数据输出至所述问答模块，筛选出相似度高的答案数据，快速精准的输出答案数据。

进一步地，第一预设文本长度根据历史数据库中各提问文本长度中字符长度最小的文本长度设定，小于其中字符长度最小的文本长度，可以设定为字符长度最小的文本长度的0.9倍，第二预设文本长度表示历史数据库中各提问文本长度中字符长度最大的文本长度，大于其中字符长度最大的文本长度，可以设定为字符长度最大的文本长度的1.1倍。

通过获取文本提问数据的输入文本长度，以对文本提问数据进行预处理，若分析模块判定输入文本长度小于第一预设文本长度，表示输入文本长度比历史数据库中的各提问文本长度较小，将直接提取关键词进行分析，即在关键词数据库中储存的各行业关键词提取出行业关键词进行判定，若分析模块判定输入文本长度在第一预设文本长度与第二预设文本长度之间，表示输入文本长度与历史数据库中的提问文本长度非常接近，将通过实时相似度分析，若分析模块判定输入文本长度大于第二预设文本长度，表示输入文本长度比历史数据库中的各提问文本长度较大，将根据关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取，并将从文本提问数据提取出的各行业关键词进行合并。

尤其，通过分析模块对输入文本长度小于第一预设文本长度的文本提问数据在关键词数据库中进行匹配，选择出匹配的行业关键词，通过行业关键词与历史数据库的历史提问数据进行匹配，保障答案数据匹配精准。

进一步地，通过将行业关键词与历史数据库的历史提问数据匹配的各历史提问数据作为待选择数据，并对待选择数据的数量进行判定，若分析模块判定待选择数据的数量为零，表示在各历史提问数据中未能选择出匹配的答案数据，将在原始数据库中进行选择，若分析模块判定待选择数据的数量不为零，将根据历史问答次数选择答案数据，即选择回答次数多的答案作为答案数据输出。

尤其，模糊匹配最小问答次数表示设定的问答频次，代表问答频次较高，根据系统生成时间、系统的历史问答次数设定；通过设置模糊匹配最小问答次数，选择出问答次数高的待选择数据，问答次数越高，更系统的反应实际相关度高的答案数据，从而预测并快速筛选出频次高的待选择数据对应的历史答案数据作为答案数据输出。

进一步地，通过分析模块将输入文本长度大于第二预设文本长度的文本提问数据与关键词数据库中储存的各行业关键词进行匹配，提取出有效信息，即行业关键词，避免文本提问数据过长导致的匹配精度不高的问题，并将各行业关键词并进行合并，形成修正后的文本提问数据，对其进一步判定。

尤其，选取相似度表示设定的文本间构成文本的词的相同程度，代表文本间的相同程度很高，一般设定为90%-95%，若分析模块判定实时相似度大于等于选取相似度，则表示文本提问数据中的词与对应的各历史提问数据中的词相同部分占比很高。

进一步地，标准语义相似度表示设定的根据两个文本中词语与词语间的相似度，构成的文本相似度；通过设置有标准语义相似度，分析模块在历史数据库中选择与行业关键词、修正后的文本提问数据、当前的文本提问数据相似的全部文本集合，将通过对比整合确定最终输出的答案数据，保障匹配的答案的精准度。

进一步地，通过分析模块将选择出的全部文本集合进行对比，将相同的文本合并，即在相同的文本中选择任一文本，并与其他不同的文本进行整合，将整合后的文本作为答案数据输出，既精简输出的文本，又保障输出的文本完整。

附图说明

图1为本发明实施例基于人工智能的答题系统的示意图；

图2为本发明实施例基于人工智能的答题系统中采集模块的连接示意图；

图3为本发明实施例基于人工智能的答题系统中历史问答数据项的连接示意图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1、图2以及图3所示，本发明提供一种基于人工智能的答题系统，包括，采集模块、问答模块以及分析模块，其中，

通过设置采集模块，将行业内的各个云平台数据进行抽取，建设原始数据库，将历史问答信息进行储存，用以分析模块随时选取历史提问数据与文本提问数据对比，通过设置问答模块，将输入的提问数据为非文本数据时，转化为文本提问数据，用以分析模块对输入文本长度进行分析，将文本提问数据与历史数据库或关键词数据库进行匹配，选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据，将文本提问数据进行预处理，提高匹配答案的精准性，并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取，或在历史数据库中的历史提问数据中进行匹配，能够选择答案数据输出至所述问答模块，筛选出相似度高的答案数据，快速精准的输出答案数据。

具体而言，所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度，根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度，在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时，分析模块将获取所述问答模块转化的文本提问数据的输入文本长度，根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定，

若输入文本长度小于第一预设文本长度，所述分析模块将在所述关键词数据库中对当前文本提问数据进行匹配，以确定是否将错误问题输出至所述问答模块；

第一预设文本长度根据历史数据库中各提问文本长度中字符长度最小的文本长度设定，小于其中字符长度最小的文本长度，可以设定为字符长度最小的文本长度的0.9倍，第二预设文本长度表示历史数据库中各提问文本长度中字符长度最大的文本长度，大于其中字符长度最大的文本长度，可以设定为字符长度最大的文本长度的1.1倍。

具体而言，所述分析模块能够在输入文本长度小于第一预设文本长度时，根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配，

通过分析模块对输入文本长度小于第一预设文本长度的文本提问数据在关键词数据库中进行匹配，选择出匹配的行业关键词，通过行业关键词与历史数据库的历史提问数据进行匹配，保障答案数据匹配精准。

具体而言，所述分析模块在第一预设条件下时，根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配，选取包含该行业关键词的各历史提问数据作为待选择数据，并对待选择数据的数量进行判定，

通过将行业关键词与历史数据库的历史提问数据匹配的各历史提问数据作为待选择数据，并对待选择数据的数量进行判定，若分析模块判定待选择数据的数量为零，表示在各历史提问数据中未能选择出匹配的答案数据，将在原始数据库中进行选择，若分析模块判定待选择数据的数量不为零，将根据历史问答次数选择答案数据，即选择回答次数多的答案作为答案数据输出。

具体而言，所述分析模块内设置有模糊匹配最小问答次数，分析模块能够获取各待选择数据对应的历史问答次数，并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比，

模糊匹配最小问答次数表示设定的问答频次，代表问答频次较高，根据系统生成时间、系统的历史问答次数设定；通过设置模糊匹配最小问答次数，选择出问答次数高的待选择数据，问答次数越高，更系统的反应实际相关度高的答案数据，从而预测并快速筛选出频次高的待选择数据对应的历史答案数据作为答案数据输出。

在本实施例中，系统还具备接收评价值的功能，外部的客户端将对输出的序列答案数据进行准确度评分，系统能够根据反馈的准确度评分统计并记录准确度评分值。

具体而言，所述分析模块在判定输入文本长度大于第二预设文本长度时，将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取，并将从文本提问数据提取出的各行业关键词进行合并，形成修正后的文本提问数据，分析模块获取修正后的文本提问数据的修正文本长度，并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比，

通过分析模块将输入文本长度大于第二预设文本长度的文本提问数据与关键词数据库中储存的各行业关键词进行匹配，提取出有效信息，即行业关键词，避免文本提问数据过长导致的匹配精度不高的问题，并将各行业关键词并进行合并，形成修正后的文本提问数据，对其进一步判定。

具体而言，所述分析模块内设置有选取相似度，分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时，将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算，选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据，并对选取的候选数据的数量进行判定，

差异词占比为一历史提问数据中与文本提问数据不同的词数占该历史提问数据总词数的比值。

选取相似度表示设定的文本间构成文本的词的相同程度，代表文本间的相同程度很高，一般设定为90%-95%，若分析模块判定实时相似度大于等于选取相似度，则表示文本提问数据中的词与对应的各历史提问数据中的词相同部分占比很高。

具体而言，所述分析模块内设置有标准差异词占比，当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时，分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度，提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词，计算出对应的若干差异词占比，并根据标准差异词占比依次分别对各差异词占比进行判定，

标准差异词占比表示设定的历史提问数据与文本提问数据的不同的词数与历史提问数据总词数的比值，此比值代表不同的词的数量很少不影响对整个句子的理解；

通过分析模块内设置有标准差异词占比，分析模块根据词语与词语的相似度，确定句子的相似度，若分析模块判定实时差异词占比小于等于标准差异词占比，表示不同的词数比重较小，即对应的历史提问数据与文本提问数据相似度很高，将对应的若干候选数据作为答案进行输出，若分析模块判定实时差异词占比大于标准差异词占比，表示在历史提问数据中不同的词数比重较大，将在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出，以及选取差异词占比最小候选数据作为答案进行输出。

具体而言，所述分析模块内设置有标准语义相似度，所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时，将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算，并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度，并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。

在本实施例中，语义理解计算方法采用利用语义词典进行计算，基于同义词词林的结构，判断需进行相似度计算的两个词汇所对应的编码在哪一层分支，根据两个义项的语义距离，计算出相似度，距离越近，相似度越高。

标准语义相似度表示设定的根据两个文本中词语与词语间的相似度，构成的文本相似度；通过设置有标准语义相似度，分析模块在历史数据库中选择与行业关键词、修正后的文本提问数据、当前的文本提问数据相似的全部文本集合，将通过对比整合确定最终输出的答案数据，保障匹配的答案的精准度。

具体而言，所述分析模块能够对选取出的若干答案文本进行对比整合，将各答案文本以标点符合拆分为若干答案数据项，并将各答案文本内对应的答案数据项进行判定，

通过分析模块将选择出的全部文本集合进行对比，将相同的文本合并，即在相同的文本中选择任一文本，并与其他不同的文本进行整合，将整合后的文本作为答案数据输出，既精简输出的文本，又保障输出的文本完整。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的答题系统，其特征在于，包括，

2.根据权利要求1所述的基于人工智能的答题系统，其特征在于，所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度，根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度，在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时，分析模块将获取所述问答模块转化的文本提问数据的输入文本长度，根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定，

3.根据权利要求2所述的基于人工智能的答题系统，其特征在于，所述分析模块能够在输入文本长度小于第一预设文本长度时，根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配，

4.根据权利要求3所述的基于人工智能的答题系统，其特征在于，所述分析模块在第一预设条件下时，根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配，选取包含该行业关键词的各历史提问数据作为待选择数据，并对待选择数据的数量进行判定，

5.根据权利要求4所述的基于人工智能的答题系统，其特征在于，所述分析模块内设置有模糊匹配最小问答次数，分析模块能够获取各待选择数据对应的历史问答次数，并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比，

6.根据权利要求2所述的基于人工智能的答题系统，其特征在于，所述分析模块在判定输入文本长度大于第二预设文本长度时，将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取，并将从文本提问数据提取出的各行业关键词进行合并，形成修正后的文本提问数据，分析模块获取修正后的文本提问数据的修正文本长度，并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比，

7.根据权利要求2所述的基于人工智能的答题系统，其特征在于，所述分析模块内设置有选取相似度，分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时，将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算，选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据，并对选取的候选数据的数量进行判定，

若选取的候选数据的数量为零，所述分析模块判定当前的文本提问数据与所述历史数据库中的各历史提问数据的实时相似度均小于选取相似度，将当前的文本提问数据在所述原始数据库中进行答案提取；

8.根据权利要求7所述的基于人工智能的答题系统，其特征在于，所述分析模块内设置有标准差异词占比，当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时，分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度，提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词，计算出对应的若干差异词占比，并根据标准差异词占比依次分别对各差异词占比进行判定，

9.根据权利要求8所述的基于人工智能的答题系统，其特征在于，所述分析模块内设置有标准语义相似度，所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时，将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算，并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度，并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。

10.根据权利要求9所述的基于人工智能的答题系统，其特征在于，所述分析模块能够对选取出的若干答案文本进行对比整合，将各答案文本以标点符合拆分为若干答案数据项，并将各答案文本内对应的答案数据项进行判定，