CN117407515A - 一种基于人工智能的答题系统 - Google Patents

一种基于人工智能的答题系统 Download PDF

Info

Publication number
CN117407515A
CN117407515A CN202311725242.2A CN202311725242A CN117407515A CN 117407515 A CN117407515 A CN 117407515A CN 202311725242 A CN202311725242 A CN 202311725242A CN 117407515 A CN117407515 A CN 117407515A
Authority
CN
China
Prior art keywords
data
question
text
answer
analysis module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311725242.2A
Other languages
English (en)
Other versions
CN117407515B (zh
Inventor
梁艳美
袁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202311725242.2A priority Critical patent/CN117407515B/zh
Publication of CN117407515A publication Critical patent/CN117407515A/zh
Application granted granted Critical
Publication of CN117407515B publication Critical patent/CN117407515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及线上答题系统技术领域,尤其涉及一种基于人工智能的答题系统,包括采集模块、问答模块以及分析模块。本发明通过设置问答模块,将输入的提问数据转化为文本提问数据,用以分析模块对输入文本长度进行分析,将文本提问数据与历史数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,将文本提问数据进行预处理,提高匹配答案的精准性,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够快速精准地筛选出相似度高的答案数据,输出至所述问答模块。

Description

一种基于人工智能的答题系统
技术领域
本发明涉及线上答题系统技术领域,尤其涉及一种基于人工智能的答题系统。
背景技术
问答系统不仅能用自然语言句子提问,还能为用户直接返回所需的答案,而不是相关的网页。显然,问答系统能更好地表达用户的信息需求,同时也能更有效地满足用户的信息需求;问答系统适于通过分析问题并在数据库中找到答案来提供问题的答案;因此,问答系统的框架可以被视为类似于搜索引擎的框架;随着互联网的普及,互联网上的信息越来越丰富,人们能够通过搜索引擎方便地得到自己想要的各种信息;但是搜索引擎存在很多不足,主要由于返回结果太多,导致用户很难快速准确地定位到所需的信息,且搜索引擎的技术基础,即关键字匹配,只关注语言的语法形式,没有涉及语义,同时用户采用简单的查询词很难准确地表达信息需求,使得检索效果一般。
中国专利公开号:CN114144774A,公开了一种问答系统,其技术点是通过分析不正确答案及不正确分类,相应地修改问答系统的算法或算法选择过程;由此可见,现有答题系统技术中,若系统本身语料库不足或低质量标签会导致不准确的返回结果,同时由于关键字匹配,只关注语言的语法形式,没有涉及语义,导致很难快速准确地匹配到所需的答案信息,且缺乏记录以前输入的问题信息,并统计同一问题信息的搜索频率。
发明内容
为此,本发明提供一种基于人工智能的答题系统,用以克服现有技术中无法根据原始数据库、历史数据库以及关键词数据库快速准确地匹配到所需的答案数据的问题。
为实现上述目的,本发明提供一种基于人工智能的答题系统,包括,
采集模块,其与外部的若干云平台相连,用以在各云平台内提取行业相关数据,所述采集模块包括原始数据库、历史数据库以及关键词数据库,所述原始数据库用以储存采集模块在各云平台内提取行业相关数据,所述历史数据库用以储存历史问答数据项,历史问答数据项包括历史提问数据、对应的历史答案数据、对应的历史问答次数以及对应的提问文本长度,所述关键词数据库用以储存若干行业关键词;
问答模块,其与外部的客户端相连,用以将外部客户端输入的提问数据转化为文本提问数据,所述问答模块还能够输出答案数据以及错误问题提示;
分析模块,其与所述采集模块以及所述问答模块分别相连;所述分析模块用以通过对输入文本长度进行判定,将文本提问数据与历史数据库、原始数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够选择答案数据输出至所述问答模块。
进一步地,所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度,根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度,在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时,分析模块将获取所述问答模块转化的文本提问数据的输入文本长度,根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定,
若输入文本长度小于第一预设文本长度,所述分析模块将在所述关键词数据库中对当前文本提问数据进行匹配,以确定是否将错误问题提示输出至所述问答模块;
若输入文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若输入文本长度大于第二预设文本长度,所述分析模块将对当前的文本提问数据进行拆分与合并,将文本提问数据输入文本长度调整至不超出第二预设文本长度。
进一步地,所述分析模块能够在输入文本长度小于第一预设文本长度时,根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配,
若文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项时,所述分析模块将获取匹配项对应的行业关键词,并根据匹配项对应的行业关键词在所述历史数据库中进行问题匹配;
若文本提问数据在所述关键词数据库中储存的各行业关键词中不存在匹配项时,所述分析模块判定当前的文本提问数据输入无效,并将错误问题提示输出至所述问答模块。
进一步地,所述分析模块在第一预设条件下时,根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配,选取包含该行业关键词的各历史提问数据作为待选择数据,并对待选择数据的数量进行判定,
若待选择数据的数量为零,所述分析模块判定所述历史数据库中暂无匹配项对应的行业关键词对应的历史问答数据项,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若待选择数据的数量不为零,所述分析模块判定所述历史数据库中存在匹配项对应的行业关键词对应的历史问答数据项,分析模块将对各待选择数据对应的历史问答次数进行判定,以确定是否输出对应的历史答案数据;
其中,第一预设条件为输入文本长度小于第一预设文本长度且文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项。
进一步地,所述分析模块内设置有模糊匹配最小问答次数,分析模块能够获取各待选择数据对应的历史问答次数,并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比,
若各待选择数据对应的历史问答次数均低于模糊匹配最小问答次数,所述分析模块判定各待选择数据均不符合答案输出标准,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若各待选择数据中存在历史问答次数不低于模糊匹配最小问答次数的各待选择数据,所述分析模块将提取历史问答次数不低于模糊匹配最小问答次数的各待选择数据对应的历史答案数据输出至问答模块,并按历史问答次数由高到低进行排序。
进一步地,所述分析模块在判定输入文本长度大于第二预设文本长度时,将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取,并将从文本提问数据提取出的各行业关键词进行合并,形成修正后的文本提问数据,分析模块获取修正后的文本提问数据的修正文本长度,并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比,
若修正文本长度小于第一预设文本长度,所述分析模块判定修正完成,将在所述关键词数据库中对修正后的文本提问数据进行匹配,以确定是否将错误问题提示输出至所述问答模块;
若修正文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块判定修正完成,将修正后的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若修正文本长度大于第二预设文本长度,所述分析模块判定修正后的文本提问数据的文本长度仍超出第二预设文本长度,分析模块将修正后的文本提问数据在所述原始数据库中进行答案提取。
进一步地,所述分析模块内设置有选取相似度,分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时,将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据,并对选取的候选数据的数量进行判定,
若选取的候选数据的数量为零,所述分析模块判定当前的文本提问数据与所述历史数据库中的各历史提问数据的实时相似度均小于选取相似度,将当前的文本提问数据在所述原始数据库中进行答案提取。
若选取的候选数据的数量等于1,所述分析模块判定当前的文本提问数据与所述历史数据库中的唯一历史提问数据的实时相似度大于或等于选取相似度,分析模块将该候选数据对应的历史答案数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
若选取的候选数据的数量大于1,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,分析模块将分别提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,并根据标准差异词占比依次分别对各差异词占比进行判定,以确定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
其中,实时相似度为文本提问数据中与任意一历史提问数据中相同的词占文本提问数据中总词数的占比;
差异词占比为一历史提问数据中与文本提问数据不同的词占该历史提问数据总词数的比值。
进一步地,所述分析模块内设置有标准差异词占比,当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,计算出对应的若干差异词占比,并根据标准差异词占比依次分别对各差异词占比进行判定,
若存在差异词占比小于或等于标准差异词占比,将对应的若干候选数据作为答案进行输出,根据对应的历史回答次数对若干候选数据进行排序,并将对应的问答数据项中的历史问答次数更新;
若差异词占比均大于标准差异词占比,在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出,以及选取差异词占比最小候选数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
其中,差异词占比为选取的一候选数据对应的一历史提问数据的差异词与该历史提问数据中总词数的比值。
进一步地,所述分析模块内设置有标准语义相似度,所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时,将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算,并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度,并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。
进一步地,所述分析模块能够对选取出的若干答案文本进行对比整合,将各答案文本以标点符合拆分为若干答案数据项,并将各答案文本内对应的答案数据项进行判定,
若各答案文本内存在若干相同的答案数据项时,将在相同的答案数据项中保留其中一答案数据项,并将其他相同答案数据项删除;
若各答案文本内不存在相同的答案数据项时,则不对任意一答案数据项删除;
所述分析模块将各答案文本内保留的各答案数据项进行整合,生成答案数据输出至所述问答模块。
与现有技术相比,本发明的有益效果在于,通过设置采集模块,将行业内的各个云平台数据进行抽取,建设原始数据库,将历史问答信息进行储存,用以分析模块随时选取历史提问数据与文本提问数据对比,通过设置问答模块,将输入的提问数据为非文本数据时,转化为文本提问数据,用以分析模块对输入文本长度进行分析,将文本提问数据与历史数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,将文本提问数据进行预处理,提高匹配答案的精准性,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够选择答案数据输出至所述问答模块,筛选出相似度高的答案数据,快速精准的输出答案数据。
进一步地,第一预设文本长度根据历史数据库中各提问文本长度中字符长度最小的文本长度设定,小于其中字符长度最小的文本长度,可以设定为字符长度最小的文本长度的0.9倍,第二预设文本长度表示历史数据库中各提问文本长度中字符长度最大的文本长度,大于其中字符长度最大的文本长度,可以设定为字符长度最大的文本长度的1.1倍。
通过获取文本提问数据的输入文本长度,以对文本提问数据进行预处理,若分析模块判定输入文本长度小于第一预设文本长度,表示输入文本长度比历史数据库中的各提问文本长度较小,将直接提取关键词进行分析,即在关键词数据库中储存的各行业关键词提取出行业关键词进行判定,若分析模块判定输入文本长度在第一预设文本长度与第二预设文本长度之间,表示输入文本长度与历史数据库中的提问文本长度非常接近,将通过实时相似度分析,若分析模块判定输入文本长度大于第二预设文本长度,表示输入文本长度比历史数据库中的各提问文本长度较大,将根据关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取,并将从文本提问数据提取出的各行业关键词进行合并。
尤其,通过分析模块对输入文本长度小于第一预设文本长度的文本提问数据在关键词数据库中进行匹配,选择出匹配的行业关键词,通过行业关键词与历史数据库的历史提问数据进行匹配,保障答案数据匹配精准。
进一步地,通过将行业关键词与历史数据库的历史提问数据匹配的各历史提问数据作为待选择数据,并对待选择数据的数量进行判定,若分析模块判定待选择数据的数量为零,表示在各历史提问数据中未能选择出匹配的答案数据,将在原始数据库中进行选择,若分析模块判定待选择数据的数量不为零,将根据历史问答次数选择答案数据,即选择回答次数多的答案作为答案数据输出。
尤其,模糊匹配最小问答次数表示设定的问答频次,代表问答频次较高,根据系统生成时间、系统的历史问答次数设定;通过设置模糊匹配最小问答次数,选择出问答次数高的待选择数据,问答次数越高,更系统的反应实际相关度高的答案数据,从而预测并快速筛选出频次高的待选择数据对应的历史答案数据作为答案数据输出。
进一步地,通过分析模块将输入文本长度大于第二预设文本长度的文本提问数据与关键词数据库中储存的各行业关键词进行匹配,提取出有效信息,即行业关键词,避免文本提问数据过长导致的匹配精度不高的问题,并将各行业关键词并进行合并,形成修正后的文本提问数据,对其进一步判定。
尤其,选取相似度表示设定的文本间构成文本的词的相同程度,代表文本间的相同程度很高,一般设定为90%-95%,若分析模块判定实时相似度大于等于选取相似度,则表示文本提问数据中的词与对应的各历史提问数据中的词相同部分占比很高。
进一步地,标准语义相似度表示设定的根据两个文本中词语与词语间的相似度,构成的文本相似度;通过设置有标准语义相似度,分析模块在历史数据库中选择与行业关键词、修正后的文本提问数据、当前的文本提问数据相似的全部文本集合,将通过对比整合确定最终输出的答案数据,保障匹配的答案的精准度。
进一步地,通过分析模块将选择出的全部文本集合进行对比,将相同的文本合并,即在相同的文本中选择任一文本,并与其他不同的文本进行整合,将整合后的文本作为答案数据输出,既精简输出的文本,又保障输出的文本完整。
附图说明
图1为本发明实施例基于人工智能的答题系统的示意图;
图2为本发明实施例基于人工智能的答题系统中采集模块的连接示意图;
图3为本发明实施例基于人工智能的答题系统中历史问答数据项的连接示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1、图2以及图3所示,本发明提供一种基于人工智能的答题系统,包括,采集模块、问答模块以及分析模块,其中,
采集模块,其与外部的若干云平台相连,用以在各云平台内提取行业相关数据,所述采集模块包括原始数据库、历史数据库以及关键词数据库,所述原始数据库用以储存采集模块在各云平台内提取行业相关数据,所述历史数据库用以储存历史问答数据项,历史问答数据项包括历史提问数据、对应的历史答案数据、对应的历史问答次数以及对应的提问文本长度,所述关键词数据库用以储存若干行业关键词;
问答模块,其与外部的客户端相连,用以将外部客户端输入的提问数据转化为文本提问数据,所述问答模块还能够输出答案数据以及错误问题提示;
分析模块,其与所述采集模块以及所述问答模块分别相连;所述分析模块用以通过对输入文本长度进行判定,将文本提问数据与历史数据库、原始数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够选择答案数据输出至所述问答模块。
通过设置采集模块,将行业内的各个云平台数据进行抽取,建设原始数据库,将历史问答信息进行储存,用以分析模块随时选取历史提问数据与文本提问数据对比,通过设置问答模块,将输入的提问数据为非文本数据时,转化为文本提问数据,用以分析模块对输入文本长度进行分析,将文本提问数据与历史数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,将文本提问数据进行预处理,提高匹配答案的精准性,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够选择答案数据输出至所述问答模块,筛选出相似度高的答案数据,快速精准的输出答案数据。
具体而言,所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度,根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度,在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时,分析模块将获取所述问答模块转化的文本提问数据的输入文本长度,根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定,
若输入文本长度小于第一预设文本长度,所述分析模块将在所述关键词数据库中对当前文本提问数据进行匹配,以确定是否将错误问题输出至所述问答模块;
若输入文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若输入文本长度大于第二预设文本长度,所述分析模块将对当前的文本提问数据进行拆分与合并,将文本提问数据输入文本长度调整至不超出第二预设文本长度。
第一预设文本长度根据历史数据库中各提问文本长度中字符长度最小的文本长度设定,小于其中字符长度最小的文本长度,可以设定为字符长度最小的文本长度的0.9倍,第二预设文本长度表示历史数据库中各提问文本长度中字符长度最大的文本长度,大于其中字符长度最大的文本长度,可以设定为字符长度最大的文本长度的1.1倍。
通过获取文本提问数据的输入文本长度,以对文本提问数据进行预处理,若分析模块判定输入文本长度小于第一预设文本长度,表示输入文本长度比历史数据库中的各提问文本长度较小,将直接提取关键词进行分析,即在关键词数据库中储存的各行业关键词提取出行业关键词进行判定,若分析模块判定输入文本长度在第一预设文本长度与第二预设文本长度之间,表示输入文本长度与历史数据库中的提问文本长度非常接近,将通过实时相似度分析,若分析模块判定输入文本长度大于第二预设文本长度,表示输入文本长度比历史数据库中的各提问文本长度较大,将根据关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取,并将从文本提问数据提取出的各行业关键词进行合并。
具体而言,所述分析模块能够在输入文本长度小于第一预设文本长度时,根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配,
若文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项时,所述分析模块将获取匹配项对应的行业关键词,并根据匹配项对应的行业关键词在所述历史数据库中进行问题匹配;
若文本提问数据在所述关键词数据库中储存的各行业关键词中不存在匹配项时,所述分析模块判定当前的文本提问数据输入无效,并将错误问题提示输出至所述问答模块。
通过分析模块对输入文本长度小于第一预设文本长度的文本提问数据在关键词数据库中进行匹配,选择出匹配的行业关键词,通过行业关键词与历史数据库的历史提问数据进行匹配,保障答案数据匹配精准。
具体而言,所述分析模块在第一预设条件下时,根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配,选取包含该行业关键词的各历史提问数据作为待选择数据,并对待选择数据的数量进行判定,
若待选择数据的数量为零,所述分析模块判定所述历史数据库中暂无匹配项对应的行业关键词对应的历史问答数据项,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若待选择数据的数量不为零,所述分析模块判定所述历史数据库中存在匹配项对应的行业关键词对应的历史问答数据项,分析模块将对各待选择数据对应的历史问答次数进行判定,以确定是否输出对应的历史答案数据;
其中,第一预设条件为输入文本长度小于第一预设文本长度且文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项。
通过将行业关键词与历史数据库的历史提问数据匹配的各历史提问数据作为待选择数据,并对待选择数据的数量进行判定,若分析模块判定待选择数据的数量为零,表示在各历史提问数据中未能选择出匹配的答案数据,将在原始数据库中进行选择,若分析模块判定待选择数据的数量不为零,将根据历史问答次数选择答案数据,即选择回答次数多的答案作为答案数据输出。
具体而言,所述分析模块内设置有模糊匹配最小问答次数,分析模块能够获取各待选择数据对应的历史问答次数,并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比,
若各待选择数据对应的历史问答次数均低于模糊匹配最小问答次数,所述分析模块判定各待选择数据均不符合答案输出标准,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若各待选择数据中存在历史问答次数不低于模糊匹配最小问答次数的各待选择数据,所述分析模块将提取历史问答次数不低于模糊匹配最小问答次数的各待选择数据对应的历史答案数据输出至问答模块,并按历史问答次数由高到低进行排序。
模糊匹配最小问答次数表示设定的问答频次,代表问答频次较高,根据系统生成时间、系统的历史问答次数设定;通过设置模糊匹配最小问答次数,选择出问答次数高的待选择数据,问答次数越高,更系统的反应实际相关度高的答案数据,从而预测并快速筛选出频次高的待选择数据对应的历史答案数据作为答案数据输出。
在本实施例中,系统还具备接收评价值的功能,外部的客户端将对输出的序列答案数据进行准确度评分,系统能够根据反馈的准确度评分统计并记录准确度评分值。
具体而言,所述分析模块在判定输入文本长度大于第二预设文本长度时,将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取,并将从文本提问数据提取出的各行业关键词进行合并,形成修正后的文本提问数据,分析模块获取修正后的文本提问数据的修正文本长度,并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比,
若修正文本长度小于第一预设文本长度,所述分析模块判定修正完成,将在所述关键词数据库中对修正后的文本提问数据进行匹配,以确定是否将错误问题提示输出至所述问答模块;
若修正文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块判定修正完成,将修正后的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若修正文本长度大于第二预设文本长度,所述分析模块判定修正后的文本提问数据的文本长度仍超出第二预设文本长度,分析模块将修正后的文本提问数据在所述原始数据库中进行答案提取。
通过分析模块将输入文本长度大于第二预设文本长度的文本提问数据与关键词数据库中储存的各行业关键词进行匹配,提取出有效信息,即行业关键词,避免文本提问数据过长导致的匹配精度不高的问题,并将各行业关键词并进行合并,形成修正后的文本提问数据,对其进一步判定。
具体而言,所述分析模块内设置有选取相似度,分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时,将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据,并对选取的候选数据的数量进行判定,
若选取的候选数据的数量为零,所述分析模块判定当前的文本提问数据与所述历史数据库中的各历史提问数据的实时相似度均小于选取相似度,将当前的文本提问数据在所述原始数据库中进行答案提取。
若选取的候选数据的数量等于1,所述分析模块判定当前的文本提问数据与所述历史数据库中的唯一历史提问数据的实时相似度大于或等于选取相似度,分析模块将该候选数据对应的历史答案数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
若选取的候选数据的数量大于1,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,分析模块将分别提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,并根据标准差异词占比依次分别对各差异词占比进行判定,以确定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
其中,实时相似度为文本提问数据中与任意一历史提问数据中相同的词占文本提问数据中总词数的占比;
差异词占比为一历史提问数据中与文本提问数据不同的词数占该历史提问数据总词数的比值。
选取相似度表示设定的文本间构成文本的词的相同程度,代表文本间的相同程度很高,一般设定为90%-95%,若分析模块判定实时相似度大于等于选取相似度,则表示文本提问数据中的词与对应的各历史提问数据中的词相同部分占比很高。
具体而言,所述分析模块内设置有标准差异词占比,当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,计算出对应的若干差异词占比,并根据标准差异词占比依次分别对各差异词占比进行判定,
若存在差异词占比小于或等于标准差异词占比,将对应的若干候选数据作为答案进行输出,根据对应的历史回答次数对若干候选数据进行排序,并将对应的问答数据项中的历史问答次数更新;
若差异词占比均大于标准差异词占比,在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出,以及选取差异词占比最小候选数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
其中,差异词占比为选取的一候选数据对应的一历史提问数据的差异词与该历史提问数据中总词数的比值。
标准差异词占比表示设定的历史提问数据与文本提问数据的不同的词数与历史提问数据总词数的比值,此比值代表不同的词的数量很少不影响对整个句子的理解;
通过分析模块内设置有标准差异词占比,分析模块根据词语与词语的相似度,确定句子的相似度,若分析模块判定实时差异词占比小于等于标准差异词占比,表示不同的词数比重较小,即对应的历史提问数据与文本提问数据相似度很高,将对应的若干候选数据作为答案进行输出,若分析模块判定实时差异词占比大于标准差异词占比,表示在历史提问数据中不同的词数比重较大,将在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出,以及选取差异词占比最小候选数据作为答案进行输出。
具体而言,所述分析模块内设置有标准语义相似度,所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时,将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算,并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度,并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。
在本实施例中,语义理解计算方法采用利用语义词典进行计算,基于同义词词林的结构,判断需进行相似度计算的两个词汇所对应的编码在哪一层分支,根据两个义项的语义距离,计算出相似度,距离越近,相似度越高。
标准语义相似度表示设定的根据两个文本中词语与词语间的相似度,构成的文本相似度;通过设置有标准语义相似度,分析模块在历史数据库中选择与行业关键词、修正后的文本提问数据、当前的文本提问数据相似的全部文本集合,将通过对比整合确定最终输出的答案数据,保障匹配的答案的精准度。
具体而言,所述分析模块能够对选取出的若干答案文本进行对比整合,将各答案文本以标点符合拆分为若干答案数据项,并将各答案文本内对应的答案数据项进行判定,
若各答案文本内存在若干相同的答案数据项时,将在相同的答案数据项中保留其中一答案数据项,并将其他相同答案数据项删除;
若各答案文本内不存在相同的答案数据项时,则不对任意一答案数据项删除;
所述分析模块将各答案文本内保留的各答案数据项进行整合,生成答案数据输出至所述问答模块。
通过分析模块将选择出的全部文本集合进行对比,将相同的文本合并,即在相同的文本中选择任一文本,并与其他不同的文本进行整合,将整合后的文本作为答案数据输出,既精简输出的文本,又保障输出的文本完整。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的答题系统,其特征在于,包括,
采集模块,其与外部的若干云平台相连,用以在各云平台内提取行业相关数据,所述采集模块包括原始数据库、历史数据库以及关键词数据库,所述原始数据库用以储存采集模块在各云平台内提取行业相关数据,所述历史数据库用以储存历史问答数据项,历史问答数据项包括历史提问数据、对应的历史答案数据、对应的历史问答次数以及对应的提问文本长度,所述关键词数据库用以储存若干行业关键词;
问答模块,其与外部的客户端相连,用以将外部客户端输入的提问数据转化为文本提问数据,所述问答模块还能够输出答案数据以及错误问题提示;
分析模块,其与所述采集模块以及所述问答模块分别相连;所述分析模块用以通过对输入文本长度进行判定,将文本提问数据与历史数据库、原始数据库或关键词数据库进行匹配,选出匹配项对应的行业关键词、当前的文本提问数据或修正后的文本提问数据,并将行业关键词、当前的文本提问数据或修正后的文本提问数据通过在原始数据库中进行答案提取,或在历史数据库中的历史提问数据中进行匹配,能够选择答案数据输出至所述问答模块。
2.根据权利要求1所述的基于人工智能的答题系统,其特征在于,所述分析模块根据在各所述提问文本长度中选取长度最小的提问文本长度设定第一预设文本长度,根据在各所述提问文本长度中选取长度最大的提问文本长度设定第二预设文本长度,在所述问答模块将外部客户端输入的提问数据转化为文本提问数据时,分析模块将获取所述问答模块转化的文本提问数据的输入文本长度,根据第一预设文本长度与第二预设文本长度对输入文本长度进行判定,
若输入文本长度小于第一预设文本长度,所述分析模块将在所述关键词数据库中对当前文本提问数据进行匹配,以确定是否将错误问题提示输出至所述问答模块;
若输入文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若输入文本长度大于第二预设文本长度,所述分析模块将对当前的文本提问数据进行拆分与合并,将文本提问数据输入文本长度调整至不超出第二预设文本长度。
3.根据权利要求2所述的基于人工智能的答题系统,其特征在于,所述分析模块能够在输入文本长度小于第一预设文本长度时,根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行匹配,
若文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项时,所述分析模块将获取匹配项对应的行业关键词,并根据匹配项对应的行业关键词在所述历史数据库中进行问题匹配;
若文本提问数据在所述关键词数据库中储存的各行业关键词中不存在匹配项时,所述分析模块判定当前的文本提问数据输入无效,并将错误问题提示输出至所述问答模块。
4.根据权利要求3所述的基于人工智能的答题系统,其特征在于,所述分析模块在第一预设条件下时,根据匹配项对应的行业关键词在所述历史数据库中的各历史提问数据中进行匹配,选取包含该行业关键词的各历史提问数据作为待选择数据,并对待选择数据的数量进行判定,
若待选择数据的数量为零,所述分析模块判定所述历史数据库中暂无匹配项对应的行业关键词对应的历史问答数据项,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若待选择数据的数量不为零,所述分析模块判定所述历史数据库中存在匹配项对应的行业关键词对应的历史问答数据项,分析模块将对各待选择数据对应的历史问答次数进行判定,以确定是否输出对应的历史答案数据;
其中,第一预设条件为输入文本长度小于第一预设文本长度且文本提问数据在所述关键词数据库中储存的各行业关键词中存在匹配项。
5.根据权利要求4所述的基于人工智能的答题系统,其特征在于,所述分析模块内设置有模糊匹配最小问答次数,分析模块能够获取各待选择数据对应的历史问答次数,并将获取到的各历史问答次数分别与模糊匹配最小问答次数进行对比,
若各待选择数据对应的历史问答次数均低于模糊匹配最小问答次数,所述分析模块判定各待选择数据均不符合答案输出标准,分析模块将根据匹配项对应的行业关键词在所述原始数据库中进行答案提取;
若各待选择数据中存在历史问答次数不低于模糊匹配最小问答次数的各待选择数据,所述分析模块将提取历史问答次数不低于模糊匹配最小问答次数的各待选择数据对应的历史答案数据输出至问答模块,并按历史问答次数由高到低进行排序。
6.根据权利要求2所述的基于人工智能的答题系统,其特征在于,所述分析模块在判定输入文本长度大于第二预设文本长度时,将根据所述关键词数据库中储存的各行业关键词对当前的文本提问数据进行提取,并将从文本提问数据提取出的各行业关键词进行合并,形成修正后的文本提问数据,分析模块获取修正后的文本提问数据的修正文本长度,并将修正文本长度与第一预设文本长度和第二预设文本长度进行对比,
若修正文本长度小于第一预设文本长度,所述分析模块判定修正完成,将在所述关键词数据库中对修正后的文本提问数据进行匹配,以确定是否将错误问题提示输出至所述问答模块;
若修正文本长度在第一预设文本长度与第二预设文本长度之间,所述分析模块判定修正完成,将修正后的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,以判定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
若修正文本长度大于第二预设文本长度,所述分析模块判定修正后的文本提问数据的文本长度仍超出第二预设文本长度,分析模块将修正后的文本提问数据在所述原始数据库中进行答案提取。
7.根据权利要求2所述的基于人工智能的答题系统,其特征在于,所述分析模块内设置有选取相似度,分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间时,将当前的文本提问数据分别与所述历史数据库中的各历史提问数据进行实时相似度的计算,选取实时相似度大于等于选取相似度对应的各历史提问数据作为候选数据,并对选取的候选数据的数量进行判定,
若选取的候选数据的数量为零,所述分析模块判定当前的文本提问数据与所述历史数据库中的各历史提问数据的实时相似度均小于选取相似度,将当前的文本提问数据在所述原始数据库中进行答案提取;
若选取的候选数据的数量等于1,所述分析模块判定当前的文本提问数据与所述历史数据库中的唯一历史提问数据的实时相似度大于或等于选取相似度,分析模块将该候选数据对应的历史答案数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
若选取的候选数据的数量大于1,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,分析模块将分别提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,并根据标准差异词占比依次分别对各差异词占比进行判定,以确定是否在所述历史数据库中选取对应的历史问答数据项进行答案的输出;
其中,实时相似度为文本提问数据中与任意一历史提问数据中相同的词占文本提问数据中总词数的占比;
差异词占比为一历史提问数据中与文本提问数据不同的词占该历史提问数据总词数的比值。
8.根据权利要求7所述的基于人工智能的答题系统,其特征在于,所述分析模块内设置有标准差异词占比,当分析模块在输入文本长度在第一预设文本长度与第二预设文本长度之间且选取的候选数据的数量大于1时,分析模块判定当前的文本提问数据与所述历史数据库中的若干历史提问数据的实时相似度大于或等于选取相似度,提取当前的文本提问数据与各选取的候选数据对应的各历史提问数据的差异词,计算出对应的若干差异词占比,并根据标准差异词占比依次分别对各差异词占比进行判定,
若存在差异词占比小于或等于标准差异词占比,将对应的若干候选数据作为答案进行输出,根据对应的历史回答次数对若干候选数据进行排序,并将对应的问答数据项中的历史问答次数更新;
若差异词占比均大于标准差异词占比,在若干候选数据中选取实时相似度最大的候选数据作为答案进行输出,以及选取差异词占比最小候选数据作为答案进行输出,并将对应的问答数据项中的历史问答次数更新;
其中,差异词占比为选取的一候选数据对应的一历史提问数据的差异词与该历史提问数据中总词数的比值。
9.根据权利要求8所述的基于人工智能的答题系统,其特征在于,所述分析模块内设置有标准语义相似度,所述分析模块在根据匹配项对应的行业关键词、修正后的文本提问数据或当前的文本提问数据在所述原始数据库中进行答案提取时,将行业关键词、修正后的文本提问数据或当前的文本提问数据与所述原始数据库中的行业相关数据进行语义理解计算,并生成行业关键词、修正后的文本提问数据或当前的文本提问数据与任意一所述原始数据库中的行业相关数据的语义相似度,并选取语义相似度大于或等于标准语义相似度对应的行业相关数据作为若干答案文本。
10.根据权利要求9所述的基于人工智能的答题系统,其特征在于,所述分析模块能够对选取出的若干答案文本进行对比整合,将各答案文本以标点符合拆分为若干答案数据项,并将各答案文本内对应的答案数据项进行判定,
若各答案文本内存在若干相同的答案数据项时,将在相同的答案数据项中保留其中一答案数据项,并将其他相同答案数据项删除;
若各答案文本内不存在相同的答案数据项时,则不对任意一答案数据项删除;
所述分析模块将各答案文本内保留的各答案数据项进行整合,生成答案数据输出至所述问答模块。
CN202311725242.2A 2023-12-15 2023-12-15 一种基于人工智能的答题系统 Active CN117407515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311725242.2A CN117407515B (zh) 2023-12-15 2023-12-15 一种基于人工智能的答题系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311725242.2A CN117407515B (zh) 2023-12-15 2023-12-15 一种基于人工智能的答题系统

Publications (2)

Publication Number Publication Date
CN117407515A true CN117407515A (zh) 2024-01-16
CN117407515B CN117407515B (zh) 2024-04-30

Family

ID=89498411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311725242.2A Active CN117407515B (zh) 2023-12-15 2023-12-15 一种基于人工智能的答题系统

Country Status (1)

Country Link
CN (1) CN117407515B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117609476A (zh) * 2024-01-19 2024-02-27 北京十环信息有限公司 一种基于人工智能的公共服务数据分析系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257512A (zh) * 2008-02-02 2008-09-03 黄伟才 用于问答系统的问答匹配方法及问答方法和系统
US20130304730A1 (en) * 2011-01-18 2013-11-14 Google Inc. Automated answers to online questions
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
CN110727779A (zh) * 2019-10-16 2020-01-24 信雅达系统工程股份有限公司 基于多模型融合的问答方法及系统
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
CN112036906A (zh) * 2020-07-31 2020-12-04 苏宁金融科技(南京)有限公司 一种数据处理方法、装置、设备
CN112307164A (zh) * 2020-10-15 2021-02-02 江苏常熟农村商业银行股份有限公司 信息推荐方法、装置、计算机设备和存储介质
CN112948546A (zh) * 2021-01-15 2021-06-11 中国科学院空天信息创新研究院 面向多源异构数据源的智能问答方法及装置
CN116127015A (zh) * 2023-01-04 2023-05-16 北京面壁智能科技有限责任公司 基于人工智能自适应的nlp大模型分析系统
CN117093686A (zh) * 2023-08-01 2023-11-21 中移(杭州)信息技术有限公司 智能问答匹配方法、装置、终端及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101257512A (zh) * 2008-02-02 2008-09-03 黄伟才 用于问答系统的问答匹配方法及问答方法和系统
US20130304730A1 (en) * 2011-01-18 2013-11-14 Google Inc. Automated answers to online questions
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
CN110727779A (zh) * 2019-10-16 2020-01-24 信雅达系统工程股份有限公司 基于多模型融合的问答方法及系统
CN112036906A (zh) * 2020-07-31 2020-12-04 苏宁金融科技(南京)有限公司 一种数据处理方法、装置、设备
CN112307164A (zh) * 2020-10-15 2021-02-02 江苏常熟农村商业银行股份有限公司 信息推荐方法、装置、计算机设备和存储介质
CN112948546A (zh) * 2021-01-15 2021-06-11 中国科学院空天信息创新研究院 面向多源异构数据源的智能问答方法及装置
CN116127015A (zh) * 2023-01-04 2023-05-16 北京面壁智能科技有限责任公司 基于人工智能自适应的nlp大模型分析系统
CN117093686A (zh) * 2023-08-01 2023-11-21 中移(杭州)信息技术有限公司 智能问答匹配方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GOMES, J., DE MELLO, R.C., ET AL: "A study of approaches to answering complex questions over knowledge bases", KNOWLEDGE AND INFORMATION SYSTEMS, vol. 64, 20 August 2022 (2022-08-20), pages 2849 - 2881 *
于凤;郑雨晴;郑德权;赵姗姗;: "面向选择类题型求解的相似问题发现研究", 计算机工程与应用, no. 15, 3 August 2017 (2017-08-03), pages 120 - 125 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117609476A (zh) * 2024-01-19 2024-02-27 北京十环信息有限公司 一种基于人工智能的公共服务数据分析系统
CN117609476B (zh) * 2024-01-19 2024-04-12 北京十环信息有限公司 一种基于人工智能的公共服务数据分析系统

Also Published As

Publication number Publication date
CN117407515B (zh) 2024-04-30

Similar Documents

Publication Publication Date Title
CN109582972B (zh) 一种基于自然语言识别的光学字符识别纠错方法
US10503828B2 (en) System and method for answering natural language question
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
US8131539B2 (en) Search-based word segmentation method and device for language without word boundary tag
Sakuntharaj et al. Use of a novel hash-table for speeding-up suggestions for misspelt Tamil words
Sakuntharaj et al. A novel hybrid approach to detect and correct spelling in Tamil text
CN112417102B (zh) 一种语音查询方法、装置、服务器和可读存储介质
CN110347787B (zh) 一种基于ai辅助面试场景的面试方法、装置及终端设备
EP1927927A2 (en) Speech recognition training method for audio and video file indexing on a search engine
CN117407515B (zh) 一种基于人工智能的答题系统
CN109840255B (zh) 答复文本生成方法、装置、设备及存储介质
CN111666764B (zh) 一种基于XLNet的自动摘要方法与装置
CN114036930A (zh) 文本纠错方法、装置、设备及计算机可读介质
CN111488466A (zh) 中文带标记错误语料生成方法、计算装置和存储介质
Fahda et al. A statistical and rule-based spelling and grammar checker for Indonesian text
US8296319B2 (en) Information retrieving apparatus, information retrieving method, information retrieving program, and recording medium on which information retrieving program is recorded
CN112445894A (zh) 基于人工智能的商务智能系统及其分析方法
CN112447172B (zh) 一种语音识别文本的质量提升方法和装置
CN112380848B (zh) 文本生成方法、装置、设备及存储介质
US20130013604A1 (en) Method and System for Making Document Module
JPH11328317A (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN113157869A (zh) 一种文档精准定位检索方法及系统
Nejja et al. The context in automatic spell correction
CN114970554A (zh) 一种基于自然语言处理的文档校验方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant