CN116805002A - 问答方法、问答装置、设备及存储介质 - Google Patents
问答方法、问答装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116805002A CN116805002A CN202310801067.4A CN202310801067A CN116805002A CN 116805002 A CN116805002 A CN 116805002A CN 202310801067 A CN202310801067 A CN 202310801067A CN 116805002 A CN116805002 A CN 116805002A
- Authority
- CN
- China
- Prior art keywords
- target
- knowledge
- feature vector
- field
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 107
- 238000013136 deep learning model Methods 0.000 claims abstract description 61
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims description 62
- 230000006870 function Effects 0.000 claims description 25
- 238000004140 cleaning Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013135 deep learning Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 235000005911 diet Nutrition 0.000 abstract description 29
- 230000037213 diet Effects 0.000 abstract description 21
- 238000004422 calculation algorithm Methods 0.000 description 12
- 230000000378 dietary effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000006286 nutrient intake Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种融合多知识领域的问答方法、装置、设备及存储介质。方法应用于FAQ系统,包括:获取目标问题,目标问题有关第一知识领域和第二知识领域;对目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,第一特征向量对应第一知识领域,第二特征向量对应第二知识领域;通过目标深度学习模型同时对第一特征向量以及第二特征向量进行分析,得到目标问题对应的目标候选问题,目标深度学习模型包括第一知识领域和第二知识领域的目标知识库;基于目标候选问题,从目标知识库中确定目标答案。本申请实施例旨在通过目标深度学习模型对结合医疗领域和饮食领域的问题进行分析,进而通过目标知识库查询到较为准确的答案。
Description
技术领域
本申请涉及医疗健康领域,尤其涉及一种融合多知识领域的问答方法、问答装置、计算机设备及计算机可读存储介质。
背景技术
在医疗领域中,对于医生而言,当遇到问题时可能需要通过FAQ(FrequentlyAsked Questions)系统查询到对应的答案。相关技术中,对于业务范围广、用户基数大、对话方式复杂的医疗领域,传统FAQ系统的FAQ知识库构建过程效率较低,因此基于FAQ知识库输出问题对应的答案的效率也较慢,且答案与问题的匹配程度也不高。
对于可能结合了医疗领域以及饮食领域等多领域的问题来说,传统FAQ系统通常无法基于多个领域的问题得到较为准确的答案,且容易忽略了获取的用户问题与FAQ知识库中问题的表述形式差异,此外,传统FAQ系统在语言理解、训练效率等方面存在一定瓶颈。
发明内容
本申请提供了一种融合多知识领域的问答方法、问答装置、计算机设备及计算机可读存储介质,旨在通过目标深度学习模型对结合医疗领域和饮食领域的问题进行分析,进而通过目标知识库查询到较为准确的答案。
为实现上述目的,本申请提供一种融合多知识领域的问答方法,所述方法包括:
获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;
对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;
通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;
基于所述目标候选问题,从所述目标知识库中确定目标答案。
为实现上述目的,本申请还提供一种问答装置,包括:
获取模块,所述获取模块用于获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;
特征提取模块,所述特征提取模块用于对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;
分析模块,所述分析模块用于通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;
确定模块,所述确定模块用于基于所述目标候选问题,从所述目标知识库中确定目标答案。
此外,为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的融合多知识领域的问答方法的步骤。
此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的融合多知识领域的问答方法的步骤。
本申请实施例公开的融合多知识领域的问答方法、问答装置、计算机设备及计算机可读存储介质,能够获取关于第一知识领域以及第二知识领域的目标问题,进而对目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量。进一步的,可通过目标深度学习模型同时对第一特征向量以及第二特征向量进行分析,得到目标问题对应的目标候选问题。如此,可基于目标候选问题从目标知识库中确定目标问题对应的目标答案。本申请能够通过目标深度学习模型对结合医疗领域和饮食领域的问题进行分析,以实现更好的理解用户提出的问题,进而能够通过目标知识库对候选问题进行查询,以到较为准确的答案,也即实现了融合了医疗领域以及知识领域问题的问答。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种融合多知识领域的问答方法的场景示意图;
图2是本申请实施例提供的一种融合多知识领域的问答方法的流程示意图;
图3是本申请实施例提供的一种得到目标候选问题的流程示意图;
图4是本申请实施例提供的一种得到目标深度学习模型的流程示意图;
图5是本申请实施例提供的一种得到迭代后的目标深度学习模型的流程示意图;
图6是本申请实施例提供的一种问答装置的示意性框图;
图7是本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
如图1所示,本申请实施例提供的融合多知识领域的问答方法,可以应用于如图1所示的应用环境中。该应用环境中包含有终端设备110和服务器120,其中,终端设备110可以通过网络与服务器120进行通信。具体地,服务器120能够获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;并对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;最后基于所述目标候选问题,从所述目标知识库中确定目标答案,并将所述目标答案发送至终端设备110。其中,服务器120可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参阅图2,图2是本申请实施例提供的一种融合多知识领域的问答方法的流程示意图。其中,该融合多知识领域的问答方法可以应用于FAQ系统,由此实现基于融合多知识领域的目标问题得到较为准确的答案。
如图2所示,该融合多知识领域的问答方法包括步骤S11至步骤S14。
步骤S11:获取目标问题。
其中,目标问题有关第一知识领域和第二知识领域,第一知识领域与第二知识领域分别隶属于不同的知识领域。
需要说明的是,FAQ系统是一个常见问题解答系统,用于提供用户对于特定主题或领域的常见问题的答案。FAQ系统旨在帮助用户快速获取常见问题的解决方案,而无需人工干预。当用户提出问题时,FAQ系统会将其输入与问题库中的问题进行比对,以找到最相关的问题。然后,系统将相应的答案返回给用户,以解决用户的问题。FAQ系统具有以下优点:提供快速的自助解决方案,无需人工干预;能够在任何时间和地点为用户提供信息;减少对客服人员的负担,使其能够专注于更复杂或个性化的问题;可以持续更新和改进问题库,以反映最新的问题和解决方案。因此,本申请可以基于FAQ系统实现融合多知识领域的问答。
进一步的,本申请对于第一知识领域以及第二知识领域对应的知识领域不加以限定,例如第一知识领域为医疗知识领域,第二知识领域为饮食知识领域,本申请以此为例进行说明。
可以理解的,目标问题即融合了医疗知识领域和饮食知识领域的问题,例如该问题可以为:“通过合理的饮食和营养摄入,如何改善慢性炎症相关疾病的症状?”、“哪些食物或营养素对大脑功能和认知能力有积极影响?”等,本申请对此不加以限定。
在本申请实施例中,可获取融合了医疗知识领域和饮食知识领域的问题,目的得到该问题对应的答案,从而实现融合多知识领域的问答。
步骤S12:对目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量。
其中,第一特征向量对应第一知识领域,也即医疗知识领域,第二特征向量对应第二知识领域,也即饮食知识领域。
需要说明的是,特征提取是指从图像或者文本中抽取出特征向量用以表示文本信息。本申请对于融合了医疗知识领域和饮食知识领域的问题进行特征提取的方法不加以限定,例如可以通过词频-逆文档频率算法、word2vec模型、文本频次方法、独热编码算法、互信息等方法实现对融合了医疗知识领域和饮食知识领域的问题进行特征提取操作等,本申请以通过词频-逆文档频率算法实现对融合了医疗知识领域和饮食知识领域的问题进行特征提取为例进行说明。
词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法,是一种用于资讯检索与文本挖掘的常用加权算法,可以用来评估一个词对于一个文档集或语料库中某个文档的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。如果某个词比较少见,但是它在整个文档中多次出现,那么该词很可能就反映了整个文档的特征。因此,可基于词频-逆文档频率算法对融合了医疗知识领域和饮食知识领域的问题进行特征提取操作,得到对应的第一特征向量和第二特征向量。
可选地,对目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,包括:对目标问题进行数据清洗操作,得到数据清洗后的目标问题;对数据清洗后的目标问题进行特征提取操作,得到若干初始特征向量;基于知识领域特征将若干初始特征向量进行分类,得到第一知识领域对应的第一特征向量以及第二知识领域对应的第二特征向量。
其中,数据清洗操作指对融合了医疗知识领域和饮食知识领域的问题进行预处理和过滤,以去除噪音、纠正错误和统一格式,确保数据的一致性和可用性的操作。例如可以包括停用词过滤、格式标准化、以及拼写纠正等,本申请对此不加以限定。
可以理解的,对融合了医疗知识领域和饮食知识领域的问题进行数据清洗操作后,便可得到数据清洗后的问题。如此,能够基于数据清洗后的问题提高后续特征提取的质量以及问题的可理解性。
进一步的,可对数据清洗后的问题进行特征提取操作,得到若干初始特征向量。并基于知识领域特征将每一初始特征向量基于知识领域进行分类,得到医疗知识领域对应的特征向量以及饮食知识领域对应的特征向量。
在本申请实施例中,可融合了医疗知识领域和饮食知识领域的问题进行数据清洗操作,进而分别通过词频-逆文档频率模型、word2vec模型等方式对数据清洗后的问题进行特征提取操作,得到医疗知识领域对应的特征向量以及饮食知识领域对应的特征向量。
步骤S13:通过目标深度学习模型同时对第一特征向量以及第二特征向量进行分析,得到目标问题对应的目标候选问题。
步骤S14:基于目标候选问题,从目标知识库中确定目标答案。
其中,目标深度学习模型包括医疗知识领域和饮食知识领域的目标知识库。
具体的,在得到医疗知识领域对应的特征向量以及饮食知识领域对应的特征向量后,可将其作为模型的输入,输入至目标深度学习模型,从而输出得到对应的候选问题。其中,候选问题为存在于目标知识库,且与目标问题相近的问题。
可选地,目标知识库包括若干候选问题以及每一候选问题对应的答案,基于目标候选问题,从目标知识库中确定目标答案,包括:从目标知识库中查询目标候选问题,并得到目标候选问题对应的答案;将目标候选问题对应的答案确定为目标答案。
可以理解的,在得到候选问题后,可从目标知识库中查询目标候选问题,并得到目标候选问题对应的答案,进而将目标候选问题对应的答案确定为目标答案。如此,实现了得到融合了医疗知识领域和饮食知识领域的问题的答案。
本申请实施例公开的融合多知识领域的问答方法、问答装置、计算机设备及计算机可读存储介质,能够获取关于融合了医疗知识领域以及饮食知识领域的目标问题,进而对目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量。进一步的,可通过目标深度学习模型同时对第一特征向量以及第二特征向量进行分析,得到目标问题对应的目标候选问题。如此,可基于目标候选问题从目标知识库中确定目标问题对应的目标答案。本申请能够通过目标深度学习模型对结合医疗领域和饮食领域的问题进行分析,以实现更好的理解用户提出的问题,进而能够通过目标知识库对候选问题进行查询,以到较为准确的答案,也即实现了融合了医疗领域以及知识领域问题的问答。
请参阅图3,图3是本申请实施例提供的一种得到目标候选问题的流程示意图。如图3所示,可通过步骤S141至步骤S143实现得到目标候选问题。
步骤S131:通过目标深度学习模型同时对第一特征向量以及第二特征向量进行分析,得到若干初始候选问题。
步骤S132:计算每一初始候选问题与目标问题的相似度。
步骤S133:将相似度最大的初始候选问题确定为目标候选问题。
具体的,在将医疗知识领域对应的特征向量以及饮食知识领域对应的特征向量输入至目标深度学习模型后,可得到若干与目标问题相似的候选问题。因此,可计算每一候选问题与目标问题的相似度,进而将相似度最大的初始候选问题确定为目标候选问题。
在本申请实施例中,可计算每一初始候选问题与目标问题的相似度,进而将相似度最大的初始候选问题确定为目标候选问题。如此,可实现基于目标候选问题从目标数据库中确定目标答案。
请继续参阅图4,图4是本申请实施例提供的一种得到目标深度学习模型的流程示意图。如图4所示,可通过步骤S21至步骤S24实现得到目标深度学习模型。
步骤S21:获取训练数据集,其中,训练数据集包括若干问答对。
步骤S22:基于每一问答对的领域文本信息,构建对应的初始知识库。
具体的,可收集包含若干领域的问题和对应答案的训练数据集,以用于进行预训练。例如可以通过人工收集、网络爬虫或公开的数据集等方式获取训练数据集,本申请对此不加以限定。
进一步的,还可以获取每一个问答对的领域文本信息,构建对应的知识库,以用于模型的预训练。
步骤S23:基于初始知识库以及训练数据集,对初始深度学习模型进行训练,得到预训练模型。
步骤S24:对预训练模型进行训练,得到目标深度学习模型。
具体的,可基于初始知识库,将训练数据集中的问题作为输入,并使用相应的答案作为目标输出,对初始深度学习模型进行训练,得到预训练模型。训练过程中,模型将学习问题和答案之间的语义和关联,以及如何根据问题生成准确的答案。训练过程中,还可以使用一些评估指标来监控模型的性能和准确度。
可选地,对预训练模型进行训练,得到目标深度学习模型,包括:获取第一知识领域对应的第一领域文本信息,以及获取第二知识领域对应的第二领域文本信息;基于第一领域文本信息以及第二领域文本信息,对预训练模型的参数进行调整,得到目标深度学习模型。
其中,第一领域文本信息为医疗领域对应的文本信息;第二领域文本信息为饮食领域对应的文本信息。
需要说明的是,本申请对于基于医疗领域对应的文本信息以及饮食领域对应的文本信息,对预训练模型的参数进行调整的方法不加以限定。例如可通过迁移学习(TransferLearning)方法、领域自适应方法以及数据增强方法等实现对预训练模型的参数进行调整。且本申请以数据增强方法为例进行说明。
具体的,可利用医疗领域对应的文本信息以及饮食领域对应的文本信息,对训练数据进行增强,从而生成更多的样本。例如,通过合成问题的变体、替换词语或添加领域特定的语义扩展,以增加数据的多样性和覆盖领域的各个方面。
在本申请实施例中,通过数据增强的方法利用医疗领域对应的文本信息以及饮食领域对应的文本信息对预训练模型的参数进行调整和优化,可以使得到目标深度学习模型更加专注于医疗知识领域和饮食知识领域的特定任务和问题,从而提高目标深度学习模型的性能和准确度。通过结合医疗领域对应的文本信息以及饮食领域对应的文本信息,模型能够更好地理解和处理医疗和饮食领域的问题,并生成更准确和相关的答案。
请继续参阅图5,图5是本申请实施例提供的一种得到迭代后的目标深度学习模型的流程示意图。如图5所示,目标深度学习模型包括大语言模型,可通过步骤S25至步骤S27实现得到迭代后的大语言模型。
步骤S25:对目标深度学习进行迭代训练提取数据特征,并计算得到损失函数。
步骤S26:利用预设方法以降低损失函数数值为目的对损失函数进行迭代训练,直至满足预期阈值规定。
步骤S27:基于迭代训练后的损失函数,得到迭代后的目标深度学习。
可以理解的,为了训练更高准确率的目标深度学习模型,可对目标深度学习模型进行反复迭代训练的方式使得损失函数不断降低,直至损失函数满足预期阈值规定,进而可基于迭代后的大语言模型得到较为准确医疗有关问题对应的答案。
需要说明的是,本申请对上述预设方法以及预期阈值不做限定,例如该预设方法可以为梯度下降算法、批梯度下降算法、随机梯度下井算法等,本申请以梯度下降算法为例进行说明。
梯度下降算法的目的为通过迭代的方式找到损失函数的最小值,或者收敛到最小值。梯度下降算法从几何意义上讲,就是在函数变化增加最快的地方,沿着向量相反的方向,梯度减小最快,因此更容易找到函数最小值。基于此,在本申请实施例中,可采用梯度下降算法的方式对目标深度学习模型进行反复迭代训练使得损失函数不断降低,从而实现降低计算结果的误差。
在本申请实施例中,由于采用梯度下降算法对目标深度学习模型进行反复迭代训练的方式使得损失函数不断降低,以得到迭代后的目标深度学习模型,进而可基于迭代后的目标深度学习模型得到较为准确的答案。
请参阅图6,图6是本申请实施例提供的一种问答装置的示意性框图。该问答装置可以配置于服务器中,用于执行前述的融合多知识领域的问答方法。
如图6所示,该问答装置200包括:获取模块201、特征提取模块202、分析模块203、确定模块204。
获取模块201,用于获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;
特征提取模块202,用于对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;
分析模块203,用于通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;
确定模块204,用于基于所述目标候选问题,从所述目标知识库中确定目标答案。
特征提取模块202,还用于对所述目标问题进行数据清洗操作,得到数据清洗后的目标问题;对所述数据清洗后的目标问题进行特征提取操作,得到若干初始特征向量;基于知识领域特征将若干所述初始特征向量进行分类,得得到所述第一知识领域对应的所述第一特征向量以及所述第二知识领域对应的所述第二特征向量。
分析模块203,还用于通过所述目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到若干初始候选问题;计算每一所述初始候选问题与所述目标问题的相似度;将相似度最大的所述初始候选问题确定为所述目标候选问题。
确定模块204,还用于从所述目标知识库中查询所述目标候选问题,并得到所述目标候选问题对应的答案;将所述目标候选问题对应的答案确定为所述目标答案。
获取模块201,还用于获取训练数据集,其中,所述训练数据集包括若干问答对;基于每一所述问答对的领域文本信息,构建对应的初始知识库;基于所述初始知识库以及所述训练数据集,对初始深度学习模型进行训练,得到预训练模型;对所述预训练模型进行训练,得到所述目标深度学习模型。
获取模块201,还用于获取所述第一知识领域对应的第一领域文本信息,以及获取所述第二知识领域对应的第二领域文本信息;基于所述第一领域文本信息以及所述第二领域文本信息,对所述预训练模型的参数进行调整,得到所述目标深度学习模型。
获取模块201,还用于对所述目标深度学习进行迭代训练提取数据特征,并计算得到损失函数;利用预设方法以降低损失函数数值为目的对所述损失函数进行迭代训练,直至满足预期阈值规定;基于迭代训练后的所述损失函数,得到迭代后的所述目标深度学习。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费终端设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
示例性的,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本申请实施例提供的一种计算机设备的示意图。该计算机设备可以是服务器。
如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括易失性存储介质、非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种融合多知识领域的问答方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种融合多知识领域的问答方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一些实施方式中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;基于所述目标候选问题,从所述目标知识库中确定目标答案。
在一些实施方式中,所述处理器还用于对所述目标问题进行数据清洗操作,得到数据清洗后的目标问题;对所述数据清洗后的目标问题进行特征提取操作,得到若干初始特征向量;基于知识领域特征将若干所述初始特征向量进行分类,得到所述第一知识领域对应的所述第一特征向量以及所述第二知识领域对应的所述第二特征向量。
在一些实施方式中,所述处理器还用于通过所述目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到若干初始候选问题;计算每一所述初始候选问题与所述目标问题的相似度;将相似度最大的所述初始候选问题确定为所述目标候选问题。
在一些实施方式中,所述处理器还用于从所述目标知识库中查询所述目标候选问题,并得到所述目标候选问题对应的答案;将所述目标候选问题对应的答案确定为所述目标答案。
在一些实施方式中,所述处理器还用于获取训练数据集,其中,所述训练数据集包括若干问答对;基于每一所述问答对的领域文本信息,构建对应的初始知识库;基于所述初始知识库以及所述训练数据集,对初始深度学习模型进行训练,得到预训练模型;对所述预训练模型进行训练,得到所述目标深度学习模型。
在一些实施方式中,所述处理器还用于获取所述第一知识领域对应的第一领域文本信息,以及获取所述第二知识领域对应的第二领域文本信息;基于所述第一领域文本信息以及所述第二领域文本信息,对所述预训练模型的参数进行调整,得到所述目标深度学习模型。
在一些实施方式中,所述处理器还用于对所述目标深度学习进行迭代训练提取数据特征,并计算得到损失函数;利用预设方法以降低损失函数数值为目的对所述损失函数进行迭代训练,直至满足预期阈值规定;基于迭代训练后的所述损失函数,得到迭代后的所述目标深度学习。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时实现本申请实施例提供的任一种融合多知识领域的问答方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种融合多知识领域的问答方法,其特征在于,所述方法应用于FAQ系统,包括:
获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;
对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;
通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;
基于所述目标候选问题,从所述目标知识库中确定目标答案。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,包括:
对所述目标问题进行数据清洗操作,得到数据清洗后的目标问题;
对所述数据清洗后的目标问题进行特征提取操作,得到若干初始特征向量;
基于知识领域特征将若干所述初始特征向量进行分类,得到所述第一知识领域对应的所述第一特征向量以及所述第二知识领域对应的所述第二特征向量。
3.根据权利要求1所述的方法,其特征在于,所述通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,包括:
通过所述目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到若干初始候选问题;
计算每一所述初始候选问题与所述目标问题的相似度;
将相似度最大的所述初始候选问题确定为所述目标候选问题。
4.根据权利要求1所述的方法,其特征在于,所述目标知识库包括若干候选问题以及每一候选问题对应的答案,所述基于所述目标候选问题,从所述目标知识库中确定目标答案,包括:
从所述目标知识库中查询所述目标候选问题,并得到所述目标候选问题对应的答案;
将所述目标候选问题对应的答案确定为所述目标答案。
5.根据权利要求1所述的方法,其特征在于,所述获取关于第一知识领域和第二知识领域的目标问题之前,还包括:
获取训练数据集,其中,所述训练数据集包括若干问答对;
基于每一所述问答对的领域文本信息,构建对应的初始知识库;
基于所述初始知识库以及所述训练数据集,对初始深度学习模型进行训练,得到预训练模型;
对所述预训练模型进行训练,得到所述目标深度学习模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述预训练模型进行训练,得到所述目标深度学习模型,包括:
获取所述第一知识领域对应的第一领域文本信息,以及获取所述第二知识领域对应的第二领域文本信息;
基于所述第一领域文本信息以及所述第二领域文本信息,对所述预训练模型的参数进行调整,得到所述目标深度学习模型。
7.根据权利要求6所述的方法,其特征在于,所述得到所述目标深度学习模型之后,还包括:
对所述目标深度学习进行迭代训练提取数据特征,并计算得到损失函数;
利用预设方法以降低损失函数数值为目的对所述损失函数进行迭代训练,直至满足预期阈值规定;
基于迭代训练后的所述损失函数,得到迭代后的所述目标深度学习。
8.一种问答装置,其特征在于,所述问答装置包括:
获取模块,所述获取模块用于获取目标问题,其中,所述目标问题有关第一知识领域和第二知识领域,所述第一知识领域与所述第二知识领域分别隶属于不同的知识领域;
特征提取模块,所述特征提取模块用于对所述目标问题进行特征提取操作,得到对应的第一特征向量以及第二特征向量,其中,所述第一特征向量对应所述第一知识领域,所述第二特征向量对应所述第二知识领域;
分析模块,所述分析模块用于通过目标深度学习模型同时对所述第一特征向量以及所述第二特征向量进行分析,得到所述目标问题对应的目标候选问题,其中,所述目标深度学习模型包括所述第一知识领域和所述第二知识领域的目标知识库;
确定模块,所述确定模块用于基于所述目标候选问题,从所述目标知识库中确定目标答案。
9.一种计算机设备,其特征在于,包括:存储器和处理器;其中,所述存储器与所述处理器连接,用于存储程序所述处理器用于通过运行所述存储器中存储的程序,实现如权利要求1-7中任一项所述的问答方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1-7中任一项所述的问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310801067.4A CN116805002A (zh) | 2023-06-30 | 2023-06-30 | 问答方法、问答装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310801067.4A CN116805002A (zh) | 2023-06-30 | 2023-06-30 | 问答方法、问答装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116805002A true CN116805002A (zh) | 2023-09-26 |
Family
ID=88080633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310801067.4A Pending CN116805002A (zh) | 2023-06-30 | 2023-06-30 | 问答方法、问答装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116805002A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407514A (zh) * | 2023-11-28 | 2024-01-16 | 星环信息科技(上海)股份有限公司 | 一种解决计划生成方法、装置、设备及存储介质 |
CN117591658A (zh) * | 2024-01-17 | 2024-02-23 | 翌东寰球(深圳)数字科技有限公司 | 一种智能问答方法、装置、设备及存储介质 |
-
2023
- 2023-06-30 CN CN202310801067.4A patent/CN116805002A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407514A (zh) * | 2023-11-28 | 2024-01-16 | 星环信息科技(上海)股份有限公司 | 一种解决计划生成方法、装置、设备及存储介质 |
CN117591658A (zh) * | 2024-01-17 | 2024-02-23 | 翌东寰球(深圳)数字科技有限公司 | 一种智能问答方法、装置、设备及存储介质 |
CN117591658B (zh) * | 2024-01-17 | 2024-03-29 | 翌东寰球(深圳)数字科技有限公司 | 一种智能问答方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11334635B2 (en) | Domain specific natural language understanding of customer intent in self-help | |
WO2022041979A1 (zh) | 一种信息推荐模型的训练方法和相关装置 | |
CA3083723C (en) | Method and apparatus for providing personalized self-help experience | |
US9104780B2 (en) | System and method for natural language processing | |
CN116805002A (zh) | 问答方法、问答装置、设备及存储介质 | |
CN114491072A (zh) | 一种中医数据处理系统、方法、存储介质及终端 | |
EP4073978B1 (en) | Intelligent conversion of internet domain names to vector embeddings | |
CN112052297B (zh) | 信息生成方法、装置、电子设备和计算机可读介质 | |
EP3561735A1 (en) | Integrating deep learning into generalized additive mixed-effect (game) frameworks | |
CN113569018A (zh) | 问答对挖掘方法及装置 | |
CN116821299A (zh) | 智能问答方法、智能问答装置、设备及存储介质 | |
AU2019298610B2 (en) | Search device and program | |
CN109599176B (zh) | 问诊技巧推荐方法及装置、在线辅诊系统 | |
KR101955920B1 (ko) | 속성 언어를 이용한 검색 방법 및 장치 | |
CN117253085A (zh) | 基于多任务的眼底图像分类方法、装置、设备及存储介质 | |
CN112541069A (zh) | 一种结合关键词的文本匹配方法、系统、终端及存储介质 | |
CN116127066A (zh) | 文本聚类方法、文本聚类装置、电子设备及存储介质 | |
US9122705B1 (en) | Scoring hash functions | |
US20140093844A1 (en) | Method for identification of food ingredients in multimedia content | |
CN116755683B (zh) | 一种数据处理方法和相关装置 | |
CN113868438B (zh) | 信息可信度的校准方法、装置、计算机设备及存储介质 | |
US20240202450A1 (en) | System and method for determining bias concept/document in a set of documents | |
CN117435648A (zh) | 高校教师与科研成果的关联方法、装置、设备及存储介质 | |
CN117131274A (zh) | 基于场景化知识图谱的推荐方法、系统及存储介质 | |
CN114444493A (zh) | 试题处理方法及装置、计算机可读存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |