CN116861986A - 基于存储神经单元的更新模型方法、装置、设备及介质 - Google Patents
基于存储神经单元的更新模型方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116861986A CN116861986A CN202310798266.4A CN202310798266A CN116861986A CN 116861986 A CN116861986 A CN 116861986A CN 202310798266 A CN202310798266 A CN 202310798266A CN 116861986 A CN116861986 A CN 116861986A
- Authority
- CN
- China
- Prior art keywords
- neuron
- storage
- model
- classification
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 210000005036 nerve Anatomy 0.000 title claims abstract description 22
- 210000002569 neuron Anatomy 0.000 claims abstract description 382
- 238000013499 data model Methods 0.000 claims abstract description 160
- 238000013145 classification model Methods 0.000 claims abstract description 63
- 230000001537 neural effect Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 17
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 238000007405 data analysis Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000006855 networking Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及人工智能领域、医疗健康技术领域,揭示了一种基于存储神经单元的更新模型方法、装置、设备及介质,其中,方法包括:获取文本数据;将文本数据输入至第一数据模型,得到第一输出值;将各个第一输出值输入至目标分类模型中,得到每个第一存储神经元对应的第一分类标签;确定分类标签满足预设更新条件的每个第一存储神经元作为第二存储神经元,将第二存储神经元对应的第一神经元作为第二神经元;根据文本数据以及第一数据模型,对第一数据模型中的第二神经元的权重进行更新。能够确定需要进行更新的第二神经元,对第二神经元更新,实现了对第一数据模型进行快速更新,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
Description
技术领域
本发明涉及人工智能领域、医疗健康技术领域,尤其涉及一种基于存储神经单元的更新模型方法、装置、设备及介质。
背景技术
目前大型模型的运用十分广泛,但是在学习和存储知识时面临一些挑战,特别是对于需要随时更新的知识,大型模型可以是医疗文本识别模型、医疗数据分析模型。主流方式是对大模型进行微调或者重新进行训练。
然而,训练大模型的成本极其昂贵,动态知识更新需要非常频繁,现也有将大模型进行联网进行知识汇总后进行事实知识输出,但是通过联网输入知识无法改变大模型类似chatgpt(Chat Generative Pre-trained Transformer)等模型固有的知识存储,同时将chatgpt剥离网络后模型会将联网的知识知识遗忘,本质上都是gpt(Generative Pre-trained Transformer)类模型依靠于离线学习。
因此,如何快速定位到大型模型需要更新的神经元并对该神经元进行更新,成为亟待解决的问题。
发明内容
基于此,有必要针对现有技术的对大型模型无法进行快速更新数据的技术问题,提出了一种基于存储神经单元的更新模型方法。
第一方面,提供了一种基于存储神经单元的更新模型方法,所述方法包括:
获取需要更新的文本数据;
将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
第二方面,提供了一种基于存储神经单元的更新模型装置,所述装置包括:
获取模块,用于获取需要更新的文本数据;
输出模块,用于将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
分类模块,用于将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签。
第三方面,提供了一种基于存储神经单元的更新模型装置,所述装置还包括:
确定模块,用于在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
更新模块,用于根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
第四方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于存储神经单元的更新模型方法的步骤。
第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于存储神经单元的更新模型方法的步骤。
本发明提出的基于存储神经单元的更新模型方法的分析方法,通过获取需要更新的文本数据,接着将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中基于存储神经单元的更新模型方法的应用环境图;
图2为一个实施例中基于存储神经单元的更新模型方法的流程图;
图3为一个实施例中基于存储神经单元的更新模型装置的结构框图;
图4为一个实施例中计算机设备的结构框图;
图5为一个实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于人工智能的基于存储神经单元的更新模型方法,可应用在如图1的应用环境中,可应用于智能诊疗、远程会诊、医疗文本识别、医疗数据分析。其中,客户端110通过网络与服务端120进行通信。服务端120可以通过客户端110接收需要更新的文本数据,接着服务端120将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后服务端120将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着服务端120在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后服务端120根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,在本发明中,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。其中,客户端110可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
请参阅图2所示,图2为本发明第一实施例提供的基于存储神经单元的更新模型方法的一个流程示意图,包括如下步骤:
S101:获取需要更新的文本数据;
在本实施例中,需要更新的文本数据可以是医疗的文本数据,其中,医疗的文本数据可以是如个人健康档案、处方、检查报告等数据。
S102:将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
其中,第一数据模型可以是基于大型gpt模型训练得到的模型,例如,医疗文本识别模型、医疗数据分析模型,作为一示例,医疗文本识别模型可用于对用户询问的文本进行回复,生成回复文本。作为又一示例,医疗数据分析模型可用于对医疗数据进行分析,得到分析文本。第一数据模型可以是已经投入市场使用的模型,第一数据模型包括各个连接的节点,所述节点既是第一神经元,对于每个第一神经元,至少配置有一个第一存储神经元,第一存储神经单元用于存储与第一神经单元相同的知识,第一存储神经元的权重以及参数与第一神经元的权重以及参数相同。第一神经元是一个神经元。
在本实施例中,将文本数据输入至待更新的第一数据模型中,从而得到第一数据模型输出的每个第一存储神经元的第一输出值。
S103:将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
其中,目标分类模型可以是基于小型gpt模型训练得到的模型,目标分类模型还可以是基于BERT(BidirectionalEncoder Representations from Transformer)模型训练得到的模型。
在本实施例中,首先,将各个第一输出值输入至目标分类模型中,从而对各个第一存储神经元进行分类处理,得到每个第一存储神经元对应的第一分类标签,其中,第一分类标签可以是数字标签,例如,第一存储神经元对应的第一分类标签可以是数字标签1。
S104:在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
其中,分类标签可以是数字标签,预设更新条件可以是分类标签是否大于数字2,当第一存储神经元的数字标签大于2则满足预设更新条件。
在本实施例中,首先,在各个第一存储神经元中,判断是否存在分类标签满足预设更新条件的每个第一存储神经元,若存在分类标签满足预设更新条件的第一存储神经元,则将满足预设更新条件的第一存储神经元作为第二存储神经元,而后将第二存储神经元对应的第一神经元作为第二神经元。
S105:根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
在本实施例中,首先,将文本数据输入至第一数据模型,从而更新第一数据模型中的第二神经元,使得第二神经元的权重进行更新。
作为一示例,A国每举行一次足球联赛,会产生一个冠军。使用新的文本数据更新旧的文本数据,其中,新的文本数据可以是A国第N届的足球联赛冠军是B区域的队伍,旧的文本数据可以是A国第N-1届的足球联赛冠军是C区域的队伍。通过第一存储神经元定位存储冠军信息的第二神经元。最后,通过更新大型模型中存储冠军信息的第二神经元的权重,可以更新模型中的冠军信息,确保其与最新的事实一致。
本实施例提出的基于存储神经单元的更新模型方法,通过获取需要更新的文本数据,接着将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
基于第一实施例,提出本发明基于存储神经单元的更新模型方法的第二实施例,在本实施例中,所述在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的第二存储神经元,作为第二存储神经元,包括:
S201:在各个所述第一存储神经元中,确定是否存在所述分类标签为第一分类等级的所述第一存储神经元;
S202:若存在,则确定所述分类标签为所述第一分类等级的第一存储神经元满足所述预设更新条件,并将所述分类标签为所述第一分类等级的所述第一存储神经元作为所述第二存储神经元。
在本实施例中,首先,在各个第一存储神经元中,确定是否存在分类标签为第一分类等级的第一存储神经元,若存在分类标签为第一分类等级的第一存储神经元,则确定分类标签为第一分类等级的第一存储神经元满足预设更新条件,并将分类标签为第一分类等级的第一存储神经元作为第二存储神经元。
本实施例提出的基于存储神经单元的更新模型方法,通过在各个所述第一存储神经元中,确定是否存在所述分类标签为第一分类等级的所述第一存储神经元,最后,若存在,则确定所述分类标签为所述第一分类等级的第一存储神经元满足所述预设更新条件,并将所述分类标签为所述第一分类等级的所述第一存储神经元作为所述第二存储神经元,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
基于第一实施例,提出本发明基于存储神经单元的更新模型方法的第三实施例,在本实施例中,所述根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,包括:
S301:将所述文本数据输入至第一数据模型中,对所述第二神经元进行模型训练,对第二神经元的权重进行更新,并且同步更新所述第二存储神经元。
在本实施例中,首先,将文本数据输入至第一数据模型中,对第二神经元进行模型训练,从而对第二神经元的权重进行更新,在更新第二神经元的同时,还可以同步更新第二存储神经元的权重与第二神经元的权重相同,需要说明的是,同步更新第二存储神经元的权重与第二神经元的权重相同,有利于下一次获取需要更新的文本数据后重新定位第二神经元并更新第二神经元。
本实施例提出的基于存储神经单元的更新模型方法,通过将所述文本数据输入至第一数据模型中,对所述第二神经元进行模型训练,对第二神经元的权重进行更新,并且同步更新所述第二存储神经元,能够对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本,同步更新第二存储神经元的权重与第二神经元的权重相同,有利于下一次获取需要更新的文本数据后重新定位第二神经元并更新第二神经元。
基于第一实施例,提出本发明基于存储神经单元的更新模型方法的第四实施例,在本实施例中,将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值之前,包括:
S401:将所述文本数据输入至第二数据模型中,得到所述第二数据模型中的每个第三存储神经元的第二输出值,其中,所述第二数据模型中的每个第三神经元至少配置有一个第三存储神经元,所述第三神经元的权重与所述第二存储神经元的权重相同;
S402:计算所述第二数据模型中的每个第三存储神经元的梯度,并根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签;
S403:根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型。
其中,第二数据模型可以是基于大型gpt模型训练得到的模型,例如,医疗文本识别模型、医疗数据分析模型,作为一示例,医疗文本识别模型可用于对用户询问的文本进行回复,生成回复文本。作为又一示例,医疗数据分析模型可用于对医疗数据进行分析,得到分析文本。第二数据模型可以是研发人员用于训练分类模型的模型,第二数据模型包括各个连接的节点,所述节点既是第三神经元,第二数据模型中的每个第三神经元至少配置有一个第三存储神经元,且第三神经元的权重与第一数据模型中的第二存储神经元的权重相同,既是第三神经元存储的知识与第二存储神经元存储的知识相同,第二分类标签可以包括多个分类等级,如分类等级为第一等级、第二等级。
在本实施例中,将文本数据输入至第二数据模型中,得到第二数据模型中的每个第三存储神经元的第二输出值,并计算所述第二数据模型中的每个第三存储神经元的梯度,其中,可以采用反向传播算法计算各个第三存储神经元的梯度。
接着,可以根据第三存储神经元的梯度的大小,确定第三存储神经元所属的第二分类标签。最后,通过第二输出值、第二分类标签,对预设的分类模型进行训练,得到目标分类模型。
进一步地,一实施例中,所述根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签,包括:
S4021:若所述第三存储神经元的梯度大于梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第一分类等级;
S4022:若所述第三存储神经元的梯度小于或等于所述梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第二分类等级,其中,所述第一分类等级高于所述第二分类等级。
在本实施例中,首先,判断第三存储神经元的梯度是否大于梯度阈值,若第三存储神经元的梯度大于梯度阈值,则确定第三存储神经单元对应的分类标签为第一分类等级,例如,第一分类等级为第一等级;
若第三存储神经元的梯度小于或等于梯度阈值,则确定第三存储神经单元对应的分类标签为第二分类等级,例如,第二分类等级为第二等级,其中,第一分类等级高于第二分类等级,既是第一等级高于第二等级。
进一步地,一实施例中,所述根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型,包括:
S4031:将所述第三存储神经元对应的标识、所述第二输出值以及所述第二分类标签输入至预设的分类模型,得到所述第三存储神经元的预测值;
S4032:通过各个所述预测值以及所述第二分类标签进行比对,计算得到损失值;
S4033:根据所述损失值对所述预设的分类模型中的参数和权重进行调整;
S4034:判断所述预设的分类模型是否达到训练结束条件,若是,则将达到训练结束条件的所述预设的分类模型作为目标分类模型。
需要说明的是,对于存储相同知识的第三存储神经元与第一存储神经单元的标识相同。
在本实施例中,将第三存储神经元对应的标识、第二输出值以及第二分类标签输入至预设的分类模型中,从而得到预设的分类模型输出的第三存储神经元的预测值。通过各个预测值以及第二分类标签进行比对,计算得到损失值。
而后,通过损失值对预设的分类模型中的参数和权重进行调整,接着,判断所述预设的分类模型是否达到训练结束条件,若是,则将达到训练结束条件的所述预设的分类模型作为目标分类模型。作为一示例,通过损失值对预设的分类模型中的参数和权重进行调整后,判断预设的分类模型是否收敛,若未收敛,则跳转将所述第三存储神经元对应的标识、第二输出值以及第二分类标签输入至预设的分类模型,得到第三存储神经元的预测值的步骤重新执行,若收敛,则满足训练结束条件,将收敛后的分类模型作为目标分类模型。作为又一示例,通过损失值对预设的分类模型中的参数和权重进行调整后,跳转将所述第三存储神经元对应的标识、第二输出值以及第二分类标签输入至预设的分类模型,得到第三存储神经元的预测值的步骤重新执行,当迭代次数达到预设次数,则满足训练结束条件。
本实施例提出的基于存储神经单元的更新模型方法,通过将所述文本数据输入至第二数据模型中,得到所述第二数据模型中的每个第三存储神经元的第二输出值,其中,所述第二数据模型中的每个第三神经元至少配置有一个第三存储神经元,所述第三神经元的权重与所述第二存储神经元的权重相同,而后计算所述第二数据模型中的每个第三存储神经元的梯度,并根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签,最后根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第三存储神经元对应的标识、第二输出值以及第二分类标签,得到目标分类模型,而后通过目标分类模型以高准确度预测第一数据模型的第一输出值的第一分类标签,从而根据第一分类标签,在第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,使第一数据模型进行快速更新,在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
请参阅图3所示,在一实施例中,提供一种基于人工智能的基于存储神经单元的更新模型装置,所述装置包括:
获取模块501,用于获取需要更新的文本数据;
输出模块502,用于将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元
分类模块503,用于将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
确定模块504,用于在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
更新模块505,用于根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
本实施例提出的基于存储神经单元的更新模型方法,通过获取需要更新的文本数据,接着将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
在一个实施例中,确定模块504,还用于:
在各个所述第一存储神经元中,确定是否存在所述分类标签为第一分类等级的所述第一存储神经元;
若存在,则确定所述分类标签为所述第一分类等级的第一存储神经元满足所述预设更新条件,并将所述分类标签为所述第一分类等级的所述第一存储神经元作为所述第二存储神经元。
在一个实施例中,更新模块505,用于:
将所述文本数据输入至第一数据模型中,对所述第二神经元进行模型训练,对第二神经元的权重进行更新,并且同步更新所述第二存储神经元。
在一个实施例中,基于人工智能的基于存储神经单元的更新模型装置,还用于:将所述文本数据输入至第二数据模型中,得到所述第二数据模型中的每个第三存储神经元的第二输出值,其中,所述第二数据模型中的每个第三神经元至少配置有一个第三存储神经元,所述第三神经元的权重与所述第二存储神经元的权重相同;
计算所述第二数据模型中的每个第三存储神经元的梯度,并根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签;
根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型。
在一个实施例中,基于人工智能的基于存储神经单元的更新模型装置,还用于:若所述第三存储神经元的梯度大于梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第一分类等级;
若所述第三存储神经元的梯度小于或等于所述梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第二分类等级,其中,所述第一分类等级高于所述第二分类等级。
在一个实施例中,基于人工智能的基于存储神经单元的更新模型装置,还用于:将所述第三存储神经元对应的标识、所述第二输出值以及所述第二分类标签输入至预设的分类模型,得到所述第三存储神经元的预测值;
通过各个所述预测值以及所述第二分类标签进行比对,计算得到损失值;
根据所述损失值对所述预设的分类模型中的参数和权重进行调整;
判断所述预设的分类模型是否达到训练结束条件,若是,则将达到训练结束条件的所述预设的分类模型作为目标分类模型。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的基于存储神经单元的更新模型方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的基于存储神经单元的更新模型方法客户端侧的功能或步骤。
在一个实施例中,提出了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取需要更新的文本数据;
将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
本发明提出的基于存储神经单元的更新模型方法的分析方法,通过获取需要更新的文本数据,接着将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
在一个实施例中,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取需要更新的文本数据;
将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
本发明提出的基于存储神经单元的更新模型方法的分析方法,通过获取需要更新的文本数据,接着将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元,而后将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签,接着在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元,最后根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,能够在第一数据模型的第一存储神经元中确定满足预设更新条件的第二存储神经元,并通过第二存储神经元确定需要进行更新的第二神经元,而后对第二神经元进行更新,从而对第一数据模型进行快速更新,使得在动态知识更新频繁的情况下,无需再次对第一数据模型重新进行大规模的训练,提高了更新第一数据模型的效率,降低了训练第一数据模型的成本。
需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于存储神经单元的更新模型方法,所述方法包括:
获取需要更新的文本数据;
将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签;
在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
2.根据权利要求1所述的基于存储神经单元的更新模型方法,其特征在于,所述在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,包括:
在各个所述第一存储神经元中,确定是否存在所述分类标签为第一分类等级的所述第一存储神经元;
若存在,则确定所述分类标签为所述第一分类等级的第一存储神经元满足所述预设更新条件,并将所述分类标签为所述第一分类等级的所述第一存储神经元作为所述第二存储神经元。
3.根据权利要求1所述的基于存储神经单元的更新模型方法,其特征在于,所述根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新,包括:
将所述文本数据输入至第一数据模型中,对所述第二神经元进行模型训练,对第二神经元的权重进行更新,并且同步更新所述第二存储神经元。
4.根据权利要求1所述的基于存储神经单元的更新模型方法,其特征在于,将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值之前,包括:
将所述文本数据输入至第二数据模型中,得到所述第二数据模型中的每个第三存储神经元的第二输出值,其中,所述第二数据模型中的每个第三神经元至少配置有一个第三存储神经元,所述第三神经元的权重与所述第二存储神经元的权重相同;
计算所述第二数据模型中的每个第三存储神经元的梯度,并根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签;
根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型。
5.根据权利要求4所述的基于存储神经单元的更新模型方法,其特征在于,所述根据所述第三存储神经元的梯度,确定所述第三存储神经元的第二分类标签,包括:
若所述第三存储神经元的梯度大于梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第一分类等级;
若所述第三存储神经元的梯度小于或等于所述梯度阈值,则确定所述第三存储神经单元对应的第二分类标签为第二分类等级,其中,所述第一分类等级高于所述第二分类等级。
6.根据权利要求4所述的基于存储神经单元的更新模型方法,其特征在于,根据所述第二输出值、所述第二分类标签,对预设的分类模型进行训练,得到目标分类模型,包括:
将所述第三存储神经元对应的标识、所述第二输出值以及所述第二分类标签输入至预设的分类模型,得到所述第三存储神经元的预测值;
通过各个所述预测值以及所述第二分类标签进行比对,计算得到损失值;
根据所述损失值对所述预设的分类模型中的参数和权重进行调整;
判断所述预设的分类模型是否达到训练结束条件,若是,则将达到训练结束条件的所述预设的分类模型作为目标分类模型。
7.一种基于存储神经单元的更新模型装置,其特征在于,所述基于存储神经单元的更新模型装置包括:
获取模块,用于获取需要更新的文本数据;
输出模块,用于将所述文本数据输入至待更新的第一数据模型中,得到所述第一数据模型中每个第一存储神经元的第一输出值,其中,所述第一数据模型包括各个第一神经元,每个所述第一神经元至少配置有一个第一存储神经元;
分类模块,用于将各个所述第一输出值输入至目标分类模型中,对各个所述第一存储神经元进行分类处理,得到每个所述第一存储神经元对应的第一分类标签。
8.根据权利要求7所述的基于存储神经单元的更新模型装置,其特征在于,所述基于存储神经单元的更新模型装置还包括:
确定模块,用于在各个所述第一存储神经元中,确定所述分类标签满足预设更新条件的每个所述第一存储神经元,以作为第二存储神经元,并将所述第二存储神经元对应的所述第一神经元作为第二神经元;
更新模块,用于根据所述文本数据以及所述第一数据模型,对所述第一数据模型中的所述第二神经元的权重进行更新。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述基于存储神经单元的更新模型方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于存储神经单元的更新模型方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310798266.4A CN116861986A (zh) | 2023-06-30 | 2023-06-30 | 基于存储神经单元的更新模型方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310798266.4A CN116861986A (zh) | 2023-06-30 | 2023-06-30 | 基于存储神经单元的更新模型方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116861986A true CN116861986A (zh) | 2023-10-10 |
Family
ID=88233343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310798266.4A Pending CN116861986A (zh) | 2023-06-30 | 2023-06-30 | 基于存储神经单元的更新模型方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861986A (zh) |
-
2023
- 2023-06-30 CN CN202310798266.4A patent/CN116861986A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11694109B2 (en) | Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure | |
CN113593611B (zh) | 语音分类网络训练方法、装置、计算设备及存储介质 | |
WO2020220545A1 (zh) | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 | |
CN109326353B (zh) | 预测疾病终点事件的方法、装置及电子设备 | |
CN112016318B (zh) | 基于解释模型的分诊信息推荐方法、装置、设备及介质 | |
EP3884426B1 (en) | Action classification in video clips using attention-based neural networks | |
CN109977394B (zh) | 文本模型训练方法、文本分析方法、装置、设备及介质 | |
CN113688244A (zh) | 基于神经网络的文本分类方法、系统、设备及存储介质 | |
CN111914562B (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
CN111598213B (zh) | 网络训练方法、数据识别方法、装置、设备和介质 | |
CN110163252B (zh) | 数据分类方法及装置、电子设备、存储介质 | |
CN114065653A (zh) | 电力负荷预测模型的构建方法与电力负荷预测方法 | |
Chand et al. | Cooperative coevolution of feed forward neural networks for financial time series problem | |
CN114386604A (zh) | 基于多教师模型的模型蒸馏方法、装置、设备及存储介质 | |
CN111275059B (zh) | 一种图像处理方法、装置和计算机可读存储介质 | |
CN113761193A (zh) | 日志分类方法、装置、计算机设备和存储介质 | |
CN116884636A (zh) | 传染病数据分析方法、装置、计算机设备及存储介质 | |
CN116861986A (zh) | 基于存储神经单元的更新模型方法、装置、设备及介质 | |
CN113299339B (zh) | 基于深度学习的药物疗效预测方法、装置、设备以及存储介质 | |
CN115293249A (zh) | 一种基于动态时序预测的电力系统典型场景概率预测方法 | |
Lai et al. | Attribute‐Associated Neuron Modeling and Missing Value Imputation for Incomplete Data | |
CN112017790B (zh) | 基于对抗网络的电子病历筛查方法、装置、设备及介质 | |
Li et al. | Momentum based on adaptive bold driver | |
CN117575363A (zh) | 资源数据监测方法、装置、计算机设备和存储介质 | |
CN114298330A (zh) | 模型参数的调整方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |