CN110298438A - 神经网络模型的调整方法和调整装置 - Google Patents
神经网络模型的调整方法和调整装置 Download PDFInfo
- Publication number
- CN110298438A CN110298438A CN201910603830.6A CN201910603830A CN110298438A CN 110298438 A CN110298438 A CN 110298438A CN 201910603830 A CN201910603830 A CN 201910603830A CN 110298438 A CN110298438 A CN 110298438A
- Authority
- CN
- China
- Prior art keywords
- fixed point
- neuron
- neural network
- network model
- point scheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003062 neural network model Methods 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 48
- 210000002569 neuron Anatomy 0.000 claims abstract description 132
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000013139 quantization Methods 0.000 claims description 17
- 238000007619 statistical method Methods 0.000 claims description 7
- 210000005036 nerve Anatomy 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000007667 floating Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种神经网络模型的调整方法和调整装置。神经网络模型的调整方法包括在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测,从而有效提高神经网络模型的预测精度。
Description
技术领域
本发明涉及神经网络模型的技术领域,具体涉及一种神经网络模型的调整方法和调整装置。
背景技术
基于神经网络模型的训练和预测方法在很多应用中取得了极大的成功,比如目标检测识别领域等。由于在神经网络模型进行训练过程中具备大量冗余的事实,通常采用神经网络定点化来大幅降低资源使用量。
然而,目前的神经网络模型进行训练后形成的定点化方案一旦确定就无法改变,因而会导致一些情况下预测结果精度降低。
发明内容
有鉴于此,本发明实施例为解决上述问题提供了一种神经网络模型的调整方法和调整装置,有效提高神经网络模型的预测精度。
在本发明实施例的第一方面,本发明实施例提供了一种神经网络模型的调整方法,包括:在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。
在本发明一实施例中,上述根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,包括:确定至少一个神经元的第二输出数据中的最大值;根据最大值对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案。
在本发明一实施例中,上述在对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案之后,调整方法还包括:量化第一定点化方案量化使得第一定点化方案的量化位宽为8比特。
在本发明一实施例中,上述根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,包括:确定第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位;将第一最高比特位修改为第二最高比特位;根据第二最高比特位修改第一定点化方案中的最低比特位以得到第二定点化方案,第二定点化方案的量化位宽为8比特。
在本发明一实施例中,上述对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案,包括:对至少一个神经元的第一输出数据进行统计分析以得到至少一个神经元的第一输出数据的有效位的信息;根据至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案。
在本发明一实施例中,神经网络模型的调整方法还包括:在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化以得到每层中权重参数对应的第三定点化方案。
在本发明一实施例中,训练样本和待预测数据包括图片、视频或图表数据。
在本发明一实施例中,神经网络模型包括卷积神经网络模型、深度神经网络模型或循环神经网络模型。
在本发明实施例的第二方面,本发明实施例提供了一种神经网络模型的调整装置,包括:定点化模块,用于在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;调整模块,用于在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。
在本发明实施例的第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机可执行指令,可执行指令被处理器执行时实现如本发明实施例的第一方面中的任一项所述的神经网络模型的调整方法。
根据本发明实施例提供的技术方案,通过在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测,从而有效提高神经网络模型的预测精度。
附图说明
图1是本发明一实施例提供的一种神经网络模型的调整方法的流程示意图。
图2是本发明另一实施例提供的一种神经网络模型的调整方法的流程示意图。
图3是本发明又一实施例提供的一种神经网络模型的调整方法的流程示意图。
图4是本发明一实施例提供的一种神经网络模型的调整装置的结构示意图。
图5是本发明一实施例提供的一种神经网络模型的调整系统的框图。
具体实施方式
下面将结合本发明实施例中所需要使用的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显而易见地,下面描述的附图仅是本发明一部分实施例,而不是全部的实施例。
需要说明的是,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有相关实施例,都属于本发明保护的范围。
还需要说明的是,本发明实施例中的“第一”、“第二”、“第三”等仅仅是为了彼此之间相互区分,并不用于限定具有固定的顺序,也不用于限定具有固定的数量。
本发明实施例中提供了一种神经网络模型的调整方法和调整装置,以下分别进行详细说明。
图1是本发明一实施例提供的一种神经网络模型的调整方法。如图1所示,该调整方法可以由服务器执行,该调整方法包括如下步骤。
S110:在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案。
具体而言,在利用训练样本对神经网络模型进行训练过程中,神经网络模型的多个层中每层有一个或多个神经元,每个神经元对应一个输出数据,服务器对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化,从而得到每层的至少一个神经元对应的第一定点化方案。
第一定点化方案可以为32位定点数,也可以为8位定点数,还可以为其他位的定点数;第一定点化方案中可包括符号位,也可不包括符号位,本发明实施例对第一定点化方案的具体定点数的位数以及是否包括符号位不做具体限定。
训练样本可以为图片,也可以为视频,还可以为输入的数据等,本发明实施例对此不做具体限定。
第一输出数据可以为一个,也可以为两个甚至多个,第一输出数据的数量与至少一个神经元的数量对应,本发明实施例对第一数据的数量和至少一个神经元的数量不做具体限定。
S120:在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。
具体而言,采用S110中训练好的神经网络模型,通过该训练好的神经网络模型对待预测数据进行预测过程中,服务器根据神经网络模型的多个层中的每层的至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。在一些实施例中,服务器根据神经网络模型的多个层中的每层的至少一个神经元的第二输出数据中的最大值,将至少一个神经元对应的第一定点化方案中的最大值调整为第二输出数据中的最大值以得到第二定点化方案;在另一些实施例中,服务器根据神经网络模型的多个层中的每层的至少一个神经元的第二输出数据中的最大值,将至少一个神经元对应的第一定点化方案中的数据范围调整至包括第二输出数据中的最大值,本发明实施例对如何根据至少一个神经元的第二输出数据中的最大值对至少一个神经元对应的第一定点化方案进行调整的方式不做具体限定。
待预测数据可以与训练样本属于同一类型,如均为含有猫的图片,也可以与训练样本不属于同一类型,如待预测数据为含有狗的图片,而训练样本为含有猫的图片,本发明实施例对此不做具体限定。
根据本发明实施例提供的技术方案,通过在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。本发明实施例中由于在通过神经网络模型对待预测数据进行预测时实时调整了第一定点化方案,从而避免了由于第一定点化方案固定而导致的预测结果精度降低的问题,使得神经网络模型的预测精度得到有效地提高。
图2是本发明另一实施例提供的一种神经网络模型的调整方法。该调整方法可以由服务器执行。图2是图1实施例的变型例。具体地,图2实施例中的步骤S111-S112为图1实施例中步骤110的变型步骤,步骤S121-S122为图1实施例中步骤120的变型步骤。
S111:在利用训练样本对神经网络模型进行训练过程中,对至少一个神经元的第一输出数据进行统计分析以得到至少一个神经元的第一输出数据的有效位的信息。
具体而言,服务器统计分析至少一个神经元的第一输出数据得到第一输出数据的有效位的信息,其中至少一个神经元为神经网络模型的多个层中的每层中所含有的神经元。例如,一个第一输出数据为32位的浮点数,其中首位为符号位,则该第一输出数据的有效位为31位;再例如,一个第一输出数据位16位的浮点数,该16位的浮点数中不包括符号位,则该第一输出数据的有效位为16位。由于第一输出数据的数量可以为一个,也可以为多个,因而需要对所有的第一输出数据进行统计分析以得到每个第一输出数据的有效位的信息。
S112:根据至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化得到至少一个神经元对应的第一定点化方案。
具体而言,服务器根据神经网络模型的多个层中的第一层的至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化得到第一层的至少一个神经元对应的第一定点化方案,服务器根据神经网络模型的多个层中的第二层的至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化得到第二层的至少一个神经元对应的第一定点化方案,神经网络模型的多个层中的其他层的至少一个神经元对应的第一定点化方案获得的方式与第一层、第二层的至少一个神经元对应的第一定点化方案获得的方式一致,此处不再赘述。
S121:在通过神经网络模型对待预测数据进行预测过程中,确定至少一个神经元的第二输出数据中的最大值。
具体而言,在通过神经网络模型对待预测数据进行预测过程中,服务器可通过统计分析神经网络模型的多个层中的每层的至少一个神经元的第二输出数据确定每层的至少一个神经元的第二输出数据的最大值。
第二输出数据的数量可以为一个,也可以为多个,本发明实施例对此不做具体限定。
S122:根据最大值对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案。
具体而言,服务器分别根据每层的至少一个神经元的第二输出数据的最大值对每层的至少一个神经元对应的第一定点化方案进行调整,从而得到每层的至少一个神经元对应的第二定点化方案。例如,服务器根据第一层的至少一个神经元的第二输出数据的最大值对第一层的至少一个神经元对应的第一定点化方案进行调整,从而得到第一层的至少一个神经元对应的第二定点化方案,服务器根据第二层的至少一个神经元的第二输出数据的最大值对第二层的至少一个神经元对应的第一定点化方案进行调整,从而得到第二层的至少一个神经元对应的第二定点化方案。
根据最大值对至少一个神经元对应的第一定点化方案进行调整的方式可以为将至少一个神经元对应的第一定点化方案中的最大值调整为第二输出数据中的最大值以得到第二定点化方案,也可以为将至少一个神经元对应的第一定点化方案中的数据范围调整至包括第二输出数据中的最大值,本发明实施例对此不做具体地限定。
根据本发明实施例提供的技术方案,通过在利用训练样本对神经网络模型进行训练过程中,对至少一个神经元的第一输出数据进行统计分析以得到至少一个神经元的第一输出数据的有效位的信息,并根据至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化,从而得到至少一个神经元对应的第一定点化方案,可充分利用每个第一输出数据的有效位的信息,提高对第一输出数据进行定点化的速度。另外,通过在通过神经网络模型对待预测数据进行预测过程中,确定至少一个神经元的第二输出数据中的最大值,根据最大值对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,从而使得每层的至少一个神经元对应的第二定点化方案中对应包含每层的至少一个神经元的第二输出数据的最大值,避免了由于第一定点化方案固定而导致的预测结果精度降低的问题,使得神经网络模型的预测精度得到有效地提高。
在本发明一实施例中,该调整方法还可包括步骤S210。
S210:在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化以得到每层中权重参数对应的第三定点化方案。
本发明实施例中,通过在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化,从而得到每层中权重参数对应的第三定点化方案,使得通过神经网络模型对待预测数据进行预测过程时,可直接结合每层中权重参数对应的第三定点化方案得到最终的预测结果。
在本发明一实施例中,训练样本和待预测数据包括图片、视频或图表数据。
训练样本可以为图片,也可以为视频,还可以为图表数据、语音等,待预测数据的类型与训练样本的类型可以保持一致,也可以不保持一致,本发明实施例对训练样本和待预测数据的类型不做具体限定。
在本发明一实施例中,神经网络模型包括卷积神经网络模型、深度神经网络模型或循环神经网络模型。
神经网络模型可以为卷积神经网络模型,也可以为深度神经网络模型,还可以为其他多层神经网络模型,如循环神经网络模型等,本发明实施例对此不做具体限定。
图3是本发明又一实施例提供的一种神经网络模型的调整方法。图3是图1实施例的变型例。具体地,图3实施例中除包括图1实施例中的步骤S110外,该调整方法还可包括如下步骤S310,另外,图3实施例中的步骤S123-S125为图1实施例中步骤120的变型步骤。
S310:量化第一定点化方案使得第一定点化方案的量化位宽为8比特。
具体而言,服务器将第一定点化方案量化为8位定点数,从而使得第一定点化方案的量化位宽为8比特。
量化的方法可以为将第一定点化方案中的定点数先转化成浮点数,然后统计将浮点数映射到8位比特区间;量化的方法也可以为直接采用第一定点化所采用的浮点数进行量化,使得第一定点化方案中的定点数为8位定点数,本发明实施例对此不做具体限定。
S123:在通过神经网络模型对待预测数据进行预测过程中,确定第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位。
例如,以神经网络模型的第一层为例,训练过程中,如果第一层的第一定点化方案的定点化结果为最低比特位为1、最高比特位为8,则确定第一层的第一定点化方案中的第一最高比特位为8;预测过程中,第一层的最大值如果为258,则最大值对应的第二最高比特位为9。确定神经网络模型的其他层的第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位的方式与确定上述举例的神经网络模型的第一层的第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位的方式类似,对此不再赘述。
确定第一定点化方案中的第一最高比特位可以是在第一定点化方案形成后即可获取的,并在通过神经网络模型对待预测数据进行预测过程中进行确定的,也可以是在通过神经网络模型对待预测数据进行预测过程中直接根据第一定点化方案获取并确定的,本发明实施例对此不做具体限定。
S124:将第一最高比特位修改为第二最高比特位。
例如,仍以神经网络模型的第一层为例,上述确定的第一层的第一定点化方案中的第一最高比特位为8,最大值对应的第二最高比特位为9,则将第一最高比特位修改为9。
S125:根据第二最高比特位修改第一定点化方案中的最低比特位以得到第二定点化方案,第二定点化方案的量化位宽为8比特。
例如,仍以神经网络模型的第一层为例,由于第一最高比特位已根据第二最高比特位修改为9,则修改第一定点化方案中的最低比特位为2。
根据本发明实施例提供的技术方案,通过量化第一定点化方案使得第一定点化方案的量化位宽为8比特,从而有效提高神经网络模型中数据的传输速度,同时有效减少对内存及存储资源的占用。另外,通过确定第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位,将第一最高比特位修改为第二最高比特位,并根据第二最高比特位修改第一定点化方案中的最低比特位以得到第二定点化方案,第二定点化方案的量化位宽为8比特,从而实现根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整,避免由于第一定点化方案固定而导致的预测结果精度降低的问题,从而有效提高神经网络模型的预测精度。
在本发明一实施例中,该调整方法还可包括步骤S210。
S210:在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化以得到每层中权重参数对应的第三定点化方案。
在本发明一实施例中,训练样本和待预测数据包括图片、视频或图表数据。
在本发明一实施例中,神经网络模型包括卷积神经网络模型、深度神经网络模型或循环神经网络模型。
图4是本发明另一实施例提供的一种神经网络模型的调整装置。如图4所示,该调整装置400包括:第一定点化模块410,用于在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;第一调整模块420,用于在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。
在本发明一实施例中,第一调整模块420包括:第一确定模块421,用于确定至少一个神经元的第二输出数据的最大值;第二调整模块422,用于根据最大值对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案。
在本发明一实施例中,该调整装置400还包括:量化模块430,用于量化第一定点化方案使得第一定点化方案的量化位宽为8比特。
在本发明一实施例中,第一调整模块420包括:第二确定模块423,用于确定第一定点化方案中的第一最高比特位和最大值对应的第二最高比特位;修改模块424,用于将第一最高比特位修改为第二最高比特位,并根据第二最高比特位修改第一定点化方案中的最低比特位以得到第二定点化方案,第二定点化方案的量化位宽为8比特。
在本发明一实施例中,第一定点化模块410包括:统计分析模块411,用于对至少一个神经元的第一输出数据进行统计分析以得到至少一个神经元的第一输出数据的有效位的信息;第二定点化模块412,用于根据至少一个神经元的第一输出数据的有效位的信息,对第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案。
在本发明一实施例中,神经网络模型的调整方法还包括:第三定点化模块440,用于在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化以得到每层中权重参数对应的第三定点化方案。
在本发明一实施例中,训练样本和待预测数据包括图片、视频或图表数据。
在本发明一实施例中,神经网络模型包括卷积神经网络模型、深度神经网络模型或循环神经网络模型。
根据本发明实施例提供的技术方案,通过设置第一定点化模块用于在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;第一调整模块用于在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测,从而有效避免了由于第一定点化方案固定而导致的预测结果精度降低的问题,并进一步提高预测结果的精度。
图5所示为本发明实施例的一种神经网络模型的调整系统500的框图。
参照图5,调整系统500包括处理组件510,其进一步包括一个或多个处理器,以及由存储器520所代表的存储器资源,用于存储可由处理组件510的执行的指令,例如应用程序。存储器520中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件510被配置为执行指令,以执行上述神经网络模型的调整方法。
调整系统500还可以包括一个电源组件被配置为执行调整系统500的电源管理,一个有线或无线网络接口被配置为将调整系统500连接到网络,和一个输入输出(I/O)接口。调整系统500可以操作基于存储在存储器520的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由上述调整系统500的处理器执行时,使得上述调整系统500能够执行一种神经网络模型的调整方法,包括在利用训练样本对神经网络模型进行训练过程中,对神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到至少一个神经元对应的第一定点化方案;在通过神经网络模型对待预测数据进行预测过程中,根据至少一个神经元的第二输出数据中的最大值,对至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,第二定点化方案用于对待预测数据进行预测。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再做过多描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序校验码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种神经网络模型的调整方法,其特征在于,包括:
在利用训练样本对神经网络模型进行训练过程中,对所述神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到所述至少一个神经元对应的第一定点化方案;
在通过所述神经网络模型对待预测数据进行预测过程中,根据所述至少一个神经元的第二输出数据中的最大值,对所述至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,所述第二定点化方案用于对所述待预测数据进行预测。
2.如权利要求1所述的调整方法,其特征在于,所述根据所述至少一个神经元的第二输出数据中的最大值,对所述至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,包括:
确定所述至少一个神经元的第二输出数据的所述最大值;
根据所述最大值对所述至少一个神经元对应的第一定点化方案进行调整以得到所述第二定点化方案。
3.如权利要求1所述的调整方法,其特征在于,在对所述神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到所述至少一个神经元对应的第一定点化方案之后,所述调整方法还包括:
量化所述第一定点化方案使得所述第一定点化方案的量化位宽为8比特。
4.如权利要求3所述的调整方法,其特征在于,所述根据所述至少一个神经元的第二输出数据中的最大值,对所述至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,包括:
确定所述第一定点化方案中的第一最高比特位和所述最大值对应的第二最高比特位;
将所述第一最高比特位修改为所述第二最高比特位;
根据所述第二最高比特位修改所述第一定点化方案中的最低比特位以得到所述第二定点化方案,所述第二定点化方案的量化位宽为8比特。
5.如权利要求1所述的调整方法,其特征在于,所述对所述神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到所述至少一个神经元对应的第一定点化方案,包括:
对所述至少一个神经元的所述第一输出数据进行统计分析以得到所述至少一个神经元的第一输出数据的有效位的信息;
根据所述至少一个神经元的第一输出数据的有效位的信息,对所述第一输出数据进行定点化以得到所述至少一个神经元对应的第一定点化方案。
6.如权利要求1所述的调整方法,其特征在于,所述调整方法还包括:
在利用所述训练样本对神经网络模型进行训练过程中,对所述神经网络模型的多个层中的每层的至少一个神经元的权重参数进行定点化以得到每层中所述权重参数对应的第三定点化方案。
7.如权利要求1-6中任一项所述的调整方法,其特征在于,所述训练样本和所述待预测数据包括图片、视频或图表数据。
8.如权利要求1-6中任一项所述的调整方法,其特征在于,所述神经网络模型包括卷积神经网络模型、深度神经网络模型或循环神经网络模型。
9.一种神经网络模型的调整装置,其特征在于,包括:
定点化模块,用于在利用训练样本对神经网络模型进行训练过程中,对所述神经网络模型的多个层中的每层的至少一个神经元的第一输出数据进行定点化以得到所述至少一个神经元对应的第一定点化方案;
调整模块,用于在通过所述神经网络模型对待预测数据进行预测过程中,根据所述至少一个神经元的第二输出数据中的最大值,对所述至少一个神经元对应的第一定点化方案进行调整以得到第二定点化方案,所述第二定点化方案用于对所述待预测数据进行预测。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1至8中的任一项所述的神经网络模型的调整方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910603830.6A CN110298438B (zh) | 2019-07-05 | 2019-07-05 | 神经网络模型的调整方法和调整装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910603830.6A CN110298438B (zh) | 2019-07-05 | 2019-07-05 | 神经网络模型的调整方法和调整装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298438A true CN110298438A (zh) | 2019-10-01 |
CN110298438B CN110298438B (zh) | 2024-04-26 |
Family
ID=68030359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910603830.6A Active CN110298438B (zh) | 2019-07-05 | 2019-07-05 | 神经网络模型的调整方法和调整装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298438B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368857A (zh) * | 2017-07-24 | 2017-11-21 | 深圳市图芯智能科技有限公司 | 图像对象检测方法、系统及模型处理方法、设备、终端 |
CN108009625A (zh) * | 2016-11-01 | 2018-05-08 | 北京深鉴科技有限公司 | 人工神经网络定点化后的微调方法和装置 |
CN108053028A (zh) * | 2017-12-21 | 2018-05-18 | 深圳云天励飞技术有限公司 | 数据定点化处理方法、装置、电子设备及计算机存储介质 |
CN108701250A (zh) * | 2017-10-16 | 2018-10-23 | 深圳市大疆创新科技有限公司 | 数据定点化方法和装置 |
CN109214515A (zh) * | 2017-06-30 | 2019-01-15 | 华为技术有限公司 | 一种深度神经网络推理方法及计算设备 |
US20190034784A1 (en) * | 2017-07-28 | 2019-01-31 | Beijing Deephi Intelligence Technology Co., Ltd. | Fixed-point training method for deep neural networks based on dynamic fixed-point conversion scheme |
CN109902745A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种基于cnn的低精度训练与8位整型量化推理方法 |
-
2019
- 2019-07-05 CN CN201910603830.6A patent/CN110298438B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009625A (zh) * | 2016-11-01 | 2018-05-08 | 北京深鉴科技有限公司 | 人工神经网络定点化后的微调方法和装置 |
CN109214515A (zh) * | 2017-06-30 | 2019-01-15 | 华为技术有限公司 | 一种深度神经网络推理方法及计算设备 |
CN107368857A (zh) * | 2017-07-24 | 2017-11-21 | 深圳市图芯智能科技有限公司 | 图像对象检测方法、系统及模型处理方法、设备、终端 |
US20190034784A1 (en) * | 2017-07-28 | 2019-01-31 | Beijing Deephi Intelligence Technology Co., Ltd. | Fixed-point training method for deep neural networks based on dynamic fixed-point conversion scheme |
CN108701250A (zh) * | 2017-10-16 | 2018-10-23 | 深圳市大疆创新科技有限公司 | 数据定点化方法和装置 |
CN108053028A (zh) * | 2017-12-21 | 2018-05-18 | 深圳云天励飞技术有限公司 | 数据定点化处理方法、装置、电子设备及计算机存储介质 |
CN109902745A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种基于cnn的低精度训练与8位整型量化推理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110298438B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220414426A1 (en) | Neural Architecture Search Method and Apparatus, Device, and Medium | |
CN111095302A (zh) | 稀疏深度卷积网络权重的压缩 | |
CN105447498A (zh) | 配置有神经网络的客户端设备、系统和服务器系统 | |
CN103279392B (zh) | 一种云计算环境下虚拟机上运行的负载分类方法 | |
CN111966484A (zh) | 一种基于深度强化学习的集群资源管理和任务调度方法及系统 | |
CN109992404A (zh) | 集群计算资源调度方法、装置、设备及介质 | |
CN106709565A (zh) | 一种神经网络的优化方法及装置 | |
CN112052948B (zh) | 一种网络模型压缩方法、装置、存储介质和电子设备 | |
CN111831358B (zh) | 权重精度配置方法、装置、设备及存储介质 | |
CN116644804B (zh) | 分布式训练系统、神经网络模型训练方法、设备和介质 | |
CN106796533A (zh) | 自适应地选择执行模式的系统和方法 | |
CN111831355A (zh) | 权重精度配置方法、装置、设备及存储介质 | |
CN111831359A (zh) | 权重精度配置方法、装置、设备及存储介质 | |
CN109214515A (zh) | 一种深度神经网络推理方法及计算设备 | |
CN115952832A (zh) | 自适应模型量化方法及装置、存储介质及电子装置 | |
CN114511042A (zh) | 一种模型的训练方法、装置、存储介质及电子装置 | |
CN111831356B (zh) | 权重精度配置方法、装置、设备及存储介质 | |
CN116302481B (zh) | 基于稀疏知识图谱链接预测的资源分配方法及系统 | |
CN110298438A (zh) | 神经网络模型的调整方法和调整装置 | |
CN111027669A (zh) | 在现场可编程门阵列上实现深度神经网络的方法及装置 | |
CN115730646A (zh) | 一种基于部分量化的混合专家网络优化方法 | |
CN115564987A (zh) | 一种基于元学习的图像分类模型的训练方法及应用 | |
CN108509984A (zh) | 激活值量化训练方法及装置 | |
US20180365350A1 (en) | Generating circuits | |
CN112990457B (zh) | 离线量化调优方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |