CN104951637A - 一种获取训练参数的方法及装置 - Google Patents
一种获取训练参数的方法及装置 Download PDFInfo
- Publication number
- CN104951637A CN104951637A CN201410114054.0A CN201410114054A CN104951637A CN 104951637 A CN104951637 A CN 104951637A CN 201410114054 A CN201410114054 A CN 201410114054A CN 104951637 A CN104951637 A CN 104951637A
- Authority
- CN
- China
- Prior art keywords
- interval
- parameter value
- parameter
- value interval
- lower limit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 237
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000011156 evaluation Methods 0.000 abstract 6
- 238000004458 analytical method Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000006854 communication Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
- G10L2015/0636—Threshold criteria for the updating
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种获取训练参数的方法及装置,属于计算机技术领域。所述方法包括:获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。所述装置包括:第一获取模块、第二获取模块和第三获取模块。本发明能够降低训练模型对序列信息进行预测分析的错误率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种获取训练参数的方法及装置。
背景技术
序列信息是被排成一列的信息元素,例如一段文字可以组成一个序列信息,序列信息的元素为该段文字中的各词。为了对序列信息进行分析以识别序列信息包括的信息元素和每个信息元素的位置,终端可以利用训练模型对序列信息进行预测分析以得到序列信息包括的信息元素和每个信息元素的位置。
在利用训练模型对序列信息进行预测分析之前终端需要获取一个训练参数并根据该训练参数对训练模型进行校正,如果使用未校正的训练模型对序列信息进行预测分析,导致预测分析出的结果的错误率较高。因此在利用训练模型之前对训练模型进行校正且校正的过程为:技术人员根据经验估计一个训练参数,将估计的训练参数输入给终端。终端接收技术人员输入的训练参数,利用该训练参数对训练模型进行校正。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
技术人员根据经验估计的训练参数可能不准确,终端利用该训练参数对训练模型进行校正,且利用校正后的训练模型对序列信息进行预测分析仍存在较高的错误率。
发明内容
为了降低训练模型对序列信息进行预测分析的错误率,本发明提供了一种获取训练参数的方法及装置。所述技术方案如下:
一种获取训练参数的方法,所述方法包括:
获取第一参数取值区间和精度值,所述第一参数取值区间包括训练参数,所述精度值为获取所述训练参数的精确程度;
根据所述精度值从所述第一参数取值区间中获取所述训练参数的取值区间,所述训练参数的取值区间满足预设精度条件;
从所述训练参数的取值区间中获取所述训练参数。
一种获取训练参数的装置,所述装置包括:
第一获取模块,用于获取第一参数取值区间和精度值,所述第一参数取值区间包括训练参数,所述精度值为获取所述训练参数的精确程度;
第二获取模块,用于根据所述精度值从所述第一参数取值区间中获取所述训练参数的取值区间,所述训练参数的取值区间满足预设精度条件;
第三获取模块,用于从所述训练参数的取值区间中获取所述训练参数。
在本发明实施例中,获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。由于根据精度值从第一参数取值区间中获取了满足预设精度推荐的训练参数的取值区间,因此从该训练参数的取值区间中获取的训练参数对应的错误概率非常小,用该训练参数对训练模型进行校正,可以很大程度上降低训练模型对序列信息进行预测分析的错误率。
附图说明
图1是本发明实施例1提供的一种获取训练参数的方法流程图;
图2是本发明实施例2提供的一种获取训练参数的方法流程图;
图3是本发明实施例3提供的一种获取训练参数的装置结构示意图;
图4是本发明实施例4提供的一种终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
序列信息是被排成一列的信息元素,目前在很多领域中都出现了序列信息,例如,在搜索引擎中序列信息为用户检索信息,用户检索信息是一种自然语音文字序列,其可能为一个关键词或一个句子,用户检索信息的信息元素为组成用户检索信息的词。在使用用户检索信息进行搜索之前,需要利用训练模型对用户检索信息进行预测分析以得到用户检索信息包括的词,再利用预测分析的词进行搜索。在利用训练模型对序列信息进行预测分析之前需要先获取一个训练参数并根据该训练参数对训练模型进行校正,如果使用未校正的训练模型对序列信息进行预测分析,导致预测分析出的结果的错误率较高。在本发明中,可以分别通过如几个实施例来获取训练参数。
实施例1
参见图1,本发明实施例提供了一种获取训练参数的方法,包括:
步骤101:获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;
步骤102:根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;
步骤103:从训练参数的取值区间中获取训练参数。
优选地,根据该精度值从第一参数取值区间中获取训练参数的取值区间,包括:
根据预设的第一优化系数和第二优化系数从第一参数取值区间中确定一个区间并将该区间作为第二参数取值区间;
如果第二参数取值区间满足预设精度条件,则将第二参数取值区间确定为训练参数的取值区间,该预设精度条件为第二参数取值区间的区间长度不超过精度值或第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过精度值。
进一步地,该方法还包括:
如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,则设置第一参数取值区间的下限值为第二参数取值区间的下限值;
根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
优选地,根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,包括:
获取第二参数取值区间的上限值;
根据第二优化系数、第一参数取值区间的下限值和上限值计算第一数值;
确定一个区间,所述区间的下限值为所述获取的上限值以及上限值为所述第一数值,并将所述第二参数取值区间更新为所述区间。
进一步地,该方法还包括:
如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,则设置第一参数取值区间的上限值为第二参数取值区间的上限值;
根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
优选地,根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,包括:
获取第二参数取值区间的下限值;
根据第一优化系数、第一参数取值区间的下限值和上限值计算第二数值;
确定一个区间,所述区间的上限值为所述获取的下限值以及下限值为所述第二数值,将所述第二参数取值区间更新为所述区间。
优选地,从训练参数的取值区间中获取训练参数,包括:
获取训练参数的取值区间的中间值并将该中间值确定为训练参数。
在本发明实施例中,获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。由于根据精度值从第一参数取值区间中获取了满足预设精度推荐的训练参数的取值区间,因此从该训练参数的取值区间中获取的训练参数对应的错误概率非常小,用该训练参数对训练模型进行校正,可以很大程度上降低训练模型对序列信息进行预测分析的错误率。
实施例2
参见图2,本发明实施例提供了一种获取训练参数的方法,包括:
步骤201:获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;
其中,第一参数取值区间为训练参数的初始取值区间,为了包含最小错误概率对应的训练参数,一般选取区间长度较大的初始取值区间。预先设置第一参数取值区间和获取训练参数的精度值,将预先设置的第一参数取值区间和精度值输入给终端。
本步骤具体为,获取预先设置的第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度。
例如,获取预先设置的第一参数取值区间[a1,b1]和精度值L,第一参数取值区间[a1,b1]包括训练参数δ,该精度值L为获取训练参数δ的精确程度。
步骤202:根据预设的第一优化系数和第二优化系数从第一参数取值区间中确定一个区间并将该区间作为第二参数取值区间;
其中,在本发明实施例中采用最优化算法自动选取错误概率最小的训练参数,在自动选取训练参数时最优化算法使用预设第一优化系数和第二优化系数对训练参数的取值区间进行优化。
最优化算法可以为0.618法或Fibonacci(Fibonacci,斐波纳契法)等。其中,0.618法使用的预设第一优化系数为0.382,第二优化系数为0.618。
本步骤具体为,根据预设的第一优化系数、第一参数取值区间的下限值和上限值计算第三数值,以及根据预设的第二优化系数、第一参数取值区间的下限值和上限值计算第四数值。确定一个区间,将该区间的下限值设置为第三数值以及将该区间的上限值设置为第四数值,将该区间作为第二参数取值区间。
例如,为了便于说明,本步骤以最优化算法为0.618法为例进行说明。根据预设的第一优化系数0.382、第一参数取值区间[a1,b1]的下限值a1和上限值b1计算第三数值c1=a1+0.382*(b1-a1),以及根据预设的第二优化系数0.618、第一参数取值区间[a1,b1]的下限值a1和上限值b1计算第四数值d1=a1+0.618*(b1-a1)。确定一个区间,将该区间的下限值设置为第三数值c1以及将该区间的上限值设置为第四数值d1,将该区间[c1,d1]作为第二参数取值区间。
步骤203:判断第二参数取值区间是否满足预设精度条件,如果满足执行步骤204,如果不满足执行步骤205;
其中,该预设精度条件为第二参数取值区间的区间长度不超过精度值或第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过精度值。
本步骤根据预设精度条件的不同可以通过如下第一和第二两种方法来实现,具体为:
第一,预设精度条件为第二参数取值区间的区间长度不超过精度值。计算第二参数取值区间的上限值与下限值之间的差值,将计算的差值作为第二参数取值区间的区间长度,比较该区间长度与精度值,如果该区间长度小于精度值,则判断出第二参数取值区间满足预设精度条件,执行步骤204。如果该区间长度大于或等于精度值,则判断出第二参数取值区间不满足预设精度条件,执行步骤205。
例如,预设精度条件为第二参数取值区间[c1,d1]的区间长度不超过精度值L。计算第二参数取值区间的上限值与下限值之间的差值(d1-c1),将计算的差值(d1-c1)作为第二参数取值区间的区间长度,比较该区间长度(d1-c1)与精度值L,如果该区间长度(d1-c1)小于精度值L,则判断出第二参数取值区间[c1,d1]满足预设精度条件,执行步骤204。如果该区间长度(d1-c1)大于或等于精度值L,则判断出第二参数取值区间[c1,d1]不满足预设精度条件,执行步骤205。
第二,预设精度条件为第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过精度值。计算第二参数取值区间的下限值对应的错误概率以及上限值对应的错误概率,计算下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值。比较该绝对值与预设精度值,如果该绝对值小于预设精度值,则判断出第二参数取值区间满足预设精度条件,执行步骤204。如果该绝对值大于或等于预设精度值,则判断出第二参数取值区间不满足预设精度条件,执行步骤205。
例如,假设第二参数取值区间[c1,d1]的下限值c1对应的错误概率为f(c1),上限值d1对应的错误概率为f(d1)。预设精度条件为第二参数取值区间[c1,d1]的下限值c1对应的错误概率为f(c1)与d1对应的错误概率为f(d1)之间的差值的绝对值|f(c1)-f(d1)|不超过精度值L。计算第二参数取值区间[c1,d1]的下限值c1对应的错误概率为f(c1)以及上限值d1对应的错误概率为f(d1),计算下限值c1对应的错误概率为f(c1)与上限值d1对应的错误概率为f(d1)之间的差值的绝对值|f(c1)-f(d1)|。比较该绝对值|f(c1)-f(d1)|与预设精度值L,如果该绝对值|f(c1)-f(d1)|小于预设精度值L,则判断出第二参数取值区间[c1,d1]满足预设精度条件,执行步骤204。如果该绝对值|f(c1)-f(d1)|大于或等于预设精度值L,则判断出第二参数取值区间[c1,d1]不满足预设精度条件,执行步骤205。
其中,计算第二参数取值区间的下限值对应的错误概率以及上限值对应的错误概率,具体为:
获取序列信息以及序列信息对应的正确分析结果,将获取的序列信息分成N等分,N为预设整数且N大于1。从分成的N等分序列信息中获取一份序列信息作为测试信息,将剩余的N-1份序列信息作为训练信息。将第二参数取值区间的下限值作为训练参数,利用训练信息和第二参数取值区间的下限值对训练模型进行训练,然后利用训练过的训练模型对测试信息进行分析,统计分析结果。比较统计的分析结果和获取的正确分析结果,获取分析结果与正确分析结果不一致的个数,计算不一致的个数与总分析结果个数的比值,将该比值作为该测试信息的错误率。对于N等分序列信息中除作为测试信息的一份序列信息以外的其他每份序列信息,同该份序列信息按照上述操作获取其他每份序列信息的错误率。按照上述方法获取N份序列信息的错误率之后,计算N份序列信息的错误率的平均值,将计算的平均值作为第二参数取值区间的下限值对应的错误概率。同样按照上述方法计算第二参数取值区间的上限值对应的错误概率。
其中,训练模型可以为CRF(Conditional Random Fields,条件随机域)模型等。
其中,对于第二参数取值区间的下限值对应的错误概率以及上限值对应的错误概率,除上述实现方式以外,还可以采用其他的方式来实现,如利用错误概率与训练参数之间的解析式来实现,具体为:
获取错误概率与训练参数之间的解析式,该解析式为关于训练参数的一元函数。将第二参数取值区间的下限值作为训练参数,将该下限值代入错误概率与训练参数之间的解析式,计算出该解析式的值,将计算的值确定为第二参数取值区间的下限值对应的错误概率。同样按照上述方法计算第二参数取值区间的上限值对应的错误概率。
步骤204:将第二参数取值区间确定为训练参数的取值区间,从训练参数的取值区间中获取训练参数,结束操作。
具体地,将第二参数取值区间确定为训练参数的取值区间,获取训练参数取值区间的中间值并将获取的中间值确定为训练参数。
其中,获取训练参数取值区间的中间值可以为计算训练参数的取值区间的下限值与上限值的平均值,将计算的平均值作为训练参数取值区间的中间值。
其中,本步骤除上述实现方式以外还存在其他的实现方式,如将第二参数取值区间确定为训练参数的取值区间,从训练参数的取值区间中获取任一数值,将获取的数值作为训练参数。
例如,将第二参数取值区间[c1,d1]确定为训练参数δ的取值区间,获取训练参数δ的取值区间[c1,d1]的中间值(c1+d1)/2并将获取的中间值(c1+d1)/2确定为训练参数δ。
其中,如果第二参数取值区间不满足预设精度条件,则比较第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率,如果下限值对应的错误概率大于上限值对应的错误概率,则执行步骤205,否则执行步骤208。
步骤205:比较第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率,如果下限值对应的错误概率大于上限值对应的错误概率,则执行步骤206,否则执行步骤208;
其中,如果预设精度条件为第二参数取值区间的区间长度不超过精度值,则在比较第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之前,需要先计算第二参数取值区间的下限值对应的错误概率以及上限值对应的错误概率。
例如,比较第二参数取值区间[c1,d1]的下限值c1对应的错误概率f(c1)与上限值d1对应的错误概率f(d1),如果下限值c1对应的错误概率f(c1)大于上限值d1对应的错误概率f(d1),则执行步骤206,否则执行步骤208。
步骤206:设置第一参数取值区间的下限值为第二参数取值区间的下限值;
其中,在第一参数取值区间中,距离训练参数较近的数值对应的错误概率较小,距离训练参数较远的数值对应的错误概率较大。
本步骤具体为,根据第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,判断出第二参数取值区间的下限值距离训练参数较远而上限值距离训练参数较近,由此可以推知训练参数必定不在第一参数取值区间的下限值与第二参数取值区间的下限值之间,因此从第一参数取值区间中将第一参数取值区间的下限值与第二参数取值区间的下限值之间的区间删除,删除后的第一参数取值区间的下限值更改为第二参数取值区间的下限值。
例如,根据第二参数取值区间[c1,d1]的下限值c1对应的错误概率f(c1)大于上限值d1对应的错误概率f(d1),判断出第二参数取值区间[c1,d1]的下限值c1距离训练参数δ较远而上限值d1距离训练参数δ较近,由此可以推知训练参数δ必定不在第一参数取值区间[a1,b1]的下限值a1与第二参数取值区间[c1,d1]的下限值c1之间,因此从第一参数取值区间[a1,b1]中将第一参数取值区间[a1,b1]的下限值a1与第二参数取值区间[c1,d1]的下限值c1之间的区间[a1,c1]删除,删除后的第一参数取值区间的下限值更改为第二参数取值区间的下限值,即更改后的第一参数取值区间变为[c1,b1]。
其中,对第一参数取值区间进行更新设置之后,需要通过如下步骤207更新第二参数取值区间。
步骤207:根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,然后返回执行步骤203;
具体地,获取第二参数取值区间的上限值。根据第二优化系数、第一参数取值区间的下限值和上限值计算第一数值。确定一个区间,该区间的下限值为获取的上限值以及上限值为第一数值,将第二参数取值区间更新为该区间,然后返回执行步骤203判断更新后的第二参数取值区间是否满足预设精度条件。
例如,获取第二参数取值区间[c1,d1]的上限值d1。根据第二优化系数0.618、第一参数取值区间[c1,b1]的下限值c1和上限值b1计算第一数值d2=c1+0.618*(b1-c1)。确定一个区间,该区间的下限值为获取的上限值d1以及上限值为第一数值d2,,将第二参数取值区间更新为该区间[d1,d2],然后返回执行步骤203判断更新后的第二参数取值区间[d1,d2]是否满足预设精度条件。
步骤208:设置第一参数取值区间的上限值为第二参数取值区间的上限值;
其中,在第一参数取值区间中,距离训练参数较近的数值对应的错误率较小,距离训练参数较远的数值对应的错误率较大。
本步骤具体为,根据第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,判断出第二参数取值区间的下限值距离训练参数较近而上限值距离训练参数较原,由此可以推知训练参数必定不在第二参数取值区间的上限值与第一参数取值区间的上限值之间,因此从第一参数取值区间中将第二参数取值区间的上限值与之间第一参数取值区间的上限值的区间删除,删除后的第一参数取值区间的上限值更改为第二参数取值区间的上限值。
例如,根据第二参数取值区间[c1,d1]的下限值c1对应的错误概率f(c1)小于或等于上限值d1对应的错误概率f(d1),判断出第二参数取值区间[c1,d1]的下限值c1距离训练参数δ较近而上限值d1距离训练参数δ较远,由此可以推知训练参数δ必定不在第二参数取值区间[c1,d1]的上限值d1与第一参数取值区间[a1,b1]的上限值b1之间,因此从第一参数取值区间[a1,b1]中将第二参数取值区间[c1,d1]的上限值d1与第一参数取值区间[a1,b1]的上限值b1之间的区间[d1,b1]删除,删除后的第一参数取值区间的下限值更改为第二参数取值区间的下限值,即更改后的第一参数取值区间变为[a1,d1]。
其中,对第一参数取值区间进行更新设置之后,需要通过如下步骤209更新第二参数取值区间。
步骤209:根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,然后返回执行步骤203;
具体地,获取第二参数取值区间的下限值。根据第一优化系数、第一参数取值区间的下限值和上限值计算第二数值。确定一个区间,该区间的上限值为获取的下限值以及下限值为第二数值,将第二参数取值区间更新为该区间,然后返回执行步骤203判断更新后的第二参数取值区间是否满足预设精度条件。
例如,获取第二参数取值区间[c1,d1]的下限值c1。根据第一优化系数0.382、第一参数取值区间[a1,d1]的下限值a1和上限值d1计算第二数值c2=a1+0.382*(d1-a1)。确定一个区间,该区间的上限值为获取的下限值c1以及下限值为第二数值c2,将第二参数取值区间更新为该区间[c2,c1],然后返回执行步骤203判断更新后的第二参数取值区间[c2,c1]是否满足预设精度条件。
其中,为了进一步方便理解本发明实施例提供的方法,下面举例进行说明:
假设错误率f与训练参数δ之间的解析式为:f(δ)=(δ-1)2
1)、选定第一参数取值区间[a1,b1]为[0,2],精度值为L=0.03;
2)、计算第二参数取值区间[c1,d1]的下限值c1和d1及其分别对应的错误率
c1=a1+0.382×(b1-a1)=0+0.382×(2-0)=0.764
d1=a1+0.618×(b1-a1)=0+0.618×(2-0)=1.236
f(c1)=(0.764-1)2=0.055696f(d1)=(1.236-1)2=0.055696
3)、由于d1–c1=0.472>L,且f(c1)≤f(d1)
则将第一参数取值区间的上限值更新为第二参数取值区间的上限值:a2=a1=0,b2=d1=1.236,更新后第一参数取值区间[a2,b2]为[0,1.236]。
更新第二参数取值区间:d2=c1=0.764,c2=a2+0.382×(b2-a2)=0+0.382×(1.236-0)=0.472152,更新后第二参数取值区间[c2,d2]为[0.472152,0.764]。
分别计算c2和d2对应的错误率:
f(c2)=(0.472152-1)2=0.278624,f(d2)=(0.764-1)2=0.055696
4)、由于d2–c2=0.291848>L,且f(c2)>f(d2)
则将第一参数取值区间的下限值更新为第二参数取值区间的下限值:a3=c2=0.472152,b3=b2=1.236,更新后第一参数取值区间[a3,b3]为[0.472152,1.236]。
更新第二参数取值区间:c3=d2=0.764,d3=a3+0.618×(b3-a3)=0.94421,更新后第二参数取值区间[c3,d3]为[0.764,0.94421]。
分别计算c3和d3对应的错误率:
f(c3)=0.055696,f(d3)=0.0031125
5)、由于d3–c3=0.18021>L,且f(c3)>f(d3)
则将第一参数取值区间的下限值更新为第二参数取值区间的下限值:a4=c3=0.764,b4=b3=1.236,更新后第一参数取值区间[a4,b4]为[0.764,1.236]。
更新第二参数取值区间:c4=d3=0.94421,d4=a4+0.618×(b4-a4)=1.055696,更新后第二参数取值区间[c4,d4]为[0.94421,1.055696]。
分别计算c4和d4对应的错误率:
f(c4)=0.0031125,f(d4)=0.0031020
6)、由于d4–c4=0.111486>L,且f(c4)>f(d4)
则将第一参数取值区间的下限值更新为第二参数取值区间的下限值:a5=c4=0.94421,b5=b4=1.236,更新后第一参数取值区间[a5,b5]为[0.94421,1.236]。
更新第二参数取值区间:c5=d4=1.055696,d5=a5+0.618×(b5-a5)=1.12454,更新后第二参数取值区间[c5,d5]为[1.055696,1.12454]。
分别计算c5和d5对应的错误率:
f(c5)=0.0031020,f(d5)=0.015509
7)、由于d5–c5=0.068844>L,且f(c5)<f(d5)
则将第一参数取值区间的上限值更新为第二参数取值区间的上限值:a6=a5=0.94421,b6=d5=1.12454,更新后第一参数取值区间[a6,b6]为[0.94421,1.12454]。
更新第二参数取值区间:d6=c5=1.055696,c6=a6+0.382×(b6-a6)=1.013096,更新后第二参数取值区间[c6,d6]为[1.013096,1.055696]。
分别计算c6和d6对应的错误率:
f(c6)=0.0001715,f(d6)=0.0031020
8)、由于d6–c6=0.0426>L,且f(c6)<f(d6)
则将第一参数取值区间的上限值更新为第二参数取值区间的上限值:a7=a6=0.94421,b7=d6=1.055696,更新后第一参数取值区间[a7,b7]为[0.94421,1.055696]。
更新第二参数取值区间:d7=c6=1.013096,c7=a7+0.382×(b7-a7)=0.98680,更新后第二参数取值区间[c7,d7]为[0.98680,1.013096]。
分别计算c7和d7对应的错误率:
f(c7)=0.00017430,f(d7)=0.00017150
9)、由于d7–c7=0.026<L,满足预设精度条件,
计算训练参数δ=(c7+d7)/2=0.999948,结束运算。
在本发明实施例中,获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。由于根据精度值从第一参数取值区间中获取了满足预设精度推荐的训练参数的取值区间,因此从该训练参数的取值区间中获取的训练参数对应的错误概率非常小,用该训练参数对训练模型进行校正,可以很大程度上降低训练模型对序列信息进行预测分析的错误率。
实施例3
参见图3,本发明实施例提供了一种获取训练参数的装置,包括:
第一获取模块301,用于获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;
第二获取模块302,用于根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;
第三获取模块303,用于从训练参数的取值区间中获取训练参数。
其中,第一参数取值区间为训练参数的初始取值区间,预先设置第一参数取值区间和获取训练参数的精度值,将预先设置的第一参数取值区间和精度值输入给终端。第一获取模块301获取预先设置的第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度。
其中,在本发明实施例中采用最优化算法自动选取错误概率最小的训练参数,在自动选取训练参数时最优化算法使用预设第一优化系数和第二优化系数对训练参数的取值区间进行优化。
其中,第二获取模块302包括:
第一确定单元,用于根据预设的第一优化系数和第二优化系数从第一参数取值区间中确定一个区间并将该区间作为第二参数取值区间;
第二获取模块302,还用于判断第二参数取值区间是否满足预设精度条件;
第二确定单元,用于如果第二参数取值区间满足预设精度条件,则将第二参数取值区间确定为训练参数的取值区间,预设精度条件为第二参数取值区间的区间长度不超过精度值或第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过精度值。
进一步地,第二获取模块302,还包括:
第一设置单元,用于如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,则设置第一参数取值区间的下限值为第二参数取值区间的下限值;
第一更新单元,用于根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
其中,第一更新单元包括:
第一获取子单元,用于获取第二参数取值区间的上限值;
第一计算子单元,用于根据第二优化系数、第一参数取值区间的下限值和上限值计算第一数值;
第一更新子单元,用于确定一个区间,所述区间的下限值为所述获取的上限值以及上限值为所述第一数值,并将所述第二参数取值区间更新为所述区间。
进一步地,第二获取模块302,还包括:
第二设置单元,用于如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,则设置第一参数取值区间的上限值为第二参数取值区间的上限值;
第二更新单元,用于根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
其中,第二更新单元包括:
第二获取子单元,用于获取第二参数取值区间的下限值;
第二计算子单元,用于根据第一优化系数、第一参数取值区间的下限值和上限值计算第二数值;
第二更新子单元,用于确定一个区间,所述区间的上限值为所述获取的下限值以及下限值为所述第二数值,将所述第二参数取值区间更新为所述区间。
其中,第三获取模块303,用于获取训练参数的取值区间的中间值并将该中间值确定为训练参数。
在本发明实施例中,获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。由于根据精度值从第一参数取值区间中获取了满足预设精度推荐的训练参数的取值区间,因此从该训练参数的取值区间中获取的训练参数对应的错误概率非常小,用该训练参数对训练模型进行校正,可以很大程度上降低训练模型对序列信息进行预测分析的错误率。
实施例4
图4是本发明实施例提供的终端的结构示意图。该终端可以用于实施上述实施例中提供的获取训练参数的方法。具体来讲:
终端900可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi(wireless fidelity,无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图4中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,RF电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband CodeDivision Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。
存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端900的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端900的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端900还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端900移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端900还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端900之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端900的通信。
WiFi属于短距离无线传输技术,终端900通过WiFi模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块170,但是可以理解的是,其并不属于终端900的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端900的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端900的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端900还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端900还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端900的显示单元是触摸屏显示器,终端900还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行述一个或者一个以上程序包含用于进行以下操作的指令:
获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;
根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;
从训练参数的取值区间中获取训练参数。
优选地,根据该精度值从第一参数取值区间中获取训练参数的取值区间,包括:
根据预设的第一优化系数和第二优化系数从第一参数取值区间中确定一个区间并将该区间作为第二参数取值区间;
如果第二参数取值区间满足预设精度条件,则将第二参数取值区间确定为训练参数的取值区间,该预设精度条件为第二参数取值区间的区间长度不超过精度值或第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过精度值。
进一步地,该方法还包括:
如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,则设置第一参数取值区间的下限值为第二参数取值区间的下限值;
根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
优选地,根据第二优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,包括:
获取第二参数取值区间的上限值;
根据第二优化系数、第一参数取值区间的下限值和上限值计算第一数值;
确定一个区间,所述区间的下限值为所述获取的上限值以及上限值为所述第一数值,并将所述第二参数取值区间更新为所述区间。
进一步地,该方法还包括:
如果第二参数取值区间不满足预设精度条件且第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,则设置第一参数取值区间的上限值为第二参数取值区间的上限值;
根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间。
优选地,根据第一优化系数、第一参数取值区间的下限值和上限值从第一参数取值区间中确定一个区间并将第二参数取值区间更新为该区间,包括:
获取第二参数取值区间的下限值;
根据第一优化系数、第一参数取值区间的下限值和上限值计算第二数值;
确定一个区间,所述区间的上限值为所述获取的下限值以及下限值为所述第二数值,将所述第二参数取值区间更新为所述区间。
优选地,从训练参数的取值区间中获取训练参数,包括:
获取训练参数的取值区间的中间值并将该中间值确定为训练参数。
在本发明实施例中,获取第一参数取值区间和精度值,第一参数取值区间包括训练参数,该精度值为获取训练参数的精确程度;根据该精度值从第一参数取值区间中获取训练参数的取值区间,该训练参数的取值区间满足预设精度条件;从训练参数的取值区间中获取训练参数。由于根据精度值从第一参数取值区间中获取了满足预设精度推荐的训练参数的取值区间,因此从该训练参数的取值区间中获取的训练参数对应的错误概率非常小,用该训练参数对训练模型进行校正,可以很大程度上降低训练模型对序列信息进行预测分析的错误率。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种获取训练参数的方法,其特征在于,所述方法包括:
获取第一参数取值区间和精度值,所述第一参数取值区间包括训练参数,所述精度值为获取所述训练参数的精确程度;
根据所述精度值从所述第一参数取值区间中获取所述训练参数的取值区间,所述训练参数的取值区间满足预设精度条件;
从所述训练参数的取值区间中获取所述训练参数。
2.如权利要求1所述的方法,其特征在于,所述根据所述精度值从所述第一参数取值区间中获取所述训练参数的取值区间,包括:
根据预设的第一优化系数和第二优化系数从所述第一参数取值区间中确定一个区间并将所述区间作为第二参数取值区间;
如果所述第二参数取值区间满足预设精度条件,则将所述第二参数取值区间确定为所述训练参数的取值区间,所述预设精度条件为所述第二参数取值区间的区间长度不超过所述精度值或所述第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过所述精度值。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述第二参数取值区间不满足所述预设精度条件且所述第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,则设置所述第一参数取值区间的下限值为所述第二参数取值区间的下限值;
根据所述第二优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间。
4.如权利要求3所述的方法,其特征在于,所述根据所述第二优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间,包括:
获取所述第二参数取值区间的上限值;
根据所述第二优化系数、所述第一参数取值区间的下限值和上限值计算第一数值;
确定一个区间,所述区间的下限值为所述获取的上限值以及上限值为所述第一数值,并将所述第二参数取值区间更新为所述区间。
5.如权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述第二参数取值区间不满足所述预设精度条件且所述第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,则设置所述第一参数取值区间的上限值为所述第二参数取值区间的上限值;
根据所述第一优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间。
6.如权利要求5所述的方法,其特征在于,所述根据所述第一优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间,包括:
获取所述第二参数取值区间的下限值;
根据所述第一优化系数、所述第一参数取值区间的下限值和上限值计算第二数值;
确定一个区间,所述区间的上限值为所述获取的下限值以及下限值为所述第二数值,将所述第二参数取值区间更新为所述区间。
7.如权利要求1所述的方法,其特征在于,所述从所述训练参数的取值区间中获取所述训练参数,包括:
获取所述训练参数的取值区间的中间值并将所述中间值确定为所述训练参数。
8.一种获取训练参数的装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一参数取值区间和精度值,所述第一参数取值区间包括训练参数,所述精度值为获取所述训练参数的精确程度;
第二获取模块,用于根据所述精度值从所述第一参数取值区间中获取所述训练参数的取值区间,所述训练参数的取值区间满足预设精度条件;
第三获取模块,用于从所述训练参数的取值区间中获取所述训练参数。
9.如权利要求8所述的装置,其特征在于,所述第二获取模块包括:
第一确定单元,用于根据预设的第一优化系数和第二优化系数从所述第一参数取值区间中确定一个区间并将所述区间作为第二参数取值区间;
第二确定单元,用于如果所述第二参数取值区间满足预设精度条件,则将所述第二参数取值区间确定为所述训练参数的取值区间,所述预设精度条件为所述第二参数取值区间的区间长度不超过所述精度值或所述第二参数取值区间的下限值对应的错误概率与上限值对应的错误概率之间的差值的绝对值不超过所述精度值。
10.如权利要求9所述的装置,其特征在于,所述第二获取模块,还包括:
第一设置单元,用于如果所述第二参数取值区间不满足所述预设精度条件且所述第二参数取值区间的下限值对应的错误概率大于上限值对应的错误概率,则设置所述第一参数取值区间的下限值为所述第二参数取值区间的下限值;
第一更新单元,用于根据所述第二优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间。
11.如权利要求10所述的装置,其特征在于,所述第一更新单元包括:
第一获取子单元,用于获取所述第二参数取值区间的上限值;
第一计算子单元,用于根据所述第二优化系数、所述第一参数取值区间的下限值和上限值计算第一数值;
第一更新子单元,用于确定一个区间,所述区间的下限值为所述获取的上限值以及上限值为所述第一数值,并将所述第二参数取值区间更新为所述区间。
12.如权利要求9所述的装置,其特征在于,所述第二获取模块,还包括:
第二设置单元,用于如果所述第二参数取值区间不满足所述预设精度条件且所述第二参数取值区间的下限值对应的错误概率小于或等于上限值对应的错误概率,则设置所述第一参数取值区间的上限值为所述第二参数取值区间的上限值;
第二更新单元,用于根据所述第一优化系数、所述第一参数取值区间的下限值和上限值从所述第一参数取值区间中确定一个区间并将所述第二参数取值区间更新为所述区间。
13.如权利要求12所述的装置,其特征在于,所述第二更新单元包括:
第二获取子单元,用于获取所述第二参数取值区间的下限值;
第二计算子单元,用于根据所述第一优化系数、所述第一参数取值区间的下限值和上限值计算第二数值;
第二更新子单元,用于确定一个区间,所述区间的上限值为所述获取的下限值以及下限值为所述第二数值,将所述第二参数取值区间更新为所述区间。
14.如权利要求8所述的装置,其特征在于,所述第三获取模块,用于获取所述训练参数的取值区间的中间值并将所述中间值确定为所述训练参数。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410114054.0A CN104951637B (zh) | 2014-03-25 | 2014-03-25 | 一种获取训练参数的方法及装置 |
PCT/CN2014/089926 WO2015143873A1 (en) | 2014-03-25 | 2014-10-30 | Method and apparatus for acquiring training parameters for a model |
US15/187,571 US9892368B2 (en) | 2014-03-25 | 2016-06-20 | Method and apparatus for acquiring training parameters to calibrate a model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410114054.0A CN104951637B (zh) | 2014-03-25 | 2014-03-25 | 一种获取训练参数的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104951637A true CN104951637A (zh) | 2015-09-30 |
CN104951637B CN104951637B (zh) | 2018-04-03 |
Family
ID=54166294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410114054.0A Active CN104951637B (zh) | 2014-03-25 | 2014-03-25 | 一种获取训练参数的方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9892368B2 (zh) |
CN (1) | CN104951637B (zh) |
WO (1) | WO2015143873A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10438132B2 (en) | 2015-12-16 | 2019-10-08 | Accenture Global Solutions Limited | Machine for development and deployment of analytical models |
US10387798B2 (en) | 2015-12-16 | 2019-08-20 | Accenture Global Solutions Limited | Machine for development of analytical models |
US11080435B2 (en) | 2016-04-29 | 2021-08-03 | Accenture Global Solutions Limited | System architecture with visual modeling tool for designing and deploying complex models to distributed computing clusters |
US10871753B2 (en) * | 2016-07-27 | 2020-12-22 | Accenture Global Solutions Limited | Feedback loop driven end-to-end state control of complex data-analytic systems |
KR102197247B1 (ko) | 2017-06-01 | 2020-12-31 | 한국전자통신연구원 | 파라미터 서버 및 그것에 의해 수행되는 분산 딥러닝 파라미터 공유 방법 |
US11710033B2 (en) | 2018-06-12 | 2023-07-25 | Bank Of America Corporation | Unsupervised machine learning system to automate functions on a graph structure |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6931602B1 (en) * | 2000-12-22 | 2005-08-16 | Cognex Corporation | Approach facilitating the selection of various machine vision functionality from among different platforms |
CN102779193A (zh) * | 2012-07-16 | 2012-11-14 | 哈尔滨工业大学 | 自适应个性化信息检索系统及方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6044344A (en) * | 1997-01-03 | 2000-03-28 | International Business Machines Corporation | Constrained corrective training for continuous parameter system |
US20120066163A1 (en) * | 2010-09-13 | 2012-03-15 | Nottingham Trent University | Time to event data analysis method and system |
CN102694800A (zh) * | 2012-05-18 | 2012-09-26 | 华北电力大学 | 网络安全态势预测的高斯过程回归方法 |
-
2014
- 2014-03-25 CN CN201410114054.0A patent/CN104951637B/zh active Active
- 2014-10-30 WO PCT/CN2014/089926 patent/WO2015143873A1/en active Application Filing
-
2016
- 2016-06-20 US US15/187,571 patent/US9892368B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6931602B1 (en) * | 2000-12-22 | 2005-08-16 | Cognex Corporation | Approach facilitating the selection of various machine vision functionality from among different platforms |
CN102779193A (zh) * | 2012-07-16 | 2012-11-14 | 哈尔滨工业大学 | 自适应个性化信息检索系统及方法 |
Non-Patent Citations (2)
Title |
---|
房亚东 等: "《现代设计方法与应用》", 28 February 2013, 机械工业出版社 * |
闫丹 等: "基于黄金分割和BP网络的气体体积分数预测模型", 《传感器与微系统》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2015143873A1 (en) | 2015-10-01 |
CN104951637B (zh) | 2018-04-03 |
US20160307115A1 (en) | 2016-10-20 |
US9892368B2 (en) | 2018-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105005909A (zh) | 预测流失用户的方法及装置 | |
CN104954402A (zh) | 一种应用推荐方法、系统及装置 | |
CN104965721A (zh) | 一种对应用程序进行更新的方法及装置 | |
CN104281394A (zh) | 智能选词的方法和装置 | |
CN104951637A (zh) | 一种获取训练参数的方法及装置 | |
CN103530115B (zh) | 一种应用程序显示方法、装置及终端设备 | |
CN104572430A (zh) | 一种终端应用界面的测试方法、装置和系统 | |
CN104636047A (zh) | 对列表中的对象进行操作的方法、装置及触屏终端 | |
CN104850507A (zh) | 一种数据缓存方法和数据缓存装置 | |
CN106170034B (zh) | 一种音效处理方法及移动终端 | |
CN104965716A (zh) | 图标更新方法、客户端装置、及终端设备 | |
CN104239343A (zh) | 一种用户输入信息的处理方法和装置 | |
CN104281600A (zh) | 智能选词的方法和装置 | |
CN103177217B (zh) | 一种文件扫描方法、系统及客户端和服务器 | |
CN105447583A (zh) | 一种预测用户离网的方法及装置 | |
CN104360307A (zh) | 一种定位方法和装置 | |
CN104618223A (zh) | 一种信息推荐的管理方法、装置和系统 | |
CN105307242A (zh) | 一种Wi-Fi网络使用方法及终端 | |
CN105045372A (zh) | 一种控制穿戴设备的方法及装置 | |
CN105512150A (zh) | 一种信息搜索方法及装置 | |
CN106506815A (zh) | 一种应用的启用方法及相关设备 | |
CN104699501A (zh) | 一种运行应用程序的方法及装置 | |
CN105550316A (zh) | 音频列表的推送方法及装置 | |
CN103383701A (zh) | 信息检索方法、装置及终端 | |
CN104281610A (zh) | 过滤微博的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |