CN101630508B - 信息处理设备、信息处理方法 - Google Patents
信息处理设备、信息处理方法 Download PDFInfo
- Publication number
- CN101630508B CN101630508B CN2009101594932A CN200910159493A CN101630508B CN 101630508 B CN101630508 B CN 101630508B CN 2009101594932 A CN2009101594932 A CN 2009101594932A CN 200910159493 A CN200910159493 A CN 200910159493A CN 101630508 B CN101630508 B CN 101630508B
- Authority
- CN
- China
- Prior art keywords
- expression formula
- feature extraction
- algorithm
- extraction expression
- optimal solution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 9
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 200
- 238000004458 analytical method Methods 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 65
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims description 386
- 238000012545 processing Methods 0.000 claims description 133
- 230000002159 abnormal effect Effects 0.000 claims description 104
- 238000004364 calculation method Methods 0.000 claims description 64
- 108090000623 proteins and genes Proteins 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 4
- 230000002068 genetic effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 61
- 238000010801 machine learning Methods 0.000 description 52
- 230000008569 process Effects 0.000 description 50
- 238000012935 Averaging Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 244000283207 Indigofera tinctoria Species 0.000 description 1
- 240000007711 Peperomia pellucida Species 0.000 description 1
- 235000012364 Peperomia pellucida Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种信息处理设备、信息处理方法以及程序,其中该信息处理设备包括:算法配置部件,其通过使用基因搜索技术来配置用于对输入信号执行辨别的算法;以及折衷分析部件,其通过基于算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
Description
技术领域
本发明涉及一种信息处理设备、信息处理方法以及程序。更具体地说,本发明涉及一种可以提供多个具有评估指标间的折衷关系的算法的信息处理设备、信息处理方法以及程序。
背景技术
已经提出了一种通过使用基因搜索技术来自动配置特征量提取算法的技术(自动算法配置技术),其中特征量提取算法用于提取表示给定数据的特征的特征量。在自动算法配置技术中,可以自动地配置用于语音识别、图像识别等的算法。
例如,本受让人已经提出了一种这样的技术(例如,参考国际专利公布No.WO2007/049641),其用于配置可以以高准确度从诸如音乐数据的内容数据中快速地提取特征量的算法。
发明内容
在自动算法配置技术中,仅仅最高性能(最高准确度)的算法被输出。因此,例如,当存在诸如性能(准确度)和速度(处理时间)的两个评估指标时,即使可以稍微降低性能,要获得以高速度操作的算法也是困难的。虽然一旦算法被配置就可以减小评估指标中的一个,但是相关领域中的技术典型地不可以处理变化,例如,期望增大评估指标中的一个。
本发明是鉴于这种情形而设计的,并且期望有可能提出多个具有评估指标间的折衷关系的算法。
根据本发明的一个实施例,提供了一种信息处理设备。该信息处理设备包括:算法配置装置,用于通过使用基因搜索技术来配置用于对输入信号执行辨别的算法;以及折衷分析装置,用于通过基于算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
信息处理设备还可以包括最佳算法确定装置,用于在帕累托最优解当中确定与所要求的评估指标条件相匹配的最佳算法。
由算法配置装置配置的算法可以具有特征提取表达式和信息估计表达式,其中信息估计表达式是特征提取表达式的组合。
折衷分析装置可以通过使用具有不同数目的特征提取表达式的算法来生成初始状态中的帕累托最优解,其中该算法通过从由算法配置装置配置的算法中逐个地删除特征提取表达式来创建。
折衷分析装置可以使用由算法配置装置配置的算法作为初始状态中的帕累托最优解。
折衷分析装置可以通过随机地改变初始状态中的帕累托最优解中的每个特征提取表达式的使用或不使用,更新帕累托最优解。
最佳算法确定装置可以基于所要求的处理时间和准确度而在帕累托最优解当中确定最佳算法。
信息处理设备还可以包括评估值计算装置,用于确定信息估计表达式中的特征提取表达式的评估值,并且算法配置装置可以基于所确定的特征提取表达式的评估值而更新信息估计表达式中的特征提取表达式。
当算法配置装置配置多个信息估计表达式作为算法时,信息估计表达式中的相同特征提取表达式的贡献率的总值可以被用作对应的特征提取表达式的评估值。
根据本发明的另一实施例,提供了一种用于信息处理设备的信息处理方法,其中信息处理设备包括:算法配置装置,用于配置算法;以及折衷分析装置,用于确定算法的帕累托最优解。该信息处理方法包括以下步骤:通过基因搜索技术来配置用于对输入信号执行辨别的算法;以及通过基于算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
根据本发明的另一实施例,提供了一种程序。该程序使计算机用作以下装置:算法配置装置,用于通过使用基因搜索技术来配置用于对输入信号执行辨别的算法;以及折衷分析装置,用于通过基于算法执行折衷分析来确定算法关于评估指标的帕累托最优解。
根据本发明的实施例,配置用于对输入信号执行辨别的算法,并且基于所配置的算法执行折衷分析。结果,确定出算法关于评估指标的多个帕累托最优解。
根据本发明的实施例,可以提供多个具有评估指标间的折衷关系的算法。
附图说明
图1是示出根据本发明实施例的信息处理设备的配置的示例的框图;
图2示出输入到信息处理设备的采样信号的示例;
图3是图示要被生成的算法的结构的图;
图4是示出异常声音辨别表达式的结构;
图5是图示要被生成的算法的另一结构的图;
图6是示出信息提取器的配置示例的框图;
图7示出特征提取表达式的示例;
图8示出一个特征提取表达式的示例;
图9图示输入信号的类型;
图10图示输入信号的类型;
图11图示输入信号的类型;
图12图示操作符的类型;
图13是示出由自动算法配置部件执行的自动算法配置的示例的图;
图14图示选择生成;
图15图示交叉生成;
图16图示变异生成;
图17图示下一代特征提取表达式的生成的示例;
图18图示下一代特征提取表达式;
图19是示出自动算法配置部件的详细配置的示例的框图;
图20图示由学习数据剪截部件执行的处理;
图21示出由特征量计算部件计算的特征量的示例;
图22示出被提供到机器学习部件的数据的示例;
图23A和23B图示由机器学习部件执行的处理;
图24图示由机器学习部件执行的处理;
图25图示由机器学习部件执行的处理;
图26A和26B图示由机器学习部件执行的处理;
图27图示帕累托最优解;
图28图示帕累托最优解的初始化;
图29图示帕累托最优解的初始化;
图30图示帕累托最优解的初始化;
图31图示帕累托最优解的初始化;
图32图示帕累托最优解的更新;
图33是图示帕累托最优解的更新的图表;
图34是图示帕累托最优解的更新的图表;
图35是图示帕累托最优解的更新的图表;
图36图示最佳算法的确定;
图37图示异常声音辨别处理;
图38是图示自动算法配置处理的流程图;
图39是图示特征提取表达式列表生成处理的流程图;
图40是图示随机生成处理的流程图;
图41是图示下一代列表生成处理的流程图;
图42是图示选择生成处理的流程图;
图43是图示交叉生成处理的流程图;
图44是图示变异生成处理的流程图;
图45是图示随机生成处理的流程图;
图46是图示特征量计算处理的流程图;
图47是图示机器学习处理的流程图;
图48是图示折衷分析处理的流程图;
图49是图示帕累托最优解初始化处理的流程图;
图50是示出根据本发明另一实施例的自动算法配置系统的框图;
图51示出教师数据的示例;
图52示出被提供到评估值计算部件的特征量和平均时间的示例;
图53A和53B示出每个特征量的使用/不使用的示例;
图54示出所计算的特征量的示例;
图55示出总计算时间的计算的示例;
图56示出速度评估参考值、亮度评估参考值和总计算时间的示例;
图57图示帕累托最优解的更新;
图58是图示帕累托最优解搜索处理的流程图;
图59是图示特征量计算处理的流程图;
图60是图示评估值计算处理的流程图;
图61是图示评估值确定处理的流程图;以及
图62是示出根据本发明的一个实施例的计算机的配置示例的框图。
具体实施方式
图1示出根据本发明的一个实施例的信息处理设备的配置的示例。
信息处理设备1执行用于检测异常声音的处理,基于作为学习数据输入的样本信号自动地配置算法,其中样本信号是异常声音还是正常声音是已知的。信息处理设备1根据自动配置的算法来确定新的输入信号(在下文中,被称为“新信号”)是具有异常声音还是具有正常声音。
信息处理设备1包括:样本信号输入部件11、样本信号存储部件12、自动算法配置部件13、折衷分析部件14、帕累托最优解存储部件15、使用算法确定部件16、新信号输入部件17、自动异常声音辨别部件18、异常声音辨别结果输出部件19和校正信息输入部件20。
用于算法配置的样本信号从信息处理设备1中的另一区块(未示出)或从另一设备输入到样本信号输入部件11。响应于用于算法配置的样本信号,样本信号输入部件11将样本信号提供到样本信号存储部件12。
样本信号存储部件12存储从样本信号输入部件11提供的样本信号,作为教师数据。自动异常声音辨别部件18和校正信息输入部件20将信号(在下面描述)提供到样本信号存储部件12。
表示输入到样本信号输入部件11的样本信号是否具有正常声音或异常声音的数据作为标注被附连到样本信号。
图2是输入到样本信号输入部件11的样本信号的示例。在图2中,水平轴表示时间,并且样本信号和标注在每个时间点具有一对一的对应关系。表示样本信号是正常声音还是异常声音的标注可以被规定为具有高电平或低电平的信号。
通过基于基因搜索技术来执行学习,自动算法配置部件13配置(生成)用于针对不知道是异常声音还是正常声音的新信号辨别异常声音或正常声音的算法。所配置的算法是这样的算法(特征量提取算法),其用于提取表示输入信号的预定特征的特征量并且使得有可能基于由算法提取的特征量(值)是否大于或等于预定阈值而辨别异常声音和正常声音。下面参考图3及后续图来描述算法配置的细节。
折衷分析部件14通过基于由自动算法配置部件13配置的算法而执行折衷分析,确定帕累托最优解作为算法。然后,折衷分析部件14将作为帕累托最优解的多个算法提供到帕累托最优解存储部件15。帕累托最优解存储部件15存储从折衷分析部件14提供的多个算法(其是帕累托最优解)。
在存储在帕累托最优解存储部件15中的多个算法当中,使用算法确定部件16确定与所要求的用于评估指标的条件相匹配的最佳算法,并且将所确定的最佳算法提供到自动异常声音辨别部件18。评估指标例如包括信息处理设备1的当前可用资源状态和所要求性能。
新信号输入部件17接收所输入的将要进行异常声音辨别的新信号,并且将所接收的新信号提供到自动异常声音辨别部件18。
自动异常声音辨别部件18使用从使用算法确定部件16提供的算法来对从新信号输入部件17提供的新信号辨别异常声音和正常信号,并且将辨别结果提供到异常声音辨别结果输出部件19。自动异常声音辨别部件18还将辨别结果作为标注加到从新信号输入部件17提供的新信号,并且将所得到的信号提供到样本信号存储部件12以便存储。这样,从新信号输入部件17提供的新信号作为新的样本信号被存储在样本信号存储部件12中。
异常声音辨别结果输出部件19以声音或图像形式输出从自动异常声音辨别部件18提供的辨别结果。例如,当新信号具有异常声音时,异常声音辨别结果输出部件19输出表示异常声音的声音,或者在屏幕上显示 示出文字“正常声音”或“异常声音”的视频。
当存储在样本信号存储部件12中的样本信号的标注有错误时,校正信息输入部件20对标注进行校正。也就是说,校正信息输入部件20响应于用户操作而改写样本信号的标注。
因此,不但来自样本信号输入部件11的加有标注的样本信号,而且来自自动异常声音辨别部件18的加有标注的样本信号被输入到样本信号存储部件12。当从自动异常声音辨别部件18提供的样本信号的标注有错误时,校正信息输入部件20对该标注进行校正。
接下来,将详细地描述由自动算法配置部件13执行的算法配置。
图3是图示要被配置的算法的结构的图。
所配置算法包括m个特征提取表达式1到m(m是大于1的整数)、以及由m个特征提取表达式1到m的线性组合表达式表示的信息估计表达式。每个特征提取表达式对输入信号执行预定计算,并且输出第一阶值作为计算结果。信息估计表达式使用从特征提取表达式输出的第一阶值来估计表示输入信号特征的信息。自动算法配置部件13确定异常声音辨别表达式U作为信息估计表达式。
图4示出异常声音辨别表达式U的具体示例。要被输出的辨别结果是表示异常声音或正常声音的二进制码。因此,基于异常声音辨别表达式U的计算结果是小于或等于预定阈值Th还是大于预定阈值Th而辨别输入信号是具有异常声音还是具有正常声音。例如,如图4所示,当异常声音辨别表达式U的计算结果小于或等于预定阈值Th时,要被输出的辨别结果表示输入信号具有正常声音,而当异常声音辨别表达式U的计算结果大于预定阈值Th时,要被输出的辨别结果表示输入信号具有异常声音。在图4所示的异常声音辨别表达式U的示例中,只有特征提取表达式1到m中的特征提取表达式1、2、5和15被使用。这是因为其他特征提取表达式的线性组合系数为0。
要被配置的算法可以是用于估计例如预定范围内的数值而不是表示异常声音或正常声音的二进制码的算法,其中预定范围内的数值例如为音乐速度和亮度的程度(级别)。在这种情况下,如图5所示,根据由m个特征提取表达式1到m的线性组合表达式表示的速度估计表达式的计算结果,确定表示输入信号速度的值,并且根据由m个特征提取表达式1到m的线性组合表达式表示的亮度估计表达式的计算结果,确定表示输入信号 亮度的值。
在下面参考图50及后续图描述的下一实施例中描述了这样的示例,其中在新信号被输入时用作用于提取速度和亮度的值的特征提取器的算法被配置成如图6所示。
图7示出特征提取表达式1到m的示例。
特征提取表达式可以处理可以以多阶值表示的输入信号,直至其具有一个值,也就是说,其具有标量。图8示出特征提取表达式的一个示例。
图8所示的这个特征提取表达式由表示输入信号的类型的信息和提供表示要对输入信号执行的信号处理的信息的操作符构成。每个操作符包括处理目标轴和处理描述,并且可选地包括用于处理的参数。在图8所示的示例中,“12TonesM”是表示输入信号类型的信息,并且接着为四个操作符“F#Differential”、“F#MaxIndex”、“T#LPF_1;0.861”和“T#UVariance”。
表示输入信号类型的信息除包括“12TonesM”(在图8的示例中示出)之外还包括例如“wav”和“Spectrum”,其中:“12TonesM”表示单声道PCM(脉冲编码调制)声源波形数据受到沿着时间轴的区间分析,“wav”表示波形,“Spectrum”表示二维图像(其示出声谱)。
特征提取表达式表示从与表示输入信号类型的信息较接近的信息开始,顺序地对输入信号执行由操作符表示的信号处理。每个操作符的开头表示要被处理的轴(处理目标轴)。在要被处理的轴中,T表示时间方向并且F表示频率(区间)方向。
关于操作符的处理目标轴之后的处理描述,“Differential”表示微分,“MaxIndex”表示获取最大值索引,“LPF_1”表示低通滤波,并且“UVariance”表示计算均方差。适当时,每个操作符可以带参数。在图8所示的示例中,“LPF_1”(低通滤波)的处理带有参数“0.861”。
因此,图8所示的特征提取表达式是要:沿着区间方向,对通过在时间轴上对PCM波形数据执行区间分析而获得的数据进行微分;计算表示沿区间方向的最大值的“Index”(即,获得具有最强声音的区间的号);沿时间轴方向应用低通滤波器;以及最后计算均方差。输出该计算的结果。
在本实施例中,输入信号采用“wav”,其表示声音表示信号中的波形,但是特征提取表达式不仅可以具有声音信号,还可以具有任何可以以矩阵形式(以具有值的多维矩阵形式)来表达的信号。示例包括静态图像信号和运动图像信号。
例如,输入信号可以是音频波形信号,如图9所示,其被视为振幅、时间和信道的矩阵;输入信号可以是图像信号,如图10所示,其被视为帧的X和Y轴、以及RGB(R:红、G:绿和B:蓝)的矩阵;或者可以是运动图像信号,如图11所示,其被视为帧的X和Y轴、RGB、以及时间的矩阵。另外,输入信号可以是例如可以由矩阵表示的二进制数据。
作为示例,在图12中示出了操作符类型。例如,操作符类型包括:平均值(Mean)、快速傅氏变换(FFT)、标准偏差(StDev)、体视比(Ratio)、低通滤波器(LPF_1)、高通滤波器(HPF_1)、绝对值(ABS)、平方(Sqr)、平方根(sqrt)、标准化(Normalize)、微分(Differential)、积分(Integrate)、最大值(MaxIndex)、均方差(UVariance)和下采样(DownSampling)。依赖于所确定的操作符,处理目标轴可以是固定的。在这种情况下,该操作符使用固定的处理目标轴。当确定使用参数的操作符时,该参数也被确定为具有随机或预设值。
接下来,将参考图13到18来描述自动算法配置部件13基于基因搜索技术而执行的自动算法生成的流程。
如图13所示,关于当前代特征提取表达式1到m,自动算法配置部件13确定用于评估特征提取表达式的评估值。自动算法配置部件13以评估值的降序来重新排列当前代特征提取表达式1到m,然后执行选择生成、交叉生成、变异生成和随机生成,以生成下一代特征提取表达式1到m。以评估值的降序重新排列当前代特征提取表达式1到m的原因是为了允许以评估值的降序选择用于生成下一代特征提取表达式的特征提取表达式。因此,重复这样的处理,其中下一代特征提取表达式1到m变为当前代特征提取表达式1到m并且基于当前代特征提取表达式1到m而生成下一代特征提取表达式1到m。
现在将详细地描述选择生成、交叉生成、变异生成和随机生成。
术语“选择生成”是指通过从当前代特征提取表达式中以评估值的降序选择预定数目的特征提取表达式并且直接使用所选特征提取表达式作为下一代特征提取表达式,生成新的特征提取表达式。
例如,如图14所示,在当前代特征提取表达式1、2和3的评估值分别为0.53、0.85和0.74时,具有最高评估值的当前代特征提取表达式2被选择,并且被用作下一代特征提取表达式1。
术语“交叉生成”是指通过在为了有助于选择具有更高评估值的特征 提取表达式而分配权重的情况下随机地选择两个特征提取表达式并且交换(交叉)随机位置处的所选特征提取表达式,生成新的特征提取表达式。
例如,如图15所示,选择具有高评估值的第一和第二特征提取表达式,第一特征提取表达式“Wav,T#Differential,T#IndexLR0”和第二特征提取表达式“Wav,T#HPF_1;0.262544,T#Mean”,并且组合第一特征提取表达式中的部分“Wav,T#Differential”和第二特征提取表达式中的部分“T#Mean”,换句话说,第一特征提取表达式中的部分“T#IndexLR0”被换成第二特征提取表达式中的部分“T#Mean”,从而生成新的特征提取表达式。
术语“变异生成”是指通过在为了有助于选择具有更高评估值的特征提取表达式而分配权重的情况下随机地选择特征提取表达式并且随机地改变所选特征提取表达式的一部分,生成新的特征提取表达式。
例如,如图16所示,选择具有高评估值的特征提取表达式“Wav,T#LPF_1;0.3,T#IndexLR0”作为变异源,并且删除所选特征提取表达式中的一个操作符“T#LPF_1;0.3”(变异示例1),加上操作符“Sqr”(变异示例2),或者将特征提取表达式中的一个操作符“T#LPF_1;0.3”的参数变成0.7(变异示例3),从而生成新的特征提取表达式。
术语“随机生成”是指通过随机地组合操作符来生成新的特征提取表达式,使得输入信号具有一个值(标量)。第一代特征提取表达式1到m没有变为其来源的上一代特征提取表达式,因此全部通过随机生成来生成。
例如,如图17所示,自动算法配置部件13使用选择生成来确定下一代特征提取表达式1到3,使用交叉生成来确定下一代特征提取表达式4到7,使用变异生成来确定下一代特征提取表达式8到13,并且使用随机生成来确定下一代特征提取表达式14到m。
图18示出根据当前代特征提取表达式1到m生成下一代特征提取表达式1到m的示例。
图19是示出自动算法配置部件13的详细配置的示例的框图。
自动算法配置部件13包括:学习数据剪截部件31、特征提取表达式列表生成部件32、特征量计算部件33、机器学习部件34和特征量提取算法输出部件35。
学习数据剪截部件31剪截存储在样本信号存储部件12中的学习数据,并且将学习数据提供到特征量计算部件33和机器学习部件34。更具 体地说,学习数据剪截部件31将存储在样本信号存储部件12中的样本信号、以及样本信号的标注分成预定单位时间中的部分,并且将各个单位时间中的经划分样本信号提供到特征量计算部件33,并且还将单位时间中的经划分标注提供到机器学习部件34。
现在假定,如图20所示,学习数据剪截部件31将存储在样本信号存储部件12中的样本信号、以及样本信号的标注分成n个单位时间中的n部分。单位时间中的第一个到第n个样本信号分别被称为数据D1到Dn,并且与数据D1到Dn相关联的标注被称为标注数据。在这种情况下,学习数据剪截部件31将数据D1到Dn提供到特征量计算部件33,并且将数据D1到Dn的标注数据提供到机器学习部件34。
机器学习部件34将当前代特征提取表达式1到m的评估值提供到特征提取表达式列表生成部件32。基于评估值,特征提取表达式列表生成部件32生成下一代特征提取表达式1到m,并且将所生成的下一代特征提取表达式1到m提供到特征量计算部件33。更具体地说,特征提取表达式列表生成部件32以评估值的降序重新排列当前代特征提取表达式1到m,然后对当前代中的预定特征提取表达式执行选择生成、交叉生成、变异生成和随机生成,从而生成下一代特征提取表达式1到m。
关于从学习数据剪截部件31提供的各个数据D1到Dn,特征量计算部件33对从特征提取表达式列表生成部件32提供的特征提取表达式1到m执行计算,并且将计算结果,即,数据D1到Dn的特征量提供到机器学习部件34。
图21示出由特征量计算部件33计算并且被提供到机器学习部件34的特征量的示例。
通过使用数据D1到Dn的特征量及其标注数据,其中特征量从特征量计算部件33提供,而标注数据从学习数据剪截部件31提供,机器学习部件34通过特征选择执行线性辨别,以估计异常声音辨别表达式U。换句话说,通过使用数据D1到Dn的特征量(该特征量从特征量计算部件33提供),机器学习部件34估计异常声音辨别表达式U,其中异常声音辨别表达式U使用特征提取表达式并且与数据D1到Dn的标注数据(标注数据从学习数据剪截部件31提供)匹配最佳。机器学习部件34确定在使用所估计的异常声音辨别表达式U时各个特征提取表达式的评估值,并且将所确定的评估值提供到特征提取表达式列表生成部件32。
现在将更详细地描述由机器学习部件34执行的处理。
图22示出从特征量计算部件33和学习数据剪截部件31提供到机器学习部件34的数据的示例。
机器学习部件34评估将要使用当前代特征提取表达式1到m中的哪些,以便与数据D1到Dn的标注数据匹配最佳,并且确定要使用的特征提取表达式的最佳组合。
首先,基于当前代特征提取表达式1到m中的任何一个都未被使用(即,特征提取表达式1到m没有被使用)的参考状态(图23A所示),机器学习部件34确定m个特征提取表达式的使用组合(图23B所示),每个特征提取表达式中的使用/不使用被顺序地反转。在图23A和23B中,在一行的0和1的排列中,“1”表示特征提取表达式1到m中的每个被使用的情况且“0”表示特征提取表达式1到m中的每个未被使用的情况,并且在一行中从左边起顺序地表示特征提取表达式1、2、3、...、和m的使用或不使用。
接下来,关于m个特征提取表达式的使用组合中的每个,机器学习部件34生成(估计)异常声音辨别表达式U。异常声音辨别表达式U由下式给出:
U=biX1+b2X2+b3X3+,...,+bmXm+b0 (1)
其中X1到Xm表示从特征提取表达式1到m得到的特征量,b1到bm表示线性组合系数,并且b0表示截距。
在表达式(1)中,对于每个未被使用的特征提取表达式的特征量,线性组合系数的值为零。
可以使用最小平方法来确定线性组合系数b1到bm以及截距b0。也就是说,当以Uk表示数据D1到Dn的标注数据(标注数据从特征量计算部件33提供)的第K个标注数据(真值),并且以Uk′表示从表达式(1)获得的真值Uk的估计值时,估计误差ek可以因此由下式给出:ek={Uk-Uk′}。确定使关于数据D1到Dn的每个标注数据的估计误差ek的均方误差“E=∑ek 2”变为最小的线性组合系数b1到bm以及截距b0,使得有可能确定最佳线性组合系数b1到bm以及最佳截距b0。
例如,所确定的异常声音辨别表达式U由下式给出:
U=0.5×X1+0.3×X2+0.0×X3+,...,+0.7Xm+0.2。
在该异常声音辨别表达式U的示例中,线性组合系数b1、b2、b3、...、和bm分别为0.5、0.3、0.0、...、和0.7,截距b0为0.2,并且从线性组合系数为0的特征提取表达式3得到的特征量未被使用。
接下来,机器学习部件34计算关于m个特征提取表达式的使用组合中的每个而生成的异常声音辨别表达式U的评估值。在下文中,异常声音辨别表达式U的评估值被称为“评估参考值”,以便与每个特征提取表达式的评估值相区别。
例如,AIC(Akaike信息标准)可以用作用于确定评估参考值的评估函数。AIC是表示值越小越好(即,具有更高的评估)的函数,并且由下式给出:
AIC=n×(log(2×PI)+1+log(‖E‖2÷n))
+2×(m’+1)…(2)
其中n表示教师数据的条数,即从学习数据剪截部件31提供的数据的条数,并且PI表示圆周率。“‖E‖2÷n”表示针对每条数据D1到Dn的均方差并且m′表示所使用的特征提取表达式的数目。
图24示出关于图23B所示的m个特征提取表达式的使用组合而生成的各个异常声音辨别表达式U的评估参考值。
机器学习部件34选择具有最高评估的特征提取表达式的使用组合(其具有最小评估参考值),作为下一参考状态。在图24所示的示例中,对于仅仅使用特征提取表达式4的使用组合,异常声音辨别表达式U的评估参考值为最小。因此,如图25所示,机器学习部件34选择仅仅使用特征提取表达式4的使用组合,作为下一参考状态。
关于仅仅使用特征提取表达式4的使用组合(图26A所示的参考状态),机器学习部件34确定m个特征提取表达式的使用组合,如图26B所示地顺序地反转每个特征提取表达式的使用/不使用。
机器学习部件34重复处理,其中该处理用于通过针对所确定的m个特征提取表达式的使用组合而生成(估计)异常声音辨别表达式U并且计算异常声音辨别表达式U的评估参考值来确定下一参考状态。重复上述参考状态的确定、异常声音辨别表达式U的生成、及其评估参考值的计算,直至评估参考值不再被更新,也就是说,直至没有更小的评估参考值被计算出。
当获得评估参考值不再被更新的异常声音辨别表达式U时,机器学习部件34基于所获得的异常声音辨别表达式U的线性组合系数,确定特征提取表达式1到m的评估值。
具体地说,机器学习部件34计算第i个特征量的贡献率Ci,作为特征提取表达式i的评估值,如由下式给出:
Ci=bi÷StDev(Xi)×StDev(T)×Correl(Xi,T) (3)
其中StDev(Xi)表示数据D1到Dn的特征提取表达式i的值(特征量Xi)的标准偏差,并且StDev(T)表示数据D1到数据Dn的标注数据T的标准偏差。Correl(T)表示数据D1到Dn的特征提取表达式i的值(特征量Xi)与其标注数据T之间的Pearson相关系数。
将如上所述计算出的特征提取表达式1到m的评估值与所生成的异常声音辨别表达式U一起提供到特征提取表达式列表生成部件32。
当满足预定完成条件时,例如,当用于生成下一代特征提取表达式的处理被执行预定次数时,机器学习部件34将最后代特征提取表达式和异常声音辨别表达式U提供到特征量提取算法输出部件35。最后代特征提取表达式从特征提取表达式列表生成部件32或特征量计算部件33获得。
特征量提取算法输出部件35将从机器学习部件34提供的最后代特征提取表达式和异常声音辨别表达式U提供到折衷分析部件14(图1所示)。
接下来,将描述折衷分析部件14的详细处理。
通过使用由自动算法配置部件13配置的算法(异常声音辨别表达式U)作为第一帕累托最优解,折衷分析部件14通过使用两个评估指标,即算法执行速度和准确度执行折衷分析来确定新的帕累托最优解。对于用于确定新的帕累托最优解的帕累托最优解搜索,折衷分析部件14采用简单的基因算法,其中该算法用于仅仅通过从作为当前帕累托最优解的特征量提取算法的变异来生成下一个候选帕累托最优解。
现在将参考图27描述帕累托最优解。
为了通过使用两个评估指标来评估算法,当不存在具有所有评估指标上的高评估的另一解时,当前考虑的解可以被认为是帕累托最优解。相反,当存在具有所有评估指标上的高评估的另一解时,当前考虑的解不是帕累托最优解。在图27中,黑圆表示帕累托最优解而白圆表示非帕累托最优解。
为了确定作为帕累托最优解的异常声音辨别表达式U,如图27所示,折衷分析部件14首先初始化帕累托最优解。也就是说,折衷分析部件14以特征提取表达式的标注数据相关性(上面提及的Correl(T))的升序,逐一顺序地设置包括在由自动算法配置部件13配置的异常声音辨别表达式U中的特征提取表达式,使得该特征提取表达式不被使用。通过这么做,折衷分析部件14生成多个异常声音辨别表达式U,其中所使用的特征提取表达式的数目相差一个。在这种情况下,特征提取表达式的最大数目是包括在由自动算法配置部件13配置的异常声音辨别表达式U中的特征提取表达式的数目,并且特征提取表达式的最小数目是一。
基于由自动算法配置部件13配置的异常声音辨别表达式U而生成异常声音辨别表达式U被称为帕累托最优解初始化,其中每个异常声音辨别表达式U要使用不同数目的特征提取表达式。由于从自动算法配置部件13提供的异常声音辨别表达式U不必使用所有特征提取表达式,因此包括在由自动算法配置部件13配置的异常声音辨别表达式U中的特征提取表达式的数目可以小于m。然而,在本实施例中,为了简化描述,将假定从自动算法配置部件13提供的异常声音辨别表达式U使用所有特征提取表达式来给出描述。
将参考图28到31进一步描述帕累托最优解的初始化。
如图28所示,折衷分析部件14创建列表,其包括为计算各个特征提取表达式所花费的平均时间(平均计算时间)、以及使用各个特征提取表达式计算出的标注数据相关系数。平均计算时间可以通过计算输入数据D1到Dn来确定,并且相关系数可以由表达式(3)中的Correl(T)来确定。
接下来,折衷分析部件14设置在被使用的特征提取表达式当中具有最小相关系数的特征提取表达式,使得该特征提取表达式不被使用,并且仅仅使用利用其余特征提取表达式提取的特征量来确定线性组合系数b1到bm以及截距b0,并且确定新的异常声音辨别表达式U。折衷分析部件14还计算在新确定的异常声音辨别表达式U被用来执行异常声音辨别时所花费的时间(总的计算时间)以及所获得的准确度(所估计的准确度)。
在图28所示的数据示例中,特征提取表达式3的相关系数是0.05,其是最低的,因此特征提取表达式3被设置成不被使用,如图29所示。其后,确定在使用除特征提取表达式3之外的特征提取表达式1到m时的新的异常声音辨别表达式U及其准确度,并且计算把为特征提取表达式3所花费的计算时间(0.11ms)排除在外的总计算时间。
类似地,以相关系数的升序逐一顺序地设置特征提取表达式,使得该特征提取表达式不被使用,确定新的异常声音辨别表达式U,并且计算总计算时间和准确度。然后,创建图30所示的候选帕累托最优解列表。
折衷分析部件14仅仅从图30所示的候选帕累托最优解列表提取帕累托最优解(即,删除非帕累托最优解)。更具体地说,在包括使用m个特征提取表达式的解1到仅仅使用一个特征提取表达式的解m(每个解是候选帕累托最优解)的异常声音辨别表达式U当中,删除作为非帕累托最优解的解3到5并且将其余解用作帕累托最优解,其中解3到5中的每个具有准确度更高和总计算时间更短的另一解。
一般而言,当特征提取表达式的数目减小时,虽然总的计算时间量变少,但是准确度往往降低。因此,由帕累托最优解初始化生成的异常声音辨别表达式U的总计算时间和准确度可以被绘制到如图31所示的图表上。图31的图表上的水平轴表示总计算时间(ms),而垂直轴表示F值的准确度(FMs:F量度)。
作为上述帕累托最优解初始化的结果,确定了初始状态中的帕累托最优解。
接下来,折衷分析部件14引起初始状态中的帕累托最优解的变异,以生成新的解,从而执行帕累托最优解的更新,以便搜索更好的帕累托最优解。当帕累托最优解被更新为更好的帕累托最优解时,连接帕累托最优解的线如图31的箭头所示沿左上方向移位。
更具体地说,折衷分析部件14随机地选择初始状态中的帕累托最优解中的一个,并且生成新解,其中随机地改变所选解中的特征提取表达式(例如,一到三)的使用或不使用。
图32示出变异的示例,其中所选解中的特征提取表达式7从“使用”变为“不使用”并且特征提取表达式8从“不使用”变为“使用”,从而生成新解。
然后,折衷分析部件14计算关于新解的总计算时间和准确度,重新创建图30所示的列表,并且删除非帕累托最优解。
折衷分析部件14执行如下处理直至满足完成条件,例如,直至处理被重复预定次数,其中该处理用于通过随机地重新选择其余帕累托解中的一个并且基于所选解的变异生成新的解来搜索更好的帕累托最优解。
图33示出在从初始状态中的帕累托最优解重复200次用于搜索帕累 托最优解的处理之后获得的帕累托最优解。
在图33中,连接黑圆的实线表示在处理被重复执行200次之后获得的帕累托最优解,并且虚线表示初始状态中的帕累托最优解。白圆(○)表示由帕累托最优解搜索处理计算出的非帕累托最优解。
类似地,图34示出在帕累托最优解搜索处理被重复执行1000次之后的帕累托最优解,并且图35示出在搜索处理被重复执行5000次之后的帕累托最优解。搜索处理被重复的次数越大,可以获得的帕累托最优解就越好。然而,不能识别在执行1000次处理的情况与执行5000次处理的情况之间的明显差别,因此可以理解成可以通过执行预定次数的处理来获得令人满意的帕累托最优解。
接下来,将给出关于使用算法确定部件16和自动异常声音辨别部件18的处理的描述。
如上所述,基于所要求的处理时间和准确度,使用算法确定部件16从由折衷分析部件14确定的且存储在帕累托最优解存储部件15中的用作帕累托最优解的算法(异常声音辨别表达式U)之中确定最佳算法。然后,使用算法确定部件16将所确定的最佳算法提供到自动异常声音辨别部件18。
例如,如图36所示,当存在足够资源并且存在即使增加处理时间量也要最高性能(最高准确度)的要求时,使用算法确定部件16确定具有最高准确度的帕累托最优解51的算法(异常声音辨别表达式U),并且将所确定的算法提供到自动异常声音辨别部件18。
例如,当要求准确度为0.76(FMs)或更多时,使用算法确定部件16确定在满足该要求的同时具有最短的总计算时间(处理时间)的帕累托最优解52的算法(异常声音辨别表达式U),并且将所确定的算法提供到自动异常声音辨别部件18。
另外,当要求每条数据的处理时间为2ms或更少作为总计算时间(处理时间)时,使用算法确定部件16确定帕累托最优解53的算法(异常声音辨别表达式U),并且将所确定的算法提供到自动异常声音辨别部件18。
如图37所示,自动异常声音辨别部件18将从新信号输入部件17提供的新信号分成单位时间的信号,这与学习数据剪截部件31中的单位时间的信号相类似。然后,自动异常声音辨别部件18通过使用从使用算法确定部件16提供的算法来辨别每个经划分的每单位时间的新信号是异常 声音还是正常声音,并且将辨别结果提供到异常声音辨别结果输出部件19。如上所述,每个单位时间的新信号的辨别结果也被提供到样本信号存储部件12以便存储。
接下来,将参考图38所示的流程图来描述由自动算法配置部件13执行的自动算法配置处理。
首先,在步骤S1中,学习数据剪截部件31剪截存储在样本信号存储部件12中的学习数据,并且将该学习数据提供到特征量计算部件33和机器学习部件34。更具体地说,学习数据剪截部件31从学习数据剪截出数据D1到Dn,并且将数据D1到Dn提供到特征量计算部件33,并且将数据D1到Dn的标注数据提供到机器学习部件34。
在步骤S2中,基于当前代特征提取表达式1到m的评估值(评估值从机器学习部件34提供),特征提取表达式列表生成部件32执行用于生成下一代特征提取表达式1到m(特征提取表达式列表)的特征提取表达式列表生成处理。重复地执行步骤S2中的处理。当第一次执行步骤S2中的处理时,不存在当前代特征提取表达式1到m,因此通过随机生成来生成下一代特征提取表达式1到m。下面参考图39来描述特征提取表达式列表生成处理的细节。
在步骤S3中,特征量计算部件33执行特征量计算处理。也就是说,关于从学习数据剪截部件31提供的各个数据D1到Dn,特征量计算部件33根据从特征提取表达式列表生成部件32提供的特征提取表达式1到m执行计算,并且将计算结果,即数据D1到Dn的特征量提供到机器学习部件34。下面参考图46来描述特征量计算处理的细节。
在步骤S4中,机器学习部件34执行机器学习处理。也就是说,通过使用数据D1到Dn的特征量,(该特征量从特征量计算部件33提供),机器学习部件34估计异常声音辨别表达式U,其中异常声音辨别表达式U使用特征提取表达式并且与从学习数据剪截部件31提供的数据D1到Dn的标注数据匹配最佳。机器学习部件34确定在使用所估计的异常声音辨别表达式U时的各个特征提取表达式的评估值,并且将所确定的评估值提供到特征提取表达式列表生成部件32。下面参考图47来描述机器学习处理的细节。
在步骤S5中,机器学习部件34确定是否满足完成条件。更具体地说,例如,当步骤S2到S4中的处理被重复执行预定次数时或者当检测到用于 停止的操作时,机器学习部件34确定满足完成条件。
当在步骤S5中确定不满足完成条件时,处理返回到步骤S2并且重复其后的处理。
另一方面,当在步骤S5中确定满足完成条件时,处理进入步骤S6。在步骤S6中,机器学习部件34将最后代特征提取表达式和异常声音辨别表达式U提供到特征量提取算法输出部件35。然后,特征量提取算法输出部件35将最后代特征提取表达式和异常声音辨别表达式U输出到折衷分析部件14,从而结束处理。
接下来,将参考图39所示的流程图来描述在图38所示的步骤S2中执行的特征提取表达式列表生成处理。
在步骤S21中,特征提取表达式列表生成部件32确定要被生成的特征提取表达式列表是否是第二代或更后。
当在步骤S21中确定要被生成的特征提取表达式列表不是第二代或更后时,也就是说,是第一代时,处理进入步骤S22。在步骤S22中,特征提取表达式列表生成部件32执行随机生成处理,下面参考图40对其进行描述。
当在步骤S21中确定特征提取表达式列表是第二代或更后时,处理进入步骤S23。在步骤S23中,特征提取表达式列表生成部件32执行下一代列表生成处理,下面参考图41对其进行描述。
在完成步骤S22或S23中的处理之后,处理进入步骤S24,其中特征提取表达式列表生成部件32将由步骤S22或S23中的处理生成的特征提取表达式列表提供到特征量计算部件33。然后,处理返回到图38所示的步骤S2并且进入步骤S3。
如上所述,对于第一代,随机地生成所有特征提取表达式,并且对于第二代或更后,使用基因搜索技术来执行下一代列表生成处理。
接下来,将参考图40所示的流程图来描述在图39所示的步骤S22中执行的随机生成处理。
在步骤S41中,特征提取表达式列表生成部件32将表达式循环参数M初始化为1,并且开始表达式循环。该表达式循环被重复与包括在特征提取表达式列表中的特征提取表达式的数目“m”相对应的次数。
在步骤S42中,特征提取表达式列表生成部件32确定第M个特征提 取表达式(在下文中,也被称为“特征提取表达式[M]”)的输入信号的类型。在本实施例中,确定输入信号的类型为表示波形的“wav”。
在步骤S43中,特征提取表达式列表生成部件32为要被生成的特征提取表达式[M]随机地确定处理目标轴和一个操作符。
在步骤S44中,特征提取表达式列表生成部件32确定直到当前时间点已经生成的特征提取表达式[M]的计算结果是否为标量(第一阶值)。当在步骤S44中确定计算结果不是标量,则处理返回到步骤S43并且重复其后的处理,以便添加一个操作符。
当在步骤S44中确定计算结果为标量时,处理进入步骤S45,其中特征提取表达式列表生成部件32确定表达式循环参数M是否小于最大值m。当在步骤S45中确定表达式循环参数M小于最大值m时,表达式循环参数M按1递增。然后,处理返回到步骤S42并且重复其后的处理。
另一方面,当在步骤S45中确定表达式循环参数M不小于最大值m(即,等于最大值m)时,退出表达式循环。然后,处理返回到图39中的步骤S22并且进入步骤S24。
作为上述处理的结果,生成了第一代的特征提取表达式列表。
接下来,将参考图41所示的流程图来描述在图39所示的步骤S23中执行的下一代列表生成处理。
在步骤S61中,特征提取表达式列表生成部件32确定使得满足ms+mx+mm+mr=m(特征提取表达式的总数)的值,其中ms表示由选择生成处理生成的特征提取表达式的数目(选择的数目),mx表示由交叉生成处理生成的特征提取表达式的数目(交叉的数目),mm表示由变异生成处理生成的特征提取表达式的数目(变异的数目),并且mr表示由随机生成处理生成的特征提取表达式的数目(随机生成的数目)。
值的比率可以被预先确定或者该值可以被随机地确定,使得满足ms+mx+mm+mr=m。
在步骤S62中,特征提取表达式列表生成部件32执行选择生成处理,下面参考图42对其进行描述。
在步骤S63中,特征提取表达式列表生成部件32执行交叉生成处理,下面参考图43对其进行描述。
在步骤S64中,特征提取表达式列表生成部件32执行变异生成处理, 下面参考图44对其进行描述。
在步骤S65中,特征提取表达式列表生成部件32执行随机生成处理,下面参考图45对其进行描述。在完成随机生成处理之后,处理返回到图39中的步骤S23并且进入步骤S24。
作为上述处理的结果,基于基因搜索技术生成了第二代或更后的特征提取表达式列表。
接下来,将参考图42所示的流程图来描述在图41所示的步骤S62中执行的选择生成处理。
在步骤S91中,特征提取表达式列表生成部件32以评估值的降序对当前代特征提取表达式进行排序。
在步骤S92中,特征提取表达式列表生成部件32使用最上面的ms个特征提取表达式作为下一代特征提取表达式。然后,处理返回到图41中的步骤S62并且进入步骤S63。
作为该处理的结果,具有较高评估值的特征提取表达式可以被选择并且可以被拷贝到下一代特征提取表达式列表。
接下来,将参考图43所示的流程图来描述在图41所示的步骤S63中执行的交叉生成处理。
在步骤S121中,特征提取表达式列表生成部件32将交叉循环参数MX初始化为1并且开始交叉循环。交叉循环被重复与交叉数“mx”相对应的次数。
在步骤S122中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被称为“表达式A”),同时分配权重以便有助于选择具有更高评估值的特征提取表达式。
在步骤S123中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被称为“表达式B”),同时分配权重以便有助于选择具有更高评估值的特征提取表达式。
在步骤S124中,特征提取表达式列表生成部件32确定表达式B是否不同于表达式A。当在步骤S124中确定表达式B与表达式A相同时,处理返回到步骤S123并且重复其后的处理,以便重新选择表达式B,直至 确定表达式B不同于表达式A。
当在步骤S124中确定表达式B不同于表达式A时,处理进入步骤S125,其中特征提取表达式列表生成部件32交换表达式A和B的部分,从而创建新的特征提取表达式。
在这种情况下,特征提取表达式列表生成部件32组合表达式A和B的部分,使得可以通过计算组合之后的特征提取表达式来从输入数据获得标量,也就是说,使得当从开始顺序地执行计算处理时,在处理轴中不发生矛盾。
在步骤S126中,特征提取表达式列表生成部件32将在步骤S125中生成的新的特征提取表达式加到下一代特征提取表达式。
在步骤S127中,特征提取表达式列表生成部件32确定交叉循环参数MX是否小于交叉数“mx”,“mx”为交叉循环参数MX的最大值。当在步骤S127中确定交叉循环参数MX小于交叉数“mx”时,交叉循环参数MX按1递增。然后,处理返回到步骤S122并且重复其后的处理。另一方面,当在步骤S127中确定交叉循环参数MX不小于交叉数“mx”,即等于交叉数“mx”时,退出交叉循环。于是,处理返回到图41中的步骤S63并且进入步骤S64。
形成交叉循环的步骤S122到S126中的处理每被执行一次,就生成要包括在下一代特征提取表达式列表内的特征提取表达式中的一个特征提取表达式。当完成交叉循环时,生成了包括在特征提取表达式列表中的特征提取表达式的mx个特征提取表达式。
在这种处理中,选择当前代特征提取表达式列表中的特征提取表达式,同时分配权重以便有助于选择具有更高评估值的特征提取表达式,并且所选特征提取表达式被用来执行交叉生成处理,以生成包括在下一代特征提取表达式列表中的特征提取表达式。
接下来,将参考图44所示的流程图来描述在图41所示的步骤S64中执行的变异生成处理。
在步骤S151中,特征提取表达式列表生成部件32将变异循环参数MM初始化为1并且开始变异循环。变异循环被重复与变异数“mm”相对应的次数。
在步骤S152中,特征提取表达式列表生成部件32从包括在当前代特征提取表达式列表内的所有特征提取表达式中随机地选择一个表达式(被 称为“表达式A”),同时分配权重以便有助于选择具有更高评估值的特征提取表达式。
在步骤S153中,特征提取表达式列表生成部件32通过执行例如改变或删除所选表达式A的一部分或者改变其中的参数的处理来引起变异,从而创建新的特征提取表达式。
在这种情况下,通过使用使得可以通过计算改变表达式的一部分之后的特征提取表达式来从输入数据获得标量的方法,也就是说,通过使用使得当从开始顺序地执行计算处理时在处理轴中不发生矛盾的方法,特征提取表达式列表生成部件32改变表达式的一部分。
在步骤S154中,特征提取表达式列表生成部件32将在步骤S153中生成的新的特征提取表达式加到下一代特征提取表达式。
在步骤S155中,特征提取表达式列表生成部件32确定变异循环参数MM是否小于变异数“mm”,“mm”为变异循环参数MM的最大值。当在步骤S155中确定变异循环参数MM小于变异数“mm”时,变异循环参数MM按1递增。然后,处理返回到步骤S152并且重复其后的处理。另一方面,当在步骤S155中确定变异循环参数MM不小于变异数“mm”,即等于变异数“mm”时,退出变异循环。于是,处理返回到图41中的步骤S64并且进入步骤S65。
形成变异循环的步骤S152到S154中的处理每被执行一次,就生成要包括在下一代特征提取表达式列表内的一个特征提取表达式。当完成变异循环时,生成了包括在特征提取表达式列表中的特征提取表达式的mm个特征提取表达式。
在这种处理中,从当前代特征提取表达式列表中选择当前代特征提取表达式列表中的特征提取表达式,同时分配权重以便有助于选择具有更高评估值的特征提取表达式,并且所选特征提取表达式被用来执行变异生成处理,以生成要包括在下一代特征提取表达式列表中的特征提取表达式。
接下来,将参考图45所示的流程图来描述在图41所示的步骤S65中执行的随机生成处理。
在步骤S181中,特征提取表达式列表生成部件32将随机生成循环参数MR初始化为1并且开始随机生成循环。随机生成循环被重复与包括在特征提取表达式列表中的特征提取表达式数“mr”相对应的次数。
在步骤S182中,特征提取表达式列表生成部件32确定第MR个特征 提取表达式(在下文中,也被称为“特征提取表达式[MR]”)的输入信号的类型。在本实施例中,确定输入信号的类型为表示波形的“wav”。
在步骤S183中,特征提取表达式列表生成部件32为要被生成的特征提取表达式[MR]随机地确定处理目标轴和一个操作符。
在步骤S184中,特征提取表达式列表生成部件32确定直到当前时间点已经生成的特征提取表达式[MR]的计算结果是否为标量(第一阶值)。当在步骤S184中确定计算结果不是标量时,处理返回到步骤S183并且重复其后的处理,以便添加一个操作符。
当在步骤S184中确定计算结果是标量时,处理进入步骤S185,其中特征提取表达式列表生成部件32确定随机生成循环参数MR是否小于最大值mr。当在步骤S185中确定随机生成循环参数MR小于最大值mr时,随机生成循环参数MR按1递增。然后,处理返回到步骤S182并且重复其后的处理。另一方面,当在步骤S185中确定随机生成循环参数MR不小于最大值mr(即,等于最大值mr)时,退出随机生成循环。然后,处理返回到图41中的步骤S65,进一步返回到图39中的步骤S23并且进入步骤S24。
形成随机生成循环的步骤S182到S185中的处理每被执行一次,就生成要包括在下一代特征提取表达式列表内的一个特征提取表达式。当完成随机生成循环时,生成了包括在特征提取表达式列表中的特征提取表达式的mr个特征提取表达式。
在这种处理中,通过随机生成处理来生成要包括在下一代特征提取表达式列表内的特征提取表达式中的一些表达式。
接下来,将参考图46所示的流程图来描述在图38所示的步骤S3中执行的特征量计算处理。
在步骤S211中,特征量计算部件33从特征提取表达式列表生成部件32获得特征提取表达式列表,将表达式循环参数M初始化为1,并且开始表达式循环。表达式循环被重复与包括在特征提取表达式列表中的特征提取表达式数“m”相对应的次数。
在步骤S212中,特征量计算部件33将数据循环参数N初始化为1并且开始数据循环。数据循环被重复与由学习数据剪截部件31剪截出的数据D的条数“n”相对应的次数。
在步骤S213中,关于数据DN,特征量计算部件33计算在使用第M 个特征提取表达式(特征提取表达式[M])时的特征量。
在步骤S214中,特征量计算部件33确定数据循环参数N是否小于最大值n。当在步骤S214中确定数据循环参数N小于最大值n时,数据循环参数N按1递增。然后,处理返回到步骤S213并且重复其后的处理。
另一方面,当在步骤S214中确定数据循环参数N不小于最大值n(即,等于最大值n)时,退出数据循环并且处理进入步骤S215。
在步骤S215中,特征量计算部件33确定表达式循环参数M是否小于最大值m。当在步骤S215中确定表达式循环参数M小于最大值m时,表达式循环参数M按1递增。然后,处理返回到步骤S212并且重复其后的处理。另一方面,当在步骤S215中确定表达式循环参数M不小于最大值m(即,等于最大值m)时,退出表达式循环。然后,处理返回到图38中的步骤S3并且进入步骤S4。
作为上述处理的结果,计算出使用每个特征提取表达式提取的特征量。
接下来,将参考图47所示的流程图来描述在图38所示的步骤S4中执行的机器学习处理。
在步骤S241中,机器学习部件34创建当前代特征提取表达式1到m的参考状态。也就是说,机器学习部件34将所有当前代特征提取表达式1到m设成不被使用。
在步骤S242中,机器学习部件34将特征量循环参数M初始化为1并且开始特征量循环。特征量循环被重复与包括在特征提取表达式列表中的特征提取表达式数“m”相对应的次数。
在步骤S243中,基于参考状态中的特征提取表达式1到m,机器学习部件34确定特征提取表达式的使用组合,其中反转从第M个特征提取表达式得到的特征量的使用/不使用(在下文中,该使用组合可以被称为特征提取表达式的使用组合[M])。
在步骤S244中,机器学习部件34针对经反转的特征提取表达式的使用组合[M]生成(估计)异常声音辨别表达式U。
在步骤S245中,机器学习部件34计算所生成的异常声音辨别表达式U的评估参考值(AIC)。
在步骤S246中,机器学习部件34确定特征量循环参数M是否小于 最大值m。当在步骤S246中确定特征量循环参数M小于最大值m时,特征量循环参数M按1递增。然后,处理返回到步骤S243并且重复其后的处理。另一方面,当在步骤S246中确定特征量循环参数M不小于最大值m(即,等于最大值m)时,退出特征量循环并且处理进入步骤S247。
在步骤S247中,机器学习部件34选择具有最高评估(即,具有最小评估参考值)的经反转特征提取表达式的使用组合作为新的参考状态。
在步骤S248中,机器学习部件34确定是否所生成的异常声音辨别表达式U的评估参考值不再被更新。当在步骤S248中确定评估参考值仍然被更新时,处理返回到步骤S242并且重复其后的处理。
另一方面,当在步骤S248中确定评估参考值不再被更新时,处理返回到图38所示的步骤S4并且进入步骤S5。
现在将参考图48所示的流程图来描述由折衷分析部件14执行的折衷分析处理。
在步骤S271中,折衷分析部件14执行帕累托最优解初始化处理,下面参考图49对其进行描述。在初始化处理中,生成多个初始状态中的帕累托最优解。
在步骤S272中,折衷分析部件14随机地选择初始状态中的帕累托最优解中的一个并且通过所选解的变异来生成新的解。例如,关于所选解中的一至三的特征提取表达式,折衷分析部件14生成随机改变使用/不使用的新解。
在步骤S273中,折衷分析部件14计算在使用新解时的总计算时间和准确度。
其后,在步骤S274到S277中,折衷分析部件14更新帕累托最优解。也就是说,在步骤S274中,折衷分析部件14将新解加到帕累托最优解,将解循环参数K初始化为1,并且开始解循环。解循环被重复与当前保存的帕累托最优解的总数“k”相对应的次数。
在步骤S275中,折衷分析部件14确定是否存在具有比第K个帕累托最优解(在下文中,也被称为“帕累托最优解[K]”)更高的速度和更高的准确度的解。当在步骤S275中确定存在具有比帕累托最优解[K]更高的速度和更高的准确度的解时,处理进入步骤S276。在步骤S276中,折衷分析部件14从帕累托最优解中删除帕累托最优解[K]。
当在步骤S275中确定不存在具有比帕累托最优解[K]更高的速度和更高的准确度的解时,处理进入步骤S277。在步骤S277中,折衷分析部件14确定解循环参数K是否小于最大值k。当在步骤S277中确定解循环参数K小于最大值k时,解循环参数K按1递增。然后,处理返回到步骤S275并且重复其后的处理。
另一方面,当确定解循环参数K不小于最大值k(即,等于最大值k)时,退出解循环并且处理进入步骤S278。
在步骤S278中,折衷分析部件14确定通过执行经由从帕累托最优解的变异来生成新解的处理来搜索帕累托最优解是否已被重复预定次数。当在步骤S278中确定搜索帕累托最优解的处理尚未被重复预定次数时,处理返回到步骤S272并且重复其后的处理。
另一方面,当在步骤S278中确定搜索帕累托最优解的处理已被重复预定次数时,处理结束。
接下来,将参考图49所示的流程图来描述在图48所示的步骤S271中执行的帕累托最优解初始化处理。
在步骤S301中,折衷分析部件14将特征量循环参数M初始化为1,并且开始特征量循环。特征量循环被重复与包括在特征提取表达式列表中的特征提取表达式数“m”相对应的次数。
在步骤S302中,折衷分析部件14计算为计算第M个特征提取表达式(在下文中,可以被称为“特征提取表达式[M]”)所花费的平均时间(平均计算时间)以及标注数据相关系数。
在步骤S303中,折衷分析部件14确定特征量循环参数M是否小于最大值m。当在步骤S303中确定特征量循环参数M小于最大值m时,特征量循环参数M按1递增。然后,处理返回到步骤S302并且重复其后的处理。另一方面,当在步骤S303中确定特征量循环参数M不小于最大值m(即,等于最大值m)时,退出特征量循环并且处理进入步骤S304。
在步骤S304中,在使用中的特征提取表达式当中,折衷分析部件14设置具有最小相关系数的特征提取表达式,使得其不被使用。
在步骤S305中,折衷分析部件14仅仅使用通过除了被设置为不被使用的特征提取表达式之外的其余特征提取表达式提取的特征量来执行线性辨别,并且确定新的异常声音辨别表达式U。在步骤S305中,折衷分析部件14还计算在所确定的新异常声音辨别表达式U被用来执行异常声 音辨别时的准确度。
在步骤S306中,折衷分析部件14计算在所确定的新异常声音辨别表达式U被用来执行异常声音辨别时所花费的时间(总计算时间),并且将所确定的总计算时间加到候选帕累托最优解列表中。
在步骤S307中,折衷分析部件14确定其余特征提取表达式的数目是否为一。当在步骤S307中确定其余特征提取表达式的数目不为一时,处理返回到步骤S304并且重复其后的处理。
另一方面,当确定其余特征提取表达式的数目为一时,处理进入步骤S308,其中折衷分析部件14执行用于更新帕累托最优解的处理。该帕累托最优解的更新处理与上面描述且在图48中示出的步骤S274到S277的处理相类似,因此在下文中不给出其描述。在步骤S308之后,处理返回到图48中的步骤S271并且进入步骤S272。
如上所述,在帕累托最优解被初始化之后,搜索更多适当的帕累托最优解,以便执行更新。
基于诸如信息处理设备1的当前可用资源状态和所要求性能的信息,使用算法确定部件16从作为由上述折衷分析处理确定且存储在帕累托最优解存储部件15中的帕累托最优解的算法(异常声音辨别表达式U)中确定最佳算法。然后,使用算法确定部件16将所确定的最佳算法提供到自动异常声音辨别部件18。基于从使用算法确定部件16提供的算法,自动异常声音辨别部件18辨别所输入的新信号是具有异常声音还是具有正常声音。
因此,信息处理设备1可以提出多个具有评估指标间的折衷关系的算法,其中评估指标例如为可用资源状态(处理速度)和所要求的性能(准确度)。根据当前的情形,信息处理设备1还可以确定多个具有评估指标间的折衷关系的算法中的最优算法,并且可以使用所确定的算法来执行辨别。
现在将描述使用上述帕累托最优解的概念的其他实施例。
图50是示出根据本发明另一实施例的自动算法配置系统101的框图。与上述实施例中的部件相对应的部件以相同的标号来表示,并且不给出其描述。
自动算法配置系统101包括:教师数据获得部件131、特征提取表达式列表生成部件32、特征量计算部件132、评估值计算部件133和算法输 出部件134。
教师数据获得部件131获得作为教师数据输入的波形信号(波形数据)、以及要从该数据提取的目标变量的值,将波形信号提供到特征量计算部件132,并且还将波形信号的目标变量的值提供到评估值计算部件133。
例如,如图51所示,教师数据获得部件131获得l条波形数据DD1到DDl及其目标变量的值作为教师数据,并且将波形数据块DD1到DDl以及目标变量的值分别提供到特征量计算部件132和评估值计算部件133。
特征量计算部件132对从教师数据获得部件131提供的波形数据DD1到DDl执行从特征提取表达式列表生成部件32提供的特征提取表达式1到m的计算。然后,特征量计算部件132将计算结果即波形数据DD1到DDl的特征量提供到评估值计算部件133。
特征量计算部件132计算为计算每个特征提取表达式所花费的平均时间,并且将所计算的平均时间提供到评估值计算部件133。
图52示出由特征量计算部件132计算出的且被提供到评估值计算部件133的特征量和平均时间的示例。
评估值计算部件133生成候选解,即候选帕累托最优解。
首先,评估值计算部件133随机地确定是否要使用从特征提取表达式1到m得到的特征量中的每个。当已经保存了一个或更多个帕累托最优解时,评估值计算部件133可以通过从所保存的帕累托最优解中随机地选择一个解并且(通过改变任意特征提取表达式的使用/不使用)引起所选解的变异,确定是否要使用从特征提取表达式1到m中的每个得到的特征量。
图53A示出随机地确定特征提取表达式1到m中的每个的特征量的使用/不使用的示例,并且图53B示出通过引起从帕累托最优解选择的解的变异来确定从特征提取表达式1到m中的每个得到的特征量的使用/不使用的示例。
接下来,评估值计算部件133基于所确定的m个特征提取表达式的使用组合而生成(估计)信息估计表达式(其是候选解)。也就是说,如图54所示,评估值计算部件133将波形数据DD1到DDl的特征量与目标变量相关联,其中该特征量和目标变量从特征量计算部件132提供,并且将关联值分配给与表达式(1)相类似的信息估计表达式,以确定使得每个目标变量的估计误差的均方误差变为最小的线性组合系数b1到bm以及截距b0。关 于速度和亮度的目标变量两者来创建信息估计表达式。
其后,使用表达式(2),评估值计算部件133为每个目标变量计算用于评估所生成的信息估计表达式的评估参考值(数量参考)。
评估值计算部件133还计算在所生成的信息估计表达式被用来计算目标变量时所花费的总计算时间。更具体地说,如图55所示,在为计算特征提取表达式所花费的平均时间(该平均时间从特征量计算部件132提供)当中,把未被使用的特征提取表达式的平均时间排除在外的时间之和是所生成的信息估计表达式的总计算时间。在图55所示的示例中,由于特征提取表达式3未被使用,因此特征提取表达式3的平均时间(0.3ms)不包括在总计算时间内。
图56示出通过对作为候选解的信息估计表达式执行计算而获得的速度评估参考值、亮度评估参考值、以及总计算时间。
接下来,评估值计算部件133将候选解的速度评估参考值、亮度评估参考值和总计算时间,与当前保存的帕累托最优解的速度评估参考值、亮度评估参考值和总计算时间相比较,并且删除非帕累托最优解。
图57示出候选解与当前保存的p个帕累托最优解相比较的示例。
在图57所示的示例中,在速度评估参考值、亮度评估参考值和总计算时间的所有评估指标上,帕累托最优解3劣于候选解,因此将其作为非帕累托最优解从帕累托最优解中删除。
对于每个帕累托最优解或候选解,评估值计算部件133保存表示每个特征提取表达式的使用/不使用的信息、每个目标变量(信息类型)的信息估计表达式的参数(线性组合系数b1到bm以及截距b0)、每个目标变量(信息类型)的评估参考值、以及总计算时间。
接下来,通过使用其余的帕累托最优解,评估值计算部件133确定特征提取表达式的评估值。确定特征提取表达式的评估值的基本概念与上述实施例中的相类似。在本实施例中,具体地说,由于存在多个目标变量(信息类型)和多个帕累托最优解(信息估计表达式),因此评估值计算部件133确定通过对帕累托最优解的第i个特征量关于所有目标变量(信息类型)的贡献率Ci求和而获得的值。
也就是说,使用帕累托最优解o(o=1到p)的特征量“Xi”关于第j个目标变量(信息类型)Tj(j=1到k)的贡献率C(o,Xi,Tj),在上面提及的 表达式(3)中的贡献率Ci可以被改写为:
C(o,Xi,Tj)=boji÷StDev(Xi)×StDev(Tj)×Correl(Xi,Tj)
…(4)
特征提取表达式的评估值可以根据表达式(5)中的SUM_Ci来计算,其中关于所有帕累托最优解的所有目标变量对贡献率C(o,Xi,Tj)进行求和。
评估值计算部件133计算特征提取表达式的评估值SUM_Ci(由表达式(5)表示),并且将计算结果提供到特征提取表达式列表生成部件32。
当通过执行用于更新帕累托最优解和计算每个特征提取表达式的评估值的处理预定次数而达到预定条件时,评估值计算部件133将最终保留的帕累托最优解提供到算法输出部件134。
取决于重点是放在速度和亮度的准确度上还是放在所要求的处理速度(总计算时间)上,算法输出部件134从所提供的帕累托最优解中选择最佳算法。然后,算法输出部件134输出所选算法。可以根据例如用户指示来确定要选择哪个算法。
接下来,将参考图58所示的流程图来描述由特征提取表达式列表生成部件32、特征量计算部件132和评估值计算部件133执行的帕累托最优解搜索处理。
首先,在步骤S401中,基于当前代特征提取表达式1到m的评估值(该评估值从评估值计算部件133提供),特征提取表达式列表生成部件32执行用于生成下一代特征提取表达式1到m(特征提取表达式列表)的特征提取表达式列表生成处理。该处理与在上述步骤S2中且在图38中示出的处理相类似,并且由此在下文中不给出对其的详细描述。
在步骤S402中,特征量计算部件132执行特征量计算处理。也就是说,关于从教师数据获得部件131提供的波形数据DD1到DDl,特征量计算部件132计算从每个特征提取表达式得到的特征量、以及为计算每个特征提取表达式所花费的平均时间。下面参考图59所示的流程图来描述特征量计算处理的细节。
在步骤S403中,评估值计算部件133执行评估值计算处理。也就是说,评估值计算部件133生成作为候选帕累托解的候选解,将候选解与当前保存的帕累托最优解相比较,执行包括删除非帕累托解的帕累托最优解更新,并且基于其余的帕累托最优解而计算特征提取表达式的评估值。下面参考图61所示的流程图来描述评估值计算处理的细节。
在步骤S404中,评估值计算部件133确定是否满足完成条件。更具体地说,例如,当上述步骤S401到S403中的处理被重复执行预设次数时或者当检测到用于停止的操作时,评估值计算部件133确定满足完成条件。
当在步骤S404中确定不满足完成条件时,处理返回到步骤S401并且重复其后的处理。
另一方面,当在步骤S404中确定满足完成条件时,处理进入步骤S405。在步骤S405中,评估值计算部件133将最后代特征提取表达式和信息估计表达式的帕累托最优解输出到算法输出部件134,从而结束处理。
例如,取决于重点是放在速度和亮度的准确度上还是放在处理速度(总计算时间)上,算法输出部件134适当时在从评估值计算部件133提供的帕累托最优解中选择最佳算法。然后,算法输出部件134输出所选算法。
接下来,将参考图59所示的流程图来描述在图58所示的步骤S402中执行的特征量计算处理。
在步骤S411中,特征量计算部件132从特征提取表达式列表生成部件32获得特征提取表达式列表,将表达式循环参数M初始化为1并且开始表达式循环。表达式循环被重复与包括在特征提取表达式列表中的特征提取表达式数“m”相对应的次数。
在步骤S412中,特征量计算部件132将数据循环参数L初始化为1并且开始数据循环。数据循环被重复与由教师数据获得部件131获得的波形数据DD的条数“l”相对应的次数。
在步骤S413中,特征量计算部件132计算在关于波形数据DDL使用第M个特征提取表达式(特征提取表达式[M])时的特征量,并且保存该计算所花费的时间。
在步骤S414中,特征量计算部件132确定数据循环参数L是否小于最大值l。当在步骤S414中确定数据循环参数L小于最大值l时,数据循环参数L按1递增。然后,处理返回到步骤S413并且重复其后的处理。
另一方面,当在步骤S414中确定数据循环参数L不小于最大值l时,(即,等于最大值l),退出数据循环并且处理进入步骤S415。
在步骤S415中,特征量计算部件132计算为计算特征提取表达式[M]所花费的平均时间。也就是说,特征量计算部件132为波形数据DD1到DDl计算特征提取表达式[M]的计算时间的平均时间,其中计算时间在步骤S413中被计算和保存。
在步骤S416中,特征量计算部件132确定表达式循环参数M是否小于最大值m。当在步骤S416中确定表达式循环参数M小于最大值m时,表达式循环参数M按1递增。然后,处理返回到步骤S412并且重复其后的处理。另一方面,当在步骤S416中确定表达式循环参数M不小于最大值m时,(即,等于最大值m),退出表达式循环。然后,处理返回到图58中的步骤S402并且进入步骤S403。
接下来,将参考图60所示的流程图来描述在图58所示的步骤S403中执行的评估值计算处理。
在步骤S431中,评估值计算部件133确定是否使用从特征提取表达式1到m中的每个得到的特征量。评估值计算部件133可以通过改变从所保存的帕累托最优解中随机地选择的一个选择项的使用/不使用(通过一个选择项的变异),确定是否使用从特征提取表达式1到m中的每个得到的特征量。然而,当第一次执行步骤S431中的处理时,由于没有保存帕累托最优解,因此随机地确定特征量的使用/不使用。
在步骤S432中,评估值计算部件133将目标变量循环参数K初始化为1并且开始数据循环。目标变量循环被重复与用于目标变量的信息类型的数目“k”相对应的次数。
在步骤S433中,评估值计算部件133生成(估计)在步骤S431中确定的m个特征提取表达式的使用组合被使用时的信息估计表达式,其作为候选解并且用于估计与目标变量K相对应的信息量。
在步骤S434中,使用上面提及的表达式(2),评估值计算部件133计算用于评估信息估计表达式的评估参考值,其中信息估计表达式用于估计与目标变量K相对应的信息量。
在步骤S435中,评估值计算部件133确定目标变量循环参数K是否小于最大值k。当在步骤S435中确定目标变量循环参数K小于最大值k时,目标变量循环参数K按1递增。然后,处理返回到步骤S433并且重 复其后的处理。
另一方面,当在步骤S435中确定目标变量循环参数K不小于最大值k时,(即,等于最大值k),退出目标变量循环并且处理进入步骤S436。
在步骤S436中,基于从特征量计算部件132提供的每个特征提取表达式的平均时间,评估值计算部件133计算在所生成的信息估计表达式被用来计算目标变量时所花费的总计算时间。
在步骤S437到S440中,评估值计算部件133更新帕累托最优解。也就是说,在步骤S437中,评估值计算部件133将候选解加到帕累托最优解,将解循环参数o初始化为1,并且开始解循环。解循环被重复与当前保存的包括候选解(一个或多个)的帕累托最优解的总数“p”相对应的次数。
在步骤S438中,评估值计算部件133确定是否存在具有比第o个帕累托最优解(在下文中,也被称为“帕累托最优解[o]”)更高速度和更高准确度的解。当在步骤S438中确定存在具有比帕累托最优解[o]更高速度和更高准确度的解时,处理进入步骤S439。在步骤S439中,评估值计算部件133从帕累托最优解中删除帕累托最优解[o]。
另一方面,当在步骤S438中确定不存在具有比帕累托最优解[o]更高速度和更高准确度的解时,处理进入步骤S440。在步骤S440中,评估值计算部件133确定解循环参数o是否小于最大值p。当在步骤S438中确定解循环参数o小于最大值p时,解循环参数o按1递增。然后,处理返回到步骤S438并且重复其后的处理。
另一方面,当在步骤S438中确定解循环参数o不小于最大值p时,(即,等于最大值p),退出解循环并且处理进入步骤S441。
在步骤S441中,评估值计算部件133确定生成候选解并且搜索帕累托最优解的处理是否被重复预定次数。当在步骤S441中确定搜索帕累托最优解的处理尚未被重复预定次数时,处理返回到步骤S431并且重复其后的处理。
另一方面,当在步骤S441中确定搜索帕累托最优解的处理已被重复预定次数时,处理进入步骤S442。在步骤S442中,使用其余的帕累托最优解,评估值计算部件133执行用于确定特征提取表达式的评估值的评估值确定处理。
图61是示出在图60所示的步骤S442中的评估值确定处理的细节的流程图。
首先,在步骤S461中,评估值计算部件133将特征量循环参数i初始化为1并且开始特征量循环。特征量循环被重复与包括在特征提取表达式列表中的特征提取表达式数“m”相对应的次数。
在步骤S462中,评估值计算部件133重置第i个特征提取表达式的评估值SUM_Ci,该评估值由上面提及的表达式(5)给出。
在步骤S463中,评估值计算部件133将解循环参数o初始化为1并且开始解循环。解循环被重复与当前保存的帕累托最优解的总数“p”相对应的次数。
在步骤S464中,评估值计算部件133将目标变量循环参数j初始化为1并且开始目标变量循环。目标变量循环被重复与用于目标变量的信息类型的数目“k”相对应的次数。
在步骤S465中,评估值计算部件133确定帕累托最优解o的第i个特征量“Xi”关于第j个目标变量Tj的贡献率C(o,Xi,Tj),并且将所确定的贡献率加到评估值SUM_Ci。
在步骤S466中,评估值计算部件133确定目标变量循环参数j是否小于最大值k。当在步骤S466中确定目标变量循环参数j小于最大值k时,目标变量循环参数j按1递增。然后,处理返回到步骤S465并且重复其后的处理。
另一方面,当在步骤S466中确定目标变量循环参数j不小于最大值k时,(即,等于最大值k),退出目标变量循环并且处理进入步骤S467。
在步骤S467中,评估值计算部件133确定解循环参数o是否小于最大值p。当在步骤S467中确定解循环参数o小于最大值p时,解循环参数o按1递增。然后,处理返回到步骤S464并且重复其后的处理。
另一方面,当在步骤S467中确定解循环参数o不小于最大值p时,(即,等于最大值p),退出解循环并且处理进入步骤S468。
在步骤S468中,评估值计算部件133确定特征量循环参数i是否小于最大值m。当在步骤S468中确定特征量循环参数i小于最大值m时,特征量循环参数i按1递增。然后,处理返回到步骤S462并且重复其后的处理。
另一方面,当在步骤S468中确定特征量循环参数i不小于最大值m时,(即,等于最大值m),退出特征量循环。然后,处理返回到图60中的 步骤S442,进一步返回到图58中的步骤S403,并且处理进入图58中的步骤S404。
如上所述,自动算法配置系统101通过随机地确定从特征提取表达式列表生成部件32所提供的提取表达式1到m中的每个得到的特征量的使用/不使用,创建单个算法作为初始状态中的帕累托最优解。基于初始状态中的帕累托最优解,自动算法配置系统101通过随机地确定从特征提取表达式1到m中的每个得到的特征量的使用/不使用、或通过经由从所保存的帕累托最优解随机选择的一个解的变异而确定从特征提取表达式1到m中的每个得到的特征量的使用/不使用,创建帕累托最优解的候选解。然后,自动算法配置系统101将候选解的评估参考值和总计算时间与作为候选解保存的帕累托最优解的评估参考值和总计算时间相比较,从而确定多个帕累托最优解,其中要放在目标变量的准确度或处理速度上的重点的程度互不相同。
通过该配置,对于输入新信号的速度和亮度量的提取,自动算法配置系统101可以提出多个作为帕累托最优解的信息提取算法,其中要放在目标变量的准确度或处理速度上的重点的程度互不相同。也就是说,自动算法配置系统101可以提出多个具有评估指标间的折衷关系的算法。
然后,用户可以根据每个目标指标的准确度或处理速度的重要程度来选择最佳算法,并且可以获得目标变量的提取结果。
在图1所示的信息处理设备1中,自动算法配置部件13和折衷分析部件14可以被替换成这样的信息提取块,其包括设置在自动算法配置系统101中的教师数据获得部件131、特征量计算部件132、评估值计算部件133和特征提取表达式列表生成部件32。在这种情况下,信息处理设备1可以用作用于执行信息提取处理的设备,以便从输入的新信号提取速度和亮度量。
在相关技术的自动算法配置技术中,仅仅最高性能(最高准确度)的算法被确定。因此,与手动配置算法的情况不同,配置能够在满足要求的同时可以以最小资源量和所期望的准确度来执行处理的算法是困难的。然而,根据本发明实施例的信息处理设备1和自动算法配置系统101可以生成可执行这种处理的算法。
上述系列处理可以通过硬件或软件来执行。在这种情况下,上述处理可以由如图62所示的计算机200来执行。
在图62中,CPU(中央处理单元)201根据存储在ROM(只读存储器)202中的程序或从存储部件208装载到RAM(随机存取存储器)203的程序,执行各种类型的处理。RAM 203适当时存储在CPU 201执行各种类型的处理等时使用的数据等。
CPU 201、ROM 202和RAM 203通过内部总线204相互连接。内部总线204还连接到输入/输出接口205。
输入部件206、输出部件207、存储部件208和通信部件209也连接到输入/输出接口205。输入部件206包括例如键盘和鼠标。输出部件207包括例如扬声器、以及诸如CRT(阴极射线管)显示器或LCD(液晶显示器)的显示器。存储部件208包括例如硬盘。通信部件209包括调制解调器、终端适配器等等。通信部件209通过包括电话线或CATV(有线电视)网络的网络来执行通信处理。
驱动器210也可以连接到输入/输出接口205,其中诸如磁盘、光盘、磁光盘或半导体存储器的可拆卸介质适当时附连到输入/输出接口205。适当时,将从可拆卸介质221读取的计算机程序安装到存储部件208。
由计算机200执行的程序可以是根据上文描述的顺序而按时间顺序执行处理的程序,或者可以是并发地或在调用时执行处理的程序。
在这里,流程图所示的步骤不仅包括根据所述顺序而按时间顺序执行的处理,还包括并发地或单独地执行而不必按时间顺序进行的处理。
本申请包含与2008年7月14日向日本专利局提交的日本优先权专利申请JP 2008-183019中公开的主题内容相关的主题内容,在此通过引用将其全文合并于此。
本发明的实施例不限于上述实施例,并且可以对其进行各种变化而不背离本发明的精神和范围。
本领域的技术人员应当理解,可以在所附权利要求或其等同方案的范围内根据设计需要或其它因素进行各种修改、组合、子组合和变更。
Claims (7)
1.一种信息处理设备,其包括:
算法配置装置,用于基于作为学习数据的样本信号、通过使用基因搜索技术来配置用于对输入信号执行辨别的算法,所述算法具有特征提取表达式、以及作为所述特征提取表达式的线性组合的信息估计表达式,所述输入信号是声音信号;以及
折衷分析装置,用于通过基于所述算法执行折衷分析来确定所述算法关于评估指标的帕累托最优解,其中当不存在具有所有评估指标上的高评估的另一解时,当前考虑的解是帕累托最优解,当存在具有所有评估指标上的高评估的另一解时,当前考虑的解不是帕累托最优解;
最佳算法确定装置,用于在所述帕累托最优解当中确定与所述评估指标的要求条件相匹配的最佳算法;以及
自动异常声音辨别装置,用于使用所述最佳算法辨别所述输入信号具有异常声音还是具有正常声音。
2.根据权利要求1所述的信息处理设备,其中所述折衷分析装置通过使用具有不同数目的特征提取表达式的算法来生成初始状态中的帕累托最优解,其中所述算法通过从由所述算法配置装置配置的所述算法中逐个地删除所述特征提取表达式来创建。
3.根据权利要求1所述的信息处理设备,其中所述折衷分析装置使用由所述算法配置装置配置的所述算法,作为初始状态中的帕累托最优解。
4.根据权利要求2所述的信息处理设备,其中所述折衷分析装置通过随机地改变所述初始状态的帕累托最优解中的每个特征提取表达式的使用或不使用,更新所述帕累托最优解。
5.根据权利要求1所述的信息处理设备,其中所述最佳算法确定装置基于所要求的处理时间和准确度而在所述帕累托最优解当中确定所述最佳算法。
6.根据权利要求1所述的信息处理设备,还包括评估值计算装置,用于确定所述信息估计表达式中的所述特征提取表达式的评估值,并且
所述算法配置装置基于所确定的所述特征提取表达式的评估值而更新所述信息估计表达式中的所述特征提取表达式,
其中当所述算法配置装置配置多个信息估计表达式作为算法时,所述信息估计表达式中的相同特征提取表达式的贡献率的总值被用作相应特征提取表达式的评估值,特征提取表达式i的贡献率由以下公式计算:
Ci=bi÷StDev(Xi)×StDev(T)×Correl(Xi,T)
其中bi是特征提取表达式i的线性组合系数,StDev(Xi)表示样本信号的数据D1到Dn的特征提取表达式i的值的标准偏差,StDev(T)表示数据D1到数据Dn的标注数据T的标准偏差,并且Correl(T)表示数据D1到Dn的特征提取表达式i的值与其标注数据T之间的Pearson相关系数。
7.一种用于信息处理设备的信息处理方法,其中所述信息处理设备包括:算法配置装置,用于配置算法;以及折衷分析装置,用于确定所述算法的帕累托最优解,所述信息处理方法包括以下步骤:
基于作为学习数据的样本信号、通过基因搜索技术来配置用于对输入信号执行辨别的所述算法,所述算法具有特征提取表达式、以及作为所述特征提取表达式的线性组合的信息估计表达式,所述输入信号是声音信号;
通过基于所述算法执行折衷分析来确定所述算法关于评估指标的帕累托最优解,其中当不存在具有所有评估指标上的高评估的另一解时,当前考虑的解是帕累托最优解,当存在具有所有评估指标上的高评估的另一解时,当前考虑的解不是帕累托最优解;
在所述帕累托最优解当中确定与所述评估指标的要求条件相匹配的最佳算法;以及
使用所述最佳算法辨别所述输入信号具有异常声音还是具有正常声音。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008183019 | 2008-07-14 | ||
JP2008-183019 | 2008-07-14 | ||
JP2008183019A JP4591566B2 (ja) | 2008-07-14 | 2008-07-14 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101630508A CN101630508A (zh) | 2010-01-20 |
CN101630508B true CN101630508B (zh) | 2012-11-28 |
Family
ID=41506030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101594932A Expired - Fee Related CN101630508B (zh) | 2008-07-14 | 2009-07-14 | 信息处理设备、信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8626685B2 (zh) |
JP (1) | JP4591566B2 (zh) |
CN (1) | CN101630508B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2978616B1 (fr) * | 2011-07-26 | 2014-03-21 | Soitec Silicon On Insulator | Refroidissement actif pour cellule photovoltaique a concentration |
US9058801B2 (en) | 2012-09-09 | 2015-06-16 | Apple Inc. | Robust process for managing filter coefficients in adaptive noise canceling systems |
CA3200347A1 (en) * | 2014-06-30 | 2016-01-07 | Amazon Technologies, Inc. | Interactive interfaces for machine learning model evaluations |
JP6580334B2 (ja) * | 2015-02-06 | 2019-09-25 | 株式会社Jsol | 情報処理装置、プログラム及び情報処理方法 |
JP7147131B2 (ja) * | 2016-02-24 | 2022-10-05 | 株式会社ジェイテクト | 解析システム |
CN106021773B (zh) * | 2016-05-30 | 2020-06-16 | 宁波至高点工业设计有限公司 | 一种针对叶扇自动适配算法的优化方法 |
US11062792B2 (en) * | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101091204A (zh) * | 2005-10-25 | 2007-12-19 | 索尼株式会社 | 信息处理设备、信息处理方法和程序 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163005A (ja) * | 2000-11-29 | 2002-06-07 | Nikon Corp | 制御系の設計方法、制御系、制御系の調整方法及び露光方法 |
DE60235920D1 (de) * | 2002-02-21 | 2010-05-20 | Sony Corp | Signalverarbeitung |
US20050246165A1 (en) * | 2004-04-29 | 2005-11-03 | Pettinelli Eugene E | System and method for analyzing and improving a discourse engaged in by a number of interacting agents |
JP2007122186A (ja) * | 2005-10-25 | 2007-05-17 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
-
2008
- 2008-07-14 JP JP2008183019A patent/JP4591566B2/ja not_active Expired - Fee Related
-
2009
- 2009-07-06 US US12/497,813 patent/US8626685B2/en not_active Expired - Fee Related
- 2009-07-14 CN CN2009101594932A patent/CN101630508B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101091204A (zh) * | 2005-10-25 | 2007-12-19 | 索尼株式会社 | 信息处理设备、信息处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
US20100010947A1 (en) | 2010-01-14 |
CN101630508A (zh) | 2010-01-20 |
US8626685B2 (en) | 2014-01-07 |
JP2010020714A (ja) | 2010-01-28 |
JP4591566B2 (ja) | 2010-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101630508B (zh) | 信息处理设备、信息处理方法 | |
US11544420B2 (en) | Managing custom computer-aided design inheritance-based assembly families for manufacturing | |
US7062478B1 (en) | Method and apparatus using automated rule processing to configure a product or service | |
CN101369320B (zh) | 信息处理装置和方法 | |
EP1865447A2 (en) | Information processing apparatus, information processing method and computer program | |
US20180300333A1 (en) | Feature subset selection and ranking | |
US10839329B2 (en) | Process execution using rules framework flexibly incorporating predictive modeling | |
KR20070062446A (ko) | 시스템의 적어도 하나의 공정에 대한 요약 제공 장치 및방법 | |
CN108920543A (zh) | 查询和交互的方法及装置、计算机装置、存储介质 | |
AU2007293283B2 (en) | Methods and apparatus for assisting with construction of data for use in an expert system | |
KR101827124B1 (ko) | 운전자의 주행 패턴 인식 시스템 및 방법 | |
CN117170980B (zh) | 一种服务器硬件异常预警方法、装置、设备及存储介质 | |
JP2022028611A (ja) | 情報処理に用いられる方法、装置、デバイス及び記憶媒体 | |
JP2022010749A (ja) | 寄与度集約システム、寄与度集約方法およびプログラム | |
US11774941B2 (en) | Method for providing a list of equipment elements in industrial plants | |
CN114205355B (zh) | 一种变电网关附属设备性能测试方法、系统及电子设备 | |
US20230124678A1 (en) | Storage medium to store transmission data setting support program, gateway device, and transmission data setting supporting method | |
CN110796265B (zh) | 决策树模型的交互式操作方法、装置、终端设备及介质 | |
US9338294B2 (en) | Automated task definitions | |
US20170068893A1 (en) | System, Method and Software for Representing Decision Trees | |
CN106027278A (zh) | 命令生成方法及信息处理设备 | |
JP4351578B2 (ja) | 生産計画の支援システム及びコンピュータプログラム | |
US20210127603A1 (en) | Integrated intelligent irrigation system design, implementation and monitoring | |
JP7186411B1 (ja) | 情報処理システム、情報処理方法及び情報処理プログラム | |
CN112051953B (zh) | 一种页面栏位的输出控制方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121128 Termination date: 20190714 |
|
CF01 | Termination of patent right due to non-payment of annual fee |