CN101091204A

CN101091204A - 信息处理设备、信息处理方法和程序

Info

Publication number: CN101091204A
Application number: CNA2006800015725A
Authority: CN
Inventors: 小林由幸
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-10-25
Filing date: 2006-10-25
Publication date: 2007-12-19
Anticipated expiration: 2026-10-25
Also published as: KR101193265B1; KR20080069509A; EP1843323A4; CN101091204B; JP2008123011A; WO2007049641A1; JP4948118B2; US8315954B2; EP1843323B1; EP1843323A1; US20100094782A1

Abstract

一种信息处理设备、信息处理方法和程序，用于创建一种算法，其用于从如歌曲作品的内容数据，以数据高精确度、并且短时间地提取相应的特征值。特征值提取算法创建设备(20)包括：低级特征值提取公式列表创建部分(21)，用于创建包含m个低级特征值提取公式的n个低级特征值提取公式列表；低级特征值计算部分(24)，用于通过将j个音乐作品上的输入数据代入n个低级特征值提取列表，确定对应于输入数据的各个项目的m种低级特征值的n个集合；以及高级特征值提取公式学习部分(25)，用于通过从对应于低级特征值输出的n个集合的教导数据(对应于各j音乐作品的高级特征值的k个项目)学习，估计高级特征值提取公式。本发明可应用于获取音乐作品或视频的高级特征值的系统。

Description

信息处理设备、信息处理方法和程序

技术领域

本发明涉及一种信息处理设备、信息处理方法和程序。本发明尤其涉及一种信息处理设备、信息处理方法和程序，用于自动创建用于从如歌曲数据的内容数据提取特征的算法。

背景技术

已经提出了有关自动创建算法的各发明，将歌曲数据输入该算法或从该算法输出歌曲数据的特征(歌曲的速度、亮度、欢乐气氛等)(例如，参见专利文献1)。

[专利文献1]

美国专利No.0181401A1

发明内容

[本发明要解决的问题]

上述专利申请，如图1中所示，提出了创建用于按特征类型提取各特征的特征提取算法。在提取各特征中涉及的计算是巨大的，并且包括大量的冗余。

因此期望开发一种用于创建算法的方法，所述算法能够用最小的冗余通过计算从歌曲数据快速提取各特征。

鉴于上面的情况已经做出本发明，并且提供了各种安排，用于创建一种算法，其能够从如歌曲数据的输入内容数据中高度精确地快速提取各特征。

[解决问题的手段]

在实现本发明中并且按照其一个实施例，提供了一种信息处理设备，其创建特征检测算法，用于从内容数据检测各特征，所述信息处理设备包括：低级特征提取表达式列表创建装置，用于基于最近一代的各表达式列表，通过学习创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据或与所述内容数据相对应的元数据，并从该表达式输出各低级特征；计算装置，用于利用由所述低级特征提取表达式列表创建装置创建的所述下一代的各表达式列表，计算所述各低级特征；以及高级特征提取表达式创建装置，用于基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入由所述计算装置计算的所述各低级特征，并从该表达式输出所述内容数据的各高级特征特性。

优选地，所述高级特征提取表达式创建装置，可以至少计算在所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或创建的各高级特征提取表达式的各精度级别；以及所述低级特征提取表达式列表创建装置，至少基于所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或所述各高级特征提取表达式的各精度级别，可以更新所述各低级特征提取表达式，其构成所述各低级特征提取表达式列表，所述各精度级别和所述各贡献比率，已经通过所述高级特征提取表达式创建装置计算。

优选地，所述低级特征提取表达式列表创建装置，可以随机地创建各第一代表达式列表。

优选地，所述低级特征提取表达式列表创建装置，通过选择过程、交叉(cross)过程和突变(mutation)过程中的至少一个，基于所述最近一代的各表达式列表，利用遗传(genetic)算法可以创建所述下一代表达式列表。

优选地，所述低级特征提取表达式列表创建装置，可以创建所述下一代表达式列表，其每个由预定常数个低级特征提取表达式构成。

优选地，所述低级特征提取表达式列表创建装置，可以创建所述下一代表达式列表，其每个由预定常数个低级特征提取表达式构成，所述低级特征提取表达式在每次创建每个所述列表时随机确定。

优选地，所述高级特征提取表达式列表创建装置，可以至少计算所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或创建的各高级特征提取表达式的各评估值；以及所述低级特征提取表达式列表创建装置，至少基于所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或所述各高级特征提取表达式的各评估值，可以更新所述各低级特征提取表达式，其构成所述各低级特征提取表达式列表，所述各评估值和所述各贡献比率已经通过所述高级特征提取表达式创建装置计算。

根据本发明的另一个实施例，提供了一种信息处理方法，其随信息处理设备使用，该信息处理设备创建特征检测算法，该算法用于从内容数据检测各特征，所述信息处理方法包括步骤：基于最近一代的各表达式列表，通过学习创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据或与所述内容数据相对应的元数据，并从该表达式输出各低级特征；利用创建的下一代的各表达式列表，计算所述各低级特征；以及基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的、与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样一种表达式：向该表达式输入计算的各低级特征，并从该表达式输出所述内容数据的各高级特征特性。

按照本发明的进一步的实施例，提供了一种用于控制信息处理设备的程序，该信息处理设备创建特征检测算法，该算法用于从内容数据检测各特征，所述程序使得所述信息处理设备的计算机执行包括如下步骤的过程：基于最近一代的各表达式列表，通过学习创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据或与所述内容数据相对应的元数据，并从该表达式输出各低级特征；利用创建的下一代的各表达式列表，计算所述各低级特征；以及基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入计算的各低级特征，并从该表达式输出所述内容数据的高级特征特性。

在使用如上所概括的、本发明各实施例的任何一个的情形中，基于最近一代的各表达式列表，通过学习首先创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据、或与所述内容数据相对应的元数据，并从该表达式输出各低级特征。利用创建的所述下一代的各表达式列表，计算所述各低级特征。基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的、与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入计算的所述各低级特征，并从该表达式输出所述内容数据的各高级特征特性。

[本发明的效果]

本发明的各实施例，如上所概括的那样，使得能够从输入的如歌曲数据的内容数据高度精确地快速提取各特征。

附图说明

图1是解释过去的特征提取算法的示意图。

图2是概述按照本发明的特征提取算法创建设备创建的特征提取算法的示意图。

图3是示出典型的低级特征提取表达式的示意图。

图4是示出典型的高级特征提取表达式的示意图。

图5是示出按照本发明的特征提取算法创建设备的第一结构性实例的框图。

图6是示出构成特征提取算法创建设备的部分的高级特征计算部分的结构性实例的框图。

图7是构成特征提取算法学习过程的各步骤的流程图。

图8是示出典型的低级特征提取表达式列表的示意图。

图9是构成低级特征提取表达式列表创建过程的各步骤的流程图。

图10是构成由作为图5中的部分结构的低级特征提取表达式列表创建部分执行的、第一代列表随机创建过程的各步骤的流程图。

图11是示出如何典型地描述低级特征提取表达式的示意图。

图12是列出输入数据的实例的表格视图。

图13是解释输入数据“Wav”的示意图。

图14是解释输入数据“Chord(和弦)”的示意图。

图15是解释输入数据“Key(调)”的示意图。

图16是解释用于支持低级特征提取表达式的维度的示意图。

图17是构成下一代列表遗传创建过程的各步骤的流程图。

图18是构成由作为图5中的部分结构的低级特征提取表达式列表创建部分执行的、选择创建过程的各步骤的流程图。

图19是构成由作为图5中的部分结构的低级特征提取表达式列表创建部分执行的、交叉创建过程的各步骤的流程图。

图20是构成由作为图5中的部分结构的低级特征提取表达式列表创建部分执行的、突变创建过程的各步骤的流程图。

图21是解释使用运算符“均值(mean)”的计算的示意图。

图22是解释由低级特征计算部分的处理的示意图。

图23是解释训练数据的各实例的示意图。

图24是构成由作为图5的部分结构的高级特征提取表达式学习部分执行的、高级特征提取表达式学习过程的各步骤的流程图。

图25是解释学习算法的图形表示。

图26是解释另一个学习算法的图形表示。

图27是解释另一个学习算法的图形表示。

图28是解释另一个学习算法的图形表示。

图29是解释另一个学习算法的图形表示。

图30是解释另一个学习算法的图形表示。

图31是解释另一个学习算法的图形表示。

图32是解释另一个学习算法的图形表示。

图33是解释另一个学习算法的图形表示。

图34是构成基于学习算法、并且由作为图5的部分结构的高级特征提取表达式学习部分执行的、学习过程的各步骤的流程图。

图35是示出各运算符的典型组合的示意图。

图36是示出各运算符的另一个典型组合的示意图。

图37是构成新的运算符创建过程的各步骤的流程图。

图38是构成高精度高级特征计算过程的各步骤的流程图。

图39是构成高精度拒绝过程的各步骤的流程图。

图40是示出按照本发明的特征提取算法创建设备的第二结构实例的框图。

图41是构成由作为图40中的部分结构的低级特征提取表达式列表创建部分执行的、第一代列表随机创建过程的各步骤的流程图。

图42是构成由作为图40中的部分结构的低级特征提取表达式列表创建部分执行的、选择创建过程的各步骤的流程图。

图43是构成由作为图40中的部分结构的低级特征提取表达式列表创建部分执行的、交叉创建过程的各步骤的流程图。

图44是构成由作为图40中的部分结构的低级特征提取表达式列表创建部分执行的、突变创建过程的各步骤的流程图。

图45是构成由作为图40的部分结构的高级特征提取表达式学习部分执行的、高级特征提取表达式学习过程的各步骤的流程图。

图46是构成基于学习算法、并且由作为图5的部分结构的高级特征提取表达式学习部分执行的、学习过程的各步骤的流程图。

图47是示出通用个人计算机的典型结构的框图。

[附图标号说明]

20特征提取算法创建设备，21低级特征提取表达式列表创建部分，22运算符组合检测部分，23运算符创建部分，24低级特征计算部分，25 高级特征提取表达式学习部分，26高级特征计算部分，27控制部分，41低级特征计算部分，42高级特征计算部分，43平方误差计算部分，44拒绝区域提取表达式学习部分，45特征提取精度计算部分，60特征提取算法创建设备，61低级特征提取表达式列表创建部分，62高级特征计算部分，100个人计算机，101 CPU，111记录介质

具体实施方式

现在将参照附图描述本发明的优选实施例。

图2是概述按照本发明、由特征提取算法创建设备20(图5)或60(图40)创建的特征提取算法的示意图。

该特征提取算法11由两个部分组成：低级特征提取部分12，内容数据(歌曲数据)和与所述内容数据相对应的元数据(属性数据)被输入其中，并且从其中输出各低级特征；以及高级特征提取部分14，各低级特征被输入其中，并且从其中输出各高级特征。

低级特征提取部分12具有：低级特征提取表达式列表13，其包括多如“m”个的低级特征提取表达式，每个具有至少一个运算符的组合，利用其对输入数据执行预定运算。该低级特征提取部分12因此将“m”个低级特征输出到高级特征提取部分14。

构成低级特征提取表达式列表13的低级特征提取表达式的数“m”，在如图5所示的特征提取算法创建设备20的情形中，是预定的常数。对于图40中的特征提取算法创建设备60，该数“m”是随机确定的数。

图3是示出典型的低级特征提取表达式的示意图。

作为举例，图3的部分A中的低级特征提取表达式f1输入波形数据，作为一种类型的歌曲数据，计算在涉及的各通道(例如，左和右)之间的输入波形数据的各均值，在时间轴上将计算的各均值进行快速傅立叶变换(FFT)，从该FFT结果获取频率的标准偏差(StDev)，并且输出作为结果的标准偏差作为低级特征“a”。

作为另一个实例，图3的部分B中的低级特征提取表达式f2输入和弦进行(chord progression)数据，作为另一种类型的歌曲数据，获取时间轴上的小三和弦(minor chords)的发生率(incidence)(比率(ratio))，并且输出作为结果的发生率作为低级特征“b”。

由低级特征提取部分12输出的低级特征本身不必是有意义的值。

高级特征提取部分14拥有“k”个高级特征提取表达式，其输入“m”个低级特征，对输入的“m”个低级特征的至少一个，执行相对简单的计算(算术运算、乘方(raise to power)等)，并且输出运算结果作为高级特征。该高级特征提取部分14因此输出“k”个高级特征。

图4是示出典型的高级特征提取表达式的示意图。

示例性地，图4的部分A中的高级特征提取表达式F1对低级特征“a”、“b”、“c”、“d”和“e”执行算术运算，并且输出运算的结果，作为构成单个高级特征的速度值。

作为另一个实例，图4的部分B中的低级特征提取表达式F2对低级特征“a”、“c”、“d”和“e”执行算术运算并且乘方，并且输出运算的结果，作为构成另一个单个高级特征的亮度值。

图5是示出按照本发明的特征提取算法创建设备20的第一结构性实例的框图。

该特征提取算法创建设备20基于遗传算法，通过学习创建最佳的低级和高级特征提取表达式。

特征提取算法创建设备20包括5个主要部分：低级特征提取表达式列表创建部分21，其创建“n”个低级特征提取表达式列表，其每个包括“m”个低级特征提取表达式；低级特征计算部分24，其输入“n”个低级特征提取表达式列表中的“j”个歌曲的输入数据(内容数据和元数据)，并且计算与每个输入数据项相对应的“m”个低级特征的“n”个组合，所述“n”个低级特征提取表达式列表由低级特征提取表达式列表创建部分21提供；高级特征提取表达式学习部分25，其基于训练数据(与“j”个歌曲的每个相对应的“k”个高级特征)，通过学习估计高级特征提取表达式，所述训练数据对应于由低级特征计算部分24输出的各低级特征的“n”个组合；高级特征计算部分26，其使用通过遗传学习最终创建的高级特征提取表达式，计算高级特征；以及控制部分27，其控制由涉及的各部分执行的各循环。

在接下来的描述中，基于遗传算法的学习还可以被称作为遗传学习。

低级特征提取表达式列表创建部分21，随机地创建低级特征提取表达式列表，其每个包括“m”(预定的常数)个第一代的低级特征提取表达式。对于第二和随后的各代中的每代，低级特征提取表达式列表创建部分21，基于最后代的低级特征提取表达式列表，使用各低级特征，通过学习典型地创建低级特征提取表达式列表。

低级特征提取表达式列表创建部分21中并入的运算符组合检测部分22，检测在创建的低级特征提取表达式中频繁出现的多个运算符的组合。运算符创建部分23，将由运算符组合检测部分22检测的多个运算符的组合，注册为新的运算符。

高级特征提取表达式学习部分25，创建与“n”个低级特征的每一个相对应的“k”个高级特征提取表达式，计算每个高级特征提取表达式中的每个低级特征的贡献比率、以及每个高级特征提取表达式的估计的精度级别，并且输出各计算结果到低级特征提取表达式列表创建部分21。对于学习的最近一代，高级特征提取表达式学习部分25，从“n”个低级特征提取表达式列表中，选择构成低级特征提取表达式列表的“m”个低级特征提取表达式，所述低级特征提取表达式列表具有获取的各高级特征的最高均值精度，并且与对应于所述列表的“k”个高级特征提取表达式一起，将选择的“m”个低级特征提取表达式，提供给高级特征计算部分26。

高级特征计算部分26，利用由高级特征提取表达式学习部分25最终提供的低级和高级特征提取表达式，计算高级特征。

图6是示出高级特征计算部分26的详细的结构实例的框图。

高级特征计算部分26包括5个主要部分：低级特征计算部分41，用于通过将输入数据(内容数据和与该内容数据相对应的元数据)代入最终获取的低级特征提取表达式列表，计算各低级特征；高级特征计算部分42，用于通过将由低级特征计算部分41计算的各低级特征，代入最终获取的高级特征提取表达式，计算高级特征；平方误差计算部分43，用于计算一方面由高级特征计算部分42计算的高级特征，并且另一方面训练数据(与输入数据相对应的真正的高级特征)之间的平方误差；拒绝区域提取表达式学习部分44，用于通过学习创建拒绝区域提取表达式，向该拒绝区域提取表达式输入由低级特征计算部分41计算的各低级特征，并且从该拒绝区域提取表达式输出由平方误差计算部分43计算的平方误差；以及特征提取精度计算部分45，用于将输入数据，代入由拒绝区域提取表达式学习部分44创建的拒绝区域提取表达式，估计关于输入数据计算的、高级特征的特征提取精度级别(平方误差)，并且只要该估计的特征提取精度级别高于预定的阈值，则使高级特征计算部分42计算该高级特征。

下面描述作为本发明的第一实施例的特征提取算法创建设备20的工作。

图7是构成特征提取算法创建过程的各步骤的流程图。其是特征提取算法创建设备20的基本操作。

在步骤S1，控制部分27通过将学习循环参数G初始化为“1”，开始学习循环。该学习循环被重复与预定的学习计数“g”一样多的次数。

在步骤S2，低级特征提取表达式列表创建部分21，创建“n”个低级特征提取表达式列表，其每个包括“m”个低级特征提取表达式，并且输出创建的各列表到低级特征计算部分24，如图8中所示。

下面参照图9的流程图，详细描述步骤S2(即，低级特征提取表达式列表创建过程)的过程。

在步骤S11，低级特征提取表达式列表创建部分21检查以便确定：要创建的各低级特征提取表达式列表是否是第一代的。如果学习循环参数G被设置为“0”，则要创建的各低级特征提取表达式列表被发现是第一代的。

当因为学习循环参数G被设置为“0”，而发现要创建的各低级特征提取表达式列表是第一代的时，到达步骤S12。在步骤S12，低级特征提取表达式列表创建部分21，随机创建第一代的低级特征提取表达式列表。

相反，如果要创建的低级特征提取表达式列表被发现不是第一代的时，则到达步骤S13。在步骤S13，低级特征提取表达式列表创建部分21，基于最近一代的各低级特征提取表达式列表，使用遗传算法，按遗传方式创建下一代的各低级特征提取表达式列表。

下面参照图10的流程图，详细描述S12的过程(即，第一代列表随机创建过程)。

在步骤S21，控制部分27通过将列表循环参数N初始化为“1”，开始列表循环。该列表循环被重复与预定的列表计数“n”一样多的次数。

在步骤S22，控制部分27通过将表达式循环参数M初始化为“1”，开始表达式循环。该表达式循环被重复与低级特征提取表达式的数“m”相同的次数，所述低级特征提取表达式构成单个低级特征提取表达式列表。

下面参照图11解释，在表达式循环期间，创建的各低级特征提取表达式典型地是如何描述的。

输入数据在低级特征提取表达式的最左位置描述。在该输入数据的右边，是按它们进行运算的次序描述的一个或多个运算符。每个运算符按需要可以包括过程对称轴和参数。

在如图11所示的低级特征提取表达式的情形，输入数据是“12TonesM”，并且各操作符是“32#Differential”、“32#MaxIndex”、“16#LPF_；0.861”等。图示性地，输入数据“12TonesM”指示单声道PCM(脉冲编码调制声音源)波形数据出现在时间轴方向。标注“48#”代表通道轴，“32#”代表频率和间隔轴，而“16#”代表时间轴。运算符中的参数“0.861”应用于低通滤波，并且图示性地表示滤波过程的阈值频率。

回到图10中的步骤S23，低级特征提取表达式列表创建部分21，在要创建的第N个低级特征提取表达式列表(下文又被称作为列表N)中，随机确定第M个低级特征提取表达式(在下文中又称作为低级特征提取表达式M)的输入数据。

典型的输入数据类型可以包括：“Wav”、“12Tones(12音)”、“Chord”、和“Key”，如图12所示。

输入数据“WAV”是如图13中所示的PCM波形数据，并且涉及的支持(holding)维度是时间和通道轴。输入数据“12Tones”是由时间轴上的间隔分析的PCM波形数据，并且支持维度是时间和间隔轴。输入数据“Chord”表示如图14中所示的歌曲和弦进行(C、C#、D、...，Bm)，并且支持维度是时间和间隔轴。输入数据“Key”表示歌曲调(C、C#、D、...、B)，并且支持维度是时间和间隔轴。

回到图10中的步骤S24，低级特征提取表达式列表创建部分21随机地确定，在要创建的列表N中用于低级特征提取表达式M的参数和过程对称轴。

各参数类型可以包括：均值(Mean)，快速傅立叶变换(FFT)、标准偏差(StDev)、发生率(比率)、低通滤波器(LPF)、高通滤波器(HPF)、绝对值(ABS)、微分(Differential(微分))、最大值(MaxIndex)和无偏方差(UVariance)。过程对称轴可以表现为对已经确定的特定运算符是固定的。在这样的情形，采用对关注的运算符中的参数固定的过程对称轴。如果确定的运算符表现出需要特定参数，则该参数被设置为随机值或预定的值。

在步骤S25中，低级特征提取表达式列表创建部分21，检查以便确定：在直到该时间点(point in time)创建的列表N中，由低级特征提取表达式M的计算结果，是标量(scalar)(一维)还是最多预定数目的维度(例如，如1或2的小数目)。如果在步骤S25中检查结果是负的，则再次到达步骤S24，并且多添加一个运算符。重复步骤S24和S25，计算结果中的支持维度的数目如图16所示那样降低。如果在步骤S25中，在列表N中由低级特征提取表达式M计算的结果，是标量或至多预定的小数目的维度(例如，1或2)，则到达步骤S26。

在步骤S26，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则参数M被增加“1”，并且再次到达步骤S23。相反，如果表达式循环参数M未被发现小于最大值“m”(即如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S27。因此由直到该点的处理，创建第N个低级特征提取表达式列表。

在步骤S27，控制部分27检查以便确定：列表循环参数N是否小于最大值“n”。如果列表循环参数N被发现小于最大值“n”，则参数N被增加“1”，并且再次到达步骤S22。另一方面，如果列表循环参数N未被发现小于最大值“n”(即，如果参数N等于最大值“n”)，则退出列表循环，并且第一代列表随机创建过程被终止。因此由直到该点的处理，创建第一代的多如“n”个的低级特征提取表达式列表。

下面参照图17的流程图，详细描述用于创建在图9的步骤S13中的第二和随后的各代的各低级特征提取表达式列表的过程(即，下一代列表遗传创建过程)。

在步骤S31，低级特征提取表达式列表创建部分21随机地确定3个数目：选择计数“ns”，表示从要创建的“n”个低级特征提取表达式列表中，应用了遗传算法选择的列表的数目；交叉计数“nx”，表示应用了遗传算法交叉的列表的数目；以及突变计数“nm”，指示应用了遗传算法突变的列表的数目。该选择计数“ns”、交叉计数“nx”和突变计数“nm”的总和等于“n”。作为替代，该选择计数“ns”、交叉计数“nx”和突变计数“nm”每个可以是预定的常数。

在步骤S32，低级特征提取表达式列表创建部分21，使用总计达(amounting to)选择计数“ns”的低级特征提取表达式列表，创建多如“ns”个的低级特征提取表达式列表，所述“ns”从最近一代的“n”个低级特征提取表达式列表中确定。在步骤S33中，低级特征提取表达式列表创建部分21，使用总计达交叉计数“nx”的低级特征提取表达式列表，创建多如“nx”个的低级特征提取表达式列表，所述“nx”从最近一代的“n”个低级特征提取表达式列表中确定。在步骤S34中，低级特征提取表达式列表创建部分21，使用总计达突变计数“nm”的低级特征提取表达式列表，创建多如“nm”个的低级特征提取表达式列表，所述“nm”从最近一代的“n”个低级特征提取表达式列表中确定。

下面详细描述步骤S32至S34中的每个的过程。

现在将参照图18的流程图，详细描述步骤S32的选择创建过程。该选择创建过程，从下一代的“n”个低级特征提取表达式列表中，创建总计达选择计数“ns”的低级特征提取表达式列表。

在步骤S41，低级特征提取表达式列表创建部分21，按各高级特征提取表达式的均值估计精度级别的降序，排序最近一代的“n”个低级特征提取表达式列表，所述各高级特征提取表达式，从高级特征提取表达式学习部分25输入。在步骤S42，低级特征提取表达式列表创建部分21，从最近一代的经排序的“n”个低级特征提取表达式列表中，采用顶端的“ns”个低级特征提取表达式列表，作为下一代的低级特征提取表达式列表。这使得选择创建过程结束。

现在将参照图19的流程图，详细描述图17的步骤S33的交叉创建过程。该交叉创建过程，从下一代的“n”个低级特征提取表达式列表中，创建总计达交叉计数“nx”的低级特征提取表达式列表。

在步骤S51，控制部分27通过初始化交叉循环参数NX为“1”，开始交叉循环。交叉循环被重复与交叉计数“nx”一样多的次数。

在步骤S52，低级特征提取表达式列表创建部分21，在随机选择两个低级特征提取表达式列表A和B之前，加权最近一代的各低级特征提取表达式列表，以便按由高级特征提取表达式学习部分25输出的、高级特征提取表达式的、均值估计精度级别的降序，导出(induce)该列表的优先部分。在该过程的选择期间，由如上所述的选择创建过程选择的“ns”个低级特征提取表达式列表，可以从候选者列表中排除，或可以作为部分候选者列表而保持原样。

在步骤S53，控制部分27通过初始化表达式循环参数M为“1”，开始表达式循环。该表达式循环被重复与表达式的数“m”一样多的次数，所述表达式包括在单个低级特征提取表达式列表中。

在步骤S54，低级特征提取表达式列表创建部分21，在随机选择单个低级特征提取表达式(包括在下一代的低级特征提取表达式列表内)之前，加权在低级特征提取表达式列表A和B中的“2m”个低级特征提取表达式，以便按各高级特征提取表达式的各贡献比率的降序，导出各表达式的优先部分，所述各高级特征提取表达式由高级特征提取表达式学习部分25输出。

在步骤S55，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则参数M被增加“1”，并且再次到达步骤S54。相反，如果表达式循环参数M未被发现小于最大值“m”(即如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S56。因此在构成表达式循环的步骤S53至S55中，创建单个低级特征提取表达式列表。

在步骤S56，控制部分27检查以便确定：交叉循环参数NX是否小于最大值“nx”。如果交叉循环参数NX被发现小于最大值“nx”，则参数NX被增加“1”，并且再次到达步骤S52。另一方面，如果交叉循环参数NX未被发现小于最大值“nx”(即如果参数NX等于最大值“nx”)，则退出交叉循环，并且交叉创建过程被终止。因此由已经执行的交叉循环，创建总计达交叉计数“nx”的低级特征提取表达式列表。

现在将参照图20的流程图，详细描述图17中的步骤S34的突变创建过程。该突变创建过程，从下一代的“n”个低级特征提取表达式列表中，创建总计达突变计数“nm”的低级特征提取表达式列表。

在步骤S61，控制部分27通过初始化突变循环参数NM为“1”，开始突变循环。突变循环被重复与突变计数“nm”一样多的次数。

在步骤S62，低级特征提取表达式列表创建部分21，在随机选择单个低级特征提取表达式列表A之前，加权最近一代的各低级特征提取表达式列表，以便按各高级特征提取表达式的均值估计精度级别的降序，导出各列表的优先部分，所述各高级特征提取表达式由高级特征提取表达式学习部分25输出。在该过程的选择期间，由如上所述的选择创建过程选择的“ns”个低级特征提取表达式列表，可以从各候选者列表中排除，或可以作为部分候选者列表而保持原样。同样，上面的交叉创建过程的步骤S52中选择的各低级特征提取表达式列表，可以从各候选者列表中排除，或可以作为各部分候选者列表而保持原样。

在步骤S63，控制部分27通过初始化表达式循环参数M为“1”，开始表达式循环。该表达式循环被重复与各表达式的数“m”一样多的次数，所述各表达式包括在单个低级特征提取表达式列表中。

在步骤S64，低级特征提取表达式列表创建部分21，检查以便确定：在低级特征提取表达式列表A中的“m”个低级特征提取表达式中，使用第M个低级特征提取表达式计算的低级特征的贡献比率，是否低于在低级特征提取表达式列表A中，使用其它低级特征提取表达式计算的低级特征的各贡献比率。更具体地讲，进行检查以确定：使用第M个低级特征提取表达式计算的低级特征的贡献比率，是否低于在低级特征提取表达式列表A中，使用“m”个低级特征提取表达式计算的贡献比率序列中的预定比率。

如果在步骤S64，使用第M个低级特征提取表达式计算的低级特征的贡献比率，被发现低于其他，则到达步骤S65。在步骤S65，低级特征提取表达式列表创建部分21，随机地突变包括在下一代的低级特征提取表达式列表中的第M个低级特征提取表达式。

如果在步骤S64，使用第M个低级特征提取表达式计算的低级特征的贡献比率，未被发现低于其他，则到达步骤S66。在步骤S66，低级特征提取表达式列表创建部分21，将第M个低级特征提取表达式，添加到下一代的低级特征提取表达式列表，而不突变存在置疑的表达式。

在步骤S67，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则表达式循环参数M被增加“1”，并且再次到达步骤S64。另一方面，如果表达式循环参数M未被发现小于最大值“m”(即，如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S68。因此在构成表达式循环的步骤S63至S67中，创建单个的低级特征提取表达式列表。

在步骤S68，控制部分27检查以便确定：突变循环参数NM是否小于最大值“ nm”。如果突变循环参数NM被发现小于最大值“nm”，则突变循环参数NM被增加“1”，并且再次到达步骤S62。另一方面，如果突变循环参数NM未被发现小于最大值“nm”(即如果参数NM等于最大值“nm”)，则退出突变循环，并且突变创建过程被终止。因此由直达该点的处理，创建总计达突变计数“nm”的各低级特征提取表达式列表。

按照如上所述的下一代列表遗传创建过程，具有高估计精度级别的最近一代的各低级特征提取表达式列表，被发送到下一代，而具有高贡献比率的最近一代的各低级特征提取表达式也一样。具有低估计精度级别和贡献比率的那些被放弃，而不发送到下一代。即，随着各代进展，各低级特征提取表达式列表的估计精度级别被期望改进，而各低级特征提取表达式的贡献比率也一样。

返回到图7，如上面讨论那样创建的下一代的各低级特征提取表达式列表，由低级特征提取表达式列表创建部分21输出到低级特征计算部分24。在步骤S3，低级特征计算部分24，通过将“j”个歌曲C1至Cj的输入数据(内容数据和元数据)，代入到“n”个低级特征提取表达式列表的每个，计算各低级特征，所述低级特征提取表达式列表，从低级特征提取表达式列表创建部分21输入。

假定“j”个歌曲的输入每个数据项目被预先提供有多如“k”个的训练数据项目(即，对应于各高级特征)。

作为举例，假定低级特征计算部分24如图21的部分A所示的那样，通过涉及“#16Mean”运算符的计算，对其支持维度是间隔和时间轴的输入数据运算。在此情形中，在用作过程对称轴的时间轴上，计算每个间隔处的均值，如图21的部分B描述的那样。该计算导致各低级特征提取表达式的“n”个组合(每个组合由“m”个低级特征构成)，每个组合对应于每个输入数据项目，如同图22所示的那样。作为结果的“n”个低级特征提取表达式组合，被输出到高级特征提取表达式学习部分25。

回到图7中的步骤S4，高级特征提取表达式学习部分25，基于从低级特征计算部分24输入的”n”个低级特征、以及相对应的训练数据(即，如图23所示，与每个输入数据项目(关于歌曲C1至Cj)相对应的“k”个类型的高级特征)，通过学习，估计(即，创建)“n”个高级特征提取表达式组合，每个高级特征提取表达式组合包括“k”个高级特征提取表达式。高级特征提取表达式学习部分25，进一步计算每个高级特征提取表达式中的每个低级特征的贡献比率、以及每个高级特征提取表达式的估计的精度级别，并且将计算结果输出到低级特征提取表达式列表创建部分21。

现在参照图24的流程图，在下文详细描述步骤S4的高级特征提取表达式学习过程。

在步骤S71，控制部分27通过初始化列表循环参数N为“1”，开始列表循环。该列表循环被重复与预定的列表计数“n”一样多的次数。在步骤S72，控制部分27通过初始化训练数据循环参数K为“1”，开始训练数据循环。该训练数据循环被重复与预定训练数据类型计数“k”一样多的次数。

在步骤S73，控制部分27通过初始化算法循环参数A为“1”，开始算法循环。该算法循环被重复与预定的学习算法类型计数“a”一样多的次数。

作为实例，可以认为存在4种学习算法类型：回归(regression)(回归分析)、分类(分级)、SVM(支持矢量机)和GP(遗传编程)。

可以提供两种“回归”类型的学习算法。如图25所示，一种算法涉及以一种方式学习参数“b_n”，使得在假定训练数据与各低级特征线性相关时，训练数据和项目Y之间的平方误差被最小化。另一种算法，如图26所示，涉及以一种方式学习参数“b_nm”，使得在假定训练数据与各低级特征非线性相关时，训练数据和项目Y之间的平方误差被最小化。

可以提供三种主要的“分类”类型的学习算法。一种算法，如图27所示，涉及计算给定项目与不同类(图27的实例中的男声类和女声类)的每个的中心的欧几里得(Euclidian)距离“d”，并且将所述项目分入一类，至该类的计算的欧几里得距离“d”最短。另一种算法，如图28所示，涉及计算给定项目的相关系数“correl”，所述给定项目与不同类(图28的实例中的男声类和女声类)的每个的均值矢量有关，并且将所述项目分入涉及相关系数“correl”最大的类。另一种算法，如图29所示，涉及计算给定项目与不同分类(图29的实例中的男声类和女声类)的每个的中心的马哈拉诺比斯距离(Mahalanobis)距离“d”，并且将所述项目分入一类，至该类的计算的马哈拉诺比斯距离“d”最短。

还可能考虑两种“分类”类型的学习算法变体(variation)。一种变体，如图30的部分A所示，涉及具有用多个类表示的、不同类的组(图30的实例中的男和女声类的组)的每个的分布，计算给定项目从不同类的每个的中心的欧几里得距离“d”，并且将所述项目分入一类，至该类的计算的欧几里得距离“d”最短。另一种变体，如图30的部分B所示，涉及具有用多个类表示的、不同类的组(图30的实例中的男和女声类的组)的每个的分布，计算给定项目从不同类的每个的中心的马哈拉诺比斯距离(Mahalanobis)距离“d”，并且将所述项目分入一类，至该类的计算的马哈拉诺比斯距离“d”最短。

可以提供一种“SVM”类型的学习算法。该算法如图31所示，涉及具有用支持矢量表示的各类(图31的实例中的男和女声类)之间的边界平面，和用此方法学习参数“bnm”，以便最大化一方面区分各类的不连续平面、以及另一方面边界平面附近的各矢量之间的距离(余量)。

可以提供3种“GP”类型的学习算法。一种算法如图32所示，涉及通过遗传编程，创建组合各低级特征的表达式。另一种算法，如图33的部分A所示，涉及交叉表达式，其每个表达式组合了各低级特征。另一种算法，如图33的部分B所示，涉及突变组合各低级特征的表达式。

如果上面概述的学习算法全部被采用，则将存在用于使用的11种学习算法。

回到图24的步骤S74，控制部分27通过初始化交叉确认循环参数C为“1”，开始交叉确认循环。该交叉确认循环被重复与预定的交叉确认计数“c”一样多的次数。

在步骤S75，高级特征提取表达式学习部分25，从多如“k”个的训练数据类型中，将大约“j”个歌曲的第K个类型的训练数据(真正的高级特征)，随机地二分为学习使用数据和评估使用数据。在下面的描述中，将为学习使用分类的训练数据称作为学习数据，而将为评估使用分类的训练数据称作为评估数据。

在步骤S76，高级特征提取表达式学习部分25，通过学习估计高级特征提取表达式，该学习涉及将第a个学习算法应用到相对应的学习数据、以及使用第N个低级特征提取表达式列表计算的“m”个低级特征的组合。在所述学习期间，“m”个低级特征的一些被遗传地选择来使用，以便降低计算量，并且抑制过度的学习(over-learning)(过度的适合)。

作为选择各低级特征的标准，使用作为函数的、称作为AIC(Akaike信息标准)的信息数量标准、或称作为BIC(贝叶斯信息标准)的信息数量标准。该AIC和BIC每个都被用作用于选择学习模型的标准(此情形中关于选择的各低级特征)。所述学习模型的值越小，则所述模型越好(即，高度地被评估)。

所述AIC用下面的表达式定义：

AIC＝-2×最大对数似然+2×自由参数计数

如果“回归(线性)”类型的学习算法被采用(如图25中的情形)，则

自由参数计数＝n+1

以及

对数似然＝0.5×学习数据计数×((log(2∏)+1+log(均方误差))

使得

AIC＝学习数据计数×((log(2∏)+1+log(均方误差))+2×(n+1)

所述BIC用下面的表达式定义：

BIC＝-2×最大对数似然+log(学习数据计数)×自由参数计数

作为实例，如果“回归(线性)”类型的学习算法被采用(如图25中的情形)，则

BIC＝学习数据计数×((log(2∏)+1+log(均方误差))+log(学习数据计数)×(n+1)

与AIC相比，注意到，所述BIC不管学习数据的正在增长的数量，而其值的增加可忽略。

现在将参照图34，描述步骤S76中基于学习算法的学习过程。对于该学习过程，如上面讨论的那样，计算的“m”个低级特征的一些被遗传地选择来使用，以便降低计算量，并且抑制过度的学习(过度的适合)。

在步骤S91，高级特征提取表达式学习部分25，从“m”个低级特征(用于在学习中使用)通过随机选择，创建多如“p”个低级特征的初始群体(initialpopulation)。

在步骤S92，高级特征提取表达式学习部分25，使用遗传算法(GA)开始特征选择循环。基于GA的特征选择循环被重复，直到特定条件在后续的步骤S98中被满足。

在步骤S93，控制部分27通过初始化初始群体循环参数P为“1”，开始初始群体循环。该初始群体循环被重复与步骤S91中创建的、低级特征的初始群体的数量“p”一样多的次数。

在步骤S94，高级特征提取表达式学习部分25，从训练数据中通过学习估计高级特征提取表达式，该学习涉及将第A个学习算法应用到各低级特征和相对应的学习数据，所述各低级特征被包括在第P个初始群体中。

在步骤S95，高级特征提取表达式学习部分25，计算信息数量标准AIC或BIC，作为以步骤S94的结果获得的高级特征的评估值。

在步骤S96，控制部分27检查以便确定：初始群体参数P是否小于最大值“P”。如果初始群体参数P被发现小于最大值“p”，则所述初始群体循环参数P被增加“1”，并且再次到达步骤S94。另一方面，如果初始群体参数P未被发现小于最大值“p”(即如果参数P等于最大值“p”)，则退出初始群体循环，并且到达步骤S97。因此信息数量标准AIC或BIC，通过构成初始群体循环的S96，被获取为用于高级特征提取表达式的评估值，所述高级特征提取表达式从步骤S93中的每个初始群体学习。

在步骤S97，高级特征提取表达式学习部分25，遗传性地更新“p”个由各低级特征组成的初始群体，以便被用于学习。更具体地讲，如在图17的步骤S32至S34，初始群体通过选择、交叉和突变被更新。所述更新意图在于，改进以随机方式从初始创建的初始群体获取的、高级特征提取表达式的评估值。

在步骤S98，控制部分27检查以便确定：在对应于“p”个初始群体的各高级特征提取表达式中，具有最高评估值(即，最小信息数量标准)的高级特征提取表达式，在继每个基于GA的特征选择循环之后，是否被发现具有其被改进的评估值(即，信息数量标准被降低)。如果在步骤S98中的检查的结果是肯定的，则再次到达步骤S93，并且所述特征选择循环被重复。另一方面，可能发生：在与“p”个初始群体相对应的各表达式中，具有最高评估值的高级特征提取表达式，在继重复的基于GA的特征选择循环之后，未被发现具有其被改进的评估值(即，信息数量标准未被降低)。在此情形中，退出基于GA的特征选择循环，并且具有最高评估值的高级特征提取表达式，被输出到下流的过程(即，至图24中的步骤S77)。这使得基于学习算法的学习过程结束。

步骤S91中选择的各低级特征的数目可能被固定。在此情形中，各低级特征的必要数量可以使用相关训练数据的熵获得。同样，可以对各主分量分析所述训练数据，并且可以将各低级特征的数量设置为等于分析的各主分量的数量。

回到在图24中的步骤S77，高级特征提取表达式学习部分25，使用相关的评估数据，评估具有步骤S76中获取的、最高评估值的高级特征提取表达式。更具体地讲，高级特征提取表达式学习部分25，使用获取的高级特征提取表达式计算高级特征，以便发现在计算的结果和存在置疑的评估数据之间的平方误差。

在步骤S78，控制部分27检查以便确定：交叉确认循环参数C是否小于最大值“c”。如果交叉确认循环参数C被发现小于最大值“c”，则参数C被增加“1”，并且再次到达步骤S75。另一方面，如果交叉确认循环参数C未被发现小于最大值“c”(即如果参数C等于最大值“c”)，则退出交叉确认循环，并且到达步骤S79。因此，多如“c”个的高级特征提取表达式被获取，作为构成交叉确认循环的步骤S74至S78中的学习的结果。因为学习数据和评估数据通过交叉确认循环被随机地变换，所以可能验证该高级特征提取表达式没有被过度学习。

在步骤S79，高级特征提取表达式学习部分25，从通过交叉确认循环获取的“c”个高级特征提取表达式中，选择具有从步骤S77获得的、最高评估值的高级特征提取表达式。

在步骤S80，控制部分27检查以便确定：算法循环参数A是否小于最大值“ a”。如果算法循环参数A被发现小于最大值“a”，则参数A被增加“1”，并且再次到达步骤S74。另一方面，如果算法循环参数A未被发现小于最大值“a”(即如果参数A等于最大值“a”)，则退出所述算法循环，并且到达步骤S81。因此在构成所述算法循环的步骤S73至S80中，获取使用“a”个学习算法学习的第K个类型的、多如“a”个的高级特征提取表达式。

在步骤S81，高级特征提取表达式学习部分25，从通过所述算法循环学习的“a”个高级特征提取表达式中，选择具有从步骤S77获得的、最高评估值的高级特征提取表达式。

在步骤S82，控制部分27检查以便确定：训练数据循环参数K是否小于最大值“k”。如果训练数据循环参数K被发现小于最大值“k”，则参数K被增加“1”，并且再次到达步骤S73。另一方面，如果训练数据循环参数K未被发现小于最大值“k”(即如果参数K等于最大值“k”)，则退出所述训练数据循环，并且到达步骤S83。因此在构成所述训练数据循环的步骤S72至S82中，获取与第N个低级特征提取表达式列表相对应的、多如“k”个的高级特征提取表达式。

在步骤S83，控制部分27检查以便确定：列表循环参数N是否小于最大值“n”。如果列表循环参数N被发现小于最大值“n”，则参数N被增加“1”，并且再次到达步骤S72。另一方面，如果列表循环参数N未被发现小于最大值“n”(即如果参数N等于最大值“n”)，则退出所述列表循环，并且到达步骤S84。因此在构成所述列表循环的步骤S71至S83中，获取与n个低级特征提取表达式列表的每个相对应的、多如“k”个的高级特征提取表达式。

在步骤S84，高级特征提取表达式学习部分25，计算“k”个高级特征提取表达式的每个的估计的精确度级别，所述k”个高级特征提取表达式与每个高级特征提取表达式中的每个低级特征的贡献比率、以及获取的“n”个低级特征提取表达式列表的每个相对应，并且将计算结果输出到低级特征提取表达式列表创建部分21。这使得高级特征提取表达式学习过程结束。

回到图7的步骤S5，控制部分27检查以便确定：学习循环参数G是否小于最大值“g”。如果学习循环参数G被发现小于最大值“g”，则参数G被增加“ 1”，并且再次到达步骤S2。另一方面，如果学习循环参数G未被发现小于最大值“g”(即如果参数G等于最大值“g”)，则退出所述学习循环，并且到达步骤S6。步骤S1至S5构成特征提取算法学习过程。继该过程之后的步骤S6，是用于使用特征提取算法计算各高级特征的过程。

在步骤S6，高级特征提取表达式学习部分25，从通过学习获得的最近一代的“n”个低级特征提取表达式列表中，将“m”个低级特征提取表达式，与对应于该列表的“k”个高级特征提取表达式一起，提供给高级特征计算部分26，所述“m”个低级特征提取表达式组成具有获取的各高级特征的最高均值精确度级别的列表。

在步骤S7，高级特征计算部分26，利用最近从高级特征提取表达式学习部分25提供的高级特征提取表达式、以及低级特征提取表达式，计算具有高精度的高级特征。随后将参照图38和后续的附图，描述步骤S7的高精度高级特征计算过程。

前面的段落完成了由特征提取算法创建设备20执行的特征提取算法创建过程的描述。

接下来将描述，继由如上所述的特征提取算法创建过程中，步骤S1至S6构成的重复的学习循环之后，随着低级特征提取表达式列表的各代的进展(如当低级特征提取表达式的贡献比率已经改进、或当相对应的高级特征提取表达式的估计的精度级别已经被提升时)，要执行的新的运算符创建过程。

当各低级特征提取表达式列表的当前代被新的代替换时，多个运算符的排列(permutation)(以后简单地被称作为运算符组合)可以频繁地出现在如图35所示的不同的低级特征表达式中。在此情形中，频繁地出现在不同的低级特征表达式的多个运算符的组合，可以被认为是单个的新操作符，并且由低级特征提取表达式列表创建部分21注册为这样用于使用。

在图35的实例中，显示3运算符组合“32#FFT、Log、32#FFT”，其出现在5个低级特征提取表达式中。如果操作符组合“32#FFT、Log、32#FFT”按图示被注册为一个运算符“NewOperator 1”，则下一代和后续的各代的各低级特征提取表达式，将包括如图36所示的运算符“NewOperator1”。

下面将参照图37的流程图，描述新的运算符创建。在步骤S101中，运算符组合检测部分22，创建预定数量的运算符(例如，1至5个运算符)的排列(序列组合)。在此过程中要创建的运算符组合的数量被假定为“og”。

在步骤S102，控制部分27通过将组合循环参数OG初始化为“1”，开始组合循环。该组合循环被重复与运算符组合计数“og”一样多的次数。

在步骤S103，第og个运算符组合的运算符组合发生频率“Count(计数)”被初始化为“1”。在步骤S104，控制部分27通过将列表循环参数N初始化为“0”，开始列表循环。该列表循环被重复与预定列表计数“n”一样多的次数。在步骤S105，控制部分27通过初始化表达式循环参数M为“1”，开始表达式循环。该表达式循环被重复与低级特征提取表达式的数量“m”一样多的次数，所述低级特征提取表达式构成单个低级特征提取表达式列表。

在步骤S106，运算符组合检测部分22检查以便确定：第og个运算符组合是否存在于第M个低级特征提取表达式中，作为第N个低级特征提取表达式列表的部分。如果第og个运算符组合被发现存在于该表达式，则到达步骤S107，并且发生频率“Count”被增加“1”。另一方面，如果第og个运算符组合没有被发现存在，则步骤S107被跳过，并且到达步骤S108。

在步骤S108，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则参数M被增加“1”，并且再次到达步骤S106。另一方面，如果表达式循环参数M未被发现小于最大值“m”(即如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S109。

在步骤S109，控制部分27检查以便确定：列表循环参数N是否小于最大值“n”。如果列表循环参数N被发现小于最大值“n”，则列表循环参数N被增加“1”，并且再次到达步骤S105。另一方面，如果列表循环参数N未被发现小于最大值“n”(即如果参数N等于最大值“n”)，则退出列表循环，并且到达步骤S110。

在步骤S110，控制部分27检查以便确定：组合循环参数OG是否小于最大值“og”。如果组合循环参数OG被发现小于最大值“og”，则参数OG被增加“1”，并且再次到达步骤S103。另一方面，如果组合循环参数OG未被发现小于最大值“og”(即如果参数OG等于最大值“og”)，则退出组合循环，并且到达步骤S110。因此由直达此点的处理，检测所有运算符组合的每个的发生频率“Count”。

在步骤S111，运算符组合检测部分22，提取其发生频率“Count”高于预定阈值的运算符组合，并且将提取的组合输出到运算符创建部分23。在步骤S112，运算符创建部分23，将从运算符组合检测部分22输入的运算符组合，注册为新运算符。这使得该新运算符创建过程结束。

按照新运算符创建过程，如上面讨论的那样，频繁出现的各运算符的组合，即在计算高级特征中被认为有效的各运算符的组合，被注册为单个运算符，用于在下一代和后续的各代的低级特征提取表达式中使用。这提升了创建低级特征提取表达式的速度、以及表达式各代的进展的速度。因此可能在早些阶段检测有效的各低级特征提取表达式。新运算符创建过程的另一个好处，是对用于手动检测的有效运算符组合的自动检测。

下面参照图38的流程图，更详细地描述图7的步骤S7中的上面概述的高精度高级特征计算过程。

在步骤S141，高级特征计算部分26执行高精度拒绝过程，以便从最终从高级特征提取表达式学习部分25提供的那些表达式中，仅选择产生高精度结果的各高级特征提取表达式。

高精度拒绝过程基于这样的假定：在一方面各高级特征的各精度级别和另一方面的各低级特征的各值之间存在因果(casual)关系。在这样的前提下，该过程涉及通过学习获取拒绝区域提取表达式，向所述拒绝区域提取表达式输入各低级特征、并从其中输出高级特征的精度级别。下面参照图39的流程图，详细描述高精度拒绝过程。

在步骤S151，高级特征计算部分26中的低级特征计算部分41，获取最终的低级特征提取表达式列表。高级特征计算部分26中的高级特征计算部分42，获得最终的高级特征提取表达式。

在步骤S152，控制部分27通过初始化内容循环参数J为“1”，开始内容循环。该内容循环被重复与输入的数据项目(内容数据和元数据)的数量“j”一样多的次数，所述输入的数据项目可被提前提供，用于执行高精度拒绝过程。假定与准备的输入数据相对应的各高级特征，还被提供为训练数据。

在步骤S153，低级特征计算部分41将第L个输入数据项目，代入在步骤S151中获取的最终的低级特征提取表达式列表，并且将从各计算中产生的“m”个低级特征输出到高级特征计算部分42、和拒绝区域提取表达式学习部分44。该高级特征计算部分42，将从低级特征计算部分41输入的“m”个低级特征，代入在步骤S151中获取的最终的高级特征提取表达式中，并且将从这些计算产生的高级特征输出到平方误差计算部分43。

在步骤S154，平方误差计算部分43，计算从高级特征计算部分42输入的高级特征和训练数据(即，与输入数据相对应的真实的高级特征)之间的平方误差，并且将该计算的结果输出到拒绝区域提取表达式学习部分44。由此计算的平方误差，表示由高级特征计算部分42计算的高级特征提取表达式的精度(该计算的精度被称作为特征提取精度)。

在步骤S155，控制部分27检查以便确定：内容循环参数J是否小于最大值“j”。如果内容循环参数J被发现小于最大值“j”，则参数J被增加“1”，并且再次到达步骤S153。另一方面，如果内容循环参数J未被发现小于最大值“j”(即如果参数J等于最大值“j”)，则退出表达式循环，并且到达步骤S156。由此在构成内容循环的步骤S151至S155中，获取与每个输入数据项目相对应的训练数据和计算的高级特征之间的平方误差。

在步骤S156，拒绝区域提取表达式学习部分44，基于从低级特征计算部分41输入的各低级特征、和从平方误差计算部分43输入的平方误差，通过学习创建拒绝区域提取表达式，对其输入各低级特征，并且从其中输出利用输入的数量计算的高级特征的特征提取精度。由此创建的拒绝区域提取表达式被提供给特征提取精度计算部分45。这完成了高精度拒绝过程，并且将控制传递给图38中的步骤S142。

在步骤S142，低级特征计算部分41，将希望获取其高级特征的歌曲的输入数据，代入最终的低级特征提取表达式列表，以便获得各低级特征。该低级特征计算部分41，将这些计算的结果输出到高级特征计算部分42、和特征提取精度计算部分45。

在步骤S143，特征提取精度计算部分45，将从低级特征计算部分41输入的各低级特征，代入从拒绝区域提取表达式学习部分44提供的拒绝区域提取表达式，以便计算高级特征的特征提取精度，所述高级特征利用输入的各低级特征(即，关于由高级特征计算部分42计算的高级特征估计的平方误差)计算。

在步骤S144，特征提取精度计算部分45检查以便确定：步骤S143中计算的特征提取精度是否高于预定的阈值。如果计算的特征提取精度被发现高于阈值，则到达步骤S145。在步骤S145，该特征提取精度计算部分45使得高级特征计算部分42计算高级特征。该高级特征计算部分42，将在步骤S142中从低级特征计算部分41输入的“m”个低级特征，代入最终的高级特征提取表达式，以便计算所述高级特征。在此点计算的高级特征是最终的输出。这完成了高精度高级特征计算过程。

如果在步骤S144，计算的特征提取精度被发现低于预定的阈值，则步骤S145被跳过，并且该高精度高级特征计算过程结束。

如上所述的高精度高级特征计算过程，使得可能利用高级特征提取表达式估计高级特征的精度。因为这些不希望实现高精度级别的高级特征被从计算中排除，所以消除了浪费的计算。

如上所述，由作为本发明的第一实施例实践的、特征提取算法创建设备20执行的特征提取算法学习过程，允许用于从歌曲数据提取相关特征的各算法的快速和高度精确的创建。该学习过程还使得可能用最小的计算仅仅获取高精度级别的各高级特征。

下面描述的是作为本发明的第二实施例实践的特征提取算法创建设备60的工作。图40是示出特征提取算法创建设备60的典型结构的框图。

该特征提取算法创建设备60，利用低级特征提取表达式列表创建部分61、和高级特征提取表达式学习部分65，分别替换在特征提取算法创建设备20中的低级特征提取表达式列表创建部分21、和高级特征提取表达式学习部分25。

在特征提取算法创建设备60和特征提取算法创建设备20之间存在一些差异。一个差异是，尽管低级特征提取表达式列表(由特征提取算法创建设备20的低级特征提取表达式列表创建部分21创建)中的各表达式的数量“m”是常数，但是在每个低级特征提取表达式列表(由特征提取算法创建设备60的低级特征提取表达式列表创建部分61创建)中的各表达式的数量“m”是随机确定的。

另一个差异是，尽管特征提取算法创建设备20的高级特征提取表达式学习部分25，将作为反馈的估计的精度级别和贡献比率，输出到低级特征提取表达式列表创建部分21，但是特征提取算法创建设备60的高级特征提取表达式学习部分65，将作为反馈的评估值和贡献比率，输出到低级特征提取表达式列表创建部分61。

除了低级特征提取表达式列表创建部分61和高级特征提取表达式学习部分65之外，特征提取算法创建设备60的各部件具有与特征提取算法创建设备20中的实质上类似的对应物。该类似的部件由相同的参考标号指定，并且将不进一步描述。

现在将再次参照前面用来解释上面的特征提取算法创建设备20的某些附图，描述特征提取算法创建设备60的工作。

下面参照图7的流程图，描述特征提取算法创建过程，其是特征提取算法创建设备60的基本操作。

在步骤S1，控制部分27通过将学习循环参数G初始化为“1”，开始学习循环。该学习循环被重复与由用户图示性地提前确定的学习计数“g”一样多的次数。

在步骤S2，低级特征提取表达式列表创建部分61，创建“n”个低级特征提取表达式列表，并且将创建的各列表输出到低级特征计算部分24。

下面通过参照图9的流程图，详细描述步骤S2的过程(低级特征提取表达式列表创建过程)。

在步骤S11，低级特征提取表达式列表创建部分61检查以便确定：要创建的低级特征提取表达式列表是否是第一代的。如果所述学习循环参数G被设置为“0”，则要创建的低级特征提取表达式列表被发现是第一代的。

当要创建的低级特征提取表达式列表，被发现因为学习循环参数G被设置为“0”而是第一代的时，到达步骤S12。在步骤S12，低级特征提取表达式列表创建部分61，随机创建第一代的低级特征提取表达式列表。

相反，如果要创建的低级特征提取表达式列表未被发现是第一代的时，则到达步骤S13。在步骤S13，低级特征提取表达式列表创建部分61基于最近一代的低级特征提取表达式列表，利用遗传算法，遗传地创建下一代的低级特征提取表达式列表。

下面参照图41的流程图，详细描述由低级特征提取表达式列表创建部分61执行的、步骤S12中的第一代列表随机创建过程。

在步骤S171，控制部分27通过将列表循环参数N初始化为“1”，开始列表循环。该列表循环被重复与预定的列表计数“n”一样多的次数。

在步骤S172，低级特征提取表达式列表创建部分61，随机确定低级特征提取表达式的数量“m”，所述低级特征提取表达式构成第一代的要创建的第N个低级特征提取表达式列表。

在步骤S173，控制部分27通过将表达式循环参数M初始化为“1”，开始表达式循环。该表达式循环被重复与低级特征提取表达式的数量“m”一样多的次数，所述低级特征提取表达式构成单个的低级特征提取表达式列表。

在步骤S174，低级特征提取表达式列表创建部分61，随机确定输入数据，其用于要创建的第N个低级特征提取表达式列表(也被称作为列表N)中的、第M个低级特征提取表达式(又被称作为低级特征提取表达式M)。

在步骤S175，低级特征提取表达式列表创建部分61，随机确定要创建的列表N中的低级特征提取表达式M的过程对称轴和参数。

在步骤S176，低级特征提取表达式列表创建部分61检查以便确定：直达该时间点创建的列表N中，由低级特征提取表达式M计算的结果，是标量(一维)还是至多预定的维度(例如，如1或2的小的数目)。如果在步骤S176中的检查结果是负，则再次到达步骤S175，并且多添加一个运算符。重复步骤S175和S176，在计算的结果中的支持维度的数量如图16所示那样降低。如果在步骤S176中，由列表N中的低级特征提取表达式M计算的结果，是标量或至多预定的小数量的维度(例如1或2)，则到达步骤S177。

在步骤S177，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则参数M被增加“1”，并且再次到达步骤S174。相反，如果表达式循环参数M未被发现小于最大值“m”(即如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S178。因此在上面的步骤S173至S177中，创建第一代的第N个低级特征提取表达式列表。

在步骤S178，控制部分27检查以便确定：列表循环参数N是否小于最大值“n”。如果列表循环参数N被发现小于最大值“n”，则参数N被增加“1”，并且再次到达步骤S172。另一方面，如果列表循环参数N未被发现小于最大值“n”(即如果参数N等于最大值“n”)，则退出所述列表循环，并且终止第一代列表随机创建过程。因此由直达此点的处理，创建第一代的多如“n”个的低级特征提取表达式列表，每个列表具有不同数目“m”个表达式。

下面参照图17的流程图详细描述的是，由低级特征提取表达式列表创建部分61执行的过程，用于在图9的步骤13中创建第二和后续的各代的低级特征提取表达式列表(即，下一代的列表遗传创建过程)。

在步骤S31，低级特征提取表达式列表创建部分61随机确定3个数量：选择计数“ns”，表示从要创建的“n”个低级特征提取表达式列表中，应用了遗传算法选择的列表的数目；交叉计数“nx”，表示应用了遗传算法交叉的列表的数目；以及突变计数“nm”，指示应用了遗传算法突变的列表的数目。该选择计数“ns”、交叉计数“nx”和突变计数“nm”的总和等于“n”。作为替代，该选择计数“ns”、交叉计数“nx”和突变计数“nm”每个可以是预定的常数。

在步骤S32，低级特征提取表达式列表创建部分61，使用总计达选择计数“ns”的低级特征提取表达式列表，创建多如“ns”个的低级特征提取表达式列表，所述“ns”从最近一代的“n”个低级特征提取表达式列表确定。在步骤S33中，低级特征提取表达式列表创建部分61，使用总计达交叉计数“nx”的低级特征提取表达式列表，创建多如“nx”个的低级特征提取表达式列表，所述“nx”从最近一代的“n”个低级特征提取表达式列表确定。在步骤S34中，低级特征提取表达式列表创建部分61，使用总计达突变计数“nm”的低级特征提取表达式列表，创建多如“nm”个的低级特征提取表达式列表，所述“nm”从最近一代的“n”个低级特征提取表达式列表确定。

下面详细描述步骤S32至S34中的每个的过程。

现在将参照图42的流程图，详细描述由低级特征提取表达式列表创建部分61执行的、步骤S32的选择创建过程。该选择创建过程从下一代的“n”个低级特征提取表达式列表中，创建总计达选择计数“ns”的低级特征提取表达式列表。

在步骤S181，低级特征提取表达式列表创建部分61，按高级特征提取表达式的各均值评估值的降序，排序最近一代的“n”个低级特征提取表达式列表，所述高级特征提取表达式从高级特征提取表达式学习部分65输入。在步骤S182，低级特征提取表达式列表创建部分61，从最近一代的经排序的“n”个低级特征提取表达式列表，采用顶端的“ns”个低级特征提取表达式列表，作为下一代的低级特征提取表达式列表。这使得选择创建过程结束。

现在将参照图43的流程图，详细描述由低级特征提取表达式列表创建部分61执行的、图17中的步骤S33的交叉创建过程。该交叉创建过程从下一代的“n”个低级特征提取表达式列表中，创建总计达交叉计数“nx”的低级特征提取表达式列表。

在步骤S191，控制部分27通过初始化交叉循环参数NX为“1”，开始交叉循环。交叉循环被重复与交叉计数“nx”一样多的次数。

在步骤S192，低级特征提取表达式列表创建部分61，在随机选择两个低级特征提取表达式列表A和B之前，加权最近一代的低级特征提取表达式列表，以便按高级特征提取表达式的各均值评估值的降序，导出该列表的优先部分，所述高级特征提取表达式由高级特征提取表达式学习部分65输出。在该过程的选择期间，由如上所述的选择创建过程选择的“ns”个低级特征提取表达式列表，可以从候选者列表中排除，或可以作为部分候选者列表而保持原样。

在步骤S193，低级特征提取表达式列表创建部分61在如下定义的范围内，在通过后续的表达式循环要创建的每个低级特征提取表达式列表中，随机确定数量“m”个的表达式：

m＝((列表A中的表达式数目+列表B中的表达式数目)/2)±mr

其中，“mr”是预定值。

在步骤S194，控制部分27通过初始化表达式循环参数M为“1”，开始表达式循环。该表达式循环被重复与步骤S193中随机确定的表达式计数“m”一样多的次数。

在步骤S195，低级特征提取表达式列表创建部分61，在随机选择单个低级特征提取表达式列表(包括在下一代的低级特征提取表达式列表中)之前，加权低级特征提取表达式列表A和B中的所有低级特征提取表达式，以便按高级特征提取表达式的各贡献比率的降序，导出各表达式的优先部分，所述高级特征提取表达式由高级特征提取表达式学习部分65输出。

在步骤S196，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则参数M被增加“ 1”，并且再次到达步骤S195。相反，如果表达式循环参数M未被发现小于最大值“m”(即如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S197。因此在构成表达式循环的步骤S194至S196中，创建单个的低级特征提取表达式列表。

在步骤S197中，控制部分27检查以便确定：交叉循环参数NX是否小于最大值“nx”。如果交叉循环参数NX被发现小于最大值“nx”，则参数NX被增加“1”，并且再次到达步骤S192。另一方面，如果交叉循环参数NX未被发现小于最大值“nx ”(即如果参数NX等于最大值“nx”)，则退出交叉循环，并且交叉创建过程被终止。因此由已经执行的交叉循环，创建总计达交叉计数“nx”的低级特征提取表达式列表。

现在将参照图44的流程图，详细描述由低级特征提取表达式列表创建部分61执行的、图17中的步骤S34的突变创建过程。该突变创建过程，从下一代的“n”个低级特征提取表达式列表中，创建总计达突变计数“nm”的低级特征提取表达式列表。

在步骤S201，控制部分27通过初始化突变循环参数NM为“1”，开始突变循环。突变循环被重复与突变计数“nm”一样多的次数。

在步骤S202，低级特征提取表达式列表创建部分61，在随机选择单个低级特征提取表达式列表A之前，加权最近一代的低级特征提取表达式列表，以便按高级特征提取表达式的各均值评估值的降序，导出各列表的优先部分，所述高级特征提取表达式由高级特征提取表达式学习部分65输出。在该过程的选择期间，由如上所述的选择创建过程选择的“ns”个低级特征提取表达式列表，可以从候选者列表中排除，或可以作为部分候选者列表而保持原样。同样，在上面的交叉创建过程的步骤S192中选择的低级特征提取表达式列表，可以从候选者列表中排除，或可以作为部分候选者列表而保持原样。

在步骤S203，低级特征提取表达式列表创建部分61通过后续的表达式循环，在要创建的每个低级特征提取表达式列表中，随机地确定数量“m”个的表达式。

更具体地讲，低级特征提取表达式列表创建部分61在如下定义的范围内，在步骤S203，随机地确定每个低级特征提取表达式列表的表达式计数“m”：

m＝列表A中的表达式数目±mr

其中，“mr”是预定值。

在步骤S204，控制部分27通过初始化表达式循环参数M为“1”，开始表达式循环。该表达式循环被重复与步骤S203中随机确定的表达式计数“m”一样多的次数。

在步骤S205，低级特征提取表达式列表创建部分61，检查以便确定：从低级特征提取表达式列表A中的所有低级特征提取表达式中，使用第M个低级特征提取表达式计算的低级特征的贡献比率，是否小于低级特征提取表达式列表A中，使用其它低级特征提取表达式计算的各低级特征的各贡献比率。更具体地讲，进行检查以确定：使用第M个低级特征提取表达式计算的低级特征的贡献比率，是否低于在低级特征提取表达式列表A中，使用所有低级特征提取表达式计算的各贡献比率序列中的预定比率。

如果在步骤S205，使用第M个低级特征提取表达式计算的低级特征的贡献比率，被发现低于其他，则到达步骤S206。在步骤S206，低级特征提取表达式列表创建部分61，随机地突变第M个低级特征提取表达式，其包含在下一代的低级特征提取表达式列表中。

如果在步骤S205中，使用第M个低级特征提取表达式计算的低级特征的贡献比率，未被发现低于其他，则到达步骤S207。在步骤S207，低级特征提取表达式列表创建部分61，将第M个低级特征提取表达式添加到下一代的低级特征提取表达式列表，而不突变存在置疑的表达式。

如果随机确定的表达式计数“m”被发现大于低级特征提取表达式的数量，所述低级特征提取表达式构成低级特征提取表达式列表A，则当表达式循环参数M超过列表A的低级特征提取表达式计数时，步骤S205的检查被忽略。在此点，低级特征提取表达式被随机地创建，并且被添加到下一代的低级特征提取表达式列表。

在步骤S208，控制部分27检查以便确定：表达式循环参数M是否小于最大值“m”。如果表达式循环参数M被发现小于最大值“m”，则表达式循环参数M被增加“1”，并且再次到达步骤S205。另一方面，如果表达式循环参数M未被发现小于最大值“m”(即，如果参数M等于最大值“m”)，则退出表达式循环，并且到达步骤S209。

因此在上述的步骤S203至S208中，创建单个的低级特征提取表达式列表。

在步骤S209，控制部分27检查以便确定：突变循环参数NM是否小于最大值“nm”。如果突变循环参数NM被发现小于最大值“nm”，则突变循环参数NM被增加“1”，并且再次到达步骤S202。另一方面，如果突变循环参数NM未被发现小于最大值“nm”(即如果参数NM等于最大值“nm”)，则退出突变循环，并且突变创建过程被终止。因此由直达该点的处理，创建总计达突变计数“nm”的低级特征提取表达式列表。

按照如上所述的、由低级特征提取表达式列表创建部分61执行的下一代列表遗传创建过程，具有高评估值的、最近一代的低级特征提取表达式列表被发送到下一代，而具有高贡献比率的、最近一代的低级特征提取表达式也一样。具有低评估值和贡献比率的那些被放弃，而不发送到下一代。即，随着各代进展，低级特征提取表达式列表的各评估值被期望改进，而各低级特征提取表达式列表的贡献比率也一样。

返回到图7，如上述讨论创建的下一代的低级特征提取表达式列表，由低级特征提取表达式列表创建部分61输出到低级特征计算部分24。在步骤S3，低级特征计算部分24通过将“j”个歌曲C1至Cj的输入数据(内容数据和元数据)，代入从低级特征提取表达式列表创建部分61输入的、“n”个低级特征提取表达式列表的每个，计算各低级特征。将产生的“n”个低级特征输出到高级特征提取表达式学习部分65。

在步骤S4，高级特征提取表达式学习部分65，基于从低级特征计算部分24输入的“n”个低级特征、以及对应的训练数据，通过学习估计(即，创建)“n”个高级特征提取表达式组合，每个高级特征提取表达式组合包括“k”个高级特征提取表达式。高级特征提取表达式学习部分65，进一步计算每个高级特征提取表达式中的每个低级特征的贡献比率、以及每个高级特征提取表达式的评估值，并且将计算结果输出到低级特征提取表达式列表创建部分61。

现在参照图45的流程图，在下文详细描述由高级特征提取表达式学习部分65执行的、步骤S4的高级特征提取表达式学习过程。

在步骤S211，控制部分27通过初始化列表循环参数N为“1”，开始列表循环。该列表循环被重复与预定的列表计数“n”一样多的次数。在步骤S212，控制部分27通过初始化训练数据循环参数K为“1”，开始训练数据循环。该训练数据循环被重复与预定的训练数据类型的计数“k”一样多的次数。

在步骤S213，控制部分27通过初始化算法循环参数A为“1”，开始算法循环。该算法循环被重复与预定的学习算法类型的计数“a”一样多的次数。在所述算法循环中使用的是和上面结合特征提取算法创建设备20讨论的相同类型的算法。

在步骤S214，控制部分27通过初始化交叉确认循环参数C为“1”，开始交叉确认循环。该交叉确认循环被重复与预定交叉确认计数“c”一样多的次数。

在步骤S215，高级特征提取表达式学习部分65，从多如“k”个的训练数据类型中，将大约“j”个歌曲的第K个类型的训练数据(真正的高级特征)，随机地二分为学习使用数据和评估使用数据。在下面的描述中，将为学习使用分类的训练数据称作为学习数据，而将为评估使用分类的训练数据称作为评估数据。

在步骤S216，高级特征提取表达式学习部分65通过学习估计高级特征提取表达式，该学习涉及将第a个学习算法应用到相对应的学习数据、以及使用第N个低级特征提取表达式列表计算的多个低级特征的组合。

上面的学习过程，与由高级特征提取表达式学习部分25实现的不同，使用了利用第N个低级特征提取表达式列表计算的所有低级特征(该计算的结果被称作为低级特征组合)。这将高级特征提取表达式的评估值转化为一值，其适当考虑原始的低级特征的数目是否足够大。

下面参照图46描述的是，基于由高级特征提取表达式学习部分65执行的、步骤S216中的学习算法的学习过程。

在步骤S231，高级特征提取表达式学习部分65，从训练数据中通过学习估计高级特征提取表达式，该学习涉及将第A个学习算法应用到学习数据和低级特征的组合。

在步骤S232，高级特征提取表达式学习部分65计算信息数量标准AIC或BIC，作为从前面的步骤获得的高级特征的评估值。这使得基于学习算法的学习过程结束。

回到图45的步骤S217，高级特征提取表达式学习部分65使用所述评估数据，评估步骤S216中获取的高级特征提取表达式。更具体地讲，高级特征提取表达式学习部分65，使用获取的高级特征提取表达式计算高级特征，并且找出计算的高级特征和评估数据之间的平方误差。

在步骤S218，控制部分27检查以便确定：交叉确认循环参数C是否小于最大值“c”。如果交叉确认循环参数C被发现小于最大值“c”，则参数C被增加“1”，并且再次到达步骤S215。另一方面，如果交叉确认循环参数C未被发现小于最大值“c”(即如果参数C等于最大值“c”)，则退出交叉确认循环，并且到达步骤S219。多如“c”个的高级特征提取表达式被因此获取，作为构成交叉确认循环的步骤S214至S218中的学习的结果。因为学习数据和评估数据通过交叉确认循环被随机地变换，所以可能验证该高级特征提取表达式没有被过度学习。

在步骤S219，高级特征提取表达式学习部分65从通过交叉确认循环获取的“c”个高级特征提取表达式中，选择具有从步骤S217获得的最高评估值的高级特征提取表达式。

在步骤S220，控制部分27检查以便确定：算法循环参数A是否小于最大值“a”。如果算法循环参数A被发现小于最大值“a”，则参数A被增加“1”，并且再次到达步骤S214。另一方面，如果算法循环参数A未被发现小于最大值“a”(即如果参数A等于最大值“a”)，则退出所述算法循环，并且到达步骤S221。因此在构成所述算法循环的步骤S213至S220中，获取使用“a”个学习算法学习的、第K个类型的多如“a”个的高级特征提取表达式。

在步骤S221，高级特征提取表达式学习部分65从通过所述算法循环学习的“a”个高级特征提取表达式中，选择具有从步骤S217获得的最高评估值的高级特征提取表达式。

在步骤S222，控制部分27检查以便确定：训练数据循环参数K是否小于最大值“k”。如果训练数据循环参数K被发现小于最大值“k”，则参数K被增加“1”，并且再次到达步骤S213。另一方面，如果训练数据循环参数K未被发现小于最大值“k”(即如果参数K等于最大值“k”)，则退出所述训练数据循环，并且到达步骤S223。因此在构成所述训练数据循环的步骤S212至S222中，获取与第N个低级特征提取表达式列表相对应的、多如“k”个的高级特征提取表达式。

在步骤S223，控制部分27检查以便确定：列表循环参数N是否小于最大值“n”。如果列表循环参数N被发现小于最大值“n”，则参数N被增加“1”，并且再次到达步骤S212。另一方面，如果列表循环参数N未被发现小于最大值“n”(即如果参数N等于最大值“n”)，则退出所述列表循环，并且到达步骤S224。因此在构成所述列表循环的步骤S221至S223中，获取与第n个低级特征提取表达式列表的每个相对应的、多如“k”个的高级特征提取表达式。

在步骤S224，高级特征提取表达式学习部分65，计算与获取的“n”个低级特征提取表达式列表的每个相对应的、“k”个高级特征提取表达式的每个的贡献比率，并且将计算结果与在步骤S217中计算的高级特征提取表达式的评估值一起，输出到低级特征提取表达式列表创建部分61。这使得高级特征提取表达式学习过程结束。

回到图7的步骤S5，控制部分27检查以便确定：学习循环参数G是否小于最大值“g”。如果学习循环参数G被发现小于最大值“g”，则参数G被增加“1”，并且再次到达步骤S2。另一方面，如果学习循环参数G未被发现小于最大值“g”(即如果参数G等于最大值“g”)，则退出所述学习循环，并且到达步骤S6。步骤S1至S5构成特征提取算法学习过程。继该过程之后的步骤S6，是用于使用特征提取算法计算各高级特征的过程。

在步骤S6，高级特征提取表达式学习部分65，从通过学习获得的最近一代的“n”个低级特征提取表达式列表中，将构成列表的低级特征提取表达式，与对应于该列表的“k”个高级特征提取表达式一起，提供给高级特征计算部分26，所述列表具有获取的各高级特征的均值评估值。

在步骤S7，高级特征计算部分26利用最近从高级特征提取表达式学习部分65提供的高级特征提取表达式、和低级特征提取表达式，计算具有高精度的高级特征。已经结合特征提取算法创建设备20讨论了步骤S7的高精度高级特征计算过程，并因此在下面将不进一步描述。

前面的段落完成了由特征提取算法创建设备60执行的特征提取算法创建过程的描述。

按照如本发明的第二实施例的、由特征提取算法创建设备60执行的如上所述的特征提取算法学习过程，可能精确和快速地创建用于从歌曲数据提取相关特征的算法。该过程还允许用显著小量的计算获取高度精确的高级特征。

特别值得注意的是，随机确定构成每个低级特征提取表达式列表的数量“m”个表达式的能力。这与由特征提取算法创建设备20执行的特征提取算法学习过程不同，其有助于避免通过繁重和潜在不精确的处理，处理太多的低级特征，从而有助于产生具有高精度的结果。

本发明不仅可以被应用来从歌曲数据获取各高级特征，而且从包括视频数据的多样化目录中的内容数据获得各高级特征。

如上所述的一系列的步骤和过程可以由硬件或软件执行。对于要进行的基于软件的处理，构成软件的程序可以提前被并入用于程序执行的计算机专用硬件，或在使用时从适合的记录介质安装到如图47所示的通用个人计算机、或类似的能够基于安装的程序执行多样化功能的装备。

如图47所示的个人计算机100并入CPU(中央处理单元)101。输入/输出接口105通过总线104被连接到CPU 101。该总线104被连接到ROM(只读存储器)102和RAM(随机存取存储器)103。

输入/输出接口105被连接到输入设备106、输出设备107、存储设备108和通信设备109。输入设备106包括：如由用户操作的键盘和鼠标的输入设备元件，以便输入操作命令。该输出设备107包括：如在其上显示操作屏幕和其他信息的CRT(阴极射线管)或LCD(液晶显示器)的显示设备。该存储设备108典型地由容纳程序和数据的硬盘驱动器构成。该通信设备109由在如因特网的网络上进行通信的modem和/或LAN(局域网)适配器形成。该输入/输出接口105被进一步连接到驱动器110，其写入数据到记录介质111并从记录介质111读取数据，所述记录介质111是如磁盘(包括软盘)、光盘(包括CD-ROM(致密盘只读存储器))和DVD(数字多功能盘))、磁光盘(包括MD(迷你盘))或半导体存储器。

用于使得个人计算机100执行如上所述步骤和过程的程序，在被提交到计算机100之前被存储在记录介质111。该程序由驱动器110从记录介质100读取，并且被安装到在存储设备108中的硬盘设备上。在存储设备108中保持的程序被从此处加载到RAM 103，以便响应于由用户通过输入设备106输入的命令，基于由CPU 101发出的指令执行。

在本说明书中，基于存储的程序执行的各步骤，不仅表示要按描述的序列执行的过程(即，基于时间的序列)，而且表示可以并行地或单个地或者不按时间地执行的过程。

该程序可以由单个计算机或基于分布式的多个计算机处理。所述程序还可以被传输到遥远位置的计算机或多个计算机用于执行。

在本说明书中，术语“系统”指由多个组件装置构成的整体配置。

本领域技术人员应该理解，各种修改、组合和子组合以及变更可依赖于设计要求和其它因素发生，只要它们在权利要求书或其等效物的范围内。

Claims

1.一种信息处理设备，其创建特征检测算法，用于从内容数据检测各特征，所述信息处理设备包括：

低级特征提取表达式列表创建装置，用于基于最近一代的各表达式列表，通过学习创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据或与所述内容数据相对应的元数据，并从该表达式输出各低级特征；

计算装置，用于利用由所述低级特征提取表达式列表创建装置创建的所述下一代的各表达式列表，计算所述各低级特征；以及

高级特征提取表达式创建装置，用于基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入由所述计算装置计算的所述各低级特征，并从该表达式输出所述内容数据的各高级特征特性。

2.如权利要求1所述的信息处理设备，其中所述高级特征提取表达式创建装置，至少计算在所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或创建的各高级特征提取表达式的各精度级别；以及

其中所述低级特征提取表达式列表创建装置，至少基于所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或所述各高级特征提取表达式的各精度级别，更新所述各低级特征提取表达式，其构成所述各低级特征提取表达式列表，所述各精度级别和所述各贡献比率，已经通过所述高级特征提取表达式创建装置计算。

3.如权利要求1所述的信息处理设备，其中所述低级特征提取表达式列表创建装置，随机地创建各第一代表达式列表。

4.如权利要求1所述的信息处理设备，其中所述低级特征提取表达式列表创建装置，通过选择过程、交叉过程和突变过程中的至少一个，基于所述最近一代的各表达式列表，利用遗传算法创建所述下一代表达式列表。

5.如权利要求1所述的信息处理设备，其中所述低级特征提取表达式列表创建装置，创建所述下一代表达式列表，其每个由预定常数个低级特征提取表达式构成。

6.如权利要求1所述的信息处理设备，其中所述低级特征提取表达式列表创建装置，创建所述下一代表达式列表，其每个由预定常数个低级特征提取表达式构成，所述低级特征提取表达式在每次创建每个所述列表时随机确定。

7.如权利要求6所述的信息处理设备，其中所述高级特征提取表达式列表创建装置，至少计算所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或创建的各高级特征提取表达式的各评估值；以及

其中所述低级特征提取表达式列表创建装置，至少基于所述各高级特征提取表达式中的所述各低级特征的各贡献比率、或所述各高级特征提取表达式的各评估值，更新所述各低级特征提取表达式，其构成所述各低级特征提取表达式列表，所述各评估值和所述各贡献比率已经通过所述高级特征提取表达式创建装置计算。

8.一种信息处理方法，其随信息处理设备使用，该信息处理设备创建特征检测算法，该算法用于从内容数据检测各特征，所述信息处理方法包括以下步骤：

基于最近一代的各表达式列表，通过学习创建下一代表达式列表，其每个由多个低级特征提取表达式构成，所述各低级特征提取表达式是这样的表达式：向该表达式输入所述内容数据或与所述内容数据相对应的元数据，并从该表达式输出各低级特征；

利用创建的下一代的各表达式列表，计算所述各低级特征；以及

基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的、与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入计算的各低级特征，并从该表达式输出所述内容数据的各高级特征特性。

9.一种用于控制信息处理设备的程序，该信息处理设备创建特征检测算法，该算法用于从内容数据检测各特征，所述程序使得所述信息处理设备的计算机执行包括如下步骤的过程：

基于训练数据，通过学习创建各高级特征提取表达式，所述训练数据由先前提供的与所述内容数据相对应的真实的各高级特征构成，所述各高级特征提取表达式是这样的表达式：向该表达式输入计算的各低级特征，并从该表达式输出所述内容数据的高级特征特性。