CN101369320A - 信息处理装置和方法、记录介质及计算机程序 - Google Patents
信息处理装置和方法、记录介质及计算机程序 Download PDFInfo
- Publication number
- CN101369320A CN101369320A CNA2008101346548A CN200810134654A CN101369320A CN 101369320 A CN101369320 A CN 101369320A CN A2008101346548 A CNA2008101346548 A CN A2008101346548A CN 200810134654 A CN200810134654 A CN 200810134654A CN 101369320 A CN101369320 A CN 101369320A
- Authority
- CN
- China
- Prior art keywords
- equation
- tabulation
- data
- target problem
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Physiology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Stored Programmes (AREA)
Abstract
本发明涉及信息处理装置和方法、记录介质及计算机程序。信息处理装置包括:目标问题获取单元,用于获取目标问题;生成单元,用于生成用以解决目标问题的针对目标问题的多个解决方案候选;以及贡献率计算单元,用于如果使用针对目标问题获取单元所获取的目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率。生成单元根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用贡献率计算单元所确定的、针对目标问题的每个解决方案候选的贡献率而算出的。
Description
相关申请的交叉引用
本发明包含于2007年8月14日向日本专利局提交的日本专利申请JP 2007-211477有关的主题内容,该日本专利申请的全部内容通过引用结合于此。
技术领域
本发明涉及信息处理装置、信息处理方法、记录介质和计算机程序并且具体地涉及用于在确定适合于解决目标问题的基因集作为解决方案时使用的信息处理装置、信息处理方法、记录介质和计算机程序。
背景技术
遗传搜索算法用作用于确定针对给定问题的近似解决方案的算法之一。
根据相关技术中的遗传搜索算法,数据(解决方案候选)表示为基因、准备多个基因,然后计算每个基因的评价值。具有较高评价值的基因以较高优先级被选择为下一代并且用作为用于交叉或者变异操作的种子。随着更新换代而搜索解决方案。
下文参照图1描述相关技术中的遗传搜索方法。
准备各包含预定数目m个基因即解决方案候选的两个集合。这两个集合是指“当前一代”和“下一代”。随机生成作为当前一代的第一代m个基因。通过评价函数来计算当前一代每个基因的评价值。
在为当前一代m个基因分别给定评价值之后,基于评价值来执行交叉、变异和复制操作。也随机生成新基因。然后将结果存储为下一代m个基因。以预定比率执行交叉、变异和复制操作以及新一基因的随机生成。
根据通过配对来产生后代的活体生物对交叉操作进行建模。在交叉操作中,选择当前一代两个基因,并且通过交换当前一代的部分基因来生成下一代基因。多种方法可用于通过选择交叉点(即一个交叉点、两个交叉点或者多个交叉点)来执行交叉操作。根据在活体生物中观察的基因变异对变异操作进行建模。从当前一代选择一个基因并且改变部分所选基因。在复制操作中,从当前一代选择一个基因并且直接将所选基因存储为下一代基因。
当执行交叉、变异和复制操作中的任何操作时,执行当前一代的基因选择过程。基于当前一代基因的评价值使用以下算法来执行基因选择,该算法允许以较高优先级选择具有较高评价值的基因。已经提出用于基因选择的多种算法,包括等级选择、竞赛选择、精英选择等。
描述图1的例子。具有评价值0.8的基因号2和具有评价值0.6的基因号5因具有较高评价值而以较高优先级被选择和复制到下一代。具有评价值0.8的基因号2因具有较高评价值而以较高优先级被选择和变异,并且存储通过变异而生成的基因供下一代用。从当前一代基因之中选择并且交叉具有评价值0.8的基因号2和具有评价值0.6的基因号5,并且存储通过交叉操作而生成的基因供下一代用。以预定比率随机生成基因并且存储这些基因供下一代用。
对于供下一代用的预备基因,这些基因的基因组被视为当前一代基因并且计算当前一代基因的评价值。基于评价值来执行交叉、变异和复制操作;然后随机生成新基因。然后将结果存储为下一代m个基因。如果基因达到再也不能超过的最高评价值,或者如果已经经历预定数目的多代,则将当前一代具有最高评价值的基因输出作为“解决方案”。
例如,如在国际公开第WO2007/049641号中公开的,生成搜索方法用来生成以下算法,该算法从内容数据如音乐数据高速度高准确度级地选择特征量。
参照图2A和图2B描述在国际公开第WO2007/049641号中使用的遗传搜索方法。
参照图1描述的相关技术的遗传搜索方法输出一个基因作为适合于解决目标问题的解决方案。对照而言,在国际公开第WO2007/049641号中公开的遗传搜索方法输出适合于解决目标问题的基因集。
在国际公开第WO2007/049641号中公开的遗传搜索方法旨在于确定允许准确地确定针对目标问题的近似解决方案的“多个基因组成的基因组”而不是允许准确地确定针对目标问题的解决方案的“单个基因”。为了生成解决目标问题的基因组而使用分别列举多个基因的多个基因列表。令m代表基因列表数目而n代表单个基因列表中列举的基因数目。
在每基因列表的基础上而不是在每基因的基础上计算评价值。基于在每基因列表的基础上提供的评价值从当前一代基因列表选择基因列表。执行复制、交叉和变异操作以及新基因列表的随机生成以生成新一代m个基因列表。
发明内容
如果用相互配合工作的多个基因来解决目标问题,则相关技术中旨在于搜寻一个优良基因的基因搜索方法并不适用。
在国际公开第WO2007/049641号中公开的技术中,使用多个基因而不是使用单个基因来解决目标问题。在这样的情况下,存储多个基因列表,基于向每个基因列表提供的评价值来选择基因列表,并且生成下一代基因。输出用于解决目标问题的基因集(即基因列表)作为解决方案。以这一方式,这样生成的算法基于大量因数高速度高准确度级地提取特征量。
根据在国际公开第WO2007/049641号中公开的技术,基因数目为n×m,而计算量在基因数目为m的情况下增加n倍。优化该公开算法要求极高吞吐量和长久处理时间。
因此希望用少量计算来确定适合于解决目标问题的基因集。
根据本发明的一个实施例,一种信息处理装置包括:目标问题获取装置,用于获取目标问题;生成装置,用于生成用以解决目标问题的针对目标问题的多个解决方案候选;以及贡献率计算装置,用于如果使用针对目标问题获取装置所获取的目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率。生成装置根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用贡献率计算装置所计算的、针对目标问题的每个解决方案候选的贡献率而算出的。
目标问题获取装置可以包括:第一获取装置,用于获取学习数据;以及第二获取装置,用于获取与学习数据对应的针对目标问题的解决方案作为监控数据,其中目标问题获取装置将目标问题设置为发现用于根据学习数据来确定与学习数据对应的解决方案的装置。
生成装置可以包括:列表生成装置,用于生成包含多个数据计算方程的列表。贡献率计算装置可以包括:计算装置,用于使用列表生成装置所生成的列表中包含的多个数据计算方程对第一获取装置所获取的学习数据执行计算操作;以及贡献率获取装置,用于使用计算装置的计算结果来学习特征量计算方程、以及用于确定作为学习结果而获得的特征量计算方程中每个数据计算方程的贡献率,该特征量计算方程用来估计第二获取装置所获取的监控数据并且是列表生成装置所生成的列表中包含的多个数据计算方程的输出值的线性组合。列表生成装置随机生成第一代列表中包含的数据计算方程并且根据遗传算法来生成包括第二代的多个后代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用根据贡献率获取装置所确定的每个数据计算方程的贡献率而算出的评价值。
信息处理装置还可以包括:输出装置,用于输出贡献率获取装置所学习的特征量计算方程和列表生成装置所生成的最后一代列表。
如果贡献率获取装置所学习的特征量计算方程的计算结果就第二获取装置所获取的监控数据而言达到预定准确度,则输出装置可以输出贡献率获取装置所学习的特征量计算方程和列表生成装置所生成的最后一代列表。
贡献率获取装置可以在基因指示了在特征量计算方程中数据计算方程的线性组合系数是否为零的情况下基于线性组合系数使用特征量计算方程来估计监控数据、并且根据遗传算法来学习特征量计算方程,其中遗传算法使用以评价函数来评价估计结果的评价值。
信息处理装置还可以包括:第三获取装置,用于获取检测数据;以及特征量运算装置,用于通过使用贡献率获取装置所学习的特征量计算方程和列表生成装置所生成的最后一代列表来处理第三获取装置所获取的检测数据从而计算检测数据的特征量。
根据本发明的一个实施例,一种用于确定针对目标问题的解决方案的信息处理装置的信息处理方法包括以下步骤:获取目标问题;生成用以解决目标问题的针对目标问题的多个解决方案候选;以及如果使用针对目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率。生成步骤可以包括根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用所计算的针对目标问题的每个解决方案候选的贡献率而算出的。
根据本发明的一个实施例,一种用于使计算机确定针对目标问题的解决方案的程序包括以下步骤:获取目标问题;生成用以解决目标问题的针对目标问题的多个解决方案候选;以及如果使用针对目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率。生成步骤可以包括根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用所计算的针对目标问题的每个解决方案候选的贡献率而算出的。
根据本发明的实施例,获取目标问题,生成针对目标问题的多个解决方案候选以解决目标问题。如果使用针对目标问题的所有多个解决方案候选来解决目标问题则确定针对目标问题的解决方案候选的贡献率。根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用针对目标问题的每个解决方案候选的贡献率而算出的。
根据本发明的一个实施例,一种信息处理装置包括:第一获取装置,用于获取检测数据;第二获取装置,用于获取特征量提取算法;以及特征量计算装置,用于通过根据第二获取装置所获取的特征量提取算法处理第一获取装置所获取的检测数据来计算检测数据的特征量。第二获取装置所获取的特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和最后一代列表:通过随机生成在包含多个数据计算方程的第一代列表中包含的数据计算方程来生成第一代列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者后一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
根据本发明的一个实施例,一种基于用于确定针对目标问题的解决方案的算法来计算检测数据的特征量的信息处理装置的信息处理方法包括步骤:获取检测数据;获取特征量提取算法;以及通过根据特征量提取算法处理检测数据来计算检测数据的特征量。特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和最后一代列表:通过随机生成在包含多个数据计算方程的第一代列表中包含的数据计算方程来生成第一代列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者后一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
根据本发明的一个实施例,一种用于使计算机基于用于确定针对目标问题的解决方案的算法来计算检测数据的特征量的计算机程序,包括以下步骤:获取检测数据;获取特征量提取算法;以及通过根据特征量提取算法处理检测数据来计算检测数据的特征量。特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和最后一代列表:通过随机生成在包含多个数据计算方程的第一代列表中包含的数据计算方程来生成列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者后一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
根据本发明的实施例,获取检测数据,获取特征量提取算法,并且通过根据特征量提取算法处理检测数据来计算检测数据的特征量。特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和最后一代列表:通过随机生成在包含多个数据计算方程的第一代列表中包含的数据计算方程来生成第一代列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者后一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
在本说明书的上下文中的术语“网络”是指以下机构,在该机构中至少两个装置被链接以使得在一个装置与另一装置之间交换信息。经由网络相互通信的装置可以相互独立或者可以是包含于一个装置中的内部块。
在这一说明书的上下文中的术语“通信”是指无线通信、有线通信或者二者的组合,无线通信和有线通信的组合是指在一个通信覆盖区中执行的无线通信与在另一通信覆盖区中执行的有线通信相组合。另外,从第一装置到第二装置执行有线通信而从第二装置到第三装置执行无线通信。
信息处理装置可以是单独的装置以及可以是具有另一功能的另一装置的部分。
根据本发明的实施例,无需增加处理步骤的数目即可确定用于确定针对目标问题的解决方案的算法。
根据本发明的实施例,通过多个计算方程而不是通过单个优良计算方程来确定特征量。
附图说明
图1图示了相关技术中的遗传搜索操作;
图2A和图2B图示了相关技术中公开的遗传说说操作;
图3图示了根据本发明一个实施例的信息处理装置;
图4A和图4B图示了监控数据和特征提取算法;
图5图示了用作为评价值的每个基因的贡献率;
图6图示了其中使用各基因的贡献率作为评价值的遗传搜索;
图7是具体图示了图3的算法生成器的框图;
图8图示了输入数据的例子;
图9图示了图8的输入数据的特征提取方程;
图10图示了选择过程;
图11图示了其中使用每个基因的贡献率作为评价值的遗传搜索;
图12是具体图示了图3的特征量计算器的框图;
图13图示了输入数据;
图14图示了输入数据;
图15图示了输入数据;
图16是图示了算法生成过程的流程图;
图17是图示了特征提取方程列表生成过程的流程图;
图18是图示了随机列表生成过程的流程图;
图19是图示了下一代列表生成过程的流程图;
图20是图示了选择过程的流程图;
图21是图示了交叉过程的流程图;
图22是图示了变异过程的流程图;
图23是图示了随机生成过程的流程图;
图24是图示了特征量计算过程的流程图;
图25是图示了机器学习过程的流程图;
图26是图示了学习过程的流程图;
图27是图示了贡献率计算过程的流程图;
图28是图示了特征量计算过程的流程图;以及
图29是图示了个人计算机的框图。
具体实施方式
在描述本发明的实施例之前,下文讨论在本发明的特征与本发明说明书或者附图中公开的实施例之间的对应。这一声明旨在于保证在本说明书或者附图中描述了支持要求保护的本发明的实施例。因此,即使实施例在说明书或者附图中有描述但是在这里没有描述为与本发明的特征有关,这并不必然意味着该实施例与本发明的该特征无关。反言之,即使实施例在这里描述为与本发明的某个特征有关,这并不必然意味着该实施例与本发明的其它特征无关。
根据本发明的一个实施例,一种信息处理装置包括:目标问题获取装置(例如图7的学习量数据获取单元31和监控数据获取单元33),用于获取目标问题;生成装置(例如图7的特征提取方程列表生成器35),用于生成用以解决目标问题的针对目标问题的多个解决方案;以及贡献率计算装置(例如图7的机器学习单元34),用于如果使用目标问题获取装置所获取的针对目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率。生成装置根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用贡献率计算装置所计算的、针对目标问题的每个解决方案候选的贡献率而算出的。
目标问题获取转置可以包括:第一获取装置(例如图7的学习量数据获取单元31),用于获取学习数据(例如从分析按照音调和时间的音频数据或者用矩阵表示的数据而获得的数据);以及第二获取装置(例如图7的监控数据获取单元33),用于获取与学习数据对应的针对目标问题的解决方案作为监控数据,其中目标问题获取装置将目标问题设置成用于发现用于根据学习数据来确定与学习数据对应的解决方案的装置。
生成装置可以包括用于生成包含多个数据计算方程的列表的列表生成装置(例如图7的特征提取方程列表生成器35)。贡献率计算装置可以包括:计算装置(例如图7的特征量计算器32),用于使用列表生成装置所生成的列表中包含的多个数据计算方程对第一获取装置所获取的学习数据执行计算操作;以及贡献率获取装置,用于使用计算装置的计算结果来学习特征量计算方程、以及用于确定作为学习结果而获得的特征量计算方程中每个数据计算方程的贡献率,该特征量计算方程用来估计第二获取装置所获取的监控数据并且是列表生成装置所生成的列表中包含的多个数据计算方程的输出值的线性组合。列表生成装置随机生成第一代列表中包含的数据计算方程并且根据遗传算法来生成第二代或者后一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用根据贡献率获取装置所确定的每个数据计算方程的贡献率而算出的评价值。
信息处理装置还可以包括:输出装置(例如图7的特征量提取算法输出单元36),用于输出贡献率获取装置所学习的特征量计算方程和列表生成装置所生成的最后一代列表。
信息处理装置还可以包括:第三获取装置(例如图12的检测内容数据获取单元52),用于获取检测数据;以及特征量运算装置(例如图12的特征量运算单元53),用于通过使用贡献率获取装置所学习的特征量计算方程和列表生成装置所生成的最后一代列表来处理第三获取装置所获取的检测数据从而计算检测数据的特征量。
根据本发明的一个实施例,用于确定针对目标问题的解决方案的信息处理装置的信息处理方法和程序每一个都包括以下步骤:获取目标问题(例如在图16的步骤S1中);生成用以解决目标问题的针对目标问题的多个解决方案候选(例如在将要参照图18讨论的处理中);以及如果使用针对目标问题的所有多个解决方案候选来解决目标问题则计算针对目标问题的每个解决方案候选的贡献率(例如在将要参照图27讨论的处理中)。生成(步骤)包括根据使用评价值的遗传算法来生成针对目标问题的下一代解决方案候选,该评价值是至少使用所计算的针对目标问题的每个解决方案候选的贡献率来计算的。
根据本发明的一个实施例,一种信息处理装置包括:第一获取装置(例如图12的检测内容数据获取单元52),用于获取检测数据;第二获取装置(例如图12的特征量提取算法获取单元51),用于获取特征量提取算法;以及特征量计算装置(例如图12的特征量运算单元53),用于通过根据第二获取装置所获取的特征量提取算法处理第一获取装置所获取的检测数据来计算检测数据的特征量,其中第二获取装置所获取的特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和最后一代列表:通过随机生成包含多个数据计算方程(例如特征提取方程)的第一代列表(例如特征提取方程列表)中包含的数据计算方程来生成列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者下一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
根据本发明的一个实施例,基于用于确定针对目标问题的解决方案的算法来计算检测数据的特征量的信息处理装置的信息处理方法和程序每一个都包括以下步骤:获取检测数据(例如在图28的步骤S333中);获取特征量提取算法(例如在图28的步骤S332中);以及通过根据特征量提取算法处理检测数据来计算检测数据的特征量(例如在图28的步骤S334中),其中特征量提取算法包括特征量计算方程和最后一代列表。通过以下操作来获得特征量计算方程和列表最后一代列表:通过随机生成包含多个数据计算方程(例如特征提取方程)的第一代列表(例如特征提取方程列表)中包含的数据计算方程来生成第一代列表;使用形成所生成的列表的多个数据计算方程来处理预定学习数据;使用预定学习数据的处理结果来学习作为形成列表的多个数据计算方程的线性组合的特征量计算方程,该特征量计算方程用来估计预定监控数据;确定在通过学习获得的特征量计算方程中每个数据计算方程的贡献率;以及根据遗传算法来生成第二代或者下一代列表,该遗传算法在以当前一代列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的贡献率而算出的评价值。
下文参照附图描述本发明的实施例。
图3是图示了根据本发明一个实施例的信息处理装置1的结构的框图。
信息处理装置1包括特征量计算器12和算法生成器11。在收到检测数据时,特征量计算器12计算检测数据的特征量。算法生成器11生成由特征量计算器12使用的特征量提取算法。
算法生成器11获取待学习的多条内容数据、和作为监控数据的与(作为针对就内容数据而言的目标问题的解决方案的)特征量有关的信息。基于这些多条信息,算法生成器11使用遗传搜索方法(遗传算法)来生成将由特征量计算器12使用的特征量提取算法。
例如,需要用于确定歌曲节奏和愉悦度的特征量提取算法。如图4中所示,提供歌曲1至歌曲4作为学习内容数据,而向每首歌曲供应作为目标问题的节奏和愉悦度以作为监控数据。作为用于信号处理歌曲1-4的信号处理方程的多个特征提取方程是当前一代基因。
算法生成器11使用所有特征提取方程对学习内容数据执行运算操作。运算操作是基于特征提取方程的处理。特征提取方程是用于获得与内容数据有关的特征量的计算方程。然后获得的特征量可以不同于作为针对目标问题的解决方案的特征量。换而言之,特征提取方程不能估计针对内容数据的目标问题的解决方案。
使用运算操作结果来执行机器学习操作。机器学习操作可以针对每个给定类型的监控(比如这里为愉悦度和节奏)计算贡献率。机器学习操作为每类监控(比如这里为愉悦度和节奏)确定特征量计算方程。特征提取计算方程可以估计针对内容数据的目标问题的解决方案。特征量计算方程确定用以解决目标问题的每个特征提取方程的贡献率。
如图5中所示,使用当前一代所有基因来解决目标问题。针对所解决的目标问题来确定每个基因的贡献率。贡献率用作每个基因的评价值。基于评价值来执行基因搜索。
更具体地如图6中所示,算法生成器11根据多个特征提取方程对输入的学习内容数据执行运算操作,由此在每个特征提取方程的基础上计算特征量。使用每个特征提取方程的特征量来确定用于通过机器学习操作来解决目标问题的特征量计算方程。然后计算特征量计算方程中每个特征提取方程的贡献率。每个特征提取方程的贡献率用作相应特征提取方程的评价值。以与参照图1相关技术的遗传搜索过程所讨论相同的方式,执行复制、交叉和变异操作并且执行新特征提取方程的随机生成。由此生成下一代多个特征提取方程。然后在以当前一代多个特征提取方程一样用作下一代多个特征提取方程的情况下重复机器学习操作。
具体而言,算法生成器11基于所有m个特征提取方程和监控数据的计算结果对特征量计算方程执行机器学习操作以解决目标问题并且确定m个特征提取方程的对解决目标问题的贡献率。基于特征提取方程的贡献率,算法生成器11生成列举下一代m个特征提取方程的特征提取方程列表。换而言之,算法生成器11在以m个特征提取方程作为基因的情况下使用所有m个基因来解决目标问题、计算每个基因对解决目标问题起作用的贡献率并且使用贡献率作为基因算法的评价值。
算法生成器11向特征量计算器12供应所生成的特征量提取算法、即在遗传搜索过程之后最终保留的每个监控的特征量计算方程和多个特征提取方程。
特征量计算器12接收所输入的检测内容数据并且使用算法生成器11所生成的特征量提取算法来执行特征量计算过程,由此输出检测结果。
特征量计算器12具有确定音乐数据的节奏和愉悦度作为特征量的特征量提取算法。响应于未知音乐数据,特征量计算器12使用每个监控的特征量计算方程(即用于确定音乐数据的节奏的特征量计算方程和用于确定音乐数据的愉悦度的特征量计算方程)来确定未知输入音乐数据的节奏和愉悦度。
学习数据和检测数据可以是任一类数据,只要该数据具有多个轴,换而言之,即该数据用多个维度的矩阵来表达。
特征量计算器12由此接收具有与算法生成器11在生成特征量提取算法时已经使用的学习数据相同轴的输入检测数据,并且使用特征量提取算法来解决目标问题。
图7是具体图示了图3的算法生成器11的功能框图。
算法生成器11包括学习内容数据获取单元31、特征量计算器32、监控数据获取单元33、机器学习单元34、特征提取方程列表生成器35和特征量提取算法输出单元36。
学习内容数据获取单元31获取用以生成特征量提取算法的学习内容数据并且将学习内容数据供应给特征量计算器32。
特征量计算器32从特征提取方程列表生成器35获取列举了m个特征提取方程作为基因的特征提取方程列表,并且基于m个特征提取方程来计算从学习内容数据获取单元31供应的内容数据的特征量。
特征提取方程可以将多个维度表示的输入数据修改成单个值、即标量值。
图8图示了以12个声调为一个音阶的时间和音调按时间-音调(频率)来分析的WAV数据的波形。
如图8中所示,作为音调轴的纵坐标以一个音阶为刻度而横坐标代表时间。深色部分表示低能量区(处于低音量水平)。浅色部分表示较高能量区(处于较高音量水平)。
图9的特征提取方程应用于图8中所示的分析结果。
如图9中所示,特征提取方程包含指示了输入数据类型的信息和作为指示了对输入数据执行的信号处理的信息的运算符。运算符包含目标轴、处理内容以及将被按需处理的参数。如图9中所示,12TonesM指示了输入数据类型的信息,继而是四个运算符、即按处理顺序为F#Differential、F#MaxIndex、T#LPF_1;0.861和T#UVariance。目标轴置于每个运算符的头部。目标轴包括代表时间方向的T以及代表频率和音调方向的F。
在图9的特征量提取方程中包含的处理包括Differential所代表的差分运算、MaxIndex所代表的获取最大索引的获取操作、LPF所代表的低通滤波操作和UVariance所代表的无偏方差操作。按需向这些运算符赋予参数。例如,1;0.861是用于低通滤波器的参数。
响应于按时间-音调的波形WAV数据的分析结果的输入,特征提取方程代表通过以下操作获得的计算结果:在音调方向上求波形差分、计算指示了音调方向上最大值的索引(以获得表示最强音的音调号)、在时间轴方向上对波形低通滤波并且最终计算波形的无偏方差。特征提取方程由此输出计算结果。
监控数据获取单元33获取针对学习输入数据的目标问题的解决方案作为监控数据。例如,如果目标问题是音乐数据的节奏和愉悦度,则监控数据获取单元33获取与学习内容数据获取单元31所获取的多条学习输入数据的节奏和愉悦度有关的信息。监控数据可以是根据多个用户对问卷的答复而确定的监控数据。
机器学习单元34使用特征量计算器32所计算的每个特征提取方程的计算结果(即特征量计算器32根据每个特征提取方程而确定的特征量)来执行用以计算贡献率的机器学习操作。机器学习单元34由此为每一类给定监控数据(例如节奏和愉悦度)确定用于估计作为针对目标问题的解决方案的特征量的特征量计算方程,并且确定所获得的特征量计算方程中每个特征提取方程的贡献率。
为每一类给定监控数据(比如节奏和愉悦度)确定特征量计算方程。特征量计算方程用来通过如以下方程(1)中所示将特征提取方程的结果与预定系数相乘并且线性组合相乘结果来估计目标特征量的值:
节奏=特征提取方程1的输出值×0.5+特征提取方程2的输出值×0.7+...+特征提取方程5的输出值×0.1+特征提取方程15的输出值×-0.4......(1)
计算贡献率的机器学习操作可以是例如使用信息标准如Akaike信息标准(AIC)或者贝叶斯信息标准(BIC)作为评价函数的线性回归/判别分析。
通过选择/不选择特征量提取算法中的每个特征量提取方程作为基因(即是否使用该特征提取方程),机器学习单元34使用所选择的特征提取方程来估计目标元数据(例如作为指示了节奏和愉悦度的值的监控数据)并且使用遗传算法来学习特征量提取算法。遗传算法是基于所选择的特征提取方程的AIC或者BIC越小越好的设置。
具体而言,机器学习单元34随机生成确定是否使用每个特征提取方程的输出值的数个基因。机器学习单元34对所有基因执行线性回归/判别分析,由此根据评价函数(比如AIC或者BIC)来评价结果。通过选择待使用的特征量来减少自由参数的数目。可以搜索提供最小AIC或者BIC的点。基于评价值,机器学习单元34对每个基因执行选择、交叉和变异操作,由此改变所用特征量。机器学习单元34从一代继续到下一代直至不再获得更好的评价值。
根据通过学习获得的特征量计算方程,机器学习单元34通过将每个线性组合系数除以特征提取方程的输出值的标准偏差、通过将所得商与监控数据的标准数据相乘,然后通过将所得乘积与特征提取方程的输出值与监控数据之间的相关度相乘来确定每个特征提取方程的贡献率。
具体而言,令Y代表目标元数据(其值表示节奏和愉悦度),XM代表作为m个特征提取方程的计算结果的m个特征量(M为落在1≤M≤特征提取方程总数m这一范围内的整数)、BM代表线性组合系数而B0代表特征量计算方程的截距,并且通过以下方程(2)来代表通过学习获得的特征量计算方程:
Y=B1X1+B2X2+B3X3+...+BmXm+B0...(2)
作为学习结果而未选择的特征提取方程的线性组合系数的值变为零。
使用以下方程(3)来计算在估计方程(2)Y的情况下特征提取方程的贡献率(XM):
XM=BM/StDev(XM)×StDev(TM)×Correl(XM,TM)...(3)
其中StDev(XM)代表就提供用于学习的所有学习输入数据而言XM的标准偏差,StDev(TM)代表就提供用于学习的所有学习输入数据而言监控数据TM的值的标准偏差,而Correl(TM)代表就提供用于学习的所有学习输入数据而言XM和监控数据TM的值的皮尔森相关系数。
机器学习单元34向特征提取方程列表生成器35供应所有类型监控的贡献率之和(例如节奏和愉悦度的贡献率之和)作为遗传算法的评价值。
机器学习单元34可以通过与使用遗传算法对用作基因的每个特征提取方程的输出值的已用/未用状态进行确定的方法不同的方法来确定特征提取方程(2)。例如,机器学习单元34使用邻近搜索方法来确定每个特征提取方程的输出值的已用/未用状态。
使用邻近搜索方法,机器学习单元34在所有特征提取方程在未用状态的情况下开始学习。机器学习单元34然后评价其中一个特征提取方程转变已用/未用状态的M个特征提取方程组合的AIC(或者BIC)。机器学习单元34选择具有最高评价值的组合,即具有低AIC值的组合。基于所选组合,机器学习单元34在特征提取方程之一转变已用/未用状态的情况下对AIC的值重复评价过程直至所得评价值不再变得更好。根据最终获得的特征提取方程已用/未用状态组合的组合,机器学习单元34生成方程(2)的线性组合方程。在线性组合方程生成之后的处理保持与上述讨论相同。
根据匹配学习单元34所获得的特征提取方程的贡献率,特征提取方程列表生成器34根据作为贡献率的评价值对当前一代特征提取操作执行选择、交叉和变异操作。通过执行新特征提取方程的随机生成,特征提取方程列表生成器35生成由下一代m个特征提取方程组成的特征提取方程列表。特征提取方程列表生成器35随机生成由下一代m个特征提取方程组成的特征提取方程列表。随机提取方程列表生成器35也随机生成第一代特征提取方程列表中包含的m个特征提取方程以便生成由m个特征提取方程组成的第一代特征提取方程列表,然后将第一代特征提取方程列表供应给机器学习单元34。
如图10中所示,特征提取方程列表生成器35根据机器学习单元34所获得的特征提取方程的贡献率按照从具有高贡献率的特征提取方程到具有低贡献率的特征提取方程的顺序对特征提取方程加权,或者按照具有较高贡献率的特征提取方程被选择的机会更高的顺序对特征提取方程加权。特征提取方程列表生成器35根据特征提取方程的贡献率来选择和复制特征提取方程(基因)到下一代。
特征提取方程列表生成器35对特征提取方程加权,使得在选择两个特征提取方程之时具有高贡献率的特征提取方程被选择的机会更高。特征提取方程列表生成器35组合(交叉)两个特征提取方程,由此以预定比率(按预定数目)生成下一代特征提取方程。
例如,第一所选特征提取方程为"12TonesM,F#aaaa,F#bbbb,T#cccc,T#dddd"而第二所选特征提取方程为""12TonesM,Sqrt,F#gggg,F#hhhh,F#iiii,T#jjjj,T#kkkk"(这里aaaa,bbbb,...分别代表运算符)。特征提取方程列表生成器35以在组合之后通过计算特征提取方程由输入数据(这里为12TonesM)确定标量这一组合来组合两个方程的部分、即如果从前导特征提取方程开始对特征提取方程执行计算处理则不引起目标轴不一致的组合。具体而言,特征提取方程列表生成器35组合第一所选特征提取方程"12TonesM,F#aaaa,F#bbbb,T#cccc,T#dddd"的"F#aaaa,F#bbbb,T#cccc"和第二所选特征提取方程"12TonesM,Sqrt,F#gggg,F#hhhh,F#iiii,T#jjjj,T#kkkk"的"T#jjjj,T#kkkk",由此生成特征提取方程"12TonesM,F#aaaa,F#bbbb,T#cccc,"T#jjjj,T#kkkk"并且处理所生成的特征提取方程作为下一代特征提取方程。
特征提取方程列表生成器35在对特征提取方程加权使得具有高贡献率的特征提取方程被选机会更高的同时选择单个特征提取方程。特征提取方程列表生成器35因此修改所选特征提取方程的部分,由此以预定比率(按预定数目)生成下一代特征提取方程。
例如,如果所选特征提取方程为"12TonesM,F#mmmm,F#nnnn,T#oooo,T#pppp,T#qqqq",则特征提取方程列表生成器35以如下方式修改特征提取方程的部分使得在修改部分特征提取方程之后通过计算特征提取方程由输入数据(这里为12TonesM)确定标量,即使得如果从前导特征提取方程开始对特征提取方程执行计算处理则不引起目标轴不一致。具体而言,特征提取方程列表生成器35用不同运算符取代所选特征提取方程中的至少一个运算符以将特征提取方程修改为"12TonesM,F#xxxx,F#yyyy,T#oooo,T#pppp,T#qqqq",由此生成下一代特征提取方程。另外,特征提取方程列表生成器35从所选特征提取方程删除至少一个运算符以将所选特征提取方程修改为"12TonesM,F#mmmm,F#nnnn,T#oooo,T#qqqq",由此生成下一代特征提取方程。特征提取方程列表35也修改所选特征提取方程的运算符中包含的至少部分参数,由此生成下一代特征提取方程。如前文所讨论的,特征提取方程列表生成器35组合对运算符的修改和删除操作已经对参数的修改,由此生成下一代特征提取方程。
特征提取方程列表生成器35以预定比率(以预定数目)随机生成特征提取方程,由此添加所生成的特征提取方程作为下一代特征提取方程。注意特征提取方程列表生成器35生成所有的第一代特征提取方程。
具体而言,当如图11中所示生成第二代和下一代特征提取方程列表时,特征提取方程列表生成器35选择预定比率的或者具有高贡献率的预定数目(在这一情况下为三个)的特征提取方程并且将所选特征提取方程复制到下一代。特征提取方程列表生成器35选择预定比率或者具有高贡献率的预定数目(在这一情况下为八个)的特征提取方程并且使用交叉操作来生成下一代特征提取操作。特征提取方程列表生成器35选择预定比率或者具有高贡献率的预定数目(在这一情况下为六个)的特征提取方程并且使用变异操作来生成下一代特征提取操作。特征提取方程列表生成器35生成其余的特征提取方程使得生成共计m个特征提取方程。特征提取方程列表生成器35然后将生成的特征提取方程供应给机器学习单元34。
重复特征量计算器32、机器学习单元34和特征提取方程列表生成器35的处理直至已经进展预定数目的多代、直至机器学习单元34所获得的特征量计算方程的计算结果达到预定准确度水平或者直至用户输入学习结束操作。在生成时由机器学习单元34最终获得的特征量计算方程和m个特征提取方程作为特征量提取算法被供应给特征量提取算法输出单元36。
特征量提取算法输出单元36向特征量计算器12供应在生成时由机器学习单元34最终获得的特征量计算方程和m个特征提取方程。
图12是具体图示了图3的特征量计算器12的功能框图。
特征量计算器12包括特征量提取算法获取单元51、检测内容数据获取单元52、特征量运算单元53和结果输出单元54。
特征量提取算法获取单元51从特征量提取算法输出单元36接收用以估计针对目标问题的解决方案的、如上所述处理的特征量提取算法、即特征量计算方程和m个特征提取方程,然后将特征量提取算法供应给特征量运算单元53。
检测内容数据获取单元52获取用以根据特征量提取算法来检测特征量的检测内容数据(比如通过按时间轴和音调轴分析WAV音频波形而得到的数据),然后将检测内容数据供应给特征量运算单元53。
特征量运算单元53基于特征量提取算法获取单元51所获取的特征量提取算法和m个特征提取方程来计算检测内容数据并且计算针对目标问题(例如音乐数据的节奏和愉悦度)的解决方案。
结果输出单元54例如通过向外部设备输出解决方案、以文字数据显示解决方案或者根据解决方案输出作为音频数据的音频来向用户通知针对目标问题(例如音乐数据的节奏和愉悦度)的解决方案。
在参照图1描述的相关技术的遗传搜索方法中向每个基因赋予的评价值是指示了与目标问题的接近度的值(或者是评价值如AIC)。在参照图2先前讨论的相关技术的方法中使用多个特征量确定最好特征量的组合以便解决目标问题。在这一方法中,如果使用形成每个基因列表的多个特征提取方程来解决目标问题,则向每个基因列表赋予指示了与目标问题的接近度的值(或者评价值如AIC)。贡献率被赋予给基因列表中的每个特征量(方程)而在从当前一代基因列表中选择基因列表的过程中完全不被使用。在从当前一代基因列表选择基因列表的过程中使用向每个基因列表赋予的评价值。
对照而言,图3的算法生成器11使目标问题用所有基因来解决、计算指示了每个基因对针对目标问题的解决方案起多大作用的基因贡献率、并且以贡献率作为评价值来执行基因搜索。
未选基因在相关技术的基因搜索方法中完全不影响下一代。另外在国际公开第WO2007/049641号中公开的技术中,在每基因列表的基础上确定评价值并且基于评价值来生成下一代基因列表。在基因列表中列举的未选基因以与相关技术的技术中相同的方式一样完全不影响下一代。对照而言,如果使用所有当前基因来解决目标问题并且甚至未选基因也影响下一代,则图3的算法生成器11使用所应用的每个基因的贡献率。
可以用来通过上述过程确定特征量提取算法的信息类型可以是能够用矩阵表示的任何信息。具体而言,将向算法生成器11供应的输入学习数据的类型(即为了确定特征量而将向特征量计算器12输入的检测数据的类型)可以是能够用矩阵表示的任一类信息,比如音乐、图像或者其它二进制数据。
例如,可以作为如图13中所示幅度、时间和声道的矩阵来分析音频波形。
又如,可以作为如图14中所示帧的X轴和Y轴以及RGB(红、绿和蓝)的矩阵来分析图像。
另外,可以作为如图15中所示帧的X轴和Y轴、RGB以及时间的矩阵来分析移动图像。
如前文所讨论的,算法生成器11由此生成特征量提取算法,该算法允许用所用全部基因而不是所用单个优良基因来解决目标问题。
例如,目标问题可以用以确定一位艺人打算发行的新歌的估计拷贝销售份数。不仅包括歌曲的声音波形而且包括歌曲的歌词和该艺人的唱片分类目录在内的该歌曲的音乐因素影响了作为歌曲特征量的歌曲销量、即针对目标问题的解决方案。算法生成器11使用对特征量的提取有影响的各种因素来生成特征量提取算法。
例如,向算法生成器11供应多首歌曲的销量作为监控数据。也向算法生成器1供应歌曲波形、封面照片、歌词和有关信息作为学习内容数据。使用这些多条信息,算法生成器11以歌曲销售量作为目标问题来执行学习过程,由此生成和供应特征量提取算法给特征量计算器12。如果向特征量计算器12输入信息(比如艺人打算发行的歌曲的波形、歌曲的封面照片、歌曲的歌词和歌曲的有关信息),则特征量计算器12提供针对歌曲估计销量的解决方案(例如数万张的销量预测,或者指示了大销量、中等销量或者小销量的排行而不是实际销量也是可接受的)。响应于来自算法生成器11的特征量提取算法,特征计算器12提取以综合方式纳入每条数据的准确特征量。
在以上讨论中,信息处理装置1包括算法生成器11和特征量计算器12。可选地,算法生成器11和特征量计算器12可以布置为分开的装置。算法生成器11和特征量计算器12可以相互远离地布置,只要算法生成器11所生成的特征量提取算法可以供应给特征量生成器12。
下文参照图16的流程图描述算法生成器11的算法生成过程。
在步骤S1中,算法生成器11中的学习内容数据获取单元31接收学习数据,然后将接收的学习数据供应给特征量计算器32。监控数据获取单元33接收监控数据,然后将接收的监控数据供应给机器学习单元34。
在步骤S2中,执行将参照图17讨论的特征提取方程列表生成过程。
在步骤S3中,执行将参照图24讨论的特征量计算过程。
在步骤S4中,执行将参照图25讨论的机器学习过程。
在步骤S5中,机器学习单元34确定根据获得的特征量计算方程而算出的特征量就监控数据而言是否已经达到预定准确度水平或者确定用户是否已经执行结束操作。
如果在步骤S5中确定尚未达到预定准确度水平并且用户尚未执行结束操作,则处理返回到步骤S2以重复步骤S2和后续步骤。
如果在步骤S5中确定已经达到预定准确度水平或者用户已经执行结束操作,则机器学习单元34在步骤S6中将获得的这一代特征量计算方程和特征提取方程供应给特征量提取算法输出单元36。特征量提取算法输出单元36将这一代特征量计算方程和特征提取方程输出到特征量计算器12或者用于为特征量计算器12供应这些多条数据的传输介质和可移动记录介质之一。由此完成生成过程。
算法生成过程生成特征量提取算法,该算法使算法生成器11用多个特征提取算法来获得针对目标问题的解决方案。
下文参照图17的流程图描述在图16的步骤S2中执行的特征提取方程列表生成过程。
在步骤S21中,特征提取方程列表生成器35确定所要生成的特征提取方程列表是第二代还是后一代。
如果在步骤S21中确定特征提取方程列表既不是第二代也不是后一代、即特征提取方程列表是第一代,则特征提取方程列表生成器35执行在将要参照图18讨论的步骤S22中的列表随机生成过程。
如果在步骤S21中确定特征提取方程列表是第二代或者后一代,则特征提取方程列表生成器35在步骤S23中执行将要参照图19讨论的下一代列表生成过程。
在步骤S22或者步骤S23之后,特征提取方程列表生成器35在步骤S24中将在步骤S22和S23之一中生成的特征提取方程列表输出到特征量计算器32。处理返回到图16的步骤S2以继续步骤S3。
随机生成第一代列表中的所有特征提取方程,并且使用遗传搜索方法生成第二代和后一代的下一代列表。
下文参照图18的流程图描述将要在图17的步骤S22中执行的随机列表生成过程。
在步骤S41中,特征提取方程列表生成器35默认方程循环参数M为一,由此开始方程循环。方程循环重复m次,其中M为形成特征提取方程列表的特征提取方程的数目。
在步骤S42中,特征提取方程列表生成器35随机确定第M个特征提取方程(下文称为特征提取方程[M])的输入数据。
在步骤S43中,特征提取方程列表生成器35随机确定生成的特征提取方程[M]的目标轴和一个运算符。
例如,运算符类型包括均值、快速傅立叶变换(FFT)、标准偏差(StDev)、发生率、低通滤波(LPF)、高通滤波(HPF)、绝对值(ABS)、积分运算、最大值(MaxIndex)和无偏方差(UVariance)。依照确定的运算符来固定目标轴。在这样的情况下,使用按照运算符而固定的目标轴。如果确定了需要参数的运算符,则将参数设置为随机值或者预定值。
在步骤S44中,特征提取方程列表生成器35确定至此生成的特征提取方程[M]的计算结果是否为一维标量值。如果在步骤S44中确定至此生成的特征提取方程[M]的计算结果不是一维标量值,则处理返回到步骤S43以重复步骤S43和后续步骤从而添加一个运算符。
如果在步骤S44中确定至此生成的特征提取方程[M]的计算结果为一维标量值,则特征提取方程列表生成器35在步骤S45中确定方程循环参数M是否小于最大值m。如果在步骤S45中确定方程循环参数M小于最大值m,则方程循环参数M递增一。处理返回到步骤S42以重复步骤S42和后续步骤。如果在步骤S45中确定方程循环参数M不小于最大值m(即方程循环参数M等于最大值m),则特征提取方程列表生成器35终止方程循环。处理返回到图17的步骤S22以继续步骤S24。
由此生成第一代特征提取方程列表。
下文参照图19的流程图描述在图17的步骤S23中执行的下一代列表生成过程。
在步骤S61中,特征提取方程列表生成器35确定满足方程m=ms+mx+mm+mr的ms、mx、mm和mr的值(m统称为特征提取方程),其中ms代表用于执行选择操作(复制操作)的特征提取方程的数目(选择计数),mx代表用于执行交叉操作的特征提取方程的数目(交叉计数),mm代表用于执行变异操作的特征提取方程的数目(变异计数),而mr代表用于执行随机生成操作的特征提取方程的数目(随机生成计数)。
值ms、mx、mm和mr可以是预定比率或者可以随机确定以满足方程m=ms+mx+mm+mr。
在步骤S62中,执行将要参照图20随后讨论的选择过程。
在步骤S63中,执行将要参照图21讨论的交叉过程。
在步骤S64中,执行将要参照图22讨论的变异过程。
在步骤S65中,执行将要参照图23讨论的随机生成过程。处理返回到图17的步骤S23以继续步骤S24。
通过这些过程,基于基因搜索来生成第二代特征提取方程列表。
下文参照图20的流程图描述在图19的步骤S62中执行的选择操作。
在步骤S91中,特征提取方程列表生成器35根据贡献率的顺序来分类当前一代特征提取方程(在当前为之生成特征提取方程列表之前)。
在步骤S92中,特征提取方程列表生成器35为下一代采用ms个特征提取方程。处理返回到图19的步骤S62以继续步骤S63。
通过这些步骤,具有高贡献率的特征提取方程被选择和复制到下一代特征提取方程列表。
下文参照21的流程图描述在图19的步骤S63中执行的交叉过程。
在步骤S121中,特征提取方程列表生成器35默认交叉循环参数MX为一,然后开始交叉循环。交叉循环重复mx次,其中mx等于交叉计数mx。
在步骤S122中,特征提取方程列表生成器35对当前一代列表中包含的所有特征提取方程加权使得具有较高贡献率的特征提取方程被选机会更高,然后随机选择特征提取方程并且处理所选特征提取方程作为方程A。
在步骤S123中,特征提取方程列表生成器35对当前生成列表中包含的所有特征提取方程加权使得具有较高贡献率的特征提取方程被选机会更高,然后随机选择特征提取方程并且处理所选特征提取方程作为方程B。
在步骤S124中,特征提取方程列表生成器35确定方程A是否不同于方程B。如果在步骤S124中确定方程A并非不同于方程B,则处理返回到步骤S123以重复步骤S123和S124从而选出新的方程B直至确定方程A不同于方程B。
如果在步骤S124中确定方程A不同于方程B,则特征提取方程列表生成器35在步骤S125中通过遗传地组合每个方程A和方程B的部分来生成新的特征提取方程。
特征提取方程列表生成器35以如下方式来将两个方程的部分组合为一个组合:使得在组合之后通过计算特征提取方程由输入数据来确定向量,即该组合使得如果从前导特征提取方程开始对特征提取方程执行计算过程则不引起目标轴不一致。
在步骤S126中,特征提取方程列表生成器35将在步骤S125中生成的新特征提取方程添加到下一代方程。
在步骤S127中,特征提取方程列表生成器35确定交叉循环参数MX是否小于作为最大值的交叉计数mx。如果在步骤S127中确定交叉循环参数MX小于交叉计数mx,则交叉循环参数MX递增一。处理返回到步骤S122以重复步骤S122和后续步骤。如果在步骤S127中确定交叉循环参数MX不小于交叉计数mx、即交叉循环参数MX等于交叉计数mx,则特征提取方程列表生成器35终止交叉循环。处理返回到图19的步骤S63以继续步骤S64
每当执行从步骤S12至步骤S126的交叉循环时,生成下一代特征提取方程列表中包含的特征提取方程(基因)之一。当交叉循环完成时,已经生成特征提取方程列表中包含的mx个特征提取方程(基因)。
由此以这一方式对特征提取方程加权使得具有较高贡献率的特征提取方程被选机会更高,然后选择一个特征提取方程。使用所选特征提取方程,特征提取方程列表生成器35执行交叉操作,由此生成下一代特征提取方程列表中包含的特征提取方程。
下文参照图22的流程图描述在图19的步骤S64中执行的变异操作。
在步骤S151中,特征提取方程列表生成器35默认变异循环参数MM为一,然后开始变异循环。变异循环重复mm次,其中mm等于变异计数mm。
在步骤S152中,特征提取方程列表生成器35对当前一代列表中包含的所有特征提取方程加权使得具有较高贡献率的特征提取方程被选机会更高,然后随机选择一个特征提取方程作为方程A。
在步骤S153中,特征提取方程列表生成器35通过执行变异操作来生成新的特征提取方程。具体而言,通过变异操作,特征提取方程列表生成器35修改或者删除所选方程A的部分或者修改方程A的内部参数。
特征提取方程列表生成器35以如下方式修改特征提取方程的部分,以使得在修改部分特征提取方程之后通过计算特征提取方程而由输入数据来确定标量,即该方式使得如果从前导特征提取方程开始对特征提取方程执行计算过程则不引起处理轴不一致。
在步骤S154中,特征提取方程列表生成器35将在步骤S153中生成的新特征提取方程添加到下一代特征提取方程。
在步骤S155中,特征提取方程列表生成器35确定变异循环参数MM是否小于变异计数mm。如果在步骤S155中确定变异循环参数MM小于变异计数mm,则特征提取方程列表生成器35使变异循环参数MM递增一。处理返回到步骤S152以重复步骤S152和后续步骤。如果在步骤S155中确定变异循环参数MM不小于变异计数mm、即变异循环参数MM等于变异计数mm,则特征提取方程列表生成器35终止变异循环。处理返回到图19的步骤S64以继续步骤S65。
每当执行步骤S152至步骤S154的变异循环时,生成下一代特征提取方程列表中将要包含的特征提取方程(基因)之一。当变异循环完成时,已经生成特征提取方程列表中包含的m个特征提取方程(基因)。
由此以如下方式对特征提取方程加权使得具有较高贡献率的特征提取方程被选机会更高,然后选择一个特征提取方程。使用所选特征提取方程,特征提取方程列表生成器35执行变异操作,由此生成下一代特征提取方程列表中包含的特征提取方程。
下文参照图23的流程图描述在图19的步骤S65中执行的随机生成过程。
在步骤S181中,特征提取方程列表生成器35默认随机生成循环参数MR为一,然后开始随机生成循环。随机生成循环重复mr次,其中mr等于特征提取方程列表中特征提取方程的数目。
在步骤S182中,特征提取方程列表生成器35从多条学习输入数据之中随机选择与第MR个特征提取方程(下文也称为特征提取方程MR)对应的输入数据。
在步骤S183中,特征提取方程列表生成器35随机确定所要生成的特征提取方程MR的目标轴和一个运算符。
例如,运算符类型包括均值、快速傅立叶变换(FFT)、标准偏差(StDev)、发生率、低通滤波(LPF)、高通滤波(HPF)、绝对值(ABS)、积分运算、最大值(MaxIndex)和无偏方差(UVariance)。依照确定的运算符来固定处理目标轴。在这样的情况下,使用按照运算符而固定的处理目标轴。如果确定了需要参数的运算符,则将参数设置为随机值或者预定值。
在步骤S184中,特征提取方程列表生成器35确定至此生成的特征提取方程MR的计算结果是否为一维标量值。如果在步骤S184中确定至此生成的特征提取方程MR的计算结果不是一维标量值,则处理返回到步骤S183以重复步骤S183和后续步骤从而添加一个运算符。
如果在步骤S184中确定至此生成的特征提取方程MR的计算结果为一维标量值,则特征提取方程列表生成器35在步骤S185中确定随机生成循环参数MR是否小于最大值mr。如果在步骤S185中确定随机生成循环参数小于最大值mr,则随机生成循环参数递增一。处理返回至步骤S182,以重复步骤S182和随后的步骤。如果在步骤S185中确定随机生成循环参数不小于最大值mr(即随机生成循环参数等于最大值mr),则特征提取方程列表生成器35终止随机生成循环。处理返回到图19的步骤S65,然后返回到图17的步骤S23以继续步骤S24。
每当执行从步骤S182至S185的随机生成循环时,生成下一代特征提取方程列表中包含的特征提取方程(基因)之一。当随机生成循环完成时,已经生成了特征提取方程列表中包含的mr个特征提取方程(基因)。
随机生成过程生成下一代特征提取方程列表中包含的部分特征提取方程。
下文参照图24的流程图描述在图16的步骤S3中执行的特征量计算过程。
在步骤S211中,特征量计算器32从特征提取方程列表生成器35获取特征提取方程列表、默认方程循环参数M为一并且开始方程循环。方程循环重复m次,其中m为形成特征提取方程列表的特征提取方程的数目。
在步骤S212中,特征量计算器32默认内容循环参数Q为一,然后开始内容循环。内容循环重复q次,其中q为学习内容数据获取单元31所获取的学习数据的条数。
在步骤S213中,特征量计算器32使用方程循环参数M的特征提取方程来计算与内容循环参数Q对应的学习数据的特征量。
在步骤S214中,特征量计算器32确定内容循环参数Q是否小于最大值q。如果在步骤S214中确定内容循环参数Q小于最大值q,则内容循环参数Q递增一。处理返回到步骤S213以重复步骤S213和后续步骤。
如果在步骤S214中确定内容循环参数Q不小于最大值q(即内容循环传输Q等于最大值q),则特征量计算器32终止内容循环。处理继续步骤S215。
在步骤S215中,特征量计算器32确定方程循环参数M是否小于最大值m。如果在步骤S215中确定方程循环参数M小于最大值m,则方程循环参数M递增一。处理返回到步骤S212以重复步骤S212和后续步骤。如果在步骤S215中确定方程循环参数M不小于最大值m(即方程循环参数M等于最大值m),则特征量计算器32终止方程循环。处理返回到图16的步骤S3以继续步骤S4。
由此算出每个特征提取方程中使用的特征量。这里算出的特征量并不用作为用以进展一代特征提取方程的评价值。用以进展一代特征提取方程的评价值不是这里算出的特征量,而是使用特征量来确定的对应特征提取方程的贡献率。
下文参照图25描述在图16的步骤S4中执行的机器学习过程。
在步骤S241中,机器学习单元34默认监控循环参数K为一,然后开始监控循环。监控循环重复k次,其中k为监控数据获取单元33所获取的监控数据的条数。
在步骤S242中,执行将要参照图26讨论的学习过程。
在步骤S243中,机器学习单元34确定监控循环参数K是否小于最大值k。如果在步骤S243中确定监控循环参数K小于最大值k,则监控循环参数K递增一。处理返回到步骤S242以重复步骤S242和后续步骤。如果在步骤S243中确定监控循环参数K不小于最大值k(即监控循环参数K等于最大值k),则机器学习单元34终止监控循环。处理继续步骤S244。
在步骤S244中执行随后将要参照图27讨论的贡献率计算过程。处理返回到图16的步骤S4以继续步骤S5。
下文参照图26的流程图描述在图25的步骤S242中执行的学习过程。
在步骤S271中,机器学习单元34随机生成将用来生成特征量提取方程的特征提取方程的初始集。具体而言,机器学习单元34随机生成多个基因的初始集。基因这里确定是否使用每个特征提取方程(即特征量计算方程中的组合系数是否具有预定值,换而言之,特征量计算方程中的组合系数是否为零)。
在步骤S272中,机器学习单元34默认填充循(population loop)环参数P为一,然后开始填充循环。填充循环重复p次,其中p为初始集中包含的基因的数目。
在步骤S273中,机器学习单元34通过线性回归/判别分析来学习特征量计算方程[k](k个目标问题的每k个特征提取方程)。在学习过程中,机器学习单元34使用从特征量计算器12供应的特征量的计算结果之中作为待使用的特征提取方程来选择的特征提取方程的计算结果。换而言之,机器学习单元34使用根据所选特征提取方程而得到的特征量。
在步骤S274中,机器学习单元34使用AIC来评价步骤273中的学习结果。
在步骤S275中,机器学习单元34确定填充循环参数P是否小于最大值p。如果在步骤S275中确定填充循环参数P小于最大值p,则填充循环参数P递增一。处理返回到步骤S273以重复步骤S273和后续步骤。如果在步骤S275中确定填充循环参数P不小于最大值p(即填充循环参数P等于最大值p),则机器学习单元34终止填充循环。
在步骤S276中,机器学习单元34以AIC作为评价值来选择待使用的特征提取方程,并且执行交叉和变异操作。由此更新换代并且改变特征提取方程。
在步骤S277中,机器学习单元34确定是否针对预定数目的多代来更新最好基因的评价值。如果在步骤S277中确定最好基因的评价值被更新或者自上次更新评价值起尚未进展预定数目的多代,则处理返回到步骤S272以重复步骤S272和后续步骤。
如果在步骤S277中确定尚未针对预定多代来更新最好基因的评价值,则机器学习单元34输出最好基因作为学习结果。处理返回到步骤S242以继续步骤S243。
使用待使用/未使用的特征提取方程组合作为基因的遗传搜索方法确定将要在特征量计算方程中使用的特征提取方程组合。
在上述讨论中,在机器学习中使用基因搜索方法和AIC。可以使用不同方法来执行特征学习。可以使用邻近搜索方法而不是遗传算法来确定待使用/未使用的每个特征提取方程的输出值。
下文参照图27的流程图描述在图25的步骤S244中执行的贡献率计算过程。
在步骤S301中,机器学习单元34默认方程循环参数M为一并且开始方程循环。方程循环重复m次,其中m为形成特征提取方程列表的特征提取方程的数目。
在步骤S302中,机器学习单元34根据特征提取方程[M]来计算为学习而提供的所有学习输入数据的标准偏差StDev[M]。
在步骤S303中,机器学习单元34确定方程循环参数M是否小于最大值m。如果在步骤S303中确定方程循环参数M小于最大值m,则方程循环参数M递增一。处理返回到步骤S301以重复步骤S301和后续步骤。如果在步骤S303中确定方程循环参数M不小于最大值m(即方程循环参数M等于最大值m),则机器学习单元34终止方程循环。
在步骤S304中,机器学习单元34默认总贡献率Cont[M]为零,该总贡献率为与所有类型的监控对应的特征提取方程的贡献率之和。
在步骤S305中,特征提取方程列表生成器35默认监控循环参数K为一,然后开始监控循环。监控循环重复k次,其中k为监控数据获取单元33所获取的监控数据的条数。
在步骤S306中,机器学习单元34默认方程循环参数M为一,然后开始方程循环。方程循环重复m次,其中m为形成特征提取方程列表的特征提取方程的数目。
在步骤S307中,机器学习单元34使用先前描述的方程(3)来计算特征提取方程的贡献率(XM)。特征提取方程这里用来响应于监控循环参数K来估计目标元数据Y(例如指示了节奏和愉悦度)。
在步骤S308中,机器学习单元确定方程循环参数M是否小于最大值m。如果在步骤S308中确定方程循环参数M小于最大值m,则方程循环参数M小于最大值m,则方程循环参数M递增一。处理返回到步骤S307以重复步骤S307和后续步骤。如果在步骤S308中确定方程循环参数M不小于最大值m(即方程循环参数M等于最大值m),则机器学习单元34终止方程循环。
在步骤S309中,机器学习单元34确定监控循环参数K是否小于最大值k。如果在步骤S309中确定监控循环参数K小于最大值k,则监控循环参数K递增一。处理返回到步骤S306以重复步骤S306和后续步骤。如果在步骤S309中确定监控循环参数K不小于最大值K(即监控循环参数K等于最大值k),则机器学习单元34终止监控循环。
在步骤S310中,机器学习单元34输出总贡献率Cont[M],也就是所有监控数据的特征提取方程的贡献率(XM)之和。处理返回到步骤图25的S244,然后返回到图16的步骤S4以继续步骤S5。
由此确定用以解决目标问题的特征量计算方程中特征提取方程的贡献率。贡献率用作为用以在生成特征量提取算法的遗传搜索方法中更新换代的评价值。
通过图16至图27的处理,算法生成器11生成特征量提取算法,然后将生成的特征量提取算法供应给布置于同一装置(信息处理装置1)中或者不同装置中的特征量计算器12。根据特征量提取算法,特征量计算器12分析为检测特征量而供应的检测数据并且计算和输出特征量。
下文参照图28的流程图描述特征量计算器12所执行的特征量计算过程。
在步骤S331中,特征量计算器12中的特征量运算单元53确定用于对检测数据的特征量进行检测的特征量提取算法是否存储于其内。
如果在步骤S331中确定未存储有特征量提取算法,则特征量提取算法获取单元51获取用于对检测数据的特征量进行检测的特征量提取算法,然后将获取的特征量提取算法供应给特征量运算单元53。用于对检测数据的特征量进行检测的特征量提取算法是算法生成器11已经使用与检测数据对应的学习数据和使用检测数据来生成的特征量提取算法。
在步骤S331中确定内部存储了特征量提取算法之后或者在步骤S332中,检测内容数据获取单元52在步骤S333中获取检测数据作为特征量提取目标并且将检测数据供应给特征量运算单元53。
在步骤S334中,特征量运算单元53使用对应特征量提取算法来计算特征量作为针对从检测内容数据获取单元52供应的作为特征量提取目标的检测数据中目标问题的解决方案。特征量运算单元53然后将所得的特征量供应给结果输出单元54。
在步骤S335中,结果输出单元54输出特征量运算单元53在步骤S334中算出的特征量以向用户通知特征量。例如,结果输出单元54将特征量输出到外部设备、以文本数据的形式显示特征量或者响应于解决方案以音频形式输出音频数据。
以这一方式,使用所有基因来解决目标问题,计算每个基因对针对目标问题的解决方案已经起作用的贡献率,并且使用贡献率作为评价值来执行的基因搜索获得了特征量提取算法。由此解决针对所需输入数据的相似问题。
用于解决目标问题的特征量提取算法由图3的信息处理装置1或者由包括作为分离装置的算法生成器11和特征量计算器12的信息处理系统生成。为了生成特征量提取算法,生成预定数目的第一代特征量提取方程(基因)并且使用所有学习内容数据来计算所有特征提取方程。使用所有特征提取方程的计算结果,执行机器学习以确定用于提取目标特征量(针对目标问题的解决方案)的特征量计算方程。也计算特征量计算方程中每个特征提取方程的贡献率。使用每个特征提取方程的贡献率作为评价值并使用当前一代多个特征提取方程作为当前一代基因来执行遗传搜索方法。由此得到下一代基因、即下一代特征提取方程。随着更新换代,由此提供了以预定准确度水平来确定针对目标问题的解决方案的特征量提取算法。
不是发现能够解决目标问题的单个优良基因,而是算法生成器11高效地搜寻相互配合地解决目标问题的多个基因。由此自动地构造用于从内容数据自动提取多个特征量的特征量提取器。
当使用多个基因的集合而不是单个基因来解决目标问题时,无需使用如在国际公开第WO2007/049641号中公开的多个特征提取方程列表。以这一方式,用数目较少的运算操作来高效地搜索相互配合地解决目标问题的多个基因。
可以使用硬件或者软件来执行上述方法步骤。如果使用软件,上述方法步骤由图29的个人计算机500执行。
如图29中所示,中央处理单元(CPU)501执行只读存储器(ROM)502上存储的程序或者从存储单元508加载到随机存取存储器(RAM)503的程序。按照需要,RAM 503存储CPU 501需要用来执行各种处理的数据。
CPU 501、ROM 502和RAM 503经由内部总线504相互连接。内部总线504也连接到输入输出接口505。
输入-输出接口505连接到包括键盘和鼠标的输入单元506、包括显示器如阴极射线管(CRT)或者液晶显示器(LCD)和扬声器的输出单元507、包括硬盘的存储单元508以及包括调制解调器和终端适配器的通信单元509。通信单元509经由包括电话线和有线电视(CATV)网络的各种网络执行通信处理。
驱动器510也适当地连接到输入-输出接口505。驱动器510适当地加载有可移动介质521如磁盘、光盘、磁光盘或者半导体存储器。从可移动介质521读取的计算机程序随需安装到存储单元508上。
以上述时序顺序执行描述了记录介质上记载的程序的方法步骤。可替换地,可以并行地或者分开地执行而不是以上述时序顺序执行方法步骤。
在本说明书的上下文中的术语“系统”是指包括多个装置的整个布置。
本领域技术人员应当理解,根据设计要求和其它有关因素可以进行各种修改、组合、二次修改和变更,因为它们落在所附的请求保护范围及其等效的范围内。
Claims (16)
1.一种信息处理装置,包括:
目标问题获取装置,用于获取目标问题;
生成装置,用于生成用以解决所述目标问题的针对所述目标问题的多个解决方案候选;以及
贡献率计算装置,用于如果使用针对所述目标问题获取装置所获取的所述目标问题的所有所述多个解决方案候选来解决所述目标问题则计算针对所述目标问题的每个解决方案候选的贡献率,
所述生成装置根据使用评价值的遗传算法来生成针对所述目标问题的下一代解决方案候选,所述评价值是至少使用所述贡献率计算装置所计算的、针对所述目标问题的每个解决方案候选的所述贡献率而算出的。
2.根据权利要求1所述的信息处理装置,其中所述目标问题获取装置包括:
第一获取装置,用于获取学习数据;以及
第二获取装置,用于获取与所述学习数据对应的针对所述目标问题的解决方案作为监控数据,
其中所述目标问题获取装置将所述目标问题设置为发现用于根据所述学习数据来确定与所述学习数据对应的所述解决方案的装置。
3.根据权利要求2所述的信息处理装置,其中所述生成装置包括:列表生成装置,用于生成包含多个数据计算方程的列表,
其中所述贡献率计算装置包括:计算装置,用于使用所述列表生成装置所生成的所述列表中包含的所述多个数据计算方程对所述第一获取装置所获取的所述学习数据执行计算操作,以及
贡献率获取装置,用于使用所述计算装置的计算结果来学习特征量计算方程以及用于确定作为学习结果而获得的所述特征量计算方程中每个数据计算方程的贡献率,所述特征量计算方程用来估计所述第二获取装置所获取的所述监控数据并且是所述列表生成装置所生成的所述列表中包含的所述多个数据计算方程的输出值的线性组合,以及
其中所述列表生成装置随机生成第一代所述列表中包含的所述数据计算方程并且根据遗传算法来生成第二代或者后一代所述列表,所述遗传算法在以当前一代所述列表中包含的每个数据计算方程作为基因的情况下使用根据所述贡献率获取装置所确定的每个数据计算方程的所述贡献率而算出的评价值。
4.根据权利要求3所述的信息处理装置,还包括:输出装置,用于输出所述贡献率获取装置所学习的所述特征量计算方程和所述列表生成装置所生成的最后一代所述列表。
5.根据权利要求4所述的信息处理装置,其中如果所述贡献率获取装置所学习的所述特征量计算方程的计算结果就所述第二获取装置所获取的所述监控数据而言达到预定准确度,则所述输出装置输出所述贡献率获取装置所学习的所述特征量计算方程和所述列表生成装置所生成的最后一代所述列表。
6.根据权利要求3所述的信息处理装置,其中所述贡献率获取装置在基因指示了在所述特征量获取方程中所述数据计算方程的线性组合系数是否为零的情况下基于所述线性组合系数使用所述特征量计算方程来估计所述监控数据、以及根据所述遗传算法来学习所述特征量计算方程,其中所述遗传算法使用以评价函数来评价估计结果的所述评价值。
7.根据权利要求2所述的信息处理装置,还包括:
第三获取装置,用于获取检测数据;以及
特征量运算装置,用于通过使用所述贡献率获取装置所学习的所述特征量计算方程和所述列表生成装置所生成的最后一代所述列表来处理所述第三获取装置所获取的所述检测数据从而计算所述检测数据的特征量。
8.一种用于确定针对目标问题的解决方案的信息处理装置的信息处理方法,包括以下步骤:
获取所述目标问题;
生成用以解决所述目标问题的针对所述目标问题的多个解决方案候选;以及
如果使用针对所述目标问题的所有所述多个解决方案候选来解决所述目标问题则计算针对所述目标问题的每个解决方案候选的贡献率,
所述生成包括根据使用评价值的遗传算法来生成针对所述目标问题的下一代解决方案候选,所述评价值是至少使用所计算的针对所述目标问题的每个解决方案候选的所述贡献率而算出的。
9.一种用于使计算机确定针对目标问题的解决方案的程序,包括以下步骤:
获取所述目标问题;
生成用以解决所述目标问题的针对所述目标问题的多个解决方案候选;以及
如果使用针对所述目标问题的所有所述多个解决方案候选来解决所述目标问题则计算针对所述目标问题的每个解决方案候选的贡献率,
所述生成包括根据使用评价值的遗传算法来生成针对所述目标问题的下一代解决方案候选,所述评价值是至少使用所计算的针对所述目标问题的每个解决方案候选的所述贡献率而算出的。
10.一种存储根据权利要求9所述的程序的记录介质。
11.一种信息处理装置,包括:
第一获取装置,用于获取检测数据;
第二获取装置,用于获取特征量提取算法;以及
特征量计算装置,用于通过根据所述第二获取装置所获取的所述特征量提取算法处理所述第一获取装置所获取的所述检测数据来计算所述检测数据的特征量,
其中所述第二获取装置所获取的所述特征量提取算法包括特征量计算方程和最后一代列表,以及
其中通过以下操作来获得所述特征量计算方程和所述最后一代列表:
通过随机生成在包含了多个数据计算方程的第一代列表中包含的所述数据计算方程来生成所述列表,
使用形成所述生成的列表的所述多个数据计算方程来处理预定学习数据,
使用所述预定学习数据的处理结果来学习作为形成所述列表的所述多个数据计算方程的线性组合的所述特征量计算方程,所述特征量计算方程用来估计预定监控数据,
确定在通过所述学习获得的所述特征量计算方程中每个数据计算方程的贡献率,以及
根据遗传算法来生成第二代或者后一代所述列表,所述遗传算法在以当前一代所述列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的所述贡献率而算出的评价值。
12.一种基于用于确定针对目标问题的解决方案的算法来计算检测数据的特征量的信息处理装置的信息处理方法,包括步骤:
获取所述检测数据;
获取特征量提取算法;以及
通过根据所述特征量提取算法处理所述检测数据来计算所述检测数据的特征量,
其中所述特征量提取算法包括特征量计算方程和最后一代列表,以及
其中通过以下操作来获得所述特征量计算方程和所述最后一代列表:
通过随机生成在包含了多个数据计算方程的第一代列表中包含的所述数据计算方程来生成所述列表,
使用形成所述生成的列表的所述多个数据计算方程来处理预定学习数据,
使用所述预定学习数据的处理结果来学习作为形成所述列表的所述多个数据计算方程的线性组合的所述特征量计算方程,所述特征量计算方程用来估计预定监控数据,
确定在通过所述学习获得的所述特征量计算方程中每个数据计算方程的贡献率,以及
根据遗传算法来生成第二代或者后一代所述列表,所述遗传算法在以当前一代所述列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的所述贡献率而算出的评价值。
13.一种用于使计算机基于用于确定针对目标问题的解决方案的算法来计算检测数据的特征量的计算机程序,包括以下步骤:
获取所述检测数据;
获取特征量提取算法;以及
通过根据所述特征量提取算法处理所述检测数据来计算所述检测数据的特征量,
其中所述特征量提取算法包括特征量计算方程和最后一代列表,以及
其中通过以下操作来获得所述特征量计算方程和最后一代所述列表:
通过随机生成在包含多个数据计算方程的第一代列表中包含的所述数据计算方程来生成所述列表,
使用形成所述生成的列表的所述多个数据计算方程来处理预定学习数据,
使用所述预定学习数据的处理结果来学习作为形成所述列表的所述多个数据计算方程的线性组合的所述特征量计算方程,所述特征量计算方程用来估计预定监控数据,
确定在通过所述学习获得的所述特征量计算方程中每个数据计算方程的贡献率,以及
根据遗传算法来生成第二代或者后一代所述列表,所述遗传算法在以当前一代所述列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的所述贡献率而算出的评价值。
14.一种存储根据权利要求13所述的计算机程序的记录介质。
15.一种信息处理装置,包括:
目标问题获取单元,该目标问题获取单元获取目标问题;
生成单元,该生成单元生成用以解决所述目标问题的针对所述目标问题的多个解决方案候选;以及
贡献率计算单元,如果使用针对所述目标问题获取单元所获取的所述目标问题的所有所述多个解决方案候选来解决所述目标问题,则该贡献率计算单元计算针对所述目标问题的每个解决方案候选的贡献率,
所述生成单元根据使用评价值的遗传算法来生成针对所述目标问题的下一代解决方案候选,所述评价值是至少使用所述贡献率计算单元所确定的针对所述目标问题的每个解决方案候选的所述贡献率而算出的。
16.一种信息处理装置,包括:
第一获取单元,该第一获取单元获取检测数据;
第二获取单元,该第二获取单元获取特征量提取算法;以及
特征量计算单元,该特征量计算单元通过根据所述第二获取单元所获取的所述特征量提取算法处理所述第一获取单元所获取的所述检测数据来计算所述检测数据的特征量,
其中所述第二获取单元所获取的所述特征量提取算法包括特征量计算方程和最后一代列表,
其中通过以下操作来获得所述特征量计算方程和最后一代所述列表:
通过随机生成在包含多个数据计算方程的第一代列表中包含的所述数据计算方程来生成所述列表,
使用形成所生成的所述列表的所述多个数据计算方程来处理预定学习数据,
使用所述预定学习数据的处理结果来学习作为形成所述列表的所述多个数据计算方程的线性组合的所述特征量计算方程,所述特征量计算方程用来估计预定监控数据,
确定在通过所述学习获得的所述特征量计算方程中每个数据计算方程的贡献率,以及
根据遗传算法来生成第二代或者后一代所述列表,所述遗传算法在以当前一代所述列表中包含的每个数据计算方程作为基因的情况下使用至少根据每个数据计算方程的所述贡献率而算出的评价值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-211477 | 2007-08-14 | ||
JP2007211477A JP4392620B2 (ja) | 2007-08-14 | 2007-08-14 | 情報処理装置、情報処理方法、演算装置、演算方法、プログラム、および記録媒体 |
JP2007211477 | 2007-08-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101369320A true CN101369320A (zh) | 2009-02-18 |
CN101369320B CN101369320B (zh) | 2014-05-28 |
Family
ID=39967648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810134654.8A Expired - Fee Related CN101369320B (zh) | 2007-08-14 | 2008-08-12 | 信息处理装置和方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US8170963B2 (zh) |
EP (1) | EP2026255A3 (zh) |
JP (1) | JP4392620B2 (zh) |
CN (1) | CN101369320B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102087721A (zh) * | 2009-12-04 | 2011-06-08 | 索尼公司 | 信息处理设备、观测值预测方法及程序 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8559662B2 (en) * | 2008-05-06 | 2013-10-15 | Starkey Laboratories, Inc. | Genetic algorithms with subjective input for hearing assistance devices |
US8359283B2 (en) * | 2009-08-31 | 2013-01-22 | Starkey Laboratories, Inc. | Genetic algorithms with robust rank estimation for hearing assistance devices |
JP5446800B2 (ja) | 2009-12-04 | 2014-03-19 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP5573443B2 (ja) * | 2010-07-14 | 2014-08-20 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP5581864B2 (ja) | 2010-07-14 | 2014-09-03 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US9213978B2 (en) * | 2010-09-30 | 2015-12-15 | At&T Intellectual Property I, L.P. | System and method for speech trend analytics with objective function and feature constraints |
JP5874292B2 (ja) | 2011-10-12 | 2016-03-02 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP5879899B2 (ja) | 2011-10-12 | 2016-03-08 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN111797401B (zh) * | 2020-07-08 | 2023-12-29 | 深信服科技股份有限公司 | 一种攻击检测参数获取方法、装置、设备及可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5924048A (en) * | 1997-03-14 | 1999-07-13 | Mccormack; Michael D. | Automated material balance system for hydrocarbon reservoirs using a genetic procedure |
JP2000020504A (ja) | 1998-06-30 | 2000-01-21 | Toshiba Corp | 目的変数の説明または予測方法、および目的変数を説明または予測するプログラムを記録した記録媒体 |
US6466929B1 (en) * | 1998-11-13 | 2002-10-15 | University Of Delaware | System for discovering implicit relationships in data and a method of using the same |
JP2000187435A (ja) * | 1998-12-24 | 2000-07-04 | Sony Corp | 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法 |
CN1363074A (zh) * | 2000-02-09 | 2002-08-07 | 索尼公司 | 信息处理设备和方法、数据存储设备和程序 |
US6868411B2 (en) * | 2001-08-13 | 2005-03-15 | Xerox Corporation | Fuzzy text categorizer |
JP2004355174A (ja) | 2003-05-28 | 2004-12-16 | Ishihara Sangyo Kaisha Ltd | データ解析方法及びそのシステム |
JP4935047B2 (ja) | 2005-10-25 | 2012-05-23 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP4948118B2 (ja) | 2005-10-25 | 2012-06-06 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2007211477A (ja) | 2006-02-09 | 2007-08-23 | Kitazawa Nosanki Seisakusho:Kk | 長さ自在調節装置付き脚並びに脚立 |
-
2007
- 2007-08-14 JP JP2007211477A patent/JP4392620B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-22 EP EP08252482A patent/EP2026255A3/en not_active Withdrawn
- 2008-08-05 US US12/186,448 patent/US8170963B2/en not_active Expired - Fee Related
- 2008-08-12 CN CN200810134654.8A patent/CN101369320B/zh not_active Expired - Fee Related
-
2012
- 2012-04-18 US US13/449,463 patent/US20120203722A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102087721A (zh) * | 2009-12-04 | 2011-06-08 | 索尼公司 | 信息处理设备、观测值预测方法及程序 |
CN102087721B (zh) * | 2009-12-04 | 2015-04-01 | 索尼公司 | 信息处理设备和观测值预测方法 |
Also Published As
Publication number | Publication date |
---|---|
US20120203722A1 (en) | 2012-08-09 |
CN101369320B (zh) | 2014-05-28 |
EP2026255A3 (en) | 2010-06-02 |
US8170963B2 (en) | 2012-05-01 |
JP4392620B2 (ja) | 2010-01-06 |
EP2026255A2 (en) | 2009-02-18 |
JP2009048266A (ja) | 2009-03-05 |
US20090048991A1 (en) | 2009-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101369320B (zh) | 信息处理装置和方法 | |
US20180365557A1 (en) | Information processing method and information processing apparatus | |
US11687352B2 (en) | Machine-learning models applied to interaction data for determining interaction goals and facilitating experience-based modifications to interface elements in online environments | |
US8364610B2 (en) | Process modeling and optimization method and system | |
CN107133874A (zh) | 一种基于遗传规划的量化策略生成系统 | |
CN108255706A (zh) | 自动化测试脚本的编辑方法、装置、终端设备及存储介质 | |
CN101419610B (zh) | 信息处理设备和信息处理方法 | |
JP2010020714A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Zou et al. | An evolutionary algorithm based on dynamic sparse grouping for sparse large scale multiobjective optimization | |
Huang et al. | Harnessing deep learning for population genetic inference | |
WO2021214936A1 (ja) | 予測装置、予測方法、及び、記録媒体 | |
CN111861674B (zh) | 一种产品推荐方法和系统 | |
JP2009110212A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113495956A (zh) | 组卷方法、装置、存储介质和计算设备 | |
KR20130086083A (ko) | 리스크-프로파일 생성 장치 | |
CN113642226A (zh) | 基于多目标进化算法的公平机器学习模型的训练方法 | |
EP4332847A1 (en) | Coupled learner formation device, coupled learner formation program, and non-transitory recording medium with a coupled learner formation program recorded therein | |
US20190172548A1 (en) | Improved computer implemented method for breeding scheme testing | |
Xie et al. | Is the not-sampled issue in tournament selection critical? | |
Junior et al. | The effect analysis of crossover and selection methods on the performance of genclust++ algorithm | |
US11907881B1 (en) | Apparatus and methods for generating a process enhancement | |
KR102319028B1 (ko) | 데이터 시각화 방법 및 장치 | |
WO2023175922A1 (ja) | モデル分析装置、モデル分析方法、及び、記録媒体 | |
Kavitha et al. | Towards Smart Data Mining Support Based on Annotation Beneficial Grouping Method | |
WO2022244625A1 (ja) | 修理内容予測方法、修理内容予測装置、プログラム、及び、修理内容予測モデルの作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140528 Termination date: 20180812 |
|
CF01 | Termination of patent right due to non-payment of annual fee |