CN101165773B - 信号处理设备及方法 - Google Patents

信号处理设备及方法 Download PDF

Info

Publication number
CN101165773B
CN101165773B CN2007101628910A CN200710162891A CN101165773B CN 101165773 B CN101165773 B CN 101165773B CN 2007101628910 A CN2007101628910 A CN 2007101628910A CN 200710162891 A CN200710162891 A CN 200710162891A CN 101165773 B CN101165773 B CN 101165773B
Authority
CN
China
Prior art keywords
sound
chord
characteristic quantity
beat
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101628910A
Other languages
English (en)
Other versions
CN101165773A (zh
Inventor
小林由幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101165773A publication Critical patent/CN101165773A/zh
Application granted granted Critical
Publication of CN101165773B publication Critical patent/CN101165773B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G3/00Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
    • G10G3/04Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

在此公开一种信号处理设备及方法、程序和记录介质。信号处理设备包括:抽取装置,用于抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音;和通过对特征量的学习而预先产生的根音判别装置,用于根据特征量判别基准声音是否是根音。

Description

信号处理设备及方法
技术领域
本发明涉及信号处理设备及方法、程序和记录介质,并且更具体地涉及处理声音信号的信号处理设备及方法、程序和记录介质。 
背景技术
对作为声音的信号的声音信号应用各种信号处理的各种信号处理设备被广泛地应用。 
如上所述的这样的信号处理设备中的一种包含再采样部分,其以八度音(octave)边界上的频率的二次幂的采样频率,对输入其中的音频信号进行再采样。八度音分割模块将从再采样部分输出的音频信号划分为八个八度音,并将得到的信号输出到相应的BPFB。每个BPFB具有十二个BPF,从而其从输入其中的一个八度音的音频信号中抽取并输出十二个不同音(tone)的音频信号(例如,参见日本专利申请早期公开No.2005-275068)。 
发明内容
然而,在其设法从一段音乐的声音信号中确定一段音乐的和弦即和音的情况下,信号处理设备有时不能确定正确的和弦。 
因此,需要提供一种信号处理设备和方法,一种程序,及一种记录介质,其中可从声音信号中准确地确定一段音乐的声音信号的和弦的根音。 
根据本发明的第一实施例,提供了一种信号处理设备,其包含用于抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量的抽取装置,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音;和通过对特征量的学习而预先产生的根音判别装置,其被配置用于根据特征量判别基准声音是否是根音。 
信号处理设备还可包含用于检测声音信号的每个节拍(beat)的位置的检测装置,抽取装置抽取声音信号的每个节拍范围内的特征量,根音判别装置在节拍范围内判别基准声音是否是根音。 
抽取装置可抽取指示十二平均律的不同音的声音的能级的特征量。 
抽取装置可抽取指示在十二平均律的每个不同音的多个八度音上合成的声音的能级的特征量。 
信号处理设备还可包含用于根据特征量至少判别和弦是大调和弦还是小调和弦的和弦类型判别装置。 
在此情况下,信号处理设备还可包含移位装置,其用于移位特征量从而将特征量的基准声音改变为另一声音,根音判别装置根据移位了的特征量判别基准声音是否是根音,该基准声音是移位了的特征量的基准,和弦类型判别装置根据移位了的特征量至少判别和弦是大调和弦还是小调和弦。 
或者,根音判别装置可输出用于判别基准声音是否是根音的第一辨别函数。和弦类型判别装置可输出用于至少判别和弦是大调和弦还是小调和弦的第二辨别函数。信号处理设备还包括概率计算装置,其用于根据第一辨别函数计算基准声音是根音的概率,并根据第二辨别函数计算和弦是大调和弦和小调和弦的概率。 
根音判别装置可根据特征量判别基准声音是否是根音,并至少判别关于和弦是大调和弦还是小调和弦的和弦类型。 
根据本发明的第一实施例,还提供了一种信号处理方法,其包括以下步骤:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,以及借助于通过对特征量的学习而预先产生的根音判别装置,根据特征量判别基准声音是否是根音。 
根据本发明的第一实施例,还提供了一种使得计算机执行以下步骤的程序:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,以及借助于通过对特征量的学习而预先产生的根音判别装 置,根据特征量判别基准声音是否是根音。 
根据本发明的第一实施例,可将程序记录在记录介质上或记录介质中。 
在该信号处理设备和方法、程序和记录介质中,在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量被抽取。这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音。然后,借助于通过对所述特征量的学习而预先产生的根音判别部分,根据特征量判别基准声音是否是根音。 
因此,利用信号处理设备和方法、程序和记录介质,可确定一段音乐的和弦。 
此外,从一段音乐的声音信号中可准确地确定一段音乐的和弦的根音。 
根据本发明的第二实施例,提供了一种信号处理设备,其包含用于抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量的抽取装置,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,以及学习装置,其用于基于声音信号的范围内的特征量以及和弦,学习根据特征量判别基准声音是否是根音。 
根据本发明的第二实施例,还提供了一种信号处理方法,其包括以下步骤:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,以及基于声音信号的范围内的特征量以及和弦,学习根据特征量判别基准声音是否是根音。 
根据本发明的第二实施例,还提供了一种使得计算机执行以下步骤的程序:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,以及基于声音信号的范围内的特征量以及和弦,学习根据特征量判别基准声音是否是根音。 
根据本发明的第二实施例,可将程序记录在记录介质上或记录介质中。 
在该信号处理设备和方法、程序和记录介质中,在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量被抽取。这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音。然后,基于声音信号的范围内的特征量以及和弦,学习根据特征量判别基准声音是否是根音。 
因此,利用信号处理设备和方法、程序和记录介质,利用信号处理的结果可从声音信号中判别一段音乐的和弦。 
此外,当从一段音乐的声音信号中判别一段音乐的和弦的根音时,可以较高的准确度判别根音。 
结合附图,通过以下描述和随附权利要求,本发明的上述及其他目的、特征和优点将变得明了,在附图中用类似的标号指示类似部份或元素。 
附图说明
图1是示出应用了本发明的信号处理设备的配置的框图; 
图2是示出从声音信号中判别出的和弦的示例的示图; 
图3是示出从声音信号中检测节拍的示例的示图; 
图4是示出节拍检测部分的配置示例的框图; 
图5是示出起奏信息的示例的图; 
图6是示出起奏信息的另一示例的示图; 
图7是示出基本节拍周期的示图; 
图8是示出确定节奏的示图; 
图9是示出校正节拍相位的示图; 
图10是示出校正节奏的示图; 
图11是示出和弦判别部分的配置示例的框图; 
图12是示出和弦判别过程的流程图; 
图13是示出从声音信号中去除中央分量的示例的示图; 
图14是示出中央去除部分的配置示例的框图; 
图15是示出在声音信号的多个八度音上的十二平均律的不同音的12 个声音的能量分布的示例的示图; 
图16是示出从声音信号中去除中央分量的示例的示图; 
图17是示出在每个节拍内判别和弦的示图; 
图18是示出从声音信号的节拍范围内抽取特征量的示图; 
图19是示出产生指示以音阶顺序排列的每个声音的能级的特征量的示图; 
图20是示出每个节拍的和弦判别特征量的示图; 
图21是示出每个节拍的和弦判别过程的示例的流程图; 
图22和图23是示出和弦判别部分的不同过程的示图; 
图24是示出辨别函数输出的示例的示图; 
图25和图26是示出和弦判别部分的不同过程的示图; 
图27是示出和弦判别部分的另一配置示例的框图; 
图28是示出每个节拍的和弦判别过程的另一示例的细节的流程图; 
图29是示出基于特征量执行学习来产生和弦判别部分的信号处理设备的配置示例的框图; 
图30是示出由每个节拍的和弦判别特征量指示的节拍范围内的和弦的示例的示图; 
图31是示出和弦判别学习过程的流程图; 
图32是示出针对每个节拍的用于学习判别声音是否是根音的和弦判别学习过程的流程图; 
图33是示出移位原始声音根音判别特征量的示图; 
图34是示出学习判别每个节拍的和弦判别特征量的第一数据的声音是否是根音的示图; 
图35是示出针对每个节拍的用于学习判别和弦是大调和弦还是小调和弦的和弦判别学习过程的流程图; 
图36是示出学习判别和弦是大调和弦还是小调和弦的示图; 
图37是示出针对每个节拍的用于学习判别声音是否是根音以及判别和弦是大调和弦还是小调和弦的和弦判别学习过程的流程图; 
图38是示出移位每个节拍的和弦判别特征量和正确的和弦名称的示 图;以及 
图39是示出个人计算机的配置示例的框图。 
具体实施方式
在详细描述本发明的优选实施例之前,先描述在权利要求中提出的几个特征与以下描述的优选实施例的特定元素之间的对应关系。然而,该描述仅用于证实在对本发明的实施例的描述中公开了支持如在权利要求中提出的本发明的特定元素。因此,即使在以下描述中,在对实施例的描述中提出的某一特定元素未作为特征之一被提出,这也并不表示特定元素与该特征不对应。相反地,即使将某一特定元素作为与特征之一相对应的元素提出,这也并不表示该元素与除了该特征外的任何其他特征不对应。 
根据本发明的第一实施例,提供了一种信号处理设备,其包含抽取装置(例如,图1中示出的节拍特征量抽取部分23)和通过对特征量的学习而预先产生的根音(root)判别装置(例如,图11中示出的根音判别部分62),该抽取装置用于在声音信号的预定范围内抽取指示十二平均律(12-tone equal temperament)的不同音的声音特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音,该根音判别装置用于根据特征量判别基准声音是否是根音。 
信号处理设备还可包含用于检测声音信号的每个节拍的位置的检测装置(例如,图1中示出的节拍检测部分21),抽取装置在声音信号的每个节拍范围内抽取特征量,根音判别装置在节拍范围内判别基准声音是否是根音。 
信号处理装置还可包含用于根据特征量至少判别和弦(chord)是大调(major)和弦还是小调(minor)和弦的和弦类型判别装置(例如,图11中示出的大调/小调判别部分63)。 
在此情况下,信号处理设备还可包含用于移位特征量从而将特征量的基准声音改变为另一声音的移位装置(例如,图11中示出的移位寄存器61),根音判别装置根据移位了的特征量判别基准声音(其是移位了的特征量的基准)是否是根音,和弦类型判别装置根据移位了的特征量至少判 别和弦是大调和弦还是小调和弦。 
或者,信号处理设备可配置使得根音判别装置输出用于判别基准声音是否是根音的第一辨别函数,和弦类型判别装置输出用于至少判别和弦是大调和弦还是小调和弦的第二辨别函数,信号处理设备还包含概率计算装置(例如,图11中示出的概率计算部分66),其用于根据第一辨别函数计算基准声音是根音的概率,并根据第二辨别函数计算和弦是大调和弦和是小调和弦的概率。 
根据本发明的第一实施例,提供了一种包含以下步骤的信号处理方法和程序:在声音信号的预定范围内抽取指示十二平均律的不同音的声音的特性的特征量,这些声音是以基准声音为基准以音阶顺序排列的,该基准声音是预定音的声音(例如,图12中在步骤S13的过程),以及借助于通过对特征量的学习而预先产生的根音判别装置,根据特征量判别基准声音是否是根音(例如,图21中在步骤S32的过程)。 
根据本发明的第二实施例,提供了一种信号处理设备,其包括抽取装置(例如,图29中的节拍特征量检测部分23)和学习装置(例如,图29中的和弦判别学习部分121),该抽取装置用于在声音信号的预定范围内抽取指示十二平均律的不同音的声音的特性的特征量,这些声音是以基准声音为基准以音阶顺序排列的,该基准声音是预定音的声音,该学习装置用于基于声音信号的范围内的特征量以及和弦,学习判别根据特征量的基准声音是否是根音。 
根据本发明的第二实施例,提供了一种包含以下步骤的信号处理方法和程序:在声音信号的预定范围内抽取指示十二平均律的不同音的声音的特性的特征量,这些声音是以基准声音为基准以音阶的顺序排列的,该基准声音是预定音的声音,(例如,图31中在步骤S103的过程),以及基于声音信号的范围内的特征量以及和弦,学习判别根据特征量的基准声音是否是根音(例如,图32中在步骤S134的过程)。 
参考图1,示出应用了本发明的信号处理设备的配置。所示出的信号处理设备11包括节拍检测部分21、中央去除部分22、节拍特征量抽取部分23以及和弦判别部分24。 
代表输入到信号处理设备11的一段音乐的立体声信号形式的声音信号被提供到节拍检测部分21、中央去除部分22和节拍特征量抽取部分23。 
节拍检测部分21检测一段音乐的声音信号的节拍。 
节拍是节拍点或韵律(meter),并且是一段音乐中听起来作为基本单元的基准。虽然术语节拍通常具有多个含义,但是在以下描述中,使用该术语来表示一段音乐中一个时间周期的基本单元开始的时间。 
将一段音乐中一个时间周期的基本单元开始的时间称作节拍位置,并将一段音乐中一个时间周期的基本单元的范围称作节拍范围。应注意,节拍的长度是节奏(tempo)。 
更具体地,节拍检测部分21从一段音乐的声音信号中检测一段音乐的声音信号的节拍位置。节拍检测部分21将表示声音信号的每个节拍的位置的节拍信息提供到节拍特征量抽取部分23。 
应注意,因为在声音信号中从一个节拍的位置到下一节拍的位置的间隔是节拍范围,所以如果检测到声音信号中的节拍位置,则可检测到节拍范围。 
中央去除部分22从立体声音信号形式的声音信号中去除中央分量,该中央分量是位于左和右之间的中央处的声音分量。中央去除部分22将去除了中央分量的声音信号(此后将这样的声音信号称作中央去除的声音信号)提供到节拍特征量抽取部分23。 
节拍特征量抽取部分23在预定范围内从声音信号抽取声音的特征量。具体地,节拍特征量抽取部分23在声音信号的预定范围内抽取如下的特征量:其分别表示以基准声音为基准以音阶顺序排列的十二平均律的不同音的声音的特性,该基准声音是预定音的声音。 
例如,节拍特征量抽取部分23从声音信号中抽取每个节拍的声音的特征量(即,下文中的每个节拍的和弦判别特征量)。具体地,节拍特征量抽取部分23基于节拍信息,在声音信号的各个节拍范围内,抽取分别表示十二平均律的音的声音的特性的特征量。更具体地,节拍特征量抽取部分23基于节拍信息,从中央去除的声音信号中,在声音信号的各个节 拍范围内,抽取分别表示十二平均律的音的声音的特性的特征量。节拍特征量抽取部分23还从未去除中央分量的原始声音信号中,在声音信号的节拍范围内,抽取指示十二平均律的声音的特性的特征量。 
节拍特征量抽取部分23将每个节拍的和弦判别特征量提供到和弦判别部分24,该和弦判别特征量包含从中央去除的声音信号中抽取的特征量和从未去除中央分量的原始声音信号中抽取的特征量。 
和弦判别部分24根据从节拍特征量抽取部分23提供到它的每个节拍的和弦判别特征量,判别每个节拍的和弦,然后输出和弦。换言之,和弦判别部分24根据每个节拍的和弦判别特征量来判别节拍范围内的和弦。 
应注意,如下文中所述,基于特征量,通过学习,预先产生和弦判别部分24。 
以这种方式,信号处理设备11从一段音乐的声音信号中判别每个节拍的和弦。 
例如,如在图2中可见,信号处理设备11从一段音乐的声音信号中判别出每个节拍的和弦:C和弦、降B和弦、A小调和弦、升G和弦、G和弦、C和弦、F和弦、D小调和弦、D和弦、G和弦等。例如,信号处理设备11判别每个节拍的和弦的和弦名称,并输出每个节拍的和弦的和弦名称。 
首先,通过在图3中可见的声音信号,给出对检测每个节拍即每个韵律的位置的节拍检测部分21的描述。参考图3,与“123412341234”每个数字相对应的垂直线指示声音信号的节拍位置。从与“123412341234”每个数字相对应的垂直线所指示的位置到下一垂直线的位置的范围指示声音信号的节拍范围。 
应注意,由两个相邻垂直线指示的长度例如指示四分音符的长度,并且与节奏相对应。同时,由与数字“1”相对应的垂直线指示的位置指示小节的开始。 
图4示出节拍检测部分21的配置示例。参考图4,节拍检测部分21包含起奏(attack)信息抽取部分41、基本节拍周期检测部分42、节奏确定部分43、音乐特征量抽取部分44和节奏校正部分45。 
起奏信息抽取部分41从指示一段音乐的波形的声音信号中抽取时间序列的起奏信息。在此,时间序列起奏信息是随时间将人感受到节拍的音量的变化转换得到的数据。如在图5中可见,用指示人感觉到的音量的音量感觉来表示起奏信息。 
例如,起奏信息抽取部分41在声音信号的每个时间点处抽取指示声音信号的声音级别的起奏信息。 
例如,如图6中所见,起奏信息抽取部分41将声音信号的声音划分为多个八度音,并确定在各个八度音中十二平均律的不同音的12个声音的每一个的能级(energy level),从而通过12音分析来确定分别指示每个八度音的12个声音的能级的时间-音数据。起奏信息抽取部分41在每个时间点处合成多个八度音的12个声音的声音能级,并将合成结果作为起奏信息使用。 
此外,例如,起奏信息抽取部分41将声音信号的声音划分为多个八度音的分量,并检测在各个八度音中十二平均律的不同音的12个声音的发声开始处的定时。例如,如果在时间方向上每个声音的能级的差值比阈值高,则起奏信息抽取部分41将该时间点确定为声音发声的开始。 
然后,起奏信息抽取部分41将1分配给声音发声的开始,并将0分配给任何其他的时间点,然后合成多个八度音上的12个声音的1和0的值。因此,起奏信息抽取部分41将合成结果确定为起奏信息。 
在图6中,圆形标记指示声音发声开始的位置。其中将1设定到声音发声的开始,并将0设定到任何其他位置,然后这些值被合成用以确定起奏信息,如果由多个八度音上的12个声音的相对较多个“1”来指示发声的开始,则起奏信息显示较高的值,然而如果由多个八度音上的12个声音的相对较少个“1”来指示发声的开始,则其显示较低的值。 
此外,起奏信息抽取部分41将声音信号的声音划分为多个八度音的分量,并确定在各个八度音内十二平均律的不同音的12个声音的每一个的能级中的变化。例如,将声音的能级中的变化计算为时间方向上声音的能量的差值。起奏信息抽取部分41合成在各个八度音内的12个声音的每个时间点处的声音的能级中的变化,然后将合成结果确定为起奏信息。 
起奏信息抽取部分41将如上所述的这样的起奏信息提供到基本节拍周期检测部分42和节奏校正部分45。 
基本节拍周期检测部分42检测作为和弦检测目标的一段音乐中的最基本的声音的长度。例如,一段音乐中最基本的声音是由四分音符、八分音符或十六分音符表示的声音。 
在以下的描述中,将一段音乐中最基本的声音的长度称作基本节拍周期。 
基本节拍周期检测部分42将时间序列形式的起奏信息与普通波形相比较,从而执行基本音高(音)抽取以确定基本节拍周期。 
例如,如在图7中可见,基本节拍周期检测部分42对时间序列信息形式的起奏信息执行短时傅立叶变换(short time Fourier transform)。作为对起奏信息进行短时傅里叶变换的结果,得到指示时间序列中每个频率处的能量强度的结果。 
具体地,当基本节拍周期检测部分42连续地移动窗口的位置时,基本节拍周期检测部分42对窗口中的起奏信息部分进行傅里叶变换,该窗口是相对于起奏信息而言与起奏信息的时间长度相比足够短的周期。然后,基本节拍周期检测部分42以时间序列排列傅里叶变换的结果,以确定指示时间序列中各个频率处的能量强度的结果。 
作为短时傅里叶变换的结果,具有比其他频率的能级更高的能级的频率被检测为作为基本节拍周期候选的周期。在图7的下部部分,浓密度指示能量强度。 
基本节拍周期检测部分42将最显著的一个周期检测为对起奏信息进行傅里叶变换的结果,即基本节拍周期。 
具体地,基本节拍周期检测部分42参考基本节拍可能性(其是预先准备的权重)和对起奏信息进行短时傅立叶变换的结果,从而将作为对起奏信息进行短时傅立叶变换的结果而被检测到的周期中具有较高基本节拍可能性的一个确定为基本节拍周期。 
更具体地,基本节拍周期检测部分42利用基本节拍可能性对作为对起奏信息进行短时傅立叶变换的结果而得到的各个频率的能级进行加权, 该基本节拍可能性即预先确定的频率方向上的权重,并将通过加权而获得的值之中显示出最高值的有关频率确定为基本节拍周期。 
通过使用基本节拍可能性,即频率方向上的权重,可防止将可能不是基本节拍周期的很低的频率或很高的频率的周期确定为基本节拍周期。 
基本节拍周期检测部分42将以这种方式抽取的基本节拍周期提供到节奏确定部分43。 
音乐特征量抽取部分44将预定的信号处理应用到声音信号,以从一段音乐中抽取预定数目的特征量(此后称作音乐特征量)。例如,音乐特征量抽取部分44将声音信号划分为多个八度音的分量,并确定在各个八度音中十二平均律的不同音的12个声音的信号。然后,音乐特征量抽取部分44将预定的信号处理应用到各个八度音中12个声音的信号,从而抽取音乐特征量。 
例如,音乐特征量抽取部分44将各个八度音中12个声音的信号的每一个的每单位时间上的峰值数目确定为音乐特征量。 
此外,音乐特征量抽取部分44例如将八度音中12个声音的信号的音乐间隔方向上的能量分布确定为音乐特性信号。 
此外,音乐特征量抽取部分44例如将各个八度音中12个声音的信号的低、中和高频区域之间的能量平衡确定为音乐特征量。 
此外,音乐特征量抽取部分44例如将各个八度音中12个声音的信号的立体声声音信号的左和右声道信号之间的相关性振幅确定为音乐特征量。 
音乐特征量抽取部分44将以这种方式抽取的音乐特征量提供到节奏确定部分43。 
通过预先学习音乐特征量和节奏来构造节奏确定部分43,并且节奏确定部分43根据从音乐特征量抽取部分44提供的音乐特征量来估计节奏。此后将通过估计得到的节奏称作估计节奏。 
节奏确定部分43基于估计节奏和从基本节拍周期检测部分42提供的基本节拍周期,从基本节拍周期的2X倍数(...,1/8拍、1/4拍、1/2拍、一拍、2拍、4拍、8拍...)中确定节奏。例如,将基本节拍周期乘以2或 1/2所获得的值确定为节奏,其中将基本节拍周期乘以2或1/2使得该值能够保持在估计节奏×21/2和估计节奏÷21/2之间的范围内,在此估计节奏是根据一段音乐的特征量通过回归分析的估计获得的。 
例如,如在图8中可见,节奏确定部分43将从基本节拍周期检测部分42提供的基本节拍周期与通过估计节奏÷21/2所确定的周期彼此比较。然后,如果基本节拍周期(在图8的上部部分,由空心圆圈指示的基本节拍周期)比通过估计节奏÷21/2所确定的周期长,则节奏确定部分43将基本节拍周期乘以1/2。 
此外,节奏确定部分43将从基本节拍周期检测部分42提供的基本节拍周期与通过估计节奏×21/2所确定的周期彼此比较。然后,如果基本节拍周期(在图8的下部部分,由空心圆圈指示的基本节拍周期)比通过估计节奏×21/2所确定的周期短,则节奏确定部分43将基本节拍周期乘以2。 
在乘以1/2或2,或者重复地乘以1/2或2直到结果值进入估计节奏×21/2和估计节奏÷21/2之间的范围内之后,节奏确定部分43将基本节拍周期(由图8中的实心圆圈指示的基本节拍周期)确定为节奏。 
应注意,在基本节拍周期维持在估计节奏×21/2和估计节奏÷21/2之间的范围内的情况下,节奏确定部分43将基本节拍周期本身确定为节奏。 
节奏确定部分43将以这种方式确定的节奏提供到节奏校正部分45。 
节奏校正部分45利用起奏信息精细地校正由节奏确定部分43确定的节奏。 
具体地,节奏校正部分45首先校正节拍的相位。 
具体地,如在图9中可见,节奏校正部分45对节奏周期中每个节拍范围内的整个一段音乐上的起奏信息求和,该节奏周期是根据起奏信息确定的。 
例如,节奏校正部分45将整个一段音乐上的节奏周期中所确定的第一节拍到最后节拍的各个范围内的起奏信息的第一样本相加。然后,节奏校正部分45将相加结果确定为节拍范围内的第一合计值。然后,节奏校正部分45将整个一段音乐上的节奏周期中所确定的第一节拍到最后节拍的各个范围内的起奏信息的第二样本相加。然后,节奏校正部分45将相 加结果确定为节拍范围内的第二合计值。 
类似地,节奏校正部分45将整个一段音乐上节奏周期中所确定的第一节拍到最后节拍的各个范围内的起奏信息的第三到最后的样本的每一个相加。于是,节奏校正部分45将相加结果分别确定为节拍范围内的第一到最后的合计值。 
然后,节奏校正部分45移动与起奏信息相关的节奏周期的相位,并类似地将每个节拍范围的整个一段音乐上的起奏信息相加。 
节奏校正部分45将与起奏信息相关的节奏周期的相位校正为如下的相位:利用该相位,可获得通过移动与起奏信息相关的节奏周期的相位而获得的显示出最高值的一个合计值。换言之,节奏校正部分45将节拍位置校正到获得最大合计值的与起奏信息相关的节奏周期的位置。 
此外,节奏校正部分45校正节奏。 
具体地,如在图10中可见,节奏校正部分45将节奏周期紧缩或拉伸预定的长度(其与周期相比足够短),然后将整个一段音乐上紧缩或拉伸后的周期中的每个节奏周期的起奏信息相加。 
仍在此情况下,节奏校正部分45将整个一段音乐上节奏周期中所确定的第一节拍到最后的节拍的各个范围内的起奏信息的第一到最后的样本相加。然后,节奏校正部分45将相加结果分别确定为节拍范围内第一到最后的合计值。 
节奏校正部分45将节奏周期紧缩或拉伸预定的长度,并将紧缩或拉伸后的节奏的每个周期的整个一段音乐上的起奏信息相加,从而确定节拍范围内的第一到最后的合计值。 
节奏校正部分45将节奏的周期校正为如下的长度:利用该长度,从原始长度以及紧缩和拉伸后的节奏的周期长度之中,可获得最大的合计值。 
节奏校正部分45在必要时重复这样的节拍相位校正和节奏校正,以确定最终的节奏。例如,节奏校正部分45重复节拍相位校正和节奏校正预定的次数,例如两次,以确定最终的节奏。 
节奏校正部分45输出表示最终确定的节奏的节拍信息。 
以这种方式,节拍检测部分21从声音信号中检测出每个节拍的位置,并输出表示声音信号中的节拍位置的节拍信息。 
现在,描述和弦判别部分24的配置。 
图11示出和弦判别部分24的配置示例。参考图11,所示出的和弦判别部分24包含移位寄存器61、根音判别部分62、大调/小调判别部分63、根音判别部分64、大调/小调判别部分65和概率计算部分66。 
移位寄存器61移位特征量,从而将特征量的基准声音改变为另一声音。这是因为从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量包含:从中央去除的声音信号中抽取的特征量,和从未去除中央分量的原始声音信号中抽取的特征量,以及以基准声音为基准以音阶顺序排列的指示不同音的声音的能级的从中央去除的声音信号中抽取的特征量,和从未去除中央分量的原始声音信号中抽取的特征量,这些基准声音是在声音信号的每个节拍的范围内与十二平均律的不同音的声音相关的预定音的声音。 
移位寄存器61将移位了的特征量提供到根音判别部分62、大调/小调判别部分63、根音判别部分64和大调/小调判别部分65,移位该特征量是为了将特征量的基准声音改变为不同的声音。 
根音判别部分62根据每个节拍的和弦判别特征量之中的从中央去除的声音信号中抽取的特征量,判别基准声音是否是根音。更具体地,根音判别部分62根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中的,从中央去除的声音信号中抽取的特征量,判别每个特征量的基准声音是否是根音。此外,根音判别部分62根据从中央去除的声音信号中抽取的并被移位寄存器61为了将每个基准声音改变为另一声音而移位的特征量,判别移位了的特征量的基准声音是否是根音。 
例如,根音判别部分62输出用于判别基准声音是否是根音的辨别函数。 
大调/小调判别部分63根据每个节拍的和弦判别特征量之中的从中央去除的声音信号中抽取的特征量,判别和弦是大调和弦还是小调和弦。更具体地,大调/小调判别部分63根据从节拍特征量抽取部分23提供的每个 节拍的和弦判别特征量之中的,从中央去除的声音信号中抽取的特征量,判别从中抽取特征量的节拍范围内的和弦是大调和弦还是小调和弦。此外,大调/小调判别部分63根据从中央去除的声音信号中抽取的并为了将每个基准声音改变为另一声音而被移位寄存器61移位了的特征量,判别从中抽取基准声音被移位之前的特征量的节拍范围内的和弦是大调和弦还是小调和弦。 
例如,大调/小调判别部分63输出用于判别和弦是大调和弦还是小调和弦的辨别函数。 
根音判别部分64根据每个节拍的和弦判别特征量之中的,从未去除中央分量的原始声音信号中抽取的特征量,判别基准声音是否是根音。更具体地,根音判别部分64根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中的,从未去除中央分量的原始声音信号中抽取的特征量,判别特征量的基准声音是否是根音。此外,根音判别部分64根据从未去除中央分量的原始声音信号中抽取的并且为了将每个基准声音改变为另一声音而移位了的特征量,判别移位了的特征量的基准声音是否是根音。 
例如,根音判别部分64输出用于辨别基准声音是否是根音的辨别函数。 
大调/小调判别部分65根据每个节拍的和弦判别征量之中的,从未去除中央分量的原始声音信号中抽取的特征量,判别和弦是大调和弦还是小调和弦。更具体地,大调/小调判别部分65根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中的,从未去除中央分量的原始声音信号中抽取的特征量,判别从中抽取特征量的节拍范围内的和弦是大调和弦还是小调和弦。此外,大调/小调判别部分65根据从未去除中央分量的原始声音信号中抽取的并为了将基准声音改变为另一声音而被移位了的特征量,判别从中抽取移位之前的特征量的节拍范围内的和弦是大调和弦还是小调和弦。 
例如,大调/小调判别部分65输出用于判别和弦是大调和弦还是小调和弦的辨别函数。 
概率计算部分66根据从根音判别部分62输出的辨别函数或从根音判别部分64输出的辨别函数,计算基准声音是根音的概率。此外,概率计算部分66根据从大调/小调判别部分63输出的辨别函数或从大调/小调判别部分65输出的辨别函数,计算和弦是大调和弦的概率以及和弦是小调和弦的概率。 
和弦判别部分24根据基准声音是根音的概率、和弦是大调和弦的概率及和弦是小调和弦的概率,判别最终的和弦,并输出判别出的最终和弦。 
现在,参考图12的流程图描述信号处理设备11的和弦判别过程。首先在步骤S11,节拍检测部分21检测节拍。具体地,在步骤S11,节拍检测部分21执行在上文中参考图3到图10所描述的过程,从而从声音信号即一段音乐的信号中检测声音信号中每个节拍的位置。然后,节拍检测部分21将表示声音信号中每个节拍的位置的节拍信息提供到节拍特征量抽取部分23。 
在步骤S12,中央去除部分22从立体声信号形式的声音信号中去除中央分量,并将中央去除的声音信号提供到节拍特征量抽取部分23,该中央分量是位于左和右之间的中央的声音分量。 
例如,如在图13中可见,在步骤S12,中央去除部分22确定立体声信号形式的声音信号内的一个声道的信号与另一声道的信号之间的差值,从而从声音信号中去除中央分量。更具体地,中央去除部分22从左声道信号中减去右声道信号,该左声道信号包含左分量L(位于左侧的声音分量)和中央分量C(位于声音信号内左和右声道之间的中央的声音分量),该右声道信号包含右分量R(位于右侧的声音分量)和中央分量C(位于左和右声道之间的中央的声音分量)。从而,中央去除部分22产生了根据从左分量L中减去右分量R的减法结果而形成的去除了中央分量C的中央去除的声音信号。 
此外,例如,在步骤S12,中央去除部分22将立体声信号形式的声音信号划分为预定数目的频带。然后,如果任一频带中的一个声道的信号相位与另一声道的信号相位之间的差值小于预先确定的阈值,则中央去除部 分22遮蔽(mask)该频带中的声音信号以从声音信号中去除中央分量。 
在此情况下,如在图14中可见,中央去除部分22包含DFT(离散傅立叶变换)滤波器组81、另一DFT滤波器组82、遮蔽部分83、另外的DFT滤波器组84和另外的DFT滤波器组85。 
DFT滤波器组81将离散傅立叶变换的处理应用到左声道信号以产生指示由DFT滤波器组81产生的多频带信号中多个频带频谱的多频带信号,该左声道信号包含作为位于左侧的声音分量的左分量L,和作为位于声音信号内的左和右声道之间的中央的声音分量的中央分量C。DFT滤波器组81将所产生的多频带信号提供到遮蔽部分83。 
DFT滤波器组82将离散傅立叶变换的处理应用到右声道信号以产生指示多个频带的频谱的多频带信号,该右声道信号包含作为位于右侧的声音分量的右分量R,和作为位于声音信号内的左和右声道之间的中央的声音分量的中央分量C。DFT滤波器组82将所产生的多频带信号提供到遮蔽部分83。 
遮蔽部分83针对每个频带,将从DFT滤波器组81提供的多频带信号的相位与从DFT滤波器组82提供的多频带信号的相位彼此比较。然后,如果从DFT滤波器组81提供的多频带信号的相位与从DFT滤波器组82提供的多频带信号的相位之间的差值小于预先确定的阈值,则遮蔽部分83遮蔽从DFT滤波器组81提供的多频带信号内的该频带中的信号,并遮蔽从DFT滤波器组82提供的多频带信号内的该频带中的信号。 
遮蔽部分83将从DFT滤波器组81提供的包含经遮蔽频带的信号的多频带信号提供到DFT滤波器组84。此外,遮蔽部分83将从DFT滤波器组82提供的包含经遮蔽频带的信号的多频带信号提供到DFT滤波器组85。 
DFT滤波器组84将离散傅立叶逆变换的处理应用到从遮蔽部分83提供的包含经遮蔽频带的信号的多频带信号,以产生去除了中央分量C并且仅包含左分量L的信号,该中央分量C是位于左和右声道之间的中央的声音分量,该左分量L是位于左侧的声音分量。DFT滤波器组84输出仅包含左分量L的信号。 
DFT滤波器组85将离散傅立叶逆变换的处理应用到从遮蔽部分83提 供的包含经遮蔽频带的信号的多频带信号,以产生去除了中央分量C并且仅包含右分量R的信号,该中央分量C是位于左和右声道之间的中央的声音分量,该右分量R是位于右侧的声音分量。DFT滤波器组85输出仅包含右分量R的信号。 
此外,例如,如在图15中可见,可根据声音信号的多个八度音中十二平均律的不同音的12个声音的能级,来确定中央去除的声音信号。 
具体的,可采取以下措施。具体地,在步骤S12,中央去除部分22将声音信号的左和右声道信号的每一个划分为多个八度音的分量,并确定各个八度音中十二平均律的不同音的12个声音的能级。然后,中央去除部分22对各个八度音中的每个声音执行如下的减法:从根据左声道信号确定的能级中减去根据右声道信号确定的能级。然后,中央去除部分22确定由该减法结果的绝对值组成的信号,并将所确定的信号确定为中央去除的声音信号。 
应注意,在此情况下,由于在抽取和弦时基本信号是重要的,所以使用如下的措施:对于包含基本信号的频带,不计算左声道信号与右声道信号之间的差值。 
声音信号常常包含在中央分量呈现较高能量的发音线(vocal line)或打击乐器的乐器声音分量。 
因此,为了能够以更高的准确度确定和弦,从立体声信号形式的声音信号中去除中央分量。 
将如下的中央去除的声音信号作为示例来给出以下示例,该中央去除的声音信号指示左声道信号和右声道信号之间的各个八度音中十二平均律的不同音的12个声音的能量的差值的绝对值。 
返回参考图12,在步骤S13,节拍特征量抽取部分23从原始声音信号中抽取每个节拍的和弦判别特征量。具体地,在步骤S13,节拍特征量抽取部分23从未去除中央分量的声音信号中抽取表示每个节拍范围内十二平均律的不同音的每个声音的特性的特征量。 
在步骤S14,节拍特征量抽取部分23从去除了中央分量的中央去除的声音信号中抽取每个节拍的和弦判别特征量。具体地,在步骤S14,节拍 特征量抽取部分23从去除了中央分量的声音信号中抽取表示每个节拍范围内十二平均律的不同音的声音的特性的特征量。 
在步骤S13和S14,节拍特征量抽取部分23基于由节拍检测部分21检测到的表示节拍位置的节拍信息,在每个节拍的范围内抽取去除了中央分量的声音信号和未去除中央分量的声音信号的特征量。 
如在图17中可见,在以下描述的步骤S15,在每个节拍的和弦判别过程中根据每个节拍范围内的特性判别和弦。在步骤S13和S14,抽取了将要用于在声音信号的每个节拍的范围内判别和弦的声音信号的每个节拍范围内的特征量。 
在此,将描述从声音信号的节拍范围中抽取特征量的细节,该声音信号可能是去除了中央分量的声音信号,或是未去除中央分量的声音信号。 
首先,节拍特征量抽取部分23将未去除中央分量的声音信号的右声道信号和左声道信号划分为多个八度音的分量。然后,节拍特征量抽取部分23确定每个八度音中十二平均律的不同音的12个声音的每一个的能级。例如,对于八度音的每个声音,节拍特征量抽取部分23将根据左声道信号确定的能级和根据右声道信号确定的能级相加。 
通过这些处理,以指示左声道信号和右声道信号之间的八度音中十二平均律的不同音的12个声音的能级的差值的绝对值的形式,未去除中央分量的声音信号被转换为类似于中央去除的声音信号的八度音中十二平均律的不同音的12个声音的能级。 
然后,如在图18中可见,节拍特征量抽取部分23基于由节拍信息指示的节拍位置,从去除了中央分量的声音信号和未去除中央分量的声音信号(这两种声音信号都是以八度音中十二平均律的不同音的12个声音的能级的形式)之一中仅裁切从预定节拍位置到下一节拍位置的节拍范围内的信号。 
节拍特征量抽取部分23按照时间平均由所裁切节拍范围内的信号指示的能级。因此,如在图18的右侧部分可见,八度音中十二平均律的不同音的12个声音的能级被确定。 
此外,如在图19中可见,节拍特征量抽取部分23对例如7个八度音 的十二平均律的不同音的12个声音的能级进行加权。在此情况下,节拍特征量抽取部分23使用预先确定的用于八度音中十二平均律的不同音的12个声音的各个声音的权重来对声音的能级进行加权。 
然后,例如,节拍特征量抽取部分23将7个独立八度音中的相同声音名称的声音的能级相加,以确定由各个声音名称指定的12个声音的能级。节拍特征量抽取部分23以声音名称的音阶顺序排列12个声音的能级,从而产生以音阶顺序排列的指示声音的能级的特征量。 
更具体地,例如,节拍特征量抽取部分23将经加权的能级之中的声音C1、C2、C3、C4、C5、C6和C7的能级相加,从而确定声音名称为C的声音的能级。此外,节拍特征量抽取部分23将经加权的能级之中的声音C#1、C#2、C#3、C#4、C#5、C#6和C#7的能级相加,从而确定声音名称为C#的声音的能级。 
类似地,节拍特征量抽取部分23将八度音01到07的声音D、D#、E、F、F#、G、G#、A、A#和B的能级相加,从而分别确定声音名称为D、D#、E、F、F#、G、G#、A、A#和B的声音的能级。 
节拍特征量抽取部分23产生如下的特征量:其是以音阶顺序排列的指示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据。 
以这种方式,节拍特征量抽取部分23产生声音信号的节拍范围内的特征量,该声音信号是去除了中央分量的声音信号和未去除中央分量的声音信号之一。 
应注意,节拍特征量抽取部分23产生将要被用于判别根音的特征量(在下文中称作原始信号根音判别特征量)和将要被用于判别和弦是大调和弦还是小调和弦的另一特征量(在下文中称作原始信号大调/小调判别特征量),作为在未去除中央分量的声音信号的节拍范围内的每个节拍的和弦判别特征量。 
在产生原始信号根音判别特征量中使用的对声音的能级进行加权的权重,与在产生原始信号大调/小调判别特征量中使用的对声音的能级进行加权的权重彼此不同。 
节拍特征量抽取部分23产生,作为在去除了中央分量的声音信号的节拍范围内的每个节拍的和弦判别特征量的,将要被用于判别根音的特征量(在下文中称作中央去除的根音判别特征量)和将要被用于判别和弦是大调和弦还是小调和弦的另一特征量(在下文中称作中央去除的大调/小调判别特征量)。 
在产生中央去除的根音判别特征量中使用的对声音的能级进行加权的权重,与在产生中央去除的大调/小调判别特征量中使用的对声音的能级进行加权的权重彼此不同。 
以这种方式,如在图20中可见,节拍特征量抽取部分23产生作为每个节拍的和弦判别特征量的原始信号根音判别特征量、原始信号大调/小调判别特征量、中央去除的根音判别特征量和中央去除的大调/小调判别特征量。 
返回参考图12,在步骤S15,和弦判别部分24执行每个节拍的和弦判别过程,然后和弦判别过程结束。 
图21示出每个节拍的和弦判别过程的示例的细节。 
参考图21,在步骤S31,和弦判别部分24从原始声音信号获取每个节拍的和弦判别特征量。具体地,和弦判别部分24获取从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量的原始信号根音判别特征量和原始信号大调/小调判别特征量。 
在步骤S32,根音判别部分64基于原始信号根音判别特征量执行根音判别。例如,在步骤S32,根音判别部分64根据原始信号根音判别特征量判别基准声音是否是根音,该原始信号根音判别特征量指示以基准声音为基准以音阶顺序排列的音的各个声音的能级,该基准声音是预定音的声音。在此情况下,根音判别部分64输出用于判别基准声音是否是根音的辨别函数。 
具体地,例如,在步骤S32,根音判别部分64根据原始信号根音判别特征量,判别是原始信号根音判别特征量的第一数据的声音的基准声音是否是根音,并输出辨别函数。 
在步骤S33,概率计算部分66将根音判别部分64的输出值转换为概 率。具体地,在步骤S33,概率计算部分66将来自根音判别部分64的用于判别基准声音是否是根音的辨别函数转换为概率。 
在步骤S34,大调/小调判别部分65基于原始信号大调/小调判别特征量,判别和弦是大调和弦还是小调和弦。例如,在步骤S34,大调/小调判别部分65根据原始声音大调/小调判别特征量判别和弦是大调和弦还是小调和弦,该原始声音大调/小调判别特征量指示以基准声音(其是预定音的声音)为基准以音阶顺序排列的音的声音的能级。在此情况下,大调/小调判别部分65输出用于辨别和弦是大调和弦还是小调和弦的辨别函数。 
在步骤S35,概率计算部分66将大调/小调判别部分65的输出值转换为概率。具体地,在步骤S35,概率计算部分66将大调/小调判别部分65的用于判别和弦是大调和弦还是小调和弦的辨别函数转换为概率。 
在步骤S36,和弦判别部分24根据在步骤S33确定的概率和在步骤S35确定的概率,确定当前根音是大调和弦的音以及是小调和弦的音的概率。 
在步骤S37,移位寄存器61移位每个节拍的和弦判别特征量。 
在步骤S38,和弦判别部分24判断从步骤S32到步骤S38的过程是否被重复了12次。如果其判断该过程尚未被执行12次,则处理返回步骤S32,从而利用移位了的每个节拍的和弦判别特征量,重复从步骤S32到步骤S38的过程。 
如图22所示,和弦判别部分24相继地将根音假设为从C到B以移位和弦判别特征量,从而所假设的根音数据到达顶部,然后相继地判别所假设的根音是大调和弦的音的概率,以及所假设的根音是小调和弦的音的概率。 
例如,和弦判别部分24使用原始信号根音判别特征量和原始信号大调/小调判别特征量(以按音阶顺序排列的表示12个不同声音名称的声音的能级的数据的形式),来判别和弦是大调和弦的概率,其中在预先确定的位置处排列的能级的声音是根音,该预先确定的位置例如是图22中用斜线指示的位置,并且和弦判别部分24判别和弦是小调和弦的概率,其中在该位置处排列的能级的声音是根音。 
例如,在如下的情况下:在原始信号根音判别特征量和原始信号大调/小调判别特征量中,表示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据以此顺序排列,和弦判别部分24确定由图22中斜线指示的排列在和弦判别特征量顶部的能级的声音C是大调和弦的概率,并确定声音C是小调和弦的概率。 
移位寄存器61将原始信号根音判别特征量和原始信号大调/小调判别特征量中以音阶顺序排列的表示12个不同声音名称的声音的能级的数据的排列进行循环地移位,即轮转地移位。例如,在如下的情况下,即在原始信号根音判别特征量和原始信号大调/小调判别特征量中,由图22中斜线指示的排列在顶部的能级的声音是C,并且指示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据以此顺序排列,移位寄存器61移位原始信号根音判别特征量和原始信号大调/小调判别特征量中指示能级的数据的排列,从而指示声音名称为C#、D、D#、E、F、F#、G、G#、A、A#、B和C的声音的能级的数据以此顺序排列。在此情况下,由图22中斜线指示的置于和弦判别特征量顶部的能级的声音是C#。 
和弦判别部分24根据移位了的原始信号根音判别特征量和原始信号大调/小调判别特征量,确定和弦是C#的大调和弦的概率及和弦是C#的小调和弦的概率,其中所述移位使得指示声音名称为C#、D、D#、E、F、F#、G、G#、A、A#、B和C的声音的能级的数据以此顺序排列。 
通过重复移位原始信号根音判别特征量和原始信号大调/小调判别特征量中的指示声音的能级的数据的排列的过程,来确定和弦是排列在预先确定的位置(例如在和弦判别特征量的顶部的能级的声音)的根音为基准声音的大调和弦的概率,并确定和弦是根音为基准声音的小调和弦的概率,和弦判别部分24确定和弦是D的大调和弦的概率及和弦是D的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率。 
现详细描述上述过程。具体地,在图21中所示的步骤S32中,根音判别部分64根据指示以基准声音(其是预定音的声音)为基准以音阶顺序排列的音的声音的能级的原始信号根音判别特征量,判别基准声音是否是 根音。然后,根音判别部分64输出用于判别基准声音是否是根音的辨别函数。 
在步骤S33,概率计算部分66将来自根音判别部分64的用于判别基准声音是否是根音的辨别函数转换为概率,以确定基准声音是根音的概率R。 
然后在步骤S34,大调/小调判别部分65根据指示以基准声音(其是预定音的声音)为基准以音阶顺序排列的音的声音的能级的原始信号大调/小调判别特征量,判别和弦是大调和弦还是小调和弦。然后,大调/小调判别部分65输出用于判别和弦是大调和弦还是小调和弦的辨别函数。 
在步骤S35,概率计算部分66将来自大调/小调判别部分65的用于判别和弦是大调和弦还是小调和弦的辨别函数转换为概率,以确定和弦是大调和弦的概率Maj及和弦是小调和弦的概率Min。 
和弦判别部分24将概率R与概率Maj相乘,以计算出和弦是根音为基准声音的大调和弦的概率。此外,和弦判别部分24将概率R与概率Min相乘,以计算出和弦是根音为基准声音的小调和弦的概率。 
应注意,如从示出用于判别和弦是大调和弦还是小调和弦的辨别函数的输出值的示例的图24中可见,因为辨别函数的输出值是不同于概率的连续值,所以在将辨别函数的输出值转换为概率时,概率计算部分66使用正态分布或GMM(高斯混合模型)来估计与辨别函数的输出值相对应的各个状态的概率。 
因此,如在图25中可见,和弦判别部分24根据原始信号根音判别特征量和原始信号大调/小调判别特征量,确定节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率。具体地,和弦判别部分24根据原始信号根音判别特征量和原始信号大调/小调判别特征量,确定和弦是C的大调和弦的概率、和弦是C的小调和弦的概率、和弦是C#的大调和弦的概率、和弦是C#的小调和弦的概率、和弦是D的大调和弦的概率、和弦是D的小调和弦的概率、和弦是D#的大调和弦的概率、和弦是D#的小调和弦的概率、和弦是E的大调和弦的概率、和弦是E的小调和弦的概率、和弦是 F的大调和弦的概率、和弦是F的小调和弦的概率、和弦是F#的大调和弦的概率、和弦是F#的小调和弦的概率、和弦是G的大调和弦的概率、和弦是G的小调和弦的概率、和弦是G#的大调和弦的概率、和弦是G#的小调和弦的概率、和弦是A的大调和弦的概率、和弦是A的小调和弦的概率、和弦是A#的大调和弦的概率、和弦是A#的小调和弦的概率、和弦是B的大调和弦的概率以及和弦是B的小调和弦的概率。 
返回参考图21,如果在步骤S38判断从步骤S32到S38的过程已经被重复了12次,则处理前进到步骤S39。 
在步骤S39,和弦判别部分24从去除了中央分量的声音信号中获取每个节拍的和弦判别特征量。具体地,和弦判别部分24获取从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量的中央去除的根音判别特征量和中央去除的大调/小调判别特征量。 
在步骤S40,根音判别部分62基于中央去除的根音判别特征量执行根音判别。例如,在步骤S40,根音判别部分62根据中央去除的根音判别特征量判别基准声音是否是根音,该中央去除的根音判别特征量指示以基准声音(其是预定音的声音)为基准以音阶顺序排列的音的各个声音的能级。在此情况下,根音判别部分62输出用于判别基准声音是否是根音的辨别函数。 
在步骤S41,概率计算部分66将根音判别部分62的输出值转换为概率。具体地,在步骤S41,概率计算部分66将来自根音判别部分62的用于判别基准声音是否是根音的辨别函数转换为概率。 
在步骤S42,大调/小调判别部分63基于中央去除的大调/小调判别特征量,判别和弦是大调和弦还是小调和弦。例如,在步骤S42,大调/小调判别部分63根据中央去除的大调/小调判别特征量判别和弦是大调和弦或者是小调和弦,该中央去除的大调/小调判别特征量指示以基准声音(其是预定音的声音)为基准以音阶顺序排列的音的声音的能级。在此情况下,大调/小调判别部分63输出用于辨别和弦是大调和弦还是小调和弦的辨别函数。 
在步骤S43,概率计算部分66将大调/小调判别部分63的输出值转换 为概率。具体地,在步骤S43,概率计算部分66将大调/小调判别部分63的用于判别和弦是大调和弦还是小调和弦的辨别函数转换为概率。 
在步骤S44,和弦判别部分24根据在步骤S41确定的概率及在步骤S43确定的概率,确定当前根音是大调和弦的音以及是小调和弦的音的概率。 
在步骤S45,移位寄存器61移位每个节拍的和弦判别特征量。 
在步骤S46,和弦判别部分24判断从步骤S40到步骤S45的过程是否被重复了12次。如果其判断该过程尚未被执行12次,则处理返回步骤S40,从而利用移位了的每个节拍的和弦判别特征量,重复从步骤S40到步骤S45的过程。 
如在图26中可见,通过从步骤S31到步骤S46的过程,与从根据原始信号根音判别特征量和原始信号大调/小调判别特征量确定的节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率相分别地,根据中央去除的根音判别特征量和中央去除的大调/小调判别特征量确定出节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率。 
以这种方式,通过根据各种特性确定的和弦概率的综合判别,确定了各个节拍范围内的和弦。 
返回参考图21,如果在步骤S46判断从步骤S40到S45的过程已经被重复了12次,则处理前进到步骤S47。 
在步骤S47,和弦判别部分24将具有最高概率的和弦判别为正确的和弦。具体地,和弦判别部分24从如下的概率之中将具有最高概率的和弦判别为正确的和弦:根据原始信号根音判别特征量和原始信号大调/小调判别特征量确定的,节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率,以及根据中央去除的根音判别特征量和中央去除的大调/小调判别特征量确定的,节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概 率。 
此外,和弦判别部分24将具有最高平均概率的和弦判别为正确的和弦。具体地,和弦判别部分24将具有如下两种概率之中的最高平均概率的和弦判别为正确的和弦:根据原始信号根音判别特征量和原始信号大调/小调判别特征量确定的、节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率,与根据中央去除的根音判别特征量和中央去除的大调/小调判别特征量确定的、从节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率。例如,对于从和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率的每一个概率,和弦判别部分24确定根据原始信号根音判别特征量和原始信号大调/小调判别特征量确定的概率与根据中央去除的根音判别特征量和中央去除的大调/小调判别特征量确定的概率的平均值。然后,和弦判别部分24将具有最高平均概率(其是从而被确定的平均值)的和弦判别为正确的和弦。 
在步骤S48,和弦判别部分24将正确的和弦作为每个节拍的和弦而输出。因此,处理结束。应注意,在此情况下,和弦判别部分24将和弦的和弦名称作为每个节拍的和弦而输出。 
以这种方式,可从声音信号中准确地确定一段音乐的和弦。 
或者,可将和弦判别部分24配置为其根据指示以音阶顺序排列的音的声音的能级的特征量来判别根音,然后判别和弦是大调和弦还是小调和弦,而无需确定概率。 
图27示出和弦判别部分24的另一配置示例,在此情况下,和弦判别部分24根据指示以音阶顺序排列的音的声音的能级的特征量判别根音,然后判别和弦是大调和弦还是小调和弦,而无需确定概率。 
和弦判别部分24包含正确和弦判别部分91。 
正确和弦判别部分91根据原始信号根音判别特征量和原始信号大调/小调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调 判别特征量来判别根音,并判别和弦是大调和弦还是小调和弦。例如,正确和弦判别部分91根据原始信号根音判别特征量和原始信号大调/小调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调判别特征量,直接输出指示正确和弦的索引(index)。 
具体地,正确和弦判别部分91根据原始信号根音判别特征量和原始信号大调/小调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调判别特征量,判别基准声音是否是根音,并判别和弦的类型,即至少判别和弦是大调和弦还是小调和弦。 
图28示出由正确和弦判别部分91形成的和弦判别部分24的每个节拍的和弦判别过程的另一示例的细节。 
在步骤S61,和弦判别部分24从节拍特征量抽取部分23获取和弦判别特征量,其包含每个节拍的原始信号根音判别特征量和原始信号大调/小调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调判别特征量。 
在步骤S62,和弦判别部分24的正确和弦判别部分91判别正确的和弦。例如,在步骤S62,正确和弦判别部分91从如下的和弦之中判别指示节拍范围正确的和弦的正确和弦:C的大调和弦、C的小调和弦、C#的大调和弦、C#的小调和弦、D的大调和弦、D的小调和弦、D#的大调和弦、D#的小调和弦、E的大调和弦、E的小调和弦、F的大调和弦、F的小调和弦、F#的大调和弦、F#的小调和弦、G的大调和弦、G的小调和弦、G#的大调和弦、G#的小调和弦、A的大调和弦、A的小调和弦、A#的大调和弦、A#的小调和弦、B的大调和弦、B的小调和弦。 
在步骤S63,和弦判别部分24将正确的和弦作为每个节拍的和弦而输出,然后处理结束。仍在此情况下,和弦判别部分24可将和弦的和弦名称作为每个节拍的和弦而输出。 
现在,描述用于产生和弦判别部分24的基于特征量的学习。 
图29示出信号处理设备101的配置示例,信号处理设备101执行用于产生和弦判别部分24的基于特征量的学习。 
参考图29,所示出的信号处理设备101包含与在上文中参考图1描述 的那些部分类似的节拍检测部分21、中央去除部分22和节拍特征量抽取部分23。信号处理设备101还包含和弦判别学习部分121。 
和弦判别学习部分121根据声音信号的预定范围内的每个节拍的和弦判别特征量以及和弦,学习根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量来判别基准声音是否是根音。 
例如,和弦判别学习部分121根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量,和由每个节拍的和弦判别特征量指示的节拍范围内的每个节拍的和弦,学习判别声音信号的节拍范围内的和弦。具体地,和弦判别学习部分121根据特征量和由特征量指示的声音信号的节拍范围内的正确和弦,学习判别由一个特征量到另一特征量指示的声音信号的节拍范围内的和弦。 
如在图30中可见,提供到和弦判别学习部分121的每个节拍的和弦指示由每个节拍的和弦判别特征量指示的节拍范围内的正确和弦。具体地,在此情况下,与12个节拍范围内的每个节拍的和弦判别特征量相对应的每个节拍的和弦指示12个节拍范围内的C、C、C、C、Am、Am、Am、Am、Em、Em、Em和Em的正确和弦。 
现在,参考图31的流程图描述和弦判别学习过程。参考图31,从步骤S101到S104,分别执行与图12的步骤S11到S14所执行的过程类似的过程。 
在步骤S105,和弦判别学习部分121执行每个节拍的和弦判别学习过程。然后,处理结束。 
在步骤S105的每个节拍的和弦判别学习过程包含,例如,学习判别基准声音是否是根音的过程,和学习判别和弦是大调和弦还是小调和弦的过程。 
图32示出学习判别基准声音是否是根音的每个节拍的和弦判别学习过程。参考图32,在步骤S121,和弦判别学习部分121从原始声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中,获取原始信号根音判别特征量。 
在步骤S122,和弦判别学习部分121移位所获取的每个节拍的和弦判别特征量即原始信号根音判别特征量,使得正确根音的数据到达顶部。 
例如,如在图33中可见,在如下的情况下,即在从节拍特征量抽取部分23提供的每个节拍的和弦判别特征量的原始信号根音判别特征量中,表示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据被以此顺序排列,并且由与每个节拍的和弦判别特征量相对应的每个节拍的和弦指示的正确和弦是D的情况下,和弦判别学习部分121将原始信号根音判别特征量移位两次,从而指示声音名称为D的声音的能级的数据被排列在原始信号根音判别特征量的顶部。 
具体地,和弦判别学习部分121移位指示原始信号根音判别特征量的能级的数据的排列,从而指示声音名称为C#、D、D#、E、F、F#、G、G#、A、A#、B和C的声音的能级的数据可以此顺序排列。此外,和弦判别学习部分121移位指示原始信号根音判别特征量的声音的能级的数据的排列,从而指示声音名称为D、D#、E、F、F#、G、G#、A、A#、B、C和C#的声音的能级的数据可以此顺序排列。 
返回参考图32,在步骤S123,和弦判别学习部分121将每个节拍的和弦判别特征量添加到正确的数据,所述每个节拍的和弦判别特征量即为使得正确根音的数据到达顶部而被移位了的原始信号根音判别特征量。 
在步骤S124,和弦判别学习部分121再次将移位了的每个节拍的和弦判别特征量移位一个声音的距离,并将每个节拍的和弦判别特征量即原始信号根音判别特征量添加到不正确的数据。 
在步骤S125,和弦判别学习部分121判断步骤S124的过程是否被重复了11次。因此,处理返回步骤S124,直到步骤S124的过程被重复了11次。 
如果在步骤S125判断步骤S124的过程被重复了11次,则处理前进到步骤S126。在步骤S126,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S121,从而对下一节拍重复在上文中描述的过程。 
如果在步骤S126其确定对所有节拍执行了处理,则处理前进到步骤 S127。在步骤S127,和弦判别学习部分121根据取决于原始信号根音判别特征量而产生的正确数据和不正确数据,通过机器学习,产生用于判别每个节拍的和弦判别特征量的第一数据的声音是否是根音的判别部分。 
例如,如在图34中可见,和弦判别学习部分121执行根音判别部分64的学习,使得其中第一数据的声音是根音并且是利用GP(遗传编程)、各种抑制分析或类似方法,基于原始信号根音判别特征量产生的正确数据时,响应于每个节拍的和弦判别特征量的输入而输出真(True),并且其中第一数据的声音是除根音外的任何音并且是基于原始信号根音判别特征量产生的不正确的数据时,响应于每个节拍的和弦判别特征量的输入而输出假(False)。 
在步骤S128,和弦判别学习部分121从去除了中央分量的声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中获取中央去除的根音判别特征量。 
在步骤S129,和弦判别学习部分121移位所获得的每个节拍的和弦判别特征量即中央去除的根音判别特征量,使得正确根音的数据到达顶部。 
例如,在如下的情况下,即在中央去除的根音判别特征量中,表示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据以此顺序排列,并且与每个节拍的和弦判别特征量相对应的每个节拍的正确和弦是E的情况下,和弦判别学习部分121将中央去除的根音判别特征量移位四次,从而指示声音名称为E的声音的能级的数据被排列在中央去除的根音判别特征量的顶部。 
在步骤S130,和弦判别学习部分121将每个节拍的和弦判别特征量添加到正确数据,该每个节拍的和弦判别特征量是为使得正确根音的数据到达顶部而被移位了的中央去除的根音判别特征量。 
在步骤S131,和弦判别学习部分121进一步将移位了的每个节拍的和弦判别特征量移位一个声音的距离,并添加每个节拍的和弦判别特征量即中央去除的根音判别特征量。 
在步骤S132,和弦判别学习部分121判断步骤S131的过程是否被重 复了11次,并且处理返回步骤S131,直到步骤S131的过程被重复了11次。 
如果在步骤S132判断步骤S131的过程被重复了11次,则处理前进到步骤S133,在步骤S133,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S128,从而对所有节拍重复了上述过程。 
如果在步骤S133其判断对所有节拍执行了处理,则处理前进到步骤S134。在步骤S134,和弦判别学习部分121从基于中央去除的根音判别特征量而产生的正确数据和不正确数据,通过机器学习,产生用于判别每个节拍的和弦判别特征量的第一数据的声音是否是根音的判别部分。 
例如,和弦判别学习部分121执行根音判别部分64的学习,使得其中第一数据的声音是根音并且是利用GP(遗传编程)、各种抑制分析或类似方法基于中央去除的根音判别特征量产生的正确数据时,响应于每个节拍的和弦判别特征量的输入而输出真,并且其中第一数据的声音是除根音外的任何音并且是基于中央去除的根音判别特征量产生的不正确的数据时,响应于每个节拍的和弦判别特征量的输入而输出假。 
现在,参考图35描述每个节拍的学习在大调和弦与小调和弦之间的和弦判别的和弦判别学习过程。在步骤S151,和弦判别学习部分121从原始声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中,获取原始信号大调/小调判别特征量。 
在步骤S152,和弦判别学习部分121移位所获取的每个节拍的和弦判别特征量即原始信号大调/小调判别特征量,使得正确根音到达顶部。 
在步骤S153,和弦判别学习部分121判别与每个节拍的和弦判别特征量相对应的节拍的正确和弦是否是大调和弦。如果其判断正确和弦是大调和弦,则处理前进到步骤S154。在步骤S154,和弦判别学习部分121将每个节拍的和弦判别特征量添加到为真的数据,该每个节拍的和弦判别特征量是为使得正确根音的数据到达顶部而被移位了的原始信号大调/小调判别特征量。然后,处理前进到步骤S156。 
如果在步骤S153判断出正确和弦不是大调和弦,即正确和弦是小调和弦,则处理前进到步骤S155。在步骤S155,和弦判别学习部分121将每个节拍的和弦判别特征量添加到为假的数据,该每个节拍的和弦判别特征量是为使得正确数据到达顶部而被移位了的原始信号大调/小调判别特征量。然后,处理前进到步骤S156。 
在步骤S156,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S151,使得对下一节拍重复上述过程。 
如果在步骤S156判断对所有节拍执行了处理,则处理前进到步骤S157。在步骤S157,和弦判别学习部分121从基于原始信号大调/小调判别特征量而产生的为真的数据和为假的数据,通过机器学习,产生用于判别和弦是大调和弦还是小调和弦的判别部分,在此情况下每个节拍的和弦判别特征量的第一数据的声音是根音。 
例如,如在图36中可见,和弦判别学习部分121执行大调/小调判别部分65的学习,使得响应于为真的数据的输入而输出真,其中第一数据的声音是根音并且是利用GP、各种递归分析或类似方法基于从大调和弦的节拍范围中抽取的原始信号大调/小调判别特征量而产生的,并且响应于为假的数据的输入而输出假,其中第一数据的声音是根音并且是基于从小调和弦的节拍范围中抽取的原始信号大调/小调判别特征量而产生的。 
返回参考图35,在步骤S158,和弦判别学习部分121从去除了中央分量的声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中获得中央去除的大调/小调判别特征量。 
在步骤S159,和弦判别学习部分121移位所获取的每个节拍的和弦判别特征量即中央去除的大调/小调判别特征量,使得正确根音的数据到达顶部。 
在步骤S160,和弦判别学习部分121判别与每个节拍的和弦判别特征量相对应的节拍的正确和弦是否是大调和弦。如果判断正确和弦是大调和弦,则处理前进到步骤S161。在步骤S161,和弦判别学习部分121将每 个节拍的和弦判别特征量添加到为真的数据,该每个节拍的和弦判别特征量是使得正确根音的数据到达顶部而被移位了的中央去除的大调/小调判别特征量。然后,处理前进到步骤S163。 
如果在步骤S160判断正确和弦不是大调和弦,即正确和弦是小调和弦,则处理前进到步骤S162。在步骤S162,和弦判别学习部分121将每个节拍的和弦判别特征量添加到为假的数据,该每个节拍的和弦判别特征量是使得正确根音的数据到达顶部而被移位了的中央去除的大调/小调判别特征量。然后,处理前进到步骤S163。 
在步骤S163,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S158,使得上述过程被重复。 
如果在步骤S163判断对所有节拍执行了处理,则处理前进到步骤S164。在步骤S164,和弦判别学习部分121从基于中央去除的大调/小调判别特征量而产生的为真的数据和为假的数据,通过机器学习,产生用于判别和弦是大调和弦还是小调和弦的判别部分,在此情况下每个节拍的和弦判别特征量的第一数据的声音是根音。然后,处理结束。 
例如,和弦判别学习部分121执行大调/小调判别部分63的学习,从而响应于为真的数据的输入而输出真,其中第一数据的声音是根音并且是利用GP、各种递归分析或类似方法基于从大调和弦的节拍范围中抽取的中央去除的大调/小调判别特征量而产生的,并且响应于为假的数据的输入而输出假,其中第一数据的声音是根音并且是基于从小调和弦的节拍范围中抽取的中央去除的大调/小调判别特征量而产生的。 
现在,描述用于产生正确和弦判别部分91的学习。 
图37示出学习判别第一数据的声音是否是根音以及判别和弦是大调和弦还是小调和弦的每一节拍的和弦判别学习过程。 
参考图37,首先在步骤S181,和弦判别学习部分121从原始声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中,获取原始信号根音判别特征量和原始信号大调/小调判别特征量。 
在步骤S182,和弦判别学习部分121将每个节拍的和弦判别特征量和正确和弦名称添加到教导数据(teacher data),所述每个节拍的和弦判别特征量是原始信号根音判别特征量和原始信号大调/小调判别特征量,所述正确和弦名称是由与每个节拍的和弦判别特征量相对应的每个节拍的和弦指示的正确和弦的名称。 
在步骤S183,和弦判别学习部分121移位每个节拍的和弦判别特征量(原始信号根音判别特征量和原始信号大调/小调判别特征量)和正确声音名称一个声音的距离,并将移位了的每个节拍的和弦判别特征量和正确和弦名称添加到教导数据。 
在步骤S184,和弦判别学习部分121判断在步骤S183的过程是否被重复了11次,并且处理返回步骤S183,直到在步骤S183的过程被重复了11次。 
如果在步骤S184判断步骤S183的过程被重复了11次,则处理前进到步骤S185。 
例如,如在图38中可见,在正确的和弦名称(由与每个节拍的和弦判别特征量相对应的每个节拍的和弦指示的正确和弦的名称)是D的情况下,原始信号根音判别特征量和原始信号大调/小调判别特征量(其中表示声音名称为C、C#、D、D#、E、F、F#、G、G#、A、A#和B的声音的能级的数据以此顺序排列)与正确的和弦名称D一起被添加到教导数据。 
然后,和弦判别学习部分121移位表示原始信号根音判别特征量和原始信号大调/小调判别特征量的声音的能级的数据,从而指示声音名称为C#、D、D#、E、F、F#、G、G#、A、A#、B和C的声音的能级的数据可以此顺序排列。此外,和弦判别学习部分121将正确的和弦名称移位到C#。和弦判别学习部分121将原始信号根音判别特征量和原始信号大调/小调判别特征量(其中指示声音名称为C#、D、D#、E、F、F#、G、G#、A、A#、B和C的声音的能级的数据被以此顺序排列)与正确的和弦名称C#一起添加到教导数据。 
此外,和弦判别学习部分121移位表示原始信号根音判别特征量和原始信号大调/小调判别特征量的声音的能级的数据,从而指示声音名称为 D、D#、E、F、F#、G、G#、A、A#、B、C和C#的声音的能级的数据可以此顺序排列。此外,和弦判别学习部分121将正确的和弦名称移位到D。和弦判别学习部分121将原始信号根音判别特征量和原始信号大调/小调判别特征量(其中指示声音名称为D、D#、E、F、F#、G、G#、A、A#、B、C和C#的声音的能级的数据被以此顺序排列)与正确的和弦名称D一起添加到教导数据。 
以这种方式,将移位指示原始信号根音判别特征量和原始信号大调/小调判别特征量中的声音的能级的数据的排列重复11次,从而将来自一个原始信号根音判别特征量的12个数据添加到教导数据,并将来自一个原始信号大调/小调判别特征量的12个数据添加到教导数据。 
返回参考图37,在步骤S185,和弦判别学习部分121从去除了中央分量的声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之中获取中央去除的根音判别特征量和中央去除的大调/小调判别特征量。 
在步骤S186,和弦判别学习部分121将每个节拍的和弦判别特征量及正确的和弦名称添加到教导数据,该每个节拍的和弦判别特征量即中央去除的根音判别特征量和中央去除的大调/小调判别特征量,该正确的和弦名称是由与每个节拍的和弦判别特征量相对应的每个节拍的和弦指示的正确和弦的名称。 
在步骤S187,和弦判别学习部分121将每个节拍的和弦判别特征量(中央去除的根音判别特征量和中央去除的大调/小调判别特征量)及正确的和弦名称移位一个声音的距离,并将移位了的每个节拍的和弦判别特征量及正确的和弦名称添加到教导数据。 
在步骤S188,和弦判别学习部分121判断在步骤S187的过程是否被重复了11次,并且处理返回步骤S187,直到在步骤S187的过程被重复了11次。 
如果在步骤S187判断在步骤S187的过程被重复了11次,则处理前进到步骤S189。 
在步骤S189,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其判断尚未对所有节拍执行处理,则处理返回步骤S181,从而对下一节拍重复上述过程。 
如果在步骤S189其判断对所有节拍执行了处理,则和弦判别学习部分121根据所产生的教导数据,通过机器学习,产生用于判别正确的和弦名称的判别部分。因此,处理结束。 
例如,在步骤S190,和弦判别学习部分121产生利用诸如k近邻(k-Nearest Neighbor)、SVM(Support Vector Machine,支持向量机)、朴素贝叶斯(Naive Bayes)、将具有最小距离的和弦判别为正确的和弦的马氏距离(Mahalanobis distance)或将具有最高概率的和弦判别为正确的和弦的GMM(Gaussian Mixture Model,高斯混合模型)之类的技术,根据所产生的教导数据判别正确的和弦名称的判别部分。 
以这种方式,和弦判别学习部分121执行正确和弦判别部分91的学习,用于基于如上所述产生的教导数据,根据原始信号根音判别特征量和原始信号大调/小调判别特征量以及中央去除的根音判别特征量和中央去除的大调/小调判别特征量,判别正确的和弦。 
在以如上所述的这种方式处理声音信号的情况下,可判别音乐的和弦。此外,在特征量指示以基准声音(预定音的声音)为基准以音阶顺序排列的声音(其是声音信号的预定范围内十二平均律的不同音的声音)的特性,并且通过基于特征量的学习而预先产生装置,根据特征量来判别基准声音是否是根音的情况下,从声音信号中可准确地判别一段音乐的和弦。 
此外,在通过使用声音信号的信号处理来执行学习的情况下,利用信号处理的结果,可从声音信号中判别一段音乐的和弦。此外,在特征量指示以基准声音(预定音的声音)为基准以音阶顺序排列的声音(其是声音信号的预定范围内十二平均律的不同音的声音)的特性,并且基于特征量和声音信号范围内的和弦学习根据特征量判别基准声音是否是根音的情况下,可以更高精度从声音信号中判别一段音乐的和弦的根音。 
应注意,信号处理设备11可以是处理声音信号的任何设备,并且例 如可将其配置为记录并再现声音信号的固定设备或便携式设备。 
此外,虽然在前述描述中,将表示基准声音的能级的数据排列在特征量的顶部,但是对此数据的排列并不局限于此,可将基准声音的能级的数据置于特征量中的任意位置,例如置于特征量的末尾或中部。 
应注意,虽然前述描述针对判别声音信号的节拍范围内的和弦,但和弦的范围并不局限于此,可判别声音信号的预定范围内的和弦,例如小节范围或预定节拍数的范围。在此情况下,抽取和弦的确定范围内的声音信号的特征量。 
虽然上述一系列的处理可由硬件执行,然而也可由软件来执行这些处理。在由软件执行一系列处理的情况下,将构成软件的程序从程序记录介质安装到被并入专用硬件的计算机,或例如通过安装各种程序可执行各种功能的通用个人计算机。 
图39示出根据程序执行在上文中描述的一系列处理的个人计算机的配置示例。参考图39,中央处理单元(CPU)201根据存储在只读存储器(ROM)202或存储部分208中的程序执行各种处理。将要被CPU 201执行的程序、数据等被适当地存储在随机存取存储器(RAM)203中。通过总线204将CPU 201、ROM 202和RAM 203彼此连接。 
通过总线204还将输入/输出接口205连接到CPU 201。将包含键盘、鼠标、麦克风等的输入部分206和包含显示单元、扬声器等的输出部分207等等连接到输入/输出接口205。CPU 201根据从输入部分206输入的指令执行各种处理。然后,CPU 201向输出部分207输出处理结果。 
由硬盘或类似物构成的存储部分208被连接到输入/输出接口205,并存储将要被CPU 201执行的程序和各种数据。通信部分209与通过诸如互联网及/或局域网之类的网络连接到它的外部设备通信。 
可通过通信部分209获得程序,并且可将获得的程序存储到存储部分208中。 
驱动器210连接到输入/输出接口205。当将诸如磁盘、光盘、磁光盘、半导体存储器或类似物之类的可移动介质211适当地载入驱动器210中时,驱动器210驱动可移动介质211。此后,驱动器210获得记录在可 移动介质211上的程序、数据等。在必要时将获得的程序或数据传送到并存储到存储部分208中。 
其上记录了将要被安装到计算机中并且将要被置于计算机的执行环境中的程序的程序记录介质可以是,如图39所示,例如由磁盘(包含软盘)、光盘(包含CD-ROM(压缩盘只读存储器)和DVD(数字多功能光盘),磁光盘)或半导体存储器构成的封装介质形式的可移动介质211。另外,可将程序记录介质形成为ROM 202、存储部分208中包含的硬盘或类似物,其中程序被临时地或永久地记录。在必要时,利用诸如局域网、互联网或数字卫星广播之类的有线或无线通信介质,通过作为诸如路由器和调制解调器之类的接口的通信部分209将程序存储到程序记录介质。 
应注意,在本说明书中,描述记录在程序记录介质中的程序的步骤可以按照所描述的时间顺序处理,但并非必需如此,并且包括被并行执行的或被个别执行的处理而无需按照时间顺序处理。 
虽然已经利用特定术语描述了本发明的优选实施例,然而此描述仅是出于说明性的目的,并且应理解可做出改变和变更而不会背离以下权利要求的精神或范围。 
本发明包含与2006年10月20日递交到日本专利局的日本专利申请JP 2006-286259相关的主题,通过引用将该日本专利申请的全部内容结合于此。 

Claims (11)

1.一种信号处理设备,包括:
抽取装置,用于抽取声音信号的中央去除声音信号的以及所述声音信号的未去除中央分量的原始声音信号的在预定范围内指示十二平均律的不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及
通过关于所述特征量的学习而预先产生的根音判别装置,用于根据从所述中央去除声音信号和所述原始声音信号中抽取的所述特征量来判别所述基准声音是否是根音。
2.根据权利要求1所述的信号处理设备,还包括用于从所述未去除中央分量的原始声音信号检测每个节拍位置的检测装置;
所述抽取装置抽取所述中央去除声音信号和所述未去除中央分量的原始声音信号的每个节拍的范围内的特征量;
所述根音判别装置在所述节拍范围内判别所述基准声音是否是根音。
3.根据权利要求1所述的信号处理设备,其中,所述抽取装置抽取指示所述十二平均律的不同音的声音的能级的特征量。
4.根据权利要求3所述的信号处理设备,其中,所述抽取装置抽取指示在所述十二平均律的每个不同音的多个八度音上合成的声音的能级的特征量。
5.根据权利要求1所述的信号处理设备,还包括和弦类型判别装置,所述和弦类型判别装置用于根据所述特征量至少判别和弦是大调和弦还是小调和弦。
6.根据权利要求5所述的信号处理设备,还包括移位装置,所述移位装置用于移位所述特征量从而将所述特征量的所述基准声音改变为另一声音;
所述根音判别装置根据所述移位了的特征量,判别作为所述移位了的特征量的基准的所述基准声音是否是根音;
所述和弦类型判别装置根据所述移位了的特征量,至少判别所述和弦是大调和弦还是小调和弦。
7.根据权利要求5所述的信号处理设备,其中
所述根音判别装置输出用于判别所述基准声音是否是根音的第一辨别函数;
所述和弦类型判别装置输出用于至少判别所述和弦是大调和弦还是小调和弦的第二辨别函数;
所述信号处理设备还包括
概率计算装置,用于根据所述第一辨别函数计算所述基准声音是根音的概率,并根据所述第二辨别函数计算所述和弦是大调和弦和小调和弦的概率。
8.根据权利要求1所述的信号处理设备,其中,所述根音判别装置根据所述特征量判别所述基准声音是否是根音,并至少判别关于所述和弦是大调和弦还是小调和弦的和弦类型。
9.一种信号处理方法,包括以下步骤:
抽取声音信号的中央去除声音信号的以及所述声音信号的未去除中央分量的原始声音信号的在预定范围内指示十二平均律的不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及
利用通过关于所述特征量的学习而预先产生的根音判别装置,根据从所述中央去除声音信号和所述原始声音信号中抽取的所述特征量判别所述基准声音是否是根音。
10.一种信号处理设备,包括:
抽取装置,用于抽取声音信号的中央去除声音信号的以及所述声音信号的未去除中央分量的原始声音信号的在预定范围内指示十二平均律的不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及
学习装置,用于基于所述中央去除声音信号和所述原始声音信号的所述范围内的和弦以及从所述中央去除声音信号和所述原始声音信号中抽取的所述特征量,学习根据所述特征量判别所述基准声音是否是根音。
11.一种信号处理方法,包括以下步骤:
抽取声音信号的中央去除声音信号的以及所述声音信号的未去除中央分量的原始声音信号的在预定范围内指示十二平均律的不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及
基于所述中央去除声音信号和所述原始声音信号的所述范围内的和弦以及从所述中央去除声音信号和所述原始声音信号中抽取的所述特征量,学习根据所述特征量判别所述基准声音是否是根音。
CN2007101628910A 2006-10-20 2007-10-22 信号处理设备及方法 Expired - Fee Related CN101165773B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006286259 2006-10-20
JP2006-286259 2006-10-20
JP2006286259A JP4214491B2 (ja) 2006-10-20 2006-10-20 信号処理装置および方法、プログラム、並びに記録媒体

Publications (2)

Publication Number Publication Date
CN101165773A CN101165773A (zh) 2008-04-23
CN101165773B true CN101165773B (zh) 2012-10-03

Family

ID=39004752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101628910A Expired - Fee Related CN101165773B (zh) 2006-10-20 2007-10-22 信号处理设备及方法

Country Status (5)

Country Link
US (1) US7649137B2 (zh)
EP (1) EP1914715B1 (zh)
JP (1) JP4214491B2 (zh)
KR (1) KR20080035963A (zh)
CN (1) CN101165773B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4315180B2 (ja) * 2006-10-20 2009-08-19 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
CA2740638A1 (en) * 2008-10-15 2010-04-22 Museeka S.A. Method for analyzing a digital music audio signal
JP5625235B2 (ja) 2008-11-21 2014-11-19 ソニー株式会社 情報処理装置、音声解析方法、及びプログラム
JP5463655B2 (ja) 2008-11-21 2014-04-09 ソニー株式会社 情報処理装置、音声解析方法、及びプログラム
JP5282548B2 (ja) * 2008-12-05 2013-09-04 ソニー株式会社 情報処理装置、音素材の切り出し方法、及びプログラム
US8878041B2 (en) * 2009-05-27 2014-11-04 Microsoft Corporation Detecting beat information using a diverse set of correlations
US7952012B2 (en) * 2009-07-20 2011-05-31 Apple Inc. Adjusting a variable tempo of an audio file independent of a global tempo using a digital audio workstation
EP2752991B1 (en) * 2013-01-02 2018-06-13 Samsung Electronics Co., Ltd Apparatus and method for processing audio signal
EP2772904B1 (en) * 2013-02-27 2017-03-29 Yamaha Corporation Apparatus and method for detecting music chords and generation of accompaniment.
JP6295794B2 (ja) * 2014-04-09 2018-03-20 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
US10395669B2 (en) 2016-02-25 2019-08-27 Sony Interactive Entertainment Inc. Voice analysis apparatus, voice analysis method, and program
JP6671245B2 (ja) * 2016-06-01 2020-03-25 株式会社Nttドコモ 識別装置
JP6500870B2 (ja) * 2016-09-28 2019-04-17 カシオ計算機株式会社 コード解析装置、方法、及びプログラム
CN108111909A (zh) * 2017-12-15 2018-06-01 广州市百果园信息技术有限公司 视频图像处理方法及计算机存储介质、终端
CN108322802A (zh) * 2017-12-29 2018-07-24 广州市百果园信息技术有限公司 视频图像的贴图处理方法、计算机可读存储介质及终端
CN108259983A (zh) * 2017-12-29 2018-07-06 广州市百果园信息技术有限公司 一种视频图像处理方法、计算机可读存储介质和终端
CN108259984A (zh) * 2017-12-29 2018-07-06 广州市百果园信息技术有限公司 视频图像处理方法、计算机可读存储介质及终端
CN108259925A (zh) * 2017-12-29 2018-07-06 广州市百果园信息技术有限公司 视频直播中的音乐礼物处理方法、存储介质及终端
JP2020170939A (ja) * 2019-04-03 2020-10-15 ヤマハ株式会社 音信号処理装置、及び音信号処理方法
CN112233662B (zh) * 2019-06-28 2024-06-07 百度在线网络技术(北京)有限公司 音频分析方法、装置、计算设备和存储介质
CN113593505A (zh) * 2020-04-30 2021-11-02 北京破壁者科技有限公司 一种语音处理方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6057502A (en) * 1999-03-30 2000-05-02 Yamaha Corporation Apparatus and method for recognizing musical chords

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634170B2 (ja) * 1986-09-29 1994-05-02 ヤマハ株式会社 電子楽器の自動伴奏装置
JP2560485B2 (ja) * 1989-08-21 1996-12-04 ヤマハ株式会社 電子楽器
JP3132038B2 (ja) * 1991-04-17 2001-02-05 カシオ計算機株式会社 和音判別装置及びそれを用いた自動伴奏装置
JP3156299B2 (ja) * 1991-10-05 2001-04-16 カシオ計算機株式会社 和音データ生成装置、伴奏音データ生成装置、および楽音発生装置
JPH0634170A (ja) 1992-07-22 1994-02-08 Hitachi Ltd 熱媒体分配システム及び熱媒体分配方法
FR2785438A1 (fr) * 1998-09-24 2000-05-05 Baron Rene Louis Procede et dispositif de generation musicale
JP2000293188A (ja) * 1999-04-12 2000-10-20 Alpine Electronics Inc 和音リアルタイム認識方法及び記憶媒体
JP3670562B2 (ja) * 2000-09-05 2005-07-13 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2002244677A (ja) * 2001-02-21 2002-08-30 Alpine Electronics Inc オーディオ再生装置
JP3908649B2 (ja) * 2002-11-14 2007-04-25 Necアクセステクニカ株式会社 環境同期制御システム、制御方法及びプログラム
JP4244133B2 (ja) * 2002-11-29 2009-03-25 パイオニア株式会社 楽曲データ作成装置及び方法
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム
DE102004028693B4 (de) 2004-06-14 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
JP2006202235A (ja) * 2005-01-24 2006-08-03 Nara Institute Of Science & Technology 経時的現象発生解析装置及び経時的現象発生解析方法
JP4767691B2 (ja) * 2005-07-19 2011-09-07 株式会社河合楽器製作所 テンポ検出装置、コード名検出装置及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6057502A (en) * 1999-03-30 2000-05-02 Yamaha Corporation Apparatus and method for recognizing musical chords

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FUJISHIMA T.《REALTIME CHORD RECOGNITION OF MUSICAL SOUND:A SYSTEM USING COMMONLISP MUSIC》.《INTENATIONAL COMPUTER MUSIC CONFERENCE》.1999,464-467. *
GOTO M ET AL.《REAL-TIME BEAT TRACKING FOR DRUMLESS AUDIO SIGNALS:CHORD CHANGE DETECTION FOR MUSICAL DECISIONS》.《SPPEECH COMMUNICATION》.1999,第27卷(第3-4期),311-335. *
第12栏第65-第14栏第58行,附图14-15.
第6栏第60-第7栏第45行,附图2

Also Published As

Publication number Publication date
CN101165773A (zh) 2008-04-23
JP2008102405A (ja) 2008-05-01
KR20080035963A (ko) 2008-04-24
JP4214491B2 (ja) 2009-01-28
US7649137B2 (en) 2010-01-19
US20080092722A1 (en) 2008-04-24
EP1914715A1 (en) 2008-04-23
EP1914715B1 (en) 2013-11-20

Similar Documents

Publication Publication Date Title
CN101165773B (zh) 信号处理设备及方法
JP4315180B2 (ja) 信号処理装置および方法、プログラム、並びに記録媒体
Lee et al. Acoustic chord transcription and key extraction from audio using key-dependent HMMs trained on synthesized audio
CN101123086B (zh) 节奏检测装置
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
EP1962274B1 (en) Sound analysis apparatus and programm
US7485797B2 (en) Chord-name detection apparatus and chord-name detection program
JP4465626B2 (ja) 情報処理装置および方法、並びにプログラム
JP6759560B2 (ja) 調律推定装置及び調律推定方法
US9378719B2 (en) Technique for analyzing rhythm structure of music audio data
WO2002047064A1 (en) Method for analyzing music using sounds of instruments
WO2009001202A1 (en) Music similarity systems and methods using descriptors
Koduri et al. A survey of raaga recognition techniques and improvements to the state-of-the-art
JP2002116754A (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
Lerch Software-based extraction of objective parameters from music performances
JP2013140234A (ja) 音響処理装置
WO2007119221A2 (en) Method and apparatus for extracting musical score from a musical signal
JP5153517B2 (ja) コード名検出装置及びコード名検出用コンピュータ・プログラム
Dittmar et al. A toolbox for automatic transcription of polyphonic music
Chuan et al. The KUSC classical music dataset for audio key finding
Sentürk et al. An approach for linking score and audio recordings in makam music of Turkey
Sharma et al. Design and development of an Indian classical vocal training tool
Müller et al. Music signal processing
Gouws The Automatic Transcription of Music to Determine its Chord Progression
Sauer Design and Evaluation of a Simple Chord Detection Algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

Termination date: 20151022

EXPY Termination of patent right or utility model