CN1136536C - 音调检测装置 - Google Patents
音调检测装置 Download PDFInfo
- Publication number
- CN1136536C CN1136536C CNB971004285A CN97100428A CN1136536C CN 1136536 C CN1136536 C CN 1136536C CN B971004285 A CNB971004285 A CN B971004285A CN 97100428 A CN97100428 A CN 97100428A CN 1136536 C CN1136536 C CN 1136536C
- Authority
- CN
- China
- Prior art keywords
- zero crossings
- signal
- pitch period
- interval
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 claims description 84
- 238000005070 sampling Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 4
- 230000005055 memory storage Effects 0.000 claims 2
- 238000011067 equilibration Methods 0.000 claims 1
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 52
- 230000008569 process Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 23
- 238000001514 detection method Methods 0.000 description 19
- 238000012360 testing method Methods 0.000 description 18
- 238000011156 evaluation Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 241001269238 Data Species 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 206010010774 Constipation Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Electrophonic Musical Instruments (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
音调检测装置在输入数字信号上执行附加抽样操作以便将抽样频率乘以一定的倍数。从而该装置产生相乘后的频率的数字声音信号,根据它们生成二进制信号。接着,该装置测定声音波形与零电平线交叉的零点交叉间隔,在零点交叉间隔上执行计算以顺序地产生波形周期之间的对应程度,通过从计算的对应程度中为数字‘n’选择产生最高对应程度的一定整数来确定音调周期。
Description
发明领域
本发明涉及检测声音波形的音调周期或音调频率的音调检测装置。
发明背景
已知音调周期(或者调频率)是确定声音波形的参数之一。检测声音波形的音调周期的技术通常用在声音分析/合成系统、声音编码系统之类的领域中。近来,某些卡拉OK系统采用检测由响应自动播放的曲调唱歌的歌手(或人)生成的声音的音调周期的功能。因而,采用上述功能的卡拉OK系统根据例如百分制来用一定的分数评价某人演唱的歌曲。
传统上已知下述方法是检测声音的音调周期的方法。
(1)零点交叉法
这一方法是基于声音波形接近正弦波,其声平相对于时间与一条零声平线相关联地改变的假设。从而,声音波形重复其声平的单调变化如下:
声音波形的声平在向上方向上从负侧到正侧通过(或交叉)零声平线。然后,声平从正侧到负侧在向下方向上通过零声平线。此后,声平又从负侧到正侧在向上方向上通过零声平线。
从而,音调周期是由声音波形的声平在同一方向上通过零声平线的点之间的时间间隔给出的。零点交叉法是根据上述概念作出的,从而测定2个零交叉点之间的时间间隔来检测音调周期。此外,有可能提供一种与上述方法相似的另一方法,在其中测定与极大值或极小值重合的声音波形的瞬时值的定时之间的时间间隔来检测音调周期。
(2)自相关法
首先,将声音波形提交给一定抽样周期的抽样操作,以便产生时间序列样本X(1),X(2),…。这样,自相关法利用上述时间序列样本来进行由下式表示的自相关函数R(r)的计算:
R(r)=1/N·∑{x(n)·x(n+r)}
其中∑表示相对于从‘1’至‘N·r’的一定范围的‘n’计算包含在括号‘{ }’中的值之和的算符。
从而,自相关法根据上述计算结果检测音调周期。即,以各种方式改变‘r’的值,而相对于‘r’的各值计算自相关函数R(r);从而根据给出自相关函数‘R(r)’的极大值的某一‘r’值计算声音波形的音调周期。这里,当自相关性程度成为极大时,为自相关函数‘R(r)’计算极大值。
由于从相对低的成本高速检测音调周期,上述零点交叉法是优越的。然而,人类声音中通常包含大量的泛音成分。因此存在着零点交叉法不能精确检测音调周期的问题。反之,自相关法能从一定程度的精确性检测音调周期。然而,自相关法需要大量的计算,因而需要多时间来检测音调周期。此外,实现自相关法需要相对高的成本。
发明内容
本发明的目的为提供一种能够高速精确地检测音调周期并能以低成本构造的音调检测装置。
本发明的音调检测装置接收具有抽样频率且与人类声音对应的输入数字信号。在输入数字信号上执行附加抽样操作以便用一个一定的倍数(诸如4)去乘抽样频率。从而,本装置产生倍频数字声音信号,根据它来生成二进制信号。这里,数字声音信号显示用原来的样本及插入的样本构成的声音波形。只在其电平在时间推移上变化的声音波形通过零电平附近的屏蔽区时,该二进制信号才反转,而在声音波形在屏蔽区内移动期间,该二进制信号保持不变。
接着,本装置测定声音波形通过零电平线的零点交叉间隔,其中测定的零点交叉间隔是相继地布置在时轴上的。基于音调周期对应于‘2n’个零点交叉间隔(‘n’为一整数)之和的假设,本装置在零点交叉间隔上执行计算来顺序地生成波形周期之间的对应程度,其中各对应程度是相对于声音波形中互相邻接放置的‘m’个波形周期(‘m’为诸如‘3’与‘4’等整数)计算的。从而,本装置通过选择一定的整数作为数字‘n’来取得计算出的对应程度中的最高对应程度,以确定音调周期。
其中如果数字‘n’大于一个预定的数,音调计算装置便减小数字‘m’来确定音调周期。
附图说明
在参照附图阅读了以下描述时,本发明的上述及其它目的将变得更全面地清楚,附图中:
图1为展示包含按照本发明的一个实施例设计的音调检测装置的功能的卡拉OK系统的配置的选择部分的框图;
图2为展示图1中所示的四倍附加抽样部件的一部分的电路图;
图3为展示表明图1中所示的二进制部件的选择部分的电路配置的一个实例的框图;
图4为展示能用作图3的电路配置的一部分的电路配置的一个实例的框图;
图5为展示对应于图1的框图的选择部分的详细配置的框图,它包含一个计时器与一个RAM以及它们的控制系统;
图6 A示出为说明图1中所示的四倍附加抽样部件的操作而提供的正弦波式信号波形;
图6B示出表示只根据原来的样本生成的二进制信号的波形;
图6C示出表示根据原来的样本及由四倍附加抽样操作产生的插入样本生成的二进制信号的波形;
图7A示出为说明图3中所示的二进制部件的操作而提供的并且是根据四倍附加抽样部件的输出信号形成的正弦波式信号波形;
图7B示出图3中所示的S/H部件的状态过渡,它们是在样本状态(S)与保持状态(H)之间发生的;
图7C示出表示S/H部件的输出的波形;及
图7D示出表示从图3中所示的比较器输出的二进制信号的波形;
图8为展示由图5中所示的写控制部件执行的写控制例程的流程图;
图9A示出为说明由图1中所示的音调计算部件执行的音调周期计算而提供的并且是根据输入到二进制部件的信号形成的波形;
图9B示出表示根据假设1计算的音调周期的时序;
图9C示出表示根据假设2计算的音调周期的时序;
图9D示出表示根据假设3计算的音调周期的时序;
图9E示出表示根据假设4计算的音调周期的时序;
图10为展示计算音调周期的过程的流程图;
图11为展示计算再生性因子的过程的流程图;
图12为展示计算音调周期的过程的流程图;
图13为展示测定音调周期的误差的测量结果的曲线;
图14为展示测定音调周期的检测延时的测量结果的曲线;
图15为展示若干次执行音调周期的求平均值及抽取误差之间的关系的曲线;以及
图16为展示音调周期的抽取精度与若干前面的波形周期之间的关系的图。
具体实施方式
下面参照附图给出对于本发明的一个实施例的音调检测装置的详细说明。
〔A〕实施例的配置
图1为展示包含按照本发明的一个实施例设计的音调检测装置的功能的卡拉OK系统的配置的一部分的框图。具体地,图1的框图涉及在卡拉OK的总体的配置内关于为歌手的一首歌记分的配置。其中,数字音乐信号是记录在紧致盘(即CD)1上的。从CD1上读出数字音乐信号并顺序地与具有抽样频率fs(fs=44.1KHz)的时钟信号同步地再生。口声抽取部件2从CD1再生的数字音乐信号中抽取对应于口声的信号。此后,这些信号称作数字口声标准信号,简称“数字标准信号”。例如,利用带通滤波器执行抽取处理从数字音乐信号中抽取包含声音频带的一定频带,从而得到数字标准信号。如果该系统能处理只记录有口声的记录媒体,则从这种记录媒体再生的数字音乐信号便能直接用作数字标准信号。接着,麦克风3拾取对应于歌手根据CD1再生的音乐演唱的一首歌的声音。从而,麦克风3输出模拟声音信号。模数转换器(简称A/D转换器)4与具有与CD1的再生同样的抽样频率fs(fs=44.1KHz)的上述时钟信号同步地在麦克风3输出的模拟声音信号上执行抽样操作。从而模拟声音信号转换成数字声音信号。
DC消除部件5接收顺序地输送给它的数字标准信号及数字声音信号。从而,DC消除部件5执行DC消除处理来消除诸如属于对应于从0Hz与50Hz之间的频率范围的低频带的DC成分。从而,数字声音信号与数字标准信号在DC消除部件5中遭受一频带消除处理。因此,DC消除部件5将消除了DC的数字声音信号与消除了DC的数字标准信号输出到低通滤波器(即LPF)6。低通滤波器6从消除了DC的数字声音信号与消除了DC的数字标准信号中消除高频成分。例如,高频成分对应于频率高于500KHz的成分。归功于DC消除部件5与LPF6的上述操作,分别从数字声音信号与数字标准信号中选择了只属于从50Hz到500Hz范围的频带的频率成分。从而,LPF6输出这一选择的频率范围的数字声音信号及这一选择的频率范围的数字标准信号。
四倍附加抽样部件7在LPF6输出的数字声音信号及数字标准信号上执行插入计算,其中这两种信号都具有抽样频率fs(fs=44.1KHz)。结果上述信号被转换成具有四倍于抽样频率的四倍抽样频率的信号。图2示出在数字声音信号与数字标准信号(此后简称输入数字信号)之一上执行四倍附加抽样部件7的处理所需的电路配置的一个实例。图2中,锁存器71根据时钟脉冲输入与保持输送给它的输入数字信号,时钟脉冲对应于抽样频率fs。全部用同一数字72表示的延时电路以级联方式连接在锁存器71后面。各延时电路实现一个时钟的延时。全体延时电路72都接收具有四倍于抽样频率fs的四倍抽样频率的时钟脉冲。从而,保持在锁存器71中的输入数字信号被延时电路72顺序地移位以生成延时信号。这里,第一延时信号在输入数字信号后面延时一个时钟周期;而第一延时信号后面的各延时信号在其前面的延时信号后面延时一个时钟周期。图2的电路配置中还包含乘法器73与加法器74,通过它们用一串插入系数在锁存器71的输出及延时电路72的输出上执行卷积内插计算。按照图2的上述电路配置,与具有四倍抽样频率的时钟脉冲同步地执行内插计算。从而,从图2中的最后一级加法器74顺序地输出表示内插计算结果的数字信号。
设置了四倍抽样部件7来提高获取音调周期的精度。本系统是设计成相对于数字声音信号与数字标准信号零点交叉点之间的时间间隔的,从而对它们中的每一个得到一个音调周期。为了提高音调周期的测量精度,有必要提高位于时轴上的零点交叉点的位置的检测精度。为此,设置了四倍附加抽样部件7来将表示数字声音信号与数字标准信号的样本的时间密度提高到四倍,从而同样提高了零点交叉点的位置的检测精度。本实施例采用‘曲线内插’来执行附加抽样。然而如果成本受限制,也可能采用具有有限精度的‘线性内插’。
二进制部件8将四倍附加抽样部件7输出的数字声音信号与数字标准信号转换成二进制数字。基本上,二进制部件8参照零电平在输入给它的输入数字信号上执行正/负判定。从而,当输入数字信号为正时,二进制部件8输出数字‘1’而输入数字信号为负时二进制部件8输出数字‘0’。换言之,从二进制部件8输出的二进制信号每当输入数字信号的电平通过零电平时在数字‘0’与‘1’之间变换。在本实施例中,相对于零电平设定了一个±Δ的屏蔽区以便对付输入数字信号的电平中的微小波动。从而,尽管输入数字信号的电平在±Δ的屏蔽区内出现微小的波动,二进制信号的数字并不变换。
图3示出在数字声音信号与数字标准信号(此后简称输入数字信号)之一上执行二进制部件8的处理所需的电路配置的一个实例。图3中,绝对值检测部件81检测输入数字信号的绝对值。比较器82将输入数字信号的绝对值与一个预定值Δ比较,当绝对值超过预定值Δ时比较器82输出数字‘1’,而当绝对值不超过预定值Δ时,比较器82输出数字‘0’。抽样与保持(S/H)部件83响应比较器82的输出在输入数字信号上执行抽样与保持操作。具体地,在比较器82的输出为‘1’期间将S/H部件83设定为抽样状态,使得S/H部件83将输入数字信号直接传送给比较器84。反之,在比较器82的输出为‘0’期间,将S/H部件83设定为保持状态,使得S/H部件83保持刚在比较器82的输出从‘1’改变到‘0’之前输入给它的输入数字信号。比较器84在S/H部件83的输出上执行正/负判定,以便生成二进制信号。当S/H部件83的输出为正时将二进制2信号设置为数字‘1’,而当S/H部件83的输出为负时将二进制信号设置为数字‘0’。
按照图3的上述电路配置,如果S/H部件83的电平存在于±Δ的屏蔽区外面,输入数字信号便直接通过它。反之,如果输入数字信号进入设置在零电平附近的±Δ的屏蔽区中,便将S/H部件83置于保持状态中,在其中S/H部件83便保持刚在输入数字信号进入屏蔽区之前出现的输入数字信号的值。在连续执行这一保持操作期间,不转变比较器84的输出二进制信号。因此,如果输入数字信号变化通过零电平周围的±Δ的屏蔽区,则在输入数字信号完全穿过屏蔽区的定时上转变二进制信号。在一些情况中,输入数字信号进入零电平周围的±Δ的屏蔽区中,但是输入数字信号并不穿过屏蔽区而在屏蔽区内部上下变化。在这一情况中,即使输入数字信号通过屏蔽区内的零电平,S/H部件83的输出仍保持在输入数字信号刚进入屏蔽区之前而并不通过零电平时出现的输入数字信号的一定的值上;因此,并不出现二进制信号的转变事件。
偶而,图3中与框84相连的框81至83可用图4中所示的框85至89替代。图4中,各比较器85与86将输入数字信号与一定的基准电平比较。从而,如果输入数字信号高于基准电平,各比较器输出数字‘1’,但如果输入数字信号低于基准电平,各比较器输入数字‘0’。具体地,基准电平+Δ作用在比较器85上,而基准电平-Δ则作用在比较器86上。锁存器87保持输入数字信号。选择器88有选择地输入输出数字信号与锁存器87的输出中之一。控制部件89根据比较器85与86的输出控制锁存器87与选择器88。下面对两种情况(a)与(b)描述控制部件89的控制细节如下:
(a)第一情况中比较器85与86的输出都为‘1’或都为‘0’。
第一情况对应于输入数字信号存在于零电平周围的±Δ的屏蔽区外面的情况。在这一情况中,控制部件89进行控制将锁存器87置于抽样状态中而控制选择器88输出该输入数字信号。
(b)第二情况中比较器85的输出为‘0’而比较器86的输出为‘1’。
第二情况对应于输入数字信号存在于零电平周围的±Δ的屏蔽区内部的情况。在这一情况中,控制部件89在输入数字信号进入屏蔽区的定时上进行控制将锁存器87置于保持状态中,从而控制部件89控制选择器88选择锁存器87的输出。
计时器9测定相对于从二进制部件8输出的二进制信号的转换呈件的时间间隔,这些信号分别对应于数字声音信号与数字标准信号。即,计时器9测定数字信号的零点交叉点之间的时间间隔。然后RAM10存储计时器9产生的测量结果。
图5为展示图1的系统的选择部分的框图,其中包含计时器9与RAM10以及它们的控制系统。图5的框图示出在对应于数字声音信号及数字标准信号的二进制信号上执行测量处理所需的电路配置。图5中,设置了由延时电路91与异或电路92组成的区分电路90以便在二进制部件8输出的二进制信号上执行区分。区分电路90每当在二进制信号上出现转变事件时便输出一个脉冲。区分电路90输出的一个脉冲复位计时器9。计时器9复位之后计数恒定频率为4fs的时钟脉冲的数目直到它被再一次复位为止。
将计时器9的计数值提供给锁存器93。当接收到区分电路90输出的脉冲时,锁存器93输入与保持计时器9刚好在其复位之前输出的计数值。保持在锁存器93中的这一计数值表示具有频率4fs的时钟脉冲数,这一数目的时钟脉冲出现在检测到二进制信号的前一次转变事件的前一次检测定时与检测到二进制信号的当前转变事件的当前检测定时之间。因此,可以说这一计数值表示零点交叉点之间的时间间隔。此后,将保持在锁存器93中的上述计数值称作‘零点交叉间隔数据’。
写控制部件94每当接收到区分电路90输出的一个脉冲时便从锁存器93中读出零点交叉间隔数据。从而,写控制部件94顺序地读出零点交叉间隔数据。如果零点交叉间隔数据等于或大于一个预定的值,或如果计时器9的计数值大时,便在写入RAM10中之前限制零点交叉间隔数据。反之,如果零点交叉间隔数据小于预定值,或如果计时器9的计数值小时,便抛弃该零点交叉间隔数据而不写入RAM10中。简言之,只是有选择地将一定范围的零点交叉间隔数据写入RAM10中。利用这种有选择地写入零点交叉间隔数据的方法来避免计算音调周期中出现误差。因为,如果将不足以表示声音信号的零点交叉点之间的时间间隔的数据作为零点交叉间隔数据错误地用在计算中,便会出现误差,从而计算出‘错误’的音调周期。
音调计算部件11参照累积在RAM10中的零点交叉间隔数据,以便分别对数字声音信号与数字标准信号计算音调周期。
下面假设一种简单的情况,其中数字声音信号(或数安标准信号)的电平变化是由在零电平线上下形成的正弦波表示的。在正弦波的一个周期中,数字声音信号的电平在其起始点及结束点上与零电平线交叉而形成两个零点交叉点。此外,数字声音信号的电平在上述两个零点交叉点之间的中点上又一次与零电平线交叉。因此,可以通过将接连产生的两个零点交叉间隔数据相加来计算音调周期。
通常,表示与人类声音对应的声音波形的数字声音信号中包量大量泛音成分。从而在某一情况中,在一个周期的声音波形(即波形周期)的起始点与结束点之间存在三个或更多的零点交叉点。在这一情况中,只将两个接连的零点交叉间隔数据相加不能得出‘正确的’音调周期。
因此,本实施例采用一个音调周期具有对应于多个零点交叉间隔数据之和的时间长度的假设,其数目由‘2n’表示,其中‘n’为不小于‘1’的整数。有时,我们采用各种整数为整数‘n’供研究之用。因此我们在上述假设下计算出多种音调周期。在研究中,我们检测相对于零点交叉点的出现定时的波形周期(或音调周期)之间的对应(或相关)程度。稍后将描述对应程度的检测细节。通过研究,我们选择对应程度最高的一种音调周期作为真实的音调周期。这一选择是根据在短时间间隔内声音波形中不会出现大的变化这一关于声音信号的性质的前提作出的。
图1中,电平检测部件12检测A/D转换器4输出的数字声音信号的电平,以及口声抽取部件2输出的数字标准信号的电平。因此,电平检测部件12输出分别表示数字声音信号与数字标准信号的电平的信号。
评分部件13根据总体评价结果用一定的分数评定歌手的一首歌曲。这里,评分部件13在音调周期的偏移上执行综合评价,其中音调计算部件11分别相对于数字声音信号及数字标准信号进行计算,以及在电平检测部件12分别对数字声音信号与数字标准信号检测的电平之间的偏差上执行综合评价。评分结果可见地显示在显示单元14的屏幕上。〔B〕实施例的操作
下面对图1的系统的操作给出描述。首先,歌手选择一首曲调。然后,从CD1顺序地再生对应于所选择的曲调的数字音乐信号。口声抽取部件2从数字音乐信号中抽取数字标准信号。将数字标准信号分发给DC消除部件5与电平检测部件12。同时,歌手按照从CD1再生的选中的曲调的音乐开始演唱一首歌曲。麦克风3拾取演唱声并生成对应的模拟声音信号。将模拟声音信号提供给A/D转换器4,在其中将它们转换成数字声音信号。将数字声音信号分送给DC消除部件5与电平检测部件12。
数字声音信号与数字标准信号传输通过DC消除部件5与LPF6,使不需的频带的频率成分得以消除。结果,将数字声音信号与数字标准信号转换成表示只包含人声频带的频率成分的波形的经过滤波的数字信号(即滤波后的数字声音信号与滤波后的数字标准信号)。将波波后的数字信号提供给四倍附加抽样部件7。
四倍附加抽样部件7在滤波后的数字声音信号与滤波后的数字标准信号上相对于时轴执行插入。从而,将这些信号转换成具有四倍抽样频率的数字信号。然后用二进制部件8将数字信号转换成二进制信号。
图6A至6C示出表示四倍抽样部件7的操作的实例。图6A示出其电平在零电平线上下改变的正弦波式波形。在图6A的波形上画上用‘·’标记的若干个点。这些点分别表示构成数字声音信号(或数字标准信号)的原始样本。此外,在用·标记的两个点之间的波形上画上三个用‘X’标记的点。这些用‘X’标记的点分别表示由四倍附加抽样部件7建立的内插样本。
图6B示出表示二进制部件8只根据原始样本生成的二进制信号的波形,其中并未执行四倍附加抽样操作。图6C示出表示二进制部件8根据原始样本与插入样本生成的二进制信号的波形,其中已执行了四倍附加抽样操作。图6B与6C只示出根据不包含小于二进制部件8的屏蔽区的电平的小变化的数字声音信号(或数字标准信号)的波形的实例。
数字声音信号(或数字标准信号)是通过执行具有恒定的抽样周期的抽样操作生成的,而与图6A中所示的信号波形无关。如果数字声音信号显示通过重复同一波形周期构成的波形,则为抽样操作选择的瞬时值相对于图6A中所示的各波形周期变化。因此,如果抽样周期相对长,则会出现二进制信号显示的波形(见图6B)在波形周期间的变化点上与图6A的信号波形不匹配的情况。然而,在本实施例中,二进制操作是在执行过四倍附加抽样操作之后的数字声音信号上执行的。因此,有可能得到其电平在接近图6A的信号波形的零点交叉点的定时上反转的二进制信号(见图6C)。从而,有可能避免在信号波形与二进制信号波形之间出现不匹配状态(见图6A与6B)。
图7A至7D示出用来说明二进制部件8的操作的波形。这里,图7A示出对应于四倍附加抽样部件7输出的数字声音信号(或数字标准信号)的正弦波式信号波形。该信号波形是在零电平线上下形成的。图7B示出用于说明图3中所示的S/H部件83的操作的波形。图7B中,字母‘S’表示其中的输入数字信号(即数字声音信号或数字标准信号)位于设置在零电平线周围的±Δ屏蔽区外部的抽样状态,而字母‘H’则表示其中的输入数字信号位于±Δ的屏蔽区内部的保持状态。作为上述S/H部件83的控制结果,S/H部件83的输出信号指定一种信号波形,例如图7C中所示的波形。比较器84接收S/H部件83的输出信号,以便生成指定一种波形的二进制信号,例如,图7D中所示的波形。如图7A至7D的波形所示,如果输入数字信号(即数字声音信号或数字标准信号)的电平变化,使得其信号波形穿过零电平线周围的±Δ的屏蔽区,则在信号波形完全穿过屏蔽区的定时上二进制信号的电平改变。即使输入数字信号中包含其电平小于±Δ的屏蔽区的宽度的微小波动,只要输入数字信号位于±Δ的屏蔽区内部,S/H部件83仍保持前面的值。因此,仅管存在着上述微小的波动,在二进制信号中不出现转变事件。
本实施例利用在零点交叉点之间测出的间隔执行计算以获取音调周期。为此,如果对于一个周期的信号波形在零点交叉点之间测出相对大量的间隔,则必需要相对大的负荷来计算音调周期。然而,本实施例是设计成使二进制部件8利用屏蔽区来生成二进制信号的。归功于该屏蔽区,有可能忽略位于零电平线附近的对音调周期的计算并不重要的微小波动。因此,有可能获得并不包含大量的‘0’与‘1’之间的转换点的指定波形的二进制信号。结果,有可能检测到其数目足够用于音调周期的计算的零点交叉间隔。
如上所述,相对于数字声音信号与数字标准信号分别生成二进制信号。然后,计时器9分别测定二进制信号的转变点之间的时间间隔。因此,将表示计时器9的测量结果的零点交叉间隔数据顺序地输送给及保持在图5中所示的锁存器93中。在写控制部件94的控制下,将保持在锁存器93中的零点交叉间隔数据顺序地写入RAM10中。换言之,写控制部件94响应区分电路90在二进制信号的各转变事件上输出的脉冲,执行写控制例程(见图8)。在图8中所示的写控制例程的第一步骤S1中,写控制部件94从锁存器93中读取零点交叉间隔数据‘t’。在下一步骤S2中,作出判定读取的零点交叉间隔数据的值是否等于或大于下限值‘8’。如果判定结果为‘否’,写控制部件94便结束写控制例程的执行而不进行零点交叉间隔数据t的写操作。如果判定结果为‘是’,写控制部件94进行到步骤S3,在其中作出判定该零点交叉间隔数据t是否大于上限值‘8192’。如果判定结果为‘否’,便在步骤S4中将零点交叉间隔数据t写入RAM10中。然后,结束写控制例程的执行。反之,如果步骤S3的判定结果为‘是’,便用上限值‘8192’替代读取的零点交叉间隔数据t并在步骤S5中将其写入RAM10中。然后结束写控制例程的执行。按照写控制例程的执行,在RAM10中有选择地写入从‘8’至‘8192’的一定范围的零点交叉间隔数据。从而,有可能避免用不足以表示声音信号波形的零点交叉点之间的时间间隔的零点交叉间隔数据来计算音调周期,从而计算出‘错误’的音调周期的不利情况。
如上所述,音调计算部件11参照累积在RAM10中的零点交叉间隔数据来分别对数字声音信号与数字标准信号计算音调周期。下面参照图9A至9E描述数字声音信号的音调周期的计算过程的概述。假定将表示图9A中所示的波形的数字声音信号提供给二进制部件8的一种情况,使得RAM10累积一系列零点交叉间隔数据t1,t2,…,它们是由当前定时生成的。这里,音调计算部件11对零点交叉间隔数据t1,t2,…与数字声音信号之间的关系提供了四种假设。因而,音调计算部件11按照评价四种假设中每一种的合理性的过程计算音调周期。
(1)假设1
数字声音信号的音调周期具有对应于两个零点交叉间隔数据t1与t2之和的时间长度T1。根据这一假设,各时间T11,T12…(见图9B)表示数字声音信号的音调周期。
(2)假设2
数字声音信号的音调周期具有对应于四个零点交叉间隔数据t1至t4之和的时间长度T2。根据这一假设,各时间T21,T22,…(见图9C)表示该数字声音信号的音调周期。
(3)假设3
数字声音信号的音调周期具有对应于六个零点交叉间隔数据t1至t6之和的时间长度T3。根据这一假设,各时间T31,T32,…(见图9D)表示该数字声音信号的音调周期。
(4)假设4
数字声音信号的音调周期具有对应于8个零点交叉间隔数据t1至t8之和的时间长度T4。根据这一假设,各时间T41,T42,…(见图9E)表示该数字声音信号的音调周期。
图10示出在各种假设的合理性上执行评价以及根据评价结果执行音调周期计算的步骤的流程。在第一步骤S101中,音调计算部件11利用假设1来计算数字声音信号的波形的再生性因子CR1。再生性因子指示表示在各种假设的基础上,波形周期之间的对应程度的一个数值数字。在本实施例中,再生性因子是根据零点交叉间隔数据t1,t2,…计算的。
图11为展示上面图10中的步骤S101中计算再生性因子的过程的流程图。下面参照图11说明计算过程的细节。在步骤S201中,在计数器CNT中设置初始值‘0’,而在控制变量i中则设置初始值‘1’。
在步骤S202中,将控制变量i增加‘2’,从而i=‘3’。在步骤S203中,作出判定条件“0.9t1-ti<0”是否成立。即,作出判定表示零点交叉间隔数据t3的数值是否大于表示90%零点交叉间隔数据t1的数值。如果判定结果为‘是’,系统进行到步骤S204在其中将计数器CNT增加‘1’。然后系统进行到步骤S205。反之,如果步骤S203的判定结果为‘否’,系统直接进行到步骤S205而不执行步骤S204。在步骤S205中,作出判定条件“-1.1t1+ti<0”是否成立。即,作出判定表示零点交叉间隔数据t3的数值是否小于表示110%零点交叉间隔数据t1的数值。如果判定结果为‘是’,系统进行到步骤S206在其中将计数器CNT增加‘1’。然后,系统进行到步骤S207。反之,如果步骤S205的判定为‘否’,系统直接进行到步骤S207而不执行步骤S206。
在步骤S207中,作出判定控制变量i是否等于‘7’。如果判定结果为‘否’,系统返回到前面的步骤S202。此后,重复执行两次步骤S202至S207的序列。从而,重复地对零点交叉间隔数据t5与t7进行步骤S203与S205的上述判定。因此,如果各零点交叉间隔数据t5与t1大于90%零点交叉间隔数据t1,或者如果它们中各个小于110%零点交叉间隔数据t1,计数器CNT受到增加(见步骤S204与S206)。
然后,如果检测到事件“i=7”,步骤S207的判定便变成‘是’,从而系统进行到步骤S208在其中将控制变量i设置成‘2’。
在步骤S209中,将控制变量i增加‘2’而i=‘4’。在步骤S210中作出判定条件“0.9t2-ti<0”是否成立。即判定零点交叉间隔数据t4是否大于90%零点交叉间隔数据t2。如果判定结果为‘是’,系统进行到步骤S211在其中将计数器CNT增加‘1’。然后,系统进行到步骤S212。反之,如果步骤S210的判定为‘否’,系统便直接进行到步骤S212而不执行步骤S211。在步骤S212中,判定条件“-1.1t2+ti<0”是否成立。即判定零点交叉间隔数据t4是否小于110%零点交叉间隔数据t2。如果判定结果为‘是’,便在步骤S213中将计数器CNT增加‘1’。然后系统进行到步骤S214。反之,如果判定结果为‘否’,系统便直接进行到步骤S214而不执行步骤S213。
在步骤S214中,判定控制变量i是否等于‘8’。如果判定结果为‘否’,系统返回到前面的步骤S209。此后,重复执行两次步骤S209至S214序列,从而对各零点交叉间隔数据t6与t8作出步骤S210与S212的判定。从而,如果各零点交叉间隔数据t6与t8大于90%零点交叉间隔数据t2,或者如果它们中各个小于110%零点交叉间隔数据t2,计数器CNT便受到增加(见步骤S211与S213)。
如果检测到事件“i=8”,步骤S214的判定结果就成‘是’,而使系统进行到步骤S215,在其中根据对零点交叉间隔数据进行判定的次数在计数器CNT的值上执行正规化。正规化的结果指定再生性因子CR1。图11的流程图中包含执行12次的判定。从而表示“CNT/12”的一个值指定再生性因子CR1。
同时,如果上述假设1是合理的(或正确的)而使得音调周期具有对应于两个零点交叉间隔数据之和的时间长度T1,我们便能提供即使音调周期改变了四次,数字声音信号的波形也不改变的理想状态。换言之,数字声音信号的波形中基本上同一波形周期重复四次的理想状态。这一理想状态满足下述两个条件:
t1=t3=t5=t7以及t2=t4=t6=t8
在上述理想状态中,上述计算处理产生100%的再生性因子CR1。尽管存在零点交叉间隔数据的微小误差,仍保持这一100%的再生性因子CR1。这便是,只要各零点交叉间隔数据t3、t5、t7属于t1±10%的范围及各零点交叉间隔数据t4、t6、t8属于t2±10%的范围,就保持100%的再生性因子CR1。
如果上述假设1是错误的,在波形周期之间的各变化点上互相相关的零点交叉间隔数据之间会出现大的差别。在这一情况中,在诸如步骤S203等一些步骤中便很容易出现否定的判定结果(‘否’)。因此,随着这种否定的判定结果出现的次数的增加会降低再生性因子CR1。
完成了再生性因子CR1的计算之后,程序控制返回到图10的流程图。因而,系统进行到步骤S102以便根据上述假设2计算数字声音信号的波形的再生性因子CR2。假设2描述音调周期具有对应于四个零点交叉间隔数据之和的时间长度T2。从而,第一音调周期与四个零点交叉间隔数据t1至t4匹配;第二音调周期与四个零点交叉间隔数据t5至t8匹配;第三音调周期与四个零点交叉间隔数据t9至t12匹配;及第四音调周期与四个零点交叉间隔数据t13至t16匹配。然后,对上述零点交叉间隔数据之间的对应性作出判定,其中将第一音调周期的零点交叉间隔数据用作判定基础(或基准)。即判定零点交叉间隔数据t5至t8、t9至t12、t13至t16是否各在一定误差范围内与零点交叉间隔数据t1至t4重合。然后,计数判定上出现肯定结果(‘是’)的次数;根据判定总数执行正规化;从而计算出再生性因子CR2。
如果假设2是正确的从而音调周期的时间长度对应于四个零点交叉间隔数据之和,我们便提供了即使音调周期改变了四次数字声音信号的波形也不改变的理想状态。这一理想状态满足下述所有条件:
t1=t5=t9=t13
t2=t6=t10=t14
t3=t7=t11=t15
t4=t8=t12=t16
在上述理想状态中,计算出的再生性因子CR2为100%。尽管存在着零点交叉间隔数据的微小误差,仍保持这一100%的再生性因子CR2。换言之,只要上述各条件的零点交叉间隔数据在±10%的误差范围内互相相等,便保持它。在一些情况中,当音调周期改变时,一些零点交叉间隔数据偏离基准零点交叉间隔数据(即第一音调周期的零点交叉间隔数据)。在这一情况中,应根据‘偏离的’零点交叉间隔数据的数目降低再生性因子CR2。
下面,系统进行到步骤S103,在其中根据上述假设3对数字声音信号的波形计算再生性因子CR3。假设3描述音调周期具有对应于6个零点交叉间隔数据之和的时间长度T3。这里,零点交叉间隔数据t1至t6与第一音调周期匹配;t7至t12与第二音调周期匹配;t13至t18与第三音调周期匹配;及t19至t24与第四音调周期匹配。然后,对上述零点交叉间隔数据之间的对应性作出判定,其中将第一音调周期的零点交叉间隔数据用作基准。这便是判定第二音调周期的零点交叉间隔数据t7至t12,第三音调周期的t13至t18及第四音调周期的t19至t24是否各在一定的误差范围内与‘基准’零点交叉间隔数据t1至t6重合。系统计数在判定上出现肯定结果的次数;根据作出判定的总次数执行正规化;从而计算出再生性因子CR3。
在满足所有下述条件时,系统计算100%的再生性因子CR3:
t1=t7=t13=t19
t2=t8=t14=t20
t3=t9=t15=t21
t4=t10=t16=t22
t5=t11=t17=t23
t6=t12=t18=t24
尽管存在着零点交叉间隔数据的微小误差,仍保持100%的再生性因子CR3。这便是,只要各条件的零点交叉间隔数据在±10%的误差范围内基本上互相相等,便保持它。然而,根据若干个零点交叉间隔数据具有大的误差,降低再生性因子CR3。
下面,系统进行到步骤S104,在其中根据上述假设4对数字声音信号的波形计算再生性因子CR4。假设4描述音调周期具有对应于8个零点交叉间隔数据之和的时间长度T4。这里,零点交叉间隔数据t1至t8与第一音调周期匹配;t9至t16与第二音调周期匹配;及t17至t24与第三音调周期匹配。然后,对上述零点交叉间隔数据之间的对应性作出判定,其中将第一音调周期的零点交叉间隔数据用作基准。这便是,判定第二音调周期的零点交叉间隔数据t9至t16及第三音调周期的t17至t24是否各在一定的误差范围内与‘基准’零点交叉间隔数据t1至t8重合。系统计数判定上出现肯定结果的次数;根据作出判定的总次数执行正规化;从而计算出再生性因子CR4。
上述步骤S101至S103处理四个音调周期的零点交叉间隔数据,而步骤S104处理3个音调周期的零点交叉间隔数据(它们对应于图9E中所示的T41至T43)。下面描述为何不同数目的音调周期分别用于这些步骤的理由。
步骤S104利用描述音调周期具有对应于8个零点交叉间隔数据的长时间长度的假设4。如果步骤S104处理四个音调周期的零点交叉间隔数据,虽然假设4是正确的,除非数字声音信号的波形在对应于四个音调周期的极长的时间间隔中是稳定的,否则会降低再生性因子CR4。按照数字声音信号的波形的性质,相同的波形只能保持在相对地短的时间间隔中;然而在时间推移上波形会改变。因此,如果步骤S104处理四个音调周期,即使假设4是正确的,也会由于数字声音信号的波形的与时间相关的变化而存在计算出不合理地低的再生性因子CR4的高概率。为了上述理由,步骤S104处理3个音调周期。
在满足下述所有条件时,步骤S104计算‘100%’的再生性因子CR4:
t1=t9=t17
t2=t10=t18
t3=t11=t19
t4=t12=t20
t5=t13=t21
t6=t14=t22
t7=t15=t23
t8=t16=t24
尽管存在零点交叉间隔数据的微小误差,仍保持100%的再生性因子CR4。这便是,只要各条件的零点交叉间隔数据在±10%的误差范围内基本上互相相等,便保持它。然而,再生性因子CR4是响应若干个具有大误差的零点交叉间隔数据而降低的。
完成步骤S104之后,系统进行到步骤S105,在其中通过在前面的步骤S101至S104中计算出的再生性因子CR1至CR4上执行评价进程而作出判定假设1至4中哪一种假设最合理。评价进程的细节由图12的流程图示出。在图12的步骤S301中,判定再生性因子CR1至CR4中哪一个再生性因子最高。如果再生性因子CR1最高,系统进行到步骤S302,在其中判定再生性因子CR1是否大于基准值‘ref’。如果判定结果为‘是’,系统确定假设1是合理的。因此,根据对应于两个零点交叉间隔数据之和的时间长度T1计算音调周期。对其它再生性因子CR2至CR4之一为最高的情况作出类似的判定。这便是,判定再生性因子CR2至CR4之一是否大于基准‘ref’(见步骤S303至S305)。如果判定结果为‘是’,系统确定假设2至4之一是合理的。因此,根据对应于合理的假设的一定时间长度计算音调周期如下:
在假设2的情况中,根据对应于4个零点交叉间隔数据之和的时间长度T2计算音调周期。在假设3的情况中,根据对应于6个零点交叉间隔数据之和的时间长度T3计算音调周期。在假设4的情况中,根据对应于8个零点交叉间隔数据之和的时间长度T4计算音调周期。
如果为所有的再生性因子CR1至CR4计算出一个相同的值,则按照由下列不等式表示的优先次序选择它们之一:
CR1>CR2>CR3>CR4这便是,给予再生性因子CR1最高优先级而首先选择它。
如果再生性因子CR1至CR4中的最高者等于或小于基准值‘ref’,则步骤S302至S305的所有判定结果都变成‘否’。在这一情况中,系统不能作出关于假设1至4的合理性的结论。因此,系统决定不选择假设。
完成了图12的流程所示的评价进程之后,程序控制返回到图10的上述流程图,其中系统进行到对应于步骤S105的判定结果的步骤。如果系统决定根据对应于两个零点交叉间隔数据之和的时间长度T1计算音调周期,系统进行到步骤S106。在步骤S106中,系统计算4个音调周期,各对应于两个零点交叉间隔数据(见图9B的T11至T14),将它们提交给正规化以生成用作数字声音信号的正常音调周期的平均音调周期。如果系统决定根据对应于四个零点交叉间隔数据之和的时间长度T2计算音调周期,系统进行到步骤S107。在步骤S107中,系统计算四个音调周期(见图9C的T21至T24),将它们提交给正规化以生成作用数字声音信号的正常音调周期的平均音调周期。再者,如果系统决定根据对应于6个零点交叉间隔数据之和的时间长度T3计算音调周期,系统进行到步骤步骤S108。在步骤S108中,系统计算四个音调周期(见图9D的T31至T34),将它们提交给正规化以生成用作数字声音信号的正常音调周期的平均音调周期。再者,如果系统决定根据对应于8个零点交叉间隔数据之和的时间长度T4计算音调周期,系统进行到步骤S109。在步骤S109中,系统计算3个音调周期(见图9E的T41至T43),将它们提交给正规化以生成用作数字声音信号的正常音调周期的平均音调周期。
完成了上述进程之后,系统返回到前面的步骤S101。这样,重复上述进程来连续地计算数字声音信号的音调周期。如果在图12的流程图中,系统到达‘无’结论,则系统不执行音调周期计算。在这一情况中,系统输出一个信号申明未执行音调周期计算。然后,程序控制返回到图10中的上述步骤S101。
现在,我们已描述了对数字声音信号计算音调周期的实例。然而,这种计算同样能应用在数字标准信号上。因此,有可能对数字标准信号计算音调周期。
如上所述,本实施例进行关于音调周期计算的‘仔细的’过程,如下:
在所有的假设1至4的基础上计算再生性因子,以便选择提供最高再生性因子的假设。然后,系统只在其再生性因子属于容许范围时才根据选择的假设执行音调周期计算。然而,如果再生性因子位于容许范围之外,系统不执行计算。
下面对本实施例的系统为何设计成进行‘仔细的’过程给出说明。
(a)有可能提供与上述本实施例的过程不同的过程的第一种替代建议。按照它,例如,系统根据假设1至4执行计算来顺序地生成再生性因子;然后在系统进行到获得属于容许范围的一个再生性因子时便停止计算;此后,选择与这一再生性因子对应的假设来计算音调周期。然而,这一建议不能对付诸如其中某些声音波形定义对应于假设1与3的再生性因子属于容许范围且假设3的再生性因子高于假设1的再生性因子的一定场合。在这种场合上,应选择假设3。然而,过程的第一种替代建议将会错误地选择假设1,从而必定计算‘错误的’音调周期。这种计算错误可以通过使容许范围变窄来克服。然而,如果变窄了容许范围,便会使系统频繁地作出指示不选择任何假设的结论‘无’的机会增大。
(b)有可能提供与本实施例的过程不同的过程的第二种替代建议。按照它,系统计算对应于假设1至4的所有再生性因子,使得系统无条件地采用提供最高再生性因子的假设来计算音调周期。然而这一建议不能对付诸如所有假设的再生性因子都同样地低而一种特定假设的再生性因子略高于其它再生性因子的一定场合。在这种情况下上、不能保证通过强制采用这一假设来获得‘正确的’音调周期。在数字声音信号的波形在电平上急剧地变化的情况中,存在着所有假设的再生性因子必定是低的极大机会。
(c)由于过程的第一与第二种替代建议可能受(a)与(b)中所描述的问题的困扰,我们能得出结论本实施例的过程是有效的。因此,本实施例按照仔细的过程执行音调周期计算来避免产生‘不充分的’音调周期。
如上所述,音调周期是分别对数字声音信号与数字标准信号计算的。然后将这些音调周期顺序地报告给评分部件13。然后,在分别为数字声音信号与数字标准信号计算的音调周期之间的偏移以及由电平检测部件12检测到的数字声音信号与数字标准信号的电平之间的偏移上执行综合评价。从而,评分部件13通过一定的分数来评分歌手的一首歌曲,然后将分数可见地显示在显示单元14的屏幕上。〔C〕本实施例的性能研究中的结果
我们进行了关于本实施例的音调检测装置的性能的研究,其中应用了各式各样的操作条件来评价相对于本实施例所计算的音调周期的检测次数与检测误差。图13至16示出研究的结果。图13示出测定实际范围中的音调周期的检测测量结果,其中将执行线性内插的电路用作四倍附加抽样部件7,并以多种方式改变其附加抽样频率。图13的测量结果显示实际范围中的检测误差能通过执行对应于四倍附加抽样的内插充分地减小。图14示出用相对于下述两种情况的各输入频率测定检测音调周期所必需的延时的测量结果:
(i)第一种情况,用‘m=3’表示(见图14中的虚线),其中在3个音调周期之间的相互关系的基础上检测音调周期;以及
(ii)第二种情况,用‘m=4’表示(见图14中的实线),其中在4个音调周期之间的相互关系的基础上检测音调周期。
图14的测量结果显示用于检测音调周期的延时次数在m=3、m=4等情况中能位于适当的范围中。图15示出表示执行音调周期的求平均值次数与抽取误差之间的关系的曲线。图16示出检测适当数目的前面的波形周期互相比较来获得精确的音调周期所进行的实验结果。按照实验结果,如果通过在两个前面的波形周期上执行比较来检测音调周期,抽取误差会相对地大,而在5个前面的波形周期上执行比较会检测出错误的音调周期,因为这些波形周期太老不适用于检测音调周期。简言之,图16中示出的实验结果显示对于检测正确的音调周期,比较3或4个前面的波形周期最佳。〔D〕修正
本实施例可用各种方式修正,下面描述它们。
(1)本实施例的系统分别对音调周期检测零点交叉间隔数据之间的对应程度,借此判定对应于‘2n’个零点交叉间隔数据(‘n’为整数)之和的音调周期的假设是否合理。这一音调检测方法可用下述另一方法替代:
可将该系统重新设计成通过对为‘n’选择的各数字计算‘2n’个零点交叉间隔数据之和来计算一定数目的音调周期。然后,系统根据所计算的音调周期之间的分散最小的数目选择一定的‘n’,从而最终选择了‘适当’的音调周期。例如,如果在图9B至9E中所示的时间之间的分散中时间T11至T14之间的分散最小,便采用时间T11至T14的平均值作为音调周期。类似地,如果时间T21至T24之间的分散最小,便将时间T21至T24的平均值用作音调周期。从而,音调周期是通过选择时间之间的最小分散来确定的。
有可能组合根据分散来检测音调周期的上述方法及根据零点交叉间隔数据来检测音调周期的前面提到的方法。在这一情况中,在零点交叉间隔数据以及音调周期的时间(或时间长度)之间的分散上执行综合评价,从而选择适当的音调周期。
(2)本实施例是设计成为二进制部件8采用‘固定’的屏蔽区△的。通常出现在声音波形的零电平周围的微小波动的幅度取决于作为整体的声音波形的总幅度。因此,在某些情况中,难于为屏蔽区△设定一个适当的宽度。为了对付这一问题,可以引入一种新的方法来设定(或控制)二进制部件8的屏蔽区△的宽度,如下:
相对于数字声音信号或数字标准信号检测幅度,然后,用一定的系数去乘该幅度。从而,根据相乘后的幅度控制屏蔽区△。
(3)本实施例是设计成用数字处理来检测音调周期的。然而,可将系统重新设计成采用模拟技术的。例如,零点交叉间隔是直接从模拟声音波形检测的;然后根据它们来检测音调周期。
最后,由于本发明可以以多种形式实施而不脱离其基本特征的精神,因此本实施例是示例性的而非限制性的,由于本发明的范围是由所附的权利要求书而非它们前面的描述定义的,因而落入权利要求书的集合与界限或这些集合与界限的等效物内的所有改变都是旨在包含在权利要求书中的。
Claims (15)
1、一种音调检测装置,包括:
零点交叉间隔测定装置,用于测定连续地出现在声音波形中的零点交叉间隔;以及
音调计算装置,采用音调周期对应于‘2n’个零点交叉间隔之和的假设,该音调计算装置根据零点交叉间隔执行计算来顺序地生成波形周期之间的对应程度,其中各对应程度是相对于在声音波形中互相邻接地放置以便构成声音波形的一部分的‘m’个波形周期计算的,使得该音调计算装置通过在计算出的对应程度中为数字‘n’选择产生最高对应程度的一定整数来确定音调周期,其中数字‘n’选自不小于‘1’的整数范围中,‘m’为不小于‘2’的整数。
2、权利要求1中所定义的音调检测装置,其中在音调计算装置中如果数字‘n’不大于预定的数则设定数字‘m’为‘4’,而如果数字‘n’大于该预定的数,则设定数字‘m’为‘3’。
3、权利要求1中所定义的音调检测装置,其中该音调计算装置相对于对应于音调周期的‘2n’个零点交叉间隔的各个,计数在一定的误差范围内的‘m’个波形周期中重复地出现的同一时间长度的次数,使得该音调计算装置能根据分别对‘2n’零点交叉间隔计数的次数之和计算波形周期之间的对应程度。
4、权利要求1中所定义的音调检测装置,其中如果数字‘n’大于一个预定的数,该音调计算装置便减小数字‘m’来确定音调周期。
5、权利要求4中所定义的音调检测装置,还包括平均装置,用于在音调计算装置为数字‘n’选择了产生最高对应程度的一定整数之后,求出相对于‘m’个波形周期且各波形周期对应于‘2n’个零点交叉间隔的音调周期的平均值。
6、权利要求1中所定义的音调检测装置,其中当所述的对应程度属于一定的容许范围时为数字‘n’选择产生最高对应程度的一定整数而确定音调周期,而在对应程度偏离该一定容许范围时,该音调计算装置不确定音调周期。
7、权利要求1中所定义的音调检测装置,其中该零点交叉间隔测定装置略去等于或小于下限值的测定出的零点交叉间隔,而如果测定出的零点交叉间隔超过上限值时,该零点交叉间隔测定装置采用上限值来替代测定的零点交叉间隔。
8、权利要求1中所定义的音调检测装置,进一步包括:
附加抽样装置,用于将输入数字声音信号的抽样频率乘以一定的倍数,以便生成倍数频率的数字声音信号;
二进制装置,用于将附加抽样装置输出的数字声音信号与一定的电平比较,以便将它们转换成二进制信号;
所述的零点交叉间隔测定装置,用于根据二进制信号测定零点交叉间隔,其中这些零点交叉间隔接连地出现在根据数字声音信号形成的声音波形上。
9、权利要求1中所定义的音调检测装置,进一步包括一个二进制装置,用于在基准零电平的基础上在声音波形上执行二进制运算,以便生成二进制信号;
所述的零点交叉间隔测定装置,用于根据二进制信号测定零点交叉间隔;
其中该二进制装置在基准零电平周围设定一个屏蔽区,使得二进制装置只在其电平在时间推移上变化的声音波形穿过该屏蔽区时才转变该二进制信号,而在声音波形在屏蔽区内部移动时该二进制装置保持刚在声音波形进入屏蔽区之前生成的二进制信号。
10、权利要求9中所定义的音调检测装置,其中该屏蔽区的宽度是控制成响应声音波形的幅度而改变的。
11、权利要求1中所定义的音调检测装置,进一步包括:
附加抽样装置,用于在提供给它的表示人类声音的输入数字信号上执行附加抽样操作,以便用一定的倍数实行乘法来提高抽样频率,从而产生具有相乘后的频率并表示声音波形的数字声音信号;
二进制装置,用于根据数字声音信号产生二进制信号,其中该二进制信号只在其电平在时间间隔上变化的声音波形穿过设置在零电平周围的一个屏蔽区时才转变,而在声音波形在该屏蔽区内部移动的持续时间内二进制信号保持不变;
所述的零点交叉间隔测定装置,用于测定声音波形在其上与零电平线交叉的多个零点交叉间隔,其中测定的零点交叉间隔是接连地布置在时轴上的。
12、权利要求11中所定义的音调检测装置,其中将该一定的倍数设定为‘4’,使得数字声音信号的相乘后的频率为抽样频率的四倍。
13、权利要求11中所定义的音调检测装置,其中的数字‘m’是根据数字‘2n’确定的,‘2n’为对应于一个音调周期的零点交叉间隔数且不小于‘3’。
14、权利要求11中所定义的音调检测装置,其中设置在零电平线周围的屏蔽区的宽度是控制成响应声音波形的幅度而改变的。
15、权利要求11中所定义的音调检测装置,还包括存储装置,用于存储由零点交叉间隔测定装置测定的且只属于预定的范围的零点交叉间隔,使得读出与提供给音调计算装置的是存储在该存储装置中的零点交叉间隔。
Applications Claiming Priority (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP005250/1996 | 1996-01-16 | ||
JP005250/96 | 1996-01-16 | ||
JP005248/96 | 1996-01-16 | ||
JP525096A JPH09198094A (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP005251/96 | 1996-01-16 | ||
JP00524896A JP3996221B2 (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP00525396A JP3996222B2 (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP00525196A JP3707120B2 (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP524996A JP3235445B2 (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP005253/96 | 1996-01-16 | ||
JP005252/1996 | 1996-01-16 | ||
JP005248/1996 | 1996-01-16 | ||
JP00525296A JP3707121B2 (ja) | 1996-01-16 | 1996-01-16 | ピッチ検出装置 |
JP005252/96 | 1996-01-16 | ||
JP005251/1996 | 1996-01-16 | ||
JP005253/1996 | 1996-01-16 | ||
JP005249/96 | 1996-06-16 | ||
JP005249/1996 | 1996-06-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1162113A CN1162113A (zh) | 1997-10-15 |
CN1136536C true CN1136536C (zh) | 2004-01-28 |
Family
ID=30773759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB971004285A Expired - Fee Related CN1136536C (zh) | 1996-01-16 | 1997-01-16 | 音调检测装置 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR100406655B1 (zh) |
CN (1) | CN1136536C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7715447B2 (en) * | 2003-12-23 | 2010-05-11 | Intel Corporation | Method and system for tone detection |
CN107808655B (zh) * | 2017-10-27 | 2021-02-12 | 广州酷狗计算机科技有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
JP7395901B2 (ja) * | 2019-09-19 | 2023-12-12 | ヤマハ株式会社 | コンテンツ制御装置、コンテンツ制御方法およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5447622A (en) * | 1977-09-21 | 1979-04-14 | Sony Corp | Electronic musical instrument |
JPS5857758B2 (ja) * | 1979-09-28 | 1983-12-21 | 株式会社日立製作所 | 音声ピッチ周期抽出装置 |
JPS60198597A (ja) * | 1984-03-22 | 1985-10-08 | 株式会社リコー | 音声スペクトルの2値化装置 |
JPH05315891A (ja) * | 1992-05-12 | 1993-11-26 | Victor Co Of Japan Ltd | デジタル信号処理方式 |
-
1997
- 1997-01-16 CN CNB971004285A patent/CN1136536C/zh not_active Expired - Fee Related
- 1997-01-16 KR KR1019970001192A patent/KR100406655B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1162113A (zh) | 1997-10-15 |
KR970060045A (ko) | 1997-08-12 |
KR100406655B1 (ko) | 2004-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MXPA01004281A (es) | Metodo fundamental para busquedad rapida. | |
CN1163894C (zh) | 频率控制和相位同步电路 | |
WO2007010637A1 (ja) | テンポ検出装置、コード名検出装置及びプログラム | |
CN101076850A (zh) | 用于提取构成音频信号基础的旋律的方法和设备 | |
EP0125423A1 (en) | Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal | |
US20090119097A1 (en) | Pitch selection modules in a system for automatic transcription of sung or hummed melodies | |
CN101123086A (zh) | 节奏检测装置及节奏检测用计算机程序 | |
CN101123085A (zh) | 和弦名检测装置以及和弦名检测用程序 | |
CN108962284A (zh) | 一种语音录制方法及装置 | |
WO2006019555A2 (en) | Music detection with low-complexity pitch correlation algorithm | |
CN109979488A (zh) | 基于重音分析的人声转乐谱系统 | |
CN1136536C (zh) | 音调检测装置 | |
CN101076849A (zh) | 对构成音频信号基础的旋律的提取 | |
SE517793C2 (sv) | Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare | |
Sato et al. | Automatic comparison of global children’s and adult songs supports a sensorimotor hypothesis for the origin of musical scales | |
CN102682782B (zh) | 语音处理装置和处理方法 | |
CN114882905A (zh) | 一种基于神经网络的音乐节拍速度检测方法 | |
Smolenski et al. | Usable speech processing: A filterless approach in the presence of interference | |
JP4735398B2 (ja) | 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム | |
Rosenzweig et al. | Detecting Stable Regions in Frequency Trajectories for Tonal Analysis of Traditional Georgian Vocal Music. | |
CN1637915A (zh) | 信息回放方法和设备 | |
Fitria et al. | Music transcription of javanese gamelan using short time fourier transform (stft) | |
CN100444270C (zh) | 抖动测量方法及其相关装置 | |
CN1849661A (zh) | 用于测量信号质量的设备和方法 | |
CN1155964C (zh) | 数字音频接口信号解调装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040128 Termination date: 20150116 |
|
EXPY | Termination of patent right or utility model |