CN1214362C - 用于确定信号间相关系数和信号音高的设备和方法 - Google Patents
用于确定信号间相关系数和信号音高的设备和方法 Download PDFInfo
- Publication number
- CN1214362C CN1214362C CNB031484077A CN03148407A CN1214362C CN 1214362 C CN1214362 C CN 1214362C CN B031484077 A CNB031484077 A CN B031484077A CN 03148407 A CN03148407 A CN 03148407A CN 1214362 C CN1214362 C CN 1214362C
- Authority
- CN
- China
- Prior art keywords
- signal
- value
- probability
- member function
- minimum value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000005070 sampling Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 13
- 238000005265 energy consumption Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Feedback Control In General (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供用于确定信号间相关系数和信号音高的设备和方法。用于确定信号间相关系数的设备包括:操作单元,它接收抽样信号x[i+k]和y[j+k],通过将信号x[i+k]和y[j+k]施加到下列公式获得两个信号x[i+k]和y[j+k]都具有大值或小值的概率P3:max[min(μL(x[i+k]),μL(y[j+k])),min(μS(x[i+k]),μS(y[j+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数,以整数为单位将所述k从0增加到M-1,并且对相应于所述k的一对信号x[i+k]和y[j+k]重复上述操作,以获得M个概率P3;以及加法单元,它通过将从操作单元输出的所述M个概率P3相加来获得表明两个信号x[i+k]和y[j+k]间相似程度的相关系数。
Description
本申请要求2002年8月1日提交给韩国知识产权局的韩国专利申请号2002-45567的优先权,将其公开的内容全文并入本文作为参考。
技术领域
本发明涉及用于确定相关系数的设备和方法,其中所述相关系数表示信号之间的相似程度,本发明还涉及用于确定这种信号音高的设备和方法。
背景技术
语音信号的特征在于相似信号连续重复,这些相似信号重复的周期被称作音高。图1显示了语音信号的音高的实例。
在语音编码器领域,需要语音识别、语音合成以及获得音高的算法,以进行编码和/或解码语音信号。总的来说,用于获得音高的算法是基于语音信号与一个音高前的语音信号相似的假设的。同样,根据由国际远程通讯联合会(ITU)和另一个GSM欧洲研发的G.723.1和G729标准,在认为一个音高后的语音信号与一个音高前的语音信号之间存在强相关时获得音高。
然而,为了使用传统方法获得音高,必须进行许多乘法运算,使得用于获得音高的计算时间占整个编码计算时间的大约25%。另外,还需要许多逻辑装置以设计和处理用于使用ASIC获得音高的传统算法,并且能耗增加。特别是,在移动通信环境下,迫切需要一种能够减少用于编码语音信号的计算时间,同时不降低声音质量的技术。
发明内容
本发明提供一种通过使用模糊逻辑获得表明两个信号之间的相似程度的相关系数来确定信号之间的相关系数的设备和方法,它提高了计算速度和计算精度,简化了设备结构并降低能耗的设备和方法。
本发明还提供一种用于确定信号音高的设备和方法,它是通过利用确定信号之间相关系数的设备和方法来获得信号音高,来提高计算速度和计算精度,简化设备结构并降低了能耗。
根据本发明的一个方面,提供一种用于确定信号间的相关系数的设备,设备包括:操作单元,它接收抽样信号x[i+k]和y[j+k],通过将信号x[i+k]和y[j+k]施加到下列公式获得两个信号x[i+k]和y[j+k]都具有大值或小值的概率P3:max[min(μL(x[i+k]),μL(y[j+k])),min(μS(x[i+k]),μS(y[j+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数,以整数为单位将所述k从0增加到M-1,并且对相应于所述k的一对信号x[i+k]和y[j+k]重复上述操作,以获得M个概率P3;以及加法单元,它通过将从操作单元输出的所述M个概率P3相加来获得表明两个信号x[i+k]和y[j+k]间相似程度的相关系数。
根据本发明的一个方面,提供一种确定信号间的相关系数的方法,该方法包括:(a)将抽样信号x[i+k]和y[j+k]施加到下列公式,并获得两个信号x[i+k]和y[j+k]都具有大值或小值的概率P3;max[min(μL(x[i+k]),μL(y[j+k])),min(μS(x[i+k]),μS(y[j+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数;(b)以整数为单位将所述k从0增加到M-1,重复(a)以获得M个概率P3;以及(c)通过将所述M个概率P3相加来获得表明两个信号x[i+k]和y[j+k]之间的相似程度的相关系数。
根据本发明的另一个方面,提供一种用于确定信号音高的设备,该设备包括:操作单元,它接收抽样信号x[i+k]和对应于信号x[i+k]的样本L之前的信号的x[i-L+k],以便通过将信号x[i+k]和x[i-L+k]施加到下列公式来获得两个信号x[i+k]和x[i-L+k]都具有大或小值的概率P3:max[min(μL(x[i+k]),μL(x[i-L+k])),min(μS(x[i+k]),μS(x[i-L+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数,以整数为单位将所述k从0增加到M-1,并且对相应于所述k的一对信号x[i+k]和x[i-L+k]重复上述操作,以获得M个概率P3;加法单元,它通过将从操作单元输出的所述M个概率相加获得表明两个信号x[i+k]和x[i-L+k]间相似程度的相关系数,其中当所述L在预定范围内变化时,操作单元确定关于L的每个值的概率P3并将确定结果输出到加法单元,而该加法单元通过将关于L的每个值的所述M个概率相加来确定相关系数并输出多个相关系数;和音高确定单元,其确定对应于从加法单元输入的多个相关系数中的最大值的L,作为信号x[i+k]的音高。
根据本发明的另一个方面,提供一种确定信号音高的方法,该方法包括:(a)将抽样信号x[i+k]和x[i-L+k]施加到下列公式,并获得两个信号x[i+k]和x[i-L+k]都具有大或小值的概率P3;max[min(μL(x[i+k]),μL(x[i-L+k])),rmin(μS(x[i+k]),μS(x[i-L+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数;(b)以整数为单位将所述k从0增加到M-1,重复(a)以获得M个概率P3;(c)通过加所述M个概率P3来获得表明两个信号x[i+k]和x[i-L+k]之间相似程度的相关系数;(d)在预定范围内改变所述L并重复(a)到(c);和(e)确定对应于在(c)获得的多个相关系数中的最大值的L,作为信号x[i+k]的音高。
附图说明
通过参考附图对优选实施例的详细描述,本发明的上述及其它的特征和优点将会变得更加清楚。
图1显示了语音信号的音高;
图2A和2B是模糊集成员函数的实例;
图3是显示根据本发明的用于确定信号之间相关系数的设备的实施例的框图;
图4是显示图3所示的运算单元的实例的框图;
图5是显示图3所示的运算单元的实例的框图;
图6是显示使用图3所示的本发明的用于确定信号之间相关系数的设备来确定信号音高的设备的实施例的框图;
图7是显示利用图3所示的本发明的确定信号之间相关系数的设备进行信号间相关系数确定的方法的实施例的流程图;
图8是显示利用图3所示的本发明的确定信号之间相关系数的设备进行信号间相关系数确定的方法的实施例的流程图;
图9是显示利用图6所示得本发明的确定信号音高的设备进行信号音高确定的方法的实施例的流程图。
具体实施方式
下面,将参考附图对本发明的优选实施例进行详细的描述。
首先,模糊逻辑是表示真(truth)程度的“度的概念”。这就是说,模糊逻辑是克服作为现代计算机基础的表明“真”或“假”的二进制(0或1)布尔逻辑的限制的概念。例如,当“高”和“矮”表示为1或0时,“有点”、“适度”或“非常高”可表示为高度的大约0.2,0.5或0.8。这里,0.2、0.5等被称作成员级。当将一组“高个的人”假定为A集,则A集变成模糊集。同样,假定用于确定高度的函数是Tall(x),则该函数可以通过公式1获得:
在这种情况下,函数Tall(x)被称作模糊集A的成员函数。通过使用上面定义的函数Tall(x),则“高度”可以表示如下。即,当一个人A是3英尺5英寸高时,人A的“高度”是“0”,当人B是6英尺1英寸高时,则人B的“高度”是“0.54”,当人C是7英尺2英寸高时,则人C的“高度”是“1”。
同时,在模糊逻辑中,truth(not x)=1.0-truth(x),truth(x and y)=(minimum(truth(x),truth(y)),truth(x or y)=maximum(truth(x),truth(y))。这里,“truth(x)”是x为真的的概率,或模糊集的成员函数。
下面,将参考附图2A到5描述利用上面所述的本发明的模糊逻辑确定信号间相关系数的设备。
在本实施例中,首先,表明信号间相似程度的相关系数被称作“两个信号都具有大或小值的概率”。
当抽样信号x[i]和y[i]具有从-R到R变化的值时,具有大值的信号的模糊集被假定为集L,具有小值的信号的模糊集被假定为集S。集L和S的成员函数分别假定为μL和μS。这里,i和j是表示时间轴上样本的顺序的变量。图2A显示成员函数μL,图2B显示成员函数μS。通过公式2和3可获得这些函数μL和μS的每一个。
μL(x)=(x+R)/2R
μS(x)=(-x+R)/2R (2)
可用公式3表示上述相关系数的定义,它是包括集L和S的逻辑公式。
(Lx∩Ly)∩(Sx∩Sy) (3)
公式3可以用模糊逻辑公式4表示。
Max[min(μL(x),μL(y)),min(μS(x),μS(y))] (4)
当根据模糊逻辑解释公式4时,min(μL(x),μL(y)表示信号x[i]和y[j]都具有大值的概率,min(μS(x),μS(y)表示所有的信号x[i]和y[j]具有小值的概率。同样,公式4所示的值表明信号x[i]和y[j]都具有大值或小值的概率。
当存在信号x的M个样本和信号y的M各样本时,通过利用公式2和4的公式5可获得信号x[i]和y[j]之间的相关系数:
由于不需要相关系数的准确值,所以相关系数由公式6确定:
从公式6显然可以看出,相关系数的计算仅仅需要获得输入信号的最大和最小值的运算,以及加法运算,而不需要乘法运算。因此,减少了计算量,并且可以快速获得相关系数。
同样,当x是语音信号时,可通过公式7获得样本信号x[i]和样本信号x[i-L]之间的相关系数:
同样,也可以用公式7获得语音信号x的音高。即,在公式7中,L可在预定范围内变化,根据每个值L获得相关系数,其中相关系数是最大值的值L成为语音信号的音高。例如,当信号x的抽样率是8000个样本/秒时,L的变化范围可以是大约20到147个样本。
图3是显示本发明的用于确定信号间的相关系数的设备的实施例的框图。用于确定信号间的相关系数的设备包括运算单元100和加法单元200。
运算单元100接收信号x[i],x[i+1],……,x[i+M-1],和信号y[j],y[j+1]……,y[j+M-1],它们是以预定抽样率抽样的。
运算单元100运算如下:
1.将信号x[i]和y[j]的每一个施加到具有大值的第一模糊集的第一成员函数μL,获得它们之间的最小值,确定信号x[i+k]和y[j+k]都具有最大值的概率P1。例如,图2A所示的函数,或具有其他形状的函数可用作第一成员函数μL。
如果第一成员函数μL是图2A所示的函数,则概率P1变成信号x[i]和y[j]之间的最小值。
2.将信号x[i]和y[j]的每一个施加到具有小值的第二模糊集的第二成员函数μL,获得它们之间的最小值,确定信号x[i]和y[j]都具有最小值的概率P2。例如,图2B所示的函数,或具有其他形状的函数可用作第二成员函数μS。
如果第二成员函数μS是图2B所示的函数,则概率P2变成信号-x[i]和-y[j]之间的最小值。
3.运算单元100获得概率P1和P2之间的最大值,确定两个信号x[i]和y[j]都具有大或小值的概率P3,将确定的结果输出到加法单元200。
4.运算单元100执行上面的用于信号x[i+1]和y[j+1]到x[i+M-1]和y[j+M-1]的每一个的程序,确定所有的M个概率P3,并将确定的结果输出到加法单元200。
加法单元200将从运算单元100输入的M个概率P3加起来,并确定表明两个信号x和y之间的相似程度的相关系数。
图4是显示图3所示的运算单元的实施例的框图。运算单元100包括符号判定部分110和最大值确定部分120。
同时,使用下表1可以获得用于确定概率P3的公式6的项。
x[i+k] | y[j+k] | P3 |
+ | + | min(x[i+k],y[j+k]) |
- | - | min(-x[i+k],-y[j+k]) |
+ | - | -min(x[i+k],-y[j+k]) |
- | + | -min(-x[i+k],y[j+k]) |
因此,如图4所示,可以设置用于确定概率P3的运算单元100根据上表使用公式6进行运算。
即,符号判定部分110判定信号x[i+k]和y[j+k]的符号,并输出符号信息。
最大值确定部分120从符号判定部分110接收两个信号x[i+k]和y[j+k]的符号信息,并获得根据上表的概率P3。
图5是显示图3所示的运算单元的实施例的框图。运算单元100包括第一最小值运算部分130、第二最小值运算部分140和最大值运算部分150。
第一最小值运算部分130接收信号x[i+k]和y[j+k],确定信号x[i+k]和y[j+k]之间的最小值,并输出确定结果。
第二最小值运算部分140接收信号x[i+k]和y[j+k],确定通过给每个信号x[i+k]和y[j+k]加上一个负号获得的这些值之间的最小值,并输出确定结果。
最大值运算部分150接收从第一最小值运算部分130输出的值和从第二最小值运算部分140输出的值,确定它们之间的最大值,并确定概率P3。
图6是显示用于利用图3所示的本发明的确定相关系数的设备来确定信号音高的设备的实施例的框图。用于确定信号音高的设备包括相关系数运算单元320和音高确定单元350。
首先,相关系数运算单元320包括运算单元100和加法单元200,如图3所示,如前所述,图4和5显示了运算单元100的实施例。
如图3所示,相关系数运算单元300输出一个相关系数。然而,在图3的相关系数运算单元300和图6的相关系数运算单元320之间有一些差异,即图6的相关系数运算单元320运算和输出多个相关系数,从而获得信号s的音高。即,相关系数运算单元320接收抽样信号s[i+k]和对应于信号s[i+k]的样本L之前的信号的信号s[i+L+k](其中,k是从0到M-1的整数),执行上述运算,并确定一个相关系数。下一步,相关系数运算单元320接收具有样本L的变化的值的一组抽样信号。例如,当前一个信号是s[i+k]和s[i-50+k](其中k是从0到M-1的整数),并且样本L增加1,当前信号变成s[i+k]和s[i-50+k](其中k是从0到M-1的整数)。相关系数运算单元320确定用于信的信号s[i+k]和s[i-50+k]的相关系数。以这种方式,由于样本L的值在预定范围内是可变的,可确定用于每个样本L的值的相关系数,将多个相关系数输出到音高确定单元350。以这种方式,为了获得多个相关系数,应该准备信号s[-PitchMax],s[-PitchMax+1],……,和s[M-1]的PitchMax+M个样本,作为相关系数运算单元320的输入抽样信号。这里,当样本L具有从PitchMin到PitchMax的范围时,PitchMax对应于样本L的最大值。当抽样率是8000样本/秒时,优选PitchMin可以是20个样本,PitchMax可以是147个样本,并且用于确定相关系数和/或查找音高的信号短M可以是120个样本。
音高确定单元350确定从相关系数运算单元输入的多个相关系数中的最大值,并确定使相关系数的值最大的L作为信号s的音高。
图7是显示用于确定信号间的相关系数的方法的实施例的流程图,该方法是由图3所示的本发明的确定信号间的相关系数的设备执行的。
在步骤410,运算单元100接收样本信号x[i+k]和y[j+k](其中k是从0到M-1的整数)。
在步骤420,将加法单元200的变量sum与在运算单元100的变量k设置为0。
在步骤430,将信号x[i+k]和y[j+k]的每一个施加到具有大值的第一模糊集的一第一成员函数μL,确定它们之间的最小值为信号x[i+k]和y[j+k]都具有最大值的概率P1。
在步骤440,将信号x[i+k]和y[j+k]的每一个施加到具有小值的第二模糊集的一第二成员函数μs,确定它们之间的最小值为信号x[i+k]和y[j+k]都具有最小值的概率P2。
在步骤450,运算单元100确定概率P1和概率P2之间的最大值作为两个信号x[i+k]和y[j+k]都具有大或小值的概率P3。
在步骤450之后,在步骤470中,加法单元200接收在步骤450中通过运算单元100获得的概率P3,并通过将变量sum加到概率P3上而获得一个新的变量sum。
在步骤470,运算单元100将变量k增加1。在步骤480中,运算单元判断变量k是否小于M。如果变量k小于M,则该方法返回到步骤430并重复执行步骤430到480的程序,直到变量k不小于M为止。
在步骤490,如果变量k不小于M,则加法单元200判断变量sum的值为相关系数C的值。
图8是显示用于确定信号间的相关系数的方法的实施例的流程图,该方法是由本发明的确定信号间的相关系数的设备执行的。
在步骤510,运算单元100接收信号x[i+k]和y[j+k](其中k是从0到M-1的整数)。
在步骤520中,将加法单元200的变量sum与在运算单元100的变量k设置为0。
在步骤530,运算单元100设置信号x[i+k]为变量s,设置信号y[j+k]为变量t。
在步骤540,运算单元100运算max(min(s,t),min(-s,-t)),并设置它们的值为变量tmp。运算变量tmp的运算与图4和5的运算单元的运算不同,这种运算如上所述。
在步骤540之后,在步骤550中,加法单元200接收在步骤540中通过运算单元100获得的变量tmp,并通过将变量sum加到变量tmp上而获得一个新的变量sum。
在步骤560,运算单元100将变量k增加1。在步骤570中,运算单元判断变量k是否小于M。如果变量k小于M,则该方法返回到步骤530并重复执行步骤530到580的程序,直到变量k不小于M为止。
在步骤590,如果变量k不小于M,则加法单元200判断变量sum的值为相关系数C的值。
图9是显示用于确定信号音高的方法的实施例,它是由本发明的图6所示的确定信号音高的设备执行的。
在步骤610中,相关系数确定单元320接收信号x的一组样本信号x[-PitchMax],x[-PitchMax+1],……,和x[M-1]。
在步骤620中,相关系数确定单元320设置表明查找范围的变量L到PitchMax,并且音高确定单元350设置表明音高的变量P到PitchMin,并设置表示相关系数间最大值的相关系数的变量CMax到0。
在步骤630,相关系数确定单元320通过使用变量x,M和L来计算相关系数C。相关系数的计算可见参考图7和8所进行的描述。
在步骤640,音高确定单元350判断在步骤630中获得的表明相关系数的变量C是否大于CMax。
如果变量C大于CMax,则将变量P设置为变量L的值,变量CMax设置为变量C的值。
在步骤660,如果变量C不大于CMax,则相关系数确定单元320将变量L增加1。
在步骤670,相关系数确定单元320判断变量L是否小于或等于PitchMax。
如果变量L小于或等于PitchMax,则方法返回到步骤630并重复步骤630到570,直到变量L大于PitchMax为止。
在步骤680,如果变量L大于PitchMax,则音高确定单元350确定变量P的值为信号x的音高的值。
本发明还可以以计算机可读记录介质上的可被计算机读取的代码的形式实施。计算机可读记录介质包括所有存储计算机可读数据的记录设备。
计算机可读记录介质包括诸如磁存储介质(例如ROM、软盘、硬盘等)、光可读介质(例如CD-ROM、DVD等)存储介质和载波(例如在英特网上的传输)。同样,计算机可读记录介质可散布到经网络连接的计算机系统上,并可被存储,以及以分布模式作为计算机可读代码执行。
如上所述,本发明的用于确定信号间的相关系数的设备和方法以及用于确定其信号音高的设备和方法,通过利用模糊逻辑获得表明两个信号间相似程度的相关系数,以及获得具有其中相似信号被重复的特征的信号音高,增加了计算速度和计算精度,简化了设备的结构,并降低了能耗。
这里参照优选实施方式对本发明进行了具体的显示和详细描述,但本领域技术人员应当理解的是,不背离如所附的权利要求限定的本发明的精神和范围的各种形式和细节的变化都是允许的。
Claims (16)
1.一种确定信号音高的方法,该方法包括:
(a)将抽样信号x[i+k]和x[i-L+k]施加到下列公式,并获得两个信号x[i+k]和x[i-L+k]都具有大或小值的概率P3;
max[min(μL(x[i+k]),μL(x[i-L+k])),min(μS(x[i+k]),μS(x[i-L+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数;
(b)以整数为单位将所述k从0增加到M-1,重复(a)以获得M个概率P3;
(c)通过加所述M个概率P3来获得表明两个信号x[i+k]和x[i-L+k]之间相似程度的相关系数;
(d)在预定范围内改变所述L并重复(a)到(c);和
(e)确定对应于在(c)获得的多个相关系数中的最大值的L,作为信号x[i+k]的音高。
2.根据权利要求1的方法,其中第一成员函数μL(w)=(w+R)/2R,第二成员函数μS(w)=(-w+R)/2R,式中R是正实数,-R≤w≤R,并且通过将第一成员函数和第二成员函数施加到(a)中的上述公式,然后近似施加了所述第一成员函数和第二成员函数的(a)中的上述公式,以通过下列公式获得概率P3:
max[min(x[i+k],x[i-L+k]),min(-x[i+k],-x[i-L+k])]。
3.根据权利要求2的方法,其中(a)包括:
(a1)判断信号x[i+k]和x[i-L+k]的符号;和
(a2)接收这两个信号的符号信息和信号x[i+k]和x[i-L+k],并根据下表获得概率P3:
x[i+k]
x[i-L+k]
P3
+ + min(x[i+k],x[i-L+k])
-
-
min(-x[i+k],-x[i-L+k])
+
-
-min(x[i+k],-x[i-L+k])
-
+
-min(-x[i+k],x[i-L+k])
4.根据权利要求2的方法,其中(a)包括:
(a1)获得信号x[i+k]和x[i-L+k]之间的最小值;
(a2)获得通过给信号x[i+k]和x[i-L+k]的每一个加上一个负号获得的值之间的最小值;和
(a3)获得在(a1)中获得的值和在(a2)中获得的值之间的最大值,作为概率P3。
5.一种确定信号间的相关系数的方法,该方法包括:
(a)将抽样信号x[i+k]和y[j+k]施加到下列公式,并获得两个信号x[i+k]和y[j+k]都具有大值或小值的概率P3;
max[min(μL(x[i+k]),μL(y[j+k])),min(μS(x[i+k]),μS(y[j+k]))]其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数;
(b)以整数为单位将所述k从0增加到M-1,重复(a)以获得M个概率P3;以及
(c)通过将所述M个概率P3相加来获得表明两个信号x[i+k]和y[j+k]之间的相似程度的相关系数。
6.根据权利要求5的方法,其中第一成员函数μL(w)=(w+R)/2R,第二成员函数μS(w)=(-w+R)/2R,式中R是正实数,-R≤w≤R,并且通过将第一成员函数和第二成员函数施加到(a)中的上述公式,然后近似施加了所述第一成员函数和第二成员函数的(a)中的上述公式,以按照下列公式获得概率P3:
max[min(x[i+k],y[j+k]),min(-x[i+k],-y[j+k])]。
7.根据权利要求6的方法,其中(a)包括:
(a1)判断信号x[i+k]和y[j+k]的符号;和
(a2)接收该两个信号的符号信息和信号x[i+k]和y[j+k],并根据下表获得概率P3:
x[i+k]
y[j+k]
P3
+
+
min(x[i+k],y[j+k])
-
-
min(-x[i+k],-y[j+k])
+
-
-min(x[i+k],-y[j+k])
-
+
-min(-x[i+k],y[j+k])
8.根据权利要求6的方法,其中(a)包括:
(a1)获得信号x[i+k]和y[j+k]之间的最小值;
(a2)获得通过给信号x[i+k]和y[j+k]的每一个加上一个负号获得的值之间的最小值;和
(a3)获得在(a1)中获得的值和在(a2)中获得的值之间的最大值,作为概率P3。
9.一种用于确定信号音高的设备,该设备包括:
操作单元,它接收抽样信号x[i+k]和对应于信号x[i+k]的样本L之前的信号的x[i-L+k],以便通过将信号x[i+k]和x[i-L+k]施加到下列公式来获得两个信号x[i+k]和x[i-L+k]都具有大或小值的概率P3:
max[min(μL(x[i+k]),μL(x[i-L+k])),min(μS(x[i+k]),μS(x[i-L+k]))]
其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数,以整数为单位将所述k从0增加到M-1,并且对相应于所述k的一对信号x[i+k]和x[i-L+k]重复上述操作,以获得M个概率P3;
加法单元,它通过将从操作单元输出的所述M个概率相加获得表明两个信号x[i+k]和x[i-L+k]间相似程度的相关系数,其中当所述L在预定范围内变化时,操作单元确定关于L的每个值的概率P3并将确定结果输出到加法单元,而该加法单元通过将关于L的每个值的所述M个概率相加来确定相关系数并输出多个相关系数;和
音高确定单元,其确定对应于从加法单元输入的多个相关系数中的最大值的L,作为信号x[i+k]的音高。
10.根据权利要求9的设备,其中第一成员函数μL(w)=(w+R)/2R,第二成员函数μS(w)=(-w+R)/2R,式中R是正实数,-R≤w≤R,并且通过将第一成员函数和第二成员函数施加到所述公式,然后近似施加了所述第一成员函数和第二成员函数的所述公式,以便操作单元通过下列公式获得概率P3:
max[min(x[i+k],x[i-L+k]),min(-x[i+k],-x[i-L+k])]。
11.根据权利要求10的设备,其中该操作单元包括:
符号判断部分,它判断信号x[i+k]和x[i-L+k]的符号;和
最大值确定部分,它接收该两个信号的符号信息和信号x[i+k]和x[i-L+k],并根据下表获得概率P3:
x[i+k]
x[i-L+k]
P3
+
+
min(x[i+k],x[i-L+k])
-
-
min(-x[i+k],-x[i-L+k])
+
-
-min(x[i+k],-x[i-L+k])
-
+
-min(-x[i+k],x[i-L+k])
12.根据权利要求10的设备,其中该操作单元包括:
第一最小值操作部分,其接收信号x[i+k]和x[i-L+k],获得它们之间的最小值,并输出该最小值;
第二最小值操作部分,其接收信号x[i+k]和x[i-L+k],获得通过给信号x[i+k]和x[i-L+k]的每一个加上一个负号而获得的值之间的最小值,并输出该最小值;和
最大值操作部分,其接收从第一最小值操作部分输出的值和从第二最小值操作部分输出的值,并获得它们之间的最大值作为概率P3。
13.一种用于确定信号间的相关系数的设备,该设备包括:
操作单元,它接收抽样信号x[i+k]和y[j+k],通过将信号x[i+k]和y[j+k]施加到下列公式获得两个信号x[i+k]和y[j+k]都具有大值或小值的概率P3:
max[min(μL(x[i+k]),μL(y[j+k])),min(μS(x[i+k]),μS(y[j+k]))]
其中k是从0到M-1的整数,所述μL是具有大值的第一模糊集的一第一成员函数,所述μS是具有小值的第二模糊集的一第二成员函数,以整数为单位将所述k从0增加到M-1,并且对相应于所述k的一对信号x[i+k]和y[j+k]重复上述操作,以获得M个概率P3;以及
加法单元,它通过将从操作单元输出的所述M个概率P3相加来获得表明两个信号x[i+k]和y[j+k]间相似程度的相关系数。
14.根据权利要求13的设备,其中第一成员函数μL(w)=(w+R)/2R,第二成员函数μS(w)=(-w+R)/2R,式中R是正实数,-R≤w≤R,并且通过将第一成员函数和第二成员函数施加到所述公式,然后近似施加了所述第一成员函数和第二成员函数的所述公式,以便操作单元通过下列公式获得概率P3:
max[min(x[i+k],y[j+k]),min(-x[i+k],-y[j+k])]。
15.根据权利要求14的设备,其中该操作单元包括:
符号判断部分,它判断信号x[i+k]和y[j+k]的符号;和
最大值确定部分,它接收两个信号和信号x[i+k]和y[j+k]的符号信息并根据下表获得概率P3:
x[i+k]
y[j+k]
P3
+
+
min(x[i+k],y[j+k])
-
-
min(-x[i+k],-y[j+k])
+
-
-min(x[i+k],-y[j+k])
-
+
-min(-x[i+k],y[j+k])
16.根据权利要求14的设备,其中所述操作单元包括:
第一最小值操作部分,其接收信号x[i+k]和y[j+k],获得它们之间的最小值,并输出该最小值;
第二最小值操作部分,其接收信号x[i+k]和y[j+k],获得通过给信号x[i+k]和y[j+k]的每一个加上一个负号而获得的值之间的最小值,并输出该最小值;和
最大值操作部分,其接收从第一最小值操作部分输出的值和从第二最小值操作部分输出的值,并获得它们之间的最大值作为概率P3。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR45567/2002 | 2002-08-01 | ||
KR10-2002-0045567A KR100440973B1 (ko) | 2002-08-01 | 2002-08-01 | 신호간 상관계수 결정 장치 및 방법과 이를 이용한 신호피치 결정 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1472726A CN1472726A (zh) | 2004-02-04 |
CN1214362C true CN1214362C (zh) | 2005-08-10 |
Family
ID=36178287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031484077A Expired - Fee Related CN1214362C (zh) | 2002-08-01 | 2003-06-27 | 用于确定信号间相关系数和信号音高的设备和方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20040024590A1 (zh) |
EP (1) | EP1387348B1 (zh) |
JP (1) | JP2004070353A (zh) |
KR (1) | KR100440973B1 (zh) |
CN (1) | CN1214362C (zh) |
AT (1) | ATE320649T1 (zh) |
DE (1) | DE60304010T2 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8666734B2 (en) | 2009-09-23 | 2014-03-04 | University Of Maryland, College Park | Systems and methods for multiple pitch tracking using a multidimensional function and strength values |
KR101214968B1 (ko) | 2010-12-07 | 2012-12-24 | 서강대학교산학협력단 | 최소위상함수 및 최대위상함수의 계수를 결정하는 방법 |
US9236064B2 (en) | 2012-02-15 | 2016-01-12 | Microsoft Technology Licensing, Llc | Sample rate converter with automatic anti-aliasing filter |
US8365514B1 (en) | 2012-02-27 | 2013-02-05 | United Technologies Corporation | Hybrid turbofan engine |
CN103176951A (zh) * | 2013-04-09 | 2013-06-26 | 厦门大学 | 一种多功能传感器信号重构精度和计算量的平衡方法 |
CN108873901A (zh) * | 2018-06-27 | 2018-11-23 | 深圳市创艺工业技术有限公司 | 一种无人驾驶系统 |
KR102437807B1 (ko) * | 2021-10-14 | 2022-08-30 | 주식회사 인터엠 | 확대가능한 탐색 구간에 대해 판정된 신호 상관관계에 기반한 전관 방송 모니터링 |
KR102437809B1 (ko) * | 2021-10-14 | 2022-08-30 | 주식회사 인터엠 | 간소화된 신호 상관관계 기반의 전관 방송 모니터링 |
KR102517110B1 (ko) * | 2022-08-24 | 2023-04-03 | 주식회사 인터엠 | 네트워크 기반 전관 방송에서의 노이즈 레벨 분석 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0636159B2 (ja) * | 1985-12-18 | 1994-05-11 | 日本電気株式会社 | ピツチ検出器 |
US5292995A (en) * | 1988-11-28 | 1994-03-08 | Yamaha Corporation | Method and apparatus for controlling an electronic musical instrument using fuzzy logic |
JPH05303393A (ja) * | 1992-04-24 | 1993-11-16 | Clarion Co Ltd | 音声認識のパターンマッチング装置 |
US5528699A (en) * | 1992-11-24 | 1996-06-18 | Nippondenso Co., Ltd. | Information medium recognition device |
KR940015920A (ko) * | 1992-12-30 | 1994-07-22 | 이대원 | 추론속도를 개선시킨 퍼지추론방법 |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
JPH06337694A (ja) * | 1993-05-28 | 1994-12-06 | Tokyo Gas Co Ltd | ファジイパターン認識装置 |
JP3500616B2 (ja) * | 1993-11-25 | 2004-02-23 | オムロン株式会社 | 信号波形データ比較装置およびその方法 |
JPH1049189A (ja) * | 1996-07-30 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
KR19990066562A (ko) * | 1998-01-30 | 1999-08-16 | 전주범 | 퍼지 매핑 함수를 이용한 음성 인식의 템플레이트 패턴 매칭 방법 |
KR20000040573A (ko) * | 1998-12-18 | 2000-07-05 | 김영환 | 화자독립 고립단어 음성인식기의 오인식 방지장치 및 방법 |
-
2002
- 2002-08-01 KR KR10-2002-0045567A patent/KR100440973B1/ko not_active IP Right Cessation
-
2003
- 2003-06-26 AT AT03254071T patent/ATE320649T1/de not_active IP Right Cessation
- 2003-06-26 EP EP03254071A patent/EP1387348B1/en not_active Expired - Lifetime
- 2003-06-26 DE DE60304010T patent/DE60304010T2/de not_active Expired - Fee Related
- 2003-06-27 CN CNB031484077A patent/CN1214362C/zh not_active Expired - Fee Related
- 2003-07-15 US US10/618,741 patent/US20040024590A1/en not_active Abandoned
- 2003-07-29 JP JP2003281920A patent/JP2004070353A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1472726A (zh) | 2004-02-04 |
ATE320649T1 (de) | 2006-04-15 |
EP1387348A1 (en) | 2004-02-04 |
EP1387348B1 (en) | 2006-03-15 |
KR20040012156A (ko) | 2004-02-11 |
US20040024590A1 (en) | 2004-02-05 |
KR100440973B1 (ko) | 2004-07-21 |
DE60304010T2 (de) | 2006-09-07 |
DE60304010D1 (de) | 2006-05-11 |
JP2004070353A (ja) | 2004-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1248190C (zh) | 快速频域音调估计方法和装置 | |
CN1139911C (zh) | 语音识别系统的动态可配置声模型 | |
CN1154086C (zh) | Celp转发 | |
CN1103971C (zh) | 语音识别计算机模块及基于音素的数字语音信号变换方法 | |
CN1162839C (zh) | 产生声学模型的方法和装置 | |
CN1146862C (zh) | 音调提取方法和装置 | |
CN101051460A (zh) | 提取语音信号的特性信息的语音信号预处理系统及方法 | |
CN1210685C (zh) | 语音编码中噪音鲁棒分类方法 | |
CN1042790A (zh) | 认人与不认人实时语音识别的方法和装置 | |
CN1266671C (zh) | 估算声音编码器的谐波的装置和方法 | |
CN1151218A (zh) | 用于语音识别的神经网络的训练方法 | |
CN1335980A (zh) | 借助于映射矩阵的宽频带语音合成 | |
CN101034891A (zh) | 基于cabac的编码方法和设备及解码方法和设备 | |
CN1909060A (zh) | 提取浊音/清音分类信息的方法和设备 | |
CN1214362C (zh) | 用于确定信号间相关系数和信号音高的设备和方法 | |
CN1147833C (zh) | 生成和编码线状谱平方根的方法和装置 | |
CN1160450A (zh) | 从连续语音中识别讲话声音的系统及其应用方法 | |
CN1303586C (zh) | 使用共振峰增强对话的方法和装置 | |
CN1532811A (zh) | 用于依佛雷姆-玛拉赫滤波器的精确分段多项式近似 | |
CN1264887A (zh) | 基于语音识别专用芯片的非特定人语音识别、语音提示方法 | |
CN1238513A (zh) | 语音识别方法 | |
CN1201284C (zh) | 一种语音识别系统中的快速解码方法 | |
CN1150852A (zh) | 采用神经网络的语音识别系统和方法 | |
CN101053020A (zh) | 利用信号属性的有效音频编码 | |
CN101030374A (zh) | 基音周期提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20050810 Termination date: 20100627 |