JP3806453B2 - 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置 - Google Patents
音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置Info
- Publication number
- JP3806453B2 JP3806453B2 JP22055395A JP22055395A JP3806453B2 JP 3806453 B2 JP3806453 B2 JP 3806453B2 JP 22055395 A JP22055395 A JP 22055395A JP 22055395 A JP22055395 A JP 22055395A JP 3806453 B2 JP3806453 B2 JP 3806453B2
- Authority
- JP
- Japan
- Prior art keywords
- autocorrelation coefficient
- maximum value
- time axis
- unit
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、音声の固体録音等に利用する音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置に係わり、特に音声信号のピッチ周期における繰り返しを利用して時間軸方向に圧縮、伸長を行う高能率音声符号化装置に関するものである。
【0002】
【従来の技術】
音声の固体録音、音声応答システム等において音声情報の蓄積を行う場合には、蓄積用メモリ容量の削減が重要であるが、音声符号・復号化装置はこの要求を可能にするものである。
【0003】
図8は、従来の音声符号・復号化装置の構成を示したものであって、1は自己相関算出部、2はピッチ周期抽出部、3は時間軸圧縮部、4は符号化部、5はメモリ、6は復号化部、7は時間軸伸長部である。
【0004】
図8において、音声信号入力s(n)の自己相関値を自己相関算出部1で数1に従って求め、ピッチ周期抽出部2によってピッチ周期探索範囲内で最も相関が大きくなる周期をピッチ周期として抽出する。
【0005】
【数1】
【0006】
ここで、ピッチ周期の探索範囲としては、ピッチ周波数の上限、下限を想定し、例えば20≦k≦100(サンプリング周波数が8kHz時)程度の範囲で探索を行う。時間軸圧縮部3は、抽出されたピッチ周期に応じて入力s(n)を時間軸方向に圧縮し、圧縮信号sc(n)を生じる。圧縮信号sc(n)は、符号化部4に加えられて任意の符号化方式、例えばADPCM方式やCELP方式で符号化される。
【0007】
符号化された信号及びピッチ周期情報はメモリ5に記憶される。
【0008】
再生側においては、復号化部6で符号化された信号を復号して圧縮再生信号s’c(n)を求める。この信号を時間軸伸長部7に加え、ピッチ周期の信号を用いて時間軸方向に伸長し、再生出力s’(n)を生じる。
【0009】
図9は図8の音声符号化及び復号化装置における時間軸圧縮と時間軸伸長の処理の例を説明するものであって、図9(a)は時間軸圧縮、図9(b)は時間軸伸長の模式図で、横軸は時間であり、縦軸は振幅を示している。
【0010】
すなわち時間軸圧縮を行う場合は、図9(a)のように抽出されたピッチ周期Pごとに入力s(n)を切り出し、2周期を1組として前の周期の信号には重み窓w(m)を掛け、後の周期の信号には逆特性の重み窓1−w(m)を掛け、それぞれを加算することによって1周期の信号を合成し、1/2に圧縮された圧縮信号sc(n)を得る。
【0011】
一方時間軸伸長を行う場合は、図9(b)のように圧縮再生信号sc’(n)を3周期分とり、前の2周期に重み窓1−w’(m)を掛け、後の2周期に重み窓w’(m)を掛け、それぞれを加算することによって2周期の信号を合成し、次に1周期進んだ時点で同様の操作を繰り返すことにより、2倍に伸長された伸長信号s’(n)を得る。
【0012】
次に、音声信号波形に時間軸圧縮を施した例を図10(a)に示す。図10( a)のような音声信号において、自己相関値を算出する際の積和範囲Nで数1に よりピッチ周期P1を抽出し、上述した通り、図10(a)のa1からa2の位 置までの最初の2周期を1周期の信号に圧縮する。そして図10(a)のa2の位置から再び積和範囲Nでピッチ周期を抽出し圧縮する。これを繰り返すことによって、音声信号波形は半分に圧縮することができる。
【0013】
【発明が解決しようとする課題】
然し乍ら、従来の音声符号・復号化装置において、ピッチ周期を抽出する際に、上述のような抽出手法では、音声信号が周期性のない無声音の部分では、ピッチ周期を抽出することができない。また、図10(b)の音声信号のように積和範囲Nの中でピッチ周期が変動している場合は、正確なピッチ周期を抽出することができない。
【0014】
従ってこのような場合には、ランダムな値に設定されたピッチ周期に応じて、圧縮及び伸長が行われるため、波形の性質が保存されず、再生音声の明瞭度が悪くなる等の品質劣化を生じるという問題がある。
【0015】
さらに、図10(a)のような音声信号においては、最初に抽出したピッチ周期と次に抽出したピッチ周期が同じ値になり、ピッチ周期抽出の効率が悪く、ピッチ周期が短い場合は特に処理負荷が増大するという問題がある。
【0016】
【課題を解決するための手段】
本発明は上記問題点を解決するために、入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値と閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記判定部の比較判定結果に応じて前記音声信号の時間軸圧縮処理を行う時間軸圧縮部とを有する音声符号化手段と、
前記判定部の比較判定結果に応じて時間軸伸長処理を行う時間軸伸長部を有する音声復号化手段を備える。
【0017】
そして、前記自己相関係数の最大値が前記閾値tより大きい場合は、前記音声符号化手段で時間軸圧縮処理を行うと共に前記音声復号化手段で時間軸伸長処理を行い、一方前記自己相関係数の最大値が前記閾値tより小さい場合は、前記音声符号化手段で時間軸圧縮処理を行わないと共に前記復号化手段で時間軸伸長処理を行わないことが望ましい。
【0018】
また、前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で該自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことが望ましい。
【0019】
さらに、前記ピッチ周期抽出部が抽出したピッチ周期が前記自己相関係数を算出する際の積和範囲のなかに含まれる個数rc(但し、rcは整数)を求め、前記時間軸圧縮部が前記rc個のピッチ周期波形を1ピッチ周期波形に時間軸圧縮し、前記時間軸伸長部が1ピッチ周期波形を前記rc個のピッチ周期波形に時間軸伸長することが望ましい。
【0020】
あるいは、本発明は上記問題点を解決するために、入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値が閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記判定部の比較判定結果に応じて前記音声信号の時間軸圧縮処理を行う時間軸圧縮部を備える。
【0021】
そして、前記自己相関係数の最大値が前記閾値tより大きい場合は、時間軸圧縮処理を行い、一方前記自己相関係数の最大値が前記閾値tより小さい場合は時間軸圧縮処理を行わないことが望ましい。
【0022】
また、前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で前記自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことが望ましい。
【0023】
さらに、前記ピッチ周期抽出部が抽出したピッチ周期が前記自己相関係数を算出する際の積和範囲のなかに含まれる個数rc(但し、rcは整数)を求め、前記時間軸圧縮部が前記rc個のピッチ周期波形を1ピッチ周期波形に時間軸圧縮することが望ましい。
【0024】
あるいは、本発明は上記問題点を解決するために、入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値が閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記判定部の比較判定結果に応じて前記音声信号の時間軸伸長処理を行う時間軸伸長部を備える。
【0025】
そして、前記自己相関係数の最大値が前記閾値tより大きい場合は、時間軸伸長処理を行い、一方前記自己相関係数の最大値が前記閾値tより小さい場合は時間軸伸長処理を行わないことが望ましい。
【0026】
また、前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で該自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことが望ましい。
【0027】
【発明の実施の形態】
<音声符号・復号化装置>
以下、本発明の音声符号・復号化装置を図1から図5に従って説明する。尚、本発明に係るそれぞれの構成要素が従来の音声符号・復号化装置のそれと同一である場合には、同一番号を付すものとする。
【0028】
図1(a)は本発明の実施の一形態を説明するための符号化側概略ブロック図であって、11は入力音声信号の自己相関係数を算出する自己相関係数算出部、12は自己相関係数の最大値を検出する最大値検出部、13はその最大値が閾値tより大きいか小さいかを判定する判定部であり、この判定部の判定結果を示す判定信号はメモリ5に送出される。閾値tの値は0≦t≦1であり、圧縮率を高める場合には0付近の値を用い、一方再生音声の歪みを小さくする場合は1付近の値を用いる。
【0029】
14は自己相関係数を算出する際の積和範囲Nを短くして自己相関係数算出部11に戻す積和範囲縮小部、15は判定部13の結果によって切り替えるスイッチ、16はピッチ周期抽出部、17は時間軸圧縮を行う際の圧縮率(=入力音声波形長/出力音声波形長)を決定する圧縮率決定部、18は入力音声の時間軸圧縮を行う時間軸圧縮部である。
【0030】
図1(b)は本発明の実施の一形態を説明するための復号化側概略ブロック図であって、19はメモリ5に格納された判定信号によって切り替えるスイッチ、20は時間軸伸長を行う際の伸長率(=出力音声波形長/入力音声波形長)を決定する伸長率決定部、21は時間軸伸長を行う時間軸伸長部、22は19のスイッチと連動するスイッチである。
【0031】
次に、上述の構成における機能を説明する。
【0032】
図1(a)において、自己相関係数算出部11は入力音声信号の自己相関係数を数2によって求める。
【0033】
【数2】
【0034】
次に、第一のピッチ周期探索範囲20≦k≦100(サンプリング周波数が8kHz時)内でその自己相関係数の最大値を最大値検出部12で検出し、その最大値が閾値tよりも大きいか小さいかを判定部13で判定する。図2のように音声信号が周期性を持つ場合は、その自己相関係数の最大値は閾値tよりも大きく、一方音声信号が周期性を持たない場合は、閾値tよりも小さくなる。
【0035】
但し、図3のように音声信号が周期性をもっていても積和範囲N内でピッチ周期が変動している場合は、自己相関係数の最大値は閾値tよりも小さくなる。このため、閾値tよりも小さい場合は積和範囲縮小部14で積和範囲Nを減少させ、再度自己相関係数を算出し、第二のピッチ周期探索範囲内でその自己相関係数の最大値を最大値検出部12で検出すれば、その最大値は閾値tよりも大きくなる。ここで、第二のピッチ周期探索範囲は、通常は第一のピッチ周期探索範囲と同一であるが積和範囲Nの値が小さくなればそれに応じて探索範囲を狭くする。例えば、N≧150の場合は20≦k≦100、150>N≧120の場合は20≦k≦80、120> N≧90の場合は20≦k≦50にする。
【0036】
上述のように再度自己相関係数を算出しても、判定部13で自己相関係数が閾値tよりも小さいと判定された場合は、スイッチ15を端子aの方に接続すると共に判定信号h=0を出力し、一方判定部13で閾値tよりも大きいと判定された 場合は、スイッチ15を端子bの方に接続すると共に判定信号h=1を出力する。
【0037】
スイッチ15を端子aに接続した場合、即ち入力音声信号が周期性を持たない場合は、音声信号を直接符号化部4に入力する。
【0038】
スイッチ15を端子bに接続した場合、即ち入力音声信号が周期性を持つ場合は、以下の手順で音声信号の時間軸圧縮を行う。
【0039】
まずピッチ周期抽出部16で自己相関係数が最大になる遅延量kをピッチ周期として抽出する。次に、圧縮率決定部17で積和範囲N1とピッチ周期P1に基づいて数3により圧縮率rcを決定する。
【0040】
【数3】
【0041】
そして、時間軸圧縮部18が、ピッチ周期及び圧縮率の値に基づいて時間軸圧縮を行う。
【0042】
図2は、積和範囲N1の中に周期P1の周期波形が4つ含まれ、圧縮率rc=4で時間軸圧縮した場合を示す。図3は、積和範囲N1内でピッチ周期が変動しており 自己相関係数の最大値が閾値tよりも小さいため、積和範囲をN2に縮小し再度 自己相関係数を算出して閾値tよりも大きくなった場合で、圧縮率rc=2で圧縮した様子を示す。
【0043】
符号化部4では、スイッチ15が端子aに接続している場合は,入力音声信号を符号化し、スイッチ15が端子bに接続している場合は時間軸圧縮した信号を符号化し符号を出力する。
【0044】
メモリ5には、符号、圧縮率、ピッチ周期及び判定信号を記録する。
【0045】
図1(b)において、まず符号を復号化部6で復号化する。次に、判定信号がh=0の場合はスイッチ19を端子cに接続し、h=1の場合は端子dに接続する。
【0046】
スイッチ19を端子cに接続した場合は、復号化音声が直接出力される。
【0047】
スイッチ19を端子dに接続した場合は、伸長率決定部20で圧縮率をもとに伸長率を決定する。伸長率は圧縮率と一致させることが多い。時間軸伸長部21では、伸長率及びピッチ周期の値に基づいて時間軸伸長を行う。
【0048】
スイッチ22はスイッチ19と連動し、再生音声を出力する。即ち、スイッチ19が端子cに接続している場合はスイッチ22は端子eに接続し、スイッチ19が端子dに接続している場合はスイッチ22は端子fに接続する。
【0049】
次に、全体の処理フローを図4及び図5を用いて説明する。
【0050】
図4は符号化側の処理フローである。ステップS11で自己相関係数を算出する際の積和範囲N1(例えばN1=200)を設定する。ステップS12では変数i を0に設定する。ステップS13では入力音声信号の自己相関係数を算出する。 ステップS14ではステップS13で求めた自己相関係数の中から最大値を検出する。ステップS15ではその最大値が閾値tより小さいか大きいかを判断する。閾値tより小さい場合はステップS16へ、大きい場合はステップS20へ進む。
【0051】
ステップS16では変数iが2よりも小さいか大きいかを判断し、小さい場合 はステップS17へ、大きい場合はステップS19へ進む。ステップS17では変数iをインクリメントする。ステップS18では積和範囲N1を例えば50減少 させ(N2=N1−50)、ステップS13へ戻す。ステップS19ではスイッチ15を端子aに接続し、ステップS20へ進んだ場合はスイッチ15を端子bに接続する。ステップS21では自己相関係数が最大となるときの遅れkをピッチ周期 とし、ステップS22では圧縮率を決定し、ステップS23で時間軸圧縮を行う。ステップS24では符号化を行い、最後にステップS25で符号,圧縮率、ピッチ周期及び判定結果をメモリに格納する。
【0052】
図5は復号化側の処理フローである。ステップS31でメモリから符号,圧縮率、ピッチ周期及び判定結果を読み出す。ステップS32では復号化を行う。ステップS33では判定信号hが0か1かを判断する。h=1の場合はステップS34に進みスイッチ19を端子dに接続し、h=0の場合はステップS38に進み端子c に接続する。ステップS34でスイッチ19を端子dに接続した場合はステップS35で伸長率を決定する。伸長率は圧縮率と一致させることが多い。
【0053】
次に、ステップS36で時間軸伸長を行い、ステップS37でスイッチ22を端子fに接続する。スイッチ19を端子cに接続した場合はステップS39でスイッチ22を端子eに接続する。最後に、ステップS40で再生音声が出力される。
<音声信号時間軸圧縮装置>
以下、本発明の音声信号時間軸圧縮装置を図6に従って説明する。尚、本音声信号時間軸圧縮装置に係わるそれぞれの構成要素が音声符号・復号化装置のそれと同一である場合には、同一番号を付すものとする。
【0054】
図6において、自己相関係数算出部11、最大値検出部12、判定部13、積和範囲縮小部14、スイッチ15、ピッチ周期抽出部16、時間軸圧縮部18は図1の音声符号・復号化装置のそれと同一であるため説明は割愛する。
【0055】
23は圧縮率決定部で、自己相関係数を算出する際の積和範囲N1とピッチ周 期P1により、圧縮率rcは、1<rc≦[N1/P1]の範囲で決定する(但し、[]はガウス記号でその記号内の数を越えない最大の整数を表す。)。24はス イッチでスイッチ15と連動し、音声を出力する。即ち、スイッチ15が端子aに接続している場合はスイッチ24は端子gに接続し、スイッチ15が端子bに接続している場合はスイッチ24は端子hに接続する。
<音声信号時間軸伸長装置>
以下、本発明の音声信号時間軸伸長装置を図7に従って説明する。尚、本音声信号時間軸伸長装置に係わるそれぞれの構成要素が音声符号・復号化装置あるいは音声信号時間軸圧縮装置のそれと同一である場合には、同一番号を付すものとする。
【0056】
図7において、自己相関係数算出部11、最大値検出部12、判定部13、積和範囲縮小部14、スイッチ15、ピッチ周期抽出部16、スイッチ24は図6の音声信号時間軸圧縮装置のそれと同一であり、21は図1の音声符号・復号化装置のそれと同一であるため説明は割愛する。
【0057】
25は伸長率決定部で、伸長率reを決定する。ここで、伸長率reは任意であるが一般的には、1<re≦3の範囲で決定することが多い。
【0058】
【発明の効果】
以上説明したように、音声信号が周期性のない無声音の場合は、時間軸圧縮及び伸長を行わないため、波形の性質が保存でき、再生音声の明瞭度が悪くなる等の品質劣化を防ぐことができるという効果を奏する。
【0059】
また、音声信号のピッチ周期が変動している場合でも、自己相関係数を算出する際の積和範囲を縮小することにより、正確なピッチ周期を求めることができるため、時間軸圧縮及び伸長を行っても、波形の性質が保存でき、再生音声の明瞭度が悪くなる等の品質劣化を防ぐことができるという効果を奏する。
【0060】
さらに、音声信号が周期性をもち同じピッチ周期が連続する場合、時間軸圧縮及び伸長を行う際の圧縮率及び伸長率を高めることによって、ピッチ周期抽出の処理負荷を軽減し、再生音声の品質を劣化させずに音声符号・復号化装置の圧縮率を高めることができるいう効果を奏する。
【図面の簡単な説明】
【図1】本発明の音声符号・復号化装置の概略ブロック図である。
【図2】本発明による音声信号の時間軸圧縮例である。
【図3】本発明による音声信号の時間軸圧縮例である。
【図4】本発明の音声符号・復号化装置の符号化側処理フローである。
【図5】本発明の音声符号・復号化装置の復号化側処理フローである。
【図6】本発明の音声信号時間軸圧縮装置の概略ブロック図である。
【図7】本発明の音声信号時間軸伸長装置の概略ブロック図である。
【図8】従来の音声符号・復号化装置の概略ブロック図である。
【図9】音声信号の時間軸圧縮及び伸長方法の説明図である。
【図10】従来技術による音声信号の時間軸圧縮例である。
【符号の説明】
1 … 自己相関算出部
2 … ピッチ周期抽出部
3 … 時間軸圧縮部
4 … 符号化部
5 … メモリ
6 … 復号化部
7 … 時間軸伸長部
11 … 自己相関係数算出部
12 … 最大値検出部
13 … 判定部
14 … 積和範囲縮小部
15 … スイッチ
16 … ピッチ周期抽出部
17 … 圧縮率決定部
18 … 時間軸圧縮部
19 … スイッチ
20 … 伸長率決定部
21 … 時間軸伸長部
22 … スイッチ
23 … 圧縮率決定部
24 … スイッチ
25 … 伸長率決定部
Claims (3)
- 入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値と閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記音声信号の時間軸圧縮処理を行う時間軸圧縮部とを有する音声符号化手段と、
前記時間軸圧縮部により時間軸圧縮処理された前記音声信号の時間軸伸長処理を行う時間軸伸長部を有する音声復号化手段とを備え、
前記判定部による大小比較の結果、前記自己相関係数の最大値が前記閾値tより大きい場合は、前記時間軸圧縮部で時間軸圧縮処理を行うと共に前記時間軸伸長部で時間軸伸長処理を行い、前記自己相関係数の最大値が前記閾値tより小さい場合は、前記時間軸圧縮部で時間軸圧縮処理を行わないと共に前記時間軸伸長部で時間軸伸長処理を行わないことに加え、
前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で該自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことを特徴とする音声符号・復号化装置。 - 入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値が閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記音声信号の時間軸圧縮処理を行う時間軸圧縮部を備え、
該時間軸圧縮部は、前記判定部による大小比較の結果、前記自己相関係数の最大値が前記閾値tより大きい場合は時間軸圧縮処理を行い、前記自己相関係数の最大値が前記閾値tより小さい場合は時間軸圧縮処理を行わないことに加え、
前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で該自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことを特徴とする音声信号時間軸圧縮装置。 - 入力音声信号の自己相関係数を算出する自己相関係数算出部と、第一のピッチ周期探索範囲内で該自己相関係数の最大値を検出する最大値検出部と、該自己相関係数の最大値が閾値tとの大小比較を行う判定部と、前記自己相関係数が最大となる遅延量kを前記音声信号のピッチ周期とするピッチ周期抽出部と、前記音声信号の時間軸伸長処理を行う時間軸伸長部を備え、
該時間軸伸長部は、前記判定部による大小比較の結果、前記自己相関係数の最大値が前記閾値tより大きい場合は時間軸伸長処理を行い、前記自己相関係数の最大値が前記閾値tより小さい場合は時間軸伸長処理を行わないことに加え、
前記自己相関係数の最大値が前記閾値tより小さい場合に、前記自己相関係数を算出する際の積和範囲を縮小して、前記自己相関係数算出部で再度自己相関係数を算出し直し、前記最大値検出部によって第二のピッチ周期探索範囲内で該自己相関係数の最大値を検出し、前記判定部で再度該自己相関係数の最大値と前記閾値tとの大小比較を行うことを特徴とする音声信号時間軸伸長装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22055395A JP3806453B2 (ja) | 1995-08-29 | 1995-08-29 | 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22055395A JP3806453B2 (ja) | 1995-08-29 | 1995-08-29 | 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0962298A JPH0962298A (ja) | 1997-03-07 |
JP3806453B2 true JP3806453B2 (ja) | 2006-08-09 |
Family
ID=16752803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22055395A Expired - Fee Related JP3806453B2 (ja) | 1995-08-29 | 1995-08-29 | 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3806453B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3639461B2 (ja) * | 1998-09-29 | 2005-04-20 | 三洋電機株式会社 | 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置 |
EP1779664A1 (fr) * | 2004-07-23 | 2007-05-02 | Pascale Loiseau | Procede de reduction de la taille des donnees d'un fichier numerique audio, image ou video par desynchronisation des criteres originels de lecture. |
DE102005045627A1 (de) | 2005-06-22 | 2007-01-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Durchführen einer Korrelation zwischen einem Testtonsignal, das mit variabler Geschwindigkeit abspielbar ist, und einem Referenztonsignal |
US7948557B2 (en) | 2005-06-22 | 2011-05-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a control signal for a film event system |
DE102005045573B3 (de) * | 2005-06-22 | 2006-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Stelle in einem Film |
JP2007304515A (ja) * | 2006-05-15 | 2007-11-22 | Sony Corp | オーディオ信号伸張圧縮方法及び装置 |
JP2011203482A (ja) * | 2010-03-25 | 2011-10-13 | Yamaha Corp | 音声処理装置 |
-
1995
- 1995-08-29 JP JP22055395A patent/JP3806453B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0962298A (ja) | 1997-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2884163B2 (ja) | 符号化伝送装置 | |
KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
JP4649208B2 (ja) | オーディオコーディング | |
US7664650B2 (en) | Speech speed converting device and speech speed converting method | |
CN103325377B (zh) | 音频编码方法 | |
MX2007011102A (es) | Tramas que distorsionan el tiempo dentro del vocoder modificando el residuo. | |
US6272459B1 (en) | Voice signal coding apparatus | |
WO2003010752A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
JP2003501675A (ja) | 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置 | |
US7072830B2 (en) | Audio coder | |
JP3806453B2 (ja) | 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置 | |
JP4550176B2 (ja) | 音声符号化方法 | |
US7269559B2 (en) | Speech decoding apparatus and method using prediction and class taps | |
JP3404350B2 (ja) | 音声符号化パラメータ取得方法、音声復号方法及び装置 | |
CA2424558C (en) | Pitch cycle search range setting apparatus and pitch cycle search apparatus | |
EP1306831A1 (en) | Digital signal processing method, learning method, apparatuses for them, and program storage medium | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JP3559485B2 (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP2797348B2 (ja) | 音声符号化・復号化装置 | |
WO2004040552A1 (ja) | トランスコーダ及び符号変換方法 | |
JP3607774B2 (ja) | 音声符号化装置 | |
JPH0573098A (ja) | 音声処理装置 | |
JPH10124097A (ja) | 音声記録再生装置 | |
JP2582763B2 (ja) | 音声分析合成装置 | |
KR100584282B1 (ko) | 오디오 신호 코딩장치 및 코딩방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040308 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040427 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20040521 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060515 |
|
LAPS | Cancellation because of no payment of annual fees |