JP2003500708A - 音声信号送信システム - Google Patents
音声信号送信システムInfo
- Publication number
- JP2003500708A JP2003500708A JP2001500258A JP2001500258A JP2003500708A JP 2003500708 A JP2003500708 A JP 2003500708A JP 2001500258 A JP2001500258 A JP 2001500258A JP 2001500258 A JP2001500258 A JP 2001500258A JP 2003500708 A JP2003500708 A JP 2003500708A
- Authority
- JP
- Japan
- Prior art keywords
- time
- signal
- frequency
- audio signal
- frequency change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 62
- 230000005540 biological transmission Effects 0.000 title claims abstract description 26
- 230000008859 change Effects 0.000 claims abstract description 55
- 230000000737 periodic effect Effects 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims abstract description 17
- 238000005311 autocorrelation function Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 11
- 238000005070 sampling Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
、少なくとも一つの周期的な成分の周波数を決定する手段を有し、前記送信機が
、受信機に少なくとも一つの周期的な成分の当該周波数を表す信号を送信する送
信手段を更に有し、当該受信機が、前記送信機から当該周波数を表す信号を受信
する受信手段と、前記少なくとも一つの周期的な成分の当該周波数に基づいて復
元された音声信号を導出する復号器とを有する、送信システムに関する。
テム、符号化方法および復号化方法、当該方法を実行するコンピュータプログラ
ムを有する有形媒体、信号、およびこのような信号を保持する記録媒体にも関す
る。
する送信媒体上に送信されなければならないか、または限定された記憶容量を有
する記憶媒体に格納されなければならないアプリケーションで使用される。この
ようなアプリケーションの具体例は、インターネット上の音声信号の送信と、携
帯電話から基地局へおよびその逆の音声信号の送信と、CD-ROM、固体状態メモリ
またはハードディスクドライブの音声信号の記憶である。
するために試みられてきた。これら動作方法の一つの場合、送信される音声信号
は、10〜20 msの長さを有する複数のセグメントに分割される。当該セグメント
の各々において、音声信号は、これらの振幅とこれらの周波数によって規定され
ている複数の正弦波によって表される。この符号器において、正弦波の振幅と周
波数が、決定される。
て実行されるこの動作は、チャネル符号化、インターリービング、および変調を
含むことが出来る。
デ・インターリービング(de-interleaving)、およびチャネル復号化のような動
作を実行する。この復号器は、受信機から音声信号の表現を得、かつ符号化され
た信号によって記載される複数の正弦波を生成しかつそれらを復元された音声信
号に結合することによって、それから復元された音声信号を導出する。
れた音声信号と元の音声信号間に、まだ、聞き取れる違いが存在する。
載の送信システムを提供することである。
号器が、既定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を決
定する周波数変化決定手段を更に有することである。
元された音声信号の品質は、二つの方法で改善することが出来る。第一の方法は
、復元された音声信号を導出するために当該周波数変化を使用することが出来る
受信機に周波数変化を送信することである。この第二の方法は、音声信号の周波
数のより正確な値を得るためにこの周波数変化を使用することである。これを、
例えば、音声信号のピッチ、または音声信号の任意の周期的な成分とすることが
出来る。既定時間にわたる周波数変化を使用することによって、当該基本的周波
数に対応する平均の周波数値を、より正確に決定することが出来る。
数変化を表す別の信号を送信するように構成されていて、前記受信機が、当該別
の信号を受信するように構成されいて、かつ前記復号器が、当該周波数の当該変
化にも基づいて当該復元された音声信号を導出するように構成されている点であ
る。
の合成間隔内の周波数において(僅かに)変化する正弦波を、復元された音声信
号を生成する際に使用する。これは、より実際の音声信号の特性に対応し、この
結果、品質が改良された復元された音声信号が得られる。
号を得る時間変換手段を有し、前記時間変換された入力信号が、前記入力信号よ
り小さい周波数変化を有するように、前記時間変換手段が、前記既定時間の第一
部分の間前記入力信号を時間圧縮し、かつ前記既定時間の第二部分の間前記入力
信号を時間伸張するように、構成されていることである。
も呼ばれる時間変換を使用することは、符号化される信号の周波数変化を取扱う
効果的方法であることが証明されている。適切な時間変換を使用することによっ
て、周波数が変化する信号を、周波数が実質的に一定の時間変換された信号に変
換することが可能になる。
ントの終わりでより高い周波数で終わる線形周波数掃引を有する音声信号である
。セグメントの第一部分において入力信号を時間圧縮することによって、時間変
換された信号の周波数は、元の入力信号の周波数より高くなる。セグメントの第
二部分において、入力信号を時間伸長することによって、時間変換された信号入
力信号の周波数は、元の入力信号の周波数より低くなる。
周波数が減少した、時間変換された入力信号が、得られる。時間変換を適切に選
択すると、周波数変化が減少した変換された入力信号を得ることが可能になる。
の時間変換された、各々異なる時間変換に対応する入力信号を導出するように構
成されていて、かつ前記符号器が、当該既定時間にわたる最も小さい周波数変化
を有する前記時間変換された入力信号に対応する前記時間変換を選択する決定手
段を有することである。
小さい周波数変化を有する変換された音声信号を選択することである。
己相関関数の前記最も高いピークを有する前記時間変換された入力信号を選択す
ることによって、当該既定時間にわたる前記最も小さい周波数変化を有する前記
時間変換された入力信号を選択するように構成されていることである。
様々な時間変換された入力信号の自己相関関数を計算することである。その自己
相関関数の最も高いピークを有するこの変換された時間音声信号は、最も小さい
周波数変化を有する。これに代えて、時間変換された入力信号のFFTを計算する
ことも、また可能である。その時、FFT領域の最も高いピークになる時間変換さ
れた音声信号は、最も一定した周波数を有する。
が、前記実時間と前記変換された時間との間の二次の関係によって規定されるこ
とである。
、かつ、時間セグメントの第一部分の時間圧縮と時間セグメントの第二部分の時
間伸長とを達成することが出来る。
記変換された時間τとの関係が、
前記持続時間である)によって規定されことである。
号セグメントの間に、時間圧縮と時間伸長を得ることが、可能である。一つしか
パラメータを有しないことが有利な点は、送信機に最適の時間変換を送信するた
めに必要とされるビット数が減少することである。更に、この時間変換関数によ
り、入力信号の線形周波数変化を完全に除去することが可能であることを、示す
ことが出来る。
器4の入力に与えられる。音声符号器4において、この入力音声信号は、周波数変
化決定手段8の入力と、ここではタイム・ワーパ(time warper)6である時間変換
手段の入力とに適用される。
ーパ6の制御入力に接続されている。この出力信号aは、入力信号の周期的な成分
の周波数変化を表す。タイム・ワ―パ6は、このパラメータaによって規定される
時間変換をその入力信号に実行する。このパラメータaは、タイム・ワーパ6の出
力信号の周期的な成分の周波数が最小となるように選択される。
波数を表す信号PITCHが、現れる。音声符号化の場合、この信号PITCHは、音声信
号のピッチを表す。
定するように構成されているアナライザ10の入力に接続される。第一の可能性は
、アナライザ10が、入力信号の複数のLPC係数を決定する線形予測アナライザで
あることである。これに代えて、このアナライザ10は、タイム・ワーパ6の出力
信号に存在する複数の正弦波成分の振幅と周波数を直接決定することも可能であ
る。
幅および周波数)を表すアナライザ10の出力は、マルチプレクサ12の対応する入
力に与えられる。このマルチプレクサ12の出力は、受信機16にマルチプレクサ12
の出力信号を送信する送信手段14の入力に接続される。
ービング、および変調のような動作を実行する。本発明を、ハードディスクまた
は光ディスク(CD、DVD)のような記録媒体上の符号化された音声信号を記録す
るために使用する場合、変調ステップは、省くことが出来る。このような場合、
変調符号は、しばしば、記録媒体に書き込まれる信号のスペクトルを整形するた
めに使用される。
て処理される。受信手段18は、復調、デ・インターリービング、およびチャネル
復号化を実行するように構成されている。受信手段18の出力信号は、復号器20の
入力に接続される。復号器20において、受信手段18の出力信号は、デマルチプレ
クサ22の入力に接続される。
。信号PITCHとLPCは、これらのパラメータから復元された音声信号を導出するシ
ンセサイザ24において使用される。ピッチ信号と複数のLPCパラメータとに基づ
いて復元された音声信号を導出するこのようなシンセサイザの動作は、国際特許
出願 WO99/03095-A1に詳述されている。
に接続される。デ・ワーパ26は、タイム・ワーパ6によって入力信号から除去さ
れた周波数バリエーションを再導入する。復元された音声信号は、デ・ワーパ26
の出力から選られる。
る:
持続時間であり、tはリアル・タイムを表し、τは変換された時間である。ワー
ピングパラメータaの値は、ワーピング機能が常に時間tとともに増加することが
保証される範囲を有する。これは、次式を導く:
グメントの持続時間に等しくなるように選ばれる。ワープされたセグメントのス
タートと終わりの値は、元の音声セグメントのスタートと終わりの値に等しい。
って決定することが出来る。これは、次式になる:
1より大きいときに起こる。(3)から、a> 0の場合、t <T/2に対して時間圧縮が起
こり、t > T/2に対して時間伸長が、起こることがわかる。a <0の場合、t> T/2
に対して時間圧縮が起こり、t <T/2に対して時間伸長が起こる。
合、τはtに等しく、かつタイム・ワーピングは起こらない。
る。信号s(t)が発声音のような時間で変化する周期性を有する信号の場合、これ
は、次式のように書くことが出来る:
る。時間変換された信号s'(τ)に対しては、次の式を書くことが出来る:
来る:
波数が、元の信号のkth高調波の平均の周波数に等しいということである。 これは、次式から容易にわかる:
除去することが可能であることが、下記に示される。
力信号を有すると仮定する。この信号の角周波数に対しては、次の様に書くこと
が出来る:
一定の値に一致する。
ルタ30に与えられる。このウエイティングフィルタ30は、適応LPC逆フィルタで
ある。ウエイティングフィルタ30の出力信号は、LPC残差である。入力信号に代
えて、予測残差を使用することは、基本的周波数の周波数(ピッチ)の決定との
フォルマント相互作用を最小にするという効果を有する。
。この低域フィルタは、約1100Hzの遮断周波数を有する。低域フィルタ32の出力
は、複数のタイム・ワーパ34, 42、および50の入力に接続されている。これらタ
イム・ワーパ34、42、および50は、(1)に従うが、各々は異なるパラメータaの値
を有する時間変換を実行するように構成されている。
出力信号の自己相関関数の近似である尺度を決定する相関器37、41、および51の
入力に接続されている。相関器37、41、および51は、自己相関関数が、分析して
いる信号のパワー・スペクトルから、逆FFTを計算することによって決定するこ
とが出来るという特性を使用する。パワー・スペクトルの近似としては、高速フ
ーリエ変換の絶対値も、使用することが出来る。いくつかの男性の声において発
生する可能性がある極めて長いピッチ間隔(最高25msec)を取扱うために、分析
ウインドウには、64 msecという相対的に長い持続時間が与えられる。この長い
分析ウインドウの選択は、タイム・ワーピング動作により可能になり、これによ
りより定常的な時間変換された信号が得られる。
りフーリエ変換される。これらのフーリエ変換器は、これらの入力信号のFFTの
絶対値を決定する。その後、第一フーリエ変換器36、44、および52の出力信号の
いわゆる「0位相関数」zj(n) が、逆第一フーリエ変換器38、46、および54を使
用して、振幅スペクトルの逆FFTを計算することによって決定される。
して正規化される。正規化装置40, 48、および56の出力は、適切値としてnのゼ
ロでない値に対して最も高いピークを有する0位相関数に対応するタイム・ワー
ピング・パラメータaを選択する選択手段58の入力に接続される。これは、適切
にワープされた信号は、最も一定した周波数Ωk(τ)を示すという認識に基づく
。従って、この信号は、その自己相関関数内で最大のピークを有する。
記載されて来た。現実に実施する場合、これらの動作は、離散時間システムで実
施されるべきである。持続時間Tを有する入力信号のセグメントが、Nサンプルに
よって表される場合、ワープされたセグメントもまた、持続時間Tを有し、かつN
サンプルによって表されるであろう。しかしながら、タイム・ワープされた信号
のサンプリング時点は、元の入力信号のサンプリング時点に対応しない。これは
、図4のタイム・ワーパとして、および図5のタイム・デ・ワーパとして示される
。
力信号に対応する。図4の矢印64によって示されているように、グラフ62のサン
プリング時点j=2は、グラフ60のサンプル時点i=2とi=3の間の時点に対応する。
これは、時間圧縮に対応する。図4の矢印66によって示されているように、グラ
フ62のサンプリング時点j=N-1は、グラフ60のサンプル時点N-2とN-1の間の時点
に対応する。これは、時間伸長に対応する。
ければならず、これは次式によって与えられる:
ことによって行われる。tのこの値から、サンプリング格子上の最も近い値が、
決定される。これは、次式によるiの二つの値になる:
れたサンプル値が、次式に従って計算される:
も出来ることも判明している。
するアンワープされた時間スケールを示す。
応するサンプルが決定されなければならない tiの値は、次式から得られる。
るように、所定のtiに対応するτの値を決定することを続ける。tのこの値から
、サンプリング格子上の最も近い値が、決定される。この結果、次式によりjの
二つの値が得られる:
能なプロセッサで実行するプログラムを使用することによって実施することが出
来ることは理解されるであろう。また、これらの実施の組み合わせを使用するこ
とも可能である。
のグラフを示す。
時間信号のグラフを示す。
Claims (26)
- 【請求項1】 音声信号を符号化する符号器を有する送信機を有し、前記符号器が、少なくと
も一つの周期的な成分の周波数を決定する手段を有し、前記送信機が、受信機に
少なくとも一つの周期的な成分の当該周波数を表す信号を送信する送信手段を更
に有し、当該受信機が、前記送信機から当該周波数を表す信号を受信する受信手
段と、前記少なくとも一つの周期的な成分の当該周波数に基づいて復元された音
声信号を導出する復号器とを有する、送信システムにおいて、前記符号器が、既
定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を決定する周波
数変化決定手段を更に有することを特徴とする送信システム。 - 【請求項2】 前記送信手段が、前記受信機に当該周波数変化を表す別の信号を送信するよう
に構成されていて、かつ前記受信機が、当該別の信号を受信するように構成され
いて、かつ前記復号器が、当該周波数の当該変化にも基づいて当該復元された音
声信号を導出するように構成されていることを特徴とする請求項1に記載の送信
システム。 - 【請求項3】 前記符号器が、当該周波数変化を使用して、前記音声信号から、基本的周波数
を決定する手段を有することを特徴とする請求項1または2に記載の送信システム
。 - 【請求項4】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
変換された音声信号が、前記音声信号より小さい周波数変化を有するように、前
記時間変換手段が、前記既定時間の第一部分の間前記音声信号を時間圧縮し、か
つ前記既定時間の第二部分の間前記音声信号を時間伸張するように、構成されて
いることを特徴とする請求項1、2または3の何れかに記載の送信システム。 - 【請求項5】 前記時間変換決定手段が、複数の時間変換された、各々異なる時間変換に対応
する入力信号を導出するように構成されていて、かつ前記符号器が、当該既定時
間にわたる最も小さい周波数変化を有する前記時間変換された入力信号に対応す
る前記時間変換を選択する決定手段を有することを特徴とする請求項1、2、3ま
たは4に記載の送信システム。 - 【請求項6】 前記時間変換決定手段が、その自己相関関数の前記最も高いピークを有する前
記時間変換された入力信号を選択することによって、当該既定時間にわたる前記
最も小さい周波数変化を有する前記時間変換された入力信号を選択するように構
成されていることを特徴とする請求項5に記載の送信システム。 - 【請求項7】 前記時間変換が、前記実時間と前記変換された時間との間の二次の関係によっ
て規定されることを特徴とする請求項4〜6の何れかに記載の送信システム。 - 【請求項8】 前記実時間tと前記変換された時間τとの関係が、 【式0】 (aは、前記時間変換を規定しているパラメータで、かつTは、信号セグメントの
前記持続時間である)によって規定されことを特徴とする請求項7に記載の送信
システム。 - 【請求項9】 音声信号を符号化する符号器を有する送信機であって、前記符号器が、前記音
声信号の少なくとも一つの周期的な成分の周波数を決定する周波数決定手段を有
し、前記送信機が、当該周波数を表す信号を送信する送信手段を更に有する、送
信機において、前記符号器が、既定時間にわたる前記音声信号の当該少なくとも
一つの周期的な成分の周波数変化を決定する周波数変化決定手段を更に有するこ
とを特徴とする送信機。 - 【請求項10】 前記送信手段が、当該周波数変化を表す別の信号を送信するように構成されて
いることを特徴とする請求項9に記載の送信機。 - 【請求項11】 前記符号器が、既定時間にわたる当該基本的周波数の当該変化の使用の下で、
前記音声信号から基本的周波数を決定する手段を有することを特徴とする請求項
9または10に記載の送信機。 - 【請求項12】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
変換された音声信号が、前記音声信号より小さい周波数変化を有するような方法
で、前記時間変換手段が、前記既定時間の第一部分の間、前記音声信号を時間圧
縮するように、かつ前記既定時間の第二部分の間、前記音声信号を時間伸長する
ように構成されていることを特徴とする請求項9、10または11の何れかに記載の
送信機。 - 【請求項13】 音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって音声信
号を表す符号化された音声信号を受信する受信手段と、当該周波数に基づいて復
元された音声信号を導出する復号器とを有する受信機において、前記受信機が、
既定時間にわたる当該音声信号の当該少なくとも一つの周期的な成分の周波数変
化を表す別の信号を受信するように構成されていて、かつ前記復号器が、当該周
波数変化にも基づいて当該復元された音声信号を導出するように構成されている
ことを特徴とする受信機。 - 【請求項14】 前記復号器が、復号化信号を時間変換させることにより、前記復元された音声
信号を得る時間変換手段を有し、前記時間変換された復号化信号が、前記復号化
信号より大きい周波数変化を有するように、前記時間変換手段が、前記既定時間
の第一部分の間、前記復号化信号を時間伸長し、かつ前記既定時間の第二部分の
間、前記復号化信号を時間圧縮するように構成されていることを特徴とする請求
項13に記載の受信機。 - 【請求項15】 音声信号を符号化する符号器であって、前記符号器が、前記音声信号の少なく
とも一つの周期的な成分の周波数を決定し、かつ当該周波数を表す信号を導出す
る手段を有する、符号器において、前記符号器が、既定時間にわたる当該少なく
とも一つの周期的な成分の周波数変化を表す信号を決定する周波数変化決定手段
を更に含むことを特徴とする符号器。 - 【請求項16】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
変換手段が、前記時間変換された音声信号が、前記音声信号より小さい周波数変
化を有するように、前記既定時間の第一部分の間、前記音声信号を時間圧縮し、
かつ前記既定時間の第二部分の間、前記音声信号を時間伸長するように構成され
ていることを特徴とする請求項15に記載の符号器。 - 【請求項17】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって当
該音声信号を表す符号化された音声信号から復元された音声信号を導出し、かつ
当該周波数に基づいて復元された音声信号を導出する復号器において、前記復号
器が、当該既定時間にわたる少なくとも一つの周期的な成分の周波数変化を表す
別の信号に基づいて当該復元された音声信号もまた導出するように構成されてい
ることを特徴とする復号器。 - 【請求項18】 前記復号器が、復号化信号を時間変換することによって前記復元された音声信
号を得る時間変換手段を有し、前記復元された音声信号が、前記復号化信号より
大きい周波数変化を有するように、前記時間変換手段が、前記既定時間の第一部
分の間、前記復号化信号を時間伸張し、かつ前記既定時間の第二部分の間、前記
復号化信号を時間圧縮するように構成されていることを特徴とする請求項17に記
載の復号器。 - 【請求項19】 少なくとも一つの周期的な成分の周波数を決定し、かつ前記音声信号の少なく
とも一つの周期的な成分の当該周波数を表す信号を導出して、音声信号を符号化
する方法において、前記方法が、更に、既定時間にわたる前記音声信号の当該少
なくとも一つの周期的な成分の周波数変化を表す信号を決定することを特徴とす
る方法。 - 【請求項20】 前記方法が、時間変換された音声信号を導出し、前記時間変換された音声信号
が、前記音声信号より小さい周波数変化を有するように、前記方法が、更に、前
記既定時間の第一部分の間、前記音声信号を時間圧縮し、かつ前記既定時間の第
二部分の間、前記音声信号を時間伸張することを特徴とする請求項19に記載の方
法。 - 【請求項21】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって、
当該音声信号を表す符号化された音声信号から復元された音声信号を導出する方
法、および当該周波数に基づいて復元された音声信号を導出する復号器において
、前記方法が、既定時間にわたる前記音声信号の当該少なくとも一つの周期的な
成分の周波数変化を表す別の信号にも基づいて当該復元された音声信号を導出す
ることを特徴とする方法。 - 【請求項22】 前記方法が、復号化信号の時間変換により、前記復元された音声信号を導出し
、前記時間変換された復号化信号が、前記復号化信号より大きい周波数変化を有
するように、前記時間変換が、前記既定時間の第一部分の間、前記復号化信号を
時間伸張し、かつ前記既定時間の第二部分の間、前記復号化信号を時間圧縮する
ことを特徴とする請求項21に記載の方法。 - 【請求項23】 請求項19〜22の何れかに記載の方法を実行するコンピュータプログラムを保持
する記憶媒体。 - 【請求項24】 請求項19〜22の何れかに記載の方法を実行するコンピュータプログラムを保持
する信号。 - 【請求項25】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって当
該音声信号を表す、符号化された音声信号において、前記符号化された音声信号
が、既定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を表す別
の信号成分を有することを特徴とする音声信号。 - 【請求項26】 請求項23に記載の符号化された音声信号を保持する記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99201656.8 | 1999-05-26 | ||
EP99201656 | 1999-05-26 | ||
PCT/EP2000/004219 WO2000074039A1 (en) | 1999-05-26 | 2000-05-08 | Audio signal transmission system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003500708A true JP2003500708A (ja) | 2003-01-07 |
JP2003500708A5 JP2003500708A5 (ja) | 2007-06-28 |
Family
ID=8240236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001500258A Pending JP2003500708A (ja) | 1999-05-26 | 2000-05-08 | 音声信号送信システム |
Country Status (7)
Country | Link |
---|---|
US (1) | US6978241B1 (ja) |
EP (1) | EP1099215B1 (ja) |
JP (1) | JP2003500708A (ja) |
KR (1) | KR20010072035A (ja) |
CN (1) | CN1227646C (ja) |
DE (1) | DE60018246T2 (ja) |
WO (1) | WO2000074039A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006518952A (ja) * | 2003-01-17 | 2006-08-17 | トムソン ライセンシング | 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法 |
JP2013210654A (ja) * | 2005-11-03 | 2013-10-10 | Dolby International Ab | 音声信号のタイムワープ処理改良変換符号化 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR0206202A (pt) | 2001-10-26 | 2004-02-03 | Koninklije Philips Electronics | Métodos para codificar um sinal de áudio e para decodificar um fluxo de áudio, codificador de áudio, reprodutor de áudio, sistema de áudio, fluxo de áudio, e, meio de armazenamento |
US7567903B1 (en) * | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101400535B1 (ko) | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
PL2532001T3 (pl) * | 2010-03-10 | 2014-09-30 | Fraunhofer Ges Forschung | Dekoder sygnału audio, koder sygnału audio, sposoby i program komputerowy wykorzystujące zależne od częstotliwości próbkowania kodowanie krzywej dopasowania czasowego |
JP6303340B2 (ja) * | 2013-08-30 | 2018-04-04 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0546199A (ja) * | 1991-08-21 | 1993-02-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH07219597A (ja) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | ピッチ変換装置 |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4937873A (en) | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
AU7960994A (en) * | 1993-10-08 | 1995-05-04 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
US5794185A (en) * | 1996-06-14 | 1998-08-11 | Motorola, Inc. | Method and apparatus for speech coding using ensemble statistics |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
-
2000
- 2000-05-08 WO PCT/EP2000/004219 patent/WO2000074039A1/en active IP Right Grant
- 2000-05-08 DE DE60018246T patent/DE60018246T2/de not_active Expired - Fee Related
- 2000-05-08 CN CNB008014647A patent/CN1227646C/zh not_active Expired - Fee Related
- 2000-05-08 EP EP00931174A patent/EP1099215B1/en not_active Expired - Lifetime
- 2000-05-08 JP JP2001500258A patent/JP2003500708A/ja active Pending
- 2000-05-08 KR KR1020017000967A patent/KR20010072035A/ko not_active Application Discontinuation
- 2000-05-22 US US09/575,609 patent/US6978241B1/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0546199A (ja) * | 1991-08-21 | 1993-02-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH07219597A (ja) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | ピッチ変換装置 |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006518952A (ja) * | 2003-01-17 | 2006-08-17 | トムソン ライセンシング | 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法 |
JP4652323B2 (ja) * | 2003-01-17 | 2011-03-16 | トムソン ライセンシング | 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法 |
JP2013210654A (ja) * | 2005-11-03 | 2013-10-10 | Dolby International Ab | 音声信号のタイムワープ処理改良変換符号化 |
US8838441B2 (en) | 2005-11-03 | 2014-09-16 | Dolby International Ab | Time warped modified transform coding of audio signals |
JP2015018274A (ja) * | 2005-11-03 | 2015-01-29 | ドルビー・インターナショナル・アクチボラゲットDolby International Ab | 音声信号のタイムワープ処理改良変換符号化 |
Also Published As
Publication number | Publication date |
---|---|
DE60018246T2 (de) | 2006-05-04 |
CN1318188A (zh) | 2001-10-17 |
KR20010072035A (ko) | 2001-07-31 |
CN1227646C (zh) | 2005-11-16 |
DE60018246D1 (de) | 2005-03-31 |
WO2000074039A1 (en) | 2000-12-07 |
US6978241B1 (en) | 2005-12-20 |
EP1099215B1 (en) | 2005-02-23 |
EP1099215A1 (en) | 2001-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102125410B1 (ko) | 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법 | |
JP4649208B2 (ja) | オーディオコーディング | |
KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
KR101237546B1 (ko) | 통신 시스템에서 프레임들을 연결하는 방법 | |
JP2650201B2 (ja) | ピツチ関連遅延値を導出する方法 | |
US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
KR100452955B1 (ko) | 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체 | |
US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
JP4912816B2 (ja) | 音声コーダの方法とシステム | |
WO2008066264A1 (en) | Frame error concealment method and apparatus and decoding method and apparatus using the same | |
KR19980032825A (ko) | 음성 분석 방법 및 음성 부호화 방법 및 장치 | |
US6029134A (en) | Method and apparatus for synthesizing speech | |
JP4782006B2 (ja) | 低ビットレートオーディオ符号化 | |
JP2003500708A (ja) | 音声信号送信システム | |
JP3168238B2 (ja) | 再構成音声信号の周期性を増大させる方法および装置 | |
JP2003044099A (ja) | ピッチ周期探索範囲設定装置及びピッチ周期探索装置 | |
JPH11219198A (ja) | 位相検出装置及び方法、並びに音声符号化装置及び方法 | |
JP3559485B2 (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP3916934B2 (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置 | |
JP2006510938A (ja) | 音声符号化における正弦波の選択 | |
KR20220104049A (ko) | 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법 | |
JP3731575B2 (ja) | 符号化装置及び復号装置 | |
JPH11219199A (ja) | 位相検出装置及び方法、並びに音声符号化装置及び方法 | |
JP4173218B2 (ja) | 音声圧縮装置および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070507 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070507 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101102 |