JP2003500708A - 音声信号送信システム - Google Patents

音声信号送信システム

Info

Publication number
JP2003500708A
JP2003500708A JP2001500258A JP2001500258A JP2003500708A JP 2003500708 A JP2003500708 A JP 2003500708A JP 2001500258 A JP2001500258 A JP 2001500258A JP 2001500258 A JP2001500258 A JP 2001500258A JP 2003500708 A JP2003500708 A JP 2003500708A
Authority
JP
Japan
Prior art keywords
time
signal
frequency
audio signal
frequency change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001500258A
Other languages
English (en)
Other versions
JP2003500708A5 (ja
Inventor
ロバート ジェー スルイエタ
アウガスタス ジェー イー エム ジャンセン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003500708A publication Critical patent/JP2003500708A/ja
Publication of JP2003500708A5 publication Critical patent/JP2003500708A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 復元された音声信号の品質が更に改善された、第一段落に記載の送信システムを提供すること。 【解決手段】 音声符号化のいくつかのタイプにおいて、一つ以上の周期的な成分の周波数が、決定され、かつ前記符号化プロセスにおいて使用される。決定される周期的な成分の周波数は、必ずしも一定ではなく、分析間隔にわたって僅かに変化する可能性がある。当該周波数変化を補正するために、本発明のシステムは、分析期間にわたる周期的な成分の周波数の変化を決定する周波数変化決定手段(8)を有する。周波数のこの変化は、音声信号の復号の精度を増すための復号器に送信することが出来る。また、この周波数変化を、ピッチのより正確な値を得るためにのみ使用することも可能である。周波数変化は、時間変換された音声信号は、最小限の周波数変化によって得られるように、時間変換を実行するタイム・ワーパ(6)を使用することによって、決定されることが好ましい。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】
本発明は、音声信号を符号化する符号器を有する送信機を有し、前記符号器が
、少なくとも一つの周期的な成分の周波数を決定する手段を有し、前記送信機が
、受信機に少なくとも一つの周期的な成分の当該周波数を表す信号を送信する送
信手段を更に有し、当該受信機が、前記送信機から当該周波数を表す信号を受信
する受信手段と、前記少なくとも一つの周期的な成分の当該周波数に基づいて復
元された音声信号を導出する復号器とを有する、送信システムに関する。
【0002】 本発明は、また、送信機、受信機、符号器、復号器、記録システム、再生シス
テム、符号化方法および復号化方法、当該方法を実行するコンピュータプログラ
ムを有する有形媒体、信号、およびこのような信号を保持する記録媒体にも関す
る。
【0003】
【従来の技術】
第一段落に記載の送信システムは、米国特許第4,937,873号から公知である。
【0004】 このような送信システムと音声符号器は、音声信号が限定された送信容量を有
する送信媒体上に送信されなければならないか、または限定された記憶容量を有
する記憶媒体に格納されなければならないアプリケーションで使用される。この
ようなアプリケーションの具体例は、インターネット上の音声信号の送信と、携
帯電話から基地局へおよびその逆の音声信号の送信と、CD-ROM、固体状態メモリ
またはハードディスクドライブの音声信号の記憶である。
【0005】 種々の音声符号器の動作原理が、適度のビットレートで良好な音声品質を達成
するために試みられてきた。これら動作方法の一つの場合、送信される音声信号
は、10〜20 msの長さを有する複数のセグメントに分割される。当該セグメント
の各々において、音声信号は、これらの振幅とこれらの周波数によって規定され
ている複数の正弦波によって表される。この符号器において、正弦波の振幅と周
波数が、決定される。
【0006】 この送信手段は、受信機に振幅と周波数の表現を送信する。この送信機によっ
て実行されるこの動作は、チャネル符号化、インターリービング、および変調を
含むことが出来る。
【0007】 この受信手段は、送信チャネルから音声信号を表す信号を受信し、かつ復調、
デ・インターリービング(de-interleaving)、およびチャネル復号化のような動
作を実行する。この復号器は、受信機から音声信号の表現を得、かつ符号化され
た信号によって記載される複数の正弦波を生成しかつそれらを復元された音声信
号に結合することによって、それから復元された音声信号を導出する。
【0008】 従来技術のシステムは、良好な符号化品質を提供するにもかかわらず、復元さ
れた音声信号と元の音声信号間に、まだ、聞き取れる違いが存在する。
【0009】
【課題を解決するための手段】
本発明の目的は、復元された音声信号の品質が更に改善された、第一段落に記
載の送信システムを提供することである。
【0010】 当該目的を達成するために、本発明の送信システムが特徴とする点は、前記符
号器が、既定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を決
定する周波数変化決定手段を更に有することである。
【0011】 当該少なくとも一つの周期的な成分の周波数変化も決定することによって、復
元された音声信号の品質は、二つの方法で改善することが出来る。第一の方法は
、復元された音声信号を導出するために当該周波数変化を使用することが出来る
受信機に周波数変化を送信することである。この第二の方法は、音声信号の周波
数のより正確な値を得るためにこの周波数変化を使用することである。これを、
例えば、音声信号のピッチ、または音声信号の任意の周期的な成分とすることが
出来る。既定時間にわたる周波数変化を使用することによって、当該基本的周波
数に対応する平均の周波数値を、より正確に決定することが出来る。
【0012】 本発明の一実施例が特徴とする点は、前記送信手段が、前記受信機に当該周波
数変化を表す別の信号を送信するように構成されていて、前記受信機が、当該別
の信号を受信するように構成されいて、かつ前記復号器が、当該周波数の当該変
化にも基づいて当該復元された音声信号を導出するように構成されている点であ
る。
【0013】 受信機に送信される付加信号によって周波数変化を表すことにより、その一つ
の合成間隔内の周波数において(僅かに)変化する正弦波を、復元された音声信
号を生成する際に使用する。これは、より実際の音声信号の特性に対応し、この
結果、品質が改良された復元された音声信号が得られる。
【0014】 本発明の別の実施例が特徴とする点は、前記符号器が、時間変換された入力信
号を得る時間変換手段を有し、前記時間変換された入力信号が、前記入力信号よ
り小さい周波数変化を有するように、前記時間変換手段が、前記既定時間の第一
部分の間前記入力信号を時間圧縮し、かつ前記既定時間の第二部分の間前記入力
信号を時間伸張するように、構成されていることである。
【0015】 時間変換された音声信号を得るために、タイム・ワーピング(time warping)と
も呼ばれる時間変換を使用することは、符号化される信号の周波数変化を取扱う
効果的方法であることが証明されている。適切な時間変換を使用することによっ
て、周波数が変化する信号を、周波数が実質的に一定の時間変換された信号に変
換することが可能になる。
【0016】 この一つの具体例は、セグメントの初めで低周波数でスタートし、かつセグメ
ントの終わりでより高い周波数で終わる線形周波数掃引を有する音声信号である
。セグメントの第一部分において入力信号を時間圧縮することによって、時間変
換された信号の周波数は、元の入力信号の周波数より高くなる。セグメントの第
二部分において、入力信号を時間伸長することによって、時間変換された信号入
力信号の周波数は、元の入力信号の周波数より低くなる。
【0017】 従って、セグメントの開始での周波数が増加し、かつセグメントの終わりでの
周波数が減少した、時間変換された入力信号が、得られる。時間変換を適切に選
択すると、周波数変化が減少した変換された入力信号を得ることが可能になる。
【0018】 本発明のさらに別の実施例が特徴とする点は、前記時間変換決定手段が、複数
の時間変換された、各々異なる時間変換に対応する入力信号を導出するように構
成されていて、かつ前記符号器が、当該既定時間にわたる最も小さい周波数変化
を有する前記時間変換された入力信号に対応する前記時間変換を選択する決定手
段を有することである。
【0019】 最も適切な時間変換を決定する方法は、様々な時間変換を多く試み、かつ最も
小さい周波数変化を有する変換された音声信号を選択することである。
【0020】 発明のさらに別の実施例が特徴とする点は、前記時間変換決定手段が、その自
己相関関数の前記最も高いピークを有する前記時間変換された入力信号を選択す
ることによって、当該既定時間にわたる前記最も小さい周波数変化を有する前記
時間変換された入力信号を選択するように構成されていることである。
【0021】 最も小さい周波数変化を有する変換された時間信号を決定する有益な方法は、
様々な時間変換された入力信号の自己相関関数を計算することである。その自己
相関関数の最も高いピークを有するこの変換された時間音声信号は、最も小さい
周波数変化を有する。これに代えて、時間変換された入力信号のFFTを計算する
ことも、また可能である。その時、FFT領域の最も高いピークになる時間変換さ
れた音声信号は、最も一定した周波数を有する。
【0022】 本発明の前記送信システムの更に別の実施例が特徴とする点は、前記時間変換
が、前記実時間と前記変換された時間との間の二次の関係によって規定されるこ
とである。
【0023】 実時間と変換された時間との間の二次の関係は、容易に計算することが可能で
、かつ、時間セグメントの第一部分の時間圧縮と時間セグメントの第二部分の時
間伸長とを達成することが出来る。
【0024】 本発明の送信システムの更に別の実施例が特徴とする点は、前記実時間tと前
記変換された時間τとの関係が、
【式0】 (aは、前記時間変換を規定しているパラメータで、かつTは、信号セグメントの
前記持続時間である)によって規定されことである。
【0025】 この上記の二次の時間変換は、一つしかパラメータを有せず、しかも一つの信
号セグメントの間に、時間圧縮と時間伸長を得ることが、可能である。一つしか
パラメータを有しないことが有利な点は、送信機に最適の時間変換を送信するた
めに必要とされるビット数が減少することである。更に、この時間変換関数によ
り、入力信号の線形周波数変化を完全に除去することが可能であることを、示す
ことが出来る。
【0026】 本発明は、次に、図面を参照して説明される。
【0027】
【発明を実施するための形態】 図1の送信システムの場合、送信される音声信号は、送信機2に含まれる音声符号
器4の入力に与えられる。音声符号器4において、この入力音声信号は、周波数変
化決定手段8の入力と、ここではタイム・ワーパ(time warper)6である時間変換
手段の入力とに適用される。
【0028】 出力信号aを有する周波数変化決定手段8の第一の出力信号は、このタイム・ワ
ーパ6の制御入力に接続されている。この出力信号aは、入力信号の周期的な成分
の周波数変化を表す。タイム・ワ―パ6は、このパラメータaによって規定される
時間変換をその入力信号に実行する。このパラメータaは、タイム・ワーパ6の出
力信号の周期的な成分の周波数が最小となるように選択される。
【0029】 周波数変化決定手段8の第二の出力には、音声信号の周期的な成分の平均の周
波数を表す信号PITCHが、現れる。音声符号化の場合、この信号PITCHは、音声信
号のピッチを表す。
【0030】 タイム・ワ―パ6の出力は、タイム・ワーパ6の出力信号を表すパラメータを決
定するように構成されているアナライザ10の入力に接続される。第一の可能性は
、アナライザ10が、入力信号の複数のLPC係数を決定する線形予測アナライザで
あることである。これに代えて、このアナライザ10は、タイム・ワーパ6の出力
信号に存在する複数の正弦波成分の振幅と周波数を直接決定することも可能であ
る。
【0031】 信号a、信号PITCH、および音声信号の追加の特性(LPC係数または正弦波の振
幅および周波数)を表すアナライザ10の出力は、マルチプレクサ12の対応する入
力に与えられる。このマルチプレクサ12の出力は、受信機16にマルチプレクサ12
の出力信号を送信する送信手段14の入力に接続される。
【0032】 送信手段14は、RFキャリアに送信される信号の、チャネル符号化、インターリ
ービング、および変調のような動作を実行する。本発明を、ハードディスクまた
は光ディスク(CD、DVD)のような記録媒体上の符号化された音声信号を記録す
るために使用する場合、変調ステップは、省くことが出来る。このような場合、
変調符号は、しばしば、記録媒体に書き込まれる信号のスペクトルを整形するた
めに使用される。
【0033】 受信機16において、送信機2から受信される信号は、最初、受信手段18によっ
て処理される。受信手段18は、復調、デ・インターリービング、およびチャネル
復号化を実行するように構成されている。受信手段18の出力信号は、復号器20の
入力に接続される。復号器20において、受信手段18の出力信号は、デマルチプレ
クサ22の入力に接続される。
【0034】 デマルチプレクサは、その出力に、出力信号a、PITCH、およびLPCを出力する
。信号PITCHとLPCは、これらのパラメータから復元された音声信号を導出するシ
ンセサイザ24において使用される。ピッチ信号と複数のLPCパラメータとに基づ
いて復元された音声信号を導出するこのようなシンセサイザの動作は、国際特許
出願 WO99/03095-A1に詳述されている。
【0035】 シンセサイザ24の出力は、ここではデ・ワーパ26である逆時間変換手段の入力
に接続される。デ・ワーパ26は、タイム・ワーパ6によって入力信号から除去さ
れた周波数バリエーションを再導入する。復元された音声信号は、デ・ワーパ26
の出力から選られる。
【0036】 タイム・ワーパ6において使用される適切な時間変換関数は、次式で与えられ
る:
【式1】 (1)において、aはワーピング(warping)パラメータであり、Tは音声セグメントの
持続時間であり、tはリアル・タイムを表し、τは変換された時間である。ワー
ピングパラメータaの値は、ワーピング機能が常に時間tとともに増加することが
保証される範囲を有する。これは、次式を導く:
【式2】 ワーピング機能は、ワープされた音声セグメントの全体の持続時間が元の音声セ
グメントの持続時間に等しくなるように選ばれる。ワープされたセグメントのス
タートと終わりの値は、元の音声セグメントのスタートと終わりの値に等しい。
【0037】 時間圧縮または時間伸長が起こるか否かは、 (1)をt.により微分することによ
って決定することが出来る。これは、次式になる:
【式3】
【0038】 時間圧縮は、dτ/dt が1より小さいときに起こり、かつ時間伸長は、dτ/dtが
1より大きいときに起こる。(3)から、a> 0の場合、t <T/2に対して時間圧縮が起
こり、t > T/2に対して時間伸長が、起こることがわかる。a <0の場合、t> T/2
に対して時間圧縮が起こり、t <T/2に対して時間伸長が起こる。
【0039】 (1)のタイム・ワーパ関数の逆は、次式によって規定される:
【式4】
【0040】 図2は、a.の種々の値に対するt/Tの関数としてのτ/Tを示す。aが0に等しい場
合、τはtに等しく、かつタイム・ワーピングは起こらない。
【0041】 以下においては、(1)によって規定されるタイム・ワーパの動作が、分析され
る。信号s(t)が発声音のような時間で変化する周期性を有する信号の場合、これ
は、次式のように書くことが出来る:
【式5】
【0042】 (5)において、kは高調波数で、xk、とykは振幅係数で、Φ(t)は位相角度であ
る。時間変換された信号s'(τ)に対しては、次の式を書くことが出来る:
【式6】
【0043】 (5)と(6)が同じ物理的な信号を表すので、Φ(t)はΨ(τ)に等しい。s(t)のkth 高調波の瞬時角周波数ωk(t)は、次式によって与えられる:
【式7】
【0044】 s'(τ)のkth高調波の瞬時角周波数Ωk(τ)に対しては、次の式を書くことが出
来る:
【式8】
【0045】 Φ(t)=Ψ(τ)であるので、時間tによるそれらの微分も等しい。 連鎖法則を使用すると、これは以下の様に書くことが出来る:
【式9】
【0046】 式(9)を使用することによって、Ωk(τ) とωk(t)の関係は、次式になる:
【式10】
【0047】 タイム・ワーパの重要な別の特性は、ワープされた信号のkth高調波の平均周
波数が、元の信号のkth高調波の平均の周波数に等しいということである。 これは、次式から容易にわかる:
【式11】
【0048】 上記のタイム・ワーピング機能が、入力信号から線形周波数バリエーションを
除去することが可能であることが、下記に示される。
【0049】 (3)を(10)に代入すると、次式が選られる:
【式12】
【0050】 入力信号が、時間に関して線形に変化する角周波数ω(t)を有する正弦波の入
力信号を有すると仮定する。この信号の角周波数に対しては、次の様に書くこと
が出来る:
【式13】 (13)を(12)に代入すると次式が得られる:
【式14】 Ω(τ)が一定である場合、次式が成立する:
【式15】 (15)を(14)に代入すると次式が得られる:
【式16】
【0051】 これは、持続時間Tを有するセグメントにわたる角周波数ω(t)の平均に等しい
一定の値に一致する。
【0052】 図3の周波数変化決定手段8において、音声信号は、最初、ウエイティングフィ
ルタ30に与えられる。このウエイティングフィルタ30は、適応LPC逆フィルタで
ある。ウエイティングフィルタ30の出力信号は、LPC残差である。入力信号に代
えて、予測残差を使用することは、基本的周波数の周波数(ピッチ)の決定との
フォルマント相互作用を最小にするという効果を有する。
【0053】 ウエイティングフィルタ30の出力は、低域フィルタ32の入力に接続されている
。この低域フィルタは、約1100Hzの遮断周波数を有する。低域フィルタ32の出力
は、複数のタイム・ワーパ34, 42、および50の入力に接続されている。これらタ
イム・ワーパ34、42、および50は、(1)に従うが、各々は異なるパラメータaの値
を有する時間変換を実行するように構成されている。
【0054】 タイム・ワーパ34、42、および50の出力は、各々、対応するタイム・ワーパの
出力信号の自己相関関数の近似である尺度を決定する相関器37、41、および51の
入力に接続されている。相関器37、41、および51は、自己相関関数が、分析して
いる信号のパワー・スペクトルから、逆FFTを計算することによって決定するこ
とが出来るという特性を使用する。パワー・スペクトルの近似としては、高速フ
ーリエ変換の絶対値も、使用することが出来る。いくつかの男性の声において発
生する可能性がある極めて長いピッチ間隔(最高25msec)を取扱うために、分析
ウインドウには、64 msecという相対的に長い持続時間が与えられる。この長い
分析ウインドウの選択は、タイム・ワーピング動作により可能になり、これによ
りより定常的な時間変換された信号が得られる。
【0055】 相関器37, 41、および51の入力信号は、フーリエ変換器36、44、および52によ
りフーリエ変換される。これらのフーリエ変換器は、これらの入力信号のFFTの
絶対値を決定する。その後、第一フーリエ変換器36、44、および52の出力信号の
いわゆる「0位相関数」zj(n) が、逆第一フーリエ変換器38、46、および54を使
用して、振幅スペクトルの逆FFTを計算することによって決定される。
【0056】 0位相関数 zj(n) は、正規化装置40、48、および56でそれらの値 zj(0) に対
して正規化される。正規化装置40, 48、および56の出力は、適切値としてnのゼ
ロでない値に対して最も高いピークを有する0位相関数に対応するタイム・ワー
ピング・パラメータaを選択する選択手段58の入力に接続される。これは、適切
にワープされた信号は、最も一定した周波数Ω(τ)を示すという認識に基づく
。従って、この信号は、その自己相関関数内で最大のピークを有する。
【0057】 タイム・ワーパとデ・ワーパ(dewarper)は、ここまでは、連続時間動作として
記載されて来た。現実に実施する場合、これらの動作は、離散時間システムで実
施されるべきである。持続時間Tを有する入力信号のセグメントが、Nサンプルに
よって表される場合、ワープされたセグメントもまた、持続時間Tを有し、かつN
サンプルによって表されるであろう。しかしながら、タイム・ワープされた信号
のサンプリング時点は、元の入力信号のサンプリング時点に対応しない。これは
、図4のタイム・ワーパとして、および図5のタイム・デ・ワーパとして示される
【0058】 図4において、グラフ60は入力信号に対応し、かつグラフ62はワープされた出
力信号に対応する。図4の矢印64によって示されているように、グラフ62のサン
プリング時点j=2は、グラフ60のサンプル時点i=2とi=3の間の時点に対応する。
これは、時間圧縮に対応する。図4の矢印66によって示されているように、グラ
フ62のサンプリング時点j=N-1は、グラフ60のサンプル時点N-2とN-1の間の時点
に対応する。これは、時間伸長に対応する。
【0059】 この課題を取扱うために、サンプル値は、発生するτjの値ごとに計算されな
ければならず、これは次式によって与えられる:
【式17】 これは、(4)を使用することによって、tの対応している値を、τjから計算する
ことによって行われる。tのこの値から、サンプリング格子上の最も近い値が、
決定される。これは、次式によるiの二つの値になる:
【式18】
【0060】 (18)において、
【記号1】 は、その引数より小さい最も近い整数を表し、かつ
【記号2】 は、その引数より大きい最も近い整数を表す。最後に、τjに対して線形補間さ
れたサンプル値が、次式に従って計算される:
【式19】 線形補間の他に、二次および三次補間のような他のタイプの補間を使用すること
も出来ることも判明している。
【0061】 図5のグラフ68は、ワープされた時間スケールを示し、かつグラフ74は、対応
するアンワープされた時間スケールを示す。
【0062】 逆ワーピングは、図5に示される方法と同様に、行うことが出来る。先ず、対
応するサンプルが決定されなければならない tiの値は、次式から得られる。
【式20】
【0063】 次に、計算は、式(1)を使用することによって矢印72と74によって示されてい
るように、所定のtiに対応するτの値を決定することを続ける。tのこの値から
、サンプリング格子上の最も近い値が、決定される。この結果、次式によりjの
二つの値が得られる:
【式21】
【0064】 最後に、tiに対して線形補間されたサンプル値が、次式に従って計算される:
【式22】
【0065】 本発明は、専用のハードウェアを使用することによって、またはプログラム可
能なプロセッサで実行するプログラムを使用することによって実施することが出
来ることは理解されるであろう。また、これらの実施の組み合わせを使用するこ
とも可能である。
【図面の簡単な説明】
【図1】音声信号を送信する本発明の送信システムを示す。
【図2】パラメータaのいくつかの値に対する時間変換関数のグラフを示す。
【図3】図1の送信システムで使用される変換決定手段8の実施例を示す。
【図4】図1のタイム・ワーパ6による時間変換と関係している離散的な時間信号
のグラフを示す。
【図5】図1のタイム・デ・ワーパ26による逆時間変換と関係している離散的な
時間信号のグラフを示す。
【符号の説明】
2 送信機 4 音声符号器 6 タイム・ワーパ 8 周波数変化決定手段 10 分析器 12 マルチプレクサ 16 受信機 18 受信手段 20 復号器 22 デ・マルチプレクサ 24 シンセサイザ 26 デ・ワーパ 30 ウェイティングフィルタ 32 低域フィルタ 34, 42, 50 タイム・ワーパ 36, 44, 52 フーリエ変換器 37, 41, 51 相関器 58 選択手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジャンセン アウガスタス ジェー イー エム オランダ国 5656 アー アー アインド ーフェン プロフホルストラーン 6

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を符号化する符号器を有する送信機を有し、前記符号器が、少なくと
    も一つの周期的な成分の周波数を決定する手段を有し、前記送信機が、受信機に
    少なくとも一つの周期的な成分の当該周波数を表す信号を送信する送信手段を更
    に有し、当該受信機が、前記送信機から当該周波数を表す信号を受信する受信手
    段と、前記少なくとも一つの周期的な成分の当該周波数に基づいて復元された音
    声信号を導出する復号器とを有する、送信システムにおいて、前記符号器が、既
    定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を決定する周波
    数変化決定手段を更に有することを特徴とする送信システム。
  2. 【請求項2】 前記送信手段が、前記受信機に当該周波数変化を表す別の信号を送信するよう
    に構成されていて、かつ前記受信機が、当該別の信号を受信するように構成され
    いて、かつ前記復号器が、当該周波数の当該変化にも基づいて当該復元された音
    声信号を導出するように構成されていることを特徴とする請求項1に記載の送信
    システム。
  3. 【請求項3】 前記符号器が、当該周波数変化を使用して、前記音声信号から、基本的周波数
    を決定する手段を有することを特徴とする請求項1または2に記載の送信システム
  4. 【請求項4】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
    変換された音声信号が、前記音声信号より小さい周波数変化を有するように、前
    記時間変換手段が、前記既定時間の第一部分の間前記音声信号を時間圧縮し、か
    つ前記既定時間の第二部分の間前記音声信号を時間伸張するように、構成されて
    いることを特徴とする請求項1、2または3の何れかに記載の送信システム。
  5. 【請求項5】 前記時間変換決定手段が、複数の時間変換された、各々異なる時間変換に対応
    する入力信号を導出するように構成されていて、かつ前記符号器が、当該既定時
    間にわたる最も小さい周波数変化を有する前記時間変換された入力信号に対応す
    る前記時間変換を選択する決定手段を有することを特徴とする請求項1、2、3ま
    たは4に記載の送信システム。
  6. 【請求項6】 前記時間変換決定手段が、その自己相関関数の前記最も高いピークを有する前
    記時間変換された入力信号を選択することによって、当該既定時間にわたる前記
    最も小さい周波数変化を有する前記時間変換された入力信号を選択するように構
    成されていることを特徴とする請求項5に記載の送信システム。
  7. 【請求項7】 前記時間変換が、前記実時間と前記変換された時間との間の二次の関係によっ
    て規定されることを特徴とする請求項4〜6の何れかに記載の送信システム。
  8. 【請求項8】 前記実時間tと前記変換された時間τとの関係が、 【式0】 (aは、前記時間変換を規定しているパラメータで、かつTは、信号セグメントの
    前記持続時間である)によって規定されことを特徴とする請求項7に記載の送信
    システム。
  9. 【請求項9】 音声信号を符号化する符号器を有する送信機であって、前記符号器が、前記音
    声信号の少なくとも一つの周期的な成分の周波数を決定する周波数決定手段を有
    し、前記送信機が、当該周波数を表す信号を送信する送信手段を更に有する、送
    信機において、前記符号器が、既定時間にわたる前記音声信号の当該少なくとも
    一つの周期的な成分の周波数変化を決定する周波数変化決定手段を更に有するこ
    とを特徴とする送信機。
  10. 【請求項10】 前記送信手段が、当該周波数変化を表す別の信号を送信するように構成されて
    いることを特徴とする請求項9に記載の送信機。
  11. 【請求項11】 前記符号器が、既定時間にわたる当該基本的周波数の当該変化の使用の下で、
    前記音声信号から基本的周波数を決定する手段を有することを特徴とする請求項
    9または10に記載の送信機。
  12. 【請求項12】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
    変換された音声信号が、前記音声信号より小さい周波数変化を有するような方法
    で、前記時間変換手段が、前記既定時間の第一部分の間、前記音声信号を時間圧
    縮するように、かつ前記既定時間の第二部分の間、前記音声信号を時間伸長する
    ように構成されていることを特徴とする請求項9、10または11の何れかに記載の
    送信機。
  13. 【請求項13】 音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって音声信
    号を表す符号化された音声信号を受信する受信手段と、当該周波数に基づいて復
    元された音声信号を導出する復号器とを有する受信機において、前記受信機が、
    既定時間にわたる当該音声信号の当該少なくとも一つの周期的な成分の周波数変
    化を表す別の信号を受信するように構成されていて、かつ前記復号器が、当該周
    波数変化にも基づいて当該復元された音声信号を導出するように構成されている
    ことを特徴とする受信機。
  14. 【請求項14】 前記復号器が、復号化信号を時間変換させることにより、前記復元された音声
    信号を得る時間変換手段を有し、前記時間変換された復号化信号が、前記復号化
    信号より大きい周波数変化を有するように、前記時間変換手段が、前記既定時間
    の第一部分の間、前記復号化信号を時間伸長し、かつ前記既定時間の第二部分の
    間、前記復号化信号を時間圧縮するように構成されていることを特徴とする請求
    項13に記載の受信機。
  15. 【請求項15】 音声信号を符号化する符号器であって、前記符号器が、前記音声信号の少なく
    とも一つの周期的な成分の周波数を決定し、かつ当該周波数を表す信号を導出す
    る手段を有する、符号器において、前記符号器が、既定時間にわたる当該少なく
    とも一つの周期的な成分の周波数変化を表す信号を決定する周波数変化決定手段
    を更に含むことを特徴とする符号器。
  16. 【請求項16】 前記符号器が、時間変換された音声信号を得る時間変換手段を有し、前記時間
    変換手段が、前記時間変換された音声信号が、前記音声信号より小さい周波数変
    化を有するように、前記既定時間の第一部分の間、前記音声信号を時間圧縮し、
    かつ前記既定時間の第二部分の間、前記音声信号を時間伸長するように構成され
    ていることを特徴とする請求項15に記載の符号器。
  17. 【請求項17】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって当
    該音声信号を表す符号化された音声信号から復元された音声信号を導出し、かつ
    当該周波数に基づいて復元された音声信号を導出する復号器において、前記復号
    器が、当該既定時間にわたる少なくとも一つの周期的な成分の周波数変化を表す
    別の信号に基づいて当該復元された音声信号もまた導出するように構成されてい
    ることを特徴とする復号器。
  18. 【請求項18】 前記復号器が、復号化信号を時間変換することによって前記復元された音声信
    号を得る時間変換手段を有し、前記復元された音声信号が、前記復号化信号より
    大きい周波数変化を有するように、前記時間変換手段が、前記既定時間の第一部
    分の間、前記復号化信号を時間伸張し、かつ前記既定時間の第二部分の間、前記
    復号化信号を時間圧縮するように構成されていることを特徴とする請求項17に記
    載の復号器。
  19. 【請求項19】 少なくとも一つの周期的な成分の周波数を決定し、かつ前記音声信号の少なく
    とも一つの周期的な成分の当該周波数を表す信号を導出して、音声信号を符号化
    する方法において、前記方法が、更に、既定時間にわたる前記音声信号の当該少
    なくとも一つの周期的な成分の周波数変化を表す信号を決定することを特徴とす
    る方法。
  20. 【請求項20】 前記方法が、時間変換された音声信号を導出し、前記時間変換された音声信号
    が、前記音声信号より小さい周波数変化を有するように、前記方法が、更に、前
    記既定時間の第一部分の間、前記音声信号を時間圧縮し、かつ前記既定時間の第
    二部分の間、前記音声信号を時間伸張することを特徴とする請求項19に記載の方
    法。
  21. 【請求項21】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって、
    当該音声信号を表す符号化された音声信号から復元された音声信号を導出する方
    法、および当該周波数に基づいて復元された音声信号を導出する復号器において
    、前記方法が、既定時間にわたる前記音声信号の当該少なくとも一つの周期的な
    成分の周波数変化を表す別の信号にも基づいて当該復元された音声信号を導出す
    ることを特徴とする方法。
  22. 【請求項22】 前記方法が、復号化信号の時間変換により、前記復元された音声信号を導出し
    、前記時間変換された復号化信号が、前記復号化信号より大きい周波数変化を有
    するように、前記時間変換が、前記既定時間の第一部分の間、前記復号化信号を
    時間伸張し、かつ前記既定時間の第二部分の間、前記復号化信号を時間圧縮する
    ことを特徴とする請求項21に記載の方法。
  23. 【請求項23】 請求項19〜22の何れかに記載の方法を実行するコンピュータプログラムを保持
    する記憶媒体。
  24. 【請求項24】 請求項19〜22の何れかに記載の方法を実行するコンピュータプログラムを保持
    する信号。
  25. 【請求項25】 前記音声信号の少なくとも一つの周期的な成分の少なくとも周波数によって当
    該音声信号を表す、符号化された音声信号において、前記符号化された音声信号
    が、既定時間にわたる当該少なくとも一つの周期的な成分の周波数変化を表す別
    の信号成分を有することを特徴とする音声信号。
  26. 【請求項26】 請求項23に記載の符号化された音声信号を保持する記憶媒体。
JP2001500258A 1999-05-26 2000-05-08 音声信号送信システム Pending JP2003500708A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99201656.8 1999-05-26
EP99201656 1999-05-26
PCT/EP2000/004219 WO2000074039A1 (en) 1999-05-26 2000-05-08 Audio signal transmission system

Publications (2)

Publication Number Publication Date
JP2003500708A true JP2003500708A (ja) 2003-01-07
JP2003500708A5 JP2003500708A5 (ja) 2007-06-28

Family

ID=8240236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001500258A Pending JP2003500708A (ja) 1999-05-26 2000-05-08 音声信号送信システム

Country Status (7)

Country Link
US (1) US6978241B1 (ja)
EP (1) EP1099215B1 (ja)
JP (1) JP2003500708A (ja)
KR (1) KR20010072035A (ja)
CN (1) CN1227646C (ja)
DE (1) DE60018246T2 (ja)
WO (1) WO2000074039A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006518952A (ja) * 2003-01-17 2006-08-17 トムソン ライセンシング 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法
JP2013210654A (ja) * 2005-11-03 2013-10-10 Dolby International Ab 音声信号のタイムワープ処理改良変換符号化

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0206202A (pt) 2001-10-26 2004-02-03 Koninklije Philips Electronics Métodos para codificar um sinal de áudio e para decodificar um fluxo de áudio, codificador de áudio, reprodutor de áudio, sistema de áudio, fluxo de áudio, e, meio de armazenamento
US7567903B1 (en) * 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101400535B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
PL2532001T3 (pl) * 2010-03-10 2014-09-30 Fraunhofer Ges Forschung Dekoder sygnału audio, koder sygnału audio, sposoby i program komputerowy wykorzystujące zależne od częstotliwości próbkowania kodowanie krzywej dopasowania czasowego
JP6303340B2 (ja) * 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0546199A (ja) * 1991-08-21 1993-02-26 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH07219597A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd ピッチ変換装置
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
AU7960994A (en) * 1993-10-08 1995-05-04 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0546199A (ja) * 1991-08-21 1993-02-26 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH07219597A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd ピッチ変換装置
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006518952A (ja) * 2003-01-17 2006-08-17 トムソン ライセンシング 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法
JP4652323B2 (ja) * 2003-01-17 2011-03-16 トムソン ライセンシング 固定レートサンプリングモードにおいて同期サンプリング設計を使用する方法
JP2013210654A (ja) * 2005-11-03 2013-10-10 Dolby International Ab 音声信号のタイムワープ処理改良変換符号化
US8838441B2 (en) 2005-11-03 2014-09-16 Dolby International Ab Time warped modified transform coding of audio signals
JP2015018274A (ja) * 2005-11-03 2015-01-29 ドルビー・インターナショナル・アクチボラゲットDolby International Ab 音声信号のタイムワープ処理改良変換符号化

Also Published As

Publication number Publication date
DE60018246T2 (de) 2006-05-04
CN1318188A (zh) 2001-10-17
KR20010072035A (ko) 2001-07-31
CN1227646C (zh) 2005-11-16
DE60018246D1 (de) 2005-03-31
WO2000074039A1 (en) 2000-12-07
US6978241B1 (en) 2005-12-20
EP1099215B1 (en) 2005-02-23
EP1099215A1 (en) 2001-05-16

Similar Documents

Publication Publication Date Title
KR102125410B1 (ko) 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법
JP4649208B2 (ja) オーディオコーディング
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
KR101237546B1 (ko) 통신 시스템에서 프레임들을 연결하는 방법
JP2650201B2 (ja) ピツチ関連遅延値を導出する方法
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
KR100452955B1 (ko) 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
JP4912816B2 (ja) 音声コーダの方法とシステム
WO2008066264A1 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
KR19980032825A (ko) 음성 분석 방법 및 음성 부호화 방법 및 장치
US6029134A (en) Method and apparatus for synthesizing speech
JP4782006B2 (ja) 低ビットレートオーディオ符号化
JP2003500708A (ja) 音声信号送信システム
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JPH11219198A (ja) 位相検出装置及び方法、並びに音声符号化装置及び方法
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2006510938A (ja) 音声符号化における正弦波の選択
KR20220104049A (ko) 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법
JP3731575B2 (ja) 符号化装置及び復号装置
JPH11219199A (ja) 位相検出装置及び方法、並びに音声符号化装置及び方法
JP4173218B2 (ja) 音声圧縮装置および記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070507

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100513

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102