JP2004518163A - オーディオ又は音声信号のパラメトリック符号化 - Google Patents
オーディオ又は音声信号のパラメトリック符号化 Download PDFInfo
- Publication number
- JP2004518163A JP2004518163A JP2002556880A JP2002556880A JP2004518163A JP 2004518163 A JP2004518163 A JP 2004518163A JP 2002556880 A JP2002556880 A JP 2002556880A JP 2002556880 A JP2002556880 A JP 2002556880A JP 2004518163 A JP2004518163 A JP 2004518163A
- Authority
- JP
- Japan
- Prior art keywords
- outside
- segment
- sinusoidal
- component
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 title claims description 19
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 230000011218 segmentation Effects 0.000 claims abstract description 11
- 230000006837 decompression Effects 0.000 claims abstract description 10
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
知られた符号化器100は、オーディオ又は音声信号sを少なくとも1つのセグメントx(n)へセグメント化するセグメント化ユニット110と、伸張(n)が、セグメントx(n)を所定の基準についてできるだけ良好に近似するように、セグメントx(n)から所定の伸張(n)の周波数と振幅データの形式のシヌソイダル符号データを計算する計算ユニット120を有する。本発明の目的は、前記シヌソイダル符号データの計算が単純な且つ安価な方法で実行できるように、知られた符号化器を改善することである。この方法は、次の伸張に従って、セグメントx(n)について、シヌソイダル符号データを計算することにより本発明に従って解決される。
Description
【0001】
本発明は、それぞれ、請求項1及び6の前文に従って、オーディオ又は音声信号をシヌソイダル符号データに符号化するパラメトリック符号化器及び方法に関連する。
【0002】
本発明は、更に、それぞれ、請求項11及び12の前文に従って、前記シヌソイダル符号データから、前記オーディオ又は音声信号の近似を再構成する、パラメトリック復号器及び方法に関連する。
【0003】
オーディオと音声信号は、チャネルを介して伝送される又は蓄積媒体に蓄積される前に、前記信号のデータを圧縮するために、符号化されるのが好ましい。オーディオ又は音声信号は、実質的には、シヌソイダル符号データにより表され、そして、これゆえに、これらの信号の符号化に特化された、特定の符号化器が従来技術で知られている。そのようなパラメトリック符号化器は、例えば、E.B.George及びM.J.T.Smithの”最少2乗シヌソイダル表現に基づく新い音声符号化モデル”から知られている。1987年音響スピーチ信号処理国際会議(ICASSP87)の論文誌、ページ1641−1644、ダラス TX、1987年4月6−9、IEEE、ピカウェイ、ニュージャージー。そこに記述されているパラメトリック符号化器が、図5に示されている。図5に従って、パラメトリック符号化器500は、受信されたオーディオ又は音声信号sを少なくとも1つの有限のセグメントx(n)へセグメント化するセグメント化ユニット510を含む。
【0004】
前記セグメントx(n)は、計算ユニット520へ入力される。前記計算ユニット520は、セグメントx(n)から、伸張
【0005】
【外94】
がセグメントx(n)を、例えば、最小の重み付けされた2乗誤差のような、所定の基準についてできるだけ良好に近似するように、所定の伸張
【0006】
【外95】
の位相と振幅データの形式のシヌソイダル符号データを計算する。引用されたパラメトリック符号化器につては、伸張は、
【0007】
【数20】
によりあたえられ、
【0008】
【外96】
は、振幅パラメータAiと位相パラメータ
【0009】
【外97】
の多項式係数である。
【0010】
計算ユニット520は、前記セグメントx(n)の周波数スペクトラム内の周波数を選ぶことにより、例えば、k=1(従って、
【0011】
【外98】
)について、受信されたセグメントx(n)から位相係数
【0012】
【外99】
を計算する、周波数推定ユニット522を有する。これらの位相係数
【0013】
【外100】
は、前記シヌソイダル符号データの位相部分を示し、一方では、マルチプレクサ530への出力され、そして、他方ではパターン発生ユニット524への入力される。前記パターン発生ユニットは、式(3)に従って、位相パラメータ
【0014】
【外101】
を計算するように働く。
【0015】
パターン発生ユニット524は、更に、
【0016】
【数21】
に従って、伸張
【0017】
【外102】
の複数のJxLの成分pijを発生する。
【0018】
複数のJxLの成分pijは、セグメント化ユニット510から出力される受信されたセグメントx(n)からだけでなく、前記受信された成分から、最適な振幅データ
【0019】
【外103】
を決定する、振幅推定ユニット526へ入力される。
【0020】
位相係数
【0021】
【外104】
と振幅係数
【0022】
【外105】
は、セグメントx(n)の近似として、伸張
【0023】
【外106】
を表すシヌソイダル符号データを構成する。これらのシヌソイダル符号データは、記録媒体に格納される又は、チャネルを介して伝送される、データストリームを構成するために、マルチプレクサ530で多重される。
【0024】
式(1)で記載されそして、記載されたパラメトリック符号化器500から知られる伸張
【0025】
【外107】
は、オーディオ又は音声信号の個々のセグメントx(n)の適切な近似を提供する。しかしながら、シヌソイダル符号データの計算は、むしろ複雑である。
【0026】
従来技術から出発すると、本発明の目的は、前記シヌソイダル符号データの計算が単純な且つ安価な方法で実行できるように、オーディオ又は音声信号をシヌソイダル符号データへ符号化する知られたパラメトリック符号化器及び方法を改善することであり、そして、伝送又は回復後に、前記シヌソイダル符号データから前記オーディオ又は音声信号の近似を再構成する、知られたパラメトリック復号器と方法を改善することである。
【0027】
この目的は、請求項1の主題により解決される。特に、この目的は、計算ユニットに、次の伸張
【0028】
【外108】
【0029】
【数22】
について、シヌソイダル符号データ
【0030】
【外109】
を計算するように、適用することにより解決され、
iは、
【0031】
【外110】
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0032】
【外111】
は、前記シヌソイダル符号データの1つとしての位相係数値を表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0033】
【外112】
は、位相であり、
【0034】
【外113】
は、前記シヌソイダル符号データの振幅部分を表す成分の線形に関係する振幅値を表す。
【0035】
優位に、請求された伸張
【0036】
【外114】
が、正確に特定のセグメントx(n)を記述するように、シヌソイダルデータを定義しようとするときに発生する最適化問題は、簡単に解決される。簡単な計算は、位相係数
【0037】
【外115】
を除いて、振幅データ
【0038】
【外116】
は請求された伸張
【0039】
【外117】
内に線形に含まれるという事実の結果である。
【0040】
【外118】
内に、ゼロ次の位相係数はなく、一方そのような成分は、
【0041】
【外119】
の形式の
【0042】
【外120】
に存在する、ことに注意する。
【0043】
さらに、優位に、請求された伸張
【0044】
【外121】
は、請求された伸張
【0045】
【外122】
が従来技術で知られた伸張よりも広く且つ個々のセグメントx(n)の更に正確な近似を提供するという、結果を有するシヌソイダル符号データを定義する更なる自由度を提供する。
【0046】
本発明の第1の実施例に従って、線形に独立な関数fj(n)は、fj(n)=njに設定される。このように、請求された伸張
【0047】
【外123】
は、多項式伸張に制限される。
【0048】
請求されたパラメトリック符号化器の及び、特に請求された計算ユニットの更に優位な実施例は、従属する符号化器クレームの主題である。
【0049】
上述の目的は、さらに、請求項6に記載のオーディオ又は音声信号を符号化する方法により、解決される。前記方法の利点と実施例は、パラメトリック符号化器について上述した、利点と実施例に対応する。
【0050】
上述の目的は、さらに、請求項11に従って、伝送され又は再生された符号データから、オーディオ又は音声信号の近似
【0051】
【外124】
を再構成するパラメトリック復号器により、解決される。特に、この目的は、以下の式
【0052】
【数23】
に従って、シヌソイダル符号データ
【0053】
【外125】
から、前記セグメント
【0054】
【外126】
を再構成するように、知られた合成器に適用することにより解決され、
iは、伸張
【0055】
【外127】
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0056】
【外128】
は、前記シヌソイダルデータの1つとしての位相係数を表し、
【0057】
【外129】
は、位相であり、
【0058】
【外130】
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す。
【0059】
優位に、請求された伸張
【0060】
【外131】
の計算は、従来技術で知られた伸張の計算よりも簡単である。これは、前記伸張内に振幅データ
【0061】
【外132】
の線形な関係と、ゼロ次の位相係数の省略による。
【0062】
伸張
【0063】
【外133】
の簡単な計算により、近似
【0064】
【外134】
の形式の元のオーディオ又は音声信号sの再構成は、安く且つ速く実現できる。
【0065】
前述の目的は、更に、請求項12に記載の復号方法により解決される。前記方法の利点は、パラメトリック復号器を参照して前述した利点に対応する。
【0066】
5つの図が、添付されている。
【0067】
本発明の好ましい実施例を説明する前に、本発明の主題に関する幾つかの基本的な説明がなされる。
【0068】
本発明は、オーディオ又は音声信号sのセグメントx(n)を近似するために、伸張
【0069】
【外135】
を提案する。前記伸張
【0070】
【外136】
は、位相と振幅データで表現され、以後、シヌソイダル符号データと呼ぶ。シヌソイダル符号データは、伸張
【0071】
【外137】
が、例えば、重み付けされた2乗誤差の最小化ような、所定の基準について、可能な限り良好に、セグメントx(n)を近似するように、定義される。言いかえれば、シヌソイダル符号データは、最適化問題を解決することにより定義されねばならない。シヌソイダル符号データが、特定のセグメントx(n)を最適に近似するように定義された後に、前記セグメントx(n)を表す、そして、前記オーディオ又は音声信号sも表す、符号データとして、蓄積媒体に蓄積され又はチャネルを介して伝送されうる。蓄積され又は伝送される前に、シヌソイダル符号データは、関連しない又は冗長なデータがそこから除去されるように、符号化され及び/又はきれいにされることが好ましい。
【0072】
本発明の第1の実施例に従って、前記シヌソイダル符号データの発生を、図1を参照して、説明する。
【0073】
図1は、入力オーディオ又は音声信号sを表す前記シヌソイダル符号データを発生するパラメトリック符号化器100の第1の実施例を示す。受信された信号sは、前記信号sを少なくとも1つのセグメントx(n)のにセグメント化するセグメント化ユニット110に入力される。
【0074】
【数24】
ここで、i,j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0075】
【外138】
は、前記シヌソイダルデータの1つとしての位相係数を表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0076】
【外139】
は、位相であり、
【0077】
【外140】
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、を有する、伸張
【0078】
【外141】
が、前記計算ユニット120に入力されたセグメントx(n)を、例えば、重み付けされた2乗誤差の最小化のような、所定の基準について、できるだけ良好に、近似するように、前記セグメントx(n)は、前記シヌソイダル符号データを発生する計算ユニット120へ入力される。前記計算ユニット120により決定されるシヌソイダル符号データは、位相
【0079】
【外142】
と振幅データ
【0080】
【外143】
である。
【0081】
【数25】
を有する式(4)の項Ciは、以後、i=1−Lを有する伸張
【0082】
【外144】
の第i成分と呼ぶ。
【0083】
計算ユニット120は、個々に受信されたセグメントx(n)を表す式(5)に従って、伸張
【0084】
【外145】
のi=1−Lを有する全成分Ciについてのk=1−Kを有する複数のLxKの位相係数
【0085】
【外146】
を決定する、周波数推定ユニット122を含む。前記複数のLxKの周波数
【0086】
【外147】
は、式(5)に従って、i=1−Lを有する複数のLの周波数パラメータ
【0087】
【外148】
を計算するパターン発生ユニット124へ入力される。前記パターン発生ユニット124は、更に、
i=1−L且つj=0−(J−1)について、
【0088】
【数26】
に従って、i=1−Lを有する成分Ciについて、複数のJxLペアのパターン
【0089】
【外149】
を発生するように、適用される。
【0090】
前記複数のペアのパターン
【0091】
【外150】
は、−セグメントx(n)と共に−、伸張
【0092】
【外151】
の全ての成分Ciの、全ての受信されたパターン
【0093】
【外152】
についての複数のJxLの振幅データ
【0094】
【外153】
と、全ての受信されたパターン
【0095】
【外154】
についての複数のJxLの振幅データ
【0096】
【外155】
とを決定する、振幅推定ユニット126に入力される。
【0097】
計算ユニット120と特に周波数推定ユニット122及び振幅推定ユニット126は、位相データ
【0098】
【外156】
と、振幅データ
【0099】
【外157】
を有するシヌソイダルデータが、基準”セグメントx(n)と伸張
【0100】
【外158】
の間の重み付けられた2乗誤差Eの最小化”が(ほぼ)満足されるように、決定され且つ最適化されるように、適用される。
【0101】
パラメトリック符号化器100は、更に、前記周波数推定ユニット122により出力される複数のLxKの位相係数
【0102】
【外159】
及び、前記振幅推定ユニット126から出力される複数のJxLの振幅データ
【0103】
【外160】
を、蓄積媒体に蓄積される又はチャネルを介して伝送されるデータストリームへ変換する、マルチプレクサ130を有する。
【0104】
図2は、第2の実施例のパラメトリック符号化器100’を示す。パラメトリック符号化器100のように、パラメトリック符号化器100’も、入力オーディオ又は音声信号sから前記シヌソイダル符号データ発生するように動作する。そのセグメント化ユニット110’の動作は、セグメント化ユニット110の動作に対応する。従って、セグメント化ユニット110’は、その出力に、受信された信号sのセグメントx(n)を発生する。前記セグメントx(n)は、計算ユニット120’へ入力される。計算ユニット120の第1の実施例と異なり、計算ユニット120’は、セグメント
【0105】
【外161】
の全ての成分について、同時に複数のシヌソイダル符号データを計算しないが、しかし、伸張
【0106】
【外162】
のi=1−Lの各成分Ciについて、順次に、このシヌソイダル符号データを発生する。この計算の方法は、一般的には、従来技術では、合成による分析又は、整合追跡アルゴリズムとして知られている。しかしながら、従来技術では、前記方法の応用は、式(4)に従った請求された伸張
【0107】
【外163】
から異なる伸張に対してのみ知られている。
【0108】
以下に、計算ユニット120’の前記第2の実施例の動作を、図2と3を参照して説明する。特に、式(4)に従った伸張
【0109】
【外164】
のシヌソイダル符号データの計算が、セグメント化ユニット110’により出力されるセグメントとその伸張
【0110】
【外165】
の間の重み付けされた2乗誤差が、式(4)に従って、(ほぼ)最小化されるように、記述される。
【0111】
第1のサイクルで、i=1、伸張
【0112】
【外166】
のi=1を有する第1成分Ciのシヌソイダル符号データが計算される(図3の方法ステップa))
これを達成するために、セグメント化ユニット110’の出力x(n)は、εi−1=x(n)に設定される(方法ステップb)参照)。
【0113】
前記第1サイクルで、セグメント化ユニット110’の前記出力は、入力値εi−1からk=1−Kを有する複数のKの位相係数
【0114】
【外167】
を決定する周波数推定ユニット122’へ入力される(方法ステップc)参照)。前記位相係数
【0115】
【外168】
は、検索されたシヌソイダル符号データの位相を表しそして、計算入力ニットから出力される。更に、前記位相係数
【0116】
【外169】
は、式(5)に従って、第1成分C1についてi=1を有する位相
【0117】
【外170】
を計算するためにパターン発生ユニット124’へ入力される(方法ステップd)参照)。前記パターン発生ユニット124’は、更に、i=1について、
【0118】
【数27】
の、成分Ciについて、j=0−(J−1)を有する複数の2xJのパターンを発生するために動作する(方法ステップe)参照)。これらの発生されたパターン
【0119】
【外171】
は、−パラメータεi−1と共に−振幅推定ユニット126’へ入力される。前記振幅推定ユニット126’は、受信された入力データからi=1の成分Ciについて、前記パターン
【0120】
【外172】
についての複数のJの振幅
【0121】
【外173】
と、前記パターン
【0122】
【外174】
についてのJの振幅
【0123】
【外175】
とを決定するように動作する(方法ステップf)参照)。前記計算された振幅
【0124】
【外176】
は、セグメントx(n)の伸張
【0125】
【外177】
を表すシヌソイダルデータの振幅部分を構成し、そして、前記位相データ
【0126】
【外178】
と共にi=1を有する前記第1成分Ciを表すデータストリームへマージされるために、計算ユニット120’から出力される。更に、前記振幅データ
【0127】
【外179】
は、それぞれのパターン
【0128】
【外180】
と共に、
【0129】
【数28】
に従って、i=1を有する成分Ciを計算するために、合成器128’へ入力される(方法ステップg)参照)。
【0130】
前記成分Ciは、前記周波数推定ユニット122’へ入力される値εi−1から、減算するために、減算ユニット129’に入力される。前記減算ユニット129’の出力で発生する差は、i=1を有するεiと呼ばれる(方法ステップh)参照)。
【0131】
ここで、伸張
【0132】
【外181】
についての、第1の成分C1とそのシヌソイダル符号データ
【0133】
【外182】
を計算する第1のサイクルが終了する。続いて、パラメータiが、セグメント
【0134】
【外183】
の成分Ciの合計数Lと比較される(方法ステップi)参照)。
【0135】
【外184】
の場合には、i=i+1について、方法ステップc)からi)が繰返される。これらの場合には、
【0136】
【外185】
に対するセグメント化ユニット110’からの出力は、周波数推定ユニット122’の入力から切断され、代わりに、周波数推定ユニット122’の入力は差εiを受信するために前記減算ユニット129’の出力に接続される。しかしながら、
【0137】
【外186】
の場合には、伸張
【0138】
【外187】
の全てのLの成分のシヌソイダル符号データは計算され、そして、計算ユニット120’により実行される計算処理は、特定のセグメント
【0139】
【外188】
について、完了する。続いて、全体の手順が、入力するオーディオ又は音声信号の後続のセグメントについて繰返される。
【0140】
図4は、受信された入力データから、オーディオ又は音声信号sの近似
【0141】
【外189】
を再構成するパラメトリック復号器400を示す。これらの受信された入力データは、伝送された又は蓄積媒体から再生された後のデータストリームのデータに対応する。
【0142】
パラメトリック復号器400は、前記受信された入力データから、オーディオ及び/又は音声信号sの近似
【0143】
【外190】
のセグメント
【0144】
【外191】
を示すシヌソイダル符号データ
【0145】
【外192】
を選択する選択ユニット420を有する。パラメトリック復号器400は、更に、前記受信されたシヌソイダル符号データから、前記セグメント
【0146】
【外193】
を再構成する合成器440と、再構成されたセグメント
【0147】
【外194】
を連結することにより近似
【0148】
【外195】
を再構成する結合ユニット460を有する。
【0149】
上述の実施例は本発明を限定するものではなく説明するものであり、そして、当業者は請求項の範囲から離れることなく多くの代わりの実施例を設計できることに、注意すべきである。請求の範囲では、括弧内に記載の符号は請求項を限定するように解釈するものではない。用語”有する”は、請求項に列挙された以外の他の構成要素又はステップの存在を除外しない。本発明は、幾つかの特徴的な構成要素を有するハードウェアにより、そして、適するようにプログラムされたコンピュータにより実行できる。幾つかの手段を列挙する装置の請求項では、これらの手段の幾つかは、1つの同じハードウェアで実現されうる。幾つかの相互に異なる従属請求項で、特定の手段が引用されていることは、これらの手段の組合せが、優位に使用できないことを示すものではない。
【図面の簡単な説明】
【図1】
本発明に従ったパラメトリック符号化器の第1の実施例を示す図である。
【図2】
本発明に従ったパラメトリック符号化器の第2の実施例を示す図である。
【図3】
本発明に従ったパラメトリック符号化器の第2の実施例の動作を示すフローチャートである。
【図4】
本発明の実施例に従ったパラメトリック復号器を示す図である。
【図5】
従来技術のパラメトリック符号化器示す図である。
本発明は、それぞれ、請求項1及び6の前文に従って、オーディオ又は音声信号をシヌソイダル符号データに符号化するパラメトリック符号化器及び方法に関連する。
【0002】
本発明は、更に、それぞれ、請求項11及び12の前文に従って、前記シヌソイダル符号データから、前記オーディオ又は音声信号の近似を再構成する、パラメトリック復号器及び方法に関連する。
【0003】
オーディオと音声信号は、チャネルを介して伝送される又は蓄積媒体に蓄積される前に、前記信号のデータを圧縮するために、符号化されるのが好ましい。オーディオ又は音声信号は、実質的には、シヌソイダル符号データにより表され、そして、これゆえに、これらの信号の符号化に特化された、特定の符号化器が従来技術で知られている。そのようなパラメトリック符号化器は、例えば、E.B.George及びM.J.T.Smithの”最少2乗シヌソイダル表現に基づく新い音声符号化モデル”から知られている。1987年音響スピーチ信号処理国際会議(ICASSP87)の論文誌、ページ1641−1644、ダラス TX、1987年4月6−9、IEEE、ピカウェイ、ニュージャージー。そこに記述されているパラメトリック符号化器が、図5に示されている。図5に従って、パラメトリック符号化器500は、受信されたオーディオ又は音声信号sを少なくとも1つの有限のセグメントx(n)へセグメント化するセグメント化ユニット510を含む。
【0004】
前記セグメントx(n)は、計算ユニット520へ入力される。前記計算ユニット520は、セグメントx(n)から、伸張
【0005】
【外94】
がセグメントx(n)を、例えば、最小の重み付けされた2乗誤差のような、所定の基準についてできるだけ良好に近似するように、所定の伸張
【0006】
【外95】
の位相と振幅データの形式のシヌソイダル符号データを計算する。引用されたパラメトリック符号化器につては、伸張は、
【0007】
【数20】
によりあたえられ、
【0008】
【外96】
は、振幅パラメータAiと位相パラメータ
【0009】
【外97】
の多項式係数である。
【0010】
計算ユニット520は、前記セグメントx(n)の周波数スペクトラム内の周波数を選ぶことにより、例えば、k=1(従って、
【0011】
【外98】
)について、受信されたセグメントx(n)から位相係数
【0012】
【外99】
を計算する、周波数推定ユニット522を有する。これらの位相係数
【0013】
【外100】
は、前記シヌソイダル符号データの位相部分を示し、一方では、マルチプレクサ530への出力され、そして、他方ではパターン発生ユニット524への入力される。前記パターン発生ユニットは、式(3)に従って、位相パラメータ
【0014】
【外101】
を計算するように働く。
【0015】
パターン発生ユニット524は、更に、
【0016】
【数21】
に従って、伸張
【0017】
【外102】
の複数のJxLの成分pijを発生する。
【0018】
複数のJxLの成分pijは、セグメント化ユニット510から出力される受信されたセグメントx(n)からだけでなく、前記受信された成分から、最適な振幅データ
【0019】
【外103】
を決定する、振幅推定ユニット526へ入力される。
【0020】
位相係数
【0021】
【外104】
と振幅係数
【0022】
【外105】
は、セグメントx(n)の近似として、伸張
【0023】
【外106】
を表すシヌソイダル符号データを構成する。これらのシヌソイダル符号データは、記録媒体に格納される又は、チャネルを介して伝送される、データストリームを構成するために、マルチプレクサ530で多重される。
【0024】
式(1)で記載されそして、記載されたパラメトリック符号化器500から知られる伸張
【0025】
【外107】
は、オーディオ又は音声信号の個々のセグメントx(n)の適切な近似を提供する。しかしながら、シヌソイダル符号データの計算は、むしろ複雑である。
【0026】
従来技術から出発すると、本発明の目的は、前記シヌソイダル符号データの計算が単純な且つ安価な方法で実行できるように、オーディオ又は音声信号をシヌソイダル符号データへ符号化する知られたパラメトリック符号化器及び方法を改善することであり、そして、伝送又は回復後に、前記シヌソイダル符号データから前記オーディオ又は音声信号の近似を再構成する、知られたパラメトリック復号器と方法を改善することである。
【0027】
この目的は、請求項1の主題により解決される。特に、この目的は、計算ユニットに、次の伸張
【0028】
【外108】
【0029】
【数22】
について、シヌソイダル符号データ
【0030】
【外109】
を計算するように、適用することにより解決され、
iは、
【0031】
【外110】
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0032】
【外111】
は、前記シヌソイダル符号データの1つとしての位相係数値を表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0033】
【外112】
は、位相であり、
【0034】
【外113】
は、前記シヌソイダル符号データの振幅部分を表す成分の線形に関係する振幅値を表す。
【0035】
優位に、請求された伸張
【0036】
【外114】
が、正確に特定のセグメントx(n)を記述するように、シヌソイダルデータを定義しようとするときに発生する最適化問題は、簡単に解決される。簡単な計算は、位相係数
【0037】
【外115】
を除いて、振幅データ
【0038】
【外116】
は請求された伸張
【0039】
【外117】
内に線形に含まれるという事実の結果である。
【0040】
【外118】
内に、ゼロ次の位相係数はなく、一方そのような成分は、
【0041】
【外119】
の形式の
【0042】
【外120】
に存在する、ことに注意する。
【0043】
さらに、優位に、請求された伸張
【0044】
【外121】
は、請求された伸張
【0045】
【外122】
が従来技術で知られた伸張よりも広く且つ個々のセグメントx(n)の更に正確な近似を提供するという、結果を有するシヌソイダル符号データを定義する更なる自由度を提供する。
【0046】
本発明の第1の実施例に従って、線形に独立な関数fj(n)は、fj(n)=njに設定される。このように、請求された伸張
【0047】
【外123】
は、多項式伸張に制限される。
【0048】
請求されたパラメトリック符号化器の及び、特に請求された計算ユニットの更に優位な実施例は、従属する符号化器クレームの主題である。
【0049】
上述の目的は、さらに、請求項6に記載のオーディオ又は音声信号を符号化する方法により、解決される。前記方法の利点と実施例は、パラメトリック符号化器について上述した、利点と実施例に対応する。
【0050】
上述の目的は、さらに、請求項11に従って、伝送され又は再生された符号データから、オーディオ又は音声信号の近似
【0051】
【外124】
を再構成するパラメトリック復号器により、解決される。特に、この目的は、以下の式
【0052】
【数23】
に従って、シヌソイダル符号データ
【0053】
【外125】
から、前記セグメント
【0054】
【外126】
を再構成するように、知られた合成器に適用することにより解決され、
iは、伸張
【0055】
【外127】
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0056】
【外128】
は、前記シヌソイダルデータの1つとしての位相係数を表し、
【0057】
【外129】
は、位相であり、
【0058】
【外130】
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す。
【0059】
優位に、請求された伸張
【0060】
【外131】
の計算は、従来技術で知られた伸張の計算よりも簡単である。これは、前記伸張内に振幅データ
【0061】
【外132】
の線形な関係と、ゼロ次の位相係数の省略による。
【0062】
伸張
【0063】
【外133】
の簡単な計算により、近似
【0064】
【外134】
の形式の元のオーディオ又は音声信号sの再構成は、安く且つ速く実現できる。
【0065】
前述の目的は、更に、請求項12に記載の復号方法により解決される。前記方法の利点は、パラメトリック復号器を参照して前述した利点に対応する。
【0066】
5つの図が、添付されている。
【0067】
本発明の好ましい実施例を説明する前に、本発明の主題に関する幾つかの基本的な説明がなされる。
【0068】
本発明は、オーディオ又は音声信号sのセグメントx(n)を近似するために、伸張
【0069】
【外135】
を提案する。前記伸張
【0070】
【外136】
は、位相と振幅データで表現され、以後、シヌソイダル符号データと呼ぶ。シヌソイダル符号データは、伸張
【0071】
【外137】
が、例えば、重み付けされた2乗誤差の最小化ような、所定の基準について、可能な限り良好に、セグメントx(n)を近似するように、定義される。言いかえれば、シヌソイダル符号データは、最適化問題を解決することにより定義されねばならない。シヌソイダル符号データが、特定のセグメントx(n)を最適に近似するように定義された後に、前記セグメントx(n)を表す、そして、前記オーディオ又は音声信号sも表す、符号データとして、蓄積媒体に蓄積され又はチャネルを介して伝送されうる。蓄積され又は伝送される前に、シヌソイダル符号データは、関連しない又は冗長なデータがそこから除去されるように、符号化され及び/又はきれいにされることが好ましい。
【0072】
本発明の第1の実施例に従って、前記シヌソイダル符号データの発生を、図1を参照して、説明する。
【0073】
図1は、入力オーディオ又は音声信号sを表す前記シヌソイダル符号データを発生するパラメトリック符号化器100の第1の実施例を示す。受信された信号sは、前記信号sを少なくとも1つのセグメントx(n)のにセグメント化するセグメント化ユニット110に入力される。
【0074】
【数24】
ここで、i,j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0075】
【外138】
は、前記シヌソイダルデータの1つとしての位相係数を表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0076】
【外139】
は、位相であり、
【0077】
【外140】
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、を有する、伸張
【0078】
【外141】
が、前記計算ユニット120に入力されたセグメントx(n)を、例えば、重み付けされた2乗誤差の最小化のような、所定の基準について、できるだけ良好に、近似するように、前記セグメントx(n)は、前記シヌソイダル符号データを発生する計算ユニット120へ入力される。前記計算ユニット120により決定されるシヌソイダル符号データは、位相
【0079】
【外142】
と振幅データ
【0080】
【外143】
である。
【0081】
【数25】
を有する式(4)の項Ciは、以後、i=1−Lを有する伸張
【0082】
【外144】
の第i成分と呼ぶ。
【0083】
計算ユニット120は、個々に受信されたセグメントx(n)を表す式(5)に従って、伸張
【0084】
【外145】
のi=1−Lを有する全成分Ciについてのk=1−Kを有する複数のLxKの位相係数
【0085】
【外146】
を決定する、周波数推定ユニット122を含む。前記複数のLxKの周波数
【0086】
【外147】
は、式(5)に従って、i=1−Lを有する複数のLの周波数パラメータ
【0087】
【外148】
を計算するパターン発生ユニット124へ入力される。前記パターン発生ユニット124は、更に、
i=1−L且つj=0−(J−1)について、
【0088】
【数26】
に従って、i=1−Lを有する成分Ciについて、複数のJxLペアのパターン
【0089】
【外149】
を発生するように、適用される。
【0090】
前記複数のペアのパターン
【0091】
【外150】
は、−セグメントx(n)と共に−、伸張
【0092】
【外151】
の全ての成分Ciの、全ての受信されたパターン
【0093】
【外152】
についての複数のJxLの振幅データ
【0094】
【外153】
と、全ての受信されたパターン
【0095】
【外154】
についての複数のJxLの振幅データ
【0096】
【外155】
とを決定する、振幅推定ユニット126に入力される。
【0097】
計算ユニット120と特に周波数推定ユニット122及び振幅推定ユニット126は、位相データ
【0098】
【外156】
と、振幅データ
【0099】
【外157】
を有するシヌソイダルデータが、基準”セグメントx(n)と伸張
【0100】
【外158】
の間の重み付けられた2乗誤差Eの最小化”が(ほぼ)満足されるように、決定され且つ最適化されるように、適用される。
【0101】
パラメトリック符号化器100は、更に、前記周波数推定ユニット122により出力される複数のLxKの位相係数
【0102】
【外159】
及び、前記振幅推定ユニット126から出力される複数のJxLの振幅データ
【0103】
【外160】
を、蓄積媒体に蓄積される又はチャネルを介して伝送されるデータストリームへ変換する、マルチプレクサ130を有する。
【0104】
図2は、第2の実施例のパラメトリック符号化器100’を示す。パラメトリック符号化器100のように、パラメトリック符号化器100’も、入力オーディオ又は音声信号sから前記シヌソイダル符号データ発生するように動作する。そのセグメント化ユニット110’の動作は、セグメント化ユニット110の動作に対応する。従って、セグメント化ユニット110’は、その出力に、受信された信号sのセグメントx(n)を発生する。前記セグメントx(n)は、計算ユニット120’へ入力される。計算ユニット120の第1の実施例と異なり、計算ユニット120’は、セグメント
【0105】
【外161】
の全ての成分について、同時に複数のシヌソイダル符号データを計算しないが、しかし、伸張
【0106】
【外162】
のi=1−Lの各成分Ciについて、順次に、このシヌソイダル符号データを発生する。この計算の方法は、一般的には、従来技術では、合成による分析又は、整合追跡アルゴリズムとして知られている。しかしながら、従来技術では、前記方法の応用は、式(4)に従った請求された伸張
【0107】
【外163】
から異なる伸張に対してのみ知られている。
【0108】
以下に、計算ユニット120’の前記第2の実施例の動作を、図2と3を参照して説明する。特に、式(4)に従った伸張
【0109】
【外164】
のシヌソイダル符号データの計算が、セグメント化ユニット110’により出力されるセグメントとその伸張
【0110】
【外165】
の間の重み付けされた2乗誤差が、式(4)に従って、(ほぼ)最小化されるように、記述される。
【0111】
第1のサイクルで、i=1、伸張
【0112】
【外166】
のi=1を有する第1成分Ciのシヌソイダル符号データが計算される(図3の方法ステップa))
これを達成するために、セグメント化ユニット110’の出力x(n)は、εi−1=x(n)に設定される(方法ステップb)参照)。
【0113】
前記第1サイクルで、セグメント化ユニット110’の前記出力は、入力値εi−1からk=1−Kを有する複数のKの位相係数
【0114】
【外167】
を決定する周波数推定ユニット122’へ入力される(方法ステップc)参照)。前記位相係数
【0115】
【外168】
は、検索されたシヌソイダル符号データの位相を表しそして、計算入力ニットから出力される。更に、前記位相係数
【0116】
【外169】
は、式(5)に従って、第1成分C1についてi=1を有する位相
【0117】
【外170】
を計算するためにパターン発生ユニット124’へ入力される(方法ステップd)参照)。前記パターン発生ユニット124’は、更に、i=1について、
【0118】
【数27】
の、成分Ciについて、j=0−(J−1)を有する複数の2xJのパターンを発生するために動作する(方法ステップe)参照)。これらの発生されたパターン
【0119】
【外171】
は、−パラメータεi−1と共に−振幅推定ユニット126’へ入力される。前記振幅推定ユニット126’は、受信された入力データからi=1の成分Ciについて、前記パターン
【0120】
【外172】
についての複数のJの振幅
【0121】
【外173】
と、前記パターン
【0122】
【外174】
についてのJの振幅
【0123】
【外175】
とを決定するように動作する(方法ステップf)参照)。前記計算された振幅
【0124】
【外176】
は、セグメントx(n)の伸張
【0125】
【外177】
を表すシヌソイダルデータの振幅部分を構成し、そして、前記位相データ
【0126】
【外178】
と共にi=1を有する前記第1成分Ciを表すデータストリームへマージされるために、計算ユニット120’から出力される。更に、前記振幅データ
【0127】
【外179】
は、それぞれのパターン
【0128】
【外180】
と共に、
【0129】
【数28】
に従って、i=1を有する成分Ciを計算するために、合成器128’へ入力される(方法ステップg)参照)。
【0130】
前記成分Ciは、前記周波数推定ユニット122’へ入力される値εi−1から、減算するために、減算ユニット129’に入力される。前記減算ユニット129’の出力で発生する差は、i=1を有するεiと呼ばれる(方法ステップh)参照)。
【0131】
ここで、伸張
【0132】
【外181】
についての、第1の成分C1とそのシヌソイダル符号データ
【0133】
【外182】
を計算する第1のサイクルが終了する。続いて、パラメータiが、セグメント
【0134】
【外183】
の成分Ciの合計数Lと比較される(方法ステップi)参照)。
【0135】
【外184】
の場合には、i=i+1について、方法ステップc)からi)が繰返される。これらの場合には、
【0136】
【外185】
に対するセグメント化ユニット110’からの出力は、周波数推定ユニット122’の入力から切断され、代わりに、周波数推定ユニット122’の入力は差εiを受信するために前記減算ユニット129’の出力に接続される。しかしながら、
【0137】
【外186】
の場合には、伸張
【0138】
【外187】
の全てのLの成分のシヌソイダル符号データは計算され、そして、計算ユニット120’により実行される計算処理は、特定のセグメント
【0139】
【外188】
について、完了する。続いて、全体の手順が、入力するオーディオ又は音声信号の後続のセグメントについて繰返される。
【0140】
図4は、受信された入力データから、オーディオ又は音声信号sの近似
【0141】
【外189】
を再構成するパラメトリック復号器400を示す。これらの受信された入力データは、伝送された又は蓄積媒体から再生された後のデータストリームのデータに対応する。
【0142】
パラメトリック復号器400は、前記受信された入力データから、オーディオ及び/又は音声信号sの近似
【0143】
【外190】
のセグメント
【0144】
【外191】
を示すシヌソイダル符号データ
【0145】
【外192】
を選択する選択ユニット420を有する。パラメトリック復号器400は、更に、前記受信されたシヌソイダル符号データから、前記セグメント
【0146】
【外193】
を再構成する合成器440と、再構成されたセグメント
【0147】
【外194】
を連結することにより近似
【0148】
【外195】
を再構成する結合ユニット460を有する。
【0149】
上述の実施例は本発明を限定するものではなく説明するものであり、そして、当業者は請求項の範囲から離れることなく多くの代わりの実施例を設計できることに、注意すべきである。請求の範囲では、括弧内に記載の符号は請求項を限定するように解釈するものではない。用語”有する”は、請求項に列挙された以外の他の構成要素又はステップの存在を除外しない。本発明は、幾つかの特徴的な構成要素を有するハードウェアにより、そして、適するようにプログラムされたコンピュータにより実行できる。幾つかの手段を列挙する装置の請求項では、これらの手段の幾つかは、1つの同じハードウェアで実現されうる。幾つかの相互に異なる従属請求項で、特定の手段が引用されていることは、これらの手段の組合せが、優位に使用できないことを示すものではない。
【図面の簡単な説明】
【図1】
本発明に従ったパラメトリック符号化器の第1の実施例を示す図である。
【図2】
本発明に従ったパラメトリック符号化器の第2の実施例を示す図である。
【図3】
本発明に従ったパラメトリック符号化器の第2の実施例の動作を示すフローチャートである。
【図4】
本発明の実施例に従ったパラメトリック復号器を示す図である。
【図5】
従来技術のパラメトリック符号化器示す図である。
Claims (14)
- オーディオ又は音声信号sをシヌソイダル符号データへ符号化するパラメトリック符号化器であって、
− 前記信号sを少なくとも1つのセグメントx(n)へセグメント化するセグメント化ユニットと、
− 伸張
【外1】 が、所定の基準について、できるだけ良好にセグメントx(n)を近似するように、セグメントx(n)から所定の伸張
【外2】 の位相と振幅データの形式で、前記シヌソイダル符号データを計算する計算ユニットとを有し、
前記計算ユニットは、次の伸張
【外3】
【外4】 を計算するように、適用されることを特徴とし、
i,j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
Ciは、伸張
【外5】 の第i成分を表し、
【外6】 は、前記シヌソイダルデータの1つとしての位相係数を表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【外7】 は、位相であり、
【外8】 は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック符号化器。 - 計算ユニットは、
− 受信されたセグメントx(n)を表す伸張
【外9】 の全成分Ciについてi=1−L及びk=1−Kの、複数のLxKの位相係数
【外10】 を決定する周波数推定ユニットを有し、
− i=1−Lの複数のLの位相
【外11】 を、位相係数
【外12】 から、
【外13】 を発生する、パターン発生ユニットを有し、
− i=1−L且つj=0−(J−1)であり、
− 伸張
【外14】 の全ての成分Ciの、
パターン
【外15】 についての複数のJxLの振幅
【外16】 と、パターン
【外17】 についての複数のJxLの振幅
【外18】 とを決定する、振幅推定ユニットを有し、
− シヌソイダルデータ
【外19】 は、セグメントxとその伸張
【外20】 の間の重み付けされた2乗誤差Eが最小化される基準について少なくともほぼ最適化される、ことを特徴とする請求項1に記載のパラメトリック符号化器。 - 前記シヌソイダル符号データをデータストリームへマージするマルチプレクサを特徴とする、請求項1に記載のパラメトリック符号化器。
- 計算ユニットは、
− 入力値εi−1から成分Ciについてk=1−Kの複数のKの位相係数
【外21】 を決定する、周波数推定ユニットを有し、i=1の第1の成分C1について、入力値はε0=x(n)に設定され、
【外22】 から、成分Ciについての位相
【外23】 を計算し、且つ、
成分Ciに対するj=1−Jの、複数の2xJのパターン
【外24】
−受信されたセグメントx(n)からと受信された複数のパターン
【外25】 から、成分Ciの前記パターンについて、複数のJの振幅
【外26】 と、複数のJの振幅
【外27】 とを決定する、振幅推定ユニットを有し、
−前記複数の2xJパターン
【外28】 から成分Ciを再構成し且つ、
【外29】 を形成する合成器を有し、
−成分Ci+1を表すシヌソイダル符号データを計算するために、結果の差εiを、新たな入力値として、周波数推定ユニットの入力へ転送してフィードするために、入力値εi−1から前記成分Ciを減算する減算ユニットを有し、
シヌソイダルデータ
【外30】 は、セグメントxと伸張
【外31】 の間の重み付けされた2乗誤差Eが最小化される基準について最適化される、ことを特徴とする、請求項1に記載のパラメトリック符号化器。 - オーディオ又は音声信号sをシヌソイダル符号データへ符号化するパラメトリック符号化方法であって、
− 前記信号sを少なくとも1つのセグメントx(n)へセグメント化するステップと、
− 伸張
【外32】 が、所定の基準について、できるだけ良好にセグメントx(n)を近似するように、セグメントx(n)から所定の伸張
【外33】 の位相と振幅データの形式で、前記シヌソイダル符号データを計算するステップを有し、
− 伸張
【外34】 は、
iは、伸張
【外35】 の成分Ciを表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【外36】 は、前記シヌソイダルデータの1つとしての位相係数を表し、
【外37】 は、位相であり、
【外38】 は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック符号化方法。 - セグメントxと伸張
【外41】 の間の重み付けされた2乗誤差が最小化される基準を満足するために、最適な振幅
【外42】 の定義は、
− 受信されたセグメントx(n)の全ての成分Ciについて、i=1−L及びk=1−Kの、複数のLxKの位相係数
【外43】 を決定するステップと、
−
【外44】 から、i=1−Lの、複数のLの位相
【外45】 を計算するステップと、
−
【外46】 を発生し、
− 伸張
【外47】 の全ての成分Ciの全てのパターンのペア
【外48】 について、複数のJxLの振幅
【外49】 と、複数のJxLの振幅
【外50】 を決定するステップとを有する、ことを特徴とする請求項6に記載の方法。 - セグメントxと伸張
【外51】 の間の重み付けされた2乗誤差が最小化される基準を満足するために、振幅
【外52】 の定義は、
a)i=1に設定するステップと、
b)εi−1=ε0=x(n)のステップと、
c)入力値εi−1から成分Ciについてk=1−Kの複数のKの位相係数
【外53】 を決定するステップと、
d)
【外54】 から成分Ciについて位相
【外55】 を計算するステップと、
e)成分Ciについてj=0−(J−1)の複数の2xJのパターン
【外56】 を
f)受信されたセグメントx(n)からと受信された複数のパターン
【外57】 からの成分Ciについての前記パターンについて、複数のJの振幅
【外58】 と複数のJの振幅
【外59】 を決定するステップと、
g)パターンpijの前記複数のJのペアからと、複数の振幅
【外60】 から、
h)結果の差εiを計算するために、入力値εi−1から前記成分Ciを減算するステップと、
i)Lは成分の所定の数を表し、
j)i<Lの場合には、i=i+1でステップc>から再び開始することにより、この方法のステップを繰返すステップと、
k)
【外61】 の全てのLの成分のシヌソイダル符号データは計算され且つ処理が終了するステップとを有する、ことを特徴とする請求項6に記載の方法。 - 伝送された又は再生された符号データからオーディオ又は音声信号sの近似
【外62】 を再構成するパラメトリック復号器であって、
− 前記受信された伝送された又は再生された符号データから近似
【外63】 のセグメント
【外64】 を表すシヌソイダル符号データを選択する選択ユニットを有し、
−前記受信されたシヌソイダル符号データから、前記セグメント
【外65】 を再構成する合成器を有し、
− 前記オーディオ又は音声信号sの前記近似
【外66】 を形成するために、連続するセグメント
【外67】 を結合する結合ユニットを有し、シヌソイダル符号データは、前記セグメント
【外68】 の少なくとも1つの成分についての複数の周波数と振幅値であり、
− 前記合成器は、以下の公式に従って、前記シヌソイダル符号データから前記セグメント
【外69】 を再構成するように適用されることを特徴とし、
【外70】 の成分Ciを表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【外71】 は、前記シヌソイダルデータの1つとしての位相係数値を表し、
【外72】 は、位相であり、
【外73】 は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック復号器。 - 伝送された又は再生された符号データからオーディオ又は音声信号sの近似
【外74】 を再構成する復号方法であって、前記受信された伝送された又は再生された符号データから近似
【外75】 のセグメント
【外76】 を表すシヌソイダル符号データを選択する選択するステップを有し、
−前記受信されたシヌソイダル符号データから、前記セグメント
【外77】 を再構成するステップを有し、
− 前記オーディオ又は音声信号sの前記近似
【外78】 を形成するために、連続するセグメント
【外79】 を共に結合ステップを有し、
− シヌソイダル符号データは、前記セグメント
【外80】 の少なくとも1つの成分についての複数の位相と振幅値であり、
− 前記再構成するステップでは、以下の公式に従って、前記セグメント
【外81】 は前記シヌソイダル符号データから、再構成されることを特徴とし、
【外82】 の成分Ciを表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【外83】 は、前記シヌソイダルデータの1つとしての位相係数を表し、
【外84】 は、位相であり、
【外85】 は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、復号方法。 - オーディオ又は音声信号の近似
【外86】 のセグメント
【外87】 を表すシヌソイダル符号データを含むデータストリームであって、そのシヌソイダル符号データは、前記セグメント
【外88】 の少なくとも1つの成分についての複数の位相と振幅値であり、そのセグメント
【外89】 は、
iは、伸張
【外90】 の成分Ciを表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
fjは、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【外91】 は、前記シヌソイダルデータの1つとしての位相係数を表し、
【外92】 は、位相であり、
【外93】 は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、データストリーム。 - 請求項13に記載のデータストリームが格納された蓄積媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01200142 | 2001-01-16 | ||
EP01202612 | 2001-07-06 | ||
PCT/IB2001/002696 WO2002056299A1 (en) | 2001-01-16 | 2001-12-20 | Parametric coding of an audio or speech signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004518163A true JP2004518163A (ja) | 2004-06-17 |
Family
ID=26076810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002556880A Withdrawn JP2004518163A (ja) | 2001-01-16 | 2001-12-20 | オーディオ又は音声信号のパラメトリック符号化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7050970B2 (ja) |
JP (1) | JP2004518163A (ja) |
KR (1) | KR100849375B1 (ja) |
CN (1) | CN1293534C (ja) |
BR (1) | BR0109237A (ja) |
WO (1) | WO2002056299A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1826634B (zh) * | 2003-07-18 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 低比特率音频编码 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
KR101435411B1 (ko) * | 2007-09-28 | 2014-08-28 | 삼성전자주식회사 | 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치 |
KR102048076B1 (ko) | 2011-09-28 | 2019-11-22 | 엘지전자 주식회사 | 음성 신호 부호화 방법 및 음성 신호 복호화 방법 그리고 이를 이용하는 장치 |
CN106851482A (zh) * | 2017-03-24 | 2017-06-13 | 北京时代拓灵科技有限公司 | 一种全景声扬声器体感实时交互系统及交互方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4937873A (en) * | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
US6029126A (en) | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
WO2000079519A1 (en) * | 1999-06-18 | 2000-12-28 | Koninklijke Philips Electronics N.V. | Audio transmission system having an improved encoder |
-
2001
- 2001-12-20 CN CNB018094295A patent/CN1293534C/zh not_active Expired - Fee Related
- 2001-12-20 JP JP2002556880A patent/JP2004518163A/ja not_active Withdrawn
- 2001-12-20 KR KR1020027012176A patent/KR100849375B1/ko not_active IP Right Cessation
- 2001-12-20 BR BR0109237-5A patent/BR0109237A/pt not_active IP Right Cessation
- 2001-12-20 WO PCT/IB2001/002696 patent/WO2002056299A1/en not_active Application Discontinuation
-
2002
- 2002-01-14 US US10/046,472 patent/US7050970B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20020156621A1 (en) | 2002-10-24 |
BR0109237A (pt) | 2002-12-03 |
US7050970B2 (en) | 2006-05-23 |
CN1293534C (zh) | 2007-01-03 |
KR100849375B1 (ko) | 2008-07-31 |
WO2002056299A1 (en) | 2002-07-18 |
CN1429384A (zh) | 2003-07-09 |
KR20020084206A (ko) | 2002-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5203923B2 (ja) | 残留信号を修正することによって、ボコーダ内部のフレームを時間伸縮すること | |
JP3483958B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 | |
RU2504026C2 (ru) | Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера | |
US20060093048A9 (en) | Partial Spectral Loss Concealment In Transform Codecs | |
JP2005506582A (ja) | オーディオコーダにおける正弦波パラメータのトラッキング | |
RU2328775C2 (ru) | Улучшенное маскирование ошибки в области частот | |
KR20160002920A (ko) | 노이즈 주입이 가중된 프레임 손실 보정 | |
JP2002372996A (ja) | 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体 | |
JPH0990968A (ja) | 音声合成方法 | |
JP2002118517A (ja) | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 | |
US7363216B2 (en) | Method and system for parametric characterization of transient audio signals | |
JPH0590974A (ja) | 前反響処理方法およびその装置 | |
JP2004518163A (ja) | オーディオ又は音声信号のパラメトリック符号化 | |
US5822721A (en) | Method and apparatus for fractal-excited linear predictive coding of digital signals | |
US20020040299A1 (en) | Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP4699117B2 (ja) | 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。 | |
JP2007047813A (ja) | ディジタル信号処理方法、そのプログラム、及びそのプログラムを格納した記録媒体 | |
JP3731575B2 (ja) | 符号化装置及び復号装置 | |
JP2004023191A (ja) | 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム | |
JP4195598B2 (ja) | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム | |
JP3576805B2 (ja) | 音声符号化方法及びシステム並びに音声復号化方法及びシステム | |
EP1356457A1 (en) | Parametric coding of an audio or speech signal | |
JP3715417B2 (ja) | 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2005156740A (ja) | 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040415 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041217 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070507 |