JP2004518163A - オーディオ又は音声信号のパラメトリック符号化 - Google Patents

オーディオ又は音声信号のパラメトリック符号化 Download PDF

Info

Publication number
JP2004518163A
JP2004518163A JP2002556880A JP2002556880A JP2004518163A JP 2004518163 A JP2004518163 A JP 2004518163A JP 2002556880 A JP2002556880 A JP 2002556880A JP 2002556880 A JP2002556880 A JP 2002556880A JP 2004518163 A JP2004518163 A JP 2004518163A
Authority
JP
Japan
Prior art keywords
outside
segment
sinusoidal
component
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002556880A
Other languages
English (en)
Inventor
ブリンケル,アルベルテュス セー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004518163A publication Critical patent/JP2004518163A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

知られた符号化器100は、オーディオ又は音声信号sを少なくとも1つのセグメントx(n)へセグメント化するセグメント化ユニット110と、伸張(n)が、セグメントx(n)を所定の基準についてできるだけ良好に近似するように、セグメントx(n)から所定の伸張(n)の周波数と振幅データの形式のシヌソイダル符号データを計算する計算ユニット120を有する。本発明の目的は、前記シヌソイダル符号データの計算が単純な且つ安価な方法で実行できるように、知られた符号化器を改善することである。この方法は、次の伸張に従って、セグメントx(n)について、シヌソイダル符号データを計算することにより本発明に従って解決される。

Description

【0001】
本発明は、それぞれ、請求項1及び6の前文に従って、オーディオ又は音声信号をシヌソイダル符号データに符号化するパラメトリック符号化器及び方法に関連する。
【0002】
本発明は、更に、それぞれ、請求項11及び12の前文に従って、前記シヌソイダル符号データから、前記オーディオ又は音声信号の近似を再構成する、パラメトリック復号器及び方法に関連する。
【0003】
オーディオと音声信号は、チャネルを介して伝送される又は蓄積媒体に蓄積される前に、前記信号のデータを圧縮するために、符号化されるのが好ましい。オーディオ又は音声信号は、実質的には、シヌソイダル符号データにより表され、そして、これゆえに、これらの信号の符号化に特化された、特定の符号化器が従来技術で知られている。そのようなパラメトリック符号化器は、例えば、E.B.George及びM.J.T.Smithの”最少2乗シヌソイダル表現に基づく新い音声符号化モデル”から知られている。1987年音響スピーチ信号処理国際会議(ICASSP87)の論文誌、ページ1641−1644、ダラス TX、1987年4月6−9、IEEE、ピカウェイ、ニュージャージー。そこに記述されているパラメトリック符号化器が、図5に示されている。図5に従って、パラメトリック符号化器500は、受信されたオーディオ又は音声信号sを少なくとも1つの有限のセグメントx(n)へセグメント化するセグメント化ユニット510を含む。
【0004】
前記セグメントx(n)は、計算ユニット520へ入力される。前記計算ユニット520は、セグメントx(n)から、伸張
【0005】
【外94】
Figure 2004518163
がセグメントx(n)を、例えば、最小の重み付けされた2乗誤差のような、所定の基準についてできるだけ良好に近似するように、所定の伸張
【0006】
【外95】
Figure 2004518163
の位相と振幅データの形式のシヌソイダル符号データを計算する。引用されたパラメトリック符号化器につては、伸張は、
【0007】
【数20】
Figure 2004518163
によりあたえられ、
【0008】
【外96】
Figure 2004518163
は、振幅パラメータAと位相パラメータ
【0009】
【外97】
Figure 2004518163
の多項式係数である。
【0010】
計算ユニット520は、前記セグメントx(n)の周波数スペクトラム内の周波数を選ぶことにより、例えば、k=1(従って、
【0011】
【外98】
Figure 2004518163
)について、受信されたセグメントx(n)から位相係数
【0012】
【外99】
Figure 2004518163
を計算する、周波数推定ユニット522を有する。これらの位相係数
【0013】
【外100】
Figure 2004518163
は、前記シヌソイダル符号データの位相部分を示し、一方では、マルチプレクサ530への出力され、そして、他方ではパターン発生ユニット524への入力される。前記パターン発生ユニットは、式(3)に従って、位相パラメータ
【0014】
【外101】
Figure 2004518163
を計算するように働く。
【0015】
パターン発生ユニット524は、更に、
【0016】
【数21】
Figure 2004518163
に従って、伸張
【0017】
【外102】
Figure 2004518163
の複数のJxLの成分pijを発生する。
【0018】
複数のJxLの成分pijは、セグメント化ユニット510から出力される受信されたセグメントx(n)からだけでなく、前記受信された成分から、最適な振幅データ
【0019】
【外103】
Figure 2004518163
を決定する、振幅推定ユニット526へ入力される。
【0020】
位相係数
【0021】
【外104】
Figure 2004518163
と振幅係数
【0022】
【外105】
Figure 2004518163
は、セグメントx(n)の近似として、伸張
【0023】
【外106】
Figure 2004518163
を表すシヌソイダル符号データを構成する。これらのシヌソイダル符号データは、記録媒体に格納される又は、チャネルを介して伝送される、データストリームを構成するために、マルチプレクサ530で多重される。
【0024】
式(1)で記載されそして、記載されたパラメトリック符号化器500から知られる伸張
【0025】
【外107】
Figure 2004518163
は、オーディオ又は音声信号の個々のセグメントx(n)の適切な近似を提供する。しかしながら、シヌソイダル符号データの計算は、むしろ複雑である。
【0026】
従来技術から出発すると、本発明の目的は、前記シヌソイダル符号データの計算が単純な且つ安価な方法で実行できるように、オーディオ又は音声信号をシヌソイダル符号データへ符号化する知られたパラメトリック符号化器及び方法を改善することであり、そして、伝送又は回復後に、前記シヌソイダル符号データから前記オーディオ又は音声信号の近似を再構成する、知られたパラメトリック復号器と方法を改善することである。
【0027】
この目的は、請求項1の主題により解決される。特に、この目的は、計算ユニットに、次の伸張
【0028】
【外108】
Figure 2004518163
【0029】
【数22】
Figure 2004518163
について、シヌソイダル符号データ
【0030】
【外109】
Figure 2004518163
を計算するように、適用することにより解決され、
iは、
【0031】
【外110】
Figure 2004518163
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0032】
【外111】
Figure 2004518163
は、前記シヌソイダル符号データの1つとしての位相係数値を表し、
は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0033】
【外112】
Figure 2004518163
は、位相であり、
【0034】
【外113】
Figure 2004518163
は、前記シヌソイダル符号データの振幅部分を表す成分の線形に関係する振幅値を表す。
【0035】
優位に、請求された伸張
【0036】
【外114】
Figure 2004518163
が、正確に特定のセグメントx(n)を記述するように、シヌソイダルデータを定義しようとするときに発生する最適化問題は、簡単に解決される。簡単な計算は、位相係数
【0037】
【外115】
Figure 2004518163
を除いて、振幅データ
【0038】
【外116】
Figure 2004518163
は請求された伸張
【0039】
【外117】
Figure 2004518163
内に線形に含まれるという事実の結果である。
【0040】
【外118】
Figure 2004518163
内に、ゼロ次の位相係数はなく、一方そのような成分は、
【0041】
【外119】
Figure 2004518163
の形式の
【0042】
【外120】
Figure 2004518163
に存在する、ことに注意する。
【0043】
さらに、優位に、請求された伸張
【0044】
【外121】
Figure 2004518163
は、請求された伸張
【0045】
【外122】
Figure 2004518163
が従来技術で知られた伸張よりも広く且つ個々のセグメントx(n)の更に正確な近似を提供するという、結果を有するシヌソイダル符号データを定義する更なる自由度を提供する。
【0046】
本発明の第1の実施例に従って、線形に独立な関数f(n)は、f(n)=nに設定される。このように、請求された伸張
【0047】
【外123】
Figure 2004518163
は、多項式伸張に制限される。
【0048】
請求されたパラメトリック符号化器の及び、特に請求された計算ユニットの更に優位な実施例は、従属する符号化器クレームの主題である。
【0049】
上述の目的は、さらに、請求項6に記載のオーディオ又は音声信号を符号化する方法により、解決される。前記方法の利点と実施例は、パラメトリック符号化器について上述した、利点と実施例に対応する。
【0050】
上述の目的は、さらに、請求項11に従って、伝送され又は再生された符号データから、オーディオ又は音声信号の近似
【0051】
【外124】
Figure 2004518163
を再構成するパラメトリック復号器により、解決される。特に、この目的は、以下の式
【0052】
【数23】
Figure 2004518163
に従って、シヌソイダル符号データ
【0053】
【外125】
Figure 2004518163
から、前記セグメント
【0054】
【外126】
Figure 2004518163
を再構成するように、知られた合成器に適用することにより解決され、
iは、伸張
【0055】
【外127】
Figure 2004518163
の成分を表し、
j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0056】
【外128】
Figure 2004518163
は、前記シヌソイダルデータの1つとしての位相係数を表し、
【0057】
【外129】
Figure 2004518163
は、位相であり、
【0058】
【外130】
Figure 2004518163
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す。
【0059】
優位に、請求された伸張
【0060】
【外131】
Figure 2004518163
の計算は、従来技術で知られた伸張の計算よりも簡単である。これは、前記伸張内に振幅データ
【0061】
【外132】
Figure 2004518163
の線形な関係と、ゼロ次の位相係数の省略による。
【0062】
伸張
【0063】
【外133】
Figure 2004518163
の簡単な計算により、近似
【0064】
【外134】
Figure 2004518163
の形式の元のオーディオ又は音声信号sの再構成は、安く且つ速く実現できる。
【0065】
前述の目的は、更に、請求項12に記載の復号方法により解決される。前記方法の利点は、パラメトリック復号器を参照して前述した利点に対応する。
【0066】
5つの図が、添付されている。
【0067】
本発明の好ましい実施例を説明する前に、本発明の主題に関する幾つかの基本的な説明がなされる。
【0068】
本発明は、オーディオ又は音声信号sのセグメントx(n)を近似するために、伸張
【0069】
【外135】
Figure 2004518163
を提案する。前記伸張
【0070】
【外136】
Figure 2004518163
は、位相と振幅データで表現され、以後、シヌソイダル符号データと呼ぶ。シヌソイダル符号データは、伸張
【0071】
【外137】
Figure 2004518163
が、例えば、重み付けされた2乗誤差の最小化ような、所定の基準について、可能な限り良好に、セグメントx(n)を近似するように、定義される。言いかえれば、シヌソイダル符号データは、最適化問題を解決することにより定義されねばならない。シヌソイダル符号データが、特定のセグメントx(n)を最適に近似するように定義された後に、前記セグメントx(n)を表す、そして、前記オーディオ又は音声信号sも表す、符号データとして、蓄積媒体に蓄積され又はチャネルを介して伝送されうる。蓄積され又は伝送される前に、シヌソイダル符号データは、関連しない又は冗長なデータがそこから除去されるように、符号化され及び/又はきれいにされることが好ましい。
【0072】
本発明の第1の実施例に従って、前記シヌソイダル符号データの発生を、図1を参照して、説明する。
【0073】
図1は、入力オーディオ又は音声信号sを表す前記シヌソイダル符号データを発生するパラメトリック符号化器100の第1の実施例を示す。受信された信号sは、前記信号sを少なくとも1つのセグメントx(n)のにセグメント化するセグメント化ユニット110に入力される。
【0074】
【数24】
Figure 2004518163
ここで、i,j,kは、パラメータを表し、
nは、離散時間パラメータを表し、
【0075】
【外138】
Figure 2004518163
は、前記シヌソイダルデータの1つとしての位相係数を表し、
は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
【0076】
【外139】
Figure 2004518163
は、位相であり、
【0077】
【外140】
Figure 2004518163
は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、を有する、伸張
【0078】
【外141】
Figure 2004518163
が、前記計算ユニット120に入力されたセグメントx(n)を、例えば、重み付けされた2乗誤差の最小化のような、所定の基準について、できるだけ良好に、近似するように、前記セグメントx(n)は、前記シヌソイダル符号データを発生する計算ユニット120へ入力される。前記計算ユニット120により決定されるシヌソイダル符号データは、位相
【0079】
【外142】
Figure 2004518163
と振幅データ
【0080】
【外143】
Figure 2004518163
である。
【0081】
【数25】
Figure 2004518163
を有する式(4)の項Cは、以後、i=1−Lを有する伸張
【0082】
【外144】
Figure 2004518163
の第i成分と呼ぶ。
【0083】
計算ユニット120は、個々に受信されたセグメントx(n)を表す式(5)に従って、伸張
【0084】
【外145】
Figure 2004518163
のi=1−Lを有する全成分Cについてのk=1−Kを有する複数のLxKの位相係数
【0085】
【外146】
Figure 2004518163
を決定する、周波数推定ユニット122を含む。前記複数のLxKの周波数
【0086】
【外147】
Figure 2004518163
は、式(5)に従って、i=1−Lを有する複数のLの周波数パラメータ
【0087】
【外148】
Figure 2004518163
を計算するパターン発生ユニット124へ入力される。前記パターン発生ユニット124は、更に、
i=1−L且つj=0−(J−1)について、
【0088】
【数26】
Figure 2004518163
に従って、i=1−Lを有する成分Cについて、複数のJxLペアのパターン
【0089】
【外149】
Figure 2004518163
を発生するように、適用される。
【0090】
前記複数のペアのパターン
【0091】
【外150】
Figure 2004518163
は、−セグメントx(n)と共に−、伸張
【0092】
【外151】
Figure 2004518163
の全ての成分Cの、全ての受信されたパターン
【0093】
【外152】
Figure 2004518163
についての複数のJxLの振幅データ
【0094】
【外153】
Figure 2004518163
と、全ての受信されたパターン
【0095】
【外154】
Figure 2004518163
についての複数のJxLの振幅データ
【0096】
【外155】
Figure 2004518163
とを決定する、振幅推定ユニット126に入力される。
【0097】
計算ユニット120と特に周波数推定ユニット122及び振幅推定ユニット126は、位相データ
【0098】
【外156】
Figure 2004518163
と、振幅データ
【0099】
【外157】
Figure 2004518163
を有するシヌソイダルデータが、基準”セグメントx(n)と伸張
【0100】
【外158】
Figure 2004518163
の間の重み付けられた2乗誤差Eの最小化”が(ほぼ)満足されるように、決定され且つ最適化されるように、適用される。
【0101】
パラメトリック符号化器100は、更に、前記周波数推定ユニット122により出力される複数のLxKの位相係数
【0102】
【外159】
Figure 2004518163
及び、前記振幅推定ユニット126から出力される複数のJxLの振幅データ
【0103】
【外160】
Figure 2004518163
を、蓄積媒体に蓄積される又はチャネルを介して伝送されるデータストリームへ変換する、マルチプレクサ130を有する。
【0104】
図2は、第2の実施例のパラメトリック符号化器100’を示す。パラメトリック符号化器100のように、パラメトリック符号化器100’も、入力オーディオ又は音声信号sから前記シヌソイダル符号データ発生するように動作する。そのセグメント化ユニット110’の動作は、セグメント化ユニット110の動作に対応する。従って、セグメント化ユニット110’は、その出力に、受信された信号sのセグメントx(n)を発生する。前記セグメントx(n)は、計算ユニット120’へ入力される。計算ユニット120の第1の実施例と異なり、計算ユニット120’は、セグメント
【0105】
【外161】
Figure 2004518163
の全ての成分について、同時に複数のシヌソイダル符号データを計算しないが、しかし、伸張
【0106】
【外162】
Figure 2004518163
のi=1−Lの各成分Cについて、順次に、このシヌソイダル符号データを発生する。この計算の方法は、一般的には、従来技術では、合成による分析又は、整合追跡アルゴリズムとして知られている。しかしながら、従来技術では、前記方法の応用は、式(4)に従った請求された伸張
【0107】
【外163】
Figure 2004518163
から異なる伸張に対してのみ知られている。
【0108】
以下に、計算ユニット120’の前記第2の実施例の動作を、図2と3を参照して説明する。特に、式(4)に従った伸張
【0109】
【外164】
Figure 2004518163
のシヌソイダル符号データの計算が、セグメント化ユニット110’により出力されるセグメントとその伸張
【0110】
【外165】
Figure 2004518163
の間の重み付けされた2乗誤差が、式(4)に従って、(ほぼ)最小化されるように、記述される。
【0111】
第1のサイクルで、i=1、伸張
【0112】
【外166】
Figure 2004518163
のi=1を有する第1成分Cのシヌソイダル符号データが計算される(図3の方法ステップa))
これを達成するために、セグメント化ユニット110’の出力x(n)は、εi−1=x(n)に設定される(方法ステップb)参照)。
【0113】
前記第1サイクルで、セグメント化ユニット110’の前記出力は、入力値εi−1からk=1−Kを有する複数のKの位相係数
【0114】
【外167】
Figure 2004518163
を決定する周波数推定ユニット122’へ入力される(方法ステップc)参照)。前記位相係数
【0115】
【外168】
Figure 2004518163
は、検索されたシヌソイダル符号データの位相を表しそして、計算入力ニットから出力される。更に、前記位相係数
【0116】
【外169】
Figure 2004518163
は、式(5)に従って、第1成分C1についてi=1を有する位相
【0117】
【外170】
Figure 2004518163
を計算するためにパターン発生ユニット124’へ入力される(方法ステップd)参照)。前記パターン発生ユニット124’は、更に、i=1について、
【0118】
【数27】
Figure 2004518163
の、成分Cについて、j=0−(J−1)を有する複数の2xJのパターンを発生するために動作する(方法ステップe)参照)。これらの発生されたパターン
【0119】
【外171】
Figure 2004518163
は、−パラメータεi−1と共に−振幅推定ユニット126’へ入力される。前記振幅推定ユニット126’は、受信された入力データからi=1の成分Ciについて、前記パターン
【0120】
【外172】
Figure 2004518163
についての複数のJの振幅
【0121】
【外173】
Figure 2004518163
と、前記パターン
【0122】
【外174】
Figure 2004518163
についてのJの振幅
【0123】
【外175】
Figure 2004518163
とを決定するように動作する(方法ステップf)参照)。前記計算された振幅
【0124】
【外176】
Figure 2004518163
は、セグメントx(n)の伸張
【0125】
【外177】
Figure 2004518163
を表すシヌソイダルデータの振幅部分を構成し、そして、前記位相データ
【0126】
【外178】
Figure 2004518163
と共にi=1を有する前記第1成分Cを表すデータストリームへマージされるために、計算ユニット120’から出力される。更に、前記振幅データ
【0127】
【外179】
Figure 2004518163
は、それぞれのパターン
【0128】
【外180】
Figure 2004518163
と共に、
【0129】
【数28】
Figure 2004518163
に従って、i=1を有する成分Cを計算するために、合成器128’へ入力される(方法ステップg)参照)。
【0130】
前記成分Cは、前記周波数推定ユニット122’へ入力される値εi−1から、減算するために、減算ユニット129’に入力される。前記減算ユニット129’の出力で発生する差は、i=1を有するεと呼ばれる(方法ステップh)参照)。
【0131】
ここで、伸張
【0132】
【外181】
Figure 2004518163
についての、第1の成分C1とそのシヌソイダル符号データ
【0133】
【外182】
Figure 2004518163
を計算する第1のサイクルが終了する。続いて、パラメータiが、セグメント
【0134】
【外183】
Figure 2004518163
の成分Cの合計数Lと比較される(方法ステップi)参照)。
【0135】
【外184】
Figure 2004518163
の場合には、i=i+1について、方法ステップc)からi)が繰返される。これらの場合には、
【0136】
【外185】
Figure 2004518163
に対するセグメント化ユニット110’からの出力は、周波数推定ユニット122’の入力から切断され、代わりに、周波数推定ユニット122’の入力は差εを受信するために前記減算ユニット129’の出力に接続される。しかしながら、
【0137】
【外186】
Figure 2004518163
の場合には、伸張
【0138】
【外187】
Figure 2004518163
の全てのLの成分のシヌソイダル符号データは計算され、そして、計算ユニット120’により実行される計算処理は、特定のセグメント
【0139】
【外188】
Figure 2004518163
について、完了する。続いて、全体の手順が、入力するオーディオ又は音声信号の後続のセグメントについて繰返される。
【0140】
図4は、受信された入力データから、オーディオ又は音声信号sの近似
【0141】
【外189】
Figure 2004518163
を再構成するパラメトリック復号器400を示す。これらの受信された入力データは、伝送された又は蓄積媒体から再生された後のデータストリームのデータに対応する。
【0142】
パラメトリック復号器400は、前記受信された入力データから、オーディオ及び/又は音声信号sの近似
【0143】
【外190】
Figure 2004518163
のセグメント
【0144】
【外191】
Figure 2004518163
を示すシヌソイダル符号データ
【0145】
【外192】
Figure 2004518163
を選択する選択ユニット420を有する。パラメトリック復号器400は、更に、前記受信されたシヌソイダル符号データから、前記セグメント
【0146】
【外193】
Figure 2004518163
を再構成する合成器440と、再構成されたセグメント
【0147】
【外194】
Figure 2004518163
を連結することにより近似
【0148】
【外195】
Figure 2004518163
を再構成する結合ユニット460を有する。
【0149】
上述の実施例は本発明を限定するものではなく説明するものであり、そして、当業者は請求項の範囲から離れることなく多くの代わりの実施例を設計できることに、注意すべきである。請求の範囲では、括弧内に記載の符号は請求項を限定するように解釈するものではない。用語”有する”は、請求項に列挙された以外の他の構成要素又はステップの存在を除外しない。本発明は、幾つかの特徴的な構成要素を有するハードウェアにより、そして、適するようにプログラムされたコンピュータにより実行できる。幾つかの手段を列挙する装置の請求項では、これらの手段の幾つかは、1つの同じハードウェアで実現されうる。幾つかの相互に異なる従属請求項で、特定の手段が引用されていることは、これらの手段の組合せが、優位に使用できないことを示すものではない。
【図面の簡単な説明】
【図1】
本発明に従ったパラメトリック符号化器の第1の実施例を示す図である。
【図2】
本発明に従ったパラメトリック符号化器の第2の実施例を示す図である。
【図3】
本発明に従ったパラメトリック符号化器の第2の実施例の動作を示すフローチャートである。
【図4】
本発明の実施例に従ったパラメトリック復号器を示す図である。
【図5】
従来技術のパラメトリック符号化器示す図である。

Claims (14)

  1. オーディオ又は音声信号sをシヌソイダル符号データへ符号化するパラメトリック符号化器であって、
    − 前記信号sを少なくとも1つのセグメントx(n)へセグメント化するセグメント化ユニットと、
    − 伸張
    【外1】
    Figure 2004518163
    が、所定の基準について、できるだけ良好にセグメントx(n)を近似するように、セグメントx(n)から所定の伸張
    【外2】
    Figure 2004518163
    の位相と振幅データの形式で、前記シヌソイダル符号データを計算する計算ユニットとを有し、
    前記計算ユニットは、次の伸張
    【外3】
    Figure 2004518163
    Figure 2004518163
    について、シヌソイダル符号データ
    【外4】
    Figure 2004518163
    を計算するように、適用されることを特徴とし、
    i,j,kは、パラメータを表し、
    nは、離散時間パラメータを表し、
    Ciは、伸張
    【外5】
    Figure 2004518163
    の第i成分を表し、
    【外6】
    Figure 2004518163
    は、前記シヌソイダルデータの1つとしての位相係数を表し、
    は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
    【外7】
    Figure 2004518163
    は、位相であり、
    【外8】
    Figure 2004518163
    は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック符号化器。
  2. Figure 2004518163
    であることを特徴とする、請求項1に記載のパラメトリック符号化器。
  3. 計算ユニットは、
    − 受信されたセグメントx(n)を表す伸張
    【外9】
    Figure 2004518163
    の全成分Ciについてi=1−L及びk=1−Kの、複数のLxKの位相係数
    【外10】
    Figure 2004518163
    を決定する周波数推定ユニットを有し、
    − i=1−Lの複数のLの位相
    【外11】
    Figure 2004518163
    を、位相係数
    【外12】
    Figure 2004518163
    から、
    Figure 2004518163
    に従って計算し且つ、
    Figure 2004518163
    に従って、i=1−Lの成分Ciについて、複数のJxLペアのパターン
    【外13】
    Figure 2004518163
    を発生する、パターン発生ユニットを有し、
    − i=1−L且つj=0−(J−1)であり、
    − 伸張
    【外14】
    Figure 2004518163
    の全ての成分Ciの、
    パターン
    【外15】
    Figure 2004518163
    についての複数のJxLの振幅
    【外16】
    Figure 2004518163
    と、パターン
    【外17】
    Figure 2004518163
    についての複数のJxLの振幅
    【外18】
    Figure 2004518163
    とを決定する、振幅推定ユニットを有し、
    − シヌソイダルデータ
    【外19】
    Figure 2004518163
    は、セグメントxとその伸張
    【外20】
    Figure 2004518163
    の間の重み付けされた2乗誤差Eが最小化される基準について少なくともほぼ最適化される、ことを特徴とする請求項1に記載のパラメトリック符号化器。
  4. 前記シヌソイダル符号データをデータストリームへマージするマルチプレクサを特徴とする、請求項1に記載のパラメトリック符号化器。
  5. 計算ユニットは、
    − 入力値εi−1から成分Ciについてk=1−Kの複数のKの位相係数
    【外21】
    Figure 2004518163
    を決定する、周波数推定ユニットを有し、i=1の第1の成分C1について、入力値はε=x(n)に設定され、
    Figure 2004518163
    に従って、前記複数の位相係数
    【外22】
    Figure 2004518163
    から、成分Ciについての位相
    【外23】
    Figure 2004518163
    を計算し、且つ、
    成分Ciに対するj=1−Jの、複数の2xJのパターン
    【外24】
    Figure 2004518163
    Figure 2004518163
    を発生する、パターン発生ユニットを有し、
    −受信されたセグメントx(n)からと受信された複数のパターン
    【外25】
    Figure 2004518163
    から、成分Ciの前記パターンについて、複数のJの振幅
    【外26】
    Figure 2004518163
    と、複数のJの振幅
    【外27】
    Figure 2004518163
    とを決定する、振幅推定ユニットを有し、
    −前記複数の2xJパターン
    【外28】
    Figure 2004518163
    から成分Ciを再構成し且つ、
    Figure 2004518163
    に従って、複数の振幅
    【外29】
    Figure 2004518163
    を形成する合成器を有し、
    −成分Ci+1を表すシヌソイダル符号データを計算するために、結果の差εを、新たな入力値として、周波数推定ユニットの入力へ転送してフィードするために、入力値εi−1から前記成分Ciを減算する減算ユニットを有し、
    シヌソイダルデータ
    【外30】
    Figure 2004518163
    は、セグメントxと伸張
    【外31】
    Figure 2004518163
    の間の重み付けされた2乗誤差Eが最小化される基準について最適化される、ことを特徴とする、請求項1に記載のパラメトリック符号化器。
  6. オーディオ又は音声信号sをシヌソイダル符号データへ符号化するパラメトリック符号化方法であって、
    − 前記信号sを少なくとも1つのセグメントx(n)へセグメント化するステップと、
    − 伸張
    【外32】
    Figure 2004518163
    が、所定の基準について、できるだけ良好にセグメントx(n)を近似するように、セグメントx(n)から所定の伸張
    【外33】
    Figure 2004518163
    の位相と振幅データの形式で、前記シヌソイダル符号データを計算するステップを有し、
    − 伸張
    【外34】
    Figure 2004518163
    は、
    Figure 2004518163
    で定義されることを特徴とし、
    iは、伸張
    【外35】
    Figure 2004518163
    の成分Ciを表し、
    j,kは、パラメータを表し、
    nは、離散時間パラメータを表し、
    は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
    【外36】
    Figure 2004518163
    は、前記シヌソイダルデータの1つとしての位相係数を表し、
    【外37】
    Figure 2004518163
    は、位相であり、
    【外38】
    Figure 2004518163
    は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック符号化方法。
  7. Figure 2004518163
    であることを特徴とする、請求項6に記載の方法。
  8. 周波数
    【外39】
    Figure 2004518163
    は、伸張
    【外40】
    Figure 2004518163
    の周波数領域内で、ピーク周波数を選ぶことにより定義されることを特徴とする、請求項6に記載の方法。
  9. セグメントxと伸張
    【外41】
    Figure 2004518163
    の間の重み付けされた2乗誤差が最小化される基準を満足するために、最適な振幅
    【外42】
    Figure 2004518163
    の定義は、
    − 受信されたセグメントx(n)の全ての成分Ciについて、i=1−L及びk=1−Kの、複数のLxKの位相係数
    【外43】
    Figure 2004518163
    を決定するステップと、

    Figure 2004518163
    に従って、位相係数
    【外44】
    Figure 2004518163
    から、i=1−Lの、複数のLの位相
    【外45】
    Figure 2004518163
    を計算するステップと、

    Figure 2004518163
    に従って、i=1−Lの成分Ciについて、複数のJxLのペアのパターン
    【外46】
    Figure 2004518163
    を発生し、
    − 伸張
    【外47】
    Figure 2004518163
    の全ての成分Ciの全てのパターンのペア
    【外48】
    Figure 2004518163
    について、複数のJxLの振幅
    【外49】
    Figure 2004518163
    と、複数のJxLの振幅
    【外50】
    Figure 2004518163
    を決定するステップとを有する、ことを特徴とする請求項6に記載の方法。
  10. セグメントxと伸張
    【外51】
    Figure 2004518163
    の間の重み付けされた2乗誤差が最小化される基準を満足するために、振幅
    【外52】
    Figure 2004518163
    の定義は、
    a)i=1に設定するステップと、
    b)εi−1=ε=x(n)のステップと、
    c)入力値εi−1から成分Ciについてk=1−Kの複数のKの位相係数
    【外53】
    Figure 2004518163
    を決定するステップと、
    d)
    Figure 2004518163
    に従って、前記複数の位相係数
    【外54】
    Figure 2004518163
    から成分Ciについて位相
    【外55】
    Figure 2004518163
    を計算するステップと、
    e)成分Ciについてj=0−(J−1)の複数の2xJのパターン
    【外56】
    Figure 2004518163

    Figure 2004518163
    で発生するステップと、
    f)受信されたセグメントx(n)からと受信された複数のパターン
    【外57】
    Figure 2004518163
    からの成分Ciについての前記パターンについて、複数のJの振幅
    【外58】
    Figure 2004518163
    と複数のJの振幅
    【外59】
    Figure 2004518163
    を決定するステップと、
    g)パターンpijの前記複数のJのペアからと、複数の振幅
    【外60】
    Figure 2004518163
    から、
    Figure 2004518163
    に従って、成分Ciを再構成するステップと、
    h)結果の差εを計算するために、入力値εi−1から前記成分Ciを減算するステップと、
    i)Lは成分の所定の数を表し、
    Figure 2004518163
    かどうかを検査するステップと、
    j)i<Lの場合には、i=i+1でステップc>から再び開始することにより、この方法のステップを繰返すステップと、
    k)
    Figure 2004518163
    の場合には、伸張
    【外61】
    Figure 2004518163
    の全てのLの成分のシヌソイダル符号データは計算され且つ処理が終了するステップとを有する、ことを特徴とする請求項6に記載の方法。
  11. 伝送された又は再生された符号データからオーディオ又は音声信号sの近似
    【外62】
    Figure 2004518163
    を再構成するパラメトリック復号器であって、
    − 前記受信された伝送された又は再生された符号データから近似
    【外63】
    Figure 2004518163
    のセグメント
    【外64】
    Figure 2004518163
    を表すシヌソイダル符号データを選択する選択ユニットを有し、
    −前記受信されたシヌソイダル符号データから、前記セグメント
    【外65】
    Figure 2004518163
    を再構成する合成器を有し、
    − 前記オーディオ又は音声信号sの前記近似
    【外66】
    Figure 2004518163
    を形成するために、連続するセグメント
    【外67】
    Figure 2004518163
    を結合する結合ユニットを有し、シヌソイダル符号データは、前記セグメント
    【外68】
    Figure 2004518163
    の少なくとも1つの成分についての複数の周波数と振幅値であり、
    − 前記合成器は、以下の公式に従って、前記シヌソイダル符号データから前記セグメント
    【外69】
    Figure 2004518163
    を再構成するように適用されることを特徴とし、
    Figure 2004518163
    iは、伸張
    【外70】
    Figure 2004518163
    の成分Ciを表し、
    j,kは、パラメータを表し、
    nは、離散時間パラメータを表し、
    は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
    【外71】
    Figure 2004518163
    は、前記シヌソイダルデータの1つとしての位相係数値を表し、
    【外72】
    Figure 2004518163
    は、位相であり、
    【外73】
    Figure 2004518163
    は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、パラメトリック復号器。
  12. 伝送された又は再生された符号データからオーディオ又は音声信号sの近似
    【外74】
    Figure 2004518163
    を再構成する復号方法であって、前記受信された伝送された又は再生された符号データから近似
    【外75】
    Figure 2004518163
    のセグメント
    【外76】
    Figure 2004518163
    を表すシヌソイダル符号データを選択する選択するステップを有し、
    −前記受信されたシヌソイダル符号データから、前記セグメント
    【外77】
    Figure 2004518163
    を再構成するステップを有し、
    − 前記オーディオ又は音声信号sの前記近似
    【外78】
    Figure 2004518163
    を形成するために、連続するセグメント
    【外79】
    Figure 2004518163
    を共に結合ステップを有し、
    − シヌソイダル符号データは、前記セグメント
    【外80】
    Figure 2004518163
    の少なくとも1つの成分についての複数の位相と振幅値であり、
    − 前記再構成するステップでは、以下の公式に従って、前記セグメント
    【外81】
    Figure 2004518163
    は前記シヌソイダル符号データから、再構成されることを特徴とし、
    Figure 2004518163
    iは、伸張
    【外82】
    Figure 2004518163
    の成分Ciを表し、
    j,kは、パラメータを表し、
    nは、離散時間パラメータを表し、
    は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
    【外83】
    Figure 2004518163
    は、前記シヌソイダルデータの1つとしての位相係数を表し、
    【外84】
    Figure 2004518163
    は、位相であり、
    【外85】
    Figure 2004518163
    は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、復号方法。
  13. オーディオ又は音声信号の近似
    【外86】
    Figure 2004518163
    のセグメント
    【外87】
    Figure 2004518163
    を表すシヌソイダル符号データを含むデータストリームであって、そのシヌソイダル符号データは、前記セグメント
    【外88】
    Figure 2004518163
    の少なくとも1つの成分についての複数の位相と振幅値であり、そのセグメント
    【外89】
    Figure 2004518163
    は、
    Figure 2004518163
    で定義されることを特徴とし、
    iは、伸張
    【外90】
    Figure 2004518163
    の成分Ciを表し、
    j,kは、パラメータを表し、
    nは、離散時間パラメータを表し、
    は、Jの線形に独立な関数の組からの第j番目のインスタンスを表し、
    【外91】
    Figure 2004518163
    は、前記シヌソイダルデータの1つとしての位相係数を表し、
    【外92】
    Figure 2004518163
    は、位相であり、
    【外93】
    Figure 2004518163
    は、前記シヌソイダルデータの部分を表す成分の線形に関係する振幅値を表す、データストリーム。
  14. 請求項13に記載のデータストリームが格納された蓄積媒体。
JP2002556880A 2001-01-16 2001-12-20 オーディオ又は音声信号のパラメトリック符号化 Withdrawn JP2004518163A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01200142 2001-01-16
EP01202612 2001-07-06
PCT/IB2001/002696 WO2002056299A1 (en) 2001-01-16 2001-12-20 Parametric coding of an audio or speech signal

Publications (1)

Publication Number Publication Date
JP2004518163A true JP2004518163A (ja) 2004-06-17

Family

ID=26076810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002556880A Withdrawn JP2004518163A (ja) 2001-01-16 2001-12-20 オーディオ又は音声信号のパラメトリック符号化

Country Status (6)

Country Link
US (1) US7050970B2 (ja)
JP (1) JP2004518163A (ja)
KR (1) KR100849375B1 (ja)
CN (1) CN1293534C (ja)
BR (1) BR0109237A (ja)
WO (1) WO2002056299A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1826634B (zh) * 2003-07-18 2010-12-01 皇家飞利浦电子股份有限公司 低比特率音频编码
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101435411B1 (ko) * 2007-09-28 2014-08-28 삼성전자주식회사 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치
KR102048076B1 (ko) 2011-09-28 2019-11-22 엘지전자 주식회사 음성 신호 부호화 방법 및 음성 신호 복호화 방법 그리고 이를 이용하는 장치
CN106851482A (zh) * 2017-03-24 2017-06-13 北京时代拓灵科技有限公司 一种全景声扬声器体感实时交互系统及交互方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
WO2000079519A1 (en) * 1999-06-18 2000-12-28 Koninklijke Philips Electronics N.V. Audio transmission system having an improved encoder

Also Published As

Publication number Publication date
US20020156621A1 (en) 2002-10-24
BR0109237A (pt) 2002-12-03
US7050970B2 (en) 2006-05-23
CN1293534C (zh) 2007-01-03
KR100849375B1 (ko) 2008-07-31
WO2002056299A1 (en) 2002-07-18
CN1429384A (zh) 2003-07-09
KR20020084206A (ko) 2002-11-04

Similar Documents

Publication Publication Date Title
JP5203923B2 (ja) 残留信号を修正することによって、ボコーダ内部のフレームを時間伸縮すること
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
RU2504026C2 (ru) Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера
US20060093048A9 (en) Partial Spectral Loss Concealment In Transform Codecs
JP2005506582A (ja) オーディオコーダにおける正弦波パラメータのトラッキング
RU2328775C2 (ru) Улучшенное маскирование ошибки в области частот
KR20160002920A (ko) 노이즈 주입이 가중된 프레임 손실 보정
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
JPH0990968A (ja) 音声合成方法
JP2002118517A (ja) 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
US7363216B2 (en) Method and system for parametric characterization of transient audio signals
JPH0590974A (ja) 前反響処理方法およびその装置
JP2004518163A (ja) オーディオ又は音声信号のパラメトリック符号化
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
US20020040299A1 (en) Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP4699117B2 (ja) 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
JP2007047813A (ja) ディジタル信号処理方法、そのプログラム、及びそのプログラムを格納した記録媒体
JP3731575B2 (ja) 符号化装置及び復号装置
JP2004023191A (ja) 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
JP3576805B2 (ja) 音声符号化方法及びシステム並びに音声復号化方法及びシステム
EP1356457A1 (en) Parametric coding of an audio or speech signal
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005156740A (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040415

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041217

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070507