JP2003316392A - オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置 - Google Patents

オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置

Info

Publication number
JP2003316392A
JP2003316392A JP2002119215A JP2002119215A JP2003316392A JP 2003316392 A JP2003316392 A JP 2003316392A JP 2002119215 A JP2002119215 A JP 2002119215A JP 2002119215 A JP2002119215 A JP 2002119215A JP 2003316392 A JP2003316392 A JP 2003316392A
Authority
JP
Japan
Prior art keywords
circuit
signal
information
decoding
control signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002119215A
Other languages
English (en)
Inventor
Tetsuro Wada
哲朗 和田
Atsushi Hotta
厚 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2002119215A priority Critical patent/JP2003316392A/ja
Priority to US10/418,176 priority patent/US20030200081A1/en
Publication of JP2003316392A publication Critical patent/JP2003316392A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Abstract

(57)【要約】 【課題】 従来、カスケード接続で次段へ符号化情報を
伝える際に、新たに情報伝送の為のインタフェースが必
要となるという課題があった。 【解決手段】 ストリーム分離回路11と、ブロック化
情報を出力する制御信号復号回路12と、復号及び逆量
子化回路13と、周波数時間変換回路14と、時間領域
信号とブロック化情報を多重する情報多重回路15とを
有する復号化装置10と、多重信号から時間領域信号と
ブロック化情報を分離する情報分離回路21と、時間周
波数変換回路22と、音響心理モデル回路23と、制御
信号符号化回路24と、量子化及び符号化回路25と、
ストリーム多重回路26と、ブロック化情報に基き、装
置内の処理遅延時間が一定になるように、符号化ストリ
ームの出力タイミングを制御する出力制御回路27とを
有する符号化装置20とを備えた。 【効果】 トータルでの遅延時間の揺らぎを防ぐことが
できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、オーディオ信号
を高能率に圧縮して伝送するオーディオ信号の復号化及
び符号化装置、復号化装置並びに符号化装置に関するも
のである。
【0002】
【従来の技術】オーディオ信号の伝送においては、伝送
路の効率的利用のために符号化及び復号化装置が用いら
れる。これらの装置に採用される符号化及び復号化方法
には、様々なものが提案されている。
【0003】例えば、まず時間領域のオーディオ信号を
単位時間毎にブロック化し、その信号ブロック毎に短時
間スペクトル成分に変換する。その後、この短時間スペ
クトル成分を基に音響心理モデルを用いながら、決定し
たビット割り当てによって量子化及び符号化を行う。符
号化によって生成されたビットストリームはこの逆の手
順に従って復号化され、時間領域のオーディオ信号が再
生される。
【0004】上記の音響心理モデルとは、人間の聴覚特
性を利用した信号分析のモデルであり、例えばマスキン
グ効果の程度をマスキングしきい値という指標として算
出する。このマスキング効果とは、ある音信号が存在す
る場合に、その周波数前後の小さな音信号が聞こえなく
なる現象のことである。オーディオ信号の符号化の際に
この特性を利用し、オーディオ信号を時間ブロック毎に
分析を行い、聴覚が知覚できる信号のみを符号化して伝
送する。
【0005】なお、上記符号化及び復号化装置は、その
適用の目的に応じてカスケードに接続されて使用される
場合がある。公知の符号化及び復号化装置においては、
オーディオ信号に対して符号化及び復号化が多く繰り返
される程、再生オーディオ信号の音質が劣化する。そこ
で、時間ブロック情報の他、符号化における特徴的な情
報を次段以降に伝送する方法が提案されている(特表平
9−503637、特開2001−134293)。
【0006】従来のオーディオ信号の復号化及び符号化
装置について図面を参照しながら説明する。図9は、例
えば特開2001−134293号公報に示された従来
のオーディオ信号の復号化及び符号化装置の構成を示す
図である。
【0007】図9において、71は復号化装置、72は
符号化装置、73は信号処理装置である。また、74は
ストリーム分離回路、75は制御信号復号回路、76は
復号化及び逆量子化回路、77は周波数時間変換回路、
78は音響心理モデル再構成回路である。さらに、79
は時間周波数変換回路、80は音響心理モデル変換回
路、81は制御信号符号化回路、82は量子化及び符号
化回路、83はストリーム多重回路である。
【0008】つぎに、従来のオーディオ信号の復号化及
び符号化装置の動作について図面を参照しながら説明す
る。
【0009】カスケード接続の形態は、図9に示した復
号化及び符号化装置が連続して接続された構成となる。
図9に示した復号化及び符号化装置は、復号化装置7
1、符号化装置72、及び信号処理装置73から構成さ
れる。
【0010】復号化装置71において、入力されるビッ
トストリームは、ストリーム分離回路74で制御信号と
主信号に分離され、制御信号復号回路75において制御
信号が復号される。
【0011】この制御情報を基に、復号化及び逆量子化
回路76では主信号が復号され逆量子化される。その出
力は、周波数時間変換回路77により周波数時間変換さ
れ時間領域信号を得る。また、上記制御信号は、音響心
理モデル再構成回路78に入力され、そこでは制御情報
を基に音響心理モデルを再構成する。
【0012】復号化装置71は、時間信号を信号処理装
置73に対して出力すると共に、ブロック化情報や音響
心理モデルのパラメータを符号化装置72に対して出力
する。
【0013】信号処理装置73では、復号化装置71か
ら出力された時間領域信号である再生オーディオ信号に
対して、イコライザ処理、ミキシング処理等の処理が行
われる。もちろん、一切の加工無しにそのまま符号化装
置72に出力する場合もある。これは信号処理装置73
が介在しないものとみなせる。
【0014】なお、復号化装置71と信号処理装置7
3、若しくは信号処理装置73または復号化装置71と
符号化装置72とをそれぞれ接続するインタフェースに
は、AES(Audio Engineering Society)3規格やI
EC(International Electrotechnical Commission)
60958規格に準拠したデジタルオーディオインタフ
ェースが用いられることが多い。
【0015】符号化装置72においては、まず、時間周
波数変換回路79により、入力された時間領域信号を復
号化装置71からのブロック化情報に基づき変換する。
並行して、音響心理モデル変換回路80は、復号化装置
71からの音響心理モデルのパラメータを基に、信号処
理装置73からの信号加工情報を加味して、時間領域信
号に対する音響心理モデルを構成する。
【0016】制御信号符号化回路81では、音響心理モ
デルを基に量子化及び符号化のための制御信号を生成す
る。この制御信号を用いて量子化及び符号化回路82
は、時間信号を再量子化し、符号化した後、ストリーム
多重回路83に出力する。制御信号もまた制御信号符号
化回路81によって符号化され、ストリーム多重回路8
3に出力され、ストリーム多重回路83は、これら信号
を全て多重化して出力する。
【0017】なお、符号化装置72では、時間周波数変
換回路79において、ブロック化情報に基づいて入力さ
れた時間領域信号と符号化装置72における符号化処理
を実行するタイミングを調整している。
【0018】すなわち、図10に示す通り、データブロ
ックの全てのデータが入力した後の、最初のフレームタ
イミングで符号化処理を開始している。従って、入力デ
ータのブロックが入力されるタイミングと符号化装置の
フレームタイミングに応じて、オーディオ信号が装置に
入力されてから出力されるまでの時間、すなわち遅延時
間が変化することになる。
【0019】この様な復号化及び符号化装置では、一連
の符号化の繰り返しの中で、ブロック化情報等のカスケ
ード接続された前段の符号化の特徴情報を次段へ伝え、
その情報を基に再符号化を行うため、品質劣化を抑える
ことができる。
【0020】
【発明が解決しようとする課題】上述したような従来の
オーディオ信号の復号化及び符号化装置では、カスケー
ド接続において次段へ符号化情報を伝える際に、新たに
情報伝送のためのインタフェースが必要となり、回路規
模が大きくなってしまうという問題点があった。
【0021】また、信号処理装置でどのような処理が行
われるのか内容をあらかじめ把握しておかなければなら
ず、カスケード接続における装置の組合せに制約が生じ
るという問題点があった。
【0022】さらに、装置を経由する際の遅延時間が、
装置毎あるいは装置の起動毎に変化するため、遅延時間
を一定の時間に固定化することが必要な伝送路において
は適用が難しいという問題点があった。
【0023】この発明は、前述した問題点を解決するた
めになされたもので、符号化情報伝送のための新たなイ
ンタフェースを不要とする符号化及び復号化装置を得る
ものであって、特にブロック化の情報を同期的に伝送す
ることができ、カスケードに接続された全装置を経由す
る遅延時間を一定にすることができるオーディオ信号の
復号化及び符号化装置、復号化装置並びに符号化装置を
得ることを目的とする。
【0024】
【課題を解決するための手段】この発明の請求項1に係
るオーディオ信号の復号化及び符号化装置は、符号化ス
トリームから主信号と制御信号を分離するストリーム分
離回路と、前記分離された制御信号を復号し、ブロック
化情報を出力する制御信号復号回路と、前記分離された
主信号を前記復号された制御信号に基づいて復号及び逆
量子化する復号及び逆量子化回路と、前記逆量子化され
た周波数領域の主信号を時間領域信号に変換する周波数
時間変換回路と、前記時間領域信号と前記ブロック化情
報を多重する情報多重回路とを有する復号化装置を備え
ると共に、多重信号から時間領域信号とブロック化情報
を分離する情報分離回路と、前記分離されたブロック化
情報に基づいて時間領域信号を周波数領域信号に変換す
る時間周波数変換回路と、前記時間領域信号に対して聴
覚分析を行う音響心理モデル回路と、音響心理モデルを
基に量子化及び符号化のための制御信号を生成し符号化
を行う制御信号符号化回路と、前記制御信号を用いて周
波数領域信号を量子化及び符号化する量子化及び符号化
回路と、前記符号化された制御信号と前記符号化された
周波数領域信号を多重して符号化ストリームを生成する
ストリーム多重回路と、前記ブロック化情報に基づい
て、装置内の処理遅延時間が一定になるように、前記符
号化ストリームの出力タイミングを制御する出力制御回
路とを有する符号化装置を備えたものである。
【0025】この発明の請求項2に係るオーディオ信号
の復号化及び符号化装置は、前記復号化装置が、符号化
特性情報から音響心理モデルを構成する音響心理モデル
構成回路をさらに有し、前記復号化装置の前記制御信号
復号回路は、前記符号化特性情報を出力し、前記復号化
装置の前記情報多重回路は、前記音響心理モデル構成回
路からの音響心理モデル情報も多重し、前記符号化装置
の前記情報分離回路は、前記多重信号から前記音響心理
モデル情報も分離し、前記符号化装置の前記音響心理モ
デル回路は、前記分離された音響心理モデル情報を基
に、前記時間領域信号に対して聴覚分析を行うものであ
る。
【0026】この発明の請求項3に係るオーディオ信号
の復号化装置は、符号化ストリームから主信号と制御信
号を分離するストリーム分離回路と、前記分離された制
御信号を復号し、ブロック化情報を出力する制御信号復
号回路と、前記分離された主信号を前記復号された制御
信号に基づいて復号及び逆量子化する復号及び逆量子化
回路と、前記逆量子化された周波数領域の主信号を時間
領域信号に変換する周波数時間変換回路と、前記時間領
域信号と前記ブロック化情報を多重する情報多重回路と
を備えたものである。
【0027】この発明の請求項4に係るオーディオ信号
の復号化装置は、符号化特性情報から音響心理モデルを
構成する音響心理モデル構成回路をさらに備え、前記制
御信号復号回路は、前記符号化特性情報を出力し、前記
情報多重回路は、前記音響心理モデル構成回路からの音
響心理モデル情報も多重するものである。
【0028】この発明の請求項5に係るオーディオ信号
の符号化装置は、多重信号から時間領域信号とブロック
化情報を分離する情報分離回路と、前記分離されたブロ
ック化情報に基づいて時間領域信号を周波数領域信号に
変換する時間周波数変換回路と、前記時間領域信号に対
して聴覚分析を行う音響心理モデル回路と、音響心理モ
デルを基に量子化及び符号化のための制御信号を生成し
符号化を行う制御信号符号化回路と、前記制御信号を用
いて周波数領域信号を量子化及び符号化する量子化及び
符号化回路と、前記符号化された制御信号と前記符号化
された周波数領域信号を多重して符号化ストリームを生
成するストリーム多重回路と、前記ブロック化情報に基
づいて、装置内の処理遅延時間が一定になるように、前
記符号化ストリームの出力タイミングを制御する出力制
御回路とを備えたものである。
【0029】この発明の請求項6に係るオーディオ信号
の符号化装置は、前記情報分離回路が、前記多重信号か
ら前記音響心理モデル情報も分離し、前記音響心理モデ
ル回路は、前記分離された音響心理モデル情報を基に、
前記時間領域信号に対して聴覚分析を行うものである。
【0030】
【発明の実施の形態】実施の形態1.この発明の実施の
形態1に係るオーディオ信号の復号化及び符号化装置に
ついて図面を参照しながら説明する。図1は、この発明
の実施の形態1に係るオーディオ信号の復号化装置の構
成を示すブロック図である。また、図2は、この発明の
実施の形態1に係るオーディオ信号の符号化装置の構成
を示すブロック図である。なお、各図中、同一符号は同
一又は相当部分を示す。
【0031】図1において、10は復号化装置全体、1
01は符号化ストリームを入力する入力端子、11は符
号化ストリームから主信号と制御信号を分離するストリ
ーム分離回路、12は分離された制御信号を復号し、さ
らにブロック化情報を出力する制御信号復号回路、13
は分離された主信号を復号された制御信号により復号及
び逆量子化する復号及び逆量子化回路、14は逆量子化
された周波数領域の主信号を時間領域信号に変換する周
波数時間変換回路、15は時間領域信号とブロック化情
報とを多重して出力する情報多重回路、102はその多
重信号を出力する出力端子である。
【0032】また、図2において、20は符号化装置全
体、201は多重信号を入力する入力端子、21は多重
信号から時間領域信号とブロック化情報を分離する情報
分離回路、22は分離されたブロック化情報に基づき時
間領域信号を周波数領域信号に変換する時間周波数変換
回路、23は時間領域信号に対して聴覚分析を行う音響
心理モデル回路、24は音響心理モデルを基に量子化及
び符号化のための制御信号を生成し符号化を行う制御信
号符号化回路、25は制御信号を用いて周波数領域信号
を量子化及び符号化する量子化及び符号化回路、26は
符号化された制御信号と符号化された周波数領域信号を
多重して符号化ストリームを生成するストリーム多重回
路、27はブロック化情報に基づき符号化ストリームの
出力タイミングを制御する出力制御回路、202はスト
リームを出力する出力端子である。
【0033】この発明の実施の形態1の特徴は、情報多
重回路15と、情報分離回路21と、出力制御回路27
である。
【0034】つぎに、この実施の形態1に係るオーディ
オ信号の復号化及び符号化装置の動作について図面を参
照しながら説明する。
【0035】図3は、この発明の実施の形態1に係るオ
ーディオ信号の符号化装置のブロック化情報を示す図で
ある。
【0036】図4は、この発明の実施の形態1に係るオ
ーディオ信号の符号化装置における一定の伝送レートで
出力する場合の出力時間の調整の様子を示す図である。
【0037】図5は、この発明の実施の形態1に係るオ
ーディオ信号の符号化装置における符号化処理のフレー
ムタイミングと多重信号のブロック化情報とのタイミン
グ差d’が、図4のdとは異なる場合の様子を示す図で
ある。
【0038】符号化ストリームは、復号化装置10の入
力端子101を経由してストリーム分離回路11に入力
され、オーディオ信号の周波数領域の信号である主信号
とその他の制御信号とに分離される。
【0039】この分離された制御信号は、制御信号復号
回路12において復号される。復号された制御信号によ
り、ストリーム分離回路11から出力された主信号は、
復号及び逆量子化回路13によって復号され逆量子化さ
れる。
【0040】逆量子化された主信号は、周波数時間変換
回路14において周波数領域の信号から時間領域の信号
に変換される。また、制御信号復号回路12は、この時
間領域の信号に対するブロック化の情報を出力する。情
報多重回路15は、時間領域信号に対してブロック化情
報を所定の出力フォーマットに準じて付加する形で多重
し、その多重信号を、出力端子102を経由して出力す
る。
【0041】ここで、ブロック化の情報とは図3に示す
通り、時間領域信号に対して特定の時間区分に分割する
際の区分境界の時間情報のことである。ブロック化にお
いては、常に固定長の時間区分である場合もあり、ま
た、適応的に可変となる可変長の時間区分である場合も
ある。通常、このブロック化情報を基にして符号化処理
及び復号処理の処理区分を設けることになる。
【0042】復号化装置10から出力された多重信号
は、符号化装置20の入力端子201を経由して情報分
離回路21に入力され、所定のフォーマットに準じてブ
ロック化情報と時間領域信号とに分離する。
【0043】時間周波数変換回路22では、このブロッ
ク化情報に基づき時間領域信号の再ブロック化を行い、
そのブロック毎に時間周波数変換を行う。ブロック化情
報から得られるブロック化と全く同じブロック化を行っ
ても良いし、アルゴリズム遅延による遅延差を考慮し
て、一定時間分をずらしてブロック化を行っても良い。
【0044】一方、音響心理モデル回路23は、時間領
域信号を人間の聴覚特性に基づき分析を行い、制御信号
符号化回路24は、音響心理モデルから符号化のための
制御信号を生成するとともにその制御信号を符号化す
る。時間周波数変換回路22で生成された周波数領域信
号は、量子化及び符号化回路25において、制御信号符
号化回路24で生成された制御信号に基づいて量子化さ
れ、符号化される。最終的に、符号化された周波数領域
信号と制御信号は、ストリーム多重回路26によって多
重化されたストリームとなる。
【0045】出力制御回路27は、情報分離回路21か
らのブロック化情報を基に、ストリームを、出力端子2
02を経由して出力する際のタイミングを制御する。す
なわち、一定の伝送レートで出力する場合の出力時間の
調整を行う。図4は、その調整の様子を示すものであ
る。符号化装置20における符号化処理のフレームタイ
ミングは、t0、t1、…と一定間隔Tで連続してい
る。符号化装置20に入力される多重信号のブロック化
情報がt0in、t1in、…であった場合、そのタイ
ミング差dはd=t0in−t0である。t0inを基
点とするブロックは、そのブロック内の全ての信号が入
力された後のt2の時点で符号化処理が開始される。t
3の時点では既にストリームが生成されており、このス
トリームはt3以降の時点で出力する。この時、出力制
御回路27は、タイミング差dを考慮してt3からd時
間経過後のt3outのタイミングで出力する。
【0046】すなわち、多重信号のブロックが入力され
てから出力されるまでの時間tは、次の通りである。 t=t3out−t0in =(t3+d)−t0in =(t3+(t0in−t0)−t0in) =t3−t0 =3T
【0047】図5は、符号化装置20における符号化処
理のフレームタイミングと多重信号のブロック化情報と
のタイミング差d’が、図4の場合のdとは異なる場合
の様子を示したものである。ここでT>d’>d≧0と
する。この場合も、多重信号のブロックが入力されてか
ら出力されるまでの時間t’は、次のようになる。t’
=3T
【0048】上記の様な出力タイミングの制御を行うこ
とにより、符号化装置20における符号化処理のフレー
ムタイミングに対して、多重信号のブロック化情報がど
のようなタイミングの関係になっても、符号化装置20
を経由するのに要する遅延時間が一定となるため、復号
化装置10及び符号化装置20を何段もカスケードに接
続された形態で使用しても、トータルでの遅延時間の揺
らぎを防ぐことが可能となる。
【0049】また、上記の実施の形態1では、ブロック
化情報がカスケードに接続された復号化装置10及び符
号化装置20において同期的に維持されるので、オーデ
ィオ信号に対して常に同じ短時間ブロックを適用して符
号化処理を行い、音響心理モデルの分析結果の違いや生
成される制御信号のばらつきが抑えられ、品質劣化を抑
制することが可能となる。
【0050】実施の形態2.この発明の実施の形態2に
係るオーディオ信号の復号化及び符号化装置について図
面を参照しながら説明する。図6は、この発明の実施の
形態2に係るオーディオ信号の復号化装置の構成を示す
ブロック図である。また、図7は、この発明の実施の形
態2に係るオーディオ信号の符号化装置の構成を示すブ
ロック図である。
【0051】図6において、30は復号化装置全体、3
01は符号化ストリームを入力する入力端子、31は符
号化ストリームから主信号と制御信号を分離するストリ
ーム分離回路、32は分離された制御信号を復号し、さ
らにブロック化情報及び符号化特性情報を出力する制御
信号復号回路、33は分離された主信号を復号された制
御信号により復号及び逆量子化する復号及び逆量子化回
路、34は逆量子化された周波数領域の主信号を時間領
域信号に変換する周波数時間変換回路、35は符号化特
性情報から音響心理モデルを構成する音響心理モデル構
成回路、36は時間領域信号とブロック化情報と音響心
理モデル情報(パラメータ)を多重して出力する情報多
重回路、302はその多重信号を出力する出力端子であ
る。
【0052】また、図7において、40は符号化装置全
体、401は多重信号を入力する入力端子、41は多重
信号から時間領域信号とブロック化情報と音響心理モデ
ル情報を分離する情報分離回路、42は分離されたブロ
ック化情報に基づき時間領域信号を周波数領域信号に変
換する時間周波数変換回路、43は分離された音響心理
モデル情報を基に、時間領域信号に対して聴覚分析を行
う音響心理モデル回路、44は音響心理モデルを基に量
子化及び符号化のための制御信号を生成し符号化を行う
制御信号符号化回路、45は制御信号を用いて周波数領
域信号を量子化及び符号化する量子化及び符号化回路、
46は符号化された制御信号と符号化された周波数領域
信号を多重して符号化ストリームを生成するストリーム
多重回路、47はブロック化情報に基づき符号化ストリ
ームの出力タイミングを制御する出力制御回路、402
はストリームを出力する出力端子である。
【0053】この発明の実施の形態2の特徴は、音響心
理モデル構成回路35と、情報多重回路36と、情報分
離回路41と、音響心理モデル回路43である。
【0054】つぎに、この実施の形態2に係るオーディ
オ信号の復号化及び符号化装置の動作について図面を参
照しながら説明する。
【0055】図8は、この発明の実施の形態2に係るオ
ーディオ信号の復号化装置の情報多重回路において音響
心理モデル情報を多重し、出力端子から出力する際のフ
ォーマットを示す図である。
【0056】符号化ストリームは、復号化装置30の入
力端子301を経由してストリーム分離回路31に入力
され、オーディオ信号の周波数領域の信号である主信号
とその他の制御信号とに分離される。
【0057】分離された制御信号は、制御信号復号回路
32において復号される。復号された制御信号により、
ストリーム分離回路31から出力された主信号は、復号
及び逆量子化回路33によって復号され逆量子化され
る。逆量子化された主信号は、周波数時間変換回路34
において周波数領域の信号から時間領域の信号に変換さ
れる。
【0058】また、制御信号復号回路32は、この時間
領域の信号に対するブロック化の情報及び符号化特性情
報を出力する。音響心理モデル構成回路35は、符号化
特性情報を基に音響心理モデルを構成する。情報多重回
路36は、時間領域信号に対してブロック化情報と音響
心理モデル情報を所定の出力フォーマットに準じて付加
する形で多重し、その多重信号を、出力端子302を経
由して出力する。
【0059】ここで、ブロック化の情報とは、上記の実
施の形態1で述べた通りである。また、符号化特性情報
とは、この復号化装置の前段に接続された符号化装置で
行われた符号化の特性を示す情報であり、例えば量子化
の精度情報であったり、符号化された信号の振幅レベル
情報であったりする。
【0060】量子化の精度は、前段に接続された符号化
装置において聴覚特性に基づく分析結果から決定された
ものであり、この情報と信号の振幅レベル情報とからマ
スキング効果を推定することが可能である。これらの情
報を基に推定した音響心理モデルの情報は、聴覚が知覚
できる信号のみを符号化して伝送するという符号化方式
において重要なパラメータであり、これらの情報を次段
の符号化装置に継続的に伝送することは、品質劣化を抑
制する上で重要なことである。
【0061】図8は、復号化装置30の情報多重回路3
6において音響心理モデル情報(パラメータ)を多重
し、出力端子302から出力する際のフォーマットを示
している。これはAES3規格のデジタルオーディオイ
ンタフェースフォーマットに準ずるフォーマットであ
る。
【0062】AES3規格は、1つのオーディオサンプ
ルに対して32ビット相当のタイムスロットを有する。
すなわち、先頭の4ビットに同期プリアンブル、補助デ
ータ(AUX)に対して4ビット、時間領域信号すなわ
ちオーディオデータに対して20ビット、補助コードデ
ータ(V、U、C、P)に対して4ビットが使用され
る。ここで、補助データ領域は通常使用されない場合が
多く、この領域に音響心理モデルの情報(パラメータ)
を多重する。なお、この領域をオーディオデータの拡張
領域として使用されないよう、補助コードデータのCに
よって構成されるチャネルステータス情報を管理してお
く。
【0063】また、図7において、復号化装置30から
出力された多重信号は、符号化装置40の入力端子40
1を経由して情報分離回路41に入力され、所定のフォ
ーマットに準じて、ブロック化情報と音響心理モデル情
報と時間領域信号とに分離する。
【0064】時間周波数変換回路42では、このブロッ
ク化情報に基づき時間領域信号の再ブロック化を行い、
そのブロック毎に時間周波数変換を行う。ブロック化情
報から得られるブロック化と全く同じブロック化を行っ
ても良いし、アルゴリズム遅延による遅延差を考慮し
て、一定時間分をずらしてブロック化を行っても良い。
【0065】一方、音響心理モデル回路43は、情報分
離回路41で分離された音響心理モデル情報を加味しな
がら時間領域信号を人間の聴覚特性に基づいて分析を行
う。制御信号符号化回路44は、音響心理モデルから符
号化のための制御信号を生成するとともにその制御信号
を符号化する。
【0066】時間周波数変換回路42で生成された周波
数領域信号は、量子化及び符号化回路45において、制
御信号符号化回路44で生成された制御信号に基づいて
量子化され、符号化される。
【0067】最終的に、符号化された周波数領域信号と
制御信号は、ストリーム多重回路46によって多重化さ
れたストリームとなる。出力制御回路47は、情報分離
回路41からのブロック化情報を基に、ストリームを、
出力端子402を経由して出力する再のタイミングを調
整し、符号化装置40に関わる遅延時間を一定に制御す
る。この詳細については、上記の実施の形態1で説明し
た通りである。
【0068】上記の様な出力タイミングを行うと共に、
ブロック化情報と音響心理モデル情報を同期的に伝送
し、前段の符号化における特徴を継続的に次段に伝える
ことによって、音響心理モデルの分析結果の違いや生成
される制御信号のばらつきが抑えられ、品質劣化を抑制
することが可能となる。
【0069】
【発明の効果】この発明の請求項1に係るオーディオ信
号の復号化及び符号化装置は、以上説明したとおり、符
号化ストリームから主信号と制御信号を分離するストリ
ーム分離回路と、前記分離された制御信号を復号し、ブ
ロック化情報を出力する制御信号復号回路と、前記分離
された主信号を前記復号された制御信号に基づいて復号
及び逆量子化する復号及び逆量子化回路と、前記逆量子
化された周波数領域の主信号を時間領域信号に変換する
周波数時間変換回路と、前記時間領域信号と前記ブロッ
ク化情報を多重する情報多重回路とを有する復号化装置
を備えると共に、多重信号から時間領域信号とブロック
化情報を分離する情報分離回路と、前記分離されたブロ
ック化情報に基づいて時間領域信号を周波数領域信号に
変換する時間周波数変換回路と、前記時間領域信号に対
して聴覚分析を行う音響心理モデル回路と、音響心理モ
デルを基に量子化及び符号化のための制御信号を生成し
符号化を行う制御信号符号化回路と、前記制御信号を用
いて周波数領域信号を量子化及び符号化する量子化及び
符号化回路と、前記符号化された制御信号と前記符号化
された周波数領域信号を多重して符号化ストリームを生
成するストリーム多重回路と、前記ブロック化情報に基
づいて、装置内の処理遅延時間が一定になるように、前
記符号化ストリームの出力タイミングを制御する出力制
御回路とを有する符号化装置を備えたので、トータルで
の遅延時間の揺らぎを防ぐことができ、音響心理モデル
の分析結果の違いや生成される制御信号のばらつきを抑
えることができ、品質劣化を抑制することができるとい
う効果を奏する。
【0070】この発明の請求項2に係るオーディオ信号
の復号化及び符号化装置は、以上説明したとおり、前記
復号化装置が、符号化特性情報から音響心理モデルを構
成する音響心理モデル構成回路をさらに有し、前記復号
化装置の前記制御信号復号回路は、前記符号化特性情報
を出力し、前記復号化装置の前記情報多重回路は、前記
音響心理モデル構成回路からの音響心理モデル情報も多
重し、前記符号化装置の前記情報分離回路は、前記多重
信号から前記音響心理モデル情報も分離し、前記符号化
装置の前記音響心理モデル回路は、前記分離された音響
心理モデル情報を基に、前記時間領域信号に対して聴覚
分析を行うので、音響心理モデルの分析結果の違いや生
成される制御信号のばらつきを抑えることができ、品質
劣化を抑制することができるという効果を奏する。
【0071】この発明の請求項3に係るオーディオ信号
の復号化装置は、以上説明したとおり、符号化ストリー
ムから主信号と制御信号を分離するストリーム分離回路
と、前記分離された制御信号を復号し、ブロック化情報
を出力する制御信号復号回路と、前記分離された主信号
を前記復号された制御信号に基づいて復号及び逆量子化
する復号及び逆量子化回路と、前記逆量子化された周波
数領域の主信号を時間領域信号に変換する周波数時間変
換回路と、前記時間領域信号と前記ブロック化情報を多
重する情報多重回路とを備えたので、ブロック化の情報
を同期的に伝送することができ、ひいてはカスケードに
接続された全装置を経由する遅延時間を一定にすること
ができるという効果を奏する。
【0072】この発明の請求項4に係るオーディオ信号
の復号化装置は、以上説明したとおり、符号化特性情報
から音響心理モデルを構成する音響心理モデル構成回路
をさらに備え、前記制御信号復号回路は、前記符号化特
性情報を出力し、前記情報多重回路は、前記音響心理モ
デル構成回路からの音響心理モデル情報も多重するの
で、音響心理モデル情報を同期的に伝送することがで
き、ひいては音響心理モデルの分析結果の違いや生成さ
れる制御信号のばらつきを抑えることができ、品質劣化
を抑制することができるという効果を奏する。
【0073】この発明の請求項5に係るオーディオ信号
の符号化装置は、以上説明したとおり、多重信号から時
間領域信号とブロック化情報を分離する情報分離回路
と、前記分離されたブロック化情報に基づいて時間領域
信号を周波数領域信号に変換する時間周波数変換回路
と、前記時間領域信号に対して聴覚分析を行う音響心理
モデル回路と、音響心理モデルを基に量子化及び符号化
のための制御信号を生成し符号化を行う制御信号符号化
回路と、前記制御信号を用いて周波数領域信号を量子化
及び符号化する量子化及び符号化回路と、前記符号化さ
れた制御信号と前記符号化された周波数領域信号を多重
して符号化ストリームを生成するストリーム多重回路
と、前記ブロック化情報に基づいて、装置内の処理遅延
時間が一定になるように、前記符号化ストリームの出力
タイミングを制御する出力制御回路とを備えたので、ブ
ロック化の情報を同期的に伝送することができ、ひいて
はカスケードに接続された全装置を経由する遅延時間を
一定にすることができるという効果を奏する。
【0074】この発明の請求項6に係るオーディオ信号
の符号化装置は、以上説明したとおり、前記情報分離回
路が、前記多重信号から前記音響心理モデル情報も分離
し、前記音響心理モデル回路は、前記分離された音響心
理モデル情報を基に、前記時間領域信号に対して聴覚分
析を行うので、音響心理モデル情報を同期的に伝送する
ことができ、ひいては音響心理モデルの分析結果の違い
や生成される制御信号のばらつきを抑えることができ、
品質劣化を抑制することができるという効果を奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態1に係るオーディオ信
号の復号化装置の構成を示すブロック図である。
【図2】 この発明の実施の形態1に係るオーディオ信
号の符号化装置の構成を示すブロック図である。
【図3】 この発明の実施の形態1に係るオーディオ信
号の符号化装置のブロック化情報を示す図である。
【図4】 この発明の実施の形態1に係るオーディオ信
号の符号化装置における一定の伝送レートで出力する場
合の出力時間の調整の様子を示す図である。
【図5】 この発明の実施の形態1に係るオーディオ信
号の符号化装置における符号化処理のフレームタイミン
グと多重信号のブロック化情報とのタイミング差d’
が、図4のdとは異なる場合の様子を示す図である。
【図6】 この発明の実施の形態2に係るオーディオ信
号の復号化装置の構成を示すブロック図である。
【図7】 この発明の実施の形態2に係るオーディオ信
号の符号化装置の構成を示すブロック図である。
【図8】 この発明の実施の形態2に係るオーディオ信
号の復号化装置の情報多重回路において音響心理モデル
情報を多重し、出力端子から出力する際のフォーマット
を示す図である。
【図9】 従来のオーディオ信号の復号化及び符号化装
置の構成を示すブロック図である。
【図10】 従来のオーディオ信号の符号化装置の動作
を示す図である。
【符号の説明】
10 復号化装置、11 ストリーム分離回路、12
制御信号復号回路、13 復号及び逆量子化回路、14
周波数時間変換回路、15 情報多重回路、20 符
号化装置、21 情報分離回路、22 時間周波数変換
回路、23 音響心理モデル回路、24 制御信号符号
化回路、25 量子化及び符号化回路、26 ストリー
ム多重回路、27 出力制御回路、30 復号化装置、
31 ストリーム分離回路、32 御信号復号回路、3
3 復号及び逆量子化回路、34周波数時間変換回路、
35 音響心理モデル構成回路、36 情報多重回路、
40 符号化装置、41 情報分離回路、42 時間周
波数変換回路、43 音響心理モデル回路、44 制御
信号符号化回路、45 量子化及び符号化回路、46
ストリーム多重回路、47 出力制御回路、101 入
力端子、102出力端子、201 入力端子、202
出力端子、301 入力端子、302出力端子、401
入力端子、402 出力端子。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5J064 AA04 BA00 BB09 BC02 BC16 BC25 BD02

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 符号化ストリームから主信号と制御信号
    を分離するストリーム分離回路と、 前記分離された制御信号を復号し、ブロック化情報を出
    力する制御信号復号回路と、 前記分離された主信号を前記復号された制御信号に基づ
    いて復号及び逆量子化する復号及び逆量子化回路と、 前記逆量子化された周波数領域の主信号を時間領域信号
    に変換する周波数時間変換回路と、 前記時間領域信号と前記ブロック化情報を多重する情報
    多重回路と を有する復号化装置を備えると共に、 多重信号から時間領域信号とブロック化情報を分離する
    情報分離回路と、 前記分離されたブロック化情報に基づいて時間領域信号
    を周波数領域信号に変換する時間周波数変換回路と、 前記時間領域信号に対して聴覚分析を行う音響心理モデ
    ル回路と、 音響心理モデルを基に量子化及び符号化のための制御信
    号を生成し符号化を行う制御信号符号化回路と、 前記制御信号を用いて周波数領域信号を量子化及び符号
    化する量子化及び符号化回路と、 前記符号化された制御信号と前記符号化された周波数領
    域信号を多重して符号化ストリームを生成するストリー
    ム多重回路と、 前記ブロック化情報に基づいて、装置内の処理遅延時間
    が一定になるように、前記符号化ストリームの出力タイ
    ミングを制御する出力制御回路とを有する符号化装置を
    備えたことを特徴とするオーディオ信号の復号化及び符
    号化装置。
  2. 【請求項2】 前記復号化装置は、 符号化特性情報から音響心理モデルを構成する音響心理
    モデル構成回路をさらに有し、 前記復号化装置の前記制御信号復号回路は、前記符号化
    特性情報を出力し、 前記復号化装置の前記情報多重回路は、前記音響心理モ
    デル構成回路からの音響心理モデル情報も多重し、 前記符号化装置の前記情報分離回路は、前記多重信号か
    ら前記音響心理モデル情報も分離し、 前記符号化装置の前記音響心理モデル回路は、前記分離
    された音響心理モデル情報を基に、前記時間領域信号に
    対して聴覚分析を行うことを特徴とする請求項1記載の
    オーディオ信号の復号化及び符号化装置。
  3. 【請求項3】 符号化ストリームから主信号と制御信号
    を分離するストリーム分離回路と、 前記分離された制御信号を復号し、ブロック化情報を出
    力する制御信号復号回路と、 前記分離された主信号を前記復号された制御信号に基づ
    いて復号及び逆量子化する復号及び逆量子化回路と、 前記逆量子化された周波数領域の主信号を時間領域信号
    に変換する周波数時間変換回路と、 前記時間領域信号と前記ブロック化情報を多重する情報
    多重回路とを備えたことを特徴とするオーディオ信号の
    復号化装置。
  4. 【請求項4】 符号化特性情報から音響心理モデルを構
    成する音響心理モデル構成回路をさらに備え、 前記制御信号復号回路は、前記符号化特性情報を出力
    し、 前記情報多重回路は、前記音響心理モデル構成回路から
    の音響心理モデル情報も多重することを特徴とする請求
    項3記載のオーディオ信号の復号化装置。
  5. 【請求項5】 多重信号から時間領域信号とブロック化
    情報を分離する情報分離回路と、 前記分離されたブロック化情報に基づいて時間領域信号
    を周波数領域信号に変換する時間周波数変換回路と、 前記時間領域信号に対して聴覚分析を行う音響心理モデ
    ル回路と、 音響心理モデルを基に量子化及び符号化のための制御信
    号を生成し符号化を行う制御信号符号化回路と、 前記制御信号を用いて周波数領域信号を量子化及び符号
    化する量子化及び符号化回路と、 前記符号化された制御信号と前記符号化された周波数領
    域信号を多重して符号化ストリームを生成するストリー
    ム多重回路と、 前記ブロック化情報に基づいて、装置内の処理遅延時間
    が一定になるように、前記符号化ストリームの出力タイ
    ミングを制御する出力制御回路とを備えたことを特徴と
    するオーディオ信号の符号化装置。
  6. 【請求項6】 前記情報分離回路は、前記多重信号から
    前記音響心理モデル情報も分離し、 前記音響心理モデル回路は、前記分離された音響心理モ
    デル情報を基に、前記時間領域信号に対して聴覚分析を
    行うことを特徴とする請求項5記載のオーディオ信号の
    符号化装置。
JP2002119215A 2002-04-22 2002-04-22 オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置 Withdrawn JP2003316392A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002119215A JP2003316392A (ja) 2002-04-22 2002-04-22 オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置
US10/418,176 US20030200081A1 (en) 2002-04-22 2003-04-18 Audio signal decoding and encoding device, decoding device and encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002119215A JP2003316392A (ja) 2002-04-22 2002-04-22 オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置

Publications (1)

Publication Number Publication Date
JP2003316392A true JP2003316392A (ja) 2003-11-07

Family

ID=29207938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002119215A Withdrawn JP2003316392A (ja) 2002-04-22 2002-04-22 オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置

Country Status (2)

Country Link
US (1) US20030200081A1 (ja)
JP (1) JP2003316392A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
ES2741963T3 (es) 2008-07-11 2020-02-12 Fraunhofer Ges Forschung Codificadores de señal de audio, métodos para codificar una señal de audio y programas informáticos

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
DE69525836T2 (de) * 1994-11-04 2002-11-21 Koninkl Philips Electronics Nv Kodierung und dekodierung eines breitbandigen digitalen informationssignals
JP2002014697A (ja) * 2000-06-30 2002-01-18 Hitachi Ltd ディジタルオーディオ装置
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification

Also Published As

Publication number Publication date
US20030200081A1 (en) 2003-10-23

Similar Documents

Publication Publication Date Title
RU2197776C2 (ru) Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты)
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
RU2495503C2 (ru) Устройство кодирования звука, устройство декодирования звука, устройство кодирования и декодирования звука и система проведения телеконференций
KR101253699B1 (ko) 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을위한 시간적 엔벨로프 정형화
KR100904436B1 (ko) 오디오 신호의 처리 방법 및 장치
KR101192241B1 (ko) 입력 데이터 스트림의 믹싱과 그로부터 출력 데이터 스트림의 생성
EP2109861B1 (en) Audio decoder
KR100941011B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP5277350B2 (ja) 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR20080044707A (ko) 오디오/스피치 신호 부호화 및 복호화 방법 및 장치
JP2000101436A (ja) オーディオ信号の符号化及び復号方法及び装置
JP2009513992A (ja) オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法
KR20190037370A (ko) 신호 처리 장치 및 방법, 및 프로그램
KR20080025636A (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
JP2002041099A (ja) マスク済み閾値表現方法、再構成方法、及びそのシステム
JPH05173599A (ja) 音声符号復号化装置
JP2003316392A (ja) オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置
JP2012519309A (ja) オーディオ符号化のための量子化
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置
EP2187388A1 (en) Signal processing device, signal processing method, and program
KR960003627B1 (ko) 서브 밴드 부호화된 오디오 신호의 난청자용 복호화 방법
KR101259120B1 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050705