JPH0651795A - 信号量子化装置及びその方法 - Google Patents
信号量子化装置及びその方法Info
- Publication number
- JPH0651795A JPH0651795A JP5064822A JP6482293A JPH0651795A JP H0651795 A JPH0651795 A JP H0651795A JP 5064822 A JP5064822 A JP 5064822A JP 6482293 A JP6482293 A JP 6482293A JP H0651795 A JPH0651795 A JP H0651795A
- Authority
- JP
- Japan
- Prior art keywords
- scale factor
- signal
- threshold
- window
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
(57)【要約】
【目的】 可聴周波信号の高品質高効率の量子化用装置
及び方法を提供する。 【構成】 知覚的可聴周波符号器104において、与え
られた周波数における計算された聴覚しきい値に基づく
しきい値スケールファクタと、同じ周波数における絶対
聴覚しきい値に基づく絶対スケールファクタとに基づい
て利用スケールファクタが設立され、量子化器206
が、この利用スケールファクタを用いて信号を量子化
し、量子化された信号に付随するコストを評価し、しき
い値スケールファクタと絶対スケールファクタとの間で
補間により利用スケールファクタを調整し、これらのス
テップをコストが許容範囲以内になるまで反復する。
及び方法を提供する。 【構成】 知覚的可聴周波符号器104において、与え
られた周波数における計算された聴覚しきい値に基づく
しきい値スケールファクタと、同じ周波数における絶対
聴覚しきい値に基づく絶対スケールファクタとに基づい
て利用スケールファクタが設立され、量子化器206
が、この利用スケールファクタを用いて信号を量子化
し、量子化された信号に付随するコストを評価し、しき
い値スケールファクタと絶対スケールファクタとの間で
補間により利用スケールファクタを調整し、これらのス
テップをコストが許容範囲以内になるまで反復する。
Description
【0001】
【産業上の利用分野】本発明は、信号処理に関し、詳し
くは、音声及び音楽を表す信号を含むモノラル及びステ
レオ可聴周波信号を伝送又は保存のために効率的に符号
化及び復号化する技術に関する。
くは、音声及び音楽を表す信号を含むモノラル及びステ
レオ可聴周波信号を伝送又は保存のために効率的に符号
化及び復号化する技術に関する。
【0002】
【従来の技術】可聴周波信号を伝送又は保存のために圧
縮することを目的とする従来技術は大抵、信号源が信号
に設ける冗長度の抑圧を探求してきた。すなわち、例え
ばジェイアント(N.S.Jayant)及びノル(P.Noll)著
「波形のディジタル符号化」(プレンティスホール社1
984年刊)に述べられているADPCMサブバンド符
号化及びトランスフォーム符号化のような技術では、信
号生成源からの信号に存在する冗長性の除去を探求して
いる。
縮することを目的とする従来技術は大抵、信号源が信号
に設ける冗長度の抑圧を探求してきた。すなわち、例え
ばジェイアント(N.S.Jayant)及びノル(P.Noll)著
「波形のディジタル符号化」(プレンティスホール社1
984年刊)に述べられているADPCMサブバンド符
号化及びトランスフォーム符号化のような技術では、信
号生成源からの信号に存在する冗長性の除去を探求して
いる。
【0003】1991年8月13日付けで発行されたブ
ランデンバーグ他(Brandenburg etal)の米国特許第
5,040,217号は、知覚的考察を取り入れて高品
質可聴周波信号の効率的な符号化及び復号化を行うシス
テムについて述べている。このシステムの実施例におい
ては、特に、入力信号の、雑音又はトーンに似た品質に
ついての計測値を用いることにより、モノラル可聴周波
信号について非常に効率的な符号化を可能にしている。
ランデンバーグ他(Brandenburg etal)の米国特許第
5,040,217号は、知覚的考察を取り入れて高品
質可聴周波信号の効率的な符号化及び復号化を行うシス
テムについて述べている。このシステムの実施例におい
ては、特に、入力信号の、雑音又はトーンに似た品質に
ついての計測値を用いることにより、モノラル可聴周波
信号について非常に効率的な符号化を可能にしている。
【0004】可聴周波信号の圧縮に用いられる符号化技
術が不快な人工生成要素をもたらさないことがもちろん
非常に重要である。このことは、再生のために復号化し
た際に、一方のステレオチャンネルに対応する符号化さ
れた情報が他方のステレオチャンネルに対応する符号化
された情報と干渉する、又は相互に影響し合うことがあ
り得るような、ステレオ可聴周波情報信号を符号化する
場合に、特に重要である。
術が不快な人工生成要素をもたらさないことがもちろん
非常に重要である。このことは、再生のために復号化し
た際に、一方のステレオチャンネルに対応する符号化さ
れた情報が他方のステレオチャンネルに対応する符号化
された情報と干渉する、又は相互に影響し合うことがあ
り得るような、ステレオ可聴周波情報信号を符号化する
場合に、特に重要である。
【0005】2つのステレオチャンネルの符号化を行う
場合の手段の1つとして、固定のビット伝送速度(以
下、ビットレート、又はレート)で作動する2台の独立
した符号器を用いる、いわゆる「デュアル・モノラル」
符号器がある。又、これと対照的な手段として、「ジョ
イント・モノラル」符号器があり、これには2台のモノ
ラル符号器が用いられるが、ビットレートとしては1つ
の組み合せレートを共用する。すなわち、2台の符号器
のビットレートを或る固定値以下に抑制するが、個々の
符号器のビットレートの間でバランスを求めるようにし
てもよい。
場合の手段の1つとして、固定のビット伝送速度(以
下、ビットレート、又はレート)で作動する2台の独立
した符号器を用いる、いわゆる「デュアル・モノラル」
符号器がある。又、これと対照的な手段として、「ジョ
イント・モノラル」符号器があり、これには2台のモノ
ラル符号器が用いられるが、ビットレートとしては1つ
の組み合せレートを共用する。すなわち、2台の符号器
のビットレートを或る固定値以下に抑制するが、個々の
符号器のビットレートの間でバランスを求めるようにし
てもよい。
【0006】更に別の手段である「ジョイント・ステレ
オ」符号器は、符号化利得を更に実現するために、1対
のステレオチャンネルについてのチャンネル相互特性を
用いようとするものである。
オ」符号器は、符号化利得を更に実現するために、1対
のステレオチャンネルについてのチャンネル相互特性を
用いようとするものである。
【0007】
【発明が解決しようとする課題】1対のステレオチャン
ネルの2つのチャンネルの信号を独立して符号化するこ
とは結果として、ビットレートが低い場合に特に、望ま
しくない音響心理学的な人工生成要素がいくつも発生す
ることが判明している。これらの中には、動的に結像さ
れた信号音像の定位にに一致しないような符号化雑音の
定位に関するものがある。すなわち、もしこのような定
位の不一致を避けなければならない場合、人間のステレ
オ知覚プロセスが符号化プロセスに抑制を加えるように
見える。
ネルの2つのチャンネルの信号を独立して符号化するこ
とは結果として、ビットレートが低い場合に特に、望ま
しくない音響心理学的な人工生成要素がいくつも発生す
ることが判明している。これらの中には、動的に結像さ
れた信号音像の定位にに一致しないような符号化雑音の
定位に関するものがある。すなわち、もしこのような定
位の不一致を避けなければならない場合、人間のステレ
オ知覚プロセスが符号化プロセスに抑制を加えるように
見える。
【0008】このことは、少なくとも雑音が空間的に分
離されるような低い周波数において存在するように見え
るバイノーラル遮蔽(マスキング)レベル差についての
報告と一致する。このようなバイノーラルなマスキング
レベル差は、モノラルシステムにおいてはマスクされる
ような雑音要素をマスキングせずに表に出すと考えられ
る。これについては例えば、モリー(B.C.J.Morre)著
「聴覚心理学序説、第2版」(フロリダ州オーランド、
アカデミックプレス社1982年刊)(特にその第5
章)を参照されたい。
離されるような低い周波数において存在するように見え
るバイノーラル遮蔽(マスキング)レベル差についての
報告と一致する。このようなバイノーラルなマスキング
レベル差は、モノラルシステムにおいてはマスクされる
ような雑音要素をマスキングせずに表に出すと考えられ
る。これについては例えば、モリー(B.C.J.Morre)著
「聴覚心理学序説、第2版」(フロリダ州オーランド、
アカデミックプレス社1982年刊)(特にその第5
章)を参照されたい。
【0009】ステレオ枠組みにおける音響心理学的な人
工生成要素を減少させる技術の1つでは、ISO−WG
11−MPEG−可聴周波音響心理学II[ISO]モ
デルを用いる。このモデルにおいては、音響心理学モデ
ルの内部の信号対雑音比(SN比)に、第2のSN比制
限値が適用される。しかし、このような、SN比の追加
抑制は一般に、低い周波数において、チャンネル容量の
追加、又は、用途が記憶の場合には記憶容量の追加使用
を必要とする一方、符号化のモノラル性能を低下させ
る。
工生成要素を減少させる技術の1つでは、ISO−WG
11−MPEG−可聴周波音響心理学II[ISO]モ
デルを用いる。このモデルにおいては、音響心理学モデ
ルの内部の信号対雑音比(SN比)に、第2のSN比制
限値が適用される。しかし、このような、SN比の追加
抑制は一般に、低い周波数において、チャンネル容量の
追加、又は、用途が記憶の場合には記憶容量の追加使用
を必要とする一方、符号化のモノラル性能を低下させ
る。
【0010】
【課題を解決するための手段】従来技術における上記の
制限は、本発明に基づく高品質可聴周波ステレオチャン
ネル対の符号化装置及び方法を用いることによって克服
でき、技術的進歩が得られる。本発明においては、チャ
ンネル相互間の冗長性及び非関連性を利用して、復号化
後の再生の高品質性を維持しながらより低いビットレー
トを達成するようにしている。本発明はステレオの符号
化及び復号化に用いる場合に特に適切であるが、通常の
「デュアル・モノラル」ステレオ符号器に用いても同様
の利点が得られる。
制限は、本発明に基づく高品質可聴周波ステレオチャン
ネル対の符号化装置及び方法を用いることによって克服
でき、技術的進歩が得られる。本発明においては、チャ
ンネル相互間の冗長性及び非関連性を利用して、復号化
後の再生の高品質性を維持しながらより低いビットレー
トを達成するようにしている。本発明はステレオの符号
化及び復号化に用いる場合に特に適切であるが、通常の
「デュアル・モノラル」ステレオ符号器に用いても同様
の利点が得られる。
【0011】本発明の一実施例においては、修正離散コ
サイン変換(MDCT)を用いるフィルタバンク構造が
採用されている。システムに入力される信号をその全範
囲にわたって符号化するために、本実施例においては、
利点として、左・右(L/R)及び和・差(M/S)の
両方の符号化方式を用い、信号従属の仕方で周波数及び
時間の両方について切り替えている。
サイン変換(MDCT)を用いるフィルタバンク構造が
採用されている。システムに入力される信号をその全範
囲にわたって符号化するために、本実施例においては、
利点として、左・右(L/R)及び和・差(M/S)の
両方の符号化方式を用い、信号従属の仕方で周波数及び
時間の両方について切り替えている。
【0012】又、新たに設けたステレオ雑音マスキング
モデルが、符号化されたステレオ信号におけるバイノー
ラルな人工生成要素を検出して排除するので有利であ
る。そして、可聴周波信号の品質を低下させずに圧縮を
より強化するために、チャンネル相互間の冗長性が利用
される。
モデルが、符号化されたステレオ信号におけるバイノー
ラルな人工生成要素を検出して排除するので有利であ
る。そして、可聴周波信号の品質を低下させずに圧縮を
より強化するために、チャンネル相互間の冗長性が利用
される。
【0013】更に、利点として、本実施例においては、
左・右両方の可聴周波チャンネルの時間挙動が正確にモ
ニタされ、その結果を用いて符号化プロセスの時間的分
割が制御される。すなわち、本発明の一態様において、
通常のMDCTウィンドウ、又は、信号状態によって
は、より小さいウィンドウのいずれかで入力信号の処理
が行われる。
左・右両方の可聴周波チャンネルの時間挙動が正確にモ
ニタされ、その結果を用いて符号化プロセスの時間的分
割が制御される。すなわち、本発明の一態様において、
通常のMDCTウィンドウ、又は、信号状態によって
は、より小さいウィンドウのいずれかで入力信号の処理
が行われる。
【0014】その上、左・右符号化モード又は和・差符
号化モード間の動的な切り替えが時間及び周波数の両方
について得られるように構成され、これによって、望ま
ないバイノーラルな雑音の定位が制御され、和・差信号
の過符号化を必要とする事態が防止され、全体的な符号
化利得が最大化される。
号化モード間の動的な切り替えが時間及び周波数の両方
について得られるように構成され、これによって、望ま
ないバイノーラルな雑音の定位が制御され、和・差信号
の過符号化を必要とする事態が防止され、全体的な符号
化利得が最大化される。
【0015】又、一般的なビットストリーム定義及びレ
ート制御ループ(反復)処理が行われ、これによって、
符号器出力形成において有用な柔軟性が得られる。又、
有利になるように、チャンネル相互間の非関連性が除去
され、ステレオ雑音マスキングが改善され、これによっ
て、ジョイントで符号化されたステレオチャンネル対に
おける可聴周波信号の再生品質が改善される。
ート制御ループ(反復)処理が行われ、これによって、
符号器出力形成において有用な柔軟性が得られる。又、
有利になるように、チャンネル相互間の非関連性が除去
され、ステレオ雑音マスキングが改善され、これによっ
て、ジョイントで符号化されたステレオチャンネル対に
おける可聴周波信号の再生品質が改善される。
【0016】実施例で用いられるレート制御方法におい
ては、符号器のレート制限値以下の信号について絶対し
きい値とマスキングしきい値との間の補間が行われ、又
レートが制限されるような条件下ではしきい値を上げる
方策が用いられる。
ては、符号器のレート制限値以下の信号について絶対し
きい値とマスキングしきい値との間の補間が行われ、又
レートが制限されるような条件下ではしきい値を上げる
方策が用いられる。
【0017】本発明の符号器/復号器の全体システムに
関する態様においては、利点として、改良ハフマン様の
エントロピー符号器/復号器を用い、これによって更に
チャンネルビットレートの要求値が減少し、記憶用途に
ついては記憶容量要求値が減少する。本発明の無雑音圧
縮方法においては例えば、周波数区分方式と共にハフマ
ン式符号化方法が用いられ、これによって、知覚的しき
い値で定まるように、左(L)、右(R)、和(M)、
及び差(S)についての周波数サンプルを効率的に符号
化することができる。
関する態様においては、利点として、改良ハフマン様の
エントロピー符号器/復号器を用い、これによって更に
チャンネルビットレートの要求値が減少し、記憶用途に
ついては記憶容量要求値が減少する。本発明の無雑音圧
縮方法においては例えば、周波数区分方式と共にハフマ
ン式符号化方法が用いられ、これによって、知覚的しき
い値で定まるように、左(L)、右(R)、和(M)、
及び差(S)についての周波数サンプルを効率的に符号
化することができる。
【0018】本発明においては、従来の量子化器/ビッ
トレート制御ループ処理装置の制約及びコストの多くを
排除しながら従来の技術とは異なるアプローチを用いて
可聴周波信号を符号化する際に用いられるスケールファ
クタ(すなわち分析フィルタバンクから出力されたMD
CT係数)を定めるためのメカニズムが設けられる。本
発明に基づいて量子化された可聴周波信号は従来の技術
による場合よりも雑音が少なく、符号化された場合のビ
ット数が少ない。
トレート制御ループ処理装置の制約及びコストの多くを
排除しながら従来の技術とは異なるアプローチを用いて
可聴周波信号を符号化する際に用いられるスケールファ
クタ(すなわち分析フィルタバンクから出力されたMD
CT係数)を定めるためのメカニズムが設けられる。本
発明に基づいて量子化された可聴周波信号は従来の技術
による場合よりも雑音が少なく、符号化された場合のビ
ット数が少ない。
【0019】これらの結果が本発明の実施例において得
られ、これらから、量子化すべきそれぞれのスペクトル
係数の周波数に対応する周波数における、計算された聴
覚しきい値から導かれたスケールファクタと、この周波
数における絶対聴覚しきい値から導かれたスケールファ
クタとの間を補間することによって、利用スケールファ
クタが導き出され、この利用スケールファクタの導出
は、量子化されたスペクトル係数が許容される制限値以
内で符号化できるようになるまで反復して行われる。
られ、これらから、量子化すべきそれぞれのスペクトル
係数の周波数に対応する周波数における、計算された聴
覚しきい値から導かれたスケールファクタと、この周波
数における絶対聴覚しきい値から導かれたスケールファ
クタとの間を補間することによって、利用スケールファ
クタが導き出され、この利用スケールファクタの導出
は、量子化されたスペクトル係数が許容される制限値以
内で符号化できるようになるまで反復して行われる。
【0020】
[概要]以下、本発明を実施例について説明する。説明
を分かりやすくするため、この実施例を、個々の機能を
代表する機能ブロックから構成されるものとして述べる
(「処理装置」と名称を付けた機能ブロックを含む)。
これらのブロックが代表する機能は、兼用又は専用のい
ずれのハードウエアを用いても得ることができ、又これ
らのハードウエアにはソフトウエアを実行できるものを
含むがこれに限らない(「処理装置」の用語を用いて
も、ソフトウエアを実行できるもののみを意味するとは
限らない)。
を分かりやすくするため、この実施例を、個々の機能を
代表する機能ブロックから構成されるものとして述べる
(「処理装置」と名称を付けた機能ブロックを含む)。
これらのブロックが代表する機能は、兼用又は専用のい
ずれのハードウエアを用いても得ることができ、又これ
らのハードウエアにはソフトウエアを実行できるものを
含むがこれに限らない(「処理装置」の用語を用いて
も、ソフトウエアを実行できるもののみを意味するとは
限らない)。
【0021】実施例は、例えば、下に述べる作業を行う
AT&T社のDSP16又はDSP32Cのようなディ
ジタル信号処理装置(DSP)とソフトウエアとからな
る。又、大規模集積回路(VLSI)をハードウエアと
して用いた実施例及びハイブリッドDSP/VLSIを
用いた実施例についても述べる。
AT&T社のDSP16又はDSP32Cのようなディ
ジタル信号処理装置(DSP)とソフトウエアとからな
る。又、大規模集積回路(VLSI)をハードウエアと
して用いた実施例及びハイブリッドDSP/VLSIを
用いた実施例についても述べる。
【0022】図1は、本発明の実施例を組み込むのに有
用なシステムの全体ブロック図である。図1のシステム
は、図示のレベルにおいては、従来の技術において知ら
れているシステムの1例であるが、下に述べるシステム
の変更及び拡張によって、本発明を実施した場合の貢献
度が明確に理解されよう。
用なシステムの全体ブロック図である。図1のシステム
は、図示のレベルにおいては、従来の技術において知ら
れているシステムの1例であるが、下に述べるシステム
の変更及び拡張によって、本発明を実施した場合の貢献
度が明確に理解されよう。
【0023】図1において、アナログ可聴周波信号10
1が前処理装置102に供給され、ここでサンプリング
され(一般に48KHzにおいて)、標準的方法でディ
ジタルのパルス符号変調(PCM)信号103に変換さ
れる。このPCM信号103は、知覚的可聴周波符号器
(PAC)104に供給され、ここで圧縮され、被圧縮
PAC信号として通信チャンネル/記憶媒体106に出
力される。
1が前処理装置102に供給され、ここでサンプリング
され(一般に48KHzにおいて)、標準的方法でディ
ジタルのパルス符号変調(PCM)信号103に変換さ
れる。このPCM信号103は、知覚的可聴周波符号器
(PAC)104に供給され、ここで圧縮され、被圧縮
PAC信号として通信チャンネル/記憶媒体106に出
力される。
【0024】この被圧縮PAC信号は、通信チャンネル
/記憶媒体106から知覚的可聴周波復号器108に出
力され、ここで圧縮を解除され、この被圧縮PAC信号
に対応するPCM信号109として出力される。このP
CM信号109は、知覚的可聴周波復号器108から後
処理装置110に供給され、ここでPCM信号109を
アナログで表す信号が生成される。
/記憶媒体106から知覚的可聴周波復号器108に出
力され、ここで圧縮を解除され、この被圧縮PAC信号
に対応するPCM信号109として出力される。このP
CM信号109は、知覚的可聴周波復号器108から後
処理装置110に供給され、ここでPCM信号109を
アナログで表す信号が生成される。
【0025】図1中の知覚的可聴周波符号器104の実
施例をブロック図の形で図2に示す。図1のシステムの
場合と同様に、図2は、例えば前に触れたブランデンバ
ーグ他の米国特許第5,040,217号に開示されて
いるシステムのような、従来の技術による或るシステム
を図示するに過ぎないが、本発明に基づき下に述べる変
更及び拡張を行うことによって重要な新しい結果が得ら
れるのである。
施例をブロック図の形で図2に示す。図1のシステムの
場合と同様に、図2は、例えば前に触れたブランデンバ
ーグ他の米国特許第5,040,217号に開示されて
いるシステムのような、従来の技術による或るシステム
を図示するに過ぎないが、本発明に基づき下に述べる変
更及び拡張を行うことによって重要な新しい結果が得ら
れるのである。
【0026】図2の知覚的可聴周波符号器104は利点
として、分析フィルタバンク202、知覚的モデル処理
装置204、量子化器/レート制御ループ処理装置20
6、及びエントロピー符号器208からなる。
として、分析フィルタバンク202、知覚的モデル処理
装置204、量子化器/レート制御ループ処理装置20
6、及びエントロピー符号器208からなる。
【0027】図2の分析フィルタバンク202は、利点
として、信号処理利得(すなわち冗長性抽出)のいくつ
かの測定値とフィルタバンク入力のマッピングとの両方
が人間の知覚的システムから見て意味のある形で得られ
るような仕方で、入力可聴周波信号の時間及び周波数に
おける変換を行う。
として、信号処理利得(すなわち冗長性抽出)のいくつ
かの測定値とフィルタバンク入力のマッピングとの両方
が人間の知覚的システムから見て意味のある形で得られ
るような仕方で、入力可聴周波信号の時間及び周波数に
おける変換を行う。
【0028】又、利点として、入力信号のこのような変
換を行うのに、例えばプリンセン(J.P.Princen)及び
ブラッドレー(A.B.Bradley)の論文「時間領域エイリ
アシング消去に基づく分析/合成フィルタバンク設計」
(IEEE論文集、ASSP、第34巻、第5号、19
68年10月)に述べられている周知の「修正離散コサ
イン変換(MDCT)」を用いている。
換を行うのに、例えばプリンセン(J.P.Princen)及び
ブラッドレー(A.B.Bradley)の論文「時間領域エイリ
アシング消去に基づく分析/合成フィルタバンク設計」
(IEEE論文集、ASSP、第34巻、第5号、19
68年10月)に述べられている周知の「修正離散コサ
イン変換(MDCT)」を用いている。
【0029】本発明において有用なMDCTの特徴の1
つは、臨界サンプリング特性、すなわち、フィルタバン
クに投入されるn個のサンプルごとにn個のサンプルが
フィルタバンクから得られるという特性である。
つは、臨界サンプリング特性、すなわち、フィルタバン
クに投入されるn個のサンプルごとにn個のサンプルが
フィルタバンクから得られるという特性である。
【0030】これに加えて、MDCTでは一般に、半オ
ーバラップが得られる。すなわち、変換長さが、フィル
タバンクにシフトされたサンプルの個数nの長さの、正
確に2倍である。半オーバラップによって、各フィルタ
タップに個々に注入される雑音の制御処理方法及び分析
ウィンドウ周波数応答が得られる。更に、量子化がない
場合、MDCTによって入力サンプルの正確な再構築が
可能であり、その場合の不具合点は、整数サンプルの遅
れがあり得ることのみである。
ーバラップが得られる。すなわち、変換長さが、フィル
タバンクにシフトされたサンプルの個数nの長さの、正
確に2倍である。半オーバラップによって、各フィルタ
タップに個々に注入される雑音の制御処理方法及び分析
ウィンドウ周波数応答が得られる。更に、量子化がない
場合、MDCTによって入力サンプルの正確な再構築が
可能であり、その場合の不具合点は、整数サンプルの遅
れがあり得ることのみである。
【0031】又、本発明の一態様においては、利点とし
て、MDCTに変更を加え高効率のステレオ可聴周波符
号器に接続して用いられるようにすることができ、その
際には、極めて非静止的な構成要素を有する信号セクシ
ョンについての分析ウィンドウの長さを、臨界サンプル
と正確な再構築についての特性とが維持されるような仕
方で切り替える能力が付与される。
て、MDCTに変更を加え高効率のステレオ可聴周波符
号器に接続して用いられるようにすることができ、その
際には、極めて非静止的な構成要素を有する信号セクシ
ョンについての分析ウィンドウの長さを、臨界サンプル
と正確な再構築についての特性とが維持されるような仕
方で切り替える能力が付与される。
【0032】図2の分析フィルタバンク202の機能を
実行するのに適したフィルタバンクの説明が、本出願に
関連する、フェレイラ(A.Ferreira)及びジョンストン
(J.D.Johnston)の米国特許出願「可聴周波信号の知覚
的符号化の方法及び装置」(以下、「フィルタバンク出
願」という)に記載されている。
実行するのに適したフィルタバンクの説明が、本出願に
関連する、フェレイラ(A.Ferreira)及びジョンストン
(J.D.Johnston)の米国特許出願「可聴周波信号の知覚
的符号化の方法及び装置」(以下、「フィルタバンク出
願」という)に記載されている。
【0033】図2の知覚的モデル処理装置204は、知
覚的重要性、雑音マスキング特性、又は単に、分析バン
クにおける種々の信号構成要素のちょうど気付く程度の
雑音床の推定値を計算する。そして、これらの量を表す
信号は、他のシステム要素に供給され、これによりフィ
ルタ作業の制御が改善され、通信チャンネル又は記憶媒
体に送られるデ−タが用意される。
覚的重要性、雑音マスキング特性、又は単に、分析バン
クにおける種々の信号構成要素のちょうど気付く程度の
雑音床の推定値を計算する。そして、これらの量を表す
信号は、他のシステム要素に供給され、これによりフィ
ルタ作業の制御が改善され、通信チャンネル又は記憶媒
体に送られるデ−タが用意される。
【0034】本発明の実施例においては、ジョンストン
(Johnston)の論文「知覚的雑音基準を用いた、可聴周
波信号の変換符号化」(IEEE、J.S.C.A.第
6巻、第2号、1988年2月)に記載されている「臨
界帯域ごとの分析」を用いるのではなく、しきい値の計
算においてより細かい周波数分割を用いるので有利であ
る。
(Johnston)の論文「知覚的雑音基準を用いた、可聴周
波信号の変換符号化」(IEEE、J.S.C.A.第
6巻、第2号、1988年2月)に記載されている「臨
界帯域ごとの分析」を用いるのではなく、しきい値の計
算においてより細かい周波数分割を用いるので有利であ
る。
【0035】すなわち、上記ジョンストン論文に記載の
全体的トーン性測定基準を用いる代わりに、ブランデン
バーグ(K.Brandenburg)及びジョンストン(J.D.Johns
ton)の論文「第2世代の知覚的可聴周波符号化:ハイ
ブリッド符号器」(AES第89回年次総会、1990
年)の記述に基づくトーン性測定方法によれば、周波数
によって変動するトーン性推定値が得られるので、複素
信号に、よりよく適合する。
全体的トーン性測定基準を用いる代わりに、ブランデン
バーグ(K.Brandenburg)及びジョンストン(J.D.Johns
ton)の論文「第2世代の知覚的可聴周波符号化:ハイ
ブリッド符号器」(AES第89回年次総会、1990
年)の記述に基づくトーン性測定方法によれば、周波数
によって変動するトーン性推定値が得られるので、複素
信号に、よりよく適合する。
【0036】知覚的モデル処理装置204において行わ
れる音響心理学的分析によって、通常のMDCTウィン
ドウ及びより小さいウィンドウについて、左(L)、右
(R)、和(M)、及び差(S)の各チャンネルそれぞ
れに対応する雑音しきい値が得られる。より小さいウィ
ンドウの使用については、この音響心理学的なモデル処
理装置によって全体的に制御されるので有利である。
れる音響心理学的分析によって、通常のMDCTウィン
ドウ及びより小さいウィンドウについて、左(L)、右
(R)、和(M)、及び差(S)の各チャンネルそれぞ
れに対応する雑音しきい値が得られる。より小さいウィ
ンドウの使用については、この音響心理学的なモデル処
理装置によって全体的に制御されるので有利である。
【0037】実際の処理プロセスにおいて、実施例の知
覚的モデル処理装置204は、左及び右のチャンネルに
ついてのしきい値(それぞれ、THRL、THRRとす
る)を求める。次にこれらのしきい値は、実施例では3
5個の符号器周波数区分(アクティブウィンドウに切り
替えられたブロックの場合には56個の区分)の各々に
おいて比較される。
覚的モデル処理装置204は、左及び右のチャンネルに
ついてのしきい値(それぞれ、THRL、THRRとす
る)を求める。次にこれらのしきい値は、実施例では3
5個の符号器周波数区分(アクティブウィンドウに切り
替えられたブロックの場合には56個の区分)の各々に
おいて比較される。
【0038】これら2つのしきい値の左右間の変動値が
或る値(一般に2dB)より小さいような区分の各々に
おいて符号器は、和差(M/S)モードに切り替えられ
る。すなわち、その周波数帯域についての左の信号L
が、M=(L+R)/2に、又右の信号RがS=(L−
R)/2に、それぞれ置き換えられる。この置換を起動
させる実際の差の量は、ビットレート制約及びその他の
システムパラメータによって変動する。
或る値(一般に2dB)より小さいような区分の各々に
おいて符号器は、和差(M/S)モードに切り替えられ
る。すなわち、その周波数帯域についての左の信号L
が、M=(L+R)/2に、又右の信号RがS=(L−
R)/2に、それぞれ置き換えられる。この置換を起動
させる実際の差の量は、ビットレート制約及びその他の
システムパラメータによって変動する。
【0039】L及びR信号のしきい値に用いられるしき
い値計算方法と同じ方法がM及びS信号のしきい値にも
用いられ、実際のM及びS信号についてしきい値が計算
される。まず第一に、基本的しきい値(それぞれBTH
RM、BTHRS)が計算される。次に、下に示すステッ
プによって、M及びS信号のステレオマスキング貢献値
が計算される。
い値計算方法と同じ方法がM及びS信号のしきい値にも
用いられ、実際のM及びS信号についてしきい値が計算
される。まず第一に、基本的しきい値(それぞれBTH
RM、BTHRS)が計算される。次に、下に示すステッ
プによって、M及びS信号のステレオマスキング貢献値
が計算される。
【0040】1.M及びSのしきい値の各々について、
追加のファクタが計算される。このファクタ(ML
DM、MLDS)は、拡散信号エネルギー(上記ジョンス
トン論文、上記ジョンストン及びブランデンバーグ論
文、及び上記ブランデンバーグ他の米国特許第5,04
0,217号から導かれる)に、図3に示すマスキング
レベル差ファクタを乗じて計算される。この計算で、第
2のレベル、すなわち、種々のソースにおいて示される
マスキングレベル差に基づき、M及びSチャンネルにお
ける周波数全域にわたっての雑音検出可能性のレベルが
計算される。
追加のファクタが計算される。このファクタ(ML
DM、MLDS)は、拡散信号エネルギー(上記ジョンス
トン論文、上記ジョンストン及びブランデンバーグ論
文、及び上記ブランデンバーグ他の米国特許第5,04
0,217号から導かれる)に、図3に示すマスキング
レベル差ファクタを乗じて計算される。この計算で、第
2のレベル、すなわち、種々のソースにおいて示される
マスキングレベル差に基づき、M及びSチャンネルにお
ける周波数全域にわたっての雑音検出可能性のレベルが
計算される。
【0041】2.和信号(すなわちM信号)についての
実際のしきい値(THRM)が、THRM=max(BT
HRM,min(BTHRS,MLDS))として、又、
差信号(すなわちS信号)についての実際のしきい値
(THRS)が、THRS=max(BTHRS,min
(BTHRM,MLDM))として計算される。
実際のしきい値(THRM)が、THRM=max(BT
HRM,min(BTHRS,MLDS))として、又、
差信号(すなわちS信号)についての実際のしきい値
(THRS)が、THRS=max(BTHRS,min
(BTHRM,MLDM))として計算される。
【0042】結果として、ステレオで非マスキングの可
能性ある場合には、MLD信号がBT信号の代わりとな
る。L及びRしきい値が等しいと判っているので、L及
びRしきい値が等しくないことによるM及びSしきい値
低下の問題を考慮する必要はない。
能性ある場合には、MLD信号がBT信号の代わりとな
る。L及びRしきい値が等しいと判っているので、L及
びRしきい値が等しくないことによるM及びSしきい値
低下の問題を考慮する必要はない。
【0043】図2の知覚的可聴周波符号器104に用い
られる量子化器/レート制御ループ処理装置206は、
分析フィルタバンク202及び知覚的モデル処理装置2
04からの出力を受けて、与えられた用途についてのビ
ットレート要求値を満足させるように、ビット及び雑音
を割り当て、他のシステムパラメータを制御する。いく
つかの符号器の例においては、この符号206の装置は
量子化器のみからなり、したがって、ビットレートには
っきりと注意を払わなくても知覚的モデルの、ちょうど
気付く程度の差を超えることは決してない。
られる量子化器/レート制御ループ処理装置206は、
分析フィルタバンク202及び知覚的モデル処理装置2
04からの出力を受けて、与えられた用途についてのビ
ットレート要求値を満足させるように、ビット及び雑音
を割り当て、他のシステムパラメータを制御する。いく
つかの符号器の例においては、この符号206の装置は
量子化器のみからなり、したがって、ビットレートには
っきりと注意を払わなくても知覚的モデルの、ちょうど
気付く程度の差を超えることは決してない。
【0044】又、符号器によっては、この符号206の
装置は繰り返しループの複合装置からなり、この複合装
置においてビットレートと符号化雑音との間のバランス
を得るために歪及びビットレートが調整される。特に有
用な量子化器/レート制御処理装置が、本出願の原米国
出願と同日に米国出願されたジョンストン(J.D.Johnst
on)の「知覚的符号器/復号器用レートループ処理装
置」(以下、レートループ出願という)に述べられてい
る。
装置は繰り返しループの複合装置からなり、この複合装
置においてビットレートと符号化雑音との間のバランス
を得るために歪及びビットレートが調整される。特に有
用な量子化器/レート制御処理装置が、本出願の原米国
出願と同日に米国出願されたジョンストン(J.D.Johnst
on)の「知覚的符号器/復号器用レートループ処理装
置」(以下、レートループ出願という)に述べられてい
る。
【0045】又、この符号206のレートループ処理装
置は、分析され量子化された信号、その他必要な側面情
報、挿入情報、及び枠組み情報の受信機能(上記のレー
トループ出願に述べられている)を備えることが望まし
い。これらの機能については、上記ブランデンバーグ他
の米国特許第5,040,217号に概略が述べられて
いる。
置は、分析され量子化された信号、その他必要な側面情
報、挿入情報、及び枠組み情報の受信機能(上記のレー
トループ出願に述べられている)を備えることが望まし
い。これらの機能については、上記ブランデンバーグ他
の米国特許第5,040,217号に概略が述べられて
いる。
【0046】次に、エントロピー符号器208は、レー
ト制御処理装置206と協力して更に無雑音の圧縮を行
うために用いられる。特に、本発明の一態様において
は、エントロピー符号器208は、量子化器/レート制
御ループ処理装置206からの出力である量子化された
可聴周波信号を含む入力を受信し、この量子化された可
聴周波信号について無損失の符号化を行い、圧縮された
可聴周波信号を通信チャンネル/記憶媒体106に出力
するので有利である。
ト制御処理装置206と協力して更に無雑音の圧縮を行
うために用いられる。特に、本発明の一態様において
は、エントロピー符号器208は、量子化器/レート制
御ループ処理装置206からの出力である量子化された
可聴周波信号を含む入力を受信し、この量子化された可
聴周波信号について無損失の符号化を行い、圧縮された
可聴周波信号を通信チャンネル/記憶媒体106に出力
するので有利である。
【0047】本実施例のエントロピー符号器208に
は、利点として、量子化された可聴周波信号の各々を符
号化するために冗長性の最小なハフマン符号化技術を新
たに変化させた技術が用いられている。ハフマン符号に
ついては、例えばハフマン(D.A.Huffman)の論文「最
小冗長性符号の構築方法」(IRE論文集、40:10
98−1101、(1952年))並びに、カバー(T.
M.Cover)及びトーマス(J.A.Thomas)著「情報理論の
要素」92〜101ページ(1991年刊)に述べられ
ている。
は、利点として、量子化された可聴周波信号の各々を符
号化するために冗長性の最小なハフマン符号化技術を新
たに変化させた技術が用いられている。ハフマン符号に
ついては、例えばハフマン(D.A.Huffman)の論文「最
小冗長性符号の構築方法」(IRE論文集、40:10
98−1101、(1952年))並びに、カバー(T.
M.Cover)及びトーマス(J.A.Thomas)著「情報理論の
要素」92〜101ページ(1991年刊)に述べられ
ている。
【0048】又、図2の符号器に関連して利点として用
いられているハフマン符号の有用な適用例が、本出願の
原米国出願と同日に米国出願されたジョンストン(J.D.
Johnston)及びリード(J.Reed)の「エントロピー符号
器」(以下、エントロピー符号器出願という)により詳
細に述べられている。デ−タ通信技術の当業者には、周
知のレンペル−ジブ(Lempel-Ziv)圧縮方法を含む他の
無雑音デ−タ圧縮技術を用いたエントロピー符号器20
8の別の実施例の実現方法について容易に察知できよ
う。
いられているハフマン符号の有用な適用例が、本出願の
原米国出願と同日に米国出願されたジョンストン(J.D.
Johnston)及びリード(J.Reed)の「エントロピー符号
器」(以下、エントロピー符号器出願という)により詳
細に述べられている。デ−タ通信技術の当業者には、周
知のレンペル−ジブ(Lempel-Ziv)圧縮方法を含む他の
無雑音デ−タ圧縮技術を用いたエントロピー符号器20
8の別の実施例の実現方法について容易に察知できよ
う。
【0049】図2に示す各要素の用法については、全体
のシステム機能との関連において更に詳細に説明する。
又、知覚的モデル処理装置204の動作の詳細について
も下に述べる。
のシステム機能との関連において更に詳細に説明する。
又、知覚的モデル処理装置204の動作の詳細について
も下に述べる。
【0050】(2.1分析フィルタバンク)知覚的可聴
周波符号器104の分析フィルタバンク202は、入力
としてパルス符号変調(PCM)ディジタル可聴周波信
号(一般には、48KHzでサンプリングされた16ビ
ット信号)を受信し、入力信号の個々の周波数構成要素
を識別特定するような、入力信号に対応する信号を出力
する。詳しくいえば、分析フィルタバンク202の出力
は、入力の修正離散コサイン変換(MDCT)からな
る。
周波符号器104の分析フィルタバンク202は、入力
としてパルス符号変調(PCM)ディジタル可聴周波信
号(一般には、48KHzでサンプリングされた16ビ
ット信号)を受信し、入力信号の個々の周波数構成要素
を識別特定するような、入力信号に対応する信号を出力
する。詳しくいえば、分析フィルタバンク202の出力
は、入力の修正離散コサイン変換(MDCT)からな
る。
【0051】これについては、プリンセン他(J.Prince
n et al.)の論文「時間領域エイリアシング消去に基づ
くフィルタバンクを用いたサブバンド変換符号化」(I
EEE、ICASSP、2161〜2164ページ、
(1987年))を参照されたい。
n et al.)の論文「時間領域エイリアシング消去に基づ
くフィルタバンクを用いたサブバンド変換符号化」(I
EEE、ICASSP、2161〜2164ページ、
(1987年))を参照されたい。
【0052】本発明の一態様に基づく分析フィルタバン
ク202の実施例を図4に示す。分析フィルタバンク2
02は、入力信号バッファ302、ウィンドウ掛算器3
04、ウィンドウメモリ306、FFT(高速フーリエ
変換)処理装置308、MDCT(修正離散コサイン変
換)処理装置310、連接器311、遅延メモリ31
2、及びデ−タ選択器314から構成される。
ク202の実施例を図4に示す。分析フィルタバンク2
02は、入力信号バッファ302、ウィンドウ掛算器3
04、ウィンドウメモリ306、FFT(高速フーリエ
変換)処理装置308、MDCT(修正離散コサイン変
換)処理装置310、連接器311、遅延メモリ31
2、及びデ−タ選択器314から構成される。
【0053】分析フィルタバンク202は、フレームに
対して作動する。1つのフレームは、入力信号バッファ
302に保持されている2N個のPCM入力可聴周波信
号サンプルとして選ぶのが便利である。上に述べたよう
に、各PCM入力可聴周波信号サンプルは、Mビットで
表される。例えばN=512、M=16、である。
対して作動する。1つのフレームは、入力信号バッファ
302に保持されている2N個のPCM入力可聴周波信
号サンプルとして選ぶのが便利である。上に述べたよう
に、各PCM入力可聴周波信号サンプルは、Mビットで
表される。例えばN=512、M=16、である。
【0054】入力信号バッファ302は、2つのセクシ
ョン、すなわちバッファ内の1からNまでの位置に存在
するN個のサンプルからなる第1のセクションと、バッ
ファ内のN+1から2Nまでの位置に存在するN個のサ
ンプルからなる第2のセクションとから構成される。知
覚的可聴周波符号器104によって符号化されることに
なる各フレームは、入力可聴周波信号の、互いに連続す
るN個のサンプルを入力信号バッファ302に移すこと
によって定義される。古い方のサンプルは、新しい方の
サンプルよりもより高いバッファ位置に配置される。
ョン、すなわちバッファ内の1からNまでの位置に存在
するN個のサンプルからなる第1のセクションと、バッ
ファ内のN+1から2Nまでの位置に存在するN個のサ
ンプルからなる第2のセクションとから構成される。知
覚的可聴周波符号器104によって符号化されることに
なる各フレームは、入力可聴周波信号の、互いに連続す
るN個のサンプルを入力信号バッファ302に移すこと
によって定義される。古い方のサンプルは、新しい方の
サンプルよりもより高いバッファ位置に配置される。
【0055】与えられた時点において入力信号バッファ
302が2N個の可聴周波信号サンプルからなる1つの
フレームを保持していると仮定すると、このフレームに
続くフレームは、次の2つのことによって得られる。
302が2N個の可聴周波信号サンプルからなる1つの
フレームを保持していると仮定すると、このフレームに
続くフレームは、次の2つのことによって得られる。
【0056】すなわち、(1)バッファ内の1からNま
での位置に存在するN個の可聴周波信号サンプルをバッ
ファ内のN+1から2Nまでの位置にそれぞれ移すこと
と(この場合、N+1から2Nまでの位置に前に存在し
ていた可聴周波信号サンプルは上書き又は削除され
る)、(2)前処理装置102からN個の新たな可聴周
波信号サンプルを、入力信号バッファ302内のバッフ
ァ内の1からNまでの位置に移すこととである。
での位置に存在するN個の可聴周波信号サンプルをバッ
ファ内のN+1から2Nまでの位置にそれぞれ移すこと
と(この場合、N+1から2Nまでの位置に前に存在し
ていた可聴周波信号サンプルは上書き又は削除され
る)、(2)前処理装置102からN個の新たな可聴周
波信号サンプルを、入力信号バッファ302内のバッフ
ァ内の1からNまでの位置に移すこととである。
【0057】したがって、互いに連続するフレームの有
するサンプルのうち、N個のサンプルは共通であること
が判る。すなわち、互いに連続する2個のフレームのう
ちの第1のフレームは、共通のサンプルをバッファ内の
1からNまでの位置に有し、同じく第2のフレームは、
共通のサンプルをバッファ内のN+1から2Nまでの位
置に有することになる。
するサンプルのうち、N個のサンプルは共通であること
が判る。すなわち、互いに連続する2個のフレームのう
ちの第1のフレームは、共通のサンプルをバッファ内の
1からNまでの位置に有し、同じく第2のフレームは、
共通のサンプルをバッファ内のN+1から2Nまでの位
置に有することになる。
【0058】分析フィルタバンク202は臨界サンプリ
ングシステムである(すなわち、入力信号バッファ30
2によって受信された可聴周波信号サンプルN個ごと
に、分析フィルタバンク202がN個のスカラー量から
なる1個のベクトルを量子化器/レート制御ループ処理
装置206に送る)。
ングシステムである(すなわち、入力信号バッファ30
2によって受信された可聴周波信号サンプルN個ごと
に、分析フィルタバンク202がN個のスカラー量から
なる1個のベクトルを量子化器/レート制御ループ処理
装置206に送る)。
【0059】入力可聴周波信号の各フレームが、入力信
号バッファ302によってウィンドウ掛算器304に供
給され、その結果、ウィンドウ掛算器304によって7
個の別個のデ−タウィンドウと各フレームとの間で掛け
算が行われる。
号バッファ302によってウィンドウ掛算器304に供
給され、その結果、ウィンドウ掛算器304によって7
個の別個のデ−タウィンドウと各フレームとの間で掛け
算が行われる。
【0060】各デ−タウィンドウは、「係数」と称する
スカラー量からなる1つのベクトルである。これら7個
のデ−タウィンドウの全てが2N個(すなわち、フレー
ム中に存在する可聴周波信号サンプルの数と同じ数)の
係数を有するのに対し、7個のうち4個のウィンドウの
みが(N/2)個(すなわち、フレーム中に存在する可
聴周波信号サンプルの数の1/4の数)の非ゼロ係数を
有する。下に説明するように、デ−タウィンドウ係数に
ついては、MDCT処理装置310の出力の知覚的エン
トロピーを減少させるように選ぶので有利である。
スカラー量からなる1つのベクトルである。これら7個
のデ−タウィンドウの全てが2N個(すなわち、フレー
ム中に存在する可聴周波信号サンプルの数と同じ数)の
係数を有するのに対し、7個のうち4個のウィンドウの
みが(N/2)個(すなわち、フレーム中に存在する可
聴周波信号サンプルの数の1/4の数)の非ゼロ係数を
有する。下に説明するように、デ−タウィンドウ係数に
ついては、MDCT処理装置310の出力の知覚的エン
トロピーを減少させるように選ぶので有利である。
【0061】デ−タウィンドウ係数についての情報は、
ウィンドウメモリ306に記憶される。ウィンドウメモ
リ306は例えば、ランダム・アクセス・メモリ(RA
M)、読みだし専用メモリ(ROM)、又は他の磁気的
又は光学的媒体からなる。ウィンドウ掛算器304によ
って掛け算を適用される7個のデ−タウィンドウの動き
の例を図4に示す。図4に示した7個のデ−タウィンド
ウの各々についての係数の一般的なベクトルを添付書A
に示す。図4及び添付書Aから判るように、デ−タウィ
ンドウ係数のいくつかはゼロに等しい。
ウィンドウメモリ306に記憶される。ウィンドウメモ
リ306は例えば、ランダム・アクセス・メモリ(RA
M)、読みだし専用メモリ(ROM)、又は他の磁気的
又は光学的媒体からなる。ウィンドウ掛算器304によ
って掛け算を適用される7個のデ−タウィンドウの動き
の例を図4に示す。図4に示した7個のデ−タウィンド
ウの各々についての係数の一般的なベクトルを添付書A
に示す。図4及び添付書Aから判るように、デ−タウィ
ンドウ係数のいくつかはゼロに等しい。
【0062】デ−タウィンドウが2N個のスカラー量か
らなるベクトルであることと、可聴周波信号フレームも
又2N個のスカラー量からなるベクトルであることとに
留意して、可聴周波信号フレームスカラー量にデ−タウ
ィンドウ係数を1対1の掛け合わせで(すなわち、第1
の可聴周波信号フレームスカラー量に第1のデ−タウィ
ンドウ係数を掛け、第2の可聴周波信号フレームスカラ
ー量に第2のデ−タウィンドウ係数を掛けるというよう
にして)掛け算を行う。
らなるベクトルであることと、可聴周波信号フレームも
又2N個のスカラー量からなるベクトルであることとに
留意して、可聴周波信号フレームスカラー量にデ−タウ
ィンドウ係数を1対1の掛け合わせで(すなわち、第1
の可聴周波信号フレームスカラー量に第1のデ−タウィ
ンドウ係数を掛け、第2の可聴周波信号フレームスカラ
ー量に第2のデ−タウィンドウ係数を掛けるというよう
にして)掛け算を行う。
【0063】したがって、ウィンドウ掛算器304は、
並行して演算する7個のマイクロプロセッサからなり、
各マイクロプロセッサは、入力信号バッファ302に保
持される可聴周波信号フレームに7個のデ−タウィンド
ウのうちの1個を適用するために2N回の掛け算を行
う。ウィンドウ掛算器304の出力は、2N個のスカラ
ー量の7個のベクトルからなり、これらのベクトルを、
以下、ウィンドウを掛け合わせたフレーム・ベクトル
(ウィンドウ・フレーム・ベクトル)という。
並行して演算する7個のマイクロプロセッサからなり、
各マイクロプロセッサは、入力信号バッファ302に保
持される可聴周波信号フレームに7個のデ−タウィンド
ウのうちの1個を適用するために2N回の掛け算を行
う。ウィンドウ掛算器304の出力は、2N個のスカラ
ー量の7個のベクトルからなり、これらのベクトルを、
以下、ウィンドウを掛け合わせたフレーム・ベクトル
(ウィンドウ・フレーム・ベクトル)という。
【0064】7個のウィンドウ・フレーム・ベクトル
は、ウィンドウ掛算器304によってFFT処理装置3
08に供給される。FFT処理装置308は、7個のウ
ィンドウ・フレーム・ベクトルの各々について奇数周波
数高速フーリエ変換(FFT)を行う。奇数周波数FF
Tは、周波数(kfH/2N)において行われる離散フ
ーリエ変換である。ここに、k=1,3,5,...,
2N、そして、fHはサンプリングレートの1/2に等
しい。
は、ウィンドウ掛算器304によってFFT処理装置3
08に供給される。FFT処理装置308は、7個のウ
ィンドウ・フレーム・ベクトルの各々について奇数周波
数高速フーリエ変換(FFT)を行う。奇数周波数FF
Tは、周波数(kfH/2N)において行われる離散フ
ーリエ変換である。ここに、k=1,3,5,...,
2N、そして、fHはサンプリングレートの1/2に等
しい。
【0065】実施例のFFT処理装置308は、並行し
て作動する7個の通常のデシメーション・イン・タイム
FFT処理装置からなり、各々が、異なるウィンドウ・
フレーム・ベクトルに対して作動する。FFT処理装置
308の出力は、2N個の複素成分からなる7個のベク
トルで、以下総称して、FFTベクトルという。
て作動する7個の通常のデシメーション・イン・タイム
FFT処理装置からなり、各々が、異なるウィンドウ・
フレーム・ベクトルに対して作動する。FFT処理装置
308の出力は、2N個の複素成分からなる7個のベク
トルで、以下総称して、FFTベクトルという。
【0066】FFT処理装置308は、7個のFFTベ
クトルを知覚的モデル処理装置204及びMDCT処理
装置310の両方に供給する。知覚的モデル処理装置2
04は、FFTベクトルを用いて、デ−タ選択器314
及び量子化器/レート制御ループ処理装置206の動作
に指示を与える。デ−タ選択器314及び知覚的モデル
処理装置204の動作の詳細については下に説明する。
クトルを知覚的モデル処理装置204及びMDCT処理
装置310の両方に供給する。知覚的モデル処理装置2
04は、FFTベクトルを用いて、デ−タ選択器314
及び量子化器/レート制御ループ処理装置206の動作
に指示を与える。デ−タ選択器314及び知覚的モデル
処理装置204の動作の詳細については下に説明する。
【0067】MDCT処理装置310は、FFT処理装
置308から受信した7個のFFTベクトルの各々の実
数成分に基づいて、MDCT(修正離散コサイン変換)
を行う。MDCT処理装置310は、並行して作動する
7個のマイクロプロセッサからなる。これらのマイクロ
プロセッサは各々、7個のFFTベクトルの1つに基づ
いてN個の実数スカラー量の7個のMDCTベクトルの
1つを定める。
置308から受信した7個のFFTベクトルの各々の実
数成分に基づいて、MDCT(修正離散コサイン変換)
を行う。MDCT処理装置310は、並行して作動する
7個のマイクロプロセッサからなる。これらのマイクロ
プロセッサは各々、7個のFFTベクトルの1つに基づ
いてN個の実数スカラー量の7個のMDCTベクトルの
1つを定める。
【0068】各FFTベクトル、F(k)について、結
果として得られるMDCTベクトル、X(k)は、次の
数式によって表される。 X(k)=Re[F(k)]cos[π(2k+1)
(1+N)/4N] ここに、1≦k≦N、である。
果として得られるMDCTベクトル、X(k)は、次の
数式によって表される。 X(k)=Re[F(k)]cos[π(2k+1)
(1+N)/4N] ここに、1≦k≦N、である。
【0069】この計算手順においては、結果の冗長性か
ら、kは2Nまでの必要はなく、Nまでとればよい。す
なわち、N≦k≦2N、に対しては、次の数式となる。 X(k)= −X(2N−k) MDCT処理装置310は、7個のMDCTベクトルを
連接器311及び遅延メモリ312に供給する。
ら、kは2Nまでの必要はなく、Nまでとればよい。す
なわち、N≦k≦2N、に対しては、次の数式となる。 X(k)= −X(2N−k) MDCT処理装置310は、7個のMDCTベクトルを
連接器311及び遅延メモリ312に供給する。
【0070】ウィンドウ掛算器304に関連して上に述
べたように、7個のデ−タウィンドウのうちの4個は、
(N/2)個のの非ゼロ係数を有する(図14(C)〜
図14(F)参照)。このことは、ウィンドウ・フレー
ム・ベクトルのうちの4個が(N/2)の非ゼロ係数の
みを有することを意味する。
べたように、7個のデ−タウィンドウのうちの4個は、
(N/2)個のの非ゼロ係数を有する(図14(C)〜
図14(F)参照)。このことは、ウィンドウ・フレー
ム・ベクトルのうちの4個が(N/2)の非ゼロ係数の
みを有することを意味する。
【0071】したがって、これら4個のベクトルの非ゼ
ロ値は、MDCT処理装置310から出力した後に、連
接器311を用いて連接することにより長さ2Nの1個
のベクトルになる。そして、これらのベクトルは、この
ように連接した結果、以後のプロセスでは1個のベクト
ルとして用いられる。すなわち、遅延メモリ312に
は、7個の代わりに4個のMDCTベクトルが供給され
る。
ロ値は、MDCT処理装置310から出力した後に、連
接器311を用いて連接することにより長さ2Nの1個
のベクトルになる。そして、これらのベクトルは、この
ように連接した結果、以後のプロセスでは1個のベクト
ルとして用いられる。すなわち、遅延メモリ312に
は、7個の代わりに4個のMDCTベクトルが供給され
る。
【0072】遅延メモリ312は、MDCT処理装置3
10と連接器311とから4個のMDCTベクトルを受
信し、一時的に記憶する。又、遅延メモリ312は、分
析フィルタバンク202内で、上記4個のMDCTベク
トルの流れについて可聴周波信号フレーム(入力信号バ
ッファによって定義されたフレーム)1個を遅延させ
る。
10と連接器311とから4個のMDCTベクトルを受
信し、一時的に記憶する。又、遅延メモリ312は、分
析フィルタバンク202内で、上記4個のMDCTベク
トルの流れについて可聴周波信号フレーム(入力信号バ
ッファによって定義されたフレーム)1個を遅延させ
る。
【0073】この遅延は、(i)互いに連続する可聴周
波信号フレームを表すMDCTベクトルの最も最近の互
いに連続する2セットを記憶することと、(ii)これ
ら互いに連続する2つのベクトルセットのうちの古い方
のセットをデ−タ選択器314に入力として供給するこ
ととによって行われる。遅延メモリ312は、M×2×
4×Nの大きさのRAMからなる。
波信号フレームを表すMDCTベクトルの最も最近の互
いに連続する2セットを記憶することと、(ii)これ
ら互いに連続する2つのベクトルセットのうちの古い方
のセットをデ−タ選択器314に入力として供給するこ
ととによって行われる。遅延メモリ312は、M×2×
4×Nの大きさのRAMからなる。
【0074】ここに、2は互いに連続するベクトルセッ
トの数、4は1つのセット中のベクトルの数、Nは1つ
のMDCTベクトル中の成分の数、そしてMは1つのM
DCTベクトル成分を表すのに用いられるビット数であ
る。
トの数、4は1つのセット中のベクトルの数、Nは1つ
のMDCTベクトル中の成分の数、そしてMは1つのM
DCTベクトル成分を表すのに用いられるビット数であ
る。
【0075】デ−タ選択器314は、遅延メモリ312
から供給された4個のMDCTベクトルのうちから1個
を選択して、分析フィルタバンク202の出力として量
子化器/レート制御ループ処理装置206に送る。上に
述べたように、知覚的モデル処理装置204は、FFT
処理装置308から供給されたFFTベクトルに基づい
て、デ−タ選択器314の動作に指示を与える。
から供給された4個のMDCTベクトルのうちから1個
を選択して、分析フィルタバンク202の出力として量
子化器/レート制御ループ処理装置206に送る。上に
述べたように、知覚的モデル処理装置204は、FFT
処理装置308から供給されたFFTベクトルに基づい
て、デ−タ選択器314の動作に指示を与える。
【0076】遅延メモリ312の遅延動作から、知覚的
モデル処理装置204に供給された7個のMDCTベク
トルと今デ−タ選択器314に供給された4個のMDC
Tベクトルとは、同一の可聴周波入力フレームに基づく
のではなく、2つの互いに連続する入力信号フレームに
基づくことになり、ベクトルとしては、これら2つのフ
レームのうちの前の方のフレームに基づくMDCTベク
トル及び同じく後の方のフレームに基づくFFTベクト
ルということになる。
モデル処理装置204に供給された7個のMDCTベク
トルと今デ−タ選択器314に供給された4個のMDC
Tベクトルとは、同一の可聴周波入力フレームに基づく
のではなく、2つの互いに連続する入力信号フレームに
基づくことになり、ベクトルとしては、これら2つのフ
レームのうちの前の方のフレームに基づくMDCTベク
トル及び同じく後の方のフレームに基づくFFTベクト
ルということになる。
【0077】したがって、特定のMDCTベクトルの選
択は、次に続く可聴周波信号フレームにある情報に基づ
いて行われる。知覚的モデル処理装置204がMDCT
ベクトルの選択を指示する基準については、次の[知覚
的モデル処理装置]説明の項で述べる。
択は、次に続く可聴周波信号フレームにある情報に基づ
いて行われる。知覚的モデル処理装置204がMDCT
ベクトルの選択を指示する基準については、次の[知覚
的モデル処理装置]説明の項で述べる。
【0078】ステレオ実施例の説明の便宜上、上記の分
析フィルタバンク202は左右量チャンネルの各々に設
けるものとする。
析フィルタバンク202は左右量チャンネルの各々に設
けるものとする。
【0079】(2.2知覚的モデル処理装置)知覚的符
号器は、高品質可聴周波信号を正確に表すのに必要なビ
ット数を減少させるように作動する。この減少効果は、
部分的には、分析フィルタバンク202から得られるM
DCT情報信号のような、情報を包含する信号の量子化
に付随する雑音を導入することによって達成される。も
ちろん、目標はこの雑音を知覚できない方法又は無害な
方法で導入することにある。
号器は、高品質可聴周波信号を正確に表すのに必要なビ
ット数を減少させるように作動する。この減少効果は、
部分的には、分析フィルタバンク202から得られるM
DCT情報信号のような、情報を包含する信号の量子化
に付随する雑音を導入することによって達成される。も
ちろん、目標はこの雑音を知覚できない方法又は無害な
方法で導入することにある。
【0080】この雑音形成は本来、周波数分析手段であ
るので、次のプロセスが便利である。すなわち、信号を
スペクトル的表現(例えば、分析フィルタバンク202
から得られるMDCTベクトル)に変換し、これらの信
号によってマスキングされる雑音の形状と量とを計算
し、スペクトル値を量子化することによって雑音を注入
するプロセスである。これらの動作は、図2に示す知覚
的符号器の構成の中で行われる。
るので、次のプロセスが便利である。すなわち、信号を
スペクトル的表現(例えば、分析フィルタバンク202
から得られるMDCTベクトル)に変換し、これらの信
号によってマスキングされる雑音の形状と量とを計算
し、スペクトル値を量子化することによって雑音を注入
するプロセスである。これらの動作は、図2に示す知覚
的符号器の構成の中で行われる。
【0081】本実施例において、知覚的可聴周波符号器
104の知覚的モデル処理装置204は、連続するフレ
ームについて作動する分析フィルタバンク202から入
力信号を受信する。知覚的モデル処理装置204の入力
は一般に、分析フィルタバンク202からの7個のFF
T(高速フーリエ変換)ベクトルからなる。これらは、
FFT処理装置308からの出力で、2N個の複素成分
から構成され、各々ウィンドウフレームベクトルの1つ
に対応する7個のベクトルの形を取るベクトルである。
104の知覚的モデル処理装置204は、連続するフレ
ームについて作動する分析フィルタバンク202から入
力信号を受信する。知覚的モデル処理装置204の入力
は一般に、分析フィルタバンク202からの7個のFF
T(高速フーリエ変換)ベクトルからなる。これらは、
FFT処理装置308からの出力で、2N個の複素成分
から構成され、各々ウィンドウフレームベクトルの1つ
に対応する7個のベクトルの形を取るベクトルである。
【0082】量子化雑音を信号によってマスキングする
ためには、信号のスペクトル的内容と信号の特定のスペ
クトルパタ−ンの持続時間とを考慮する必要がある。こ
れら2つのファクタは、聴覚系の統合期間が与えられた
場合に信号と雑音とがほぼ定常状態にあるような周波数
領域におけるマスキングに関連し、又、信号と雑音とが
異なる蝸牛フィルタに当てられるような時間領域におけ
るマスキングに関連する。これらのフィルタの形状及び
長さは、周波数によって決まる。
ためには、信号のスペクトル的内容と信号の特定のスペ
クトルパタ−ンの持続時間とを考慮する必要がある。こ
れら2つのファクタは、聴覚系の統合期間が与えられた
場合に信号と雑音とがほぼ定常状態にあるような周波数
領域におけるマスキングに関連し、又、信号と雑音とが
異なる蝸牛フィルタに当てられるような時間領域におけ
るマスキングに関連する。これらのフィルタの形状及び
長さは、周波数によって決まる。
【0083】周波数領域におけるマスキングは、「同時
マスキング」の概念で、又、時間領域におけるマスキン
グは、「マスキング前」特性及び「マスキング後」特性
の概念で、それぞれ説明される。これらの概念について
は、例えば、ツビッカー(E.Zwicker)及びファストル
(H.Fastl)著「音響心理学、その実際及びモデル」
(シュプリンガー出版社1990年)等の文献に詳細に
わたって述べられている。これらの概念を知覚的符号化
に有益に用いるため、異なるいくつかの実施例が考慮さ
れた。
マスキング」の概念で、又、時間領域におけるマスキン
グは、「マスキング前」特性及び「マスキング後」特性
の概念で、それぞれ説明される。これらの概念について
は、例えば、ツビッカー(E.Zwicker)及びファストル
(H.Fastl)著「音響心理学、その実際及びモデル」
(シュプリンガー出版社1990年)等の文献に詳細に
わたって述べられている。これらの概念を知覚的符号化
に有益に用いるため、異なるいくつかの実施例が考慮さ
れた。
【0084】「同時マスキング」の評価は、知覚的雑音
形成モデルを用いることによって行われる。信号のスペ
クトル的内容と、雑音に似た、又はトーンに似た挙動に
関しての記述とを与えらると、これらのモデルによっ
て、各スペクトル成分の量子化レベルを定める仮定マス
キングしきい値が生成される。この雑音形成は、知覚で
きる程の差を生じさせずに元の信号に導入できる最大雑
音量を表す。
形成モデルを用いることによって行われる。信号のスペ
クトル的内容と、雑音に似た、又はトーンに似た挙動に
関しての記述とを与えらると、これらのモデルによっ
て、各スペクトル成分の量子化レベルを定める仮定マス
キングしきい値が生成される。この雑音形成は、知覚で
きる程の差を生じさせずに元の信号に導入できる最大雑
音量を表す。
【0085】知覚的エントロピー(PE)と称する測定
法では、この仮定マスキングしきい値を用いて即応的
(トランスパレント)符号化についてのビットレートの
理論的下限値を推定する。(ジョンストン(J.D.Johnst
on)の論文「雑音マスキング基準を用いての知覚的エン
トロピーの推定」(ICASSP、1989年)
法では、この仮定マスキングしきい値を用いて即応的
(トランスパレント)符号化についてのビットレートの
理論的下限値を推定する。(ジョンストン(J.D.Johnst
on)の論文「雑音マスキング基準を用いての知覚的エン
トロピーの推定」(ICASSP、1989年)
【0086】「マスキング前」特性は、雑音より大きな
マスキング信号よりも少し前に始まるこの雑音が聞こえ
るかどうかを表す。雑音の振幅は、遅延が増加するにつ
れてより減衰させる必要がある。この減衰レベルも周波
数によって決まる。もしこの雑音が合成ウィンドウの前
半によって減衰された量子化雑音の場合、最大許容遅延
時間は約1msであることが実験的に判っている。
マスキング信号よりも少し前に始まるこの雑音が聞こえ
るかどうかを表す。雑音の振幅は、遅延が増加するにつ
れてより減衰させる必要がある。この減衰レベルも周波
数によって決まる。もしこの雑音が合成ウィンドウの前
半によって減衰された量子化雑音の場合、最大許容遅延
時間は約1msであることが実験的に判っている。
【0087】この問題は非常に微妙で、良好な符号化利
得を得ることと直接衝突する。静止的条件を仮定すると
(これは事実に反する前提であるが)、符号化利得は、
より大きな変換に対してより大きくなるが、量子化誤差
は、再生された時間セグメントが始まるまで拡散する。
したがって、もし、48000Hzのレートでサンプリ
ングされたディジタル信号について1024サンプル相
当の変換長さが用いられる場合には、雑音は、信号に先
立つこと多くとも21msの時点に現れることになる。
得を得ることと直接衝突する。静止的条件を仮定すると
(これは事実に反する前提であるが)、符号化利得は、
より大きな変換に対してより大きくなるが、量子化誤差
は、再生された時間セグメントが始まるまで拡散する。
したがって、もし、48000Hzのレートでサンプリ
ングされたディジタル信号について1024サンプル相
当の変換長さが用いられる場合には、雑音は、信号に先
立つこと多くとも21msの時点に現れることになる。
【0088】このシナリオは、信号が、時間領域内での
鋭い過渡現象の形(普通、アタックとして知られる)を
取る場合に、特に不安定である。この場合、量子化雑音
は、アタックよりも前に聞こえる。この効果は、プリエ
コーとして知られている。
鋭い過渡現象の形(普通、アタックとして知られる)を
取る場合に、特に不安定である。この場合、量子化雑音
は、アタックよりも前に聞こえる。この効果は、プリエ
コーとして知られている。
【0089】このように、固定長さのフィルタバンク
は、信号の非静止的領域にとって、良好な知覚的解でも
なく信号処理解でもない。この問題を避けることが可能
な方法の1つが、分析/合成ウィンドウ長さを減少させ
ることによって符号器の時間的分割を改善することであ
ることを後に述べる。これは、アタックの状況が検出さ
れた場合に、ウィンドウ切り替えメカニズムとして実現
される。
は、信号の非静止的領域にとって、良好な知覚的解でも
なく信号処理解でもない。この問題を避けることが可能
な方法の1つが、分析/合成ウィンドウ長さを減少させ
ることによって符号器の時間的分割を改善することであ
ることを後に述べる。これは、アタックの状況が検出さ
れた場合に、ウィンドウ切り替えメカニズムとして実現
される。
【0090】このように、大きい分析/合成ウィンドウ
を用いて得られる符号化利得は、この検出の結果として
小さい方の分析/合成ウィンドウに切り替える必要があ
るような場合にのみ影響を受ける。
を用いて得られる符号化利得は、この検出の結果として
小さい方の分析/合成ウィンドウに切り替える必要があ
るような場合にのみ影響を受ける。
【0091】「マスキング後」特性は、より強いマスキ
ング信号が終止した後に雑音が残る場合にこの雑音が聞
こえるかどうかを表す。この場合、許容遅延時間は20
msのオーダーである。大きい方の変換された時間セグ
メントが21ms(1024サンプル)続くとした場
合、この状態の取り扱いに特に注意する必要はない。
ング信号が終止した後に雑音が残る場合にこの雑音が聞
こえるかどうかを表す。この場合、許容遅延時間は20
msのオーダーである。大きい方の変換された時間セグ
メントが21ms(1024サンプル)続くとした場
合、この状態の取り扱いに特に注意する必要はない。
【0092】[ウィンドウ切り替え]特定の変換セグメ
ントの知覚的エントロピー(PE)測定によって、その
セグメントを即応的に符号化するためのビット/サンプ
ルの理論的下限が得られる。マスキング前の保護に関連
するメモリ特性のため、この測定からは、信号の強い非
静止的状態(例えば、アタック)が発生した場合、PE
値に、前の値(前のセグメントに関連する)に対して顕
著な増加がみられる。
ントの知覚的エントロピー(PE)測定によって、その
セグメントを即応的に符号化するためのビット/サンプ
ルの理論的下限が得られる。マスキング前の保護に関連
するメモリ特性のため、この測定からは、信号の強い非
静止的状態(例えば、アタック)が発生した場合、PE
値に、前の値(前のセグメントに関連する)に対して顕
著な増加がみられる。
【0093】この重要な特性は、プリエコーを減少させ
るためにウィンドウ切り替えメカニズムを起動させるの
に用いられる。このウィンドウ切り替えメカニズムは、
新しい手法ではなく、例えば、ISO/MPEG可聴周
波符号化報告(1990年)に述べられているASPE
C符号器にも用いられているが、その背後の意思決定技
術は新しいもので、PE情報を用いることにより、非静
止状態を正確に定位し、切り替えを行う正しい時点を定
義することができる。
るためにウィンドウ切り替えメカニズムを起動させるの
に用いられる。このウィンドウ切り替えメカニズムは、
新しい手法ではなく、例えば、ISO/MPEG可聴周
波符号化報告(1990年)に述べられているASPE
C符号器にも用いられているが、その背後の意思決定技
術は新しいもので、PE情報を用いることにより、非静
止状態を正確に定位し、切り替えを行う正しい時点を定
義することができる。
【0094】2つの基本的なウィンドウ長さとして10
24個のサンプルと256個のサンプルとが用いられ
る。前者は約21msのセグメント持続長さに、又、後
者は約5msのセグメント持続長さにそれぞれ対応す
る。小ウィンドウは4個のセットとして1個の大ウィン
ドウと同量のデ−タを表す(但し、異なる数の時間的サ
ンプルを表す)。
24個のサンプルと256個のサンプルとが用いられ
る。前者は約21msのセグメント持続長さに、又、後
者は約5msのセグメント持続長さにそれぞれ対応す
る。小ウィンドウは4個のセットとして1個の大ウィン
ドウと同量のデ−タを表す(但し、異なる数の時間的サ
ンプルを表す)。
【0095】大ウィンドウから小ウィンドウへの、又は
その逆の移行を行うためには、更に2つの種類のウィン
ドウを用いるのが便利である。そのうちの、「スター
ト」ウィンドウは大ウィンドウ(通常のウィンドウ)か
ら小ウィンドウへの移行に、又「ストップ」ウィンドウ
はその逆の移行に用いられる(図5(B)参照)。これ
らについての有用な説明が、上に引用したプリンセン文
献に述べられている。
その逆の移行を行うためには、更に2つの種類のウィン
ドウを用いるのが便利である。そのうちの、「スター
ト」ウィンドウは大ウィンドウ(通常のウィンドウ)か
ら小ウィンドウへの移行に、又「ストップ」ウィンドウ
はその逆の移行に用いられる(図5(B)参照)。これ
らについての有用な説明が、上に引用したプリンセン文
献に述べられている。
【0096】これら2つの追加ウィンドウは、いずれも
1024個のサンプルに対応する大きさを有する。これ
らの追加ウィンドウは、信号を臨界サンプリングの状態
に保つのにも、又、移行領域で時間領域エイリアシング
消去を保証するのにも有用である。
1024個のサンプルに対応する大きさを有する。これ
らの追加ウィンドウは、信号を臨界サンプリングの状態
に保つのにも、又、移行領域で時間領域エイリアシング
消去を保証するのにも有用である。
【0097】チャンネル相互間の冗長性及び非関連性を
活用するために、各セグメントにおいて左右両チャンネ
ルについて同じ形式のウィンドウが用いられる。
活用するために、各セグメントにおいて左右両チャンネ
ルについて同じ形式のウィンドウが用いられる。
【0098】信号の静止的挙動は、2つのレベルにおい
てモニタされる。すなわち、最初は大きな通常のウィン
ドウによってモニタされ、次にもし必要なら小ウィンド
ウでモニタされる。したがって、大ウィンドウ(通常の
ウィンドウ)のPEは、各セグメントについて計算され
るが、小ウィンドウのPEは、必要な場合にのみ計算さ
れる。しかし、信号の連続的変動に追随するために、両
方の形式のトーン性についての情報は、各セグメントに
ついて更新される。
てモニタされる。すなわち、最初は大きな通常のウィン
ドウによってモニタされ、次にもし必要なら小ウィンド
ウでモニタされる。したがって、大ウィンドウ(通常の
ウィンドウ)のPEは、各セグメントについて計算され
るが、小ウィンドウのPEは、必要な場合にのみ計算さ
れる。しかし、信号の連続的変動に追随するために、両
方の形式のトーン性についての情報は、各セグメントに
ついて更新される。
【0099】別段の表示のない限り、セグメントは10
24個のサンプルからなり、これは大ウィンドウ(通常
ウィンドウ)の長さに等しい。
24個のサンプルからなり、これは大ウィンドウ(通常
ウィンドウ)の長さに等しい。
【0100】図5(A)は、点「N/2」から点[3N
/2」までのセグメントを分析している際にモニタでき
る可能性をすべて表現した説明図である。図6はこれに
関連する流れ図で、モニタ作業の手順と決定技術とを示
す。必要な場合に一連の小ウィンドウの前に「スター
ト」ウィンドウを挿入できるように、セグメントの3/
2をバッファに保持しておくことが必要である。図5
(A)から図5(E)までの図においては、互いに連続
するセグメント間に50%のオーバラップをはっきりと
考慮している。
/2」までのセグメントを分析している際にモニタでき
る可能性をすべて表現した説明図である。図6はこれに
関連する流れ図で、モニタ作業の手順と決定技術とを示
す。必要な場合に一連の小ウィンドウの前に「スター
ト」ウィンドウを挿入できるように、セグメントの3/
2をバッファに保持しておくことが必要である。図5
(A)から図5(E)までの図においては、互いに連続
するセグメント間に50%のオーバラップをはっきりと
考慮している。
【0101】プロセスは、512個の新たな時間的サン
プルからなる新たなセグメントを分析することから始ま
る(残りの512個のサンプルは前のセグメントに属す
る)。この新セグメントのPEと前のセグメントとのP
E差とが計算される。もし後者の値が予め定められたし
きい値に到達した場合、現セグメント内に非静止状態が
存在すると判断され、その詳細は、図5(A)に示す位
置を有する4個の小ウィンドウを処理することによって
得られる。
プルからなる新たなセグメントを分析することから始ま
る(残りの512個のサンプルは前のセグメントに属す
る)。この新セグメントのPEと前のセグメントとのP
E差とが計算される。もし後者の値が予め定められたし
きい値に到達した場合、現セグメント内に非静止状態が
存在すると判断され、その詳細は、図5(A)に示す位
置を有する4個の小ウィンドウを処理することによって
得られる。
【0102】各小ウィンドウのPE値が計算され、PE
1、PE2、PE3、及びPE4の順に結果が得られ
る。これらの値から、信号の強い非静止状態の正確な開
始点が導き出される。
1、PE2、PE3、及びPE4の順に結果が得られ
る。これらの値から、信号の強い非静止状態の正確な開
始点が導き出される。
【0103】位置としては、図5(A)中に、L1、L
2、L3、L4、及びL5として示す5箇所だけが可能
である。図から判るように、もし非静止状態が点「N/
2」から点「15N/16」までの間のどこかで発生し
ていたとすると、その状態は前のセグメントにおいて検
出されていたはずである。したがって、PE1の値は現
セグメントの非静止状態に関する情報を含んでいないこ
とになる。
2、L3、L4、及びL5として示す5箇所だけが可能
である。図から判るように、もし非静止状態が点「N/
2」から点「15N/16」までの間のどこかで発生し
ていたとすると、その状態は前のセグメントにおいて検
出されていたはずである。したがって、PE1の値は現
セグメントの非静止状態に関する情報を含んでいないこ
とになる。
【0104】ここで、小ウィンドウの平均PE値が同じ
セグメントの大ウィンドウのPE値と比較される。PE
値がより小さいことはより効率的な符号化状態であるこ
とを意味する。したがって、もし前者すなわち平均値が
後者すなわち大ウィンドウの値より小さくない場合、縮
退状態が存在するものとみなされ、ウィンドウ切り替え
プロセスは中止される。
セグメントの大ウィンドウのPE値と比較される。PE
値がより小さいことはより効率的な符号化状態であるこ
とを意味する。したがって、もし前者すなわち平均値が
後者すなわち大ウィンドウの値より小さくない場合、縮
退状態が存在するものとみなされ、ウィンドウ切り替え
プロセスは中止される。
【0105】以上から、小ウィンドウについて、静止状
態に関する情報は、前のウィンドウのPE値との差より
も現ウィンドウのPE値により多く存在することが観察
された。その結果、予め定められたしきい値よりも大き
いPE値を有する第1ウィンドウが検出される。PE2
は位置L1で識別され、同じくPE3は位置L2で、P
E4は位置L3で識別される。いずれの場合にも、「ス
タート」ウィンドウは、小ウィンドウで符号化される現
セグメントの前に配置される。
態に関する情報は、前のウィンドウのPE値との差より
も現ウィンドウのPE値により多く存在することが観察
された。その結果、予め定められたしきい値よりも大き
いPE値を有する第1ウィンドウが検出される。PE2
は位置L1で識別され、同じくPE3は位置L2で、P
E4は位置L3で識別される。いずれの場合にも、「ス
タート」ウィンドウは、小ウィンドウで符号化される現
セグメントの前に配置される。
【0106】プロセスを完了するには「ストップ」ウィ
ンドウが必要であるが、2つの可能性が考えられる。も
し信号の強い非静止状態の開始点として識別された位置
がL1又はL2の場合、これは、小ウィンドウの一連の
セグメントのかなり内部にあり、符号化による人工要素
は生じない。この符号化シ−ケンスを図5(B)に示
す。もし非静止状態の開始点がL4ならば、最悪の場
合、非静止状態は最後の小ウィンドウの右端に非常に近
いところで始まる可能性がある。
ンドウが必要であるが、2つの可能性が考えられる。も
し信号の強い非静止状態の開始点として識別された位置
がL1又はL2の場合、これは、小ウィンドウの一連の
セグメントのかなり内部にあり、符号化による人工要素
は生じない。この符号化シ−ケンスを図5(B)に示
す。もし非静止状態の開始点がL4ならば、最悪の場
合、非静止状態は最後の小ウィンドウの右端に非常に近
いところで始まる可能性がある。
【0107】前の結果は、符号化状態において「ストッ
プ」ウィンドウをこれらの状況に配置することがこの切
り替え点において信号の再構築を顕著に劣化させること
を一貫して示している。この理由から、「ストップ」ウ
ィンドウの前に別の4個の小ウィンドウのセットが配置
される。その結果としての符号化シ−ケンスを図5
(E)に示す。
プ」ウィンドウをこれらの状況に配置することがこの切
り替え点において信号の再構築を顕著に劣化させること
を一貫して示している。この理由から、「ストップ」ウ
ィンドウの前に別の4個の小ウィンドウのセットが配置
される。その結果としての符号化シ−ケンスを図5
(E)に示す。
【0108】もし小ウィンドウのPE値がどれもしきい
値を超えない場合、残る可能性は、L4又はL5であ
る。この場合、問題は小ウィンドウシ−ケンスの範囲の
先にあり、バッファ内の第1セグメントが、通常の大ウ
ィンドウを用いてすぐに符号化される。
値を超えない場合、残る可能性は、L4又はL5であ
る。この場合、問題は小ウィンドウシ−ケンスの範囲の
先にあり、バッファ内の第1セグメントが、通常の大ウ
ィンドウを用いてすぐに符号化される。
【0109】正しい位置を識別特定するために、別の小
ウィンドウでの処理が必要である。これは、図5(A)
中に破線で表され、そのPE値であるPE1n+1も計算
される。容易に判るように、この小ウィンドウは既に次
のセグメントに属している。もしPE1n+1がしきい値
を超える場合、位置はL4であり、図5(C)に示すよ
うに、「スタート」ウィンドウに「ストップ」ウィンド
ウが続く形となる。この場合、量子化雑音の拡散は小ウ
ィンドウの長さに限られ、よりよい符号化利得が得られ
る。
ウィンドウでの処理が必要である。これは、図5(A)
中に破線で表され、そのPE値であるPE1n+1も計算
される。容易に判るように、この小ウィンドウは既に次
のセグメントに属している。もしPE1n+1がしきい値
を超える場合、位置はL4であり、図5(C)に示すよ
うに、「スタート」ウィンドウに「ストップ」ウィンド
ウが続く形となる。この場合、量子化雑音の拡散は小ウ
ィンドウの長さに限られ、よりよい符号化利得が得られ
る。
【0110】まれに位置がL5の場合があり、その際に
は、符号化は図5(D)のように行われる。この場合に
これが正しい解であることの証明は、PE2n+1の値が
しきい値を超えることを確認することで得られる。PE
2n+1は、PE1n+1で識別されるウィンドウの直後に続
く小ウィンドウ(図5には表されていない)のPE値で
ある。
は、符号化は図5(D)のように行われる。この場合に
これが正しい解であることの証明は、PE2n+1の値が
しきい値を超えることを確認することで得られる。PE
2n+1は、PE1n+1で識別されるウィンドウの直後に続
く小ウィンドウ(図5には表されていない)のPE値で
ある。
【0111】前に述べたように、各セグメントについ
て、「RIGHT」(右)及び「LEFT」(左)のチ
ャンネルは、同じ形式の分析/合成ウィンドウを用い
る。これは、少なくとも一方のチャンネルが切り替えを
要するときには両方のチャンネルについて切り替えが行
われることを意味する。
て、「RIGHT」(右)及び「LEFT」(左)のチ
ャンネルは、同じ形式の分析/合成ウィンドウを用い
る。これは、少なくとも一方のチャンネルが切り替えを
要するときには両方のチャンネルについて切り替えが行
われることを意味する。
【0112】以上から、ビットレートの低い用例につい
ては、図5(C)の解は、局部的にはよい音響心理学的
解ではあるが、不当に大量のビット数を必要とし、これ
が後に続くセグメントの符号化の品質に悪影響を及ぼす
ことが観察された。この理由から、符号化についてのこ
の解は、結局用いられない。
ては、図5(C)の解は、局部的にはよい音響心理学的
解ではあるが、不当に大量のビット数を必要とし、これ
が後に続くセグメントの符号化の品質に悪影響を及ぼす
ことが観察された。この理由から、符号化についてのこ
の解は、結局用いられない。
【0113】又、小ウィンドウが用いられた場合に再構
築された信号の詳細が、通常の大ウィンドウのみが用い
られる場合よりも元の信号に近いことも明かである。こ
れは、アタックが基本的に、広帯域幅信号であること
と、極めて短時間しか静止状態にないと考えてよいこと
とによる。小ウィンドウは大ウィンドウよりも大きな時
間的分割を有するので、変動するスペクトルパタ−ン
を、より高い忠実度で追随、再生できるのである。
築された信号の詳細が、通常の大ウィンドウのみが用い
られる場合よりも元の信号に近いことも明かである。こ
れは、アタックが基本的に、広帯域幅信号であること
と、極めて短時間しか静止状態にないと考えてよいこと
とによる。小ウィンドウは大ウィンドウよりも大きな時
間的分割を有するので、変動するスペクトルパタ−ン
を、より高い忠実度で追随、再生できるのである。
【0114】いい替えれば、これは、信号のより正確な
局部的(時間)量子化と、同じ信号の全体的(周波数)
量子化との差である。
局部的(時間)量子化と、同じ信号の全体的(周波数)
量子化との差である。
【0115】次に、ステレオ符号器の最終マスキングし
きい値が、モノラル及びステレオしきい値の組み合せを
用いて計算される。モノラルしきい値が各チャンネルに
ついて独立して計算されるのに対し、ステレオでは両チ
ャンネルが考慮される。
きい値が、モノラル及びステレオしきい値の組み合せを
用いて計算される。モノラルしきい値が各チャンネルに
ついて独立して計算されるのに対し、ステレオでは両チ
ャンネルが考慮される。
【0116】「右」チャンネル又は「左」チャンネルの
独立したマスキングしきい値は、トーンをマスキングす
る雑音と雑音をマスキングするトーンとについての表現
を含む音響心理学的モデルを用いて計算される。後者
は、雑音をマスキングする雑音の表現の控え目な近似概
算として用いられる。モノラルしきい値は、前に説明し
た作業と同じ手順を用いて計算される。
独立したマスキングしきい値は、トーンをマスキングす
る雑音と雑音をマスキングするトーンとについての表現
を含む音響心理学的モデルを用いて計算される。後者
は、雑音をマスキングする雑音の表現の控え目な近似概
算として用いられる。モノラルしきい値は、前に説明し
た作業と同じ手順を用いて計算される。
【0117】特に、トーン性の測定は、最後の3個のセ
グメントの全体にわたって各周波数係数のパワー及びフ
ェーズの展開を考慮して、信号がよりトーンに似るか又
はより雑音に似るかを識別する。したがって、音響心理
学的表現は各々、多かれ少なかれ他方よりも加重され
る。文献に記載のこれら表現は、よりよい性能を得るた
めに更新されている。
グメントの全体にわたって各周波数係数のパワー及びフ
ェーズの展開を考慮して、信号がよりトーンに似るか又
はより雑音に似るかを識別する。したがって、音響心理
学的表現は各々、多かれ少なかれ他方よりも加重され
る。文献に記載のこれら表現は、よりよい性能を得るた
めに更新されている。
【0118】これらは次の式のように定義される。 TMNdB = 19.5 + bark(18.0 /26.0) TMTdB = 6.56 − bark( 3.06/26.0) ここに、barkは、バーク・スケールによる周波数、
である。このスケールは、いわゆる蝸牛フィルタ又は臨
界帯状組織と称されるものに関連する。この臨界帯状組
織は、頭蓋底膜の定長セグメントのことである。最終し
きい値は、マスキングの絶対しきい値及び部分的なマス
キング前の保護を考慮して調整される。
である。このスケールは、いわゆる蝸牛フィルタ又は臨
界帯状組織と称されるものに関連する。この臨界帯状組
織は、頭蓋底膜の定長セグメントのことである。最終し
きい値は、マスキングの絶対しきい値及び部分的なマス
キング前の保護を考慮して調整される。
【0119】モノラルしきい値の計算の全部について以
下に簡単に説明する。関連演算の説明を簡略化するた
め、いくつかの用語の導入が必要である。
下に簡単に説明する。関連演算の説明を簡略化するた
め、いくつかの用語の導入が必要である。
【0120】それぞれ異なる目的に合わせるために、各
セグメントのスペクトルは3種類の異なる方法で構成さ
れる。
セグメントのスペクトルは3種類の異なる方法で構成さ
れる。
【0121】1.第1に、スペクトルは、区分に分割さ
れて構成される。各区分には、1個のバーク値が付随す
る。これらの区分によって、1個のMDCTライン又は
臨界帯域幅の1/3のいずれか広い方に近似の分割が得
られる。低い周波数においては、単一のMDCTライン
が符号器区分を構成する。高い周波数においては、多数
の線が組み合わされて1つの符号器区分が得られる。こ
の場合、付随するバーク値はこの区分の中央バーク点で
ある。
れて構成される。各区分には、1個のバーク値が付随す
る。これらの区分によって、1個のMDCTライン又は
臨界帯域幅の1/3のいずれか広い方に近似の分割が得
られる。低い周波数においては、単一のMDCTライン
が符号器区分を構成する。高い周波数においては、多数
の線が組み合わされて1つの符号器区分が得られる。こ
の場合、付随するバーク値はこの区分の中央バーク点で
ある。
【0122】このスペクトル区分方法は、拡散関数に対
して受け入れ可能な分割が確実に得られるようにするた
めに必要である。後に示すように、この機能は、近隣の
臨界帯域に対するマスキングの影響を表す。
して受け入れ可能な分割が確実に得られるようにするた
めに必要である。後に示すように、この機能は、近隣の
臨界帯域に対するマスキングの影響を表す。
【0123】2.第2に、スペクトルは、帯域に分割さ
れて構成される。帯域は、パラメータ・ファイルによっ
て定義される。各帯域は、最終マスキングしきい値ベク
トルから得られる単一のスケールファクタに付随するい
くつかのスペクトル線をまとめたものである。
れて構成される。帯域は、パラメータ・ファイルによっ
て定義される。各帯域は、最終マスキングしきい値ベク
トルから得られる単一のスケールファクタに付随するい
くつかのスペクトル線をまとめたものである。
【0124】3.最後に、スペクトルは又、セクション
に分けて構成される。後で説明するが、セクションには
整数の個数からなる帯域を含み、同じハフマンコードブ
ックで符号化されるスペクトル領域を表す。
に分けて構成される。後で説明するが、セクションには
整数の個数からなる帯域を含み、同じハフマンコードブ
ックで符号化されるスペクトル領域を表す。
【0125】デ−タ値について次の3種類の指標が用い
られる。「ω→」は、計算が、MDCTライン領域内で
周波数によってインデックスされることを表示してい
る。「b→」は、計算が、しきい値計算区分領域内でイ
ンデックスされることを表示している。その領域でたた
みこみ又は和が行われる場合に、「bb」が加法変数と
して用いられる。「n→」は、計算が、符号器帯域領域
内でインデックスされることを表示している。
られる。「ω→」は、計算が、MDCTライン領域内で
周波数によってインデックスされることを表示してい
る。「b→」は、計算が、しきい値計算区分領域内でイ
ンデックスされることを表示している。その領域でたた
みこみ又は和が行われる場合に、「bb」が加法変数と
して用いられる。「n→」は、計算が、符号器帯域領域
内でインデックスされることを表示している。
【0126】更に、次の符号が用いられる。 1.計算区分の指標:b 2.区分内の最低周波数ライン:ωlowb 3.区分内の最高周波数ライン:ωhighb 4.区分の中間バーク値:bvalb 5.区分についての、トーンをマスキングする雑音の値
(dB):TMNb 6.区分についての、雑音をマスキングするトーンの値
(dB):NMTb
(dB):TMNb 6.区分についての、雑音をマスキングするトーンの値
(dB):NMTb
【0127】以下の説明中、数箇所で、「拡散関数」
(sprdng f(i,j))の用語が用いられる。
これは次の方法で計算される。
(sprdng f(i,j))の用語が用いられる。
これは次の方法で計算される。
【0128】tmpx=1.05(j−i)、 ここに、iは、拡散される信号のバーク値、jは、拡散
先の帯域のバーク値、そして、tmpxは、一時的数値
変数。 x=8 minimum((tmpx−.5)2−2(t
mpx−.5),0) 、ここに、xは、一時的数値変数、そして、minim
um(a,b)は、a、又はb、のうち、より負数であ
る方を返す関数である。
先の帯域のバーク値、そして、tmpxは、一時的数値
変数。 x=8 minimum((tmpx−.5)2−2(t
mpx−.5),0) 、ここに、xは、一時的数値変数、そして、minim
um(a,b)は、a、又はb、のうち、より負数であ
る方を返す関数である。
【0129】tmpy=15.811389+7.5(t
mpx+.474)−17.5(1.+(tmpx+.47
4)2).5、 ここに、tmpyは、別の一時的数値変数であり、もし
(tmpy<−100)の場合、{sprdng f
(i,j)=0}、そうでない場合{sprdng f
(i,j)=10(x+tmpy)/10.}である。
mpx+.474)−17.5(1.+(tmpx+.47
4)2).5、 ここに、tmpyは、別の一時的数値変数であり、もし
(tmpy<−100)の場合、{sprdng f
(i,j)=0}、そうでない場合{sprdng f
(i,j)=10(x+tmpy)/10.}である。
【0130】(しきい値計算のステップ)符号器におい
て用いられるSMRn値を計算するには、次のステップ
が必要である。
て用いられるSMRn値を計算するには、次のステップ
が必要である。
【0131】1.入力信号の512個の新たなサンプル
を連接して、1024個のサンプルからなる別のセグメ
ントを形成する(図5(A)を参照)。
を連接して、1024個のサンプルからなる別のセグメ
ントを形成する(図5(A)を参照)。
【0132】2.第2.0項に述べたようにO−FFT
を用い、又サイン・ウィンドウを用いて、入力信号の複
素スペクトルを計算する。
を用い、又サイン・ウィンドウを用いて、入力信号の複
素スペクトルを計算する。
【0133】3.予測されたr及びφを計算する。変換
の極座標による表示が計算される。rω及びφωは、変
換されたセグメントの或るスペクトル線の大きさの成分
及び位相の成分を表す(本明細書において記号の後に付
く添え文字のωを、上記のように同列併記する場合と、
下付き文字で表記する場合とがあるが、これらは同一内
容を意味する)。
の極座標による表示が計算される。rω及びφωは、変
換されたセグメントの或るスペクトル線の大きさの成分
及び位相の成分を表す(本明細書において記号の後に付
く添え文字のωを、上記のように同列併記する場合と、
下付き文字で表記する場合とがあるが、これらは同一内
容を意味する)。
【0134】rωの予測値(次の数式[数1]の符号で
示す)及びφωの予測値(次の数式[数2]の符号で示
す)、
示す)及びφωの予測値(次の数式[数2]の符号で示
す)、
【数1】
【数2】 は、先の2つのしきい値計算ブロックのr及びφから次
の数式[数3]及び[数4]により計算される。
の数式[数3]及び[数4]により計算される。
【数3】
【数4】 ここに、tは、現ブロック番号を表し、t−1は、1つ
前のブロックのデ−タを示し、t−2は、その更に1つ
前のブロックのデ−タを示す。
前のブロックのデ−タを示し、t−2は、その更に1つ
前のブロックのデ−タを示す。
【0135】4.予測不能性の測定値cωを計算する。
予測不能性の測定値cωは、次の数式[数5]により計
算される。
予測不能性の測定値cωは、次の数式[数5]により計
算される。
【数5】
【0136】5.しきい値計算区分におけるエネルギー
及び予測不能性を計算する。各区分におけるエネルギ
ー、ebは、次の数式[数6]により計算され、
及び予測不能性を計算する。各区分におけるエネルギ
ー、ebは、次の数式[数6]により計算され、
【数6】 加重した予測不能性、cbは、次の数式[数7]により
計算される。
計算される。
【数7】
【0137】6.区分されたエネルギー及び予測不能性
を、拡散関数でたたみこむ。これらの値ecbb及びc
tbは、次の数式[数8]及び[数9]により計算され
る。
を、拡散関数でたたみこむ。これらの値ecbb及びc
tbは、次の数式[数8]及び[数9]により計算され
る。
【数8】
【数9】
【0138】ctbは、信号エネルギーで加重されてい
るので、正規化する必要があり、正規化された値、cb
bは次の式で計算される。 cbb = ctb/ecbb 同時に、拡散関数が非正規化特性を有するため、ecb
bは再正規化する必要があり、再正規化されたエネルギ
ー値、enbは次の式で計算される。 enb = ecbb/rnormb 再正規化係数、rnormbは次の数式[数10]によ
り計算される。
るので、正規化する必要があり、正規化された値、cb
bは次の式で計算される。 cbb = ctb/ecbb 同時に、拡散関数が非正規化特性を有するため、ecb
bは再正規化する必要があり、再正規化されたエネルギ
ー値、enbは次の式で計算される。 enb = ecbb/rnormb 再正規化係数、rnormbは次の数式[数10]によ
り計算される。
【数10】
【0139】7.cbbを次の式によりtbbに変換す
る。 tbb = −.299−.43loge(cbb) 各tbbは、0≦tbb≦1の範囲に限定される。
る。 tbb = −.299−.43loge(cbb) 各tbbは、0≦tbb≦1の範囲に限定される。
【0140】8.各区分において要求される信号対雑音
比(SN比)を計算する。 TMNb = 19.5 + bvalb(18.0)/(2
6.0) NMTb = 6.56 − bvalb(3.06)/(2
6.0) ここに、TMNbはトーンをマスキングする雑音の値
(dB)、NMTbは雑音をマスキングするトーンの値
(dB)である。要求される信号対雑音比、SNRbは
次の式で計算される。 SNRb = tbb × TMNb + (1−tbb)NMT
b
比(SN比)を計算する。 TMNb = 19.5 + bvalb(18.0)/(2
6.0) NMTb = 6.56 − bvalb(3.06)/(2
6.0) ここに、TMNbはトーンをマスキングする雑音の値
(dB)、NMTbは雑音をマスキングするトーンの値
(dB)である。要求される信号対雑音比、SNRbは
次の式で計算される。 SNRb = tbb × TMNb + (1−tbb)NMT
b
【0141】9.パワー比、bcb、を次の式で計算す
る。 bcb = 10-SNRb/10
る。 bcb = 10-SNRb/10
【0142】10.実際のエネルギーしきい値、n
bb、を次の式で計算する。 nbb = enb × bcb
bb、を次の式で計算する。 nbb = enb × bcb
【0143】11.しきい値エネルギーをMDCTライ
ン上に拡散し、結果としての値、nbω、を次の式で計
算する。 nbω = nbb/(ωhighb − ωlowb +
1)
ン上に拡散し、結果としての値、nbω、を次の式で計
算する。 nbω = nbb/(ωhighb − ωlowb +
1)
【0144】12.絶対しきい値を算入し、最終の可聴
性エネルギーしきい値、thrω、を次の式で計算す
る。 thrω = max(nbω,absthrω) 「絶対しきい値テーブル」に示される絶対しきい値(a
bsthr)のdB値は、しきい値計算に用いられるM
DCT内で±(1/2)lsbのサイン波が有するレベ
ルに比例する。dB値は、実際に用いられたMDCT正
規化を考慮後、エネルギー領域へ変換する必要がある。
性エネルギーしきい値、thrω、を次の式で計算す
る。 thrω = max(nbω,absthrω) 「絶対しきい値テーブル」に示される絶対しきい値(a
bsthr)のdB値は、しきい値計算に用いられるM
DCT内で±(1/2)lsbのサイン波が有するレベ
ルに比例する。dB値は、実際に用いられたMDCT正
規化を考慮後、エネルギー領域へ変換する必要がある。
【0145】13.プリエコー制御を行う。
【0146】14.信号対マスク比(SM比)、SMR
nを計算する。「符号器の帯域」には次の2つの情報が
示される。 (1)帯域の指標、n。 (2)帯域nの上部指標、ωhighn。下部指標ωl
ownは、前の帯域の値から、ωhighn-1+1として
計算される。
nを計算する。「符号器の帯域」には次の2つの情報が
示される。 (1)帯域の指標、n。 (2)帯域nの上部指標、ωhighn。下部指標ωl
ownは、前の帯域の値から、ωhighn-1+1として
計算される。
【0147】各帯域を更に分類するために、別の変数と
して、幅指標、widthnを新たに設ける。この幅指
標、widthnは、もしnが知覚的に狭い帯域の場
合、「1」の値を取り、もしnが知覚的に広い帯域の場
合、「0」の値を取る。前者は、次の数式[数11]が
成立する場合に生じる。
して、幅指標、widthnを新たに設ける。この幅指
標、widthnは、もしnが知覚的に狭い帯域の場
合、「1」の値を取り、もしnが知覚的に広い帯域の場
合、「0」の値を取る。前者は、次の数式[数11]が
成立する場合に生じる。
【数11】 式中、「bandlength」は初期化ルーチンにお
いてセットされるパラメータである。数式[数11]が
成立しない場合は、後者とみなされる。
いてセットされるパラメータである。数式[数11]が
成立しない場合は、後者とみなされる。
【0148】次に、もし、widthn = 1、の場
合、符号器帯域における雑音レベル、nbandn、が
次の数式[数12]で計算される。
合、符号器帯域における雑音レベル、nbandn、が
次の数式[数12]で計算される。
【数12】 もしそうでない場合には、nbandn、は次の数式
[数13]で計算される。
[数13]で計算される。
【数13】 ここに、この場合、minimum(a,...,z)
は、独立変数a...zのうちの最も負である負数又は
最も小さい正数を返す関数である。
は、独立変数a...zのうちの最も負である負数又は
最も小さい正数を返す関数である。
【0149】復号器に送るべき信号対マスク比、SMR
nは、が次の数式[数14]で計算される。
nは、が次の数式[数14]で計算される。
【数14】
【0150】ここで、トーン性についての測定値がスペ
クトル分析プロセスの出力であるので、分析ウィンドウ
は大又は小ウィンドウの全ての場合についてサイン形状
を有する、ということを強調したい。特に、セグメント
が「スタート」又は「ストップ」ウィンドウとして選択
され符号化される場合、そのトーン性についての情報
は、サインウィンドウを考慮して得られる。残りの作
業、例えばしきい値の計算及び係数の量子化は、適切な
ウィンドウで得られたスペクトルを考慮する。
クトル分析プロセスの出力であるので、分析ウィンドウ
は大又は小ウィンドウの全ての場合についてサイン形状
を有する、ということを強調したい。特に、セグメント
が「スタート」又は「ストップ」ウィンドウとして選択
され符号化される場合、そのトーン性についての情報
は、サインウィンドウを考慮して得られる。残りの作
業、例えばしきい値の計算及び係数の量子化は、適切な
ウィンドウで得られたスペクトルを考慮する。
【0151】[ステレオしきい値]ステレオしきい値に
はいくつかの目的がある。大部分の時間について2つの
チャンネル上の音が互いに同一に聞こえることが知られ
ている。すなわち、符号化利得に変換できる何らかの相
関関係が存在する。これら2つのチャンネルの時間的表
示について検討した場合に、この相関関係は明白ではな
い。しかし、スペクトル的表示には、利用すると有利
な、いくつかの興味深い特徴がみられる。
はいくつかの目的がある。大部分の時間について2つの
チャンネル上の音が互いに同一に聞こえることが知られ
ている。すなわち、符号化利得に変換できる何らかの相
関関係が存在する。これら2つのチャンネルの時間的表
示について検討した場合に、この相関関係は明白ではな
い。しかし、スペクトル的表示には、利用すると有利
な、いくつかの興味深い特徴がみられる。
【0152】実際には、2つのチャンネルを表示する新
たな基盤を考えるのが、非常に実際的且つ有用である。
この基盤は、次の数式[数15]に示す一次結合によっ
て定義される2つの直交ベクトル、すなわち「SUM」
(和)ベクトル及び「DIFFERENCE」(DI
F、又は、差)に関するものである。
たな基盤を考えるのが、非常に実際的且つ有用である。
この基盤は、次の数式[数15]に示す一次結合によっ
て定義される2つの直交ベクトル、すなわち「SUM」
(和)ベクトル及び「DIFFERENCE」(DI
F、又は、差)に関するものである。
【数15】
【0153】変換プロセスが定義から一次演算であるた
め、これらのベクトル(使用中のウィンドウと同じ長さ
を有する)は、周波数領域において生成される。このこ
とは、演算負荷を簡単化するという利点がある。
め、これらのベクトル(使用中のウィンドウと同じ長さ
を有する)は、周波数領域において生成される。このこ
とは、演算負荷を簡単化するという利点がある。
【0154】ステレオしきい値の第1の目的は、2つの
信号について、より相関関係の少ない表示を求めること
である。これら新しいチャンネルの一方にエネルギーの
大部分が集中する状態は、「右」チャンネル及び「左」
チャンネルの間に存在する冗長性の結果として得られる
もので、これから、概して、常に符号化利得が得られ
る。
信号について、より相関関係の少ない表示を求めること
である。これら新しいチャンネルの一方にエネルギーの
大部分が集中する状態は、「右」チャンネル及び「左」
チャンネルの間に存在する冗長性の結果として得られる
もので、これから、概して、常に符号化利得が得られ
る。
【0155】第2の目的は、「右」チャンネル及び
「左」チャンネルの量子化雑音を相関させることと、雑
音の位置特定(定位)又は非マスキング(アンマスキン
グ)効果を制御することとである。この問題は、「右」
チャンネル及び「左」チャンネルが独立して量子化され
符号化される場合に生じる。
「左」チャンネルの量子化雑音を相関させることと、雑
音の位置特定(定位)又は非マスキング(アンマスキン
グ)効果を制御することとである。この問題は、「右」
チャンネル及び「左」チャンネルが独立して量子化され
符号化される場合に生じる。
【0156】この概念は、次の例で説明できる。或る特
定の信号についてマスキングのしきい値が計算されたと
仮定すると、2つの状態が生じる。まず第1に、しきい
値に対応する雑音量を信号に加える。この同じ信号をこ
の同じ雑音と共に両方の耳に聞かせると、雑音がマスキ
ング(遮蔽)される。
定の信号についてマスキングのしきい値が計算されたと
仮定すると、2つの状態が生じる。まず第1に、しきい
値に対応する雑音量を信号に加える。この同じ信号をこ
の同じ雑音と共に両方の耳に聞かせると、雑音がマスキ
ング(遮蔽)される。
【0157】しかし、もししきい値に対応する雑音を信
号に加えてこの組み合せを一方の耳に聞かせてから、他
方の耳に同じことを、但し雑音については前と相関関係
をもたせないようにして、行った場合には、雑音はマス
キングされない。再度マスキング状態を得るには、両方
の耳に対する雑音をマスキングレベル差(MLD)によ
って与えられるレベルだけ減少させる必要がある。
号に加えてこの組み合せを一方の耳に聞かせてから、他
方の耳に同じことを、但し雑音については前と相関関係
をもたせないようにして、行った場合には、雑音はマス
キングされない。再度マスキング状態を得るには、両方
の耳に対する雑音をマスキングレベル差(MLD)によ
って与えられるレベルだけ減少させる必要がある。
【0158】非マスキング問題は、概説すれば次の状態
として説明できる。すなわち、量子化雑音がマスキング
信号の定位に追随しない場合、量子化雑音がマスキング
されない、という状態である。特に、限定された2つの
場合が考えられる。信号が中央に定位され聴者の側部に
おいて非マスキングがより顕著である場合と、信号が側
部に定位され、非マスキングが中央線上でより顕著であ
る場合とである。
として説明できる。すなわち、量子化雑音がマスキング
信号の定位に追随しない場合、量子化雑音がマスキング
されない、という状態である。特に、限定された2つの
場合が考えられる。信号が中央に定位され聴者の側部に
おいて非マスキングがより顕著である場合と、信号が側
部に定位され、非マスキングが中央線上でより顕著であ
る場合とである。
【0159】新たな「和」ベクトル及び「差」ベクトル
は、聴者の中央に定位された信号と側部に定位された信
号との両方を表すので非常に便利である。また、これら
のベクトルによって。中央及び側部イメ−ジで量子化を
制御することが可能となる。したがって、非マスキング
問題は、これらのベクトルを用いてマスキングレベル差
(MLD)についての保護レベルを制御することによっ
て解決できる。
は、聴者の中央に定位された信号と側部に定位された信
号との両方を表すので非常に便利である。また、これら
のベクトルによって。中央及び側部イメ−ジで量子化を
制御することが可能となる。したがって、非マスキング
問題は、これらのベクトルを用いてマスキングレベル差
(MLD)についての保護レベルを制御することによっ
て解決できる。
【0160】いくつかの音響心理学的情報及び他の実験
結果に基づいていえば、MLD保護は、約3KHzの非
常に低い周波数については特に不安定で、信号のパワー
にのみ依り、トーン性についての特性には依らない。
結果に基づいていえば、MLD保護は、約3KHzの非
常に低い周波数については特に不安定で、信号のパワー
にのみ依り、トーン性についての特性には依らない。
【0161】MLDを次の数式で表すとよい結果が得ら
れる。 MLDdB(i) = 25.5[cos(πb(i)/
32.0)]2 ここに、iは、スペクトルの区分指標([7]参照)、
b(i)は、区分(i)の中心のバーク周波数である。
この式は、b(i)≦16.0の場合、すなわち3KH
zより低い周波数についてのみ有効である。
れる。 MLDdB(i) = 25.5[cos(πb(i)/
32.0)]2 ここに、iは、スペクトルの区分指標([7]参照)、
b(i)は、区分(i)の中心のバーク周波数である。
この式は、b(i)≦16.0の場合、すなわち3KH
zより低い周波数についてのみ有効である。
【0162】MLDしきい値の式は次の数式[数16]
で与えられる。
で与えられる。
【数16】 ここに、C(i)は、頭蓋底膜上の拡散信号エネルギー
で、区分(i)にのみ対応する。
で、区分(i)にのみ対応する。
【0163】ステレオしきい値の第3の、すなわち最後
の目的は、特定のステレオ信号イメ−ジを利用してこの
イメ−ジによってマスキングされた信号の方向から非関
連性を導き出すことである。原理的には、これは、ステ
レオ信号の音の豊富さを損なわないために、ステレオ信
号イメ−ジが一方向に強く表示されているときにのみ行
われる。「和」ベクトル及び「差」に基づき、この目的
は、次の2つの二元的な原理を前提とすることによって
実現される。
の目的は、特定のステレオ信号イメ−ジを利用してこの
イメ−ジによってマスキングされた信号の方向から非関
連性を導き出すことである。原理的には、これは、ステ
レオ信号の音の豊富さを損なわないために、ステレオ信
号イメ−ジが一方向に強く表示されているときにのみ行
われる。「和」ベクトル及び「差」に基づき、この目的
は、次の2つの二元的な原理を前提とすることによって
実現される。
【0164】1.もし聴者の両側部において信号の(し
たがって、雑音の)強い減衰がある場合、中央線(中心
イメ−ジ)上の雑音の増大は知覚的に許容される。上限
は、側部雑音である。 2.もし聴者の中央線において信号の(したがって、雑
音の)強い局在性がある場合、両側部における相関雑音
の増大は知覚的に許容される。上限は、中心雑音であ
る。 しかし、雑音レベルが増加した場合には、MLDしきい
値によって矯正する必要がある。
たがって、雑音の)強い減衰がある場合、中央線(中心
イメ−ジ)上の雑音の増大は知覚的に許容される。上限
は、側部雑音である。 2.もし聴者の中央線において信号の(したがって、雑
音の)強い局在性がある場合、両側部における相関雑音
の増大は知覚的に許容される。上限は、中心雑音であ
る。 しかし、雑音レベルが増加した場合には、MLDしきい
値によって矯正する必要がある。
【0165】これらの目的に合わせて、最終ステレオし
きい値は次のように計算される。第1に、「SUM」
(和)チャンネル及び「DIFFERENCE」(差)
チャンネルについてのしきい値が、雑音をマスキングす
るトーンと、トーンをマスキングする雑音とについての
モノラルモデルを用いて計算される。この手順は、3.
2項のステップ10までに説明された手順と全く同じで
ある。
きい値は次のように計算される。第1に、「SUM」
(和)チャンネル及び「DIFFERENCE」(差)
チャンネルについてのしきい値が、雑音をマスキングす
るトーンと、トーンをマスキングする雑音とについての
モノラルモデルを用いて計算される。この手順は、3.
2項のステップ10までに説明された手順と全く同じで
ある。
【0166】この時点で、帯域当りの実際のエネルギー
しきい値、nbbが、両チャンネルについて得られる。
便宜上、「SUM」(和)チャンネル及び「DIFFE
RENCE」(差)チャンネルについてのこれらの値を
それぞれ、THRnSUM及びTHRnDIF、と呼ぶことと
する。
しきい値、nbbが、両チャンネルについて得られる。
便宜上、「SUM」(和)チャンネル及び「DIFFE
RENCE」(差)チャンネルについてのこれらの値を
それぞれ、THRnSUM及びTHRnDIF、と呼ぶことと
する。
【0167】第2に、これら両チャンネルについてのM
LDしきい値、すなわち、THRnMLD,SUM及びTHR
nMLD,DIF、がそれぞれ、次の数式[数17]及び[数
18]によって計算される。
LDしきい値、すなわち、THRnMLD,SUM及びTHR
nMLD,DIF、がそれぞれ、次の数式[数17]及び[数
18]によって計算される。
【数17】
【数18】 MLD保護及びステレオ非関連性の考慮は、次の式の計
算によって行われる。 nthrSUM=MAX[THRnSUM,MIN(THRn
DIF,THRnMLD,DIF)] nthrDIF=MAX[THRnDIF,MIN(THRn
SUM,THRnMLD,SUM)]
算によって行われる。 nthrSUM=MAX[THRnSUM,MIN(THRn
DIF,THRnMLD,DIF)] nthrDIF=MAX[THRnDIF,MIN(THRn
SUM,THRnMLD,SUM)]
【0168】これらの演算後、3.2項において説明し
たステップ11以降の残りのステップも又、これらのチ
ャンネルについて実行される。要点としては、これら最
後のしきい値が、絶対しきい値と、部分的なマスキング
前保護とを考慮して調整される。尚、このマスキング前
保護はモノラルの場合のものから採用されたに過ぎな
い。これは、モノラルの約2msの時間分割を考慮して
いる。しかし、バイノーラルの時間分割は、6μs程度
に精密である。
たステップ11以降の残りのステップも又、これらのチ
ャンネルについて実行される。要点としては、これら最
後のしきい値が、絶対しきい値と、部分的なマスキング
前保護とを考慮して調整される。尚、このマスキング前
保護はモノラルの場合のものから採用されたに過ぎな
い。これは、モノラルの約2msの時間分割を考慮して
いる。しかし、バイノーラルの時間分割は、6μs程度
に精密である。
【0169】ステレオ信号を、チャンネル相互間の時間
差に基づき関連ステレオイメ−ジを用いる使いやすい符
号化が今後検討を要する課題である。
差に基づき関連ステレオイメ−ジを用いる使いやすい符
号化が今後検討を要する課題である。
【0170】[ステレオ符号器]ステレオ符号器の簡略
化した構成を図12に示す。分析中の各セグメントにつ
いて、両方の信号チャンネルの独立挙動及び関連挙動に
関する詳細情報は、大変換及び小変換によって与えられ
る情報を通じて得られる。この情報は、特定のセグメン
トの符号化に必要な複数のステップにおいて用いられ
る。
化した構成を図12に示す。分析中の各セグメントにつ
いて、両方の信号チャンネルの独立挙動及び関連挙動に
関する詳細情報は、大変換及び小変換によって与えられ
る情報を通じて得られる。この情報は、特定のセグメン
トの符号化に必要な複数のステップにおいて用いられ
る。
【0171】これらのステップは、本質的に、分析ウィ
ンドウの選択、符号化モードR/L(右/左)、又はS
/D(和/差)の、帯域に基づく定義、係数とスケール
ファクタとの量子化及びハフマン符号化、並びに、ビッ
トストリームの組み立てである。
ンドウの選択、符号化モードR/L(右/左)、又はS
/D(和/差)の、帯域に基づく定義、係数とスケール
ファクタとの量子化及びハフマン符号化、並びに、ビッ
トストリームの組み立てである。
【0172】(符号化モード選択)新しいセグメントが
読まれると、大及び小の分析ウィンドウについてのトー
ン性の更新が行われる。3.1項に説明した手法に基づ
いてモノラルしきい値及びPE(知覚的エントロピー)
値が計算される。これによって、両チャンネルについて
用いるべきウィンドウの形式が、最初に決定される。
読まれると、大及び小の分析ウィンドウについてのトー
ン性の更新が行われる。3.1項に説明した手法に基づ
いてモノラルしきい値及びPE(知覚的エントロピー)
値が計算される。これによって、両チャンネルについて
用いるべきウィンドウの形式が、最初に決定される。
【0173】ウィンドウのシ−ケンスが選択されると、
次に直交符号化についての決定が行われる。この決定
は、「右」/「左」(R/L)チャンネルの独立符号
化、又は「和」/「差」(SUM/DIFFERENC
E)チャンネルを用いるジョイント符号化のいずれかを
選択する決定であり、符号器の帯域に基づいて行われ
る。これは、バイノーラルの知覚が、両方の耳における
同じ臨界帯状組織の出力の関数であるという仮定に基づ
いている。
次に直交符号化についての決定が行われる。この決定
は、「右」/「左」(R/L)チャンネルの独立符号
化、又は「和」/「差」(SUM/DIFFERENC
E)チャンネルを用いるジョイント符号化のいずれかを
選択する決定であり、符号器の帯域に基づいて行われ
る。これは、バイノーラルの知覚が、両方の耳における
同じ臨界帯状組織の出力の関数であるという仮定に基づ
いている。
【0174】もし両方のチャンネルにおけるしきい値が
非常に異なる場合には、MLD保護の必要はなく、もし
「和」チャンネル及び「差」チャンネルが考慮される場
合、信号の相関関係をより少なくする作業は行われな
い。もし信号がステレオイメ−ジを生成するような信号
の場合には、MLD保護を起動する必要があり、追加利
得を求めてS/D(和/差)符号化モードが選択される
ことになる。
非常に異なる場合には、MLD保護の必要はなく、もし
「和」チャンネル及び「差」チャンネルが考慮される場
合、信号の相関関係をより少なくする作業は行われな
い。もし信号がステレオイメ−ジを生成するような信号
の場合には、MLD保護を起動する必要があり、追加利
得を求めてS/D(和/差)符号化モードが選択される
ことになる。
【0175】この後者の状態を検出する便利な方法は、
「右」チャンネルと「左」チャンネルとの間でモノラル
しきい値を比較することである。もし特定の帯域におけ
るしきい値の差がが、予め定められた値、例えば2dB
よりも大きくない場合は、S/D符号化モードが選択さ
れ、もしそうでない場合には、独立のR/L(右/左)
モードが取られる。各帯域には、その帯域の符号化モー
ドを示す1ビットのフラッグが付随する。このフラッグ
については、サイド情報として復号器に送る必要があ
る。以下、このフラッグを、符号化モードフラッグとい
う。
「右」チャンネルと「左」チャンネルとの間でモノラル
しきい値を比較することである。もし特定の帯域におけ
るしきい値の差がが、予め定められた値、例えば2dB
よりも大きくない場合は、S/D符号化モードが選択さ
れ、もしそうでない場合には、独立のR/L(右/左)
モードが取られる。各帯域には、その帯域の符号化モー
ドを示す1ビットのフラッグが付随する。このフラッグ
については、サイド情報として復号器に送る必要があ
る。以下、このフラッグを、符号化モードフラッグとい
う。
【0176】符号化モードの決定は、同じ帯域について
もセグメントによって異なるので、時間面で適応性があ
り、又同じセグメントについても帯域によって異なるの
で、周波数面で適応性がある。符号化決定手順の例を図
13に示す。この例は、大セグメント及び小セグメント
の両方に有効である。
もセグメントによって異なるので、時間面で適応性があ
り、又同じセグメントについても帯域によって異なるの
で、周波数面で適応性がある。符号化決定手順の例を図
13に示す。この例は、大セグメント及び小セグメント
の両方に有効である。
【0177】この時点において、ウィンドウ切り替えメ
カニズムがモノラル測定値のみを含むため、セグメント
当りのPE測定値の最大個数は10(2チャンネル×
[大ウィンドウ1個+小ウィンドウ4個])であること
が明白である。しかし、計算を要するしきい値の、セグ
メント当りの最大個数は20(4チャンネル×[大ウィ
ンドウ1個+小ウィンドウ4個]であり、したがってト
ーン性についての測定値20個をセグメントごとに更新
する必要がある。
カニズムがモノラル測定値のみを含むため、セグメント
当りのPE測定値の最大個数は10(2チャンネル×
[大ウィンドウ1個+小ウィンドウ4個])であること
が明白である。しかし、計算を要するしきい値の、セグ
メント当りの最大個数は20(4チャンネル×[大ウィ
ンドウ1個+小ウィンドウ4個]であり、したがってト
ーン性についての測定値20個をセグメントごとに更新
する必要がある。
【0178】(ビットレート調整)ウィンドウ切り替え
についての決定と符号化モード選択についての決定と
は、相互に依存しないという意味で直交であると前に述
べた。量子化、ハフマン符号化、及びビットストリーム
の組み立てを含む、符号化プロセスの最終ステップも、
これらの決定に対して独立である。すなわち、フィード
バック・パスは存在しない。このことは、符号化全体の
遅延を最低値(1024/48000=21.3ms)
まで減少させ、且つ、非直交符号化の場合に生じる不安
定性を避けることができるという利点がある。
についての決定と符号化モード選択についての決定と
は、相互に依存しないという意味で直交であると前に述
べた。量子化、ハフマン符号化、及びビットストリーム
の組み立てを含む、符号化プロセスの最終ステップも、
これらの決定に対して独立である。すなわち、フィード
バック・パスは存在しない。このことは、符号化全体の
遅延を最低値(1024/48000=21.3ms)
まで減少させ、且つ、非直交符号化の場合に生じる不安
定性を避けることができるという利点がある。
【0179】量子化プロセスは、スペクトル係数及びス
ケールファクタの両方に影響を与える。スペクトル係数
は、帯域状に結集し、各帯域は同一のステップサイズ、
又はスケールファクタを有する。各ステップサイズは、
3.2項のステップ14に示すようにその帯域に対応す
るマスキングしきい値から直接計算される。
ケールファクタの両方に影響を与える。スペクトル係数
は、帯域状に結集し、各帯域は同一のステップサイズ、
又はスケールファクタを有する。各ステップサイズは、
3.2項のステップ14に示すようにその帯域に対応す
るマスキングしきい値から直接計算される。
【0180】次いで、量子化された値(整数値)は変動
ワード長さ又はハフマン符号に変換される。そのセグメ
ントを符号化するための総ビット数が、ビットストリー
ムの追加フィールドを考慮して計算される。ビットレー
トを一定に保持する必要があるため、量子化プロセス
は、ビット数が予め定められた制限値以内になるまで反
復して行われる。
ワード長さ又はハフマン符号に変換される。そのセグメ
ントを符号化するための総ビット数が、ビットストリー
ムの追加フィールドを考慮して計算される。ビットレー
トを一定に保持する必要があるため、量子化プロセス
は、ビット数が予め定められた制限値以内になるまで反
復して行われる。
【0181】そのセグメント全部を符号化するためのビ
ット数が、基本マスキングしきい値を考慮して計算され
た後、調整度が、バッファ制御ユニットによって指示さ
れる。このバッファ制御ユニットは、いくつかのセグメ
ント間で、個々のセグメントの必要に応じて、追加ビッ
トの不足又は余剰を共通させて調整する。
ット数が、基本マスキングしきい値を考慮して計算され
た後、調整度が、バッファ制御ユニットによって指示さ
れる。このバッファ制御ユニットは、いくつかのセグメ
ント間で、個々のセグメントの必要に応じて、追加ビッ
トの不足又は余剰を共通させて調整する。
【0182】ビットレート調整手法のルーチンを図9に
示す。現セグメント用に利用可能な総ビット数が計算さ
れた後、初期しきい値全てにファクタαを乗じた場合に
最終の総ビット数が、利用可能なビット数の誤差δ以内
になるようなファクタα、を求めるプロセスが反復して
行われる。もし近似カーブにうまく乗らず、最大反復回
数以内にファクタαが得られない場合でも、受け入れ可
能な解が常に1つは求められる。
示す。現セグメント用に利用可能な総ビット数が計算さ
れた後、初期しきい値全てにファクタαを乗じた場合に
最終の総ビット数が、利用可能なビット数の誤差δ以内
になるようなファクタα、を求めるプロセスが反復して
行われる。もし近似カーブにうまく乗らず、最大反復回
数以内にファクタαが得られない場合でも、受け入れ可
能な解が常に1つは求められる。
【0183】このルーチンの主要ステップは次の通りで
ある。最初に、この解を含む時間間隔が求められる。次
に、ループによって最良解への急速な集斂が図られる。
各反復ごとに最良解が更新される。
ある。最初に、この解を含む時間間隔が求められる。次
に、ループによって最良解への急速な集斂が図られる。
各反復ごとに最良解が更新される。
【0184】大ウィンドウ及び小ウィンドウで符号化さ
れるセグメントについても同じ手順を用いるために、こ
の後者の場合に、相同帯域を連接させることによって、
4個の小ウィンドウの係数をクラスタ化させる。スケー
ルファクタも同様にクラスタ化させる。
れるセグメントについても同じ手順を用いるために、こ
の後者の場合に、相同帯域を連接させることによって、
4個の小ウィンドウの係数をクラスタ化させる。スケー
ルファクタも同様にクラスタ化させる。
【0185】次にビットレート調整ルーチンはハフマン
符号化語(係数及びスケールファクタ)全てを表す総ビ
ット数を計算する別のルーチンを呼び出す。この後者の
ルーチンは、係数の振幅分布に基づくスペクトル区分化
を行う。目的は、予め定められたハフマンコードブック
をスペクトルの各セクションに割り当てることである。
各セクションは、変動する個数の帯域をグループ化し、
その係数は、便利なコードブックでハフマン方式で符号
化される。そのセクションの限度とコードブックの参照
番号とをサイド情報として復号器に送る必要がある。
符号化語(係数及びスケールファクタ)全てを表す総ビ
ット数を計算する別のルーチンを呼び出す。この後者の
ルーチンは、係数の振幅分布に基づくスペクトル区分化
を行う。目的は、予め定められたハフマンコードブック
をスペクトルの各セクションに割り当てることである。
各セクションは、変動する個数の帯域をグループ化し、
その係数は、便利なコードブックでハフマン方式で符号
化される。そのセクションの限度とコードブックの参照
番号とをサイド情報として復号器に送る必要がある。
【0186】スペクトルの区分化は、最小コスト手法を
用いて行われる。その主要ステップは次の通りである。
最初に、対象となる全てのセクションが定義され(限度
は、帯域当り1セクション)、各セクションは、そのセ
クション内の係数の振幅分布に最もよくマッチするコー
ドブックを与えられる。スペクトル全体の初めと終わり
は判っている。もしKがセクションの総数とすると、セ
クション間にK−1個の分離隔壁が存在する。
用いて行われる。その主要ステップは次の通りである。
最初に、対象となる全てのセクションが定義され(限度
は、帯域当り1セクション)、各セクションは、そのセ
クション内の係数の振幅分布に最もよくマッチするコー
ドブックを与えられる。スペクトル全体の初めと終わり
は判っている。もしKがセクションの総数とすると、セ
クション間にK−1個の分離隔壁が存在する。
【0187】各分離隔壁を除去するためのコストが計算
され、このコストのの低い分離隔壁は除去される(初期
コストは負数となる)。次回の反復前にコストが再度計
算される。このプロセスが、最大許容セクション数が得
られ、且つ分離隔壁を除去する最低コストが予め定めら
れた値より高くなるまで、反復して行われる。
され、このコストのの低い分離隔壁は除去される(初期
コストは負数となる)。次回の反復前にコストが再度計
算される。このプロセスが、最大許容セクション数が得
られ、且つ分離隔壁を除去する最低コストが予め定めら
れた値より高くなるまで、反復して行われる。
【0188】次に、図2の量子化器/レート制御ループ
処理装置206によって行われるプロセスについて説明
する。従来の技術においては、レート・ループのメカニ
ズムにモノラルの場合に関する仮定が含まれていた。モ
ノラルからステレオの知覚的符号器への移行に伴い、レ
ート・ループに対する要求が増大することになる。
処理装置206によって行われるプロセスについて説明
する。従来の技術においては、レート・ループのメカニ
ズムにモノラルの場合に関する仮定が含まれていた。モ
ノラルからステレオの知覚的符号器への移行に伴い、レ
ート・ループに対する要求が増大することになる。
【0189】図2の量子化器/レート制御ループ処理装
置206への入力は、分析フィルタバンク202によっ
て導かれたスペクトル係数(すなわち、MDCT係
数)、及び知覚的モデル処理装置204の出力からな
り、スペクトル係数に対応する計算されたしきい値を含
む。
置206への入力は、分析フィルタバンク202によっ
て導かれたスペクトル係数(すなわち、MDCT係
数)、及び知覚的モデル処理装置204の出力からな
り、スペクトル係数に対応する計算されたしきい値を含
む。
【0190】量子化器/レート制御ループ処理装置20
6は、部分的に、計算されたしきい値及び聴覚の絶対し
きい値に基づいてスペクトル情報を量子化を行い、この
ために、ビットストリームをエントロピー符号器208
に供給する。ビットストリームは、次の3部に分割され
た信号を有する。
6は、部分的に、計算されたしきい値及び聴覚の絶対し
きい値に基づいてスペクトル情報を量子化を行い、この
ために、ビットストリームをエントロピー符号器208
に供給する。ビットストリームは、次の3部に分割され
た信号を有する。
【0191】すなわち、(1)標準化されたサイド情報
を含む第1部、(2)35または36個の帯域について
のスケールファクタ、及びいわゆるウィンドウの適応切
り替えに用いる追加サイド情報を含む第2部(この第2
部の長さは、第1部の情報に依って変動する)、及び
(3)量子化されたスペクトル係数からなる第3部であ
る。
を含む第1部、(2)35または36個の帯域について
のスケールファクタ、及びいわゆるウィンドウの適応切
り替えに用いる追加サイド情報を含む第2部(この第2
部の長さは、第1部の情報に依って変動する)、及び
(3)量子化されたスペクトル係数からなる第3部であ
る。
【0192】利用スケールファクタ、Δ、は計算された
スケールファクタと、量子化対象のそれぞれのスペクト
ル係数の周波数に対応する周波数において聴覚の絶対し
きい値から導かれたスケールファクタとの間を補間する
ことによって導き出され、この導出は、量子化されたス
ペクトル係数が許容限度以内で符号化できるまで反復し
て行われる。
スケールファクタと、量子化対象のそれぞれのスペクト
ル係数の周波数に対応する周波数において聴覚の絶対し
きい値から導かれたスケールファクタとの間を補間する
ことによって導き出され、この導出は、量子化されたス
ペクトル係数が許容限度以内で符号化できるまで反復し
て行われる。
【0193】本発明の実施例の量子化についての流れ図
を図13に示す。ステップ1301において、量子化器
/レート制御ループ処理装置206は、スペクトル係数
Cf及びこのスペクトル係数に対応するエネルギーしき
い値、E、を受信する。次いで、ステップ1303にお
いて、しきい値スケールファクタ、Δ0が、次の数式
[数19]によって計算される。
を図13に示す。ステップ1301において、量子化器
/レート制御ループ処理装置206は、スペクトル係数
Cf及びこのスペクトル係数に対応するエネルギーしき
い値、E、を受信する。次いで、ステップ1303にお
いて、しきい値スケールファクタ、Δ0が、次の数式
[数19]によって計算される。
【数19】
【0194】又、絶対スケールファクタ、ΔAも、聴覚
の絶対しきい値(すなわち、スケールファクタに対応す
る周波数において聞こえる最も静かな音)に基づいて計
算される。利点として、補間定数、α、及び補間限度α
high、αlow、が利用スケールファクタの調整を助ける
ために次のように初期化される。 αhigh = 1 αlow = 0 α = αhigh
の絶対しきい値(すなわち、スケールファクタに対応す
る周波数において聞こえる最も静かな音)に基づいて計
算される。利点として、補間定数、α、及び補間限度α
high、αlow、が利用スケールファクタの調整を助ける
ために次のように初期化される。 αhigh = 1 αlow = 0 α = αhigh
【0195】次に、ステップ1305において、利用ス
ケールファクタが次の数式[数20]によって計算され
る。
ケールファクタが次の数式[数20]によって計算され
る。
【数20】 更に、ステップ1307において、利用スケールファク
タが自身で量子化される。すなわち、利用スケールファ
クタは、上で計算されたままでは離散値ではないが、伝
送、使用されるときには離散値になるので有利である。 Δ = Q-1(Q(Δ))
タが自身で量子化される。すなわち、利用スケールファ
クタは、上で計算されたままでは離散値ではないが、伝
送、使用されるときには離散値になるので有利である。 Δ = Q-1(Q(Δ))
【0196】次に、ステップ1309において、スペク
トル係数が、利用スケールファクタを用いて量子化さ
れ、次の数式の、量子化スペクトル係数、Q(Cf,
Δ)が得られる。 Q(Cf,Δ)= NINT(Cf/Δ) ここに、「NINT」は、最も近い整数関数である。
トル係数が、利用スケールファクタを用いて量子化さ
れ、次の数式の、量子化スペクトル係数、Q(Cf,
Δ)が得られる。 Q(Cf,Δ)= NINT(Cf/Δ) ここに、「NINT」は、最も近い整数関数である。
【0197】量子化器/レート制御ループ処理装置20
6は量子化スペクトル係数及び利用スケールファクタの
両方を伝送する必要があるので、これら両方を伝送する
ために要するビット数に付随するコスト、C、がステッ
プ1311において次の数式により計算される。 C = FOO(Q(Cf,Δ),Q(Δ)) ここに、「FOO」は、デ−タ通信技術に関する当業者
が容易に定めることのできる関数で、個々の実施例によ
って異なる。
6は量子化スペクトル係数及び利用スケールファクタの
両方を伝送する必要があるので、これら両方を伝送する
ために要するビット数に付随するコスト、C、がステッ
プ1311において次の数式により計算される。 C = FOO(Q(Cf,Δ),Q(Δ)) ここに、「FOO」は、デ−タ通信技術に関する当業者
が容易に定めることのできる関数で、個々の実施例によ
って異なる。
【0198】そしてステップ1313において、コスト
Cが許容範囲内にあるかどうかが点検される。コストC
が許容範囲内にある場合、Q(Cf,Δ)及びQ(Δ)
は、エントロピー符号器208に伝送される。
Cが許容範囲内にあるかどうかが点検される。コストC
が許容範囲内にある場合、Q(Cf,Δ)及びQ(Δ)
は、エントロピー符号器208に伝送される。
【0199】コストCと許容範囲との関連によるが、補
間定数及び補間限度は、利用スケールファクタから許容
範囲以内のコストの量子化スペクトル係数が得られるま
で、反復調整されるので有利である。ステップ1315
において、補間限度が人手によって調整され、二分探索
が行われる。
間定数及び補間限度は、利用スケールファクタから許容
範囲以内のコストの量子化スペクトル係数が得られるま
で、反復調整されるので有利である。ステップ1315
において、補間限度が人手によって調整され、二分探索
が行われる。
【0200】詳しく説明すれば、C>[許容範囲]の場
合、αhigh = α、であり、C<[許容範囲]の場合、
αlow = α、である。いずれの場合にも、新しい補間
定数が、次の数式によって計算される。 α = (αlow + αhigh )/2 プロセスは、更にステップ1305に戻り、Cが許容範
囲以内になるまで反復継続する。
合、αhigh = α、であり、C<[許容範囲]の場合、
αlow = α、である。いずれの場合にも、新しい補間
定数が、次の数式によって計算される。 α = (αlow + αhigh )/2 プロセスは、更にステップ1305に戻り、Cが許容範
囲以内になるまで反復継続する。
【0201】[ステレオ復号器]ステレオ復号器は、非
常に簡単な構造を有する。その主要機能は、入力される
ビットストリームを読み、全デ−タを復号化し、「右」
及び「左」のチャンネルの量子化と再構築とを反転する
ことである。その手法を図12に示す。
常に簡単な構造を有する。その主要機能は、入力される
ビットストリームを読み、全デ−タを復号化し、「右」
及び「左」のチャンネルの量子化と再構築とを反転する
ことである。その手法を図12に示す。
【0202】以上説明した実施例は、AT&T社のDS
P16又はDSP32Cのような、ディジタル信号処理
装置(DSP)及び上に述べた作業を行うソフトウエア
化ら構成されているが、超大規模集積回路(VLSI)
ハードウエアを用いた実施例及び、ハイブリッドDSP
/VLSIを用いた実施例も可能である。
P16又はDSP32Cのような、ディジタル信号処理
装置(DSP)及び上に述べた作業を行うソフトウエア
化ら構成されているが、超大規模集積回路(VLSI)
ハードウエアを用いた実施例及び、ハイブリッドDSP
/VLSIを用いた実施例も可能である。
【0203】更に又、この技術分野の当業者であれば、
上記実施例に関連して本発明の種々の変形例を考え得る
が、それらはいずれも本発明の技術的範囲に包含され
る。尚、特許請求の範囲に記載した参照番号は発明の容
易な理解のためで、その技術的範囲を制限するよう解釈
されるべきではない。
上記実施例に関連して本発明の種々の変形例を考え得る
が、それらはいずれも本発明の技術的範囲に包含され
る。尚、特許請求の範囲に記載した参照番号は発明の容
易な理解のためで、その技術的範囲を制限するよう解釈
されるべきではない。
【0204】
【発明の効果】以上述べたごとく、本発明によれば、復
号後の可聴周波再生の高品質性を維持しながらより低い
ビットレートが得られ、圧縮をより強化できる。量子化
された可聴周波信号は従来の技術による場合よりも雑音
が少なく、符号化された場合のビット数を減少できる。
ステレオ雑音のマスキングが改善され、ステレオチャン
ネルにおける可聴周波再生品質が改善される。したがっ
て、再生後の可聴周波信号の品質を低下させずに変換圧
縮効率を高めることができる。
号後の可聴周波再生の高品質性を維持しながらより低い
ビットレートが得られ、圧縮をより強化できる。量子化
された可聴周波信号は従来の技術による場合よりも雑音
が少なく、符号化された場合のビット数を減少できる。
ステレオ雑音のマスキングが改善され、ステレオチャン
ネルにおける可聴周波再生品質が改善される。したがっ
て、再生後の可聴周波信号の品質を低下させずに変換圧
縮効率を高めることができる。
【図1】本発明の適用可能な種類の、従来技術による可
聴周波通信/記憶システムの一例を示す説明図である。
聴周波通信/記憶システムの一例を示す説明図である。
【図2】本発明の適用可能な、従来技術による知覚的可
聴周波符号器の一例を示す説明図である。
聴周波符号器の一例を示す説明図である。
【図3】しきい値計算に用いられる便利なマスキングレ
ベル差ファクタを示す線図である。
ベル差ファクタを示す線図である。
【図4】本発明に基づく分析フィルタバンクの一例を示
す説明図である。
す説明図である。
【図5】種々のウィンドウ機能の動作を示す説明図であ
る(図5(A)〜図5(E))。
る(図5(A)〜図5(E))。
【図6】ウィンドウ切り替え機能を示す流れ図である。
【図7】出力ビットストリームを得るための入力信号処
理の全体とその流れを示すブロック図である。
理の全体とその流れを示すブロック図である。
【図8】或るしきい値変動を示す線図である。
【図9】或るビット割当機能を示す流れ図である。
【図10】ビットストリームの構成を示す説明図であ
る。
る。
【図11】或るハフマン符号化作業をを示す説明図であ
る(図11(A)〜図11(C))。
る(図11(A)〜図11(C))。
【図12】符号器の作業を補間する復号器における作業
を示す流れ図である。
を示す流れ図である。
【図13】本発明の一態様に基づく或る量子化作業の流
れ図である。
れ図である。
【図14】図4のフィルタによって用いられるウィンド
ウの例を示す説明図である(図14(A)〜図14(G))。
ウの例を示す説明図である(図14(A)〜図14(G))。
101 アナログ可聴周波信号 102 前処理装置 103 ディジタルのパルス符号変調(PCM)信号 104 知覚的可聴周波符号器(PAC) 106 通信チャンネル/記憶媒体 108 知覚的可聴周波復号器 109 PCM信号 110 後処理装置 202 分析フィルタバンク 204 知覚的モデル処理装置 206 量子化器/伝送速度(レート)制御ループ処理
装置 208 エントロピー符号器 302 入力信号バッファ 304 ウィンドウ掛算器 306 ウィンドウメモリ 308 FFT(高速フーリエ変換)処理装置 310 MDCT(修正離散コサイン変換)処理装置 311 連接器 312 遅延メモリ 314 デ−タ選択器
装置 208 エントロピー符号器 302 入力信号バッファ 304 ウィンドウ掛算器 306 ウィンドウメモリ 308 FFT(高速フーリエ変換)処理装置 310 MDCT(修正離散コサイン変換)処理装置 311 連接器 312 遅延メモリ 314 デ−タ選択器
Claims (10)
- 【請求項1】 信号量子化のための装置であって、 (a)或る周波数における計算された聴覚しきい値に基
づいてしきい値スケールファクタΔ0を形成するための
手段(1303)と、 (b)前記周波数における絶対聴覚しきい値に基づいて
絶対スケールファクタΔAを形成するための手段(13
03)と、 (c)前記しきい値スケールファクタと前記絶対スケー
ルファクタとに基づいて利用スケールファクタを設立す
るための手段(1305)と、 (d)次の、(1)量子化された信号を形成するために
前記信号を前記利用スケールファクタを用いて量子化す
るステップと、(2)前記量子化された信号に付随する
コストを評価するステップと、(3)前記しきい値スケ
ールファクタと前記絶対スケールファクタとの間で前記
利用スケールファクタを調整するステップとを、前記コ
ストが許容範囲以内になるまで反復して行うための手段
(1307、1311、1315)と、からなることを
特徴とする信号量子化のための装置。 - 【請求項2】 前記装置において、 利用スケールファクタを設立するための前記手段が、 前記しきい値スケールファクタと前記絶対スケールファ
クタとの間を補間するための手段からなる、ことを特徴
とする請求項1の装置。 - 【請求項3】 前記装置において、 前記利用スケールファクタを調整するための前記手段
が、 前記しきい値スケールファクタと前記絶対スケールファ
クタとの間を補間するための手段からなる、ことを特徴
とする請求項1の装置。 - 【請求項4】 前記装置において、 コストを評価するための前記手段が、 前記量子化された信号と前記利用スケールファクタとに
付随するコストを評価するための手段からなる、ことを
特徴とする請求項1の装置。 - 【請求項5】 前記装置において、前記装置が更に、量
子化された利用スケールファクタを形成する目的で前記
利用スケールファクタを量子化するための手段からな
る、ことを特徴とする請求項1の装置。 - 【請求項6】 信号量子化のための方法であって、 (a)或る周波数における計算された聴覚しきい値に基
づいてしきい値スケールファクタΔ0を形成するステッ
プと、 (b)前記周波数における絶対聴覚しきい値に基づいて
絶対スケールファクタΔAを形成するステップと、 (c)前記しきい値スケールファクタと前記絶対スケー
ルファクタとに基づいて利用スケールファクタを設立す
るステップと、 (d)次の、(1)量子化された信号を形成するために
前記信号を前記利用スケールファクタを用いて量子化す
るステップと、(2)前記量子化された信号に付随する
コストを評価するステップと、(3)前記しきい値スケ
ールファクタと前記絶対スケールファクタとの間で前記
利用スケールファクタを調整するステップとを、前記コ
ストが許容範囲以内になるまで反復して行うステップ
と、からなることを特徴とする信号量子化のための方
法。 - 【請求項7】 前記方法において、 利用スケールファクタを設立する前記ステップが、 前記しきい値スケールファクタと前記絶対スケールファ
クタとの間を補間するステップからなる、ことを特徴と
する請求項6の方法。 - 【請求項8】 前記方法において、 前記利用スケールファクタを調整する前記ステップが、 前記しきい値スケールファクタと前記絶対スケールファ
クタとの間を補間するステップからなる、ことを特徴と
する請求項6の方法。 - 【請求項9】 前記方法において、 コストを評価する前記ステップが、 前記量子化された信号と前記利用スケールファクタとに
付随するコストを評価するステップからなる、ことを特
徴とする請求項6の方法。 - 【請求項10】 前記方法において、前記方法が更に、 量子化された利用スケールファクタを形成する目的で前
記利用スケールファクタを量子化するステップからな
る、ことを特徴とする請求項6の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US84481192A | 1992-03-02 | 1992-03-02 | |
US844811 | 1992-03-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0651795A true JPH0651795A (ja) | 1994-02-25 |
JP3263168B2 JP3263168B2 (ja) | 2002-03-04 |
Family
ID=25293693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06482293A Ceased JP3263168B2 (ja) | 1992-03-02 | 1993-03-02 | 可聴音信号を符号化する方法及びデコーダ |
Country Status (5)
Country | Link |
---|---|
US (2) | US5627938A (ja) |
EP (1) | EP0559348A3 (ja) |
JP (1) | JP3263168B2 (ja) |
KR (1) | KR970007663B1 (ja) |
CA (1) | CA2090160C (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041099A (ja) * | 2000-06-02 | 2002-02-08 | Lucent Technol Inc | マスク済み閾値表現方法、再構成方法、及びそのシステム |
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
US6625574B1 (en) | 1999-09-17 | 2003-09-23 | Matsushita Electric Industrial., Ltd. | Method and apparatus for sub-band coding and decoding |
AU2001270503B2 (en) * | 2000-05-15 | 2004-04-01 | Unilever Plc | Liquid detergent composition |
US6771777B1 (en) | 1996-07-12 | 2004-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Process for coding and decoding stereophonic spectral values |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
JP2006154851A (ja) * | 1994-03-31 | 2006-06-15 | Arbitron Inc | 音声信号にコードを含める共に復号化する装置及び方法 |
JP2007004050A (ja) * | 2005-06-27 | 2007-01-11 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化装置及び符号化プログラム |
WO2007029304A1 (ja) * | 2005-09-05 | 2007-03-15 | Fujitsu Limited | オーディオ符号化装置及びオーディオ符号化方法 |
WO2007043648A1 (ja) * | 2005-10-14 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 変換符号化装置および変換符号化方法 |
WO2007116809A1 (ja) * | 2006-03-31 | 2007-10-18 | Matsushita Electric Industrial Co., Ltd. | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
JP2010538316A (ja) * | 2007-08-27 | 2010-12-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 改良された音声及びオーディオ信号の変換符号化 |
WO2011021238A1 (ja) * | 2009-08-20 | 2011-02-24 | トムソン ライセンシング | レート制御装置、レート制御方法及びレート制御プログラム |
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
Families Citing this family (149)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE40280E1 (en) | 1988-12-30 | 2008-04-29 | Lucent Technologies Inc. | Rate loop processor for perceptual encoder/decoder |
EP0559348A3 (en) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
JP3125543B2 (ja) * | 1993-11-29 | 2001-01-22 | ソニー株式会社 | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 |
KR960003628B1 (ko) * | 1993-12-06 | 1996-03-20 | Lg전자주식회사 | 디지탈신호의 부호화/복호화 방법 및 장치 |
KR970011727B1 (en) * | 1994-11-09 | 1997-07-14 | Daewoo Electronics Co Ltd | Apparatus for encoding of the audio signal |
EP0721257B1 (en) * | 1995-01-09 | 2005-03-30 | Daewoo Electronics Corporation | Bit allocation for multichannel audio coder based on perceptual entropy |
CN1110955C (zh) * | 1995-02-13 | 2003-06-04 | 大宇电子株式会社 | 自适应地编码来自多条通道的输入数字音频信号的装置 |
DE19505435C1 (de) * | 1995-02-17 | 1995-12-07 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
EP0924962B1 (en) * | 1997-04-10 | 2012-12-12 | Sony Corporation | Encoding method and device, decoding method and device, and recording medium |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
US5913191A (en) * | 1997-10-17 | 1999-06-15 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
US6091773A (en) * | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
US6037987A (en) * | 1997-12-31 | 2000-03-14 | Sarnoff Corporation | Apparatus and method for selecting a rate and distortion based coding mode for a coding system |
US6161088A (en) * | 1998-06-26 | 2000-12-12 | Texas Instruments Incorporated | Method and system for encoding a digital audio signal |
US6128593A (en) * | 1998-08-04 | 2000-10-03 | Sony Corporation | System and method for implementing a refined psycho-acoustic modeler |
GB9819920D0 (en) * | 1998-09-11 | 1998-11-04 | Nds Ltd | Audio encoding system |
US6760316B1 (en) * | 1998-10-30 | 2004-07-06 | Broadcom Corporation | Method and apparatus for the synchronization of multiple cable modem termination system devices |
DE69939781D1 (de) * | 1998-10-30 | 2008-12-04 | Broadcom Corp | Kabelmodemsystem |
US6961314B1 (en) | 1998-10-30 | 2005-11-01 | Broadcom Corporation | Burst receiver for cable modem system |
US7103065B1 (en) * | 1998-10-30 | 2006-09-05 | Broadcom Corporation | Data packet fragmentation in a cable modem system |
US6240379B1 (en) * | 1998-12-24 | 2001-05-29 | Sony Corporation | System and method for preventing artifacts in an audio data encoder device |
JP3739959B2 (ja) * | 1999-03-23 | 2006-01-25 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
GB2349054A (en) * | 1999-04-16 | 2000-10-18 | Nds Ltd | Digital audio signal encoders |
DE60035740T2 (de) * | 1999-06-22 | 2007-12-06 | Victor Company of Japan, Ltd., Yokohama | Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen |
JP3762579B2 (ja) * | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
JP2001099718A (ja) * | 1999-09-30 | 2001-04-13 | Ando Electric Co Ltd | 波長計のデータ処理装置、及びそのデータ処理方法 |
US6499010B1 (en) * | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
TW499672B (en) * | 2000-02-18 | 2002-08-21 | Intervideo Inc | Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders |
JP4021124B2 (ja) * | 2000-05-30 | 2007-12-12 | 株式会社リコー | デジタル音響信号符号化装置、方法及び記録媒体 |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
GB0115952D0 (en) * | 2001-06-29 | 2001-08-22 | Ibm | A scheduling method and system for controlling execution of processes |
US6732071B2 (en) * | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
KR20040041085A (ko) | 2001-10-03 | 2004-05-13 | 소니 가부시끼 가이샤 | 부호화장치 및 방법, 복호화장치 및 방법, 기록매체의기록장치 및 방법 |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US8401084B2 (en) * | 2002-04-01 | 2013-03-19 | Broadcom Corporation | System and method for multi-row decoding of video with dependent rows |
US20030215013A1 (en) * | 2002-04-10 | 2003-11-20 | Budnikov Dmitry N. | Audio encoder with adaptive short window grouping |
US20040162637A1 (en) | 2002-07-25 | 2004-08-19 | Yulun Wang | Medical tele-robotic system with a master remote station with an arbitrator |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
EP2282310B1 (en) * | 2002-09-04 | 2012-01-25 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
AU2003276754A1 (en) * | 2002-11-07 | 2004-06-07 | Samsung Electronics Co., Ltd. | Mpeg audio encoding method and apparatus |
KR100908117B1 (ko) * | 2002-12-16 | 2009-07-16 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
US6996763B2 (en) * | 2003-01-10 | 2006-02-07 | Qualcomm Incorporated | Operation of a forward link acknowledgement channel for the reverse link data |
US7650277B2 (en) * | 2003-01-23 | 2010-01-19 | Ittiam Systems (P) Ltd. | System, method, and apparatus for fast quantization in perceptual audio coders |
US8023950B2 (en) | 2003-02-18 | 2011-09-20 | Qualcomm Incorporated | Systems and methods for using selectable frame durations in a wireless communication system |
US7155236B2 (en) | 2003-02-18 | 2006-12-26 | Qualcomm Incorporated | Scheduled and autonomous transmission and acknowledgement |
US20040160922A1 (en) | 2003-02-18 | 2004-08-19 | Sanjiv Nanda | Method and apparatus for controlling data rate of a reverse link in a communication system |
US7286846B2 (en) * | 2003-02-18 | 2007-10-23 | Qualcomm, Incorporated | Systems and methods for performing outer loop power control in wireless communication systems |
US8081598B2 (en) * | 2003-02-18 | 2011-12-20 | Qualcomm Incorporated | Outer-loop power control for wireless communication systems |
US8391249B2 (en) * | 2003-02-18 | 2013-03-05 | Qualcomm Incorporated | Code division multiplexing commands on a code division multiplexed channel |
US7505780B2 (en) * | 2003-02-18 | 2009-03-17 | Qualcomm Incorporated | Outer-loop power control for wireless communication systems |
US8150407B2 (en) * | 2003-02-18 | 2012-04-03 | Qualcomm Incorporated | System and method for scheduling transmissions in a wireless communication system |
US7660282B2 (en) * | 2003-02-18 | 2010-02-09 | Qualcomm Incorporated | Congestion control in a wireless data network |
US8705588B2 (en) | 2003-03-06 | 2014-04-22 | Qualcomm Incorporated | Systems and methods for using code space in spread-spectrum communications |
US7215930B2 (en) * | 2003-03-06 | 2007-05-08 | Qualcomm, Incorporated | Method and apparatus for providing uplink signal-to-noise ratio (SNR) estimation in a wireless communication |
US8477592B2 (en) * | 2003-05-14 | 2013-07-02 | Qualcomm Incorporated | Interference and noise estimation in an OFDM system |
US8489949B2 (en) | 2003-08-05 | 2013-07-16 | Qualcomm Incorporated | Combining grant, acknowledgement, and rate control commands |
AU2003302486A1 (en) * | 2003-09-15 | 2005-04-06 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
SG120118A1 (en) * | 2003-09-15 | 2006-03-28 | St Microelectronics Asia | A device and process for encoding audio data |
US7813836B2 (en) | 2003-12-09 | 2010-10-12 | Intouch Technologies, Inc. | Protocol for a remotely controlled videoconferencing robot |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
US8077963B2 (en) | 2004-07-13 | 2011-12-13 | Yulun Wang | Mobile robot with a head-based movement mapping scheme |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US8225392B2 (en) * | 2005-07-15 | 2012-07-17 | Microsoft Corporation | Immunizing HTML browsers and extensions from known vulnerabilities |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7933337B2 (en) * | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US9198728B2 (en) | 2005-09-30 | 2015-12-01 | Intouch Technologies, Inc. | Multi-camera mobile teleconferencing platform |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US7769492B2 (en) * | 2006-02-22 | 2010-08-03 | Intouch Technologies, Inc. | Graphical interface for a remote presence system |
US7835904B2 (en) * | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
FR2898443A1 (fr) * | 2006-03-13 | 2007-09-14 | France Telecom | Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants |
US8849679B2 (en) | 2006-06-15 | 2014-09-30 | Intouch Technologies, Inc. | Remote controlled robot system that provides medical images |
US8184710B2 (en) * | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US9160783B2 (en) | 2007-05-09 | 2015-10-13 | Intouch Technologies, Inc. | Robot system that operates through a network firewall |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US20090144054A1 (en) * | 2007-11-30 | 2009-06-04 | Kabushiki Kaisha Toshiba | Embedded system to perform frame switching |
US10875182B2 (en) | 2008-03-20 | 2020-12-29 | Teladoc Health, Inc. | Remote presence system mounted to operating room hardware |
US8179418B2 (en) | 2008-04-14 | 2012-05-15 | Intouch Technologies, Inc. | Robotic based health care system |
US8170241B2 (en) | 2008-04-17 | 2012-05-01 | Intouch Technologies, Inc. | Mobile tele-presence system with a microphone system |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8325800B2 (en) | 2008-05-07 | 2012-12-04 | Microsoft Corporation | Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers |
US8379851B2 (en) | 2008-05-12 | 2013-02-19 | Microsoft Corporation | Optimized client side rate control and indexed file layout for streaming media |
US7925774B2 (en) | 2008-05-30 | 2011-04-12 | Microsoft Corporation | Media streaming using an index file |
US9193065B2 (en) | 2008-07-10 | 2015-11-24 | Intouch Technologies, Inc. | Docking system for a tele-presence robot |
US9842192B2 (en) | 2008-07-11 | 2017-12-12 | Intouch Technologies, Inc. | Tele-presence robot system with multi-cast features |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
US8340819B2 (en) | 2008-09-18 | 2012-12-25 | Intouch Technologies, Inc. | Mobile videoconferencing robot system with network adaptive driving |
US8457194B2 (en) * | 2008-09-29 | 2013-06-04 | Microsoft Corporation | Processing real-time video |
US8913668B2 (en) * | 2008-09-29 | 2014-12-16 | Microsoft Corporation | Perceptual mechanism for the selection of residues in video coders |
US8265140B2 (en) | 2008-09-30 | 2012-09-11 | Microsoft Corporation | Fine-grained client-side control of scalable media delivery |
US8996165B2 (en) | 2008-10-21 | 2015-03-31 | Intouch Technologies, Inc. | Telepresence robot with a camera boom |
US8463435B2 (en) | 2008-11-25 | 2013-06-11 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US9138891B2 (en) | 2008-11-25 | 2015-09-22 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US8849680B2 (en) | 2009-01-29 | 2014-09-30 | Intouch Technologies, Inc. | Documentation through a remote presence robot |
CN101853663B (zh) * | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
US8897920B2 (en) | 2009-04-17 | 2014-11-25 | Intouch Technologies, Inc. | Tele-presence robot system with software modularity, projector and laser pointer |
US9055374B2 (en) * | 2009-06-24 | 2015-06-09 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Method and system for determining an auditory pattern of an audio segment |
US8384755B2 (en) | 2009-08-26 | 2013-02-26 | Intouch Technologies, Inc. | Portable remote presence robot |
US11399153B2 (en) | 2009-08-26 | 2022-07-26 | Teladoc Health, Inc. | Portable telepresence apparatus |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US11154981B2 (en) | 2010-02-04 | 2021-10-26 | Teladoc Health, Inc. | Robot user interface for telepresence robot system |
US8670017B2 (en) | 2010-03-04 | 2014-03-11 | Intouch Technologies, Inc. | Remote presence system including a cart that supports a robot face and an overhead camera |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) * | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US10343283B2 (en) | 2010-05-24 | 2019-07-09 | Intouch Technologies, Inc. | Telepresence robot system that can be accessed by a cellular phone |
US10808882B2 (en) | 2010-05-26 | 2020-10-20 | Intouch Technologies, Inc. | Tele-robotic system with a robot face placed on a chair |
US9264664B2 (en) | 2010-12-03 | 2016-02-16 | Intouch Technologies, Inc. | Systems and methods for dynamic bandwidth allocation |
US12093036B2 (en) | 2011-01-21 | 2024-09-17 | Teladoc Health, Inc. | Telerobotic system with a dual application screen presentation |
CN104898652B (zh) | 2011-01-28 | 2018-03-13 | 英塔茨科技公司 | 与一个可移动的远程机器人相互交流 |
US9323250B2 (en) | 2011-01-28 | 2016-04-26 | Intouch Technologies, Inc. | Time-dependent navigation of telepresence robots |
EP2689418B1 (en) * | 2011-03-21 | 2017-10-25 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for damping of dominant frequencies in an audio signal |
JP2014513320A (ja) * | 2011-03-21 | 2014-05-29 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオ信号におけるドミナント周波数を減衰する方法及び装置 |
US10769739B2 (en) | 2011-04-25 | 2020-09-08 | Intouch Technologies, Inc. | Systems and methods for management of information among medical providers and facilities |
MX345963B (es) | 2011-05-13 | 2017-02-28 | Samsung Electronics Co Ltd | Asignación de bits, codificación y decodificación de audio. |
US9098611B2 (en) | 2012-11-26 | 2015-08-04 | Intouch Technologies, Inc. | Enhanced video interaction for a user interface of a telepresence network |
US20140139616A1 (en) | 2012-01-27 | 2014-05-22 | Intouch Technologies, Inc. | Enhanced Diagnostics for a Telepresence Robot |
US8836751B2 (en) | 2011-11-08 | 2014-09-16 | Intouch Technologies, Inc. | Tele-presence system with a user interface that displays different communication links |
US9251313B2 (en) | 2012-04-11 | 2016-02-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
US8902278B2 (en) | 2012-04-11 | 2014-12-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
WO2013176760A1 (en) | 2012-05-22 | 2013-11-28 | Intouch Technologies, Inc. | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
US9361021B2 (en) | 2012-05-22 | 2016-06-07 | Irobot Corporation | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
CN104704559B (zh) * | 2012-10-01 | 2017-09-15 | 日本电信电话株式会社 | 编码方法以及编码装置 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
CN107210824A (zh) | 2015-01-30 | 2017-09-26 | 美商楼氏电子有限公司 | 麦克风的环境切换 |
US11862302B2 (en) | 2017-04-24 | 2024-01-02 | Teladoc Health, Inc. | Automated transcription and documentation of tele-health encounters |
US10483007B2 (en) | 2017-07-25 | 2019-11-19 | Intouch Technologies, Inc. | Modular telehealth cart with thermal imaging and touch screen user interface |
US11636944B2 (en) | 2017-08-25 | 2023-04-25 | Teladoc Health, Inc. | Connectivity infrastructure for a telehealth platform |
US10617299B2 (en) | 2018-04-27 | 2020-04-14 | Intouch Technologies, Inc. | Telehealth cart that supports a removable tablet with seamless audio/video switching |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3989897A (en) | 1974-10-25 | 1976-11-02 | Carver R W | Method and apparatus for reducing noise content in audio signals |
FR2412987A1 (fr) * | 1977-12-23 | 1979-07-20 | Ibm France | Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede |
JPS5931279B2 (ja) | 1979-06-19 | 1984-08-01 | 日本ビクター株式会社 | 信号変換回路 |
US4356349A (en) | 1980-03-12 | 1982-10-26 | Trod Nossel Recording Studios, Inc. | Acoustic image enhancing method and apparatus |
US4516258A (en) | 1982-06-30 | 1985-05-07 | At&T Bell Laboratories | Bit allocation generator for adaptive transform coder |
US4535472A (en) | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
CA1229681A (en) | 1984-03-06 | 1987-11-24 | Kazunori Ozawa | Method and apparatus for speech-band signal coding |
GB8421498D0 (en) | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
WO1986003873A1 (en) | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
US4790016A (en) | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
DE3506912A1 (de) | 1985-02-27 | 1986-08-28 | Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover | Verfahren zur uebertragung eines audiosignals |
US4646061A (en) | 1985-03-13 | 1987-02-24 | Racal Data Communications Inc. | Data communication with modified Huffman coding |
IL76283A0 (en) | 1985-09-03 | 1986-01-31 | Ibm | Process and system for coding signals |
JP2792853B2 (ja) | 1986-06-27 | 1998-09-03 | トムソン コンシューマー エレクトロニクス セイルズ ゲゼルシャフト ミット ベシュレンクテル ハフツング | オーディオ信号の伝送方法及び装置 |
US5924060A (en) | 1986-08-29 | 1999-07-13 | Brandenburg; Karl Heinz | Digital coding process for transmission or storage of acoustical signals by transforming of scanning values into spectral coefficients |
DE3629434C2 (de) | 1986-08-29 | 1994-07-28 | Karlheinz Dipl Ing Brandenburg | Digitales Codierverfahren |
IL80103A0 (en) * | 1986-09-21 | 1987-01-30 | Eci Telecom Limited | Adaptive differential pulse code modulation(adpcm)system |
DE3688980T2 (de) | 1986-10-30 | 1994-04-21 | Ibm | Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens. |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
GB8628046D0 (en) | 1986-11-24 | 1986-12-31 | British Telecomm | Transmission system |
DE3642982A1 (de) | 1986-12-17 | 1988-06-30 | Thomson Brandt Gmbh | System zur uebertragung |
SE458532B (sv) * | 1987-03-25 | 1989-04-10 | Sandvik Ab | Verktyg med haardmetallspets avsett att roterbart monteras i ett vaeghyvelskaer |
US4860360A (en) | 1987-04-06 | 1989-08-22 | Gte Laboratories Incorporated | Method of evaluating speech |
NL8700985A (nl) | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
JP2586043B2 (ja) | 1987-05-14 | 1997-02-26 | 日本電気株式会社 | マルチパルス符号化装置 |
EP0300775B1 (en) * | 1987-07-21 | 1995-05-31 | Matsushita Electric Industrial Co., Ltd. | Signal encoding and decoding method and device |
JPS6450695A (en) | 1987-08-21 | 1989-02-27 | Tamura Electric Works Ltd | Telephone exchange |
DE3805946A1 (de) * | 1988-02-25 | 1989-09-07 | Fraunhofer Ges Forschung | Vorrichtung zur ermittlung von charakteristischen parametern aus den eingangs- und ausgangssignalen eines systems fuer die audiosignalverarbeitung |
US5341457A (en) | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
CA2002015C (en) * | 1988-12-30 | 1994-12-27 | Joseph Lindley Ii Hall | Perceptual coding of audio signals |
US5109417A (en) | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5357594A (en) | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
US5297236A (en) | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
US5230038A (en) | 1989-01-27 | 1993-07-20 | Fielder Louis D | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5479562A (en) | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
US5752225A (en) | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
JPH03117919A (ja) | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5040217A (en) | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
DE69127842T2 (de) | 1990-03-09 | 1998-01-29 | At & T Corp | Hybride wahrnehmungsgebundene Kodierung von Audiosignalen |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5235671A (en) | 1990-10-15 | 1993-08-10 | Gte Laboratories Incorporated | Dynamic bit allocation subband excited transform coding method and apparatus |
US5274740A (en) | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
ATE138238T1 (de) | 1991-01-08 | 1996-06-15 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
US5218435A (en) * | 1991-02-20 | 1993-06-08 | Massachusetts Institute Of Technology | Digital advanced television systems |
CA2090052C (en) | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US5227788A (en) | 1992-03-02 | 1993-07-13 | At&T Bell Laboratories | Method and apparatus for two-component signal compression |
EP0559348A3 (en) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
-
1993
- 1993-02-17 EP EP19930301124 patent/EP0559348A3/en not_active Withdrawn
- 1993-02-23 CA CA002090160A patent/CA2090160C/en not_active Expired - Lifetime
- 1993-02-27 KR KR1019930003051A patent/KR970007663B1/ko not_active IP Right Cessation
- 1993-03-02 JP JP06482293A patent/JP3263168B2/ja not_active Ceased
-
1994
- 1994-09-22 US US08/310,898 patent/US5627938A/en not_active Ceased
-
2002
- 2002-08-13 US US10/218,232 patent/USRE39080E1/en not_active Expired - Lifetime
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006154851A (ja) * | 1994-03-31 | 2006-06-15 | Arbitron Inc | 音声信号にコードを含める共に復号化する装置及び方法 |
US6771777B1 (en) | 1996-07-12 | 2004-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Process for coding and decoding stereophonic spectral values |
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
US6625574B1 (en) | 1999-09-17 | 2003-09-23 | Matsushita Electric Industrial., Ltd. | Method and apparatus for sub-band coding and decoding |
AU2001270503B2 (en) * | 2000-05-15 | 2004-04-01 | Unilever Plc | Liquid detergent composition |
JP2002041099A (ja) * | 2000-06-02 | 2002-02-08 | Lucent Technol Inc | マスク済み閾値表現方法、再構成方法、及びそのシステム |
US7613603B2 (en) | 2003-06-30 | 2009-11-03 | Fujitsu Limited | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
JP2007004050A (ja) * | 2005-06-27 | 2007-01-11 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化装置及び符号化プログラム |
WO2007029304A1 (ja) * | 2005-09-05 | 2007-03-15 | Fujitsu Limited | オーディオ符号化装置及びオーディオ符号化方法 |
US8135588B2 (en) | 2005-10-14 | 2012-03-13 | Panasonic Corporation | Transform coder and transform coding method |
WO2007043648A1 (ja) * | 2005-10-14 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 変換符号化装置および変換符号化方法 |
JP4954080B2 (ja) * | 2005-10-14 | 2012-06-13 | パナソニック株式会社 | 変換符号化装置および変換符号化方法 |
US8311818B2 (en) | 2005-10-14 | 2012-11-13 | Panasonic Corporation | Transform coder and transform coding method |
WO2007116809A1 (ja) * | 2006-03-31 | 2007-10-18 | Matsushita Electric Industrial Co., Ltd. | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
JP2010538316A (ja) * | 2007-08-27 | 2010-12-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 改良された音声及びオーディオ信号の変換符号化 |
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
WO2011021238A1 (ja) * | 2009-08-20 | 2011-02-24 | トムソン ライセンシング | レート制御装置、レート制御方法及びレート制御プログラム |
JP5539992B2 (ja) * | 2009-08-20 | 2014-07-02 | トムソン ライセンシング | レート制御装置、レート制御方法及びレート制御プログラム |
US9159330B2 (en) | 2009-08-20 | 2015-10-13 | Gvbb Holdings S.A.R.L. | Rate controller, rate control method, and rate control program |
Also Published As
Publication number | Publication date |
---|---|
USRE39080E1 (en) | 2006-04-25 |
EP0559348A3 (en) | 1993-11-03 |
CA2090160C (en) | 1998-10-06 |
CA2090160A1 (en) | 1993-09-03 |
JP3263168B2 (ja) | 2002-03-04 |
EP0559348A2 (en) | 1993-09-08 |
KR930020412A (ko) | 1993-10-19 |
KR970007663B1 (ko) | 1997-05-15 |
US5627938A (en) | 1997-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3263168B2 (ja) | 可聴音信号を符号化する方法及びデコーダ | |
KR970007661B1 (ko) | 스테레오포닉 오디오 신호의 입력세트 코딩방법 | |
EP0564089B1 (en) | A method and appartus for the perceptual coding of audio signals | |
US5301255A (en) | Audio signal subband encoder | |
Shlien | Guide to MPEG-1 audio standard | |
US5623577A (en) | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions | |
EP0709004B1 (en) | Hybrid adaptive allocation for audio encoder and decoder | |
EP0966108B1 (en) | Dynamic bit allocation apparatus and method for audio coding | |
EP0424016B1 (en) | Perceptual coding of audio signals | |
KR100277819B1 (ko) | 심리음향성 적응 비트 할당을 이용한 다중 채널 예측 분할대역부호화기 | |
EP0799531B1 (en) | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system | |
KR100397690B1 (ko) | 데이터부호화장치및그방법 | |
EP1080462B1 (en) | System and method for entropy encoding quantized transform coefficients of a signal | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
EP0775389B1 (en) | Encoding system and encoding method for encoding a digital signal having at least a first and a second digital signal component | |
KR100477701B1 (ko) | Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치 | |
JPH06242797A (ja) | 変換符号化装置のブロックサイズ決定法 | |
Davidson | Digital audio coding: Dolby AC-3 | |
USRE40280E1 (en) | Rate loop processor for perceptual encoder/decoder | |
EP1046239B1 (en) | Method and apparatus for phase estimation in a transform coder for high quality audio | |
GB2322776A (en) | Backward adaptive prediction of audio signals | |
Markel | Highlights of a group effort in algorithmic development for packet-switched voice networks | |
JPH05114863A (ja) | 高能率符号化装置及び復号化装置 | |
KR19990041758A (ko) | 디지탈 오디오 부호화장치 | |
JPH06291679A (ja) | オーディオ信号のためのしきい値制御量子化決定法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RVOP | Cancellation by post-grant opposition |