JP2003523662A - データ圧縮方法及びデータ圧縮装置 - Google Patents

データ圧縮方法及びデータ圧縮装置

Info

Publication number
JP2003523662A
JP2003523662A JP2001556968A JP2001556968A JP2003523662A JP 2003523662 A JP2003523662 A JP 2003523662A JP 2001556968 A JP2001556968 A JP 2001556968A JP 2001556968 A JP2001556968 A JP 2001556968A JP 2003523662 A JP2003523662 A JP 2003523662A
Authority
JP
Japan
Prior art keywords
original signal
representation
coder
compression
compression system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001556968A
Other languages
English (en)
Other versions
JP2003523662A5 (ja
Inventor
シドレンコ,マーク,アール.
Original Assignee
シドレンコ,マーク,アール.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シドレンコ,マーク,アール. filed Critical シドレンコ,マーク,アール.
Publication of JP2003523662A publication Critical patent/JP2003523662A/ja
Publication of JP2003523662A5 publication Critical patent/JP2003523662A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 近似の再生信号(図1,38)と原信号(図1,20)間の知覚距離(図1、ブロック14,16及び18)の測定システムを提供する。前記知覚距離は人間が前記原信号を再生された近似から識別できる蓋然性である。本システムは再生された信号が人間によって判定された時に原信号に知覚的に類似するように、適応性のある量子化(図1、ブロック14及び28)によってビットを割り当てるため使用される。

Description

【発明の詳細な説明】
【0001】 関連出願とのクロスリファレンス 本出願は、本願へ参照して含めている1996年11月12日付出願の米国仮
特許出願番号60/030,806(代理人摘要番号SYD−001Xq800
)の利益を請求ものである。 合衆国後援研究開発に関する記述 該当しない。 発明の技術分野 本発明は全般的には音声及び映像符号化(圧縮とも呼ばれる)技術に関し、よ
り詳細には近似的に再生された知覚信号(例えば音声信号あるいは映像信号)が
人間によって元の知覚信号から識別可能かどうかの判定に関する。
【0002】 発明の背景 音声あるいは映像符号化技術の主要な課題は視聴者が元の(符号化されていな
い)信号と僅かな相違しかなくあるいは全く相違を見出せない信号を再生する性
能にある。例えば、よい音声圧縮技術は(市販のオーディオコンパクトディスク
あるいはCDのような)高質表示の音声信号を取り込んでその入力表示よりも少
ないビットしか必要としないよりコンパクトな表示へと変換する。このコンパク
トな表示から元の高質な表示に近似した表示へと再生できる。音声信号をコンパ
クト化あるいは圧縮する方法には、入力信号中のすべての情報を保存する「無損
失」(「無ノイズ」とも呼ばれる)技術及び/または入力信号中の情報、特に重
要性の低い情報を廃棄する「損失」(「ノイズ」とも呼ばれる)圧縮技術が取り
入れられる。
【0003】 現行の損失圧縮技術は一般的には信号源のモデルあるいはレシーバーのモデル
(通常は人間の耳あるいは眼)に基づくものである(Jayant,‘93)。
音声信号を圧縮する発声管モデルを使用するボコーダーは音声源モデルに基づく
圧縮技術の例である。人間の音響心理学的しきい値(例えばマスキングしきい値
)のモデルを使用する知覚符号器はレシーバーに基づくモデルの例である。
【0004】 「知覚心理的音声符号化」に関する方法あるいは単に「知覚音声符号化」技術
を取り入れる従前技術は、符号化された信号の聴覚マスキング特性を少なくとも
部分的にマスクへと高めるか、あるいは圧縮処理によって発生する符号化ノイズ
を潜在させるものである。かかる符号器は一般的に信号の周波数スペクトルを音
響心理学的な「臨界帯域」へと分離して、各臨界帯域について隣接する帯域(マ
スキングの拡散と呼ばれる)とともに現在の帯域中の信号特性に基づいてマスキ
ングしきい値を計算する。計算されたマスキングしきい値に基づいて、これら知
覚音響符号化方法は信号を再量子化することにより、各帯域において生じた符号
化ノイズが計算されたマスキングしきい値に近接あるいはそれ以下になるように
圧縮を実行する。本願開示の方法は音声符号化への知覚的アプローチとして説明
できるが、かかる方法においては音響心理学的臨界帯域あるいはマスキングしき
い値計算は使用されていない。むしろ、本願開示の方法では神経生理的情報容量
に関する概念が有利に取り入れており、また脳中で原信号によって生成される表
示に類似する神経表示を再生するのに必要な圧縮された信号の忠実性を量子化す
る技術が使用されている。
【0005】 発明の要約 本願開示の方法及び装置は、近似の再生された(音声あるいは映像信号等の)
知覚信号と原知覚信号間の「知覚距離」を測定することを目的として提供される
ものである。ここで知覚距離とは、視聴者が再生された原音声あるいは映像信号
に近似の信号から原音声あるいは映像信号を識別できる可能性に関する直接的な
定量的基準である。
【0006】 本願開示の方法及び装置は、音声及び映像符号化(音声及び映像圧縮とも呼ば
れる)技術の分野において種々応用される。ここで説明される方法はノイズ圧縮
技術へ適用され、該方法は原信号の再生されたノイズ表示が視聴者によって元の
表示から識別され得る可能性を予測することを可能とするものである。ここに記
載された実施態様は、本願記載の方法が音声及び映像圧縮アルゴリズムにおいて
圧縮された表示から再生された信号が視聴者によって判定されたときに元の入力
信号と知覚的に類似するようにビットを割り当てるためにどのように利用できる
かを示すものである。
【0007】 本願記載の方法は音声及び映像信号の圧縮において用いられる現行のアプロー
チと対比されるものである。本願記載の方法は人間の知覚能力の神経生理的限界
に関する未発表の理論に基づくものである。この理論において最も重要な要素は
「神経符号化モデル」(NEM)であり、これは簡単に言えば知覚信号を人間の
脳中に表示する方法である。このNEMはレーダーの目標探知における研究から
発展した分野であり、知覚入力の相違から生ずる神経表示における相違の検出能
力を統計的に定量するための数学的枠組を与える「検出理論」と関連して分析さ
れる。従って本願記載の方法は音響心理学的あるいは「マスキング」現象に基づ
く情報源モデル技術あるいはレシーバーモデル技術のいずれをも含むものではな
い。むしろ、本願記載の方法及び装置は近似的に再生された信号中の動揺(ノイ
ズ)に対する知覚能力を定量するために検出理論から導かれた拡大部分を含む神
経生理的な基盤を置くレシーバーモデルを与えるものである。このNEMアプロ
ーチは種々公表された音響心理学的データ(マスキング及び多くの他の現象を含
む)を予測する能力を発揮することによって有効とされてきた。
【0008】 詳細な説明 1.概要 説明を明瞭にするため、原信号の近似の表示と原信号自体間の知覚距離を測定
する本願記載の方法及び装置の実例となる実施態様をここでは「プロセッサ」と
記載した機能ブロックを含む個々の機能ブロックで構成して示してある。これら
のブロックが与える機能は、限定されないがソフトウェアを実行できるハードウ
ェア(例えば状態機械)を含む共有のあるいは専用のハードウェアを用いて実行
できる。しかしながら、前記用語「プロセッサ」の使用がソフトウェアの実行が
可能なハードウェアを排他的に指すと解釈されてはならない。実例となる実施態
様には、単独あるいは組合せとして、デジタル信号プロセッサ(DSP)ハード
ウェアあるいはパーソナルコンピューター(PC)及び以下で検討する操作を実
行するソフトウェアが含まれている。本願開示のシステムを実現するに際しては
、本発明に係る極めて大規模な積分(VLSI)ハードウェアによる実施態様を
複合DSP/VLSIによる実施態様と同様に採用することもできる。これらの
特定された実行手段は例示であってすべての適する代替手段を網羅したリストを
示すものではない。
【0009】 符号器 図1は本願開示の発明に係るシステム10の実施態様を示す図である。この一
般化されたブロック図は本発明が提供する符号器あるいは「コーダ」を示すもの
で、従来技術において既知のシステムへ本願で説明する特定の特徴を加えて為し
た改良を示すものである。符号器はデコーダとともに(合わせてコーデックと呼
ばれる)、デジタル符号化されたデータ(圧縮)を記憶し伝送するために及びデ
ータを再生(減圧)するために必要なビット数を減らす役割をそれぞれ担ってい
る。本発明はデータが音声あるいは映像知覚情報のいずれかのデジタル情報源表
示12である場合に適用される。図示された符号器では1または2段階の圧縮が
行われる。(1)「損失」(またはノイズ)コーダ14による圧縮で、音声ある
いは映像を表示するのに必要なビット数を情報処理により減少させてその表示へ
ノイズ(歪み)を加える。あるいは別の選択として、(2)「無損失」(または
ノイズレス)コーダ16による圧縮があり、これはすべての情報内容を保存しな
がら局所データ冗長構成を取り除くことによってビット数をさらに減少させかつ
低ビット速度表示を生成するものである。かかる無損失技術は当業者によって総
称的にエントロピー符号化と呼ばれるものである。
【0010】 本願開示の発明は、発明の一部として、損失コーダ14におけるあるいはそれ
に関連する革新的進歩を提案するものである。特に、原信号と比較したときに再
生された信号中に認められる歪みを情報処理的に最小化するビット割り当て方法
及び装置18を損失コーダと結合することが望ましい。ビット割り当て方法を可
能とする構成部18と損失コーダ14との構成の一実施態様を図1に示した。ビ
ット割り当て方法を可能とする構成部18は二つの入力を受け取る。(1)一つ
は前記損失コーダ14への入力でもある高ビット速度情報源信号表示20であり
、及び(2)もう一つは損失コーダ14からの出力である変換され及び/または
再量子化された信号表示22である。これらの二つの入力20、22の分析に基
づいてビット割り当て方法構成部18はビット割り当て命令24を損失コーダ1
4へ出力する。
【0011】 本発明は前記ビット割り当て方法及び装置18に基づいて前記損失コーダ段階
14において最適ビット割り当てを決定する根本的に新規な方法及び装置を提案
するものである。この提案に係る方法は人間の脳中の神経系の知覚信号表示の理
解における最近の進歩に基づくものである。本発明に係る方法は入力知覚信号に
対して人間の脳により行われる神経生理的変換のうちの計算に関する効率的な概
要を取り入れたものである。これら総称的に「神経符号化モデル」(NEM)2
6a、26bと呼ばれる計算の概要は入力信号20、22の神経系に基づく表示
を生成するために用いられる。図1は2つの計算神経表示のそれぞれを単一の個
別プロセッサラベル化神経系符号化モデル(NEM)26a、26bとして集合
的に示している。図1において、NEMプロセッサ26a、26bは以下の二つ
の信号それぞれの神経表示を生成するのに使用される。これら二つの信号とは(
1)元の高ビット速度情報源信号20、及び(2)損失コーダ出力22から再生
された信号38である。後者の再生された信号38は損失コーダ14へ入力され
た高ビット速度表示20の近似を本質的に再生する損失デコーダ36によって与
えられる。この損失デコーダ36は伝送及び/または記憶媒体34と連絡したを
行うデコーダにおいて使用される同じ損失デコーダであることが好ましい。二つ
の前記NEM表示30a、30bは次の処理ブロックである「知覚距離計算」2
8への入力として働く。
【0012】 本発明に係る方法及び装置は、元々レーダー目標識別能力を分析するために開
発された数学的/統計的枠組みとしての検出理論領域を損失コーダ14の圧縮さ
れた出力22中におけるビットの最適な割り当て計算方法を開発するために追加
的及び有利に拡大するものである。(イタリック体の用語はここでは検出理論分
野の専門家によって認識される厳密な定義及び使用法に従って用いられている)
。本願発明方法において、最適なビット割り当てとは元の情報源20と損失コー
ド化された信号22間の相違(例えば歪み)の知覚が最小化されるかあるいは気づ
かれない程度に減じることと定義される。このため、本願開示の方法は前記二つ
のNEM表示30a、30bの識別能力に直接関係する「知覚距離」量を算定す
る。別言すれば、前記二つのNEM出力30a、30b(図1参照)が人間の脳
中に惹起された神経表示を即座に反映するとの仮定に立って、前記「知覚距離計
算」プロセッサ28(図1参照)が人間により二つの表示30a、30bを識別
できる蓋然性を算定する。この識別能力(知覚距離)計算は視聴者がNEM表示
30a,30bの理想的なレシーバーであることを仮定し、従って人間は最大効
率で活動する(例えば「金色の耳」あるいは「音楽的に訓練された」と俗に言わ
れる)との本質的仮定に立脚するものである。
【0013】 前記ビット割当て構成部18及びコーダ14は、損失コード化された信号22
及び最終的には前記低ビット速度表示32における最適ビット割当てへと収束す
る計算ループ(図1参照)を形成している。最適ビット割当ては以下の二つの制
約のいずれかの下で達成される。(1)一つはユーザーが特定する知覚距離しき
い値を超えずにビット数を最小化する割当てを計算する制約であり、もう一つは
(2)ユーザーが特定したビット数を用いて知覚距離を最小化する割当てを計算
する制約である。(1)の制約の下ではビット割当て方法構成部18とコーダ1
4の組合せは、情報源20と損失コーダ入力22間の相違を識別する人間の能力
が所定のしきい値を決して超えないようにビット速度の減少された表示22を生
成する。(2)の制約の下では、ビット割当て方法構成部18とコーダ14の組
合せは、相違を識別する人間の能力が最小となるようにビット速度が一定の表示
22を生成する。
【0014】 このため、図1に概説したシステムは二つの方式、(1)可変ビット速度方式
、あるいは(2)一定ビット速度方式のいずれかで作動することができる。これ
ら方式の各々にはその利用によって特定の利点がある。可変ビット速度方式にお
いては、システム10は一定の知覚距離しきい値を超えずにコード化された信号
22を示すために必要な最少のビット数を割当てるので、可変ビット速度方式は
再生品質が特に重要でありビット速度の変更が許容される利用に適している。一
定ビット速度方式に関しては、システム10はコード化された表示22へ所定の
ビット数を割当てながら知覚距離を最小とする。従って一定ビット速度方式は一
定のデータ速度を期待され(例えば通信システム)、かつ再生品質の変動を許容
できる利用に適している。
【0015】 損失コーダ14の出力である低ビット速度表示22は一実施態様においては直
接に伝送及び/または記憶媒体34へ与えられる。別の実施態様においては、損
失コーダ14の出力である低ビット速度表示22は当該技術分野において既知で
ある無損失コーダ16等を介して有効化される前に前記伝送及び/または記憶媒
体へと向けられる。
【0016】 本願開示の方法及び装置の他の実施態様においては、本開示において説明され
検討された広汎な単一チャネル態様の多チャネルへの適応例も含まれる。単一チ
ャネルの実施態様には立体かつカラー(例えばRGBチャネル)のビデオ及び立
体かつ「取り巻き型の」(例えば3以上のチャネル)オーディオ等のマルチチャ
ネルへの適用例もさらに含まれる。マルチチャネルの変形には各チャネルへの本
願開示の単一チャネル態様の繰り返し、及び当業者に既知のマルチチャネル技術
(例えば相互チャネル情報の立体のL+R,L−R表示でのコード化、サブチャ
ネル帯域幅の減少のためのスペクトルろ過技術の利用など)との組合せが含まれ
る。
【0017】 デコーダ 本願開示の発明によれば、デコーダの一実施態様において、デコーダは前記伝
送及び/または記憶媒体34を介して元の情報源信号20の低ビット速度表示3
2へインターフェースで連結されて逆順序で符号器操作を行うことにより元の情
報源信号20の複製を再生する。このように図1の符号器10へインターフェー
スで連結されたデコーダには、ビット割当て方法機能ブロック18において使用
される損失デコーダ36と機能的に同等なものが後続する無損失デコーダ(実質
的には無損失コーダ16と逆のもの)が含まれている。図1に具体化された符号
器10の出力には、元の情報源信号20を再生する損失コード化された信号22
を変換及び/または量子化するために必要なビット割当て情報とともにエントロ
ピーコード化された信号32を取り出すために必要なデータフォーマット情報が
含まれている。デコーダは、前記ビット割当て方法18は例外として、前記信号
20を再生する順序と逆の順序で図1に具体化されたシステムの処理を実行する
【0018】 無損失コーダ16機能を利用しない前記符号器10の一実施態様へインターフ
ェースで接続されたデコーダは同様に相補性損失デコーダより先に相補性無損失
デコーダを省略しているものである。
【0019】 2.実施例−音声コード化 本発明を最良の形態で実施するための実施態様を音声信号符号化と映像信号符
号化に分けて別個に説明する。音声信号符号化と映像信号符号化の実施は主にビ
ット割当て方法構成部18(図1参照)との関連における神経符号化モデル26
a,26bの詳細においてのみ異なるものである。その他においては、音声及び
映像の両装置は知覚距離計算28(図1)、ビット割当て方法18、及び二つの
主要な操作方式(可変及び一定ビット速度)への同一のアプローチも含めて本質
的には前記概説の欄で述べた同一の方法論を共有している。音声符号化装置の説
明は同時に図1の一般化された実施態様の計算冗長構成を減じる音声及び映像符
号化の双方へ適用可能な変形についても説明するものである。
【0020】 音声符号化の概要 図2は本発明に係る音声信号符号器40の一実施態様を示す。このシステムの
目的は高ビット速度情報源音声50の歪みの少ない低ビット速度表示62を提供
することである。本実施態様においては、対応するNEM56(以下で図3及び
4において説明)が入力信号50の完全再生変換(前記入力信号50が前記NE
M56の出力信号57から正確に再生できる意味においての「完全再生」)を行
う。完全な再生NEM変換はNEM56を損失コーダ44中へ組み入れることに
よって計算に要する諸経費を減らすために用いられる。図2を図1と比較すると
、この望ましい構成から1のNEMプロセッサ26a,26bが取り除かれてい
ることが分かる。
【0021】 図3は前記神経符号化モデル(NEM)56の第一の実施態様を示すものであ
る。この実施態様は音声コーデックに関する最良様式のパラメーターについても
説明するものである。この例においてNEM56はデータ窓掛け機能100、他
に帯域フィルター列102、光圧縮非線形性104、及び包絡線検波器106か
ら構成される。図3に具体化されたシステムは人間における聴覚情報の処理に関
与が知られている主要な生理的要素の概要を示すものである(Pickles, ’82; B
erlin, ’84; Irvine, ’86; Sydorenko, ’92; Wang, ’94)。しかしながら、
この基本構造の特定の最良形態の変形(以下で説明)が聴覚生理分野の公表され
た文献とも音声信号処理分野における先行技術とも一致しないことは聴覚生理及
び音声符号化分野の専門家であれば明らかであろう。
【0022】 前記データ窓掛けプロセッサすなわち図3のラベル付き時間窓100は入力デ
ータ流50の連続ブロックの窓掛け操作を行う。データの連続ブロックは時間に
関して重複する可能性があり、またデータブロックは次の帯域フィルタープロセ
ッサ102と共に完全な再生を確保しつつデータ冗長構成を有利に取り除く最近
公表された臨界サンプリング技術(以下で説明)によって任意に再度サンプリン
グできる。
【0023】 本願開示の発明の第一の実施態様においては、データ窓掛け期間は100−4
00ミリ秒の範囲内である。かかる窓掛け期間の選択は知覚距離計算58に直接
関連しており、また「神経生理的バッファー長」にも直接基づいているものであ
る。知覚距離計算に関する神経生理的バッファー長とは脳が一時に分析できる知
覚信号の最大期間を表すものである。検出理論分野の専門家は窓(神経生理的バ
ッファー)長の選択が知覚距離計算58の予測正確性に関して臨界的な関係をも
つことを認識している(Peterson, ’54; Proakis, ’89)。音響心理学分野の
専門家ならば、神経生理的バッファー長は人間の振幅変調検知しきい値(Fletch
er, ’95)に関係があるのでおよそ300ミリ秒であると認識している。音声符
号化分野の専門家は、100−400ミリ秒の窓長は実質的に現行の実施よりも
長く(Veldhuis, ’92; Jayant, ’93)、従前技術に見られるものよりもかなり大
きいと認識している。
【0024】 図3に示された実施態様の先に仄めかされた一変形例においては、データ窓掛
け機能100は窓を2以上の同一で期間の短いサブウィンドーへと有利に分割で
きる。音声符号化分野の専門家ならば、短い窓は前エコー制御及びI/O遅延(
リアルタイムアプリケーション用)に関して有利な特性をもつことを認識してい
る。期間の短いサブウィンドーは、知覚距離計算プロセッサ58のための望まし
い最良形態の窓期間を保持しながら、システムに短い窓の特性から利益を得るこ
とを可能とする。例えば、窓掛けプロセッサ100は連続する(部分的に重なり
合う)50ミリ秒の窓を窓掛けしてそれらの窓を次の帯域フィルタープロセッサ
102へ渡す。包絡線検波プロセッサ106は200ミリ秒のFIFOバッファ
ーを維持できる。連続する50ミリ秒のデータサブウィンドーが200ミリ秒バ
ッファー中で最も古い50ミリ秒のデータサブウィンドーを置き換えるにつれて
、損失コーダ44ビット割当て方法ループは200ミリ秒バッファー窓中の全て
のデータに関連する最新の50ミリ秒のサブウィンドーを処理する。前記の例は
、知覚距離計算58窓の期間がおよそ100−400ミリ秒である条件での窓と
サブウィンドー期間の何らかの組合せを包含する複数の実施態様の特定の一例で
ある。
【0025】 図3の帯域フィルター列102は窓掛けされた信号52を複数のチャネルへと
分解し、すべてのチャネルに渡る総和が入力データ52を完全に再生するように
各チャネル出力は連続的な周波数帯域中の窓掛けされたデータの時間領域表示に
なっている。前記フィルター列102を実行するため多様な手法を用いることが
でき、本発明の実施に決定的となる特定の手法があるわけではない。使用可能な
フィルタリング方法の例としては、いわゆる有限インパルス応答(FIR)フィ
ルター及び無限インパルス応答(IIR)フィルター(Oppenheim, ’75; Hammin
g, ’89)、多項フィルター等の手法を用いる装置、あるいは離散フーリエ変換(
DFT)、高速フーリエ変換(FET)、有限コサイン変換(DCT)、直角ミ
ラーフィルター(QMF)、時間領域別名桁落ち(TDAC)(Esteban, ’77;
Princen, ’86)等の変形がある。これら列挙した手法は単に適する手法を例示
したものであってこれらが全てであることを意図するものではない。
【0026】 最良の形態においては、帯域フィルター102はすべてほぼ100−400ヘ
ルツの範囲内の帯域幅をもつ。時間窓100期間と同様に、フィルター幅の選択
は知覚距離計算58に直接関係するものであり、また「神経生理的チャネル帯域
幅容量」とも直接関係するものである。神経生理的チャネル帯域幅容量は単一の
神経生理的チャネルによって符号化が可能な最大振幅変調帯域幅を説明するもの
である。知覚距離計算58は各チャネルについて個別に知覚距離(識別能力)を
計算する(以下で詳述する)。それゆえ、検出理論分野の専門家はフィルター帯
域幅の選択が知覚距離計算(Peterson, ’54; Proakis, ’89)の予測正確性に関
して臨界的な関係をもつことについて認識している。音響心理学的及び聴覚神経
生理学分野の専門家はこれらのフィルター幅がかなり狭く、また聴覚チャネル(
「臨界的帯域」として知られる)(Pickles, ’82; Fletcher, ’95)に関して報
告されているように中心周波数とともに変動しないことを認識している。音声符
号化分野の専門家は100−400ヘルツの副帯域幅が現行の実施幅よりもかな
り狭く(Veldhuis, ’92; Jayant, ’93)、また従来技術において見出された幅よ
りかなり狭いことも認識している。
【0027】 図3に示す実施態様のNEM56の最後の二つの副プロセッサ、圧縮非線形性
104及び包絡線検波器106は条件付で任意である。概念的に、包絡線検波器
は本発明の実施にとって重大な要素である。しかしながら、以下の説明において
明確になるが、例示した全般的実施態様における変形ではNEMプロセッサモジ
ュール56中にかかる副プロセッサを明確に含んでいなくとも包絡線検波器10
6の機能上の重要性が保持されている。
【0028】 厳密な形での圧縮非線形性104は実施上システム40の性能との関連におい
ては重要ではない。従って、圧縮非線形性104は効率性に関しては例示した実
施態様の変形においては除外してもよい。好ましい実施態様においては、圧縮力
の緩やかな瞬間非線形性の形態を取るために非線形性を必要とする。よい候補は
、下記式で表される(ミュー法則圧縮との類比における)対数関数または指数関
数に似る。 入力=│入力│α x sign(入力) 式中、1/3 ≦ α≦ 1, │χ│はχの絶対値、sign(χ)はχ>0ならば1、χ=0なら
ば0、χ<0ならば-1である。 生理学的には、前記圧縮非線形性104は人間の蝸牛と神経生理的処理の圧縮に
関する貢献度の総和を示す(Pickles, ’82; Wang, ’94)。
【0029】 包絡線検波器106(あるいは復調器)プロセッサは入力から搬送波信号を除
去してその変調器信号(ヒルベルト包絡線)をその出力57として通過させる。
その周波数領域において、これはその通過帯域中のすべての周波数成分をゼロへ
向かってその通過帯域中の最も低い周波数に等しい量まで移すことに等しい。包
絡線検波器106の出力は包絡線検波器への入力からもたらされたヒルベルト包
絡線の臨界的にサンプリングされた表示である。検波器106出力信号57の臨
界的再サンプリングによって、(すべての帯域に渡って総和された)全体のサン
プリング速度は入力情報源サンプリング速度のレベルまで減少される。デジタル
信号処理分野の専門家に周知である多様な基本的技術を包絡線検波器プロセッサ
106を実行するために用いることができる。但しこれら技術の選択は本発明の
実施に関して決定的な構成要素ではない。
【0030】 図3に示した実施態様の変形においては、圧縮非線形性プロセッサ104が包
絡線検波器プロセッサ106の(前よりもむしろ)後に設置されている。かかる
構成とすることには、包絡線検波器106以降のビット速度の減少による非線形
性プロセッサ104への計算負荷を低減すること、及びNEMプロセッサ56の
特定周波数領域装置において計算効率を高めること等、本発明の特定の実施形態
によっては利点がある(以下に一例を挙げる)。
【0031】 図3のNEM56の出力57は、それが図2のコーデックシステムの実施態様
へ組み入れられた場合、(1)損失再量子化器プロセッサ44a、及び(2)知
覚距離計算プロセッサ58への入力として働く。図3のNEMプロセッサ56の
出力57は窓掛けされた入力情報源信号52の完全再生表示を含むものである。
このNEM表示57は知覚距離計算58の制御の下で再量子化されて損失コーダ
44の出力110となる。
【0032】 再量子化器モジュール44aは減らされたビット数を用いて前記入力57の近
似値を表す。前記再量子化を実行するために多様なベクター量子化手法が用いら
れる(Jayant, ’76)。各チャネルあるいはチャネル群についての直接的アプロー
チとして、群規模因数(あるいはステップサイズとも呼ばれる)を計算すること
、及び数の減らされた量子化レベルを選択して各NEM係数57を近似させるこ
とが挙げられる。再量子化器44aの出力110は無損失コーダ46(図1の無
損失コーダ46と同一あるいは実質的に同等)への損失コーダ44の出力を示し
、またこの出力は損失コーダの一部、すなわち図1に関連して記載されたビット
割当て方法ループとして知覚距離計算58へと渡される。図1に示すように、損
失コーダすなわち図2のビット割当て方法ループには、再量子化器44aへの入
力57の損失再生である信号59を発生するデコーダ66が含まれている。この
デコーダ66は伝送及び/または記憶媒体64と連絡を行う相対するデコーダ中
に使用されているデコーダと同一であるか少なくとも殆ど同種のものであるのが
理想的である。
【0033】 図4は知覚距離計算の一実施態様の図解である。知覚距離計算は以下の式に基
づくものである。 知覚距離(帯域#i)=差エネルギー(i)/ノイズエネルギー(i) χi jはi番目のNEM帯域(NEMの出力)のj番目の包絡線係数、 уi jはi番目の再量子化器帯域(再量子化器の出力)のj番目の包絡線係数、及
び 0≦βi ≦1 (本文参照)を表す。
【0034】 知覚距離は、いずれか一定の帯域について妥当に評価される場合、人間が元の
情報源信号と標準的音響心理学的識別パラダイム(例えば2区間を強いられた選
択、2IFC課題)(Green, ’66; Peterson, ’54)において復号され再量子化
された損失信号とを識別できる見込み(蓋然性の確率)の測定基準である。本願
開示の発明に関して、知覚距離とは情報源と損失符号化された信号間の相違につ
いての知覚認知力が増大するにつれてその値が増大する測定基準のことである。
一般的にはこの知覚距離を小さく保持することによって損失符号化による歪みが
視聴者により検出される確率が低減される。
【0035】 前記知覚距離式の分母、すなわちノイズエネルギー(上記式参照)は神経表示
の変動性あるいは変化のレベルを表すものである。一般的に、神経変化は信号レ
ベルよりも幾分低い速度で増加するので(Li, ‘91参照)、神経変化は信号レベル
の増加に伴って幾分比例的に増加する。後者の現象は緩やかな圧縮関数f(x)を前
記ノイズエネルギー式(上述)へと適用することによって知覚距離プロセッサ58
a中へ組み込まれる。上記ノイズエネルギー式中の圧縮関数f(x)は実施態様によ
って以下に示すように多様な形態を取ることができる。 f(χ)= χ(1-χ/α)、式中、α > 2* (χの最大絶対値)、または f(χ)= χα、式中 0.7 ≦ α≦ 1 上記関数に類似する性質をもついずれの圧縮関数も本発明の実施に用いることが
出来る。本願開示の発明の一実施態様では、関数f(x)の選択の一方法として、圧
縮関数をすべて省略して f(x)=xとしている。
【0036】 知覚距離プロセッサ58a中へ取り込まれている前記隣接帯域エネルギー式は
、蝸牛内でのエネルギー(興奮)の拡がりや収束性の神経処理等の生理的メカニ
ズムを介して近隣の帯域から与えられるノイズを表すものである(Pickles, ’82
; Sydorenko, ’92)。帯域エネルギー121の割合に比例して、隣接帯域エネル
ギー121aはノイズエネルギー式(上記参照)の全体のうちの断片的量につい
て寄与している。隣接帯域が寄与するエネルギーは、中心帯域からの距離の増加
に伴い、人間におけるマスキングの拡がりについての音響心理学的測定と一致す
る形で減少する。従って、上記隣接帯域エネルギー式中の加重要因の数値、□は
、人間におけるマスキングの拡がりを定量するために発表された種々の測定法を
用いて直接求めることができる。
【0037】 総括すれば、上記の図2、3及び4に示すシステムはデジタル音声情報を圧縮
する作業を行うものである。情報源音声を表すために必要なビット数は損失コー
ダ44以降減少し、また無損失コーダ46以降さらに減少する。損失コーダ44
において音声表示はNEM表示へと変換される。NEM表示は、各帯域について
、知覚距離が特定の知覚距離しきい値以下に保持されるように知覚距離計算58
によるビット割当てを用いて再量子化される44a。再量子化器44a及び知覚
距離計算58は最適ビット割当てをサーチする、すなわちいずれの帯域において
も特定の知覚距離しきい値を超えることなく信号を表示するために必要な最小ビ
ット数を割り当てる計算ループを形成する。可変ビット速度モードで作動してい
る場合は、システムはユーザーが特定した一定の知覚しきい値で作動する。一定
ビット速度モードで作動する場合は、計算ループはシステムの出力時におけるビ
ット速度を付加的に(無損失コーダ/データフォーマッター以降で)モニターす
る。情報源音声の性質から独立して出力時に一定のビット速度を保持するため、
計算ループは一体となって知覚距離しきい値を上下に変更して(共通の尺度を設
定して)いずれの帯域においても測定基準の再設定された知覚しきい値を超えな
い状態でユーザーが特定した一定の出力データ速度を達成する。
【0038】 周波数領域による方法 上記の図2、3及び4に示された上記の計算上効率的な変形を図3のNEMを
周波数領域において実行することによって達成できる。先に述べた実施態様では
本願開示のシステムを実行するために複数の特定の手法が用いられることを強調
したが、一定の手法は特に計算効率(すなわち、処理を実行するために必要な操
作数を減らす)の向上を提供するものである。以下に示す他の実施態様は図1、
2及び4において具体化したシステム及びそれらに関する説明に連関させた例で
あり、従って特に説明がない限り上記の記述の全てが当て嵌められるものである
【0039】 図5は図3に示した実施態様によるNEMを周波数領域とした特徴を際立たせ
たシステムである。図3及び5に示した構成要素はそれぞれほぼ類似し、図5の
出力表示210が図3の時間領域係数ではなくて周波数領域係数で構成されてい
ることを除いて、図5の出力210は入力152の完全再生表示である。時間窓
200の出力152はスペクトル領域(図5の実施態様における時間窓及びその
出力152は図3の時間窓100及び出力52と同一またはほぼ同じものである
)へと変換される。符号化分野の専門家は前記変換には上記説明中に引用した多
様な手法を用い得ることを認識している。しかしながら、時間領域別名桁落ち(
TDAC)等の手法は他の手法に対して付加的な利点を提供するものである(Pri
ncen, ’86)。
【0040】 図5の離散周波数変換202の出力は均一に分散された周波数成分の振幅を表
す係数203のベクターである。この周波数成分は連続的な重なり合いのない帯
域へとグループ化される。先に言及したように各帯域は100−400ヘルツの
範囲の周波数成分を包含している。
【0041】 前記したように、周波数係数は圧縮非線形性204によって任意に処理される
。この圧縮非線形性の形態は先に述べたものにほぼ類似している。
【0042】 残りの処理はすでに述べた図1、2及び4に示した処理にほぼ類似している。
図5の実施態様の出力を含むNEM係数256は、図2の実施態様にけるNEM
56の出力57と全く同様に、再量子化器44aと知覚距離計算プロセッサ58
の双方へと送られる。知覚距離計算58及びビット割当てループは機能的には先
に述べたものと同一のものである。
【0043】 3.実施例−映像符号化 簡潔性及び効率性の観点から、前記表題「実施例−音声符号化」の項における
説明を以下における言及を除いて映像符号化に関するここでの説明にそのまま用
いる。
【0044】 図6は映像神経符号化モデル(NEM)356の一実施態様である。時間窓プ
ロセッサ300は上記説明したように、入力データ流350の連続ブロックを窓
掛けする操作を行う。音声NEM56、256と対照的に、映像NEM356に
おいては時間窓の特定期間に関して何ら制限が付されていない。映像表示の輝度
値は上記詳述した機能に従って圧縮非線形性304によって任意に処理される。
【0045】 図6の2−Dフィルター306は二次元画像ラスタのモノスコープ神経処理の
態様を示すものである。2−Dフィルター306の一実施態様においては、二次
元画像輝度ラスタの離散時間表示がガーバーフィルターによって処理される(Dau
gman, ’88)。視覚神経生理学分野の専門家ならば、ガーバーフィルターは視覚
画像の神経生理的表示の多くの性状を近似させることを認識している。映像符号
化分野の専門家もまたガーバー型展開を用いて映像データを表示することの本来
的利点を認識している(Daugman, ’88)。概して、ガーバーフィルターに類似し
た空間的ろ過特性(すなわち二次元の対称的な減衰調波機能)を有する二次元フ
ィルターは本発明の実施においてその目的に適う表示を与える。最適なガーバー
フィルターパラメーターは公表されている視覚神経受容視野マップの測定(例え
ばDaugman, ’88)から得ることができる。
【0046】 最後に、二つの二次元フィルター306の出力は、窓掛けされた画像連続の空
間的グリッド表示を一緒に形成する四角い部位310の中へ偏析される。この空
間的グリッドの寸法パラメーターには何ら制限が付されていない。
【0047】 一実施態様において、映像NEM356は図1または2に示された実施態様の
状態において実行される。このNEM356におけるガーバーフィルターの使用
は図2における装置と概略一致するものである。完全再生表示の重要性は映像コ
ーデック装置に関しては(音声コーデック装置に比較して)低い。他の映像符号
化方法には付加的に符号化効率を高めるものがある。これらの手法の多くは図1
のシステム構成と一致するものである。いずれの場合においても、システムは前
記音声コーデックの実施態様において説明したものとほぼ同一の方式で作動する
。すなわち、映像NEM356を組み入れたビット割当て方法は情報源と損失符
号化された画像間の知覚距離を最小化することにより損失映像表示中のビットの
割当てを制御するものである。
【0048】 図4に関する記述は映像知覚距離計算の実施態様の説明にも用いられる。映像
知覚距離の計算における唯一の変更点は特別に空間的寸法が加えられる点である
。音声の場合の一次元周波数帯域はここでの映像の場合の二次元グリッド部分と
類似するものである。発光係数は二次元空間部分にわたって総計され、先の知覚
距離計算はすべてのエネルギー計算へ付加の合計寸法を導入することによって変
更される。
【0049】 さらに他の映像符号化の実施態様は図6の映像NEM356と図5の周波数領
域NEM256との結合に基づくものである。さらに、本願開示の発明はさらに
、周波数領域NEM256を採用するマルチチャネル映像コーデックを含めて上
記実施態様の多様な組合せを提供できるものである。
【0050】 上記説明した本発明の実施例は例示を意図するものであり、本発明の実際の範
囲は以下に記載する特許請求の範囲に基づく範囲及び精神によってのみ限定され
るものである。 参考文献
【図面の簡単な説明】
本発明についてのより十分な理解を提供するため本発明を添付の図面とともに
以下に説明する。
【図1】本発明による原信号とその近似間の知覚距離を定量し及び前記近似の
生成をもたらす神経符号化装置及び方法を示すブロック図である。
【図2】音声信号符号器の第一の実施態様として構成された図1に示す装置及
び方法のブロック図である。
【図3】音声符号復号化において使用する図1及び2に示した神経符号化モデ
ルの第一の時間領域の実施態様のブロック図である。
【図4】図1及び2の知覚距離計算を実行するモジュールのブロック図である
【図5】音声符号復号化において使用する図1及び2に示した神経符号化モデ
ルの第二の周波数領域の実施態様のブロック図である。
【図6】音声符号復号化において使用する図1に示す神経符号化モデルの第一
の時間領域の実施態様のブロック図である。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C059 KK47 MA23 MC11 MC38 ME01 SS06 SS11 TA45 TB01 TC08 TD12 UA02 UA13 UA17 5D045 DA20 5J064 BA09 BA16 BB07 BC01 BC02 BC16 BC26 BD01

Claims (91)

    【特許請求の範囲】
  1. 【請求項1】データ信号と該データ信号の第一表示間の知覚距離を計算する
    方法であって、 窓掛けプロセッサを用いて前記データ信号の時間順の表示を分割するステップ
    と、 フィルター列を用いて前記分割されたデータを周波数帯域ごとに分割されたデ
    ータ成分を表わす複数のチャネルへと分解するステップと、 前記分解されたデータを量子化器中で量子化するステップと、 デコーダを用いて前記量子化されたデータから前記分解されたデータを再生す
    るステップと、 差エネルギープロセッサ中で前記量子化されたデータと前記再生されたデータ
    間のエネルギー差を測定するステップと、及び 所定のしきい値と前記エネルギー差との比較に基づいて前記量子化器を調整す
    るステップから構成されることを特徴とする前記方法。
  2. 【請求項2】前記データ信号が音声及び映像データ信号のいずれかであるこ
    とを特徴とする請求項1項記載の方法。
  3. 【請求項3】データ信号と該データ信号の第一表示間の知覚距離を計算する
    方法であって、 窓掛けプロセッサを用いて前記データ信号の時間順の表示を分割するステップ
    と、 前記分割されたデータを離散周波数変換を用いて均一に分散された周波数成分
    のベクター係数へと分解するステップと、 前記分解されたデータを量子化器中で量子化するステップと、 デコーダを用いて前記量子化されたデータから前記分解されたデータを再生す
    るステップと、 差エネルギープロセッサ中で前記量子化されたデータと前記再生されたデータ
    間のエネルギー差を測定するステップと、及び 所定のしきい値と前記エネルギー差との比較に基づいて前記量子化器を調整す
    るステップから構成されることを特徴とする前記方法。
  4. 【請求項4】前記データ信号が音声及び映像データ信号のいずれかであるこ
    とを特徴とする請求項3項記載の方法。
  5. 【請求項5】原信号の中間のかつ圧縮された表示から前記原信号の最終的再
    生が生成される、前記原信号の中間のかつ圧縮された表示を与える圧縮システム
    であって、 前記原信号を受け取り及び前記原信号の中間再生神経符号化モデルと前記原信
    号の神経符号化モデル表示間で計算された知覚距離データに基づいて前記圧縮さ
    れた表示を生成する損失コーダを備えることを特徴する前記圧縮システム。
  6. 【請求項6】前記圧縮された表示を受け取り、その表示から前記最終的再生
    を生成させる補損失デコーダをさらに備えることを特徴とする請求項5項記載の
    圧縮システム。
  7. 【請求項7】前記損失コーダと前記補損失デコーダを仲介する信号媒体をさ
    らに備えることを特徴とする請求項6項記載の圧縮システム。
  8. 【請求項8】前記信号媒体が伝送媒体及び記憶媒体のいずれかであることを
    特徴とする請求項7項記載の圧縮システム。
  9. 【請求項9】前記損失コーダと連絡して、前記損失コーダから前記圧縮され
    た表示を受け取り、及びその表示に対してエントロピー符号化され圧縮された表
    示を生成する無損失コーダと、 前記補損失デコーダと連絡して、前記エントロピー符号化され圧縮された表示
    を受け取り、及び前記中間の圧縮された表示を再生する無損失デコーダをさらに
    備えることを特徴とする請求項7項記載の圧縮システム。
  10. 【請求項10】前記コーダは、デジタル信号プロセッサ、プログラム可能な
    コンピューター、VLSI回路構成から選ばれるいずれかの構成要素中において
    実行されることを特徴とする請求項5項記載の圧縮システム。
  11. 【請求項11】前記原信号は音声信号及び映像信号のいずれかであることを
    特徴とする請求項5項記載の圧縮システム。
  12. 【請求項12】前記原信号はマルチチャネル原信号を集合的に含む複数の信
    号チャネルの一つであり、前記損失コーダは前記マルチチャネル原信号の各チャ
    ネルについて複製されることを特徴とする請求項5項記載の圧縮システム。
  13. 【請求項13】前記損失コーダは前記知覚距離データに従って前記原信号を
    表示するために必要なビット数を割り当てる表示変換器及び再量子化器をさらに
    備えることを特徴とする請求項5項記載の圧縮システム。
  14. 【請求項14】前記損失コーダと連絡して、前記損失コーダから前記圧縮さ
    れた表示を受け取り、及びその表示に応答して前記減少されたビット数から成る
    エントロピー符号化され圧縮された表示を生成させる無損失コーダをさらに備え
    ることを特徴とする請求項13項記載の圧縮システム。
  15. 【請求項15】前記割当てによって、前記知覚距離が所定の知覚距離しきい
    値を超えないように保たれながら前記原信号を表示するために必要なビット数が
    最小化されることを特徴とする請求項14項記載の圧縮システム。
  16. 【請求項16】前記割当てによって前記原信号を表示する所定のビット数を
    用いて前記知覚距離が最小化されることを特徴とする請求項14項記載の圧縮シ
    ステム。
  17. 【請求項17】前記損失コーダは、前記表示変換器及び再量子化器と連絡し
    て、前記表示変換器及び再量子化器によって行われた前記表示変換及び前記原信
    号の表示に要するビット数の選択的減少を実質的に逆戻りさせ及び前記中間の原
    信号の再生を生成する再生素子をさらに備えることを特徴とする請求項13項記
    載の圧縮システム。
  18. 【請求項18】前記損失コーダは前記再生素子と連絡して、前記中間的再生
    の神経符号化モデル表示を生成する第一の神経符号化モデルをさらに備えること
    を特徴とする請求項17項記載の圧縮システム。
  19. 【請求項19】前記損失コーダは前記原信号を受け取り、及び前記原信号の
    神経符号化モデル表示を生成する第二の神経符号化モデルをさらに備えることを
    特徴とする請求項18項記載の圧縮システム。
  20. 【請求項20】前記損失コーダは、前記中間的再生の神経符号化モデル表示
    と前記原信号の神経符号化モデル表示を受け取る前記第一及び第二の神経符号化
    モデルと連絡して、知覚距離データを生成し及び前記原信号の表示に要するビッ
    ト数の選択的減少において使用する前記表示変換器及び再量子化器へ前記知覚距
    離データを与える知覚距離計算装置をさらに備えることを特徴とする請求項19
    項記載の圧縮システム。
  21. 【請求項21】前記損失コーダは前記原信号の神経符号化モデル表示を生成
    する神経符号器を備えることを特徴とする請求項5項記載の圧縮システム。
  22. 【請求項22】前記損失コーダは前記知覚距離データに従って前記原信号の
    神経符号化モデル表示を表示するために必要なビット数を選択的に減少させる再
    量子化器をさらに備えることを特徴とする請求項21項記載の圧縮システム。
  23. 【請求項23】前記再量子化器と連絡して、前記再量子化器から前記圧縮さ
    れた表示を受け取り及びその表示に応答して前記減少されたビット数から成るエ
    ントロピー符号化され圧縮された表示を生成する無損失コーダをさらに備えるこ
    とを特徴とする接続点22項記載の圧縮システム。
  24. 【請求項24】前記再量子化器は前記知覚距離が所定の知覚距離しきい値を
    超えないようにしながら前記原信号を表示するために要するビット数最小化する
    ことを特徴とする請求項23項記載の圧縮システム。
  25. 【請求項25】前記再量子化器は前記原信号を表示するために要する所定の
    ビット数を用いて前記知覚距離を最小化することを特徴とする請求項23項記載
    の圧縮システム。
  26. 【請求項26】前記損失コーダは、前記再量子化器と連絡して、前記再量子
    化器によって導入された前記原信号の神経符号化モデル表示を表示するために要
    するビット数の選択的減少を実質的に逆戻りさせ及び前記原信号の中間的表示の
    神経符号化モデル表示を生成する再生素子をさらに備えることを特徴とする請求
    項22項記載の圧縮システム。
  27. 【請求項27】前記損失コーダは、前記神経符号器及び前記再生素子と連絡
    して、前記原信号神経符号化モデル表示及び前記中間的表示の神経符号化モデル
    表示を受け取り、前記知覚距離データを生成し、及び前記原信号を表示するため
    に要するビット数の選択的減少において前記再量子化器によって使用される前記
    知覚距離データを前記再量子化器へ与える知覚距離計算装置をさらに備えること
    を特徴とする接続点26項記載の圧縮システム。
  28. 【請求項28】前記損失コーダは前記原信号からのデータの連続ブロックを
    時間経過順に窓掛けするデータ窓掛け素子をさらに備えることを特徴とする請求
    項5項記載の圧縮システム。
  29. 【請求項29】前記窓掛けされた連続ブロックが時間に関して一部重なり合
    うことを特徴とする請求項28項記載の圧縮システム。
  30. 【請求項30】前記窓掛けされた連続ブロックの各々がほぼ100−400
    ミリ秒の範囲内の持続時間をもつことを特徴とする請求項28項記載の圧縮シス
    テム。
  31. 【請求項31】前記データ窓掛け素子は、前記窓掛けされた連続ブロックを
    、その持続時間が前記窓掛けされた連続ブロックの各々の持続時間よりも短くま
    た時間に関して一部重なり合う副窓へとさらに分割することを特徴とする請求項
    28項記載の圧縮システム。
  32. 【請求項32】前記損失コーダは、前記データ窓掛け素子と連絡して、前記
    窓掛けされた連続ブロックを複数の連続的な周波数帯域チャネルへと分解する帯
    域フィルター列をさらに備えることを特徴とする請求項28項記載の圧縮システ
    ム。
  33. 【請求項33】前記フィルター列は有限インパルス応答フィルター、無限イ
    ンパルス応答フィルター、多項フィルター、離散フーリエ変換素子、高速フーリ
    エ変換素子、離散コサイン変換素子、直角ミラーフィルター、及び離散サイン変
    換素子から選ばれるいずれかの素子から成ることを特徴とする請求項32項記載
    の圧縮システム。
  34. 【請求項34】前記フィルター列は周波数領域別名桁落ち素子と連結する臨
    界未満のサンプリング素子を含んで構成されることを特徴とする請求項32項記
    載の圧縮システム。
  35. 【請求項35】前記帯域フィルター列中の各フィルターの帯域幅がほぼ10
    0−400ヘルツの範囲内にあることを特徴とする請求項32項記載の圧縮シス
    テム。
  36. 【請求項36】前記損失コーダは、前記帯域フィルター列と連絡して、前記
    連続する周波数帯域チャネルの出力中へ圧縮瞬間非直線性を導入する圧縮非直線
    性プロセッサをさらに備えることを特徴とする請求項32項記載の圧縮システム
  37. 【請求項37】前記損失コーダは、前記帯域フィルター列と連絡して、前記
    連続する周波数帯域チャネルの出力について包絡線表示を生成し及びサンプル比
    を減らすために前記包絡線表示を臨界的に再度サンプリングする包絡線検波器プ
    ロセッサをさらに備えることを特徴とする請求項32項記載の圧縮システム。
  38. 【請求項38】前記損失コーダは、前記包絡線検波器と連絡して、前記包絡
    線検波器プロセッサの出力中へ圧縮瞬間非直線性を導入する圧縮非直線性プロセ
    ッサをさらに備えることを特徴とする請求項37項記載の圧縮システム。
  39. 【請求項39】前記再量子化器は前記連続する周波数帯域チャネルを受け取
    り、及び1または2以上の前記チャネルの群について前記連続する周波数帯域チ
    ャネルを近似的に表示するために必要とされる各群についての群規模因数あるい
    は量子化レベルを計算することを特徴とする請求項32項記載の圧縮システム。
  40. 【請求項40】前記知覚距離計算装置は、前記原信号の前記神経符号化モデ
    ル表示と前記中間的表示の神経符号化モデル間の周波数帯域当たりのエネルギー
    差を表示する数値を前記知覚距離データとして測定する差エネルギープロセッサ
    をさらに備えることを特徴とする請求項27項記載の圧縮システム。
  41. 【請求項41】前記損失コーダは、前記知覚距離計算装置及び前記再量子化
    器と連絡して、前記知覚距離データを各周波数帯域について知覚距離しきい値と
    比較する知覚しきい値コンパレータをさらに備えることを特徴とする接続点40
    項記載の圧縮システム。
  42. 【請求項42】前記知覚距離計算装置は前記原信号の神経符号化モデルから
    周波数帯域当たりの全エネルギー特定する帯域エネルギープロセッサをさらに備
    えることを特徴とする請求項40項記載の圧縮システム。
  43. 【請求項43】前記知覚距離計算装置は周波数帯域当たりの前記エネルギー
    差値及び周波数帯域当たりの全エネルギーに基づく知覚距離量を計算する知覚距
    離プロセッサをさらに備えることを特徴とする請求項42項記載の圧縮システム
  44. 【請求項44】前記知覚距離プロセッサはさらに前記知覚距離量の計算にお
    いて前記帯域あたりの全エネルギーへの隣接帯域ノイズエネルギーの寄与を測定
    することを特徴とする接続点43項記載の圧縮システム。
  45. 【請求項45】前記損失コーダは前記窓掛けされた連続ブロックを周波数領
    域係数の複数の帯域へと変換する変換素子をさらに備えることを特徴とする請求
    項28項記載の圧縮システム。
  46. 【請求項46】前記変換素子は、離散周波数変換素子、高速フーリエ変換素
    子、離散コサイン変換素子、及び離散サイン変換素子から選ばれるいずれかの素
    子をさらに含むことを特徴とする請求項45項記載の圧縮システム。
  47. 【請求項47】前記変換素子は前記変換を実施するための時間領域別名桁落
    ちプロセッサと結合した臨界未満のサンプリング素子をさらに備えることを特徴
    とする請求項45項記載の圧縮システム。
  48. 【請求項48】前記複数の周波数領域係数の帯域の各々がほぼ100−40
    0ヘルツ範囲であることを特徴とする請求項45項記載の圧縮システム。
  49. 【請求項49】前記損失コーダは、前記離散周波数変換素子と連絡して、前
    記周波数領域係数の複数の帯域中へ圧縮瞬間非直線性を導入する圧縮非直線性プ
    ロセッサをさらに備えることを特徴とする請求項45項記載の圧縮システム。
  50. 【請求項50】前記再量子化器は、前記周波数領域係数の複数の帯域を受け
    取り、及び1または2以上の前記帯域から成る群について、前記連続する周波数
    帯域を近似的に表示することを要する各群について群規模因数あるいは量子化レ
    ベルを計算することを特徴とする請求項45項記載の圧縮システム。
  51. 【請求項51】前記損失コーダは前記窓掛けされた連続ブロックを二次元画
    像ラスタの離散時間表示として処理する二次元フィルターをさらに備えることを
    特徴とする請求項28項記載の圧縮システム。
  52. 【請求項52】前記二次元フィルターがガーバーフィルターであることを特
    徴とする接続点51項記載の圧縮システム。
  53. 【請求項53】前記損失コーダは前記二次元フィルターによる処理前に前記
    窓掛けされた連続ブロック中へ圧縮瞬間非直線性を導入する圧縮非直線性プロセ
    ッサをさらに備えることを特徴とする請求項51項記載の圧縮システム。
  54. 【請求項54】前記損失コーダは、前記フィルターを通過した二次元画像ラ
    スタを複数のタイルへ分離し、前記フィルターを通過した二次元画像ラスタを集
    合的に限定するグリッド配列フィルターをさらに備えることを特徴とする請求項
    51項記載の圧縮システム。
  55. 【請求項55】原信号の中間の圧縮された表示を供給するデータ圧縮方法で
    あって、前記表示から前記原信号の最終表示が生成され、前記方法は、 損失コーダによって前記原信号を受け取り、 前記損失コーダによって前記原信号の中間的再生の神経符号化モデル表示を生
    成し、 前記損失コーダによって前記原信号の神経符号化モデル表示を生成し、 前記損失コーダによって前記原信号の中間的再生の前記神経符号化モデル表示
    と前記原信号の前記神経符号化モデル表示間の知覚距離を計算し、及び 前記損失コーダによって前記原信号を再量子化して前記知覚距離に基づいて前
    記原信号の前記中間の圧縮された表示を形成することから構成される前記データ
    圧縮方法。
  56. 【請求項56】補損失デコーダによって前記原信号の前記再量子化を実質的
    に逆戻りさせて前記最終表示を生成する工程をさらに含むことを特徴とする請求
    項55項記載の圧縮方法。
  57. 【請求項57】前記中間の圧縮された表示を前記損失コーダによって前記損
    失コーダと前記補損失デコーダを仲介する信号媒体へ伝送する工程をさらに含む
    ことを特徴とする請求項56項記載の圧縮方法。
  58. 【請求項58】無損失コーダによって前記損失コーダから前記中間の圧縮さ
    れた表示を受け取る工程と、 前記無損失コーダによって前記中間の圧縮された表示のエントロピー符号化さ
    れ圧縮された表示を生成する工程と、 無損失デコーダによって前記エントロピー符号化され圧縮された表示を受け取
    る工程と、及び 前記無損失デコーダによって前記中間の圧縮された表示を回復する工程をさら
    に含むことを特徴とする接続点56項記載の圧縮方法。
  59. 【請求項59】前記損失コーダによって前記原信号を表象的に変換及び再量
    子化して、前記知覚距離データに従って数の減少した前記原信号の表示に要する
    ビット数を割り当てる工程をさらに含むことを特徴とする請求項55項記載の圧
    縮方法。
  60. 【請求項60】無損失コーダによって、前記ビット数の減少した中間の圧縮
    された表示のエントロピー符号化され圧縮された表示を生成する工程をさらに含
    むことを特徴とする請求項59項記載の圧縮方法。
  61. 【請求項61】前記再量子化において、前記知覚距離が所定の知覚距離しき
    い値を超えないようにしながら前記原信号を表示するために要するビット数が最
    小化されることを特徴とする請求項60項記載の圧縮方法。
  62. 【請求項62】前記再量子化において前記原信号を表示するための所定のビ
    ット数を用いて前記知覚距離が最小化されることを特徴とする請求項60項記載
    の圧縮方法。
  63. 【請求項63】前記損失コーダによって前記表象的変換及び前記原信号を表
    示するために要するビット数の選択的減少を実質的に逆戻りさせて前記原信号の
    前記中間的再生を生成する工程をさらに含むことを特徴とする請求項59項記載
    の圧縮方法。
  64. 【請求項64】前記損失コーダによって前記原信号を再量子化して、前記知
    覚距離データに従って前記原信号の前記神経符号化モデル表示を表示するために
    要するビット数を選択的に減少させる工程をさらに含むことを特徴とする請求項
    55項記載の圧縮方法。
  65. 【請求項65】前記無損失コーダによって前記減少されたビット数の中間の
    圧縮された表示のエントロピー符号化され圧縮された表示を生成する工程をさら
    に含むことを特徴とする請求項64項記載の圧縮方法。
  66. 【請求項66】前記再量子化において、前記知覚距離が所定の知覚距離しき
    い値を超えないようにしながら前記原信号を表示するために要するビット数が減
    少されることを特徴とする接続点65項記載の圧縮方法。
  67. 【請求項67】前記再量子化において、前記原信号を表示するための所定の
    ビット数を用いて前記知覚距離が最小化されることを特徴とする請求項65項記
    載の圧縮方法。
  68. 【請求項68】前記原信号の中間的再生の神経符号化モデル表示の生成にお
    いて、前記再量子化によって導入された前記原信号の前記神経符号化モデル表示
    を表示するために要するビット数の選択的減少を実質的に逆戻りさせる工程をさ
    らに含むことを特徴とする請求項64項記載の圧縮方法。
  69. 【請求項69】前記原信号の神経符号化モデル表示の生成工程には、 前記原信号からのデータの連続ブロックを時間経過順に窓掛けする工程がさら
    に含まれることを特徴とする請求項55項記載の圧縮方法。
  70. 【請求項70】前記時間経過順の窓掛けにおいて時間に関して部分的に重な
    り合っている連続ブロックが窓掛けされることを特徴とする請求項69項記載の
    圧縮方法。
  71. 【請求項71】前記時間経過順の窓掛けにおいて、ほぼ100−400ミリ
    秒の範囲持続時間をもつ連続ブロックが窓掛けされることを特徴とする請求項6
    9項記載の圧縮方法。
  72. 【請求項72】前記原信号の神経符号化モデル表示の生成工程は前記窓掛け
    された連続ブロックを複数の連続する周波数帯域チャネルへと帯域フィルター列
    を用いて分解する工程をさらに含むことを特徴とする請求項69項記載の圧縮方
    法。
  73. 【請求項73】前記分解において使用された前記帯域フィルター列中の各フ
    ィルターはほぼ100−400ヘルツの範囲内の帯域幅をもつことを特徴とする
    接続点72項記載の圧縮方法。
  74. 【請求項74】前記原信号の神経符号化モデル表示を生成する工程には、 前記連続する周波数帯域チャネルの出力中へ圧縮瞬間非直線性を導入する工程
    がさらに含まれることを特徴とする請求項72項記載の圧縮方法。
  75. 【請求項75】前記原信号の神経符号化モデル表示を生成する工程には、 包絡線表示を生成し、及びサンプル速度を減少させるため前記包絡線表示を臨
    界的に再サンプリングする前記連続する周波数帯域チャネルの出力を包絡線検波
    する工程がさらに含まれることを特徴とする接続点72項記載の圧縮方法。
  76. 【請求項76】前記原信号の神経符号化モデル表示を生成する工程には 前記包絡線検波器プロセッサの出力中へ圧縮瞬間非直線性を導入する工程がさ
    らに含まれることを特徴とする請求項75項記載の圧縮方法。
  77. 【請求項77】前記原信号を再量子化する工程には、 前記連続する周波数帯域チャネルを受け取る工程と、 1または2以上の前記チャネルから成る群について、前記連続する周波数帯域
    チャネルを近似的に表示するために要する各群について群規模因数及び量子化レ
    ベルを計算する工程がさらに含まれることを特徴とする請求項72項記載の圧縮
    方法。
  78. 【請求項78】前記知覚距離の計算工程には、 前記原信号の神経符号化モデル表示と前記中間的再生の神経符号化モデル間の
    周波数帯域当たりのエネルギー差を表示する数値を前記知覚距離データの測定基
    準として測定する工程がさらに含まれることを特徴とする接続点55項記載の圧
    縮方法。
  79. 【請求項79】前記知覚距離の計算工程には、 前記知覚距離データを各周波数帯域についての知覚距離しきい値と比較する工
    程がさらに含まれることを特徴とする請求項78項記載の圧縮方法。
  80. 【請求項80】前記知覚距離の計算工程には、 前記原信号の神経符号化モデルから周波数帯域当たりの全エネルギーを測定す
    る工程がさらに含まれることを特徴とする請求項78項記載の圧縮方法。
  81. 【請求項81】前記知覚距離の計算工程には、 周波数帯域当たりの前記エネルギー差値及び周波数帯域当たりの前記全エネル
    ギーに基づいて知覚距離量を計算する工程がさらに含まれることを特徴とする請
    求項80項記載の圧縮方法。
  82. 【請求項82】前記知覚距離の計算工程には、 前記知覚距離量の計算において帯域当たりの全エネルギーへの隣接帯域ノイズ
    エネルギーの寄与を測定する工程がさらに含まれることを特徴とする請求項81
    項記載の圧縮方法。
  83. 【請求項83】前記神経符号化モデルを生成する工程には、 前記窓掛けされた連続ブロックを周波数領域係数の複数の帯域へ変換する工程
    がさらに含まれることを特徴とする請求項55項記載の圧縮方法。
  84. 【請求項84】前記変換工程には、 前記窓掛けされた連続ブロックを周波数領域係数の複数の帯域へと時間領域別
    名桁落ちを行う工程が含まれることを特徴とする請求項83項記載の圧縮方法。
  85. 【請求項85】前記変換工程には、 前記窓掛けされた連続ブロックを、それぞれの帯域がほぼ100−400ヘル
    ツの範囲である周波数領域係数の複数の帯域へと変換する工程がさらに含まれる
    ことを特徴とする請求項83項記載の圧縮方法。
  86. 【請求項86】前記原信号の神経符号化モデル表示を生成する工程には、 周波数領域係数の前記複数の帯域中へ圧縮瞬間非直線性を導入する工程がさら
    に含まれることを特徴とする請求項83項記載の圧縮方法。
  87. 【請求項87】前記原信号を再量子化する工程には、 周波数領域係数をもつ前記複数の帯域を受け取る工程と、 1または2以上の前記帯域から成る群に関して、前記連続する周波数帯域を近
    似的に表示するために要する各群について群規模因数及び量子化レベルを計算す
    る工程がさらに含まれることを特徴とする請求項83項記載の圧縮方法。
  88. 【請求項88】前記神経符号化モデルを生成する工程には、 前記窓掛けされたブロックを、二次元フィルターを用いて二次元画像ラスタの
    離散時間表示として処理する工程がさらに含まれることを特徴とする請求項55
    項記載の圧縮方法。
  89. 【請求項89】前記処理において前記二次元フィルターとしてガーバーフィ
    ルターが用いられることを特徴とする請求項88項記載の圧縮方法。
  90. 【請求項90】前記神経符号化モデルを生成する工程には、 前記二次元フィルターを用いる処理前に圧縮瞬間非直線性を前記窓掛けされた
    連続ブロック中へ導入する工程がさらに含まれることを特徴とする請求項88項
    記載の圧縮方法。
  91. 【請求項91】前記神経符号化モデルを生成する工程には、 前記フィルターを通過させた二次元画像ラスタを複数のタイルへ分離し、前記
    フィルターを通過させた二次元画像ラスタをグリッド配列フィルターを用いて集
    合的に限定する工程がさらに含まれることを特徴とする請求項88項記載の圧縮
    方法。
JP2001556968A 2000-02-03 2000-02-03 データ圧縮方法及びデータ圧縮装置 Pending JP2003523662A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2000/002917 WO2001057788A1 (en) 1997-11-12 2000-02-03 Data compression method and apparatus

Publications (2)

Publication Number Publication Date
JP2003523662A true JP2003523662A (ja) 2003-08-05
JP2003523662A5 JP2003523662A5 (ja) 2007-03-15

Family

ID=21741037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001556968A Pending JP2003523662A (ja) 2000-02-03 2000-02-03 データ圧縮方法及びデータ圧縮装置

Country Status (8)

Country Link
US (1) US6091773A (ja)
EP (1) EP1252605A4 (ja)
JP (1) JP2003523662A (ja)
AU (1) AU781690B2 (ja)
BR (1) BR0017086A (ja)
CA (1) CA2398191A1 (ja)
NO (1) NO20023617L (ja)
WO (1) WO2001057788A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US6987890B2 (en) * 2002-03-27 2006-01-17 Eastman Kodak Company Producing and encoding rate-distortion information allowing optimal transcoding of compressed digital image
GB2387055A (en) * 2002-03-28 2003-10-01 Sony Uk Ltd Data compression method including target data quantity allocation
US7672838B1 (en) 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US8027242B2 (en) * 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US20070192086A1 (en) * 2006-02-13 2007-08-16 Linfeng Guo Perceptual quality based automatic parameter selection for data compression
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US20080294446A1 (en) * 2007-05-22 2008-11-27 Linfeng Guo Layer based scalable multimedia datastream compression
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US8515239B2 (en) * 2008-12-03 2013-08-20 D-Box Technologies Inc. Method and device for encoding vibro-kinetic data onto an LPCM audio stream over an HDMI link
US9405015B2 (en) 2012-12-18 2016-08-02 Subcarrier Systems Corporation Method and apparatus for modeling of GNSS pseudorange measurements for interpolation, extrapolation, reduction of measurement errors, and data compression
US9250327B2 (en) 2013-03-05 2016-02-02 Subcarrier Systems Corporation Method and apparatus for reducing satellite position message payload by adaptive data compression techniques
US10748062B2 (en) * 2016-12-15 2020-08-18 WaveOne Inc. Deep learning based adaptive arithmetic coding and codelength regularization
EP4071497A1 (en) * 2018-05-18 2022-10-12 Aptiv Technologies Limited Radar system and method for receiving and analyzing radar signals

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
FR2389277A1 (fr) * 1977-04-29 1978-11-24 Ibm France Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede
GB8628046D0 (en) * 1986-11-24 1986-12-31 British Telecomm Transmission system
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
DE59008047D1 (de) * 1989-03-06 1995-02-02 Bosch Gmbh Robert Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale.
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JPH05219385A (ja) 1992-02-07 1993-08-27 Hudson Soft Co Ltd 画像圧縮・伸張方法および装置
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法
JP3278900B2 (ja) * 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
US5436985A (en) * 1993-05-10 1995-07-25 Competitive Technologies, Inc. Apparatus and method for encoding and decoding images
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
WO1995019683A1 (en) * 1994-01-14 1995-07-20 Houston Advanced Research Center Boundary-spline-wavelet compression for video images
KR100289733B1 (ko) * 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
US5625743A (en) * 1994-10-07 1997-04-29 Motorola, Inc. Determining a masking level for a subband in a subband audio encoder
US5699479A (en) * 1995-02-06 1997-12-16 Lucent Technologies Inc. Tonality for perceptual audio compression based on loudness uncertainty
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5890102A (en) * 1995-10-24 1999-03-30 Georgia Tech Research Corporation Jointly optimized subband coding system and method
US5764805A (en) * 1995-10-25 1998-06-09 David Sarnoff Research Center, Inc. Low bit rate video encoder using overlapping block motion compensation and zerotree wavelet coding
US5777678A (en) * 1995-10-26 1998-07-07 Sony Corporation Predictive sub-band video coding and decoding using motion compensation
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치

Also Published As

Publication number Publication date
WO2001057788A1 (en) 2001-08-09
CA2398191A1 (en) 2001-08-09
AU3482700A (en) 2001-08-14
NO20023617D0 (no) 2002-07-30
EP1252605A4 (en) 2008-03-26
NO20023617L (no) 2002-10-02
US6091773A (en) 2000-07-18
EP1252605A1 (en) 2002-10-30
AU781690B2 (en) 2005-06-09
BR0017086A (pt) 2003-01-07

Similar Documents

Publication Publication Date Title
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
JP2904472B2 (ja) ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置
EP1719119B1 (en) Classification of audio signals
US6766293B1 (en) Method for signalling a noise substitution during audio signal coding
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP2003523662A (ja) データ圧縮方法及びデータ圧縮装置
EP2490215A2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
JPH08272399A (ja) ラウドネス不確定性に基づく知覚音声圧縮
JP3297240B2 (ja) 適応的符号化システム
KR20040040268A (ko) 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
US6678647B1 (en) Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
KR100349329B1 (ko) 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법
JP3146121B2 (ja) 符号化復号化装置
KR0152016B1 (ko) 가변 비트할당을 이용한 부호화 및 복호화시스템
KR970006827B1 (ko) 오디오신호 부호화장치
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JPH06224862A (ja) ディジタルオーディオ信号の処理方法および装置
KR970006825B1 (ko) 오디오신호 부호화장치
KR940010542A (ko) 가변비트할당 방식의 부호화시스템
WO2004042722A1 (en) Mpeg audio encoding method and apparatus

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090819

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090915

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091117