JP5587599B2 - 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 - Google Patents

量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 Download PDF

Info

Publication number
JP5587599B2
JP5587599B2 JP2009504099A JP2009504099A JP5587599B2 JP 5587599 B2 JP5587599 B2 JP 5587599B2 JP 2009504099 A JP2009504099 A JP 2009504099A JP 2009504099 A JP2009504099 A JP 2009504099A JP 5587599 B2 JP5587599 B2 JP 5587599B2
Authority
JP
Japan
Prior art keywords
input signal
quantization
detected
scale type
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009504099A
Other languages
English (en)
Other versions
JP2009532734A (ja
Inventor
キム,ジュン−フェ
オー,ウン−ミ
ポゾフ,アントン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009532734A publication Critical patent/JP2009532734A/ja
Application granted granted Critical
Publication of JP5587599B2 publication Critical patent/JP5587599B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02GINSTALLATION OF ELECTRIC CABLES OR LINES, OR OF COMBINED OPTICAL AND ELECTRIC CABLES OR LINES
    • H02G3/00Installations of electric cables or lines or protective tubing therefor in or on buildings, equivalent structures or vehicles
    • H02G3/02Details
    • H02G3/04Protective tubing or conduits, e.g. cable ladders or cable troughs
    • H02G3/0406Details thereof
    • H02G3/0412Heat or fire protective means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16LPIPES; JOINTS OR FITTINGS FOR PIPES; SUPPORTS FOR PIPES, CABLES OR PROTECTIVE TUBING; MEANS FOR THERMAL INSULATION IN GENERAL
    • F16L3/00Supports for pipes, cables or protective tubing, e.g. hangers, holders, clamps, cleats, clips, brackets
    • F16L3/26Supports for pipes, cables or protective tubing, e.g. hangers, holders, clamps, cleats, clips, brackets specially adapted for supporting the pipes all along their length, e.g. pipe channels or ducts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02GINSTALLATION OF ELECTRIC CABLES OR LINES, OR OF COMBINED OPTICAL AND ELECTRIC CABLES OR LINES
    • H02G3/00Installations of electric cables or lines or protective tubing therefor in or on buildings, equivalent structures or vehicles
    • H02G3/02Details
    • H02G3/04Protective tubing or conduits, e.g. cable ladders or cable troughs
    • H02G3/0406Details thereof
    • H02G3/0418Covers or lids; Their fastenings
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02GINSTALLATION OF ELECTRIC CABLES OR LINES, OR OF COMBINED OPTICAL AND ELECTRIC CABLES OR LINES
    • H02G3/00Installations of electric cables or lines or protective tubing therefor in or on buildings, equivalent structures or vehicles
    • H02G3/02Details
    • H02G3/04Protective tubing or conduits, e.g. cable ladders or cable troughs
    • H02G3/0437Channels
    • H02G3/045Channels provided with perforations or slots permitting introduction or exit of wires

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Architecture (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、入力信号の符号化及び復号化に係り、さらに詳細には、入力信号に対して圧縮効率を高めるための量子化及び逆量子化のための入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置に関する。
情報を含んでいる入力信号の波形は、本来の振幅において連続的であり、時間上でも連続的なアナログ信号である。したがって、波形を離散信号として表現するために、A/D(Analog−to−Digital)変換が必要である。前記A/D変換を行うためには、2つの過程を必要とする。一つは、時間上の連続信号を離散信号に変える標本化過程であり、他の一つは、可能な振幅の数を有限な値で制限するための振幅量子化過程である。すなわち、振幅の量子化は、時間nで入力振幅x(n)を可能な振幅の有限な集合のうち一元素であるy(n)に変換する過程である。
オーディオ信号の保存/復元方式も、最近デジタル信号処理技術の発達によって、既存のアナログ信号を標本化及び量子化過程を経てデジタル信号であるPCM(Pulse Code Modulation)データに変換してCD(Compact Disc)及びDAT(Digital Audio Tape)のような記録/保存媒体に信号を保存しておいた後、ユーザが必要時に保存された信号を再び再生して聞ける技術が開発されて、一般人に普遍化されて使われている。このようなデジタル方式による保存/復元方式は、LP(Long−Play Record)とテープ(Tape)のようなアナログ方式に比べて、音質の向上及び保存期間による劣化を克服したが、デジタルデータが大きすぎて保存及び伝送に問題を示した。
このような問題を解決するために、デジタル音声信号を圧縮するためにDPCM(Differential Pulse Code Modulaton)やADPCM(Adaptive Differential Pulse Code Modulation)の方法が開発された。前記方法を使用して、デジタル音声信号のデータ量を減らそうとする努力があったが、信号の種類によって効率性に大きい差がある。最近、ISO(International Standard Organization)によって標準化作業がなされたMPEG(MovingPicturesExpertGroup)/audio技法やドルビ(Dolby)によって開発されたAC(Audio Codec)−2/AC−3技法では、人間の心理音響モデルを利用してデータ量を減らす方法を使用した。このような方法は、信号の特性に関係なく、効率的なデータ量の減少に大きく寄与した。
MPEG−1/audio、MPEG−2/audioやAC−2/AC−3のような既存のオーディオ信号圧縮技法では、時間領域の信号を一定サイズのブロックに縛って周波数領域の信号に変換する。そして、この変換された信号を人間の心理音響モデルを利用してスカラー量子化を行う。このような量子化技法は、単純であるが、入力サンプルが統計的に独立的であるとしても、最適ではない。もちろん、入力サンプルが統計的に従属的であれば、さらに不十分である。このような問題点のため、エントロピー符号化のような無損失符号化やある種類の適応量子化を含んで符号化を行う。したがって、単純なPCMデータのみを保存する方式よりは、非常に複雑な過程を経、ビットストリームは、量子化されたPCMデータだけでなく、信号を圧縮するための付加的な情報で構成されている。
MPEG/audio標準やAC−2/AC−3方式は、既存のデジタル符号化に比べて、1/6ないし1/8に減った64Kbps〜384Kbpsのビット率でCD音質とほぼ同じ音質を提供する。このような理由のため、MPEG/audio標準は、DAB(Digital Audio Broadcasting)、インターネットフォン、AOD(Audio on Demand)及びマルチメディアシステムのようなオーディオ信号の保存と伝送とに重要な役割を行うと予想される。
MPEG−1/2オーディオ符号化技術は、サブバンドフィルタリングを行った後、サブバンドサンプルを心理音響で提示したビット割当情報を利用して線形量子化して、ビットパッキング過程を経て符号化を完了する。前記量子化過程で、線形量子化器は、データの分布が均一な場合、最適の性能を示す。しかし、線形量子化器は、低い割当ビット数では信号歪曲が著しいという問題点がある。
実際のデータの分布は、均一な分布ではないガウスあるいはラプラス分布に近似した分布を示す。このような場合には、それぞれの分布に合うように量子化器を設計することが望ましく、MSE(Mean Squared Error)側面で、最適の結果を示すことができる。MPEG−2/4のAACなど、一般オーディオ符号化器は、
Figure 0005587599
の非線形量子化器を利用する。これは、MDCTのサンプル分布と心理音響的な側面とを考慮して設計された。しかし、多様な入力信号に対して同じ量子化器を利用しており、このような点は、ビット率で効率的に符号化し難く、音質の劣化をもたらすことができ、高い音質を得るために、複雑度が上昇するという問題点がある。
本発明が解決しようとする技術的課題は、ビット率及び歪曲率を考慮して、所定の入力信号に対して最適の量子化方式を提供する入力信号の量子化及び逆量子化方法と装置を提供することである。
本発明が解決しようとする他の技術的課題は、ビット率及び歪曲率を考慮して、所定の入力信号に対して最適の量子化方式を提供する入力信号の符号化及び復号化方法と装置を提供することである。
前記課題を達成するために、本発明による入力信号の量子化方法は、入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するステップと、検出された量子化スケールタイプによって、入力信号を量子化するステップとを含む。
望ましくは、量子化スケールタイプを検出するステップは、一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出するステップと、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出するステップと、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出するステップとを含む。
前記他の課題を達成するために、本発明による入力信号の符号化方法は、入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するステップと、検出された量子化スケールタイプによって、入力信号を量子化するステップと、量子化された入力信号を符号化するステップとを含む。
前記他の課題を達成するために、本発明による入力信号の逆量子化方法は、入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、入力信号を逆量子化するステップを含む。
前記他の課題を達成するために、本発明による入力信号の復号化方法は、入力信号を復号化するステップ及び復号化された入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化された入力信号を逆量子化するステップを含む。
前記他の課題を達成するために、本発明による入力信号の量子化装置は、入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するタイプ検出部及び検出された量子化スケールタイプによって、入力信号を量子化する量子化部を備える。
望ましくは、タイプ検出部は、一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する変数検出部と、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出する相関関係検出部と、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出するスケールタイプ及びファクター検出部と、を備える。
前記他の課題を達成するために、本発明による入力信号の符号化装置は、入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するタイプ検出部と、検出された量子化スケールタイプによって、入力信号を量子化する量子化部と、量子化された入力信号を符号化する符号化部と、を備える。
前記他の課題を達成するために、本発明による入力信号の逆量子化装置は、入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、入力信号を逆量子化する逆量子化部を備える。
前記他の課題を達成するために、本発明による入力信号の復号化装置は、入力信号を復号化する復号化部及び復号化された入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化された入力信号を逆量子化する逆量子化部を備える。
本発明による入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置は、均等スケーラ量子化方式の問題点に該当する低い割当ビット数による符号化時の信号歪曲を最小化しうる。
また、本発明による入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置は、非均等スケーラ量子化方式のように、複雑度を上昇させるか、または最適のスケールを設定するための相当量の付加情報なしにも入力信号の圧縮効率を改善しうる。
また、本発明による入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置は、入力信号のビット割当数に対応する歪曲率のトレードオフを考慮して信号を符号化及び復号化しうる。
以下、本発明による入力信号の量子化方法を、添付された図面を参照して詳細に説明する。
図1は、本発明による入力信号の量子化方法を説明するための一実施形態のフローチャートである。
入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出する(第1ステップ)。
図2は、図1に示された第1ステップを説明するための一実施形態のフローチャートである。
一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する(第10ステップ)。入力信号として、特にオーディオ信号が入力される。一般化ガウス分布は、確率分布のガウスべき指数αによって媒介変数が決定された分布の集合である。ガウスべき指数αは、分布の尖度を調整する。一般化ガウス分布関数は、次の式(1)の通りである。
Figure 0005587599
ここで、Γは、ガンマ関数である。

ガウスべき指数αがα=1であれば、一般化ガウス分布は、標準ラプラス分布となり、ガウスべき指数αがα=2であれば、一般化ガウス分布は、正規分布となる。
前述したガウスべき指数αを、以下で一般化ガウス分布変数と称す。
図3は、入力信号の実際分布及び実際分布に近似した一般化ガウス分布の一例を示す図である。図3に示したように、入力信号の実際分布は、周波数領域に変換されたサンプルによる頻度をグラフで表現したものである。このような実際分布と近似した一般化ガウス分布を検索して、実際分布と近似した一般化ガウス分布をなす一般化ガウス分布変数αを検出することが第10ステップで行われる。図2に示した実際分布に類似した一般化ガウス分布変数αは、α=0.5である時ということが確認できる。
入力信号の実際分布に類似した一般化ガウス分布変数を検出するために、カイ2乗尺度を使用する。カイ2乗尺度は、次の式(2)の通りである。
Figure 0005587599
ここで、lは、周波数領域に変換されたサンプルの数を意味し、mは、サンプルiの実際分布された頻度大きさを意味し、nは、全てのサンプルの頻度大きさの総和を意味し、pは、一般化ガウス分布でサンプルiに対する確率を意味する。
式(2)から次の式(3)を類推しうる。
Figure 0005587599
式(3)から分かるように、一般化ガウス分布変数のうち、カイ2乗尺度を最低にする変数αが入力信号に近似した一般化ガウス分布変数として検出される。
一方、第10ステップで、入力信号の実際分布に対する標準偏差を検出する。検出された入力信号に対する標準偏差は、後述するスケールファクター検出時に使われる。
第10ステップ後に、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出する(第12ステップ)。一般化ガウス分布変数のそれぞれの値に対応する相関関係情報が予め保存されている。相関関係情報は、割当ビット数と歪曲率とがなすグラフについての情報を有する。
図4Aないし図4Dは、一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係を示す図である。図4Aないし図4Dのそれぞれに4個の曲線が表示されている。このような4個の曲線は、後述する量子化スケールタイプによる割当ビット数と歪曲率との相関関係をそれぞれ表す曲線である。
図4Aないし図4Dに示したような割当ビット数と歪曲率との相関関係を表す情報が一般化ガウス分布変数値別にそれぞれ保存されている。図4Aないし図4Dは、一般化ガウス分布変数αがα=0.25、α=0.5、α=1.00、α=2.00である場合のみを示しているが、これは、例示的なものであり、それ以外に多くの一般化ガウス分布変数に対応する相関関係情報が保存されている。
例えば、第10ステップで検出された入力信号に対応する一般化ガウス分布変数αがα=0.25であれば、第12ステップであらかじめ保存された相関関係情報のうち、α=0.25に該当する図3Aの相関関係情報を検出する。
第12ステップ後に、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出する(第14ステップ)。このとき、入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプが検出される。入力信号の歪曲率は、一例として心理音響モデリングを通じて決定されうる。すなわち、入力信号に対して、ある程度歪曲を許容しつつ符号化するか否かに対して、量子化ノイズを最小可聴限界以下となるように心理音響モデリングを行うことによって、入力信号の歪曲率が決定される。
量子化スケールは、入力信号の量子化において、ある程度の大きさに量子化するかを規定する要素である。量子化スケールタイプは、入力信号の歪曲率がどのように設定されるかによって、量子化スケールを異なって適用するために設けられた量子化スケールの種類を意味する。量子化スケールタイプを規定する式(4)は、次の通りである。
Figure 0005587599
ここで、Sは、量子化スケールタイプを意味し、Tは、量子化スケールを意味する。
図5は、量子化スケールタイプの一例を示す図である。図5に示したように、4つのスケールタイプが示されている。量子化スケールタイプSは、i=1であるので、前述した式(4)によって、T=1、T=2、T=3、T=4、T=5、T=6のスケールを有する。また、量子化スケールタイプSは、i=2であるので、前述した式(4)によって、T=2、T=3、T=4、T=5、T=6、T=7のスケールを有する。また、量子化スケールタイプSは、i=3であるので、前述した式(4)によって、T=4、T=5、T=6、T=7、T=8、T=9のスケールを有する。また、量子化スケールタイプSは、i=4であるので、前述した式(4)によって、T=8、T=9、T=10、T=11、T=12、T=13のスケールを有する。
例えば、第12ステップで、一般化ガウス分布変数αがα=1.00に該当する図4Cの相関関係が検出され、心理音響モデリングを通じて入力信号の歪曲率がD=1/80と決定されたとすれば、図4Cの検出された相関関係から入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプ(4)が検出される。同じ歪曲率D=1/80に対して、量子化スケールタイプ(1)の割当ビット数は、rに該当し、量子化スケールタイプ(2)の割当ビット数は、rに該当し、量子化スケールタイプ(3)の割当ビット数は、rに該当し、量子化スケールタイプ(4)の割当ビット数は、rに該当する。歪曲率D=1/80に対して、割当ビット数が最も低い量子化スケールタイプを選定することが圧縮効率面で優秀であるので、量子化スケールタイプ(4)が歪曲率D=1/80に対して量子化スケールタイプとして検出される。
前述したように、入力信号の歪曲率による量子化スケールタイプの検出は、次の式(5)によって検出される。
Figure 0005587599
ここで、iは、量子化スケールタイプを意味し、Dは、入力信号の歪曲率を意味し、d は、量子化スケールタイプiに対応する最小歪曲率を意味し、d は、量子化スケールタイプiに対応する最大歪曲率を意味する。入力信号の歪曲率が量子化スケールタイプiに対応する最小歪曲率と最大歪曲率との間に該当する時、量子化スケールタイプiが入力信号の歪曲率に対して量子化スケールタイプとして検出される。
入力信号の歪曲率に対応するスケールファクターは、次の式(6)によって検出される。
Figure 0005587599
ここで、SFは、スケールファクターを意味し、シグマσは、入力信号の標準偏差を意味し、Dは、入力信号の歪曲率を意味する。
スケールファクターが入力信号の歪曲率によって決定されることによって、量子化による圧縮効率を改善しうる。
第1ステップ後に、検出された量子化スケールタイプ及び検出されたスケールファクターによって、入力信号を量子化する(第2ステップ)。検出された量子化スケールタイプによって正規化係数を算出し、算出された正規化係数及びスケールファクターを使用して入力信号を量子化する。
正規化係数は、量子化のための基準値を調整するための係数である。正規化係数は、前述したスケールファクターを使用して、次の式(7)のように表現しうる。
Figure 0005587599
ここで、COEFは、正規化係数を意味し、SFは、スケールファクターを意味する。
算出された正規化係数は、入力信号の量子化のための式(8)に使われる。
Figure 0005587599
ここで、qは、量子化スケールに該当するインデックス値を意味し、xは、入力信号を意味し、sign(x)は、正(+)または負(−)の符号を意味し、roundは、計算された値の整数処理のための演算子である。
量子化スケールに該当するインデックス値は、図5に示された量子化スケールT、T、T、T、T、Tの下添字に該当するインデックス値を表す。入力信号が式(8)によって量子化されれば、量子化されたq値によって量子化スケールが決定される。例えば、量子化スケールタイプがSと検出され、スケールファクターSF及び正規化係数COEFから量子化スケールのインデックス値であるqがq=3と検出されれば、入力信号は、図4の量子化スケールタイプSのうち、Tのスケールに該当するT=4に量子化される。
図6Aないし図6Dは、本発明による量子化方法と従来の量子化方法とによる割当ビット数と歪曲率との相関関係を示す図である。図6Aないし図6Dで、RNUSQ(D)は、本発明による量子化方法による割当ビット数と歪曲率との相関関係を表し、R(D)は、理想的な量子化方法による時の割当ビット数と歪曲率との相関関係を表し、RUSQ(D)、ROUSQ(D)、RML(D)は、従来の量子化方法による割当ビット数と歪曲率との相関関係を表す。RUSQ(D)、ROUSQ(D)は、均等スケーラ量子化方法を意味し、RML(D)は、非均等スケーラ量子化方法(例えば、Max−Lloyd)を意味する。図6Aないし図6Dから分かるように、理想的な量子化方法を除いては、本発明による量子化方法が歪曲率に比べて相対的に割当ビット数が小さいということが確認できる。また、低い割当ビット数でも信号歪曲が従来の量子化方法に比べて減少することが確認できる。
以下、本発明による入力信号の符号化方法を、添付された図面を参照して詳細に説明する。
図7は、本発明による入力信号の符号化方法を説明するための一実施形態のフローチャートである。
入力信号の分布特性によって、量子化のためのスケールの種類を表す量子化スケールタイプを検出する(第20ステップ)。
図8は、図7に示された第20ステップを説明するための一実施形態のフローチャートである。
一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する(第30ステップ)。第30ステップは、前述した第10ステップと同じであるので、詳細な説明は省略する。
第30ステップ後に、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出する(第32ステップ)。第32ステップは、前述した第12ステップと同じであるので、詳細な説明は省略する。
第32ステップ後に、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出する(第34ステップ)。第34ステップは、前述した第14ステップと同じであるので、詳細な説明は省略する。
第20ステップ後に、検出された量子化スケールタイプ及び検出されたスケールファクターによって、入力信号を量子化する(第22ステップ)。第22ステップは、前述した第2ステップと同じであるので、詳細な説明は省略する。
第22ステップ後に、量子化された入力信号を符号化する(第24ステップ)。量子化された入力信号を2進のビット列で符号化する。このような符号化方法には、情報の損失なしに能率的に符号化する可変長符号化方式を使用する。
以下、本発明による入力信号の逆量子化方法を、添付された図面を参照して詳細に説明する。
図9は、本発明による入力信号の逆量子化方法を説明するための一実施形態のフローチャートである。
入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、入力信号を逆量子化する(第50ステップ)。量子化スケールの量子化間隔が0を基準に変わる量子化スケールタイプを使用して、復号化された入力信号を逆量子化することを特徴とする。量子化スケールタイプは、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を使用して決定されたタイプである。すなわち、図4Aないし図4Dに示された相関関係グラフのうち、一般化ガウス分布変数に対応する相関関係グラフを使用して量子化スケールタイプが決定される。このような量子化スケールタイプは、入力信号の歪曲率に対して最低の割当ビット数を有するタイプである。量子化スケールタイプは、符号化ステップで決定され、このように決定された量子化スケールタイプの情報が復号化ステップで逆量子化のための情報として使われる。また、スケールファクターは、入力信号の標準偏差を使用して検出されたファクターである。このようなスケールファクターも、符号化ステップで決定され、このように決定されたスケールファクターの情報が復号化ステップで逆量子化のための情報として使われる。量子化スケールタイプ及びスケールファクターについての詳細な内容は、前述した通りであるので、詳細な説明を省略し、但し、逆量子化過程では、符号化ステップで検出されたかかる情報を利用するのに特徴がある。
以下、本発明による入力信号の復号化方法を、添付された図面を参照して詳細に説明する。
図10は、本発明による入力信号の復号化方法を説明するための一実施形態のフローチャートである。
入力信号を復号化する(第70ステップ)。符号化された信号が入力されれば、入力信号のビット列を復号化する。このとき、復号化される入力信号の情報には、符号化時の量子化スケールタイプ及び量子化のためのスケールファクターについての情報も含まれる。量子化スケールタイプ及びスケールファクター情報は、後述する逆量子化のための情報として使われる。
第70ステップ後に、復号化された入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化された入力信号を逆量子化する(第72ステップ)。第72ステップについての詳細な内容は、前述した第50ステップと同じであるので、ここでは説明を省略する。
一方、前述した本発明の方法の発明は、コンピュータ可読コード/命令/プログラムで具現でき、媒体、例えば、コンピュータで読み取り可能な記録媒体を利用して前記コード/命令/プログラムを動作させる汎用デジタルコンピュータで具現されうる。前記コンピュータで読み取り可能な記録媒体は、マグネチック保存媒体(例えば、ROM(Read Only Memory)、フロッピー(登録商標)ディスク、ハードディスク、マグネチックテープなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを通じた伝送)のような保存媒体を含む。また、本発明の実施形態は、コンピュータ可読コードを内蔵する媒体として具現され、ネットワークを通じて連結された多数のコンピュータシステムが分配されて処理動作させうる。本発明を実現する機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマーによって容易に推論されうる。
以下、本発明による入力信号の量子化装置を、添付された図面を参照して詳細に説明する。
図11は、本発明による入力信号の量子化装置を説明するための一実施形態のブロック図であって、タイプ検出部90及び量子化部92で構成される。
図12は、図11に示されたタイプ検出部90を説明するための一実施形態のブロック図であって、変数検出部100、相関関係検出部110、データベース120、スケールタイプ及びファクター検出部130で構成される。
変数検出部100は、一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出し、検出した結果を相関関係検出部110に出力する。変数検出部100は、入力信号の実際分布と近似した一般化ガウス分布を検索して、実際分布と近似した一般化ガウス分布をなす一般化ガウス分布変数を検出する。特に、変数検出部100は、入力信号の実際分布に類似した一般化ガウス分布変数を検出するために、式(2)に示されたカイ2乗尺度を使用する。変数検出部100は、式(2)に示されたカイ2乗尺度によって類推しうる式(3)を使用して、一般化ガウス分布変数のうちカイ2乗尺度を最低にする変数を入力信号に近似した一般化ガウス分布変数として検出する。また、変数検出部100は、一般化ガウス分布変数を検出する以外に、入力信号の実際分布に対する標準偏差を検出する。検出された入力信号に対する標準偏差は、後述するスケールファクター検出時に使われるために、スケールタイプ及びファクター検出部130に出力される。
相関関係検出部110は、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出し、検出した結果をスケールタイプ及びファクター検出部130に出力する。一般化ガウス分布変数のそれぞれの値に対応する相関関係情報は、データベース120にあらかじめ保存されている。相関関係情報は、割当ビット数と歪曲率とがなすグラフについての情報である。図3Aないし図3Dは、データベース120に保存された一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係情報である。例えば、変数検出部100が入力信号に対応する一般化ガウス分布変数としてα=0.25を検出したならば、相関関係検出部110は、データベース120に保存された相関関係情報のうち、α=0.25に該当する相関関係情報を検出する。
スケールタイプ及びファクター検出部130は、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出し、検出した結果を量子化部140に出力する。
スケールタイプ及びファクター検出部130は、入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプを検出する。入力信号の歪曲率は、心理音響モデリングを通じて決定される。図5に示したように、量子化スケールタイプは、入力信号の歪曲率がどのように設定されるかによって、量子化スケールを異なって適用するために設けられた量子化スケールの種類を意味する。例えば、一般化ガウス分布変数α=1.00に該当する図4Cの相関関係が検出され、心理音響モデリングを通じて入力信号の歪曲率がD=1/80と決定されたとすれば、タイプ検出部132は、図4Cの検出された相関関係から入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプ(4)を検出する。歪曲率D=1/80に対して、割当ビット数が最も低い量子化スケールタイプを選定することが圧縮効率面で優秀であるので、量子化スケールタイプ(4)が歪曲率D=1/80に対する量子化スケールタイプとして検出される。スケールタイプ及びファクター検出部130は、入力信号の歪曲率による量子化スケールタイプの検出のために、前述した式(5)を使用する。
一方、スケールタイプ及びファクター検出部130は、入力信号の標準偏差を使用しスケールファクターを検出する。スケールタイプ及びファクター検出部130は、入力信号の歪曲率に対応するスケールファクターを検出するために、前述した式(6)を使用する。スケールファクターが入力信号の歪曲率によって決定されることによって、量子化による圧縮効率を改善しうる。
量子化部92は、検出された量子化スケールタイプ及び検出されたスケールファクターによって、入力信号を量子化する。量子化部92は、検出された量子化スケールタイプによって正規化係数を算出し、算出された正規化係数及びスケールファクターを使用して入力信号を量子化する。正規化係数は、量子化のための基準値を調整するための係数である。量子化部92は、前述した式(7)を使用して正規化係数を検出する。式(7)から分かるように、スケールファクターが正規化係数を求めるのに使われる。量子化部140は、前述した式(8)を使用して入力信号に対する量子化を行う。式(8)で、qは、量子化スケールに該当するインデックス値を意味する。したがって、入力信号が式(8)によって量子化されれば、量子化されたq値によって量子化スケールが決定される。例えば、量子化スケールタイプがSと検出され、スケールファクターSF及び正規化係数COEFから量子化スケールのインデックス値であるqがq=3と検出されれば、入力信号は、図5の量子化スケールタイプSのうち、Tのスケールに該当するT=4に量子化される。
以下、本発明による入力信号の符号化装置を、添付された図面を参照して詳細に説明する。
図13は、本発明による入力信号の符号化装置を説明するための一実施形態のブロック図であって、タイプ検出部150、量子化部152及び符号化部154で構成される。
図14は、図13に示されたタイプ検出部150を説明するための一実施形態のブロック図であって、変数検出部200、相関関係検出部210、データベース220、スケールタイプ及びファクター検出部230で構成される。
変数検出部200は、一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する。変数検出部200の内容は、前述した変数検出部100の内容と同じであるので、詳細な説明は省略する。
相関関係検出部210は、検出された一般化ガウス分布変数を使用して、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を検出する。相関関係検出部210の内容は、前述した相関関係検出部110の内容と同じであるので、詳細な説明は省略する。一般化ガウス分布変数のそれぞれの値に対応する相関関係情報は、データベース220にあらかじめ保存されている。
スケールタイプ及びファクター検出部230は、検出された相関関係から入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターを検出する。スケールタイプ及びファクター検出部230は、入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプを検出する。また、スケールタイプ及びファクター検出部230は、入力信号の標準偏差を使用してスケールファクターを検出する。スケールタイプ及びファクター検出部230の内容は、前述したスケールタイプ及びファクター検出部130の内容と同じであるので、詳細な説明は省略する。
量子化部152は、検出された量子化スケールタイプ及び検出されたスケールファクターによって、入力信号を量子化する。量子化部152の内容は、前述した量子化部92の内容と同じであるので、詳細な説明は省略する。
符号化部154は、量子化部152で量子化された入力信号を符号化する。符号化部154は、量子化された入力信号を2進のビット列で符号化する。符号化部154は、情報の損失なしに能率的に符号化する可変長符号化方式で符号化しうる。
以下、本発明による入力信号の逆量子化装置を、添付された図面を参照して詳細に説明する。
図15は、本発明による入力信号の逆量子化装置を説明するための一実施形態のブロック図であって、逆量子化部300で構成される。
逆量子化部300は、入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、入力信号を逆量子化する。逆量子化部300は、量子化スケールの量子化間隔が0を基準に変わる量子化スケールタイプを使用して、復号化された入力信号を逆量子化することを特徴とする。量子化スケールタイプは、入力信号を符号化するための割当ビット数と入力信号に対する歪曲率との相関関係を使用して決定されたタイプである。すなわち、図4Aないし図4Dに示された相関関係グラフのうち、一般化ガウス分布変数に対応する相関関係グラフを使用して量子化スケールタイプが決定される。このような量子化スケールタイプは、入力信号の歪曲率に対して最低の割当ビット数を有するタイプである。スケールファクターは、入力信号の標準偏差を使用して検出されたファクターである。量子化スケールタイプ及びスケールファクターは、符号化ステップで決定され、逆量子化部300は、符号化過程で決定された量子化スケールタイプ及びスケールファクターの情報を使用して入力信号を逆量子化する。
以下、本発明による入力信号の復号化装置を、添付された図面を参照して詳細に説明する。
図16は、本発明による入力信号の復号化装置を説明するための一実施形態のブロック図であって、復号化部400及び逆量子化部410で構成される。
復号化部400は、入力信号を復号化し、復号化した結果を逆量子化部410に出力する。符号化された信号が入力されれば、復号化部400は、入力信号のビット列を復号化する。このとき、復号化部400は、符号化時の量子化スケールタイプ及び量子化のためのスケールファクターについての情報も復号化する。量子化スケールタイプ及びスケールファクター情報は、後述する逆量子化のための情報として使われる。
逆量子化部410は、復号化部400で復号化された入力信号に対する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化された入力信号を逆量子化する。
一方、本発明による入力信号の符号化方法のさらに他の実施形態は、次の通りである。
まず、オーディオPCM(Pulse Code Modulation)データを入力される(第500ステップ)。第500ステップ後に、オーディオ信号を周波数変換する(第502ステップ)。第502ステップ後に、周波数変換された信号の分布特性を分析して量子化スケールタイプを検出する(第504ステップ)。第504ステップ後に、周波数変換された信号を検出されたスケールタイプによって量子化する(第506ステップ)。第506ステップ後に、量子化された信号を無損失符号化する(第508ステップ)。第508ステップ後に、無損失符号化された信号のビットストリームを生成する(第510ステップ)。オーディオ信号の符号化方法についての具体的な内容は、前述した入力信号の符号化方法で説明したので、詳細な説明を省略する。
一方、本発明による入力信号の復号化方法のさらに他の実施形態は、次の通りである。
まず、符号化されたオーディオビットストリームを入力される(第600ステップ)。第600ステップ後に、入力されたオーディオビットストリームを無損失復号化する(第602ステップ)。第602ステップ後に、復号化されたオーディオデータの歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化されたオーディオデータを逆量子化する(第604ステップ)。第604ステップ後に、逆量子化されたオーディオデータを時間軸に逆変換する(第606ステップ)。オーディオ信号の復号化方法についての具体的な内容は、前述した入力信号の復号化方法で説明したので、詳細な説明を省略する。
一方、本発明による入力信号の符号化装置のさらに他の実施形態は、データ入力部、周波数変換部、スケールタイプ検出部、量子化部、符号化部及びビットストリーム生成部を備える。
データ入力部は、オーディオPCMデータを入力される。周波数変換部は、オーディオ信号を周波数変換する。周波数変換部は、MDCT/FFT(Modified Discrete Consine Transform/Fast Fourier Transform)のような方式によってオーディオ信号を周波数変換する。スケールタイプ検出部は、周波数変換された信号の分布特性を分析して量子化スケールタイプを検出する。量子化部は、周波数変換された信号を検出されたスケールタイプによって量子化する。符号化部は、量子化された信号を無損失符号化する。ビットストリーム生成部は、無損失符号化された信号のビットストリームを生成する。オーディオ信号の符号化装置についての具体的な内容は、前述した入力信号の符号化装置で説明したので、説明を省略する。
一方、本発明による入力信号の復号化装置のさらに他の実施形態は、データ入力部、復号化部、逆量子化部、逆変換部を備える。
データ入力部は、符号化されたオーディオビットストリームを入力される。復号化部は、入力されたオーディオビットストリームを無損失復号化する。逆量子化部は、復号化されたオーディオデータの歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、復号化されたオーディオデータを逆量子化する。逆変換部は、逆量子化されたオーディオデータを時間軸に逆変換する。オーディオ信号の復号化装置についての具体的な内容は、前述した入力信号の復号化装置で説明したので、詳細な説明を省略する。
このような本願発明の入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置は、理解を助けるために図面に示された実施形態を参照して説明されたが、これは、例示的なものに過ぎず、当業者ならば、これから多様な変形及び均等な他の実施形態が可能であるということが分かるであろう。したがって、本発明の真の技術的保護範囲は、特許請求の範囲によって決定されねばならない。
本発明による入力信号の量子化方法を説明するための一実施形態のフローチャートである。 図1に示された第1ステップを説明するための一実施形態のフローチャートである。 入力信号の実際分布及び入力信号の実際分布に近似した一般化ガウス分布の一例を示す図である。 一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係を示す図である。 一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係を示す図である。 一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係を示す図である。 一般化ガウス分布変数値による割当ビット数と歪曲率との相関関係を示す図である。 量子化スケールタイプの一例を示す図である。 本発明による量子化方法及び従来の量子化方法による割当ビット数と歪曲率との相関関係を示す図である。 本発明による量子化方法及び従来の量子化方法による割当ビット数と歪曲率との相関関係を示す図である。 本発明による量子化方法及び従来の量子化方法による割当ビット数と歪曲率との相関関係を示す図である。 本発明による量子化方法及び従来の量子化方法による割当ビット数と歪曲率との相関関係を示す図である。 本発明による入力信号の符号化方法を説明するための一実施形態のフローチャートである。 図7に示された第20ステップを説明するための一実施形態のフローチャートである。 本発明による入力信号の逆量子化方法を説明するための一実施形態のフローチャートである。 本発明による入力信号の復号化方法を説明するための一実施形態のフローチャートである。 本発明による入力信号の量子化装置を説明するための一実施形態のブロック図である。 図11に示されたタイプ検出部を説明するための一実施形態のブロック図である。 本発明による入力信号の符号化装置を説明するための一実施形態のブロック図である。 図13に示されたタイプ検出部を説明するための一実施形態のブロック図である。 本発明による入力信号の逆量子化装置を説明するための一実施形態のブロック図である。 本発明による入力信号の復号化装置を説明するための一実施形態のブロック図である。

Claims (20)

  1. 入力信号の分布特性と、前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率とによって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するステップと、
    前記検出された量子化スケールタイプによって、前記入力信号を量子化するステップと、
    を含み、前記量子化スケールタイプを検出するステップは、
    一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を検出するステップと、
    前記検出された一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出するステップと、
    前記検出された相関関係から前記入力信号の前記歪曲率に対応する量子化スケールタイプを検出するステップと
    を含む、入力信号の量子化方法。
  2. 前記一般化ガウス分布変数を検出するステップは、
    カイ2乗尺度のうち、最低を表す値を前記一般化ガウス分布変数として検出することを特徴とする請求項に記載の入力信号の量子化方法。
  3. 前記相関関係を検出するステップは、
    前記一般化ガウス分布変数のそれぞれの値に対応する相関関係情報があらかじめ保存されていることを特徴とする請求項に記載の入力信号の量子化方法。
  4. 前記量子化スケールタイプを検出するステップは、
    前記入力信号の歪曲率に対して最低の割当ビット数を有する量子化スケールタイプを検出することを特徴とする請求項に記載の入力信号の量子化方法。
  5. 前記量子化スケールタイプは、量子化スケールの量子化間隔が0を基準に変わることを特徴とする請求項に記載の入力信号の量子化方法。
  6. 前記量子化スケールタイプは
    Figure 0005587599
    により表現される式(1)により規定され、Siは、量子化スケールタイプを意味し、Tjは、量子化スケールを意味する請求項に記載の入力信号の量子化方法。
  7. 前記スケールタイプを検出するステップは、
    前記入力信号の標準偏差を使用して前記スケールタイプを検出することを特徴とする請求項に記載の入力信号の量子化方法。
  8. 前記入力信号を量子化するステップは、
    前記検出された量子化スケールタイプによって正規化係数を算出し、前記算出された正規化係数及び前記スケールタイプを使用して前記入力信号を量子化することを特徴とする請求項に記載の入力信号の量子化方法。
  9. 前記入力信号は、オーディオ信号であることを特徴とする請求項1に記載の入力信号の量子化方法。
  10. 請求項1ないしのうち何れか1項に記載の方法を、コンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
  11. 入力信号の分布特性と、前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率とによって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するステップと、
    前記検出された量子化スケールタイプによって、前記入力信号を量子化するステップと、
    前記量子化された入力信号を符号化するステップと
    を含み、前記量子化スケールタイプを検出するステップは、
    一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出するステップと、
    前記検出された一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出するステップと、
    前記検出された相関関係から前記入力信号の前記歪曲率に対応する量子化スケールタイプを検出するステップと
    を含む、入力信号の符号化方法。
  12. 入力信号の分布特性と、前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率とによって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するタイプ検出部と、
    前記検出された量子化スケールタイプによって、前記入力信号を量子化する量子化部
    を備え、前記タイプ検出部は、
    一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する変数検出部と、
    前記検出された一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出する相関関係検出部と、
    前記検出された相関関係から前記入力信号の前記歪曲率に対応する量子化スケールタイプを検出するスケールタイプ及びファクター検出部と
    を備える、入力信号の量子化装置。
  13. 入力信号の分布特性と、前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率とによって、量子化のためのスケールの種類を表す量子化スケールタイプを検出するタイプ検出部と、
    前記検出された量子化スケールタイプによって、前記入力信号を量子化する量子化部と、
    前記量子化された入力信号を符号化する符号化部
    を備え、前記タイプ検出部は、
    一般化ガウス分布を入力信号の分布にマッチングさせる一般化ガウス分布変数を検出する変数検出部と、
    前記検出された一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出する相関関係検出部と、
    前記検出された相関関係から前記入力信号の前記歪曲率に対応する量子化スケールタイプを検出するスケールタイプ及びファクター検出部とを備える、入力信号の符号化装置。
  14. 入力信号に対する許容歪曲と量子化ノイズの心理音響モデリングにより決定される入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、前記入力信号を逆量子化するステップを含み、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とする入力信号の逆量子化方法。
  15. 入力信号を復号化するステップと、
    前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される前記復号化された入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、前記復号化された入力信号を逆量子化するステップとを含み、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とする入力信号の復号化方法。
  16. 入力信号に対する許容歪曲と量子化ノイズの心理音響モデリングにより決定される入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、前記入力信号を逆量子化する逆量子化部を備え、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とする入力信号の逆量子化装置。
  17. 入力信号を復号化する復号化部と、
    前記入力信号に対して、許容歪曲と量子化ノイズの心理音響モデリングにより決定される前記復号化された入力信号の歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、前記復号化された入力信号を逆量子化する逆量子化部とを備え、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とする入力信号の復号化装置。
  18. オーディオPCMデータを入力されるデータ入力部と、
    オーディオ信号を周波数変換する周波数変換部と、
    周波数変換された信号の分布特性と、許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率とを分析して量子化スケールタイプを検出するスケールタイプ検出部と、
    前記周波数変換された信号を前記検出されたスケールタイプによって量子化する量子化部と、
    前記量子化された信号を無損失符号化する符号化部と、
    無損失符号化された信号のビットストリームを生成するビットストリーム生成部とを備え、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とするオーディオ信号の符号化装置。
  19. 符号化されたオーディオビットストリームを入力されるデータ入力部と、
    前記入力されたオーディオビットストリームを無損失復号化する復号化部と、
    許容歪曲と量子化ノイズの心理音響モデリングにより決定される前記復号化されたオーディオデータの歪曲率に対応する量子化スケールタイプ及び量子化のためのスケールファクターによって、前記復号化されたオーディオデータを逆量子化する逆量子化部と、
    前記逆量子化されたオーディオデータを時間軸に逆変換する逆変換部とを備え、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とするオーディオ信号の復号化装置。
  20. 入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と、前記入力信号に対する許容歪曲と量子化ノイズの心理音響モデリングにより決定される歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の歪曲率に対応する量子化スケールタイプを決定するスケールタイプ決定部と、
    前記検出された量子化スケールタイプ及び前記分布特性によって、前記入力信号を処理するプロセッサーとを備え、
    前記量子化スケールタイプは、一般化ガウス分布を前記入力信号の分布にマッチングさせる一般化ガウス分布変数を使用して、前記入力信号を符号化するための割当ビット数と前記入力信号の歪曲率との相関関係を検出し、前記検出された相関関係から前記入力信号の前記歪曲率に対応して検出された量子化スケールタイプであることを特徴とする入力信号の処理装置。
JP2009504099A 2006-04-03 2006-10-19 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 Expired - Fee Related JP5587599B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020060030167A KR100738109B1 (ko) 2006-04-03 2006-04-03 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
KR10-2006-0030167 2006-04-03
PCT/KR2006/004268 WO2007114546A1 (en) 2006-04-03 2006-10-19 Method and apparatus to quantize and dequantize input signal, and method and apparatus to encode and decode input signal

Publications (2)

Publication Number Publication Date
JP2009532734A JP2009532734A (ja) 2009-09-10
JP5587599B2 true JP5587599B2 (ja) 2014-09-10

Family

ID=38503954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009504099A Expired - Fee Related JP5587599B2 (ja) 2006-04-03 2006-10-19 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置

Country Status (6)

Country Link
US (1) US7508333B2 (ja)
EP (1) EP2008466A4 (ja)
JP (1) JP5587599B2 (ja)
KR (1) KR100738109B1 (ja)
CN (1) CN101406064B (ja)
WO (1) WO2007114546A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4721355B2 (ja) * 2006-07-18 2011-07-13 Kddi株式会社 符号化データの符号化則変換方法および装置
US20090030676A1 (en) * 2007-07-26 2009-01-29 Creative Technology Ltd Method of deriving a compressed acoustic model for speech recognition
MX2013012301A (es) * 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
CN105324949B (zh) 2013-05-29 2018-05-29 凯迪迪爱通信技术有限公司 基站系统及通信装置
WO2016121826A1 (ja) * 2015-01-30 2016-08-04 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP6140747B2 (ja) 2015-03-09 2017-05-31 パナソニック株式会社 送信装置及び量子化方法
JP6392450B2 (ja) * 2015-04-13 2018-09-19 日本電信電話株式会社 マッチング装置、判定装置、これらの方法、プログラム及び記録媒体
US10531099B2 (en) * 2016-09-30 2020-01-07 The Mitre Corporation Systems and methods for distributed quantization of multimodal images

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0575869A (ja) * 1991-09-17 1993-03-26 Oki Electric Ind Co Ltd 画像圧縮装置
KR950009412B1 (en) 1992-11-20 1995-08-22 Daewoo Electronics Co Ltd Method and system of adaptive beit allocation according to frame variation
WO1995002929A1 (en) * 1993-07-16 1995-01-26 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
KR970057995A (ko) * 1995-12-30 1997-07-31 배순훈 Mpeg 복호기에서 역양자화기의 최적화 장치
KR100209357B1 (ko) * 1996-10-17 1999-07-15 이계철 Mpeg-1 및 mpeg-2 비디오 역양자기 회로
US6144698A (en) * 1996-10-31 2000-11-07 Mitsubishi Electric Information Technology Center America, Inc. (Ita) Digital video decoder and method of decoding a digital video signal
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6075901A (en) * 1998-12-04 2000-06-13 France Telecom Method and system for predictive encoding of arrays of data
JP3360046B2 (ja) * 1999-09-28 2002-12-24 松下電器産業株式会社 音声符号化装置、音声復号化装置及び音声符復号化方法
KR100355440B1 (ko) * 2000-07-20 2002-10-11 주식회사 하이닉스반도체 적응 양자화 계수발생기
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
DE10300048B4 (de) * 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
JP2003304404A (ja) * 2002-04-09 2003-10-24 Canon Inc 画像符号化装置
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
WO2004061702A1 (en) * 2002-12-26 2004-07-22 The Trustees Of Columbia University In The City Of New York Ordered data compression system and methods
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
KR100668299B1 (ko) * 2004-05-12 2007-01-12 삼성전자주식회사 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치
KR100695125B1 (ko) * 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
US7508333B2 (en) 2009-03-24
WO2007114546A1 (en) 2007-10-11
CN101406064A (zh) 2009-04-08
JP2009532734A (ja) 2009-09-10
EP2008466A1 (en) 2008-12-31
EP2008466A4 (en) 2011-08-17
CN101406064B (zh) 2011-10-26
KR100738109B1 (ko) 2007-07-12
US20070229345A1 (en) 2007-10-04

Similar Documents

Publication Publication Date Title
JP5587599B2 (ja) 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置
KR100571824B1 (ko) 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
JP5107916B2 (ja) オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置
KR100634506B1 (ko) 저비트율 부호화/복호화 방법 및 장치
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
US7835907B2 (en) Method and apparatus for low bit rate encoding and decoding
US20030215013A1 (en) Audio encoder with adaptive short window grouping
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
RU2289858C2 (ru) Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник
KR20100089772A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR100349329B1 (ko) 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
JP3389849B2 (ja) 量子化装置
Mandal et al. Digital Audio Compression

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110907

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121024

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130819

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20131025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140724

R150 Certificate of patent or registration of utility model

Ref document number: 5587599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees