JP2006235253A - 符号化装置、符号化方法、復号化装置及び復号化方法 - Google Patents

符号化装置、符号化方法、復号化装置及び復号化方法 Download PDF

Info

Publication number
JP2006235253A
JP2006235253A JP2005050005A JP2005050005A JP2006235253A JP 2006235253 A JP2006235253 A JP 2006235253A JP 2005050005 A JP2005050005 A JP 2005050005A JP 2005050005 A JP2005050005 A JP 2005050005A JP 2006235253 A JP2006235253 A JP 2006235253A
Authority
JP
Japan
Prior art keywords
bits
bit allocation
frame
bit
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005050005A
Other languages
English (en)
Other versions
JP4573670B2 (ja
Inventor
Satoru Miyata
哲 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toa Corp
Original Assignee
Toa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toa Corp filed Critical Toa Corp
Priority to JP2005050005A priority Critical patent/JP4573670B2/ja
Publication of JP2006235253A publication Critical patent/JP2006235253A/ja
Application granted granted Critical
Publication of JP4573670B2 publication Critical patent/JP4573670B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 本発明は、音質を良好に維持しつつ符号化可能な符号化装置を目的とする。
【解決手段】 本発明のビット割当部は、所望のビット数Xよりも大きな目標ビット数X+aを設定し、目標ビット数X+a以下となるようにビット割当を決定する(ステップS30a参照)。次に、比較部21は、生成フレームのビット数と所望のビット数Xとを比較する(ステップS30b参照)。ここで、生成フレームのビット数が所望のビット数X以下である場合は、差分符号化器は、そのときのビット割当に基づく差分符号化データをビットストリーム生成部に出力する(ステップS30d参照)。一方、生成フレームのビット数が所望のビット数より大きい場合は、ビット割当部は、前回設定した目標ビット数X+aよりも小さく、かつ所望のビット数Xよりも大きな目標ビット数X+bを設定してビット割当を決定することを繰り返す(ステップS30e、30f参照)。
【選択図】 図2

Description

本発明は、入力信号の符号化装置、符号化方法、復号化装置及び復号化方法に関するものである。
音声符号化技術は、1990年代から大きく発展してきており、インターネットを用いた音楽配信や携帯音楽プレーヤなどに応用されている。特に、DSP(Digital Signal Processor)などのデバイス性能の向上とともに、携帯音楽プレーヤなどの普及が大きく進んでいる。
これらのアプリケーションで主に用いられている音声符号化技術としては、MP3(MPEG1 Audio Layer3)、AAC(Advanced Audio Coding)、ATRAC(Adaptive TRansform Acoustic Coding)などの周波数変換型の技術が挙げられる。これらの周波数変換型の音声符号化技術においては、時間領域の入力データを周波数変換して人間の聴覚特性を考慮に入れて分析することで、帯域毎のビット割当を動的に変更する。これにより、入力データに最適なビット割当を実現し、高圧縮率でも比較的音質劣化の少ない音声符号化技術を提供している。
しかし、上記音声符号化技術においては、周波数分解能を確保するために周波数変換のフレームの長さ、つまりオーディオデータのサンプル数を大きく取っているため、遅延時間が大きくなる。この遅延時間は、周波数変換を行うためのフレーム長分、オーディオデータを蓄積するために発生する。例えば、AACではフレーム長が1024サンプルであり、標本化周波数48kHzである場合、符号化及び復号化に要する遅延時間は64msecとなる。これでは、発話及び受話をリアルタイムで行う機器への利用を考えると遅延時間が大きすぎて聞く人に違和感を与える。また、拡声器などでは、使用者による発話と使用者に届く自分の声とにずれが生じることで、発話が困難になるなどの問題が発生する。
そこで、遅延時間を小さくするためにフレーム長を短くする技術が提案されている。ここで、フレームは、ヘッダ情報、オーディオデータに付随する情報であるスケールファクタやビット割当情報及びオーディオデータなどから構成される。フレーム長を短くした場合には、オーディオデータ以外のヘッダ情報やオーディオデータに付随する情報などのフレームに占める割合が大きくなり、オーディオデータに割当可能なビット数が減少する。そのため、符号化されたオーディオデータの音質の劣化が著しい。
そこで、本発明は、音質を良好に維持しつつ符号化可能な符号化装置、符号化方法を提供することを目的とする。また、音質を良好に維持しつつ復号化可能な復号化装置及び復号化方法を提供することを目的とする。
上記課題を解決するために、本願第1発明は、時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化し、以下の要素を含む符号化装置を提供する。
◎前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成手段、
◎前記スペクトル信号の心理聴覚分析を行い、帯域毎のビット割当を決定するビット割当手段、
◎前記ビット割当手段により決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化器、
◎前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化手段、
◎前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力手段、
ここで、前記ビット割当手段は、前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す。
通常、ビットストリームは、量子化の際に割り当てるビット数に関するビット割当情報と、そのビット割当情報に基づいて量子化される量子化スペクトルとを含むフレームから構成される。本発明では、前述のビット割当情報としてビット割当の差分符号化データを用いる。ここで、ビット割当の差分符号化データは、現在フレームと直前フレームとのビット割当の差分をエントロピー符号化したものである。ビット割当情報としてこの差分符号化データを用いてフレームを生成することで、ビット割当そのものを用いるよりもビット割当情報に割り当てるビット数を少なくすることができる。よって、ビット割当情報に割り当てるビット数が少なくてすむ分だけ、量子化スペクトルに割り当てるビット数を増加することができる。以下では、このように目標ビット数を繰り返し設定して最適なビット割当を行うことを、目標ビット数に基づくビット割当というものとする。
具体的には、ビット割当手段は、ビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きな目標ビット数を設定し、その目標ビット数以下となるようにビット割当を決定する。ここで、生成されるであろう生成フレームは、決定されたビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した差分符号化データと、決定されたビット割当に基づいて量子化された量子化スペクトルとを含んで生成される。ビット割当手段は、この生成フレームのビット数と所望のビット数とを比較する。比較の結果、生成フレームのビット数が所望のビット数よりも大きい場合は、前回設定した目標ビット数よりも小さく、かつ所望のビット数よりも大きな目標ビット数を設定する。そして、ビット割当手段は、再度設定された目標ビット数に基づいてビット割当を行い、このビット割当を用いて生成される生成フレームのビット数と所望のビット数との比較を行う。そして、生成フレームのビット数が所望のビット数よりも大きい場合は、同様に前回設定した目標ビット数よりも小さく、かつ所望のビット数よりも大きな目標ビット数を設定することを繰り返す。このように目標ビット数を設定してビット割当を決定することを繰り返すのは、差分データの符号化後の符号量を予測することができないからである。
ビット割当情報としてビット割当そのものではなく差分符号化データを用いることで、ビット割当情報のビット数が減少するが、以上のようにビット割当を行うことで、この減少した分のビット数が量子化スペクトルに割り当てられるようになる。よって、量子化スペクトルに割り当てるビット数を増加することができる。そのため、遅延時間を短縮するためにフレーム長を短くしても、量子化スペクトルに割り当てられるビット数の減少を抑えることができ音質の劣化を防止することができる。また、ビット割当手段は、生成フレームのビット数が1フレームの所望のビット数以下であるかを判断するため、ビットレートを維持しつつ量子化スペクトルにビットを最適に割り当てることができる。これにより、生成フレームのビット数が所望のビット数を超えることによる音質の劣化を防止することができる。
なお、ビット割当情報に割り当てるビット数が少なくてすむ分だけビットストリームを構成するフレームを小さくすると、同じ音質であってもより圧縮率を高めることができる。また、ビット数が少なくてすむ分だけ量子化スペクトルに割り当てるとともにフレームを小さくすることで、遅延時間を短縮しつつ音質の劣化を防止することもできる。
本願第2発明は、第1発明において、前記ビット割当手段は、前記目標ビット数に基づくビット割当の決定の繰り返しを所定の制限回数で終了する符号化装置を提供する。
繰り返し回数に制限を設けることで、量子化スペクトルへの最適なビット割当に要する演算量を低減させることができる。特に、遅延時間を短くするためにフレーム長を短くすると、演算に許される時間が短くなる。そのため、フレーム長が大きい場合には問題とならないような処理の演算量が、全体の演算量に対して大きな影響を与えるようになる。このような場合に、繰り返し回数に制限を設けて演算量を低減させることが有効となる。例えば、ビット割当の差分データをエントロピー符号化する際の演算量が大きく、繰り返し回数によっては演算処理が間に合わずノイズが発生する原因となる場合がある。そこで、前述のように、繰り返し回数に制限を設けて演算量を低減させ、所定時間内に演算処理を終了させノイズの発生を防止する。
本願第3発明は、第2発明において、前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合(以下、フラグ=“0”とする)と、前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合(以下、フラグ=“1”とする)とに応じてフラグを設定するフラグ設定手段をさらに含み、前記ビットストリーム出力手段は、さらに前記フラグを含む生成フレームを生成する。また、前記ビット割当手段は、前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合は、前記目標ビット数に基づくビット割当を前記差分データ符号化器に出力し、前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数に基づくビット割当を前記ビットストリーム出力手段に出力する。さらに、前記ビットストリーム生成手段は、前記ビット割当手段での比較結果に応じて、前記フラグ=“0”と、前記差分符号化データと、前記量子化スペクトルとを含む生成フレームか、または前記フラグ=“1”と、前記所望のビット数に基づくビット割当と、前記量子化スペクトルとを含む生成フレームかのいずれかを生成し出力する。
ここで、目標ビット数に基づくビット割当とは、所望のビット数よりも高い目標ビット数を設定し、所望のビット数以下となるようにビット割当を繰り返し行ったときのビット割当をいう。一方、所望のビット数に基づくビット割当とは、目標ビット数として所望のビット数を設定し、所望のビット数以下となるようにビット割当を行ったときのビット割当をいう。
具体的に、ビット割当手段は、生成フレームのビット数と、フレームの所望のビット数とを比較する。ここで、予め設定された制限回数に達するまで目標ビット数に基づくビット割当を繰り返し行った場合であっても、生成フレームのビット数が所望のビット数よりも大きくなる場合がある。フラグ設定手段は、この時の状態をフラグ=“1”として設定する。一方、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、フラグ設定手段は、この時の状態をフラグ=“0”として設定する。
ここで、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、目標ビット数に基づくビット割当が差分符号化データに出力される。そして、差分符号化データは、目標ビット数に基づくビット割当と直前フレームのビット割当との差分データをエントロピー符号化して差分符号化データを演算し、ビットストリーム出力手段に出力する。ビットストリーム出力手段は、フラグ=“0”と、差分符号化データと、量子化スペクトルとを含む生成フレームによりビットストリームを生成する。このようにビット割当情報として差分符号化データを用いることでビット数を節約しており、ビット割当手段は、その分のビット数を量子化スペクトルに割り当てるような最適なビット割当を行っている。よって、音質の劣化を防ぐことができる。
一方、予め設定された制限回数に達しても生成フレームのビット数が所望のビット数よりも大きくなった場合は、ビット割当手段が所望のビット数に基づくビット割当をビットストリーム出力手段に出力する。ビットストリーム出力手段は、フラグ=“1”と、所望のビット数に基づくビット割当と、量子化スペクトルとを含む生成フレームによりビットストリームを生成する。この場合、生成フレームが1フレームの所望のビット数を超えることによる音質の劣化を防止することができる。
また、復号化装置は、このように生成されたビットストリームを受信し、まずフラグを解釈することでビット割当情報が差分符号化データであるかどうかを判断する。フラグ=“0”である場合は、ビット割当情報はエントロピー符号化されており、ビットストリームには差分符号化データが含まれる。よって、復号化装置では、エントロピー符号化された差分符号化データを復号化してビット割当の差分データを取得し、対応するビット割当を算出する。そして、このビット割当に基づいて量子化スペクトルを逆量子化及び逆周波数変換して入力データを取得する。一方、フラグ=“1”である場合は、復号化装置は、ビットストリーム内の所望のビット数に基づくビット割当に基づいて量子化スペクトルを逆量子化及び逆周波数変換して入力データを取得する。
本願第4発明は、第1または第2発明において前記差分データ符号化器によるエントロピー符号化はハフマン符号化である符号化装置を提供する。
ハフマン符号化は、一般的に演算量の小さい符号化方式であるが、一方で符号化後の符号量を予測することが困難な符号化方式である。上記の通り、本願の符号化では、ビット割当情報として差分符号化データを含む生成フレームが、所望のビット数以下となるようにビット割当を繰り返し行う。このように繰り返しビット割当を行うため、符号量の予測が困難なハフマン符号化であっても、生成フレームが所望のビット数以下となるように収束させることが可能である。よって、ハフマン符号化により演算量を小さくしつつ、量子化スペクトルに割り当てるビット数を減らさないような符号化を行うことができる。
また、繰り返し回数に制限を設けた場合には、所定時間内に演算処理を終了させノイズの発生を防ぐことができる。前述の通り、ハフマン符号化は符号量の予測が困難であるため、所望のビット数以下となるようにビット割当を行うには繰り返し回数が多くなり演算量が多くなる場合がある。しかし、繰り返し回数に制限を設けた場合には、演算量の増加に制限を設けることができ、ノイズの発生を防ぐことができる。
本願第5発明は、時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化する符号化方法であって、以下のステップを含む。
◎前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成ステップ、
◎前記スペクトル信号の心理聴覚分析を行い、前記帯域毎のビット割当を決定するビット割当ステップ、
◎前記ビット割当ステップにより決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化ステップと、
◎前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化ステップと、
◎前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力ステップ、
ここで、前記ビット割当ステップでは、前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す。
本願第5発明の符号化方法によれば、本願第1発明と同様の作用効果を奏する。
本願第6発明は、入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化装置であって、前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解部と、前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化部と、前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化器とを含む復号化装置を提供する。
本願第6発明の復号化装置によれば、本願第1発明と同様に遅延を低減し音質が向上された出力データを得ることができる。
本願第7発明は、入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化方法であって、前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解ステップと、前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化ステップと、前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化ステップとを含む復号化方法を提供する。
本願第7発明は、本願第6発明と同様の作用効果を奏する。
本発明によれば、音質を良好に維持しつつ符号化可能な符号化装置、符号化方法を提供することができる。また、音質を良好に維持しつつ復号化可能な復号化装置及び復号化方法を提供することができる。
<発明の概要>
図1は、符号化による遅延時間を短縮しつつ音質を良好に維持可能な本発明の概要を説明するための模式図であり、(a)、(b)及び(c)はそれぞれビットストリームの生成フレームの模式図である。図1(a)はビット割当情報としてビット割当そのものを用いて生成した生成フレームを示しており、図1(b)及び(c)はビット割当情報としてビット割当の差分符号化データを用いて生成した生成フレームを示している。
符号化装置が生成するビットストリームの生成フレームは、ビット割当情報及び入力データのサンプルを含んで構成される。ここで、以下ビット割当情報とは、ビット割当そのもの及びビット割当の差分符号化データの総称とする。
本発明を適用しない場合、生成フレームを構成するビット割当情報としてはビット割当そのものを用いており、生成フレームは図1の(a)に示すようにビット割当ba及びサンプルmcにより構成される。一方、本発明の符号化装置では、ビット割当情報として現在フレームのビット割当と直前フレームのビット割当との差分をエントロピー符号化した差分符号化データhbaを用いる。よって、本発明により生成される生成フレームは、図1の(b)に示すように差分符号化データhba及びサンプルmcにより構成される。
ビット割当情報としてビット割当そのものを用いた生成フレーム(図1(a)参照)と、ビット割当情報として差分符号化データを用いた生成フレーム(図1(b)参照)とを比較すると、図1(b)の生成フレームは図1(a)の生成フレームよりも斜線部分の分だけ生成フレームに割り当てるビット数が削減されている。これは、ビット割当情報としてビット割当そのものではなくビット割当の差分符号化データを用いているためである。ここで、図1の(c)の生成フレームに示すように、この削減されたビット数分をサンプルmcに割り当てることでサンプルmcに割り当てるビット数を増加することができる。そのため、遅延時間を短縮するためにフレーム長を短くしても、量子化サンプルmcに割り当てられるビット数の減少を抑えることができ音質の劣化を防止することができる。
<第1実施形態例>
{符号化装置の構成}
図2は、本発明の第1実施形態例に係る符号化装置である。以下に、第1実施形態例に係る符号化装置100の各部の構成について説明する。
(1)MDCT変換器
MDCT変換器11は、オーディオ信号などの入力データを変形離散コサイン変換処理(MDCT:Modified Discrete Cosine Transform)し、MDCT係数(図2中、mdctに相当:スペクトル信号とも言う)を生成する。このMDCT係数は、入力データの周波数スペクトルを表現する係数である。ここで、入力データはフレーム毎に入力され、MDCT変換器11はフレーム単位のMDCT係数を出力する。フレームとは、符号化・復号化の1単位処理において処理されるデータであり、1単位の処理ではこれまでのデータに加えて新たに1フレーム分の入力データを読み込み、処理を行うことで1フレーム分の新たなMDCT係数を算出する。本発明の第1実施形態例に係るMDCT変換器11では、変換処理を行うフレーム長が短い。つまり1フレーム内のサンプリング数が少ない。例えば、フレーム長が128サンプル以下であり、好ましくは64サンプル以下である。このように1フレームに含まれるサンプル数が少ないため、1フレーム分の入力データが蓄積されるのに要する時間が短く、1フレームの処理を開始するまでに要する遅延が少ない。よって、全体として符号化・復号化に要する時間を短縮することができる。以下、第1実施形態例では、フレーム毎に64サンプルのMDCT係数を生成しているものとする。
(2)スケーリング部
スケーリング部13は、MDCT係数を数本ずつ含むセグメントに1フレームを分割し、セグメントごとにスケールファクタ(図2中、scに相当)を算出するとともに、スケールファクタに基づいてセグメントごとにMDCT係数を正規化(図2中、正規化mdctに相当)する。ここで、スケールファクタとは、セグメント毎におけるMDCT係数の振幅の最大値に基づく値である。第1実施形態例では、2サンプルのMDCT係数を1セグメントとし、1フレームを32分割し32個のスケールファクタを算出している。
(3)FFT部
FFT部25は、入力データについてFFT(Fast Fourier Transform)による周波数スペクトルの計算を行って、例えば512点の周波数データを算出し心理聴覚分析器27に出力する。
(4)心理聴覚分析器
心理聴覚分析器27は、FFT部25からの算出結果に基づいて帯域毎のSMR(Signal to Masking Ratio)を決定し、ビット割当部15に出力する。以下、ビット割当の単位を帯域というものとする。ビット割当の単位である帯域とスケールファクタを算出する単位であるセグメントは、同じ単位であっても良いし異なっていても良い。
(5)ビット割当部
以下において、所望のビットレートのビットストリームを構成する1フレームのビット数を所望のビット数とする。まず、ビット割当部15は、所望のビット数よりも大きな目標ビット数を設定する。そして、ビット割当部15は、正規化MDCT係数及びSMRの入力を受けて、生成フレームが目標ビット数以下となるようにビット割当を行う。さらに、ビット割当部15は、決定したビット割当を後述の量子化器17及び差分符号化器19に出力する。差分符号化器19は、決定されたビット割当に基づいて差分符号化データを演算する。そして、比較部21は、その差分符号化データと、決定されたビット割当に基づいて量子化された量子化MDCT係数(図2中、mcに相当)と、スケールファクタと、後述のフラグ情報とを含んで生成される場合の生成フレームのビット数と、所望のビット数とを比較する。ビット割当部15は、比較部21での比較結果を受信し、比較結果に応じて、必要であれば再度ビット割当を行う。
ビット割当部15は、生成フレームのビット数が所望のビット数以下である場合は、そのときの目標ビット数に基づくビット割当をビットストリーム生成部29に出力する。一方、ビット割当部15は、生成フレームのビット数が所望のビット数よりも大きい場合は、再度、目標ビット数を設定してビット割当を行う。このとき設定する目標ビット数は、所望のビット数よりも大きく、かつ直前に設定した目標ビット数よりも小さくなるように設定する。そして、差分符号化器19及び比較部21により同様に比較結果が算出されビット割当部15に入力される。ビット割当部15は、その比較結果に応じて生成フレームのビット数が所望のビット数よりも大きい場合は、同様の処理を繰り返す。
なお、ビット割当部15は、ビット割当の繰り返し回数をカウントするカウンタ(図示せず)を有しており、繰り返し回数を制限する。所定の繰り返し回数(以下、制限回数という)に到達しても生成フレームのビット数が所望のビット数よりも大きい場合は、ビット割当部15は所望のビット数に基づいてビット割当を行う。そして、この所望のビット数に基づくビット割当をビットストリーム生成部29に出力する。このように繰り返し回数に制限を設けることで、量子化MDCT係数への最適なビット割当に要する演算量を低減させることができる。特に、遅延時間を短くするためにフレーム長を短くすると、演算に許される時間が短くなる。そのため、フレーム長が大きい場合には問題とならないような処理の演算量が、全体の演算量に対して大きな影響を与えるようになる。このような場合に、繰り返し回数に制限を設けて演算量を低減させることが有効となる。例えば、ビット割当の差分データをエントロピー符号化する際の演算量が大きく、繰り返し回数によっては演算処理が間に合わずノイズが発生する原因となる場合がある。そこで、前述のよう繰り返しに制限を設けて演算量を低減させ、所定時間内に演算処理を終了させノイズの発生を防止する。また、後述の差分符号化器19において、差分データのエントロピー符号化としてハフマン符号化を用いた場合に、制限回数を有していると有効である。ハフマン符号化は、一般的に演算量の小さい符号化方式であるが、一方で符号化後の符号量を予測することが困難な符号化方式である。よって、ハフマン符号化を用いて所望のビット数以下となるようにビット割当を行うには繰り返し回数が多くなり演算量が多くなる場合がある。しかし、繰り返し回数に制限を設けた場合には、演算量の増加に制限を設けて所定時間内に演算処理を終了させ、ノイズの発生を防ぐことができる。
(6)差分符号化器
差分符号化器19は、ビット割当部15から出力されるビット割当と直前フレームのビット割当との差分データをハフマン符号化して差分符号化データ(図中、hbaに相当)を算出する。さらに、差分符号化器19は、比較部21での比較結果に基づいて差分符号化データをビットストリーム生成部29に出力する。なお、差分符号化器19ではエントロピー符号化としてハフマン符号化を用いているが、これに限定されるものではない。ただし、ハフマン符号化を用いた場合には演算量を小さくできるので好ましい。
また、ビット割当部15が決定したビット割当の差分符号化データと、そのビット割当に基づいて量子化された量子化MDCT係数と、スケールファクタと、後述のフラグ情報とを含んで生成される場合の生成フレームのビット数が所望のビット数以下である場合は、差分符号化器19はビットストリーム生成部29に差分符号化データを出力する。一方、生成フレームのビット数が所望のビット数よりも大きい場合は、差分符号化器19はビットストリーム生成部29への差分符号化データの出力を行わない。なお、この場合はビット割当部15が決定した、所望のビット数に基づくビット割当がビットストリーム生成部29に出力される。
(7)比較部
ビットストリームは、前述の通り後述のフラグ情報と、差分符号化データと、スケールファクタと、量子化MDCT係数とを含む生成フレームにより構成される。所望のビットレートを維持するためには、この生成フレームが所望のビット数以下である必要がある。よって、比較部21は、ビット割当部15からのビット割当と、差分符号化器19からの差分符号化データとを受信し、これらから生成されるであろう生成フレームのビット数を計算し、所望のビット数と比較する。なお、図2において、比較部21は、差分符号化データhbaを受信しているが、より詳細には差分符号化データhbaの長さに関する情報を受信している。また、ここでは、生成フレームがフラグ情報、ビット割当情報、スケールファクタ及び量子化MDCT係数により構成されるとしているが、その他のヘッダ情報などを含んでいても良い。さらに、以下において、フラグ情報及びスケールファクタに割り当てられるビット数は固定とする。
比較部21において生成フレームのビット数と所望のビット数との比較が必要な理由を説明する。ビット割当部15は、ビット割当そのものではなく差分符号化データにより生成フレームを生成することで削減されたビット割当情報のビット数分を、量子化MDCT係数に割り当てるようなビット割当を行っている。しかしこの場合、量子化MDCT係数のビット数を増加するように割り当てたビット割当と直前フレームとの差分符号化データにより生成フレームを生成した場合、生成フレームのビット数が所望のビット数を超えてしまう可能性がある。あるいは、生成フレームが十分に圧縮されない可能性がある。これは、ハフマン符号化後の差分符号化データの符号量を予測することができないためである。
例えば、あるビット割当ba(n)と直前フレームのビット割当ba(n−1)との差分データ(ba(n)−ba(n−1))をハフマン符号化して差分符号化データhba(n)を算出したとする。この場合、そのビット割当ba(n)がフレームに占めるビット数と差分符号化データhba(n)がフレームに占めるビット数との差分の分だけ、MDCT係数に割り当てるビット数を増加するようにビット割当ba(n)’を行う。ここで、実際にフレームに用いる差分符号化データは、ビット割当ba(n)’と直前フレームのビット割当ba(n−1)との差分データ(ba(n)’−ba(n−1))をハフマン符号化した差分符号化データhba(n)’である。つまり、フレームの生成に用いる差分符号化データhba(n)’は、ビット割当の際に参照した差分符号化データhba(n)と異なり、またハフマン符号化前に差分符号化データhba(n)’の符号量を予測することができない。よって差分符号化データhba(n)’の符号量が予想以上に大きい場合は生成された生成フレームのビット数が所望のビット数を超える場合がある。逆に差分符号化データhba(n)’の符号量が予想以上に小さい場合は、生成フレームのビット数が所望のビット数を下回っており、圧縮率を高めることができる可能性を残したまま十分な圧縮符号化ができていない。以上より、圧縮率をたかめつつ生成フレームが所望のビット数以下となるように、生成フレームのビット数と所望のビット数との比較結果に基づいたビット割当を繰り返す必要がある。
(8)フラグ設定部
フラグ設定部23は、比較部21での比較結果を受信しフラグ情報(図2中、fに相当)を設定し、ビットストリーム生成部29に出力する。ここで、フラグ情報とは、フラグ情報、差分符号化データ、スケールファクタ及び量子化MDCT係数を含む生成フレームのビット数と1フレームの所望のビット数との比較結果を示す情報である。以下では、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、フラグ=“0”とする。一方、制限回数後においても生成フレームのビット数が所望のビット数より大きい場合は、フラグ=“1”とする。
(9)量子化器
量子化器17は、ビット割当部15からビット割当を受信し、スケーリング部13から正規化MDCT係数を受信する。そして、量子化器17は、正規化MDCT係数をビット割当に基づいて量子化し、量子化MDCT係数(図中、mcに相当)を生成する。ここで、量子化器17は、ビット割当部15から目標ビット数に基づくビット割当または所望のビット数に基づくビット割当を受信している。
(10)ビットストリーム生成部
ビットストリーム生成部29は、フラグ設定部23からフラグ情報を受信し、差分符号化器19またはビット割当部15からビット割当情報を受信し、スケーリング部13からスケールファクタを受信し、量子化器17から量子化MDCT係数を受信し、これらの情報に基づいてフレームを組み立ててビットストリームを生成する。より具体的には、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、ビットストリーム生成部29は、フラグ=“0”、差分符号化データ、スケールファクタ及び量子化MDCT係数に基づいてビットストリームを生成する。一方、制限回数後においても生成フレームのビット数が所望のビット数より大きい場合は、ビットストリーム生成部29は、フラグ=“1”、ビット割当、スケールファクタ及び量子化MDCT係数に基づいてビットストリームを生成する。
そして、ビットストリーム生成部29は、ビットストリームを伝送路または蓄積メディアに出力し、そこから復号化装置200に出力される。なお、ビット割当情報が差分符号化されているかどうかを示すフラグ情報が先頭となるようにビットストリームを生成する。これは、後述の復号化装置において、まずフラグ情報を判断してビット割当情報がエントロピー符号化されているかどうかを判断するためである。
なお、特許請求の範囲のスペクトル信号生成手段はMDCT変換器11に相当し、特許請求の範囲のビット割当手段はビット割当部15及び比較部21を含み、特許請求の範囲の差分データ符号化器は差分符号化器19に相当し、特許請求の範囲の量子化手段は量子化器17に相当し、特許請求の範囲のビットストリーム生成手段はビットストリーム生成部29に相当し、特許請求の範囲のフラグ設定手段はフラグ設定部23に相当する。
{符号化処理の流れ}
(1)全体処理
次に、第1実施形態例に係る符号化装置100の符号化処理全体の流れについて説明する。図3は、符号化処理の流れの概要を示すフローチャートの一例である。
ステップS10:MDCT変換器11は、入力データを受け付け変形離散コサイン変換処理してMDCT係数を生成し、スケーリング部13に出力する。
ステップS15:次に、スケーリング部13は、分割されたフレームのセグメント毎にスケールファクタを算出する。さらに、スケーリング部13は、スケールファクタに基づいてMDCT係数を正規化する。
ステップS20、S25:FFT部25は入力データを解析して周波数データを算出する。心理聴覚分析器27は、その算出結果に基づいて帯域毎のSMRを決定してビット割当部15に出力する。
ステップS30:ビット割当部15は、目標ビット数または所望のビット数に基づいてビット割当を決定するビット割当処理を行う。ビット割当処理については、下記(2)にて説明する。
ステップS35:量子化器17は、正規化MDCT係数をビット割当部15から受信したビット割当に基づいて量子化し、量子化MDCT係数を生成する。
ステップS40:ビットストリーム生成部29は、フラグ情報、ビット割当情報、ケールファクタ及び量子化MDCT係数からビットストリームを生成し、伝送路または蓄積メディアを経て復号化装置200に出力される。ここで、ビット割当情報は、目標ビット数に基づくビット割当から算出された差分符号化データまたは所望のビット数に基づくビット割当のいずれかである。
(2)ビット割当処理
次に、前記ステップS30の比較結果に基づくビット割当処理について図4を用いて説明する。図4は、ビット割当処理の流れを示す模式図である。
着目するフレームを現在フレームnとし、現在フレームに対して直前のフレームを直前フレーム(n−1)とする。以下において、このnは現在フレームに関連する添字とし、(n−1)は直前フレームに関連する添字とする。例えば、直前フレームのビット割当をba(n−1)とする。また、所望のビットレートのビットストリームを構成する1フレームのビット数(所望のビット数)をXとする。
ステップS30a:ビット割当部15は、所望のビット数Xよりも大きな目標ビット数X+aを設定する。
ステップS30b:ビット割当部15は、目標ビット数X+aに基づいてビット割当を決定する。つまり、決定されたビット割当に基づいて演算した差分符号化データと、決定されたビット割当に基づいて量子化された量子化MDCT係数と、スケールファクタと、フラグ情報とを含んで生成される場合の生成フレームのビット数が、目標ビット数X+a以下となるようにビット割当を決定する。このビット割当は、MPEG-1/Audio Layer 2と同様の方法で行われ、割当ビット数により変化するSNR(Signal to Nose Ratio)とSMRとからMNR(Masking to Noise Ratio)を計算し、MNRの小さい帯域から順にビットを割り当てる。
なお、MPEG-1/Audio Layer 2では、帯域ごとに最大割当ビット数やビットの増やし方を変えているが、本発明においては演算量低減のために一定としている。例えば、ある帯域のビット数を増加した場合は、ビットレートに適合しなくなる場合があり、これを別の帯域で吸収する演算などが必要となる。しかし、最大割当ビット数やビットの増やし方を一定とすることで、前述のような演算が不要となる。
ステップS30c:次に、比較部21は、この生成フレームのビット数と所望のビット数Xとを比較する。このときの生成フレームのビット数は、目標ビット数X+aに基づくビット割当ba(n)及び直前フレームのビット割当ba(n−1)から算出した差分符号化データのビット数bit_hbaと、ビット割当ba(n)に基づいて量子化された量子化MDCT係数bit_mcと、スケールファクタのビット数bit_scと、フラグ情報のビット数bit_fとの総和により求まる。比較部21において生成フレームのビット数が所望のビット数以下(bit_hba+bit_mc+bit_sc+bit_f≦X)であると判断された場合は、ステップS30dに進む。一方、生成フレームのビット数が所望のビット数より大きい(bit_hba+bit_mc+bit_sc+bit_f>X)であると判断された場合は、ステップS30eに進む。
ステップS30d:生成フレームのビット数が所望のビット数X以下である場合は、ビット割当部15はそのときに決定したビット割当を差分符号化器19に出力する。そして、差分符号化器19は、そのビット割当に基づいて算出した差分符号化データをビットストリーム生成部29に出力する。
ステップS30e:一方、ビット割当部15は、生成フレームのビット数が所望のビット数Xより大きい場合は、前回設定した目標ビット数X+aよりも小さく、かつ所望のビット数Xよりも大きな目標ビット数X+bを設定する。そして、ビット割当部15は、再度設定された目標ビット数X+bに基づいてビット割当を決定する。
ステップS30f:次に、比較部21は、生成フレームのビット数と所望のビット数Xとを比較する。このときの生成フレームのビット数は、目標ビット数X+bに基づくビット割当ba(n)’及び直前フレームのビット割当ba(n−1)から算出した差分符号化データのビット数bit_hba’と、ビット割当ba(n)’に基づいて量子化された量子化MDCT係数bit_mc’と、スケールファクタのビット数bit_scと、フラグ情報のビット数bit_fとの総和により求まる。比較部21において生成フレームのビット数が所望のビット数以下(bit_hba’+bit_mc’+bit_sc+bit_f≦X)であると判断された場合は、ステップS30dに進む。一方、生成フレームのビット数が所望のビット数より大きい(bit_hba’+bit_mc’+bit_sc+bit_f>X)であると判断された場合は、以上の処理を制限回数Nまで繰り返す。
ステップS30g:処理の繰り返し回数が制限回数Nに到達しても、生成フレームのビット数が所望のビット数よりも大きい場合は、ビット割当部15は所望のビット数に基づいてビット割当を行う。そして、この所望のビット数に基づくビット割当をビットストリーム生成部29に出力する。
{復号化装置の構成}
図5は、本発明の第1実施形態例に係る復号化装置である。以下に、第1実施形態例に係る復号化装置200の各部の構成について説明する。
(1)フレーム分解部
フレーム分解部51は、前述の符号化装置100からビットストリームをフレームごとに受信し、量子化MDCT係数と、それ以外のフラグ情報、帯域毎のビット割当情報及びセグメント毎のスケールファクタを含む副情報とに分解する。
(2)副情報復号化部
副情報復号化部53は、フレーム分解部51で分解された副情報を受信して、必要に応じて復号化し、ビット割当情報及びスケールファクタを逆量子化器55に出力する。ここで、副情報復号化部53は、まず各フレームの先頭に含まれるフラグ情報を解釈し、ビット割当情報として差分符号化データが含まれているかどうかを判断する。そして、フラグ=“0”である場合はビット割当情報として差分符号化データが含まれるため、副情報復号化部53はその差分符号化データを復号化してビット割当の差分データを取得する。副情報復号化部53は、この差分データに基づいて現在フレームのビット割当を算出し、逆量子化器55に出力する。なお、副情報復号化部53は、差分データから現在フレームのビット割当を算出するため、直前フレームのビット割当を記憶しているものとする。一方、フラグ=“1”である場合はビット割当情報として所望のビット数に基づくビット割当が含まれるため、副情報復号化部53はフレーム分解部51から受信した所望のビット数に基づくビット割当そのものを逆量子化器55に出力する。
(3)逆量子化器
逆量子化器55は、ビット割当情報及びスケールファクタに基づいて量子化MDCT係数を逆量子化し、逆量子化データを算出する。つまり、フラグ=“0”である場合は、逆量子化器55は、差分符号化データから算出されたビット割当に基づいて量子化MDCT係数を逆量子化する。一方、フラグ=“1”である場合は、逆量子化器55は、所望のビット数に基づくビット割当に基づいて量子化MDCT係数を逆量子化する。

(4)MDCT逆変換器 MDCT逆変換器57は、逆量子化されたMDCT係数を逆変形離散コサイン変換処理(IMDCT:Inverse Modified DiscreteCosine Transform)して出力信号を生成し出力する。
{作用効果}
第1実施形態例によると、ビットストリームが差分符号化データと、量子化MDCT係数bit_と、スケールファクタと、フラグ情報とを含んで構成される。ここで、差分符号化データは、現在フレームと直前フレームとのビット割当の差分を符号化したものであり、ビット割当そのものよりもフレーム内において割り当てるビット数を少なくすることができる。よって、ビット割当情報に割り当てるビット数が少なくてすむので、その分だけ量子化スペクトルに割り当てるビット数を増加することができる。そのため、符号化及び復号化による遅延時間を短縮するためにフレーム長を短くしても、量子化スペクトルに割り当てられるビット数の減少を抑えることができ音質の劣化を防止することができる。
また、比較部21は、生成フレームのビット数が1フレームの所望のビット数以下であるかを判断し、ビット割当部15がその判断結果に基づいてビット割当を行う。よって、生成フレームが所望のビット数を超えることがなく、ビットレートを維持しつつ量子化スペクトルにビットを最適に割り当てることができる。これにより、生成フレームのビット数が所望のビット数を超えることによる音質の劣化を防止することができる。
なお、ビット割当情報に割り当てるビット数が少なくてすむ分だけビットストリームを構成するフレームを小さくすると、同じ音質であってもより圧縮率を高めることができる。また、ビット数が少なくてすむ分だけ量子化スペクトルに割り当てるとともにフレームを小さくすることで、符号化及び復号化による遅延時間を短縮しつつ音質の劣化を防止することもできる。例えば、ADPCMなどの予測符号化においては、圧縮率を1/6以上にあげることは困難であるが、本発明によれば圧縮率を1/6以上に上げるとともに音質の劣化を防止できる符号化及び復号化を実現することができる。
また、上記のような符号化装置により符号化された入力データを、前述の復号化装置で復号化することで、符号化及び復号化による遅延時間を短縮しつつ音質の劣化が低減された出力データを得ることができる。
本発明によれば符号化・復号化に伴う遅延を小さくするとともに音質の劣化を低減することができるので、遅延が許されず、音質が重要視される機器、例えば拡声器やマイクロホンなどに適用可能である。
符号化による遅延時間を短縮しつつ音質を良好に維持可能な本発明の概要を説明するための模式図。 本発明の第1実施形態例に係る符号化装置。 符号化処理の流れの概要を示すフローチャートの一例。 ビット割当処理の流れを示す模式図。 本発明の第1実施形態例に係る復号化装置。
符号の説明
11:MDCT変換器
13:スケーリング部
15:ビット割当部
17:量子化器
19:差分符号化器
21:比較部
23:フラグ設定部
25:FFT部
29:ビットストリーム生成部
100:符号化装置
200:復号化装置

Claims (7)

  1. 時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化する符号化装置であって、
    前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成手段と、
    前記スペクトル信号の心理聴覚分析を行い、帯域毎のビット割当を決定するビット割当手段と、
    前記ビット割当手段により決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化器と、
    前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化手段と、
    前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力手段とを含み、
    前記ビット割当手段は、
    前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、
    前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、
    その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す、符号化装置。
  2. 前記ビット割当手段は、前記目標ビット数に基づくビット割当の決定の繰り返しを所定の制限回数で終了する、請求項1に記載の符号化装置。
  3. 前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合(以下、フラグ=“0”とする)と、前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合(以下、フラグ=“1”とする)とに応じてフラグを設定するフラグ設定手段をさらに含み、
    前記ビットストリーム出力手段は、さらに前記フラグを含む生成フレームを生成し、
    前記ビット割当手段は、
    前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合は、前記目標ビット数に基づくビット割当を前記差分データ符号化器に出力し、
    前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数に基づくビット割当を前記ビットストリーム出力手段に出力し、
    前記ビットストリーム生成手段は、前記ビット割当手段での比較結果に応じて、前記フラグ=“0”と、前記差分符号化データと、前記量子化スペクトルとを含む生成フレームか、または前記フラグ=“1”と、前記所望のビット数に基づくビット割当と、前記量子化スペクトルとを含む生成フレームかのいずれかを生成し出力する、請求項2に記載の符号化装置。
  4. 前記差分データ符号化器によるエントロピー符号化はハフマン符号化である、請求項1または2に記載の符号化装置。
  5. 時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化する符号化方法であって、
    前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成ステップと、
    前記スペクトル信号の心理聴覚分析を行い、前記帯域毎のビット割当を決定するビット割当ステップと、
    前記ビット割当ステップにより決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化ステップと、
    前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化ステップと、
    前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力ステップとを含み、
    前記ビット割当ステップでは、
    前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、
    前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、
    その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す、符号化方法。
  6. 入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化装置であって、
    前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解部と、
    前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化部と、
    前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化器と、
    を含む復号化装置。
  7. 入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化方法であって、
    前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解ステップと、
    前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化ステップと、
    前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化ステップと、
    を含む復号化方法。
JP2005050005A 2005-02-25 2005-02-25 符号化装置、符号化方法、復号化装置及び復号化方法 Active JP4573670B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005050005A JP4573670B2 (ja) 2005-02-25 2005-02-25 符号化装置、符号化方法、復号化装置及び復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005050005A JP4573670B2 (ja) 2005-02-25 2005-02-25 符号化装置、符号化方法、復号化装置及び復号化方法

Publications (2)

Publication Number Publication Date
JP2006235253A true JP2006235253A (ja) 2006-09-07
JP4573670B2 JP4573670B2 (ja) 2010-11-04

Family

ID=37042967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005050005A Active JP4573670B2 (ja) 2005-02-25 2005-02-25 符号化装置、符号化方法、復号化装置及び復号化方法

Country Status (1)

Country Link
JP (1) JP4573670B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200012861A (ko) * 2017-04-25 2020-02-05 디티에스, 인코포레이티드 디지털 오디오 신호에서의 차분 데이터

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895598A (ja) * 1994-09-26 1996-04-12 Nec Corp 帯域分割符号化装置
JP2001094433A (ja) * 1999-09-17 2001-04-06 Matsushita Electric Ind Co Ltd サブバンド符号化・復号方法
JP2002189500A (ja) * 2000-12-21 2002-07-05 Nippon Columbia Co Ltd オーディオ信号符号化方法及びオーディオ信号符号化装置及びオーディオ信号符号化プログラムが記録された記録媒体
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895598A (ja) * 1994-09-26 1996-04-12 Nec Corp 帯域分割符号化装置
JP2001094433A (ja) * 1999-09-17 2001-04-06 Matsushita Electric Ind Co Ltd サブバンド符号化・復号方法
JP2002189500A (ja) * 2000-12-21 2002-07-05 Nippon Columbia Co Ltd オーディオ信号符号化方法及びオーディオ信号符号化装置及びオーディオ信号符号化プログラムが記録された記録媒体
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
JP2003066998A (ja) * 2001-08-28 2003-03-05 Mitsubishi Electric Corp 音響信号符号化装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200012861A (ko) * 2017-04-25 2020-02-05 디티에스, 인코포레이티드 디지털 오디오 신호에서의 차분 데이터
CN110870005A (zh) * 2017-04-25 2020-03-06 Dts公司 数字音频信号中的差异数据
EP3616325A4 (en) * 2017-04-25 2020-12-09 DTS, Inc. DIFFERENTIAL DATA IN DIGITAL AUDIO SIGNALS
CN110870005B (zh) * 2017-04-25 2023-12-12 Dts公司 编码系统和解码系统
KR102615901B1 (ko) 2017-04-25 2023-12-19 디티에스, 인코포레이티드 디지털 오디오 신호에서의 차분 데이터

Also Published As

Publication number Publication date
JP4573670B2 (ja) 2010-11-04

Similar Documents

Publication Publication Date Title
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
CN108831501B (zh) 用于带宽扩展的高频编码/高频解码方法和设备
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
CN107025909B (zh) 能量无损编码方法和设备以及能量无损解码方法和设备
JP5413839B2 (ja) 符号化装置および復号装置
JP2019191594A (ja) 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
KR100848324B1 (ko) 음성 부호화 장치 및 그 방법
CN111179946B (zh) 无损编码方法和无损解码方法
JPWO2006049204A1 (ja) 符号化装置、復号化装置、符号化方法及び復号化方法
WO2013168414A1 (ja) 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP5355387B2 (ja) 符号化装置および符号化方法
US20130226598A1 (en) Audio encoder or decoder apparatus
EP3550563B1 (en) Encoder, decoder, encoding method, decoding method, and associated programs
WO2004044891A1 (ja) 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
JP4573670B2 (ja) 符号化装置、符号化方法、復号化装置及び復号化方法
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2007004050A (ja) ステレオ信号の符号化装置及び符号化プログラム
JP2008026372A (ja) 符号化データの符号化則変換方法および装置
JP2005026940A (ja) デジタルデータ符号化装置
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
KR20140037118A (ko) 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100817

R150 Certificate of patent or registration of utility model

Ref document number: 4573670

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250