JP2005043761A - 情報量変換装置及び情報量変換システム - Google Patents

情報量変換装置及び情報量変換システム Download PDF

Info

Publication number
JP2005043761A
JP2005043761A JP2003279307A JP2003279307A JP2005043761A JP 2005043761 A JP2005043761 A JP 2005043761A JP 2003279307 A JP2003279307 A JP 2003279307A JP 2003279307 A JP2003279307 A JP 2003279307A JP 2005043761 A JP2005043761 A JP 2005043761A
Authority
JP
Japan
Prior art keywords
information
amount
encoded data
data
recording medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003279307A
Other languages
English (en)
Inventor
Tetsuro Wada
哲朗 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2003279307A priority Critical patent/JP2005043761A/ja
Publication of JP2005043761A publication Critical patent/JP2005043761A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 符号化データの情報量変換における復号処理を省略することで復号処理によるデータ品質の劣化を防ぎ、且つ所望の情報量に的確に変換可能な情報量変換装置及び情報量変換システムを提供する。
【解決手段】 第1のオーディオ符号化データの情報量と、当該符号化データを記録すべき記録媒体3aの記録可能容量とを用いて、当該記録媒体3aに記録できる情報量への変換度合を示す調整量を算出する調整部4と、第1のオーディオ符号化データの構成単位を分析して特定した構成要素データから、情報量を削減すべき構成要素データを判別する判別部5と、情報量を削減すべきと判別した構成要素データをその情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データ群を多重して第2のオーディオ符号化データを生成する圧縮部6とを備える。
【選択図】 図2

Description

この発明は、例えばオーディオ信号を高能率に圧縮したオーディオ符号化データの情報量を変換する情報量変換装置に係り、特に復号処理を要さずに符号化データの情報量を変換する情報量変換装置及び情報量変換システムに関するものである。
ある同一の符号化方式を採用する記録媒体や装置の間で当該符号化方式によるディジタルオーディオ符号化データを読み書きする場合、その記録媒体や伝送媒体の容量に応じてその情報量が変換される場合がある。これは、データ書き込み側の記録媒体や装置の記録可能容量によってオーディオ符号化データを書き込むことができないことに起因する不具合を防止するためである。
例えば、容量の異なる2つの記録媒体においてオーディオ符号化データを読み書きするにあたり、一方の記録媒体から読み出されたオーディオ符号化データの情報量が他方の記録媒体に記録可能な容量より大きいと、当該記録媒体には容量以上の書き込みを行うことはできない。このとき、書き込み側の記録媒体の容量分しかオーディオ符号化データの書き込みができないと、オーディオ再生データが中途で終了するなどの不具合が発生する要因となる。
上述したようなオーディオ符号化データの情報量を変換する従来の情報量変換装置としては、例えば特許文献1に開示されるものがある。当該装置では、オーディオ符号化データを複数個の符号化フレーム単位でオーディオ信号に復号したあとに、これらの情報量を減少させる符号化を実施する。このような情報量を減少させる符号化方式としては、量子化ビット数を選択可能な符号化方式や、周波数スペクトルの数を選択可能な符号化方式がある。
また、上記文献1には、オーディオ符号化データを復号することなく、符号化フレーム単位で同一の符号化方式でさらに圧縮符号化して情報量を減少させる処理についても開示されている。
この他にも、復号処理(ビット伸張処理)を行わずに情報量を変換する技術としては、例えば特許文献2に開示される信号処理方法及び圧縮データ記録再生装置がある。この装置では、聴覚的に聞こえない量子化雑音レベルを与えるビットの少なくとも一部を、時間と周波数について細分化されたサンプルの形において除去することによって情報量の変換を実現している。
特開2002−268687号公報 特開平5−90973号公報
特許文献1に開示される従来の情報量変換装置では、オーディオ符号化データの情報量を変換するにあたり、上述のようにオーディオ符号化データを一旦復号して圧縮符号化する場合、復号処理と符号化処理とを実行するため、量子化誤差や演算誤差の影響を受け音質劣化を生じるという課題があった。また、復号回路及び符号化回路などが情報量の変換用のハードウェアとして必須なものとなり、装置構成の増大にも繋がる。
また、特許文献1には、オーディオ符号化データを復号することなく、符号化フレーム単位で同一の符号化方式でさらに圧縮符号化して情報量を減少させる処理についても開示されているが、単にオーディオ符号化データを同一の符号化方式でさらに圧縮符号化するとのみ記載されているだけで、確実に適切な情報量に変換するための具体的な処理内容を開示するものではなかった。
特に、符号化方式がハフマン符号化などのような可変長符号化である場合、符号化フレーム単位で符号化を実施すると、所望の情報量を削減することができない場合が発生する。このため、特許文献1による方法では、情報量変換の効果が十分に得られない可能性がある。
さらに、特許文献2に開示される発明において、量子化雑音レベルを与えるビットを除去するには、マスキングスレッショルドという情報量削減のための固定的な基準が必要である。このため、記録媒体の記録可能容量に適合する所望の情報量に適応的に変換することができないという課題があった。つまり、マスキングスレッショルドにより決定された削減量によると、一定量以下の情報量に変換することができなかったり、極端に情報量が少なくなってしまう可能性もある。
この発明は上記のような課題を解決するためになされたもので、第1の目的は、符号化データの情報量変換における復号処理を省略することで復号処理によるデータ品質の劣化を防ぎ、且つ所望の情報量に的確に変換可能な情報量変換装置及び情報量変換システムを得るものである。
この発明に係る情報量変換装置は、符号化データの情報量と、当該符号化データを記録すべき記録媒体の記録可能容量とを用いて、上記記録媒体に記録できる情報量への変換度合を示す調整量を算出する調整部と、上記符号化データの構成単位を分析して個々の構成要素データを特定すると共に、上記調整量に基づいて上記符号化データについて削減すべき情報量を算出し、当該算出結果の情報量に上記構成要素データから削減する情報量の総和が合致するまで、情報量を削減すべき構成要素データを逐一判別する判別部と、上記判別部が情報量を削減すべきと判別した構成要素データを、その情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データ群を多重して上記記録媒体に記録する符号化データを生成する圧縮部とを備えるものである。
この発明に係る情報量変換システムは、符号化データを記録する第1の記録媒体を有し、当該第1の記録媒体から読み出した上記符号化データを再生する再生装置と、第2の記録媒体を有し、入力したデータを上記第2の記録媒体に記録する記録装置と、上記再生装置から上記第2の記録媒体に記録すべく出力された符号化データを入力すると共に、上記記録装置から上記第2の記録媒体の記録可能容量を入力し、当該符号化データの情報量が上記第2の記録媒体の記録可能容量より大きいと、その情報量を削減した符号化データを生成して上記記録装置に出力する上記情報量変換装置とを備えるものである。
この発明に係る情報量変換システムは、符号化データを記録する記録媒体を有し、当該記録媒体から読み出した上記符号化データを再生すると共に、入力したデータを上記記録媒体に記録する再生記録装置と、上記再生記録装置が上記記録媒体に符号化データを記録するにあたり、上記記録媒体に記録すべき符号化データ又は既に記録されている符号化データと、上記記録媒体の記録可能容量とを入力し、上記符号化データの情報量を削減した符号化データを生成して上記再生記録装置に出力する上記情報量変換装置とを備えるものである。
この発明は、符号化データの情報量と、当該符号化データを記録すべき記録媒体の記録可能容量とを用いて、上記記録媒体に記録できる情報量への変換度合を示す調整量を算出する調整部と、上記符号化データの構成単位を分析して個々の構成要素データを特定すると共に、上記調整量に基づいて上記符号化データについて削減すべき情報量を算出し、当該算出結果の情報量に上記構成要素データから削減する情報量の総和が合致するまで、情報量を削減すべき構成要素データを逐一判別する判別部と、上記判別部によって情報量を削減すべきと判別された構成要素データを、その情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データ群を多重して上記記録媒体に記録する符号化データを生成する圧縮部とを備えるので、符号化データの情報量変換における復号処理を省略することで復号処理によるデータ品質の劣化を防ぎ、且つ所望の情報量に的確に変換することができるという効果がある。
実施の形態1.
図1はこの発明の実施の形態1による情報量変換システムを示すブロック図である。本実施の形態による情報量変換システムは、情報量変換装置1、第1の記憶媒体2aを有する再生装置2、及び第2の記憶媒体(記録媒体)3aを有する記憶装置3から構成される。情報量変換装置1は、再生装置2及び記憶装置3に接続しており、それぞれが有する記憶媒体2a,3aにアクセス可能である。
第1の記録媒体2aには、特定の符号化方式によってディジタルオーディオ信号を圧縮した第1のオーディオ符号化データが記録されており、その情報量や記録時間(再生時間)も補助情報として記録されている。この第1のオーディオ符号化データは、第1の記録媒体2aに1つ記録されている場合もあれば、複数記録されている場合もある。また、第1のオーディオ符号化データは、符号化フレームという時間単位で符号化されており、複数のフレームで構成されている。
再生装置2は、第1の記録媒体2aから第1のオーディオ符号化データ及び付属する補助情報を出力する機能を有する。ここで、再生装置2から出力される第1のオーディオ符号化データは、ユーザが任意に数、時間等を選択したものであっても、自動的に全体が選択されたものであってもよい。
情報量変換装置1は、再生装置2から出力された第1のオーディオ符号化データ及び付属する補助情報を一旦入力してから第2の記録媒体3aに記録する。ここで、第1のオーディオ符号化データ及び付属する補助情報を第2の記録媒体3aに記録する前に、情報量変換装置1は、記録装置3から第2の記録媒体3aにおける記録可能な空き容量(記録可能容量)に関する情報を取得する。ここで、記録可能容量とは、空き容量全体であってもよいし、ユーザが選択した空き容量の一部であっても構わない。
記録装置3から第2の記録媒体3aにおける記録可能な空き容量に関する情報を取得すると、情報量変換装置1は、当該記録可能容量と第1のオーディオ符号化データの情報量とを比較する。このとき、第1のオーディオ符号化データの情報量が第2の記録媒体3aの記録可能容量よりも小さい場合、情報量変換装置1は、第1のオーディオ符号化データ及び付属する補助情報を変換せずにそのままの情報量で第2のオーディオ符号化データとして記憶装置3側に出力する。
一方、第1のオーディオ符号化データの情報量が第2の記録媒体3aの記録可能容量よりも大きいと、情報量変換装置1は、第1のオーディオ符号化データを変換して上記記憶可能容量よりも小さくなるまで(若しくは、等しくなるまで)その情報量を削減したあと、第2のオーディオ符号化データとして記憶装置3側に出力する。
記録装置3では、情報量変換装置1からの第2のオーディオ符号化データを入力し、第2の記録媒体3aに記録する。ここで、第1のオーディオ符号化データの情報量が第2の記録媒体3aの記録可能容量よりも大きかった場合であっても、第2のオーディオ符号化データの情報量は、情報量変換装置1によって記憶可能容量より小さく(若しくは、等しく)される。これにより、第2のオーディオ符号化データは、第2の記録媒体3aに全て記録することができる。
図2は、図1中の情報量変換装置の内部構成を示した情報量変換システムを示すブロック図である。図に示すように、情報量変換装置1は、調整部4、判別部5及び圧縮部6から構成されている。調整部4は、第1のオーディオ符号化データに付随した補助情報から読み出した情報量と第2の記録媒体3aの記録可能容量とを比較して、第1のオーディオ符号化データから第2のオーディオ符号化データに変換する際の情報量変換の調整量を決定する。
この調整量は、第1のオーディオ符号化データの情報量が第2の記録媒体3aの記録可能容量よりも大きい場合であっても、第1のオーディオ符号化データについてその記録時間を損なうことなく(途中で記録が途切れることなく)第2の記録媒体3aに記録することができるよう、その情報量をどの程度削減すべきかを規定する。調整量は、例えば以下のように決定する。
変換の対象となる第1のオーディオ符号化データの情報量をB1(B1>0)とし、第2の記録媒体3aの記録可能容量をX(X>0)とすると、情報量の削減率Rは、下記式のように表すことができる。
R=(B1−X)/B1
ここで、削減率Rは、第1のオーディオ符号化データから第2のオーディオ符号化データに変換する前後での情報量の削減率を意味する。なお、Rが0以下の場合は、情報量変換を行わなくても良いものとする。
調整部4では、上記式を用いて第1のオーディオ符号化データから第2のオーディオ符号化データに変換する前後における情報量の調整量として削減率Rを求め、これを判別部5に出力する。
判別部5は、調整部4からの調整量に従って、第1のオーディオ符号化データを構成するどの要素データを情報圧縮するかを決定する。ここでは、例えば第1のオーディオ符号化データが、符号化フレーム単位の情報量が変化する、いわゆる可変ビットレート符号化されている場合について説明する。
判別部5は、図3に示すように、分離部7及び解析部8から構成される。判別部5内の分離部7は、再生装置2から入力した第1のオーディオ符号化データ(図中、Aで示す)を同一の符号化方式のビット多重文法に従って個々の構成要素のデータごとに分離する。次に、解析部8では、分離部7が分離した構成要素ごとのデータ(以下、要素データと称する)を上記符号化方式に沿って解析する。
なお、要素データ(構成要素データ)としては、オーディオ信号の時間サンプルに相当するデータ、あるいは周波数スペクトルに相当するデータなどが考えられる。また、符号化方式によっては、正規化するためのスケーリング係数や適応ビット割り当て情報なども要素データの対象とすることができる。
続いて、解析部8は、調整部4から調整量(調整部4からの制御情報B)として、例えば削減率Rを得てオーディオ符号化データAの符号化フレームごとの情報量に削減率Rを乗じて削減すべき情報量を得る(圧縮部6への制御情報C)。そして、要素データの解析結果に基づいて、要素データをそれぞれ後述するようにして情報圧縮して得られるであろう削減量の総量が、当該符号化フレームごとに削減率Rを用いて求めた削減量に等しくなるまで、符号化フレーム内で圧縮の対象とする要素データを順次決定する。
ここで、本発明で取り扱うオーディオ符号化データの特徴について説明する。
図4は、オーディオ符号化データの特徴を説明する図であり、(a)は符号化される前のディジタルオーディオ信号についての時間波形を示し、横軸を時間とし縦軸を振幅で表している。また、(b)は、(a)中のディジタルオーディオ信号についての信号強度のスペクトログラムを示す図であり、横軸を時間、縦軸を周波数、及び色の濃度を信号の強度で表している(信号強度は、黒地に対しての白さの度合で示している)。さらに、(c)は、(a)中のディジタルオーディオ信号の符号化において音質劣化を発生させないために必要な符号化フレームごとの情報量の時間変化を示しており、横軸を時間、縦軸を情報量で表している。なお、横軸の時間は、各図とも同じ時間軸となるように表示している。
図4(a)と(b)の関係において、ディジタルオーディオ信号の振幅が大きなところでは幅広い帯域の周波数成分を含んでいる。また、(b)に示すように、ディジタルオーディオ信号の周波数が低い帯域の周波数成分は定常的に存在しており、周波数が高い帯域の周波数成分は瞬間的に現れていることがわかる。図4(a)と(c)の関係において、ディジタルオーディオ信号の振幅が大きなところでは、多くの情報量が必要とされていることがわかる。言い換えれば、幅広い帯域の周波数成分を含むところでは、多くの情報量が必要とされているとも言える。
ところで、人間の聴覚特性には、マスキングというものがある。マスキングとは、人間の聴覚上の特性により、ある信号によって他の信号が聞こえなくなる現象のことを言う。このマスキング効果には、時間軸上の信号による時間マスキング効果と、周波数軸上の信号による同時刻マスキング効果とがある。これらの効果により、マスキングされる部分にノイズがあったとしても、このノイズは聞こえないことになる。
また、人間の可聴周波数帯域は約20Hz〜20kHzと言われており、周波数に依存する可聴限も存在する。図5は音声周波数とその周波数での可聴限度の信号強度との関係を示す図であり、当該曲線を最小可聴限カーブと呼んでいる。近年のオーディオ符号化方式では、図に示すような人間の聴覚特性を積極的に取り入れ、周波数帯域ごとに適応的にビット割当てを行い符号化しているものが多い。
解析部8では、上記性質を考慮して、第1のオーディオ符号化データから情報圧縮する要素データを選択し決定する。例えば、最小可聴限カーブの値が大きく、音として聞き取りにくい高域の周波数成分に相当する要素データから情報圧縮する。可聴周波数帯域の上限は個人差が大きく、また年齢と共に低下してゆくため、この選択は音質劣化を最小限に抑えるため方法として理に適っている。
この他に、周波数成分の信号レベルが絶対的に小さな要素データから情報圧縮するようにしてもよい。上述したマスキング効果は、信号レベルの大小に依存するものである。つまり、信号レベルの大きな信号は、信号レベルの小さな信号をマスクするが、信号レベルの小さな信号が信号レベルの大きな信号をマスクすることはできない。従って、信号レベルの大小関係を簡易的なマスキング効果解析結果とみなすことで、同様に音質劣化を最小限に抑える効果が得られる。
さらに、信号レベルと許容ノイズレベルとに基づいて適応的に割当てられたビット長が相対的に短い周波数帯域に含まれる周波数成分に相当する要素データから情報圧縮するようにしてもよい。上述したように周波数帯域ごとに適応的なビット割当てを行って符号化されている場合、割当てられたビット長が短いということは、そのビット長で量子化を行う際に発生する量子化ノイズの許容ノイズレベルが信号レベルに対して相対的に大きいということに相当する。即ち、ビット長をより短くした際に増加する量子化ノイズも許容することができる度合いが高くなる。
このようにして、判別部5は、第1のオーディオ符号化データA及び調整部4からの調整量に関する制御情報Bを受けて、第1のオーディオ符号化データAについて解析部8が決定した要素データの情報を制御情報Cとして圧縮部6に出力する。
圧縮部6は、図6に示すように、分離部9、置換部10及び多重部11から構成される。分離部9は、再生装置2から入力した第1のオーディオ符号化データ(図中、Aで示す)を同一の符号化方式のビット多重文法に従って個々の構成要素のデータ(要素データ)に分離する。置換部10では、判別部5からの制御情報Cにおいて情報圧縮を行うよう指定された要素データに対して符号置換を行い、置換後の要素データを多重部11に出力する。このとき、判別部5から指定されなかった要素データに対しては符号置換を行わず、そのまま多重部11に出力する。
多重部11は、第1のオーディオ符号化データAにおける全ての要素データ(構成要素データ群)を入力すると、同一の符号化方式のビット多重文法に従って全ての要素データを多重化し、第2のオーディオ符号化データ(図中、Dで示す)を生成する。ここで、ビット多重文法に違反しない限り、一部の要素データを除外しても良い。多重部11が生成した第2のオーディオ符号化データDの情報量は、第1のオーディオ符号化データAの情報量に比べて削減されており、全ての情報を記録装置3の第2の記録媒体3aに記録することが可能である。
さらに、図7を用いて置換部10について詳述する。図に示すように、置換部10は、ビット長決定部12、ビット長変換部13及びサンプル変換部14から構成される。ビット長決定部12は、判別部5からの制御情報Cにおいて情報圧縮を行うよう指定された要素データに関する情報を取得し、さらに要素データのうち制御情報Cにて指定された要素データに関するビット長情報bを分離部9から取得する。
このとき、ビット長決定部12は、制御情報Cにて指定された要素データの情報量がより削減されるように、当該要素データに対して予め設定したビット長短縮に関する規則に従ってより短いビット長が決定される。例えば、元のビット長に対して1ビットだけ短くする規則を設定しておくことで、3ビットの要素データがあると、そのビット長は2ビットに決定される。このようにして決定したビット長情報は、ビット長変換部13に出力される。
ビット長変換部13では、ビット長情報b及びビット長決定部12からのビット長情報を取得すると、制御情報Cにて指定された要素データについてのビット長をビット長情報bによって把握する。そして、予め設定した符号変換に関する規則に従って、当該ビット長を表す符号からビット長決定部12が決定したビット長を表す符号に変換する。
例えば、制御情報Cにて指定された要素データのビット長が3ビットであり、ビット長決定部12が当該要素データに対して2ビットを決定していた場合を考える。このとき、ビット長変換部13は、3ビットのビット長を表す符号から2ビットのビット長を表す符号に変換し、新たなビット長情報dとして多重部11に出力する。また、このビット長情報dは、サンプル変換部14に対しても出力される。
サンプル変換部14は、制御情報Cで指定された要素データに関するサンプル情報aを分離部9から取得し、当該要素データについてのサンプルを表す符号を認識する。このあと、サンプル変換部14は、サンプル情報aから読み取ったサンプルを表す符号を、ビット長変換部13から入力したビット長情報dで指定するビット長に合わせて変換する。変換後のサンプルの符号に関する情報は、サンプル情報cとして多重部11に出力される。
図8は、予め設定した符号変換に関する規則として、3ビットの要素データのビット長を2ビットに変更する場合におけるサンプルを表す符号の変換前後の対応を示す表である。この図は、サンプルの符号が3ビット長のビット列で表される場合、これを2ビット長のビット列に変換するという情報量の削減に関する一定の規則を示している。例えば、サンプルの符号が3ビット長のビット列「011」で表される場合、2ビット長のビット列「01」に変換される。また、サンプルの符号が3ビット長のビット列「101」であった場合には、ビット列「10」に変換される。なお、サンプルの量子化値に対するディジタル符号割当ては、任意の方法によって行っても良い。例えば、オフセット2進(オフセットバイナリ)符号を使うことが多い。
このように、置換部10がオーディオ符号化データAの要素データのビット列をより短いビット長に置換することで、符号化データAについての情報量をさらに削減することができる。上述した例では、1つのサンプルあたり1ビットの情報が削減されることになり、要素データに含まれるサンプル数がn個(n>0)の場合、削減量の総計はnビットとなる。
多重部11では、制御情報Cにて指定された要素データの情報量を削減した第1のオーディオ符号化データAを入力すると、同一の符号化方式のビット多重文法に従って当該データAの全ての要素データを多重化し、第2のオーディオ符号化データDとして記録装置3に出力する。
また、置換部10は、ビット長決定部12によってオーディオ符号化データ中のある要素データのビット長をゼロと決定し、その要素データのサンプルの符号変換を省略しても良い。この場合、多重部11は、ゼロに決定されたビット長情報を受け、要素データに関するサンプル符号の多重処理を省略する。ビット長をゼロとする要素データとしては、例えばサンプル情報aにて規定されるサンプルの符号を表すビットなどが挙げられる。また、サンプル符号をゼロとすることは、符号を示すビットが不要であることを意味し、図8に示す表に示した3ビット長の符号から2ビット長の符号に変換する処理が省略されることになる。
図9は、図1中の情報量変換装置によって生成された第2のオーディオ符号化データの符号化フレームとその情報量との関係を示す図であり、第1のオーディオ符号化データからどれだけ情報量が削減されたかを示している。図において、可変ビットレートで符号化されている第1のオーディオ符号化データから、符号化フレームごとに削減率Rを基に算出した削減量(斜線部分)に相当する情報を削除している。この結果、符号化フレームごとにその情報量に応じた量の情報が削除されることになり、ある情報内容についての情報量が過度に削減されることが防止される。これにより、音質劣化が特定の信号部分に発生することを抑制することができる。
以上のように、この実施の形態1によれば、第1のオーディオ符号化データの情報量と、当該符号化データを記録すべき第2の記録媒体3aの記録可能容量とを用いて、当該記録媒体3aに記録できる情報量への変換度合を示す調整量を算出する調整部4と、第1のオーディオ符号化データの構成単位を分析して個々の構成要素データを特定すると共に、上記調整量に基づいて上記符号化データについて削減すべき情報量を算出し、当該算出結果の情報量に上記構成要素データから削減する情報量の総和が合致するまで、情報量を削減すべき構成要素データを逐一判別する判別部5と、情報量を削減すべきと判別された構成要素データを、その情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データ群を多重して第2のオーディオ符号化データを生成する圧縮部6とを備えるので、オーディオ符号化データを復号することなく、符号化データの情報量を直接変換することから、復号処理をはさむ構成に必須となる復号器及び符号化器を省略することができ、装置の小形化と低価格化が可能となる。また、復号処理に要する時間も削減することができ、オーディオ符号化データの情報量をより短時間で変換することができる。さらに、変換後のオーディオ符号化データの容量は、変換前より情報量が減少しているので、高価な記録媒体に記録する場合にも経済的である。
また、一旦復号してディジタルオーディオ信号に再生し再び符号化せず、符号化データを直接変換したので、復号処理や符号化処理の際に発生する量子化誤差や演算誤差の影響による音質劣化を避けることができる。
また、符号化フレーム単位の情報量に応じて削減量を調整したので、過度な情報の削減や、不十分な情報の削減を抑えることができ、特定の部分に極端な音質劣化が発生することを避けることが可能となる。
また、オーディオ符号化データの情報量と、それを記録する記録媒体の記録可能容量とから情報の削減量を決定しているので、記録媒体の容量に応じた最適な音質を得ることが可能である。
実施の形態2.
上記実施の形態1では、調整量として削減比率Rを決定する例を示したが、この実施の形態2は調整量として削減量の絶対量を決定するものである。
本実施の形態2による情報量変換装置は、上記実施の形態1に示したものと基本的な構成は一致するが、調整部4の機能が上記実施の形態1と異なる。具体的に説明すると、本実施の形態による調整部4では、変換の対象となる第1のオーディオ符号化データの情報量B1と第2の記録媒体3aの記録可能容量Xとの差ΔY(ΔY=B1−X)を求める。
このΔYの値は、第1のオーディオ符号化データに対して記録時間を損なうことなく第2の記録媒体3aに記録するために、情報量変換装置1が第1のオーディオ符号化データから削減すべき情報量を意味する。但し、ΔYが0以下の場合は、情報量変換を行わなくても良い。
判別部5は、調整部4によって決定された調整量に従って、第1のオーディオ符号化データを構成するどの要素データを情報圧縮するかを決定する。例えば、第1のオーディオ符号化データが、符号化フレーム単位の情報量が一定である、いわゆる固定ビットレート符号化されている場合を挙げる。
上記実施の形態1で図4(c)に示した通り、ディジタルオーディオ信号と符号化に必要な情報量との関係はその信号の性質に応じて変化する。このため、固定ビットレート符号化の場合に定常的に十分な情報量が与えられていない限り、十分な情報量が与えられて符号化されている部分と、情報量が十分には与えられずに符号化されている部分とが存在することとなる。
そこで、判別部5は、複数の符号化フレームを新たな単位として、第1のオーディオ符号化データを構成するどの要素データを情報圧縮するかを決定する。この新たな単位をスーパーフレーム(SF)と呼ぶものとする。このスーパーフレームを構成する符号化フレームの数は、例えばフレーム数について予め規定(固定化)しておいた値の選択肢の中から適宜選択して設定するようにしてもよい。
但し、スーパーフレームの導入は、符号化フレームごとに符号化に用いた符号量の冗長度に違いがあることに着目し、新たな単位として当該冗長度が平均化された状態にすることを目的としている。このため、最低限、当該目的を満たす程度のフレーム数にてスーパーフレームを構成する。
また、この他に、符号量の冗長度は、対象とするオーディオ信号の性質(情報量)に依存することから、このオーディオ信号の性質を解析して適応的にスーパーフレームを構成する符号化フレームの数を決定するようにしてもよい。
判別部5内の分離部7では、上記実施の形態1と同様にして、再生装置2から入力した第1のオーディオ符号化データAを同一の符号化方式のビット多重文法に従って個々の構成要素のデータ(要素データ)ごとに分離する。続いて、解析部8では、分離部7が分離した要素データを上記符号化方式に沿って解析する。
次に、解析部8は、調整部4から調整量(制御情報B)として、例えば直接削減すべき情報量ΔYと記録時間に関する情報を得て、スーパーフレームごとに平均的に削減すべき情報量を求めておく。そして、要素データの解析結果に基づいて、要素データを情報圧縮して得られる削減量が等しくなるまで、圧縮の対象とする要素データを順次決定する。ここでは、スーパーフレーム内の複数の符号化フレーム間で、信号レベルの大小を比較する等の判定を行うことによって、符号化フレームあたりの削減量に重み付けを行い、複数の符号化フレームごとに削減量を決定する。
1つの符号化フレームに相当する部分から情報圧縮する要素データを選択し決定する方法としては、上記実施の形態1で述べた方法が挙げられる。即ち、最小可聴限カーブや帯域ごとの信号レベル、あるいは割当てられたビット長などを基準として選択し決定する。
続いて、圧縮部6では、判別部5で情報圧縮を行うように指定された要素データについてより情報量の少ない符号に置換することによって、第1のオーディオ符号化データを第2のオーディオ符号化データに変換する。詳細な動作については、上記実施の形態1と同様である。
図10は、本実施の形態による情報量変換装置によって生成された第2のオーディオ符号化データの符号化フレームとその情報量との関係を示す図であり、第1のオーディオ符号化データからどれだけ情報量が削減されたかを示している。図中の点線で区切った部分は、2つの符号化フレームをスーパーフレーム(SF1〜SF6)とした場合を示しており、それぞれの情報量の削減量を斜線で示している。
図示の例では、スーパーフレームSF2,SF3を除き、スーパーフレーム単位の削減量は、1つの符号化フレームあたりで同量の削減量となっている。また、スーパーフレームSF4,SF5についても、4つの符号化フレームを基本単位としたさらに上位のスーパーフレームとみなせば、1つの符号化フレームあたりの削減量は変わらない。
以上のように、この実施の形態2によれば、スーパーフレームを導入して情報量の削減対象を選択するので、情報の削減箇所をオーディオ符号化データの広範囲に分散させることが可能となり、音質劣化を抑制しつつ、圧縮効率を高めることができる。
なお、上記実施の形態2では、スーパーフレームを導入して各符号化フレームの冗長度を平均化した例を示したが、スーパーフレームを導入せず、符号化フレームごとに一定の情報量を削減するようにしてもよい。図11は、スーパーフレームを導入せず、符号化フレームごとに一定の情報量を削減して第2のオーディオ符号化データとした例を示している。
また、上記実施の形態2において、スーパーフレーム内の複数の符号化フレームに対して削減量についての重み付けを付与するようにしてもよい。このようにすることで、情報量を多く必要とする信号部分に対しては削減量を少なく、情報量を多く必要としない信号部分に対しては削減量を多くすることができ、オーディオ信号の特性に合った情報量の削減調整が可能となる。
さらに、第1のオーディオ符号化データが可変ビットレート符号化又は固定ビットレート符号化によるものかに応じて、判別部5及び圧縮部6が、上記実施の形態1のような符号化フレームごとの処理にするか、上記実施の形態2のようなスーパーフレームごとの処理にするかを切り替えることができるように構成しても良い。例えば、可変長符号化のように量子化のビット数と符号語の語長が一様に対応していない場合では、上記実施の形態1のような符号化フレームごとの処理を実行し、一般的に量子化におけるビット数と符号語の語長が同じである固定長符号化では、スーパーフレームごとの処理を実行することで、符号化方式に応じた的確な情報量変換が可能となる。
実施の形態3.
この実施の形態3では、圧縮部6によって実際に削減された情報量に基づいて、調整部4が決定した調整量を補正するよう構成したものである。
符号長が量子化出力値に関わらず一定な固定長符号化方式では、一般的に量子化におけるビット数と符号語の語長が同じであり、量子化のビット数を1ビット削減すれば、それに応じて削減される符号量(情報量)が容易に推定可能である。このような符号化方式であれば、上記実施の形態でも十分に対応することができる。
しかしながら、量子化出力値の生起確率に応じて符号長を換える、ハフマン符号化のような可変長符号化方式では、量子化のビット数と符号語の語長が一様に対応していないため、量子化のビット数を1ビット削減しても、これに対応する符号量(情報量)がどれだけ削減されるかわからない。
例えば、30個のサンプル情報を単位として、5ビットで量子化されている場合を考えると、ある符号化フレームにおいて30ビットの情報量の削減が必要だと調整部が判断した場合、固定長符号化では、量子化ビットを1ビット削減すれば、削減量は30ビットになる。しかしながら、可変長符号化では、量子化ビットを1ビット削減するとしても、削減量が30ビットにならない場合がある。
そこで、本実施の形態では、圧縮部6によって実際に削減された情報量に基づいて、調整部4が決定した調整量を補正する。図12は、この発明の実施の形態3による情報量変換システムの構成を示すブロック図であり、情報量変換装置1内の構成についても示している。図に示すように、本情報量変換装置1内の圧縮部6aは、第1のオーディオ符号化データから第2のオーディオ符号化データを生成するにあたり、第1のオーディオ符号化データについて実際に削減した情報量に関する情報を調整部4aにフィードバックする。
調整部4aでは、圧縮部6aから受けた情報量の削減量に関する情報を基にして、前回調整量として決定した値を補正する。このようにすることで、より正確な調整量を得ることができる。例えば、上述した可変長符号化によって、量子化ビットを1ビット削減するとしても削減量が30ビットにならず、20ビットになった場合を考える。
このとき、圧縮部6aが実際に削減した情報量を調整部4aにフィードバックしてやることで、調整部4aは、削減量の目標値(30ビット)からの誤差である10ビット分を次の符号化フレームに繰り越すように調整量を補正する。つまり、調整部4aは、次の符号化フレームで、再び30ビットの情報量の削減が必要だと判断した場合、繰り越し分も含めて40ビットの削減を指示する調整量を生成して判別部5に出力する。
以上のように、この実施の形態3によれば、第1のオーディオ符号化データに採用されている符号化方式によってフレーム単位で計算すると必ずしも調整部4が決定した調整量通りに削減できない場合であっても、圧縮部6aが実際に削減した情報量に基づいて調整量を補正してやることで、第1のオーディオ符号化データの削減量を正確に制御することができる。
なお、上記実施の形態3の構成は、上記実施の形態1及び上記実施の形態2に示した全ての構成に適用することができ、これにより、これらの実施の形態における効果と共に、上記実施の形態3における効果も得ることができる。
実施の形態4.
図13はこの発明の実施の形態4による情報量変換システムの構成を示すブロック図である。図に示す再生・記録装置15は、図1に示した再生装置2と記録装置3を一体化して構成され、同一の記録媒体15aについて記録・消去が可能である。この情報量変換システムでは、記録媒体15aの空き容量が不足して新規なオーディオ符号化データを追加して記録することができない容量であったとしても、情報量変換によって実質的に空き容量を増やしたのと同様の処理が可能となる。
つまり、空き容量が不足している記録媒体15aに新規にオーディオ符号化データを追加して記録する際、当該データを第1のオーディオ符号化データと見なして、その情報量を変換して第2のオーディオ符号化データとした後に記録する。このようにすることで、記録媒体15aの空き容量を増やしたものと擬制でき、新規にオーディオ符号化データを追加することができる。
例えば、CD等から10曲が記録されており、かつ残りの記録可能容量がない記録媒体に対して、シングルCD等から1曲だけ追加したい場合に有効である。即ち、情報量変換によって全11曲を当該記録媒体に記録することが可能となる。このように、10曲収録された記録媒体と1曲収録された記録媒体の2つの記録媒体を所有する必要がなくなり、ユーザの利便性を向上させることができる。また、必要な記録媒体の数は1つとなり、経済的でもある。
また、第1のオーディオ符号化データは、予め記録されているものではなく、記録途中のものであってもよい。例えば、第1のオーディオ符号化データは、一定の符号化ビットレートで符号化されたものであるとすると、第1のオーディオ符号化データが記録されるに従って記録媒体15aの空き容量は一定の割合で減る。
この場合、記録されるべき第1のオーディオ符号化データの未記録の残量が多いと、記録媒体15aの空き容量が不足し、途中で記録できなくなる。そこで、必要に応じて、記録済みの第1のオーディオ符号化データに対し、その時点での記録媒体15aの空き容量に応じた情報量圧縮を行う。
このような情報量変換システムでは、例えば放送開始から放送終了までの放送時間が決まっていない番組を記録する際に、想定した放送時間から延長されても、全ての番組内容を記録することができる。この場合、番組の途中で記録が途切れることが無くなり、ユーザの利便性をさらに向上させることができる。
また、記録済みの第1のオーディオ符号化データ全体に対して情報量の圧縮を行うので、部分的に極端な音質劣化が発生することも避けることができる。
以上のように、この実施の形態4によれば、再生装置2と記録装置3を一体化した再生・記録装置15を備えたので、同一の記録媒体15aについて記録・消去が可能であることから、記録媒体15aの空き容量に応じた情報量圧縮を実行することができる。
なお、上記実施の形態で示した構成のみに限定されるものではなく、例えば記録媒体は装置内に固定されたものであっても、取り外し可能なものであってもよい。
また、上記実施の形態では、情報量変換の調整量は自動的に計算するものであったが、音質に対する許容度はユーザの主観に依存するので、ユーザ自身が指定可能に構成しても良い。但し、この場合には、符号化データの情報量と記録可能容量の組合せによって全てのデータを変換して記録することができない場合がある。従って、その判定結果をユーザに通知し、第1のオーディオ符号化データの数を選択し直す等のユーザ指導を行うよう構成しても良い。
この発明の実施の形態1による情報量変換システムを示すブロック図である。 図1中の情報量変換装置の内部構成を示した情報量変換システムを示すブロック図である。 図2中の判別部の構成を示すブロック図である。 オーディオ符号化データの特徴を説明する図である。 音声周波数とその周波数での可聴限度の信号強度との関係を示す図である。 図2中の圧縮部の構成を示すブロック図である。 図6中の置換部の構成を示すブロック図である。 サンプルを表す符号の変換前後の対応を示す表である。 第2のオーディオ符号化データの符号化フレームとその情報量との関係を示す図である。 この発明の実施の形態2による情報量変換装置が生成した第2のオーディオ符号化データの符号化フレームとその情報量との関係を示す図である。 符号化フレームごとに一定の情報量を削減して第2のオーディオ符号化データの符号化フレームとその情報量との関係を示す図である。 この発明の実施の形態3による情報量変換システムの構成を示すブロック図である。 この発明の実施の形態4による情報量変換システムの構成を示すブロック図である。
符号の説明
1 情報量変換装置、2 再生装置、2a 第1の記録媒体、3 記録装置、3a 第2の記録媒体(記録媒体)、4,4a 調整部、5 判別部、6,6a 圧縮部、7 分離部、8 解析部、9 分離部、10 置換部、11 多重部、12 ビット長決定部、13 ビット長変換部、14 サンプル変換部、15 再生・記録装置、15a 記録媒体。

Claims (11)

  1. 符号化データの情報量と、当該符号化データを記録すべき記録媒体の記録可能容量とを用いて、上記記録媒体に記録できる情報量への変換度合を示す調整量を算出する調整部と、
    上記符号化データの構成単位を分析して個々の構成要素データを特定すると共に、上記調整量に基づいて上記符号化データについて削減すべき情報量を算出し、当該算出結果の情報量に上記構成要素データから削減する情報量の総和が合致するまで、情報量を削減すべき構成要素データを逐一判別する判別部と、
    上記判別部が情報量を削減すべきと判別した構成要素データを、その情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データ群を多重して上記記録媒体に記録する符号化データを生成する圧縮部と
    を備えた情報量変換装置。
  2. 判別部は、符号化データについて複数の符号化フレームを1つにまとめたスーパーフレームごとに上記符号化データの構成単位を分析して個々の構成要素データを特定すると共に、調整量に基づいてスーパーフレームごとに削減すべき情報量を算出し、当該算出結果の情報量に上記構成要素データから削減する情報量の総和が合致するまで、上記スーパーフレームごとに情報量を削減すべき構成要素データを逐一判別し、
    圧縮部は、スパーフレームごとに情報量を削減すべきと判別された構成要素データについてその情報量を削減した構成要素データに置換し、置換後の構成要素データを含む構成要素データを多重して上記記録媒体に記録する符号化データを生成することを特徴とする請求項1記載の情報量変換装置。
  3. 判別部及び圧縮部は、入力した符号化データが可変長符号化又は固定長符号化によるものかに応じて、スーパーフレームごとに処理を実行すべきか否かを切り替えることを特徴とする請求項2記載の情報量変換装置。
  4. 判別部は、調整量に基づいてスーパーフレームごとに削減すべき情報量を算出するにあたり、上記スーパーフレームを構成する符号化フレームごとにその情報内容に応じて削減すべき情報量に関する重み付けを設定することを特徴とする請求項2又は請求項3記載の情報量変換装置。
  5. 判別部は、符号化データがオーディオ符号化データである場合、オーディオ信号の最小可聴限信号レベルの大小に応じて情報量を削減すべき構成要素データを判別することを特徴とする請求項1から請求項4のうちのいずれか1項記載の情報量変換装置。
  6. 判別部は、符号化データの信号レベルの大小に応じて情報量を削減すべき構成要素データを判別することを特徴とする請求項1から請求項4のうちのいずれか1項記載の情報量変換装置。
  7. 判別部は、符号化データがオーディオ符号化データである場合、オーディオ信号の信号レベルとその許容ノイズレベルとに応じて割り当てた符号化データの各構成要素データのビット長が相対的に短い周波数帯域に含まれるものを、情報量を削減すべき構成要素データとして判別することを特徴とする請求項1から請求項4のうちのいずれか1項記載の情報量変換装置。
  8. 圧縮部は、構成要素データについて情報量を削減した構成要素データに置換するにあたり、上記情報量をゼロとした構成要素データに置換することを特徴とする請求項1から請求項7のうちのいずれか1項記載の情報量変換装置。
  9. 圧縮部は、置換後の構成要素データを含む構成要素データを多重して生成した符号化データの処理前の情報量からの削減量を算出して調整部に出力し、
    調整部は、上記圧縮部が算出した削減量に応じて調整量の算出結果を補正することを特徴とする請求項1から請求項8のうちのいずれか1項記載の情報量変換装置。
  10. 符号化データを記録する第1の記録媒体を有し、当該第1の記録媒体から読み出した上記符号化データを再生する再生装置と、
    第2の記録媒体を有し、入力したデータを上記第2の記録媒体に記録する記録装置と、
    上記再生装置から上記第2の記録媒体に記録すべく出力された符号化データを入力すると共に、上記記録装置から上記第2の記録媒体の記録可能容量を入力し、当該符号化データの情報量が上記第2の記録媒体の記録可能容量より大きいと、その情報量を削減した符号化データを生成して上記記録装置に出力する請求項1から請求項9のうちのいずれか1項記載の情報量変換装置と
    を備えた情報量変換システム。
  11. 符号化データを記録する記録媒体を有し、当該記録媒体から読み出した上記符号化データを再生すると共に、入力したデータを上記記録媒体に記録する再生記録装置と、
    上記再生記録装置が上記記録媒体に符号化データを記録するにあたり、上記記録媒体に記録すべき符号化データ又は既に記録されている符号化データと、上記記録媒体の記録可能容量とを入力し、上記符号化データの情報量を削減した符号化データを生成して上記再生記録装置に出力する請求項1から請求項9のうちのいずれか1項記載の情報量変換装置と
    を備えた情報量変換システム。
JP2003279307A 2003-07-24 2003-07-24 情報量変換装置及び情報量変換システム Pending JP2005043761A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003279307A JP2005043761A (ja) 2003-07-24 2003-07-24 情報量変換装置及び情報量変換システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003279307A JP2005043761A (ja) 2003-07-24 2003-07-24 情報量変換装置及び情報量変換システム

Publications (1)

Publication Number Publication Date
JP2005043761A true JP2005043761A (ja) 2005-02-17

Family

ID=34265453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003279307A Pending JP2005043761A (ja) 2003-07-24 2003-07-24 情報量変換装置及び情報量変換システム

Country Status (1)

Country Link
JP (1) JP2005043761A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010540990A (ja) * 2007-09-28 2010-12-24 ヴォイスエイジ・コーポレーション 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010540990A (ja) * 2007-09-28 2010-12-24 ヴォイスエイジ・コーポレーション 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置

Similar Documents

Publication Publication Date Title
KR100548891B1 (ko) 음성 부호화 장치 및 음성 부호화 방법
US7899676B2 (en) Signal encoding device and signal encoding method, signal decoding device and signal decoding method, program, and recording medium
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
JP2004522198A (ja) 音声符号化方法
JP2007293354A (ja) 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法
JP4628861B2 (ja) 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法
US6310564B1 (en) Method and apparatus for compressively coding/decoding digital data to reduce the use of band-width or storage space
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
US5524170A (en) Vector-quantizing device having a capability of adaptive updating of code book
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
US5812982A (en) Digital data encoding apparatus and method thereof
JPWO2005057550A1 (ja) 音声圧縮伸張装置
US20070192089A1 (en) Apparatus and method for reproducing audio data
JP2005043761A (ja) 情報量変換装置及び情報量変換システム
JP4508599B2 (ja) データ圧縮方法
JP3776004B2 (ja) ディジタルデータの符号化方法
JP4271588B2 (ja) ディジタルデータの符号化方法および符号化装置
KR20020000834A (ko) 디지털 녹화 장치
JP4822697B2 (ja) ディジタル信号符号化装置およびディジタル信号記録装置
JP2005265865A (ja) オーディオ符号化のためのビット割り当て方法及び装置
JPH11355145A (ja) 音響符号器および音響復号器
JP2001249699A (ja) 音声圧縮装置
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JPH08307277A (ja) 可変レート音声符号化方法及び装置
JP2006522949A (ja) 埋め込みデータ・チャンネルの更新

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060627

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071018

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090616

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091020