JP2004233901A - オーディオ信号処理装置及びオーディオ信号処理方法 - Google Patents
オーディオ信号処理装置及びオーディオ信号処理方法 Download PDFInfo
- Publication number
- JP2004233901A JP2004233901A JP2003025236A JP2003025236A JP2004233901A JP 2004233901 A JP2004233901 A JP 2004233901A JP 2003025236 A JP2003025236 A JP 2003025236A JP 2003025236 A JP2003025236 A JP 2003025236A JP 2004233901 A JP2004233901 A JP 2004233901A
- Authority
- JP
- Japan
- Prior art keywords
- bit
- audio signal
- signal
- section
- mute pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】1ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、圧縮率をより向上させることができるオーディオ信号処理装置及びオーディオ信号処理方法を提供する。
【解決手段】1ビット・オーディオ信号編集機4は、ΔΣ変調器3が出力した1ビット・オーディオ信号Aの無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する。さらに、1ビット・オーディオ信号編集機4は、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【選択図】 図1
【解決手段】1ビット・オーディオ信号編集機4は、ΔΣ変調器3が出力した1ビット・オーディオ信号Aの無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する。さらに、1ビット・オーディオ信号編集機4は、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、オーディオ信号処理装置及びオーディオ信号処理方法に関し、特にΔΣ変調された1ビット・オーディオ信号を圧縮するオーディオ信号処理装置及びオーディオ信号処理方法、並びにオーディオ信号処理システムに関する。
【0002】
【従来の技術】
ΔΣ変調された高速1ビット・オーディオ信号は、従来のデジタルオーディオに使われてきたデータのフォーマット(例えばサンプリング周波数44.1kHz、データ語長16ビット)に比べて、非常に高いサンプリング周波数と短いデータ語長(例えばサンプリング周波数が44.1kHzの64倍でデータ語長が1ビット)であり、伝送可能周波数帯域が広いことを特長としている。また、ΔΣ変調により1ビット信号であっても、64倍というオーバーサンプリング周波数に対して低域であるオーディオ帯域において、高いダイナミックレンジをも確保できる。この特徴を生かして高音質のレコーダーやデータ伝送に応用することができる。
【0003】
ΔΣ変調回路自体はとりわけ新しい技術ではなく、回路構成がIC化に適していて、また比較的簡単にAD変換の精度を得ることができることから、従来からADコンバータの内部などでよく用いられている回路である。ΔΣ変調された信号は、簡単なアナログローパスフィルターを通すことによって、アナログオーディオ信号に戻すことができる。
【0004】
最近、前記ΔΣ変調に基づいたDSD(Direct Stream Digital )方式により生成された1ビット方式のオーディオストリームデータを記録しているスーパーオーディオコンパクトディスク(Super Audio Compact Disc 以下、SA−CDと記す)が知られるようになった。
【0005】
入力信号に対して64fsのオーバーサンプリング・ΔΣ変調を施すと1ビット・オーディオ信号が得られる。CD方式のシステムでは、その直後に1ビットの信号からマルチビットのPCM符号へのデシメーションが行われるが、DSD方式を採用した前記SA−CDでは前記1ビット・オーディオ信号を直接記録している。
【0006】
ところで、オーディオ記録/再生で用いられるチャンネル数としては、モノラル、ステレオ2チャンネルなどが古くからあるが、近年2チャンネルを越えるマルチチャンネルオーディオを記録/再生するオーディオアプリケーションが出現してきている。例えば、映画でよく使用されている5.1(6)チャンネルはもとより音楽用に4チャンネルなども用いられる。
【0007】
例えば、前記SA−CDでは、ディスク上に、通常2チャンネルステレオの他、最大6個の独立したオーディオチャンネルが規定されている。このため、5.1チャンネルのオーディオソースを格納可能である。これらの規格におけるマルチチャンネルのスピーカ位置の設定は、ITU−R(international telecommunications union radiocommunication sector)の勧告BS−775−1Multi−channel Stereophonic Sound System with and without Accompanying Pictureに基づいている。
【0008】
図29には、前記勧告によるマルチチャンネルの標準的なスピーカ配置を示す。聴取者Uに対するフロントの左L,右R、フロントのセンターC、サラウンドの左LS,サラウンドの右RSの5チャンネルの配置である。また、この5チャンネルの配置に、図30に示すように低域補正(Low Frequency Enhancement:LFE)を再生するサブウーハー(Sub Woofer:SW)スピーカを加えた5.1チャンネルの配置も標準的となっている。
【0009】
これら5.1チャンネルや、4チャンネルを含めて何種類かのチャンネル数をサポートする系の場合、それぞれに適合したソースを作成する記録装置、再生装置などが必要となりソースのチャンネル数によってその機能や回路を切り替えて運用する必要がある。
【0010】
【発明が解決しようとする課題】
ところで、オーディオソースをマルチチャンネルで記録媒体に記録するには、チャンネル数が多いだけ、モノラルや、ステレオ2チャンネルよりもデータ量が多くなってしまう。記録媒体としては、例えば磁気ディスク、光ディスク、光磁気ディスク、ディジタルオーディオテープ、半導体メモリ等がある。音楽用の4チャンネルを例にあげれば、圧縮率を同一とした場合、チャンネル数が多くなるほど一つの記録媒体への記録時間は短くなる。よって、アルバムであれば、曲数が少なくなる。
【0011】
マルチチャンネル用にΔΣ変調された1ビット・オーディオ信号をマルチチャンネルで圧縮記録する際にも、同様のことがいえる。これは、ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるために、オーディオ帯域において無音であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【0012】
また、チャンネル数を一定、例えば最大チャンネル数に固定したシステムの場合、チャンネル数が異なるオーディオアプリケーションをサポートできるが、特にそのソースの伝送系や記録容量が必要以上に増大してしまう。本来、記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、6チャンネルの系に4チャンネルしか利用しないソースを応用する場合、2チャンネル分無音の余分で無駄なデータが増えることになる。これも、ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるため、オーディオ帯域において無音であっても有声音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【0013】
本発明は、1ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、圧縮率をより向上させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【0014】
また、本発明は、1ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、構成を単純化させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【0015】
【課題を解決するための手段】
本発明に係るオーディオ信号処理装置は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調手段と、前記ΔΣ変調手段が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する編集手段と、前記編集手段が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮手段とを備える。
【0016】
本発明に係るオーディオ信号処理方法は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調工程と、前記ΔΣ変調工程が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力する編集工程と、前記編集工程が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮工程とを備える。
【0017】
ΔΣ変調された1ビット・オーディオ信号の信号波形を基に、無音と推定される区間を切り出し、その区間を特定1ビット・ミュートパターンに置き換え、区間の境目をクロスフェードさせた後、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0018】
ΔΣ変調後の1ビット・オーディオ信号の無音と推定される区間を切り出し、特定1ビット・ミュートパターン信号の連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せる。よって、その符号効率が良くなるのは自明である。)。
【0019】
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0020】
また、本発明に係るオーディオ信号処理装置は、前記課題を解決するために、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段とを備える。
【0021】
また、本発明に係るオーディオ信号処理方法は、前記課題を解決するために、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調工程と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成工程と、前記ΔΣ変調工程が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成工程が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮工程とを備える。
【0022】
また、本発明に係るオーディオ信号処理システムは、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段と、前記圧縮手段が圧縮した1ビット信号を記録媒体に記録する記録手段と、前記記録手段によって記録媒体に記録された圧縮1ビット信号を伸長する伸長手段と、前記伸長手段によって伸長された1ビット信号をアナログ信号に変換する信号処理手段とを備える。
【0023】
伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル(無音)を特定1ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0024】
利用されていないチャンネルを特定1ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せるとすると、その符号効率が良くなるのは自明である。)。
【0025】
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0026】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【0027】
【発明の実施の形態】
以下、本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法のいくつかの実施の形態について図面を参照しながら説明する。
【0028】
第1の実施の形態は、2時間以上の映画のマルチチャンネルオーディオ(5.1チャンネル)を情報圧縮の対象とするオーディオ信号処理装置である。5.1チャンネルは、聴取者Uに対するフロントの左L,右R、フロントのセンターC、サラウンドの左LS,サラウンドの右RSの5チャンネルに、低域補正(Low Frequency Enhancement:LFE)チャンネルを加えた構成である。
【0029】
LFEは、低域補正という性質上、低域の音がないときには、無音と推定される区間が頻繁に存在する。詳細を後述するが、実際には全てのチャンネルの音声波形を基に、各チャンネル毎に無音と推定される区間を抽出し、例えば区間の長さ、多さ、さらに音質上問題が無いか否かを判定し、対象とするチャンネルを決定する。その結果、この第1の実施の形態では、LFEチャンネルを対象とする。
【0030】
図1において、オーディオ信号処理装置1は、入力端子2から入力されるアナログオーディオ信号にΔΣ変調を施すΔΣ変調器3と、ΔΣ変調器3が出力する1ビット・オーディオ信号Aに後述する編集処理を施して1ビット・オーディオ信号A’を出力する1ビット・オーディオ信号編集機4と、1ビット・オーディオ信号A’を圧縮する圧縮器5とを備えてなる。圧縮器5から出力される圧縮1ビット・オーディオ信号Cは、出力端子6から、例えば光ディスクへの記録系や、同軸ケーブル、あるいは光ファイバーケーブルなどの伝送路に導出される。
【0031】
ΔΣ変調器3は、例えばコンパクトディスクに対するデジタルデータの記録再生時に用いられているサンプリング周波数(Fs=44.1kHz)の64倍の64Fsを使ってアナログオーディオ信号をΔΣ変調し、1ビット・オーディオ信号を出力する。図2に示すように、入力端子7から入力されたアナログオーディオ信号は、加算器8を介して積分器9に供給される。この積分器9からの積分値は1ビット量子化器10に供給され、アナログオーディオ信号の中点電位と比較されて1サンプル期間毎に1ビット量子化処理される。この1ビット量子化処理により生成された1ビットオーディオ信号は、1サンプル遅延器11に供給されて1サンプル期間分遅延される。この遅延信号が加算器8に供給されて、上記アナログオーディオ信号に加算される。そして、加算器8の出力が積分器9、1ビット量子化器10を介して出力端子12から1ビット・オーディオ信号Aとして1ビット・オーディオ信号編集機4に導出される。
【0032】
1ビット・オーディオ信号編集機4は、ΔΣ変調器3が出力した1ビット・オーディオ信号Aの無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する。さらに、1ビット・オーディオ信号編集機4は、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【0033】
このため、1ビット・オーディオ信号編集機4は、図3に示すように、無音区間抽出部14と、1ビット・ミュートパターン置換&クロスフェード部15とを備えてなる。無音区間抽出部14は、ΔΣ変調器3から入力される1ビット・オーディイオ信号Aのうち無音と推定される区間を抽出し、無音区間の1ビット・オーディオ信号A’’として出力する。1ビット・ミュートパターン置換&クロスフェード部15は、無音と推定した区間(無音区間の1ビット・オーディオ信号A’’)を特定の1ビット・ミュートパターン信号に置き換える。無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【0034】
図4には、1ビット・オーディオ信号編集機4が無音区間抽出部14によって無音区間を抽出し、1ビット・ミュートパターン置換&クロスフェード部15によって所定の1ビット・ミュートパターン信号に置換する処理手順を示す。すなわち、ステップSIにて1ビット・オーディオ信号Aを入力すると、無音区間抽出部14では、ある短い一定時間の窓(Window)を設け、区間(x,x+1)におけるデータのレベル(Lebel)を検出する(ステップS1)。このレベルが所定のydB以下であるか否かをステップS2にて判定する。yは例えば−79dBや,−80dBである。ステップS2にてレベルがydB以下であると判定する(yes)とステップS3に進む。
【0035】
ステップS3では、前記区間(x,x+1)を、所定の1ビット・ミュートパターン信号に置き換える。ここで、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるときに、無音と推定されなかった区間との境目をクロスフェードする。
【0036】
図5には、クロスフェード処理を行うために必要な1ビット・ミュートパターン置換&クロスフェード部の具体的な構成を示す。無音区間抽出部14で抽出された無音区間の1ビット・オーディオ信号A’’は、制御部17に供給される。また、無音と推定されなかった区間の1ビット・オーディオ信号Aは、ディレイライン19に供給される。制御部17は、ミュートパターン発生部18にミュートパターン信号の発生タイミング制御信号を供給する。この発生タイミング制御信号を受けてミュートパターン発生部18は、所定の1ビット・ミュートパターン信号を発生し、置換・クロスフェード部20に供給する。置換・クロスフェード部20には、ディレイラインで、無音区間抽出処理時等のタイミングを合わせた1ビット・オーディオ信号Aが供給される。置換・クロスフェード部20は、制御部17から供給されるフェードタイミング制御信号に基づいて、前記1ビット・オーディオ信号A中の無音区間の1ビット・オーディオ信号A’’を、ミュートパターン発生部18からの1ビット・ミュートパターン信号に置き換える。このとき、置換・クロスフェード部20は、1ビット・ミュートパターン信号と、前記1ビット・オーディオ信号A中の無音と推定されなかった区間との境目をクロスフェードして、1ビット・オーディオ信号A’を出力する。
【0037】
ミュートパターン発生部18は、例えば$96パターンと呼ばれる「1,0,0,1,0,1,1,0」の繰り返しからなる、1ビット・ミュート信号パターンをリニアに発生している。この$96パターンについての詳細は後述する。置換・クロスフェード部20によるクロスフェードは、本件出願人が特開平9−307452号公報にて開示したディジタル信号処理方法に応じてなされる。簡単に説明すると、前記1ビット・オーディオ信号Aと、ミュートパターン発生部18によって生成される1ビット・ミュートパターン信号とのレベルを合わせてから複数サンプルにわたるパターンの一致を検出し、その検出結果に応じて切り換えるという技術である。
【0038】
前記ステップS3により、無音と推定されなかった区間の1ビット・オーディオ信号と、所定の1ビット・ミュートパターン信号は、クロスフェードされ、連続して出力される。次に、ステップS4にて、区間が2時間以上のオーディオデータの終了ENDになったか否かを判定し、ENDになった(yes)のであれば、ステップSOにて前記無音と推定されなかった区間の1ビット・オーディオ信号と、所定の1ビット・ミュートパターン信号とを連続的に出力する。
【0039】
ステップS4にてまだ前記区間が2時間以上のオーディオデータの終了ENDになっていない(no)と判定すれば、ステップS1〜ステップS3をステップS4にてyesと判定するまで繰り返す。
【0040】
図1に戻り、圧縮器5について説明する。圧縮器5は、1ビット・オーディオ信号編集機4が出力した1ビット・ミュートパターン信号を含む1ビットオーディオ信号A’を圧縮する。
【0041】
音声波形の符号化に予測符号化がある。オーディオ信号は、隣接標本間のみならず、さらに離れた点の間でも相関がある。その相関を利用して予測した値と実際の標本値との差を符号化する方法が予測符号化である。差は実際の標本値の分布に比べて変化範囲が小さくて済み、また予測の的中具合により生じる分布の偏りと共に符号化することで効率的な情報圧縮を図ることができる。この原理はデジタルオーディオ信号を圧縮記録する系において有用であり、またΔΣ変調された1ビット・オーディオ信号の圧縮記録系内においても用いられている。
【0042】
圧縮器5は、圧縮技術として、前記予測符号化の原理に基づいた「ダイレクトストリームトランスファー(以下DST)」を用いる。DSTとは、SA−CDにおける1ビット・オーディオ信号の圧縮に用いられているロスレスコーディング技術である(United States Patent No.6289306参照)。この技術は、前述の予測符号化の原理に基づいた予測フィルタと算術符号化から成り、予測フィルタ内で入力信号と予測値の差を取り、算術符号化でその差を分布の偏り、すなわち分布確率と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。そして、現在、この技術は前述したように、SA−CDにおける1ビット・オーディオ信号の圧縮技術として用いられるようになった。
【0043】
図6には、前記DSTを行う圧縮器5の構成を示す。1ビット・オーディオ信号編集機4を経た1ビット・オーディオ信号A’は、デジタル信号として扱われるためにデータ変換器22にて“0”となっていた信号を“−1”に直され、予測フィルタ23に供給される。予測フィルタ23は、常に次に続く標本値を予測する。予測フィルタ23からの予測結果Zは、1ビット量子化器24に供給される。1ビット量子化器24は、予測結果Zに基づいて“0”又は“1”を排他論理和(イクスクルーシブオアXOR)回路25に出力する。排他論理和回路25は、前記1ビット・オーディオ信号A’と、前記予測結果Zに基づいた1ビット量子化器24からの“0”又は“1”との排他論理和を出力する。予測フィルタ23による予測が当たれば排他論理和回路25からの出力が0となる。この予測の当たり具合は算術符号化器27にて確率情報として用いられる。算術符号化器27は、前記確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。
【0044】
予測フィルタ23は、指定回数分の遅延器310,311,312・・・31nと、係数乗算器320,321,322・・・32nの組み合わせと、各係数乗算器の合計出力を算出する加算器(Σ)33とから成る。予測フィルタ23の遅延器の数と、係数乗算器のフィルタ係数a0,a1,a2・・・anは、1ビット・オーディオ信号A’のフレーム単位毎に、DSTの結果として記録される。また、予測フィルタ23が出力した予測結果Zは、情報テーブル26へ記録される。
【0045】
1ビット量子化器24は、予測フィルタ23が出力した予測結果Zが0より小さければ“0”を、0以上であれば“1”を出力する。
【0046】
排他論理和回路25は、1ビット・オーディオ信号A’と、予測結果Zに基づいた1ビット量子化器24からの前記“0”又は“1”との排他論理和を出力する。1ビット・オーディオ信号A’の各0と1とが、前記“0”又は“1”と、それぞれ一致、つまり(0,0)又は(1,1)であれば「0」を出力する。また、この排他論理和回路25が「1]を出力するということは、(0,1)又は(1,0)であり、予測が外れたことを示す。
【0047】
したがって、算術符号化器27は、排他論理和回路25が出力する「0」又は「1」を見ることにより、あるインターバルにおける予測が外れた確率を予測の当たり具合として算出することができる。この予測が外れた確率値も確率情報として情報テーブル26に記録される。
【0048】
算術符号化器27は、前記確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。算術符号化器27は、前記差に相当する出力を、分布の偏り、すなわち分布確率に相当する確率情報と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化器27において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。
【0049】
図7には、圧縮器5が行うDST処理手順を示す。ステップSIにて1ビット・オーディオ信号A’が入力される。すると、ステップS11にてデータ変換器22は、“0”となっていた信号を“−1”に直し、“1“はそのまま“1”にする。ステップS12にて、予測フィルタ23は、常に次に続く標本値を予測する。このとき、予測フィルタ23の遅延器の数と、係数乗算器のフィルタ係数a0,a1,a2・・・anは、ソフトウェア上用いられるものであり、DSTの結果として、SA−CDに記録される。無音区間に置き換えられた1ビット・ミュートパターン信号は、パターンの繰り返しのため、音の急激な変化がなく、相関が強い。よって、予測しやすくなる。すなわち、当たり易くなり、遅延器の数を減少することができる。予測フィルタ23が出力した予測結果Zは、SA−CDの情報テーブル26にDSTの結果として記録される。
【0050】
ステップS13にて、1ビット量子化器24は、予測結果Zが0より小さければ“0”を、0以上であれば“1”を出力する。そして、ステップS14にて、排他論理和回路25は、1ビット・オーディオ信号A’と、予測結果Zに基づいた1ビット量子化器24からの前記“0”又は“1”との排他論理和を出力する。このとき、算術符号化器27は、排他論理和回路25が出力する「0」又は「1」を見ることにより、あるインターバルにおける予測が外れた確率を算出することができる。この予測が外れた確率値も情報テーブル26へ記録される。予測が当たれば当たるほど、前記予測が外れた確率値は低くなる。
【0051】
そして、ステップS15にて算術符号化器27は、確率情報算出部によって算出された確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。この結果、ステップSOにて、DSTデータが出力されることになる。
【0052】
算術符号化の具体例について図8を参照しながら説明する。例えば、排他論理和回路25が、“0010001001”という合計10個の0と1を出力したとする。この排他論理和(XOR)の結果“0010001001”を算術符号化する例である。0は予測が当たったことを示し、1は外れたことを示している。
【0053】
先ず、0の確率は7/10であり、1の確率は3/10である。よって、(a)に示すように、1番目の0の分布確率は[0,7/10)、つまり0以上、7/10未満となる。次に、2番目の0は、(b)に示すように、(a)に示した7/10を1とした場合の7/10となり、その分布確率は[0,49/100)となる。次に、3番目の1は、(c)に示すように、(b)に示した49/100を1とした場合の3/10となり、その分布確率は[343/1000,49/100)となる。次に、4番目の0は、(d)に示すように、(c)に示した[343/1000,49/100)を1とした場合の7/10となり、その分布確率は[343/1000,3759/10000)となる。そして、(e)に示すように0の分布確率は、[x/1010,y/1010)となる。この算術符号化では、x/1010と、1の分布確率である3/10を結果として出力する。
【0054】
もし、予測フィルタによる予測が当たり、1の分布確率が低くなると、算術符号化は容易となる。例えば、排他論理和回路25が、“0000000000”という合計10個の0を出力したとする。0の確率は10/10であり、1の確率は0/10である。よって、図9に示すように、0の分布確率は、[10/10,0)となる。このため、算術符号化では、1010/1010=1と0(1の分布確率)を結果として出力するだけでよい。
【0055】
すなわち、圧縮器5は、DSTを行う場合、1ビット・ミュートパターン信号のような連続パターン信号が入力されることで、予測フィルタでの予測が容易になり、予測はより当たるようになる。すなわち、排他論理和からの出力として0の連続値が得られる。このことは、ある間隔において0の連続値を算術符号化することとなり、符号化効率が上がる。
【0056】
このように、DSTを採用した圧縮器5では、予測が当たる程、算術符号化が容易になり、出力すべき結果は単純なものとなる。よって例えば記録、又は伝送される全体の情報はより圧縮されることになる。
【0057】
次に、第1の実施の形態のオーディオ信号処理装置における具体的な処理例について説明する。
【0058】
図10は映画の5.1チャンネルオーディオの各チャンネルを音声波形として表示したものである。上からL、R、C、LFE、LS、RSとなっており、全体の音声分布が見渡せる。この音声波形を基に、各チャンネル毎に無音と推定される区間の抽出を行う。この音声波形を時間軸(横軸)方向とレベル(縦軸)方向にそれぞれ拡大すると、オーディオ帯域において無音部分と有音部分の境界を視覚的に推定することができる。その境界に挟まれた「無音と推定される区間」を図3に示した1ビット・オーディオ信号編集機4内の無音区間抽出部14で抽出する。
【0059】
もちろん、図11に示すように、1ビット・オーディオ信号の無音区間を波形レベルから推定し(1)、その推定無音区間を実際耳で聞き、無音であることを聴覚的に確認して(2)から、その無音区間を切り出し(3)てもよい。
【0060】
このような処理を全チャンネルに対して行った結果が図12であり、図3における1ビット・オーディオ信号A’’の状態を表す。この図12より、LFEは他のチャンネルと比べ、多くの区間が無音と推定されたことがわかる。
【0061】
続いてこの無音と推定された区間に、特定1ビット・ミュートパターン信号を割り当て、区間の境目を図5に示したような構成でクロスフェードさせる。第1の実施の形態では特定1ビット・ミュートパターン信号として、前述したように2進表示で”10010110”、16進表示で”$96”である1ビットパターン信号を用いる。
【0062】
この“$96”パターンについては、本件出願人による特開平9−153814号公報にて開示されている。以下に説明しておく。図13は、パターン”$96”の周波数成分分布図である。この周波数成分はFs×1/8、Fs×3/8であり、アナログ復調でローパスフィルタを通る際に除去される阻止周波数と一致する。よってこの区間を再生する際、無信号と同じ中点電圧(通常0V)であるアナログ信号を再生することになる。即ちその区間はデジタル的にミュートされたことになる。
【0063】
図14は無音と推定される区間のオーディオ帯域における周波数成分分布図、図15はパターン”$96”のオーディオ帯域における周波数成分分布図である。図14より、無音と推定される区間の20Hz〜20KHzの周波数成分は、その変化範囲が乏しくほぼ一定レベルであることが分かる。また、そのレベルは聴覚的に認識できない範囲にある。図15より、パターン”$96”の20Hz〜20KHzの周波数成分は存在せず、即ち聴覚的にも音は認識されない。よって、周波数成分の観点からみても、無音と推定される区間を”$96”の1ビット・ミュートパターン信号に置き換えるということは、音楽性に影響を与えない。
【0064】
このような1ビット・ミュートパターン信号である連続パターン信号が前記図6に示した構成のDSTを適用した圧縮器5に入力されることで、予測フィルタ23での予測が容易になり、予測はより当たるようになる。すなわち、排他論理和回路25からの出力として0の連続値が得られる。このことは、ある間隔において0の連続値を算術符号化部27にて算術符号化することとなり、図9を参照した原理にしたがって符号化効率が上がることとなる。
【0065】
次に、第1の実施の形態についての効果を、2種類の実験によって検証する。第1の実施の形態にかかるオーディオ信号処理装置1による実験を実験2とし、比較例としての実験1と比較する。実験1は、図16に示すように、ΔΣ変調された1ビット・オーディオ信号A(以下A)を1ビット・オーディオ信号編集機4に伝送せずに、圧縮器5に伝送し、1ビット・オーディオ信号B(以下B)を得る。実験2は、図16に示すように、ΔΣ変調された1ビット・オーディオ信号Aを1ビット・オーディオ編集機4に伝送し、前記図3〜図5を参照して説明した処理を施した後、圧縮器5に伝送し、1ビット・オーディオ信号C(以下C)を得る。
【0066】
図17には実験1の結果を、図18には実験2の結果を示す。実験1(比較例)の1ビット・オーディオ信号Aに対する1ビット・オーディオ信号Bの圧縮率(ゲイン=Gain)は、図17の「Gain information」に示すように平均(Average)が3.1142である。圧縮の比率は、A:B=1:1/Gain=1:1/3.1142となる。これに対して、実験2の1ビット・オーディオ信号Aに対する1ビット・オーディオ信号Cの圧縮率(ゲイン=Gain)は、図18の「Gain information」に示すように平均(Average)が3.5740である。圧縮比率は、A:B=1:1/Gain=1:1/3.5740となる。
【0067】
また、図17の「Byte information」において実験1の1ビット・オーディオ信号Aのデータサイズ(Databytes input)は17,310,941,712 bytesで、1ビット・オーディオ信号Bのデータサイズ(Databytes output)は5,558,853,428 bytesであった。これに対して、図18の「Byte information」において実験2の1ビット・オーディオ信号Aのデータサイズ(Databytes input)は17,310,941,712 bytesで、1ビット・オーディオ信号Cのデータサイズ(Databytes output)は4,843,700,513 bytesであった。
【0068】
以上より、実験2、すなわち本発明を施した結果の方が、圧縮率は向上した。因みにGain(圧縮率)3.5740という値は、1ビット・オーディオ信号の圧縮において有意義な値である。
【0069】
なお、第1の実施の形態は、図1に基本構成を示したように、1ビット・オーディオ信号編集機4が出力した1ビット・オーディオ信号A’を圧縮器5によって圧縮する構成のオーディオ信号処理装置1であった。圧縮器5によって圧縮されて出力された1ビット・オーディオ信号Cを図19に示すような記録系40にて例えば光ディスクに記録すればマルチチャンネルの光ディスク41を製造することができる。特に、2時間以上の映画のマルチチャンネルオーディオ(5.1チャンネル)を情報圧縮の対象として、上述したような構成で圧縮すれば、オーディオ部分の圧縮率を、音の品質は落とさず、つまり音楽性に影響を与えずに上げることができる。
【0070】
上記光ディスク41は、図20に示すような構成のオーディオ信号再生装置50によって再生することができる。なお、図20には1チャンネル分だけの構成を示すが、マルチチャンネルの場合には、後述するFIRフィルタ、アンプ、出力端子がチャンネル数だけ必要となる。
【0071】
図20において、光学ピックアップ51が読み出した1ビット・オーディオ信号Cは、RFアンプ52によって信号処理され、図19に示した圧縮器5にて行われるDSTに対応した伸長処理を行う伸長器53によって伸長される。伸長器53によって伸長された1ビット・オーディオ信号は、例えばFIRフィルタ54にてアナログオーディオ信号に変換され、アンプ55にて増幅された後、出力端子56から出力される。また、RFアンプ52からの出力信号はサーボ処理回路57に供給される。サーボ処理回路57によって生成されたサーボ用信号は、光学ピックアップ51をスレッド、フォーカス、トラッキングしたり、スピンドルモータによって光ディスク41を回転駆動する機構部58に供給される。
【0072】
なお、第1の実施の形態では、圧縮器内において、DSTを施す際に「圧縮パラメータ」と呼ばれるDSTの算術処理に用いる数値をチャンネル毎にカテゴリ化でき、相関の高いチャンネル同士に同じ「圧縮パラメータ」を与えることが可能であった。このカテゴリ化は圧縮率に影響を与えるが、どのようなカテゴリ化を用いても本発明の実施による圧縮率の向上は自明である。
【0073】
また、第1の実施の形態では、圧縮記録技術にDSTを用いたが、同様の方法はDST以外の圧縮記録技術にも適応可能である。
【0074】
例えば、ハフマン符号化やランレングス符号化を適応することができる。ハフマン符号化の具体例を図21〜図24を参照して説明する。図21において、合計40ビットである元の1ビット信号は4ビットづつに区切ってみると、「1010」というaパターンと、「1011」というbパターンと、「1100」というcパターンと、「1101」というdパターンに分けられる。そして、各パターンの出現率を計算すると、a:0.4、b:0.3、c:0.2、d:0.1となる。これらの出現率より図22のハフマン符号木を作成し、各記号に対する葉を作り、確率の最も小さい葉同士を枝で結ぶ。一方の枝に「0」、もう一方に「1」を割り当てる。節点に確率の和を書き、新たな葉とする。これを葉が一枚になるまで繰り返す。すると、aは”0”、bは”10”、cは”110”、dは”111”に符号化できる。これにより、符号化された1ビット信号は、計19ビットとなる。よって圧縮率は、19ビット/40ビットとなる。
【0075】
前記1ビット・オーディオ信号編集機4によって元の1ビット信号を例えば10101011という1ビットパターン信号に置換した後に、そのパターン信号をハフマン符号化すると、図23に示すように、計40ビットは「1010」というaパターンと、「1011」というbパターンに分けられる。出現率は、a:0.5、b:0.5となる。この出現率よりハフマン符号木を作成すると図24に示すようになる。すると、aは”0”に、bは”1”に符号化できる。これにより、符号化された1ビット信号は、計10ビットとなる。よって圧縮率は、10ビット/40ビットとなり、圧縮率が向上できる。
【0076】
ランレングス符号化は図25及び図26に示すように、連続の長さによる符号化である。40ビットからなる元の1ビット信号にあって、1は0の連続が0であるので1→0、01は0の連続が1であるので01→1、001は0の連続が2であるので001→2、000は0の連続が3であるので000→3となる。この0〜3によって作られた数列を二値化することで符号化された1ビット信号の合計が計26ビットとなる。すると、圧縮率は26ビット/40ビットとなる。
【0077】
前記1ビット・オーディオ信号編集機4によって元の1ビット信号を例えば0101の繰り返しからなる40ビットのパターン信号に置換する。そして、ランレングス符号化すると、1のみからなる計20ビットの符号化された1ビット信号となる。よって、圧縮率は20ビット/40ビットとなり、圧縮率が向上できる。
【0078】
また、第1の実施の形態においては、”$96”というバイトパターンの連続であるミュート信号が使用されているが、圧縮記録技術のアルゴリズムに依っては前述した”1010”といった4ビット連続信号の方が圧縮率を向上させる場合もある。さらに、16進数表示で”$93”、2進数で”10010011”という1ビット・ミュートパターン信号を用いてもよい。
【0079】
次に、本発明の第2の実施の形態について図27及び図28を用いて説明する。この第2の実施の形態は、図27に示す構成のオーディオ信号記録装置60である。4チャンネルのアナログオーディオ信号をΔΣ変調して4チャンネルの1ビット・オーディオ信号を出力するΔΣ変調器61と、2チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成器62と、ΔΣ変調器61が出力した4チャンネルとミュートパターン生成器62が生成した2チャンネルの特定1ビット・ミュートパターン信号とを圧縮して記録する圧縮記録系63とを備えてなる。
【0080】
4チャンネル分のアナログオーディオ信号はΔΣ変調器61にて1ビット・オーディオ信号にΔΣ変調される。そのデータは、圧縮記録系63に送られるが、この圧縮記録系63は6チャンネル分のオーディオ信号をまとめて扱うように構成されている。残りの2チャンネル分は使用されていないわけだが、使用されていないチャンネルのデータに、ミュートパターン生成器62からの特定1ビット・ミュートパターン信号を使用する。後の1ビット・オーディオ信号は、続いて圧縮記録系63へ伝送され、情報の圧縮が図られる。圧縮記録系63は、既に図6〜図9を用いて説明したDSTによって情報を圧縮する。
【0081】
本来記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、6チャンネルの系に4チャンネルしか利用しないソースを応用する場合、2チャンネル分無音の余分で無駄なデータが増えることになる。ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系に伝送されるために、オーディオ帯域において無音部分であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要とされる。
【0082】
そこで、図27に示す構成のオーディオ信号記録装置60は、伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル(無音)を特定1ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0083】
利用されていないチャンネルを特定1ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する。(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せるとすると、その符号効率が良くなるのは自明である。)
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0084】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【0085】
なお、圧縮された信号を記録伝送する際に、サブ情報として本来の信号はどのチャンネルであるか、或いはどのチャンネルがこの系を通過する場合に付加されたミュート信号であるかを明示する情報を付加することによりユーザに対して本来のオーディオチャンネルを提示することができる。
【0086】
図28は、前記オーディオ信号記録装置60によって例えば光ディスクに記録されたマルチチャンネルオーディオ信号を再生するオーディオ信号再生装置65である。伸長再生系66を備えた構成である。この伸長再生系66は、前記図20に示したオーディオ信号再生装置50のFIRフィルタ、アンプが6チャンネル分ある構成である。
【0087】
この伸長再生系66としては構成が6チャンネル固定となっており、入力を再生すると本来の4チャンネル分のオーディオ信号と2チャンネル分のミュート信号が出力される。記録系での入力が6チャンネルの場合も同じ系を使用できるのでチャンネル数によって系を切り替える必要がない。従来チャンネル数を切り替えようとすると切り替わり遷移部において処理を変更する必要があることから、一旦、全チャンネルをミュートして処理が切り替わってからフェードインし再生をする。このため音切れが生じるが、第2の実施の形態ではチャンネル数が替わらないのでそのようなことは起こらない。
【0088】
ここで1ビット・オーディオ信号をDSTを用いて圧縮記録再生する第2の実施の形態では特定1ビット・ミュートパターン信号として、図13及び図15を用いて特性を説明した2進表示で“10010110”、16進表示で“$96”である1ビットパターン信号を用いる。また、上述した2進表示で“10010011”、16進表示で“$93”であるミュートパターンを用いても良いし、”1010”といった4ビット連続信号を用いてもよい。
【0089】
【発明の効果】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法は、アナログオーディオ信号をΔΣ変調された1ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、無音と推定される区間を特定の1ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送することにより圧縮率の向上を可能にする。このように、圧縮記録技術のアルゴリズムに依存した「音楽性に影響を与えない置き換え」による圧縮率向上の方法及び装置は、今後、記録メディアの発展に伴いその効果を発揮できる。
【0090】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法並びにオーディオ信号処理システムは、マルチチャンネルのアナログオーディオ信号をΔΣ変調された1ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、記録又は伝送するチャンネル数を一定とし、使用しないチャンネルの信号を無音である特定の1ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送し、圧縮再生系で再生する場合に系の処理の構成の簡素化を可能とする。
【図面の簡単な説明】
【図1】オーディオ信号処理装置の構成を示すブロック図である。
【図2】ΔΣ変調器の構成を示すブロック図である。
【図3】1ビット・オーディオ信号編集機の構成を示すブロック図である。
【図4】無音区間推定処理を示すフローチャートである。
【図5】1ビット・ミュートパターン置換&クロスフェード部の具体例を示すブロック図である。
【図6】DSTの構成図である。
【図7】DST処理を示すフローチャートである。
【図8】算術符号化を説明するための図である。
【図9】算術符号化と圧縮率向上の関係を示す図である。
【図10】映画の5.1チャンネルオーディオの各チャンネルを音声波形として表示した図である。
【図11】無音区間推定方法を説明するための図である。
【図12】1ビット・オーディオ信号編集機における編集画面を示す図である。
【図13】パターン$96の周波数成分分布図である。
【図14】無音と推定される区間のオーディオ帯域における周波数成分分布図である。
【図15】パターン$96のオーディオ帯域における周波数成分分布図である。
【図16】実験1,実験2を示すブロック図である。
【図17】実験1の結果を示す図である。
【図18】実験2の結果を示す図である。
【図19】オーディオ信号記録装置の構成を示すブロック図である。
【図20】オーディオ信号再生装置の構成を示すブロック図である。
【図21】ハフマン符号化を説明するための図である。
【図22】ハフマン符号木を示す図である。
【図23】ハフマン符号化により圧縮率が向上したことを説明するための図である。
【図24】出現率a:0.5、b:0.5より作成したハフマン符号木を示す図である。
【図25】ランレングス符号化を説明するための図である。
【図26】ランレングス符号化により圧縮率が向上したことを説明するための図である。
【図27】オーディオ信号記録装置の構成を示す図である。
【図28】オーディオ信号再生装置の構成を示す図である。
【図29】ITU−Rの勧告によるマルチチャンネル(5チャンネル)の標準的なスピーカ配置を示す図である。
【図30】ITU−Rの勧告によるマルチチャンネル(5.1チャンネル)の標準的なスピーカ配置を示す図である。
【符号の説明】
1 オーディオ信号処理装置、3 ΔΣ変調器、4 1ビット・オーディオ信号編集機、5 圧縮器、14 無音区間抽出部、15 1ビット・ミュートパターン置換&クロスフェード部
【発明の属する技術分野】
本発明は、オーディオ信号処理装置及びオーディオ信号処理方法に関し、特にΔΣ変調された1ビット・オーディオ信号を圧縮するオーディオ信号処理装置及びオーディオ信号処理方法、並びにオーディオ信号処理システムに関する。
【0002】
【従来の技術】
ΔΣ変調された高速1ビット・オーディオ信号は、従来のデジタルオーディオに使われてきたデータのフォーマット(例えばサンプリング周波数44.1kHz、データ語長16ビット)に比べて、非常に高いサンプリング周波数と短いデータ語長(例えばサンプリング周波数が44.1kHzの64倍でデータ語長が1ビット)であり、伝送可能周波数帯域が広いことを特長としている。また、ΔΣ変調により1ビット信号であっても、64倍というオーバーサンプリング周波数に対して低域であるオーディオ帯域において、高いダイナミックレンジをも確保できる。この特徴を生かして高音質のレコーダーやデータ伝送に応用することができる。
【0003】
ΔΣ変調回路自体はとりわけ新しい技術ではなく、回路構成がIC化に適していて、また比較的簡単にAD変換の精度を得ることができることから、従来からADコンバータの内部などでよく用いられている回路である。ΔΣ変調された信号は、簡単なアナログローパスフィルターを通すことによって、アナログオーディオ信号に戻すことができる。
【0004】
最近、前記ΔΣ変調に基づいたDSD(Direct Stream Digital )方式により生成された1ビット方式のオーディオストリームデータを記録しているスーパーオーディオコンパクトディスク(Super Audio Compact Disc 以下、SA−CDと記す)が知られるようになった。
【0005】
入力信号に対して64fsのオーバーサンプリング・ΔΣ変調を施すと1ビット・オーディオ信号が得られる。CD方式のシステムでは、その直後に1ビットの信号からマルチビットのPCM符号へのデシメーションが行われるが、DSD方式を採用した前記SA−CDでは前記1ビット・オーディオ信号を直接記録している。
【0006】
ところで、オーディオ記録/再生で用いられるチャンネル数としては、モノラル、ステレオ2チャンネルなどが古くからあるが、近年2チャンネルを越えるマルチチャンネルオーディオを記録/再生するオーディオアプリケーションが出現してきている。例えば、映画でよく使用されている5.1(6)チャンネルはもとより音楽用に4チャンネルなども用いられる。
【0007】
例えば、前記SA−CDでは、ディスク上に、通常2チャンネルステレオの他、最大6個の独立したオーディオチャンネルが規定されている。このため、5.1チャンネルのオーディオソースを格納可能である。これらの規格におけるマルチチャンネルのスピーカ位置の設定は、ITU−R(international telecommunications union radiocommunication sector)の勧告BS−775−1Multi−channel Stereophonic Sound System with and without Accompanying Pictureに基づいている。
【0008】
図29には、前記勧告によるマルチチャンネルの標準的なスピーカ配置を示す。聴取者Uに対するフロントの左L,右R、フロントのセンターC、サラウンドの左LS,サラウンドの右RSの5チャンネルの配置である。また、この5チャンネルの配置に、図30に示すように低域補正(Low Frequency Enhancement:LFE)を再生するサブウーハー(Sub Woofer:SW)スピーカを加えた5.1チャンネルの配置も標準的となっている。
【0009】
これら5.1チャンネルや、4チャンネルを含めて何種類かのチャンネル数をサポートする系の場合、それぞれに適合したソースを作成する記録装置、再生装置などが必要となりソースのチャンネル数によってその機能や回路を切り替えて運用する必要がある。
【0010】
【発明が解決しようとする課題】
ところで、オーディオソースをマルチチャンネルで記録媒体に記録するには、チャンネル数が多いだけ、モノラルや、ステレオ2チャンネルよりもデータ量が多くなってしまう。記録媒体としては、例えば磁気ディスク、光ディスク、光磁気ディスク、ディジタルオーディオテープ、半導体メモリ等がある。音楽用の4チャンネルを例にあげれば、圧縮率を同一とした場合、チャンネル数が多くなるほど一つの記録媒体への記録時間は短くなる。よって、アルバムであれば、曲数が少なくなる。
【0011】
マルチチャンネル用にΔΣ変調された1ビット・オーディオ信号をマルチチャンネルで圧縮記録する際にも、同様のことがいえる。これは、ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるために、オーディオ帯域において無音であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【0012】
また、チャンネル数を一定、例えば最大チャンネル数に固定したシステムの場合、チャンネル数が異なるオーディオアプリケーションをサポートできるが、特にそのソースの伝送系や記録容量が必要以上に増大してしまう。本来、記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、6チャンネルの系に4チャンネルしか利用しないソースを応用する場合、2チャンネル分無音の余分で無駄なデータが増えることになる。これも、ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるため、オーディオ帯域において無音であっても有声音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【0013】
本発明は、1ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、圧縮率をより向上させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【0014】
また、本発明は、1ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、構成を単純化させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【0015】
【課題を解決するための手段】
本発明に係るオーディオ信号処理装置は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調手段と、前記ΔΣ変調手段が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する編集手段と、前記編集手段が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮手段とを備える。
【0016】
本発明に係るオーディオ信号処理方法は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調工程と、前記ΔΣ変調工程が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力する編集工程と、前記編集工程が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮工程とを備える。
【0017】
ΔΣ変調された1ビット・オーディオ信号の信号波形を基に、無音と推定される区間を切り出し、その区間を特定1ビット・ミュートパターンに置き換え、区間の境目をクロスフェードさせた後、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0018】
ΔΣ変調後の1ビット・オーディオ信号の無音と推定される区間を切り出し、特定1ビット・ミュートパターン信号の連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せる。よって、その符号効率が良くなるのは自明である。)。
【0019】
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0020】
また、本発明に係るオーディオ信号処理装置は、前記課題を解決するために、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段とを備える。
【0021】
また、本発明に係るオーディオ信号処理方法は、前記課題を解決するために、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調工程と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成工程と、前記ΔΣ変調工程が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成工程が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮工程とを備える。
【0022】
また、本発明に係るオーディオ信号処理システムは、複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段と、前記圧縮手段が圧縮した1ビット信号を記録媒体に記録する記録手段と、前記記録手段によって記録媒体に記録された圧縮1ビット信号を伸長する伸長手段と、前記伸長手段によって伸長された1ビット信号をアナログ信号に変換する信号処理手段とを備える。
【0023】
伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル(無音)を特定1ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0024】
利用されていないチャンネルを特定1ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せるとすると、その符号効率が良くなるのは自明である。)。
【0025】
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0026】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【0027】
【発明の実施の形態】
以下、本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法のいくつかの実施の形態について図面を参照しながら説明する。
【0028】
第1の実施の形態は、2時間以上の映画のマルチチャンネルオーディオ(5.1チャンネル)を情報圧縮の対象とするオーディオ信号処理装置である。5.1チャンネルは、聴取者Uに対するフロントの左L,右R、フロントのセンターC、サラウンドの左LS,サラウンドの右RSの5チャンネルに、低域補正(Low Frequency Enhancement:LFE)チャンネルを加えた構成である。
【0029】
LFEは、低域補正という性質上、低域の音がないときには、無音と推定される区間が頻繁に存在する。詳細を後述するが、実際には全てのチャンネルの音声波形を基に、各チャンネル毎に無音と推定される区間を抽出し、例えば区間の長さ、多さ、さらに音質上問題が無いか否かを判定し、対象とするチャンネルを決定する。その結果、この第1の実施の形態では、LFEチャンネルを対象とする。
【0030】
図1において、オーディオ信号処理装置1は、入力端子2から入力されるアナログオーディオ信号にΔΣ変調を施すΔΣ変調器3と、ΔΣ変調器3が出力する1ビット・オーディオ信号Aに後述する編集処理を施して1ビット・オーディオ信号A’を出力する1ビット・オーディオ信号編集機4と、1ビット・オーディオ信号A’を圧縮する圧縮器5とを備えてなる。圧縮器5から出力される圧縮1ビット・オーディオ信号Cは、出力端子6から、例えば光ディスクへの記録系や、同軸ケーブル、あるいは光ファイバーケーブルなどの伝送路に導出される。
【0031】
ΔΣ変調器3は、例えばコンパクトディスクに対するデジタルデータの記録再生時に用いられているサンプリング周波数(Fs=44.1kHz)の64倍の64Fsを使ってアナログオーディオ信号をΔΣ変調し、1ビット・オーディオ信号を出力する。図2に示すように、入力端子7から入力されたアナログオーディオ信号は、加算器8を介して積分器9に供給される。この積分器9からの積分値は1ビット量子化器10に供給され、アナログオーディオ信号の中点電位と比較されて1サンプル期間毎に1ビット量子化処理される。この1ビット量子化処理により生成された1ビットオーディオ信号は、1サンプル遅延器11に供給されて1サンプル期間分遅延される。この遅延信号が加算器8に供給されて、上記アナログオーディオ信号に加算される。そして、加算器8の出力が積分器9、1ビット量子化器10を介して出力端子12から1ビット・オーディオ信号Aとして1ビット・オーディオ信号編集機4に導出される。
【0032】
1ビット・オーディオ信号編集機4は、ΔΣ変調器3が出力した1ビット・オーディオ信号Aの無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する。さらに、1ビット・オーディオ信号編集機4は、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【0033】
このため、1ビット・オーディオ信号編集機4は、図3に示すように、無音区間抽出部14と、1ビット・ミュートパターン置換&クロスフェード部15とを備えてなる。無音区間抽出部14は、ΔΣ変調器3から入力される1ビット・オーディイオ信号Aのうち無音と推定される区間を抽出し、無音区間の1ビット・オーディオ信号A’’として出力する。1ビット・ミュートパターン置換&クロスフェード部15は、無音と推定した区間(無音区間の1ビット・オーディオ信号A’’)を特定の1ビット・ミュートパターン信号に置き換える。無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【0034】
図4には、1ビット・オーディオ信号編集機4が無音区間抽出部14によって無音区間を抽出し、1ビット・ミュートパターン置換&クロスフェード部15によって所定の1ビット・ミュートパターン信号に置換する処理手順を示す。すなわち、ステップSIにて1ビット・オーディオ信号Aを入力すると、無音区間抽出部14では、ある短い一定時間の窓(Window)を設け、区間(x,x+1)におけるデータのレベル(Lebel)を検出する(ステップS1)。このレベルが所定のydB以下であるか否かをステップS2にて判定する。yは例えば−79dBや,−80dBである。ステップS2にてレベルがydB以下であると判定する(yes)とステップS3に進む。
【0035】
ステップS3では、前記区間(x,x+1)を、所定の1ビット・ミュートパターン信号に置き換える。ここで、無音と推定した区間を特定の1ビット・ミュートパターンに置き換えるときに、無音と推定されなかった区間との境目をクロスフェードする。
【0036】
図5には、クロスフェード処理を行うために必要な1ビット・ミュートパターン置換&クロスフェード部の具体的な構成を示す。無音区間抽出部14で抽出された無音区間の1ビット・オーディオ信号A’’は、制御部17に供給される。また、無音と推定されなかった区間の1ビット・オーディオ信号Aは、ディレイライン19に供給される。制御部17は、ミュートパターン発生部18にミュートパターン信号の発生タイミング制御信号を供給する。この発生タイミング制御信号を受けてミュートパターン発生部18は、所定の1ビット・ミュートパターン信号を発生し、置換・クロスフェード部20に供給する。置換・クロスフェード部20には、ディレイラインで、無音区間抽出処理時等のタイミングを合わせた1ビット・オーディオ信号Aが供給される。置換・クロスフェード部20は、制御部17から供給されるフェードタイミング制御信号に基づいて、前記1ビット・オーディオ信号A中の無音区間の1ビット・オーディオ信号A’’を、ミュートパターン発生部18からの1ビット・ミュートパターン信号に置き換える。このとき、置換・クロスフェード部20は、1ビット・ミュートパターン信号と、前記1ビット・オーディオ信号A中の無音と推定されなかった区間との境目をクロスフェードして、1ビット・オーディオ信号A’を出力する。
【0037】
ミュートパターン発生部18は、例えば$96パターンと呼ばれる「1,0,0,1,0,1,1,0」の繰り返しからなる、1ビット・ミュート信号パターンをリニアに発生している。この$96パターンについての詳細は後述する。置換・クロスフェード部20によるクロスフェードは、本件出願人が特開平9−307452号公報にて開示したディジタル信号処理方法に応じてなされる。簡単に説明すると、前記1ビット・オーディオ信号Aと、ミュートパターン発生部18によって生成される1ビット・ミュートパターン信号とのレベルを合わせてから複数サンプルにわたるパターンの一致を検出し、その検出結果に応じて切り換えるという技術である。
【0038】
前記ステップS3により、無音と推定されなかった区間の1ビット・オーディオ信号と、所定の1ビット・ミュートパターン信号は、クロスフェードされ、連続して出力される。次に、ステップS4にて、区間が2時間以上のオーディオデータの終了ENDになったか否かを判定し、ENDになった(yes)のであれば、ステップSOにて前記無音と推定されなかった区間の1ビット・オーディオ信号と、所定の1ビット・ミュートパターン信号とを連続的に出力する。
【0039】
ステップS4にてまだ前記区間が2時間以上のオーディオデータの終了ENDになっていない(no)と判定すれば、ステップS1〜ステップS3をステップS4にてyesと判定するまで繰り返す。
【0040】
図1に戻り、圧縮器5について説明する。圧縮器5は、1ビット・オーディオ信号編集機4が出力した1ビット・ミュートパターン信号を含む1ビットオーディオ信号A’を圧縮する。
【0041】
音声波形の符号化に予測符号化がある。オーディオ信号は、隣接標本間のみならず、さらに離れた点の間でも相関がある。その相関を利用して予測した値と実際の標本値との差を符号化する方法が予測符号化である。差は実際の標本値の分布に比べて変化範囲が小さくて済み、また予測の的中具合により生じる分布の偏りと共に符号化することで効率的な情報圧縮を図ることができる。この原理はデジタルオーディオ信号を圧縮記録する系において有用であり、またΔΣ変調された1ビット・オーディオ信号の圧縮記録系内においても用いられている。
【0042】
圧縮器5は、圧縮技術として、前記予測符号化の原理に基づいた「ダイレクトストリームトランスファー(以下DST)」を用いる。DSTとは、SA−CDにおける1ビット・オーディオ信号の圧縮に用いられているロスレスコーディング技術である(United States Patent No.6289306参照)。この技術は、前述の予測符号化の原理に基づいた予測フィルタと算術符号化から成り、予測フィルタ内で入力信号と予測値の差を取り、算術符号化でその差を分布の偏り、すなわち分布確率と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。そして、現在、この技術は前述したように、SA−CDにおける1ビット・オーディオ信号の圧縮技術として用いられるようになった。
【0043】
図6には、前記DSTを行う圧縮器5の構成を示す。1ビット・オーディオ信号編集機4を経た1ビット・オーディオ信号A’は、デジタル信号として扱われるためにデータ変換器22にて“0”となっていた信号を“−1”に直され、予測フィルタ23に供給される。予測フィルタ23は、常に次に続く標本値を予測する。予測フィルタ23からの予測結果Zは、1ビット量子化器24に供給される。1ビット量子化器24は、予測結果Zに基づいて“0”又は“1”を排他論理和(イクスクルーシブオアXOR)回路25に出力する。排他論理和回路25は、前記1ビット・オーディオ信号A’と、前記予測結果Zに基づいた1ビット量子化器24からの“0”又は“1”との排他論理和を出力する。予測フィルタ23による予測が当たれば排他論理和回路25からの出力が0となる。この予測の当たり具合は算術符号化器27にて確率情報として用いられる。算術符号化器27は、前記確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。
【0044】
予測フィルタ23は、指定回数分の遅延器310,311,312・・・31nと、係数乗算器320,321,322・・・32nの組み合わせと、各係数乗算器の合計出力を算出する加算器(Σ)33とから成る。予測フィルタ23の遅延器の数と、係数乗算器のフィルタ係数a0,a1,a2・・・anは、1ビット・オーディオ信号A’のフレーム単位毎に、DSTの結果として記録される。また、予測フィルタ23が出力した予測結果Zは、情報テーブル26へ記録される。
【0045】
1ビット量子化器24は、予測フィルタ23が出力した予測結果Zが0より小さければ“0”を、0以上であれば“1”を出力する。
【0046】
排他論理和回路25は、1ビット・オーディオ信号A’と、予測結果Zに基づいた1ビット量子化器24からの前記“0”又は“1”との排他論理和を出力する。1ビット・オーディオ信号A’の各0と1とが、前記“0”又は“1”と、それぞれ一致、つまり(0,0)又は(1,1)であれば「0」を出力する。また、この排他論理和回路25が「1]を出力するということは、(0,1)又は(1,0)であり、予測が外れたことを示す。
【0047】
したがって、算術符号化器27は、排他論理和回路25が出力する「0」又は「1」を見ることにより、あるインターバルにおける予測が外れた確率を予測の当たり具合として算出することができる。この予測が外れた確率値も確率情報として情報テーブル26に記録される。
【0048】
算術符号化器27は、前記確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。算術符号化器27は、前記差に相当する出力を、分布の偏り、すなわち分布確率に相当する確率情報と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化器27において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。
【0049】
図7には、圧縮器5が行うDST処理手順を示す。ステップSIにて1ビット・オーディオ信号A’が入力される。すると、ステップS11にてデータ変換器22は、“0”となっていた信号を“−1”に直し、“1“はそのまま“1”にする。ステップS12にて、予測フィルタ23は、常に次に続く標本値を予測する。このとき、予測フィルタ23の遅延器の数と、係数乗算器のフィルタ係数a0,a1,a2・・・anは、ソフトウェア上用いられるものであり、DSTの結果として、SA−CDに記録される。無音区間に置き換えられた1ビット・ミュートパターン信号は、パターンの繰り返しのため、音の急激な変化がなく、相関が強い。よって、予測しやすくなる。すなわち、当たり易くなり、遅延器の数を減少することができる。予測フィルタ23が出力した予測結果Zは、SA−CDの情報テーブル26にDSTの結果として記録される。
【0050】
ステップS13にて、1ビット量子化器24は、予測結果Zが0より小さければ“0”を、0以上であれば“1”を出力する。そして、ステップS14にて、排他論理和回路25は、1ビット・オーディオ信号A’と、予測結果Zに基づいた1ビット量子化器24からの前記“0”又は“1”との排他論理和を出力する。このとき、算術符号化器27は、排他論理和回路25が出力する「0」又は「1」を見ることにより、あるインターバルにおける予測が外れた確率を算出することができる。この予測が外れた確率値も情報テーブル26へ記録される。予測が当たれば当たるほど、前記予測が外れた確率値は低くなる。
【0051】
そして、ステップS15にて算術符号化器27は、確率情報算出部によって算出された確率情報と、排他論理和回路25からの出力(予測符号化の原理では「差」に相当する)とを算術符号化を用いて効率良く符号化する。この結果、ステップSOにて、DSTデータが出力されることになる。
【0052】
算術符号化の具体例について図8を参照しながら説明する。例えば、排他論理和回路25が、“0010001001”という合計10個の0と1を出力したとする。この排他論理和(XOR)の結果“0010001001”を算術符号化する例である。0は予測が当たったことを示し、1は外れたことを示している。
【0053】
先ず、0の確率は7/10であり、1の確率は3/10である。よって、(a)に示すように、1番目の0の分布確率は[0,7/10)、つまり0以上、7/10未満となる。次に、2番目の0は、(b)に示すように、(a)に示した7/10を1とした場合の7/10となり、その分布確率は[0,49/100)となる。次に、3番目の1は、(c)に示すように、(b)に示した49/100を1とした場合の3/10となり、その分布確率は[343/1000,49/100)となる。次に、4番目の0は、(d)に示すように、(c)に示した[343/1000,49/100)を1とした場合の7/10となり、その分布確率は[343/1000,3759/10000)となる。そして、(e)に示すように0の分布確率は、[x/1010,y/1010)となる。この算術符号化では、x/1010と、1の分布確率である3/10を結果として出力する。
【0054】
もし、予測フィルタによる予測が当たり、1の分布確率が低くなると、算術符号化は容易となる。例えば、排他論理和回路25が、“0000000000”という合計10個の0を出力したとする。0の確率は10/10であり、1の確率は0/10である。よって、図9に示すように、0の分布確率は、[10/10,0)となる。このため、算術符号化では、1010/1010=1と0(1の分布確率)を結果として出力するだけでよい。
【0055】
すなわち、圧縮器5は、DSTを行う場合、1ビット・ミュートパターン信号のような連続パターン信号が入力されることで、予測フィルタでの予測が容易になり、予測はより当たるようになる。すなわち、排他論理和からの出力として0の連続値が得られる。このことは、ある間隔において0の連続値を算術符号化することとなり、符号化効率が上がる。
【0056】
このように、DSTを採用した圧縮器5では、予測が当たる程、算術符号化が容易になり、出力すべき結果は単純なものとなる。よって例えば記録、又は伝送される全体の情報はより圧縮されることになる。
【0057】
次に、第1の実施の形態のオーディオ信号処理装置における具体的な処理例について説明する。
【0058】
図10は映画の5.1チャンネルオーディオの各チャンネルを音声波形として表示したものである。上からL、R、C、LFE、LS、RSとなっており、全体の音声分布が見渡せる。この音声波形を基に、各チャンネル毎に無音と推定される区間の抽出を行う。この音声波形を時間軸(横軸)方向とレベル(縦軸)方向にそれぞれ拡大すると、オーディオ帯域において無音部分と有音部分の境界を視覚的に推定することができる。その境界に挟まれた「無音と推定される区間」を図3に示した1ビット・オーディオ信号編集機4内の無音区間抽出部14で抽出する。
【0059】
もちろん、図11に示すように、1ビット・オーディオ信号の無音区間を波形レベルから推定し(1)、その推定無音区間を実際耳で聞き、無音であることを聴覚的に確認して(2)から、その無音区間を切り出し(3)てもよい。
【0060】
このような処理を全チャンネルに対して行った結果が図12であり、図3における1ビット・オーディオ信号A’’の状態を表す。この図12より、LFEは他のチャンネルと比べ、多くの区間が無音と推定されたことがわかる。
【0061】
続いてこの無音と推定された区間に、特定1ビット・ミュートパターン信号を割り当て、区間の境目を図5に示したような構成でクロスフェードさせる。第1の実施の形態では特定1ビット・ミュートパターン信号として、前述したように2進表示で”10010110”、16進表示で”$96”である1ビットパターン信号を用いる。
【0062】
この“$96”パターンについては、本件出願人による特開平9−153814号公報にて開示されている。以下に説明しておく。図13は、パターン”$96”の周波数成分分布図である。この周波数成分はFs×1/8、Fs×3/8であり、アナログ復調でローパスフィルタを通る際に除去される阻止周波数と一致する。よってこの区間を再生する際、無信号と同じ中点電圧(通常0V)であるアナログ信号を再生することになる。即ちその区間はデジタル的にミュートされたことになる。
【0063】
図14は無音と推定される区間のオーディオ帯域における周波数成分分布図、図15はパターン”$96”のオーディオ帯域における周波数成分分布図である。図14より、無音と推定される区間の20Hz〜20KHzの周波数成分は、その変化範囲が乏しくほぼ一定レベルであることが分かる。また、そのレベルは聴覚的に認識できない範囲にある。図15より、パターン”$96”の20Hz〜20KHzの周波数成分は存在せず、即ち聴覚的にも音は認識されない。よって、周波数成分の観点からみても、無音と推定される区間を”$96”の1ビット・ミュートパターン信号に置き換えるということは、音楽性に影響を与えない。
【0064】
このような1ビット・ミュートパターン信号である連続パターン信号が前記図6に示した構成のDSTを適用した圧縮器5に入力されることで、予測フィルタ23での予測が容易になり、予測はより当たるようになる。すなわち、排他論理和回路25からの出力として0の連続値が得られる。このことは、ある間隔において0の連続値を算術符号化部27にて算術符号化することとなり、図9を参照した原理にしたがって符号化効率が上がることとなる。
【0065】
次に、第1の実施の形態についての効果を、2種類の実験によって検証する。第1の実施の形態にかかるオーディオ信号処理装置1による実験を実験2とし、比較例としての実験1と比較する。実験1は、図16に示すように、ΔΣ変調された1ビット・オーディオ信号A(以下A)を1ビット・オーディオ信号編集機4に伝送せずに、圧縮器5に伝送し、1ビット・オーディオ信号B(以下B)を得る。実験2は、図16に示すように、ΔΣ変調された1ビット・オーディオ信号Aを1ビット・オーディオ編集機4に伝送し、前記図3〜図5を参照して説明した処理を施した後、圧縮器5に伝送し、1ビット・オーディオ信号C(以下C)を得る。
【0066】
図17には実験1の結果を、図18には実験2の結果を示す。実験1(比較例)の1ビット・オーディオ信号Aに対する1ビット・オーディオ信号Bの圧縮率(ゲイン=Gain)は、図17の「Gain information」に示すように平均(Average)が3.1142である。圧縮の比率は、A:B=1:1/Gain=1:1/3.1142となる。これに対して、実験2の1ビット・オーディオ信号Aに対する1ビット・オーディオ信号Cの圧縮率(ゲイン=Gain)は、図18の「Gain information」に示すように平均(Average)が3.5740である。圧縮比率は、A:B=1:1/Gain=1:1/3.5740となる。
【0067】
また、図17の「Byte information」において実験1の1ビット・オーディオ信号Aのデータサイズ(Databytes input)は17,310,941,712 bytesで、1ビット・オーディオ信号Bのデータサイズ(Databytes output)は5,558,853,428 bytesであった。これに対して、図18の「Byte information」において実験2の1ビット・オーディオ信号Aのデータサイズ(Databytes input)は17,310,941,712 bytesで、1ビット・オーディオ信号Cのデータサイズ(Databytes output)は4,843,700,513 bytesであった。
【0068】
以上より、実験2、すなわち本発明を施した結果の方が、圧縮率は向上した。因みにGain(圧縮率)3.5740という値は、1ビット・オーディオ信号の圧縮において有意義な値である。
【0069】
なお、第1の実施の形態は、図1に基本構成を示したように、1ビット・オーディオ信号編集機4が出力した1ビット・オーディオ信号A’を圧縮器5によって圧縮する構成のオーディオ信号処理装置1であった。圧縮器5によって圧縮されて出力された1ビット・オーディオ信号Cを図19に示すような記録系40にて例えば光ディスクに記録すればマルチチャンネルの光ディスク41を製造することができる。特に、2時間以上の映画のマルチチャンネルオーディオ(5.1チャンネル)を情報圧縮の対象として、上述したような構成で圧縮すれば、オーディオ部分の圧縮率を、音の品質は落とさず、つまり音楽性に影響を与えずに上げることができる。
【0070】
上記光ディスク41は、図20に示すような構成のオーディオ信号再生装置50によって再生することができる。なお、図20には1チャンネル分だけの構成を示すが、マルチチャンネルの場合には、後述するFIRフィルタ、アンプ、出力端子がチャンネル数だけ必要となる。
【0071】
図20において、光学ピックアップ51が読み出した1ビット・オーディオ信号Cは、RFアンプ52によって信号処理され、図19に示した圧縮器5にて行われるDSTに対応した伸長処理を行う伸長器53によって伸長される。伸長器53によって伸長された1ビット・オーディオ信号は、例えばFIRフィルタ54にてアナログオーディオ信号に変換され、アンプ55にて増幅された後、出力端子56から出力される。また、RFアンプ52からの出力信号はサーボ処理回路57に供給される。サーボ処理回路57によって生成されたサーボ用信号は、光学ピックアップ51をスレッド、フォーカス、トラッキングしたり、スピンドルモータによって光ディスク41を回転駆動する機構部58に供給される。
【0072】
なお、第1の実施の形態では、圧縮器内において、DSTを施す際に「圧縮パラメータ」と呼ばれるDSTの算術処理に用いる数値をチャンネル毎にカテゴリ化でき、相関の高いチャンネル同士に同じ「圧縮パラメータ」を与えることが可能であった。このカテゴリ化は圧縮率に影響を与えるが、どのようなカテゴリ化を用いても本発明の実施による圧縮率の向上は自明である。
【0073】
また、第1の実施の形態では、圧縮記録技術にDSTを用いたが、同様の方法はDST以外の圧縮記録技術にも適応可能である。
【0074】
例えば、ハフマン符号化やランレングス符号化を適応することができる。ハフマン符号化の具体例を図21〜図24を参照して説明する。図21において、合計40ビットである元の1ビット信号は4ビットづつに区切ってみると、「1010」というaパターンと、「1011」というbパターンと、「1100」というcパターンと、「1101」というdパターンに分けられる。そして、各パターンの出現率を計算すると、a:0.4、b:0.3、c:0.2、d:0.1となる。これらの出現率より図22のハフマン符号木を作成し、各記号に対する葉を作り、確率の最も小さい葉同士を枝で結ぶ。一方の枝に「0」、もう一方に「1」を割り当てる。節点に確率の和を書き、新たな葉とする。これを葉が一枚になるまで繰り返す。すると、aは”0”、bは”10”、cは”110”、dは”111”に符号化できる。これにより、符号化された1ビット信号は、計19ビットとなる。よって圧縮率は、19ビット/40ビットとなる。
【0075】
前記1ビット・オーディオ信号編集機4によって元の1ビット信号を例えば10101011という1ビットパターン信号に置換した後に、そのパターン信号をハフマン符号化すると、図23に示すように、計40ビットは「1010」というaパターンと、「1011」というbパターンに分けられる。出現率は、a:0.5、b:0.5となる。この出現率よりハフマン符号木を作成すると図24に示すようになる。すると、aは”0”に、bは”1”に符号化できる。これにより、符号化された1ビット信号は、計10ビットとなる。よって圧縮率は、10ビット/40ビットとなり、圧縮率が向上できる。
【0076】
ランレングス符号化は図25及び図26に示すように、連続の長さによる符号化である。40ビットからなる元の1ビット信号にあって、1は0の連続が0であるので1→0、01は0の連続が1であるので01→1、001は0の連続が2であるので001→2、000は0の連続が3であるので000→3となる。この0〜3によって作られた数列を二値化することで符号化された1ビット信号の合計が計26ビットとなる。すると、圧縮率は26ビット/40ビットとなる。
【0077】
前記1ビット・オーディオ信号編集機4によって元の1ビット信号を例えば0101の繰り返しからなる40ビットのパターン信号に置換する。そして、ランレングス符号化すると、1のみからなる計20ビットの符号化された1ビット信号となる。よって、圧縮率は20ビット/40ビットとなり、圧縮率が向上できる。
【0078】
また、第1の実施の形態においては、”$96”というバイトパターンの連続であるミュート信号が使用されているが、圧縮記録技術のアルゴリズムに依っては前述した”1010”といった4ビット連続信号の方が圧縮率を向上させる場合もある。さらに、16進数表示で”$93”、2進数で”10010011”という1ビット・ミュートパターン信号を用いてもよい。
【0079】
次に、本発明の第2の実施の形態について図27及び図28を用いて説明する。この第2の実施の形態は、図27に示す構成のオーディオ信号記録装置60である。4チャンネルのアナログオーディオ信号をΔΣ変調して4チャンネルの1ビット・オーディオ信号を出力するΔΣ変調器61と、2チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成器62と、ΔΣ変調器61が出力した4チャンネルとミュートパターン生成器62が生成した2チャンネルの特定1ビット・ミュートパターン信号とを圧縮して記録する圧縮記録系63とを備えてなる。
【0080】
4チャンネル分のアナログオーディオ信号はΔΣ変調器61にて1ビット・オーディオ信号にΔΣ変調される。そのデータは、圧縮記録系63に送られるが、この圧縮記録系63は6チャンネル分のオーディオ信号をまとめて扱うように構成されている。残りの2チャンネル分は使用されていないわけだが、使用されていないチャンネルのデータに、ミュートパターン生成器62からの特定1ビット・ミュートパターン信号を使用する。後の1ビット・オーディオ信号は、続いて圧縮記録系63へ伝送され、情報の圧縮が図られる。圧縮記録系63は、既に図6〜図9を用いて説明したDSTによって情報を圧縮する。
【0081】
本来記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、6チャンネルの系に4チャンネルしか利用しないソースを応用する場合、2チャンネル分無音の余分で無駄なデータが増えることになる。ΔΣ変調された1ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系に伝送されるために、オーディオ帯域において無音部分であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要とされる。
【0082】
そこで、図27に示す構成のオーディオ信号記録装置60は、伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル(無音)を特定1ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定1ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【0083】
利用されていないチャンネルを特定1ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する。(例えば、(1)「AECFDBAF・・・」と並んでいる信号を、(2)「ABABABAB・・・」と置き換えると、(2)に関する情報は「「AB」がx個」だけで済み、「ABx」と表せるとすると、その符号効率が良くなるのは自明である。)
またΔΣ変調された1ビット・オーディオ信号を予め特定1ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位(通常0V)であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【0084】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【0085】
なお、圧縮された信号を記録伝送する際に、サブ情報として本来の信号はどのチャンネルであるか、或いはどのチャンネルがこの系を通過する場合に付加されたミュート信号であるかを明示する情報を付加することによりユーザに対して本来のオーディオチャンネルを提示することができる。
【0086】
図28は、前記オーディオ信号記録装置60によって例えば光ディスクに記録されたマルチチャンネルオーディオ信号を再生するオーディオ信号再生装置65である。伸長再生系66を備えた構成である。この伸長再生系66は、前記図20に示したオーディオ信号再生装置50のFIRフィルタ、アンプが6チャンネル分ある構成である。
【0087】
この伸長再生系66としては構成が6チャンネル固定となっており、入力を再生すると本来の4チャンネル分のオーディオ信号と2チャンネル分のミュート信号が出力される。記録系での入力が6チャンネルの場合も同じ系を使用できるのでチャンネル数によって系を切り替える必要がない。従来チャンネル数を切り替えようとすると切り替わり遷移部において処理を変更する必要があることから、一旦、全チャンネルをミュートして処理が切り替わってからフェードインし再生をする。このため音切れが生じるが、第2の実施の形態ではチャンネル数が替わらないのでそのようなことは起こらない。
【0088】
ここで1ビット・オーディオ信号をDSTを用いて圧縮記録再生する第2の実施の形態では特定1ビット・ミュートパターン信号として、図13及び図15を用いて特性を説明した2進表示で“10010110”、16進表示で“$96”である1ビットパターン信号を用いる。また、上述した2進表示で“10010011”、16進表示で“$93”であるミュートパターンを用いても良いし、”1010”といった4ビット連続信号を用いてもよい。
【0089】
【発明の効果】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法は、アナログオーディオ信号をΔΣ変調された1ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、無音と推定される区間を特定の1ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送することにより圧縮率の向上を可能にする。このように、圧縮記録技術のアルゴリズムに依存した「音楽性に影響を与えない置き換え」による圧縮率向上の方法及び装置は、今後、記録メディアの発展に伴いその効果を発揮できる。
【0090】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法並びにオーディオ信号処理システムは、マルチチャンネルのアナログオーディオ信号をΔΣ変調された1ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、記録又は伝送するチャンネル数を一定とし、使用しないチャンネルの信号を無音である特定の1ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送し、圧縮再生系で再生する場合に系の処理の構成の簡素化を可能とする。
【図面の簡単な説明】
【図1】オーディオ信号処理装置の構成を示すブロック図である。
【図2】ΔΣ変調器の構成を示すブロック図である。
【図3】1ビット・オーディオ信号編集機の構成を示すブロック図である。
【図4】無音区間推定処理を示すフローチャートである。
【図5】1ビット・ミュートパターン置換&クロスフェード部の具体例を示すブロック図である。
【図6】DSTの構成図である。
【図7】DST処理を示すフローチャートである。
【図8】算術符号化を説明するための図である。
【図9】算術符号化と圧縮率向上の関係を示す図である。
【図10】映画の5.1チャンネルオーディオの各チャンネルを音声波形として表示した図である。
【図11】無音区間推定方法を説明するための図である。
【図12】1ビット・オーディオ信号編集機における編集画面を示す図である。
【図13】パターン$96の周波数成分分布図である。
【図14】無音と推定される区間のオーディオ帯域における周波数成分分布図である。
【図15】パターン$96のオーディオ帯域における周波数成分分布図である。
【図16】実験1,実験2を示すブロック図である。
【図17】実験1の結果を示す図である。
【図18】実験2の結果を示す図である。
【図19】オーディオ信号記録装置の構成を示すブロック図である。
【図20】オーディオ信号再生装置の構成を示すブロック図である。
【図21】ハフマン符号化を説明するための図である。
【図22】ハフマン符号木を示す図である。
【図23】ハフマン符号化により圧縮率が向上したことを説明するための図である。
【図24】出現率a:0.5、b:0.5より作成したハフマン符号木を示す図である。
【図25】ランレングス符号化を説明するための図である。
【図26】ランレングス符号化により圧縮率が向上したことを説明するための図である。
【図27】オーディオ信号記録装置の構成を示す図である。
【図28】オーディオ信号再生装置の構成を示す図である。
【図29】ITU−Rの勧告によるマルチチャンネル(5チャンネル)の標準的なスピーカ配置を示す図である。
【図30】ITU−Rの勧告によるマルチチャンネル(5.1チャンネル)の標準的なスピーカ配置を示す図である。
【符号の説明】
1 オーディオ信号処理装置、3 ΔΣ変調器、4 1ビット・オーディオ信号編集機、5 圧縮器、14 無音区間抽出部、15 1ビット・ミュートパターン置換&クロスフェード部
Claims (12)
- アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調手段と、
前記ΔΣ変調手段が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の1ビット・オーディオ信号と共に出力する編集手段と、
前記編集手段が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮手段と
を備えることを特徴とするオーディオ信号処理装置。 - 前記編集手段は、一定時間の窓を設定し、前記ΔΣ変調手段が出力した1ビット・オーディオ信号の所定区間におけるレベルが所定のレベル以下であるときにその区間を無音と推定し、特定の1ビット・ミュートパターン信号に置き換えることを特徴とする請求項1記載のオーディオ信号処理装置。
- 前記編集手段は、無音と推定した区間を特定の1ビット・ミュートパターン信号に置き換えるとき、前記無音と推定されなかった区間との境目をクロスフェードすることを特徴とする請求項1記載のオーディオ信号処理装置。
- 前記アナログオーディオ信号は複数m(mは2以上の整数)チャンネルの信号であり、前記ΔΣ変調手段は各チャンネル毎の1ビット・オーディオ信号を出力し、前記編集手段はいずれかのチャンネルの内の少なくとも一つのチャンネルの1ビット・オーディオ信号の無音区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力することを特徴とする請求項1記載のオーディオ信号処理装置。
- 前記圧縮手段が圧縮した1ビット信号を記録媒体に記録する記録手段をさらに備えることを特徴とする請求項1記載のオーディオ信号処理装置。
- アナログオーディオ信号をΔΣ変調して1ビット・オーディオ信号を出力するΔΣ変調工程と、
前記ΔΣ変調工程が出力した1ビット・オーディオ信号の無音と推定される区間を抽出し、特定の1ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力する編集工程と、
前記編集工程が出力した前記1ビット・ミュートパターン信号を含む1ビット・オーディオ信号を圧縮する圧縮工程と
を備えることを特徴とするオーディオ信号処理方法。 - 前記圧縮行程が圧縮した1ビット・オーディオ信号を記録媒体に記録する記録工程をさらに備えることを特徴とする請求項6記載のオーディオ信号処理方法。
- 複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、
複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、
前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段と
を備えることを特徴とするオーディオ信号処理装置。 - 前記圧縮手段が圧縮した1ビット信号を記録媒体に記録する記録手段をさらに備えることを特徴とする請求項8記載のオーディオ信号処理装置。
- 複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調工程と、
複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成工程と、
前記ΔΣ変調工程が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成工程が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮工程と
を備えることを特徴とするオーディオ信号処理方法。 - 前記圧縮工程が圧縮した1ビット信号を記録媒体に記録する記録工程をさらに備えることを特徴とする請求項10記載のオーディオ信号処理方法。
- 複数m(mは2以上の整数)チャンネルのアナログオーディオ信号をΔΣ変調してmチャンネルの1ビット・オーディオ信号を出力するΔΣ変調手段と、
複数n(nは1以上の整数)チャンネルの特定の1ビット・ミュートパターン信号を出力するミュートパターン生成手段と、
前記ΔΣ変調手段が出力したmチャンネルの1ビット・オーディオ信号と前記ミュートパターン生成手段が生成したnチャンネルの特定1ビット・ミュートパターン信号とを圧縮する圧縮手段と、
前記圧縮手段が圧縮した1ビット信号を記録媒体に記録する記録手段と、
前記記録手段によって記録媒体に記録された圧縮1ビット信号を伸長する伸長手段と、
前記伸長手段によって伸長された1ビット信号をアナログ信号に変換する信号処理手段と
を備えることを特徴とするオーディオ信号処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025236A JP2004233901A (ja) | 2003-01-31 | 2003-01-31 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025236A JP2004233901A (ja) | 2003-01-31 | 2003-01-31 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004233901A true JP2004233901A (ja) | 2004-08-19 |
Family
ID=32953563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003025236A Withdrawn JP2004233901A (ja) | 2003-01-31 | 2003-01-31 | オーディオ信号処理装置及びオーディオ信号処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004233901A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516963A (ja) * | 2005-11-18 | 2009-04-23 | クゥアルコム・インコーポレイテッド | 無線通信のためのディジタル送信機 |
-
2003
- 2003-01-31 JP JP2003025236A patent/JP2004233901A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516963A (ja) * | 2005-11-18 | 2009-04-23 | クゥアルコム・インコーポレイテッド | 無線通信のためのディジタル送信機 |
US8411788B2 (en) | 2005-11-18 | 2013-04-02 | Qualcomm, Incorporated | Digital transmitters for wireless communication |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3496411B2 (ja) | 情報符号化方法及び復号化装置 | |
US6314391B1 (en) | Information encoding method and apparatus, information decoding method and apparatus and information recording medium | |
JP3272438B2 (ja) | 信号処理システムおよび処理方法 | |
JP2000503510A (ja) | ライスエンコーダ/デコーダを用いるデータ圧縮/拡大 | |
WO2000021199A1 (fr) | Procede et dispositif de codage a compression sans perte, et procede et dispositif de decodage a compression sans perte | |
KR100682915B1 (ko) | 다채널 신호 부호화/복호화 방법 및 장치 | |
WO1994003988A2 (en) | Dithered digital signal processing system | |
JP2001134295A (ja) | 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体 | |
KR100601748B1 (ko) | 디지털 음성 데이터의 부호화 방법 및 복호화 방법 | |
JP2003143015A (ja) | 信号処理方法及び装置並びに符号列生成方法及び装置 | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
JP2004233901A (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
JP3776004B2 (ja) | ディジタルデータの符号化方法 | |
Knapen et al. | Lossless compression of 1-bit audio | |
JP2852862B2 (ja) | Pcmオーディオ信号の変換方法と装置 | |
JP3304739B2 (ja) | ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置 | |
JP2000148193A (ja) | 音声符号化装置、光記録媒体及び音声復号装置並びに音声伝送方法 | |
JPH1083623A (ja) | 信号記録方法、信号記録装置、記録媒体および信号処理方法 | |
JP4822697B2 (ja) | ディジタル信号符号化装置およびディジタル信号記録装置 | |
JP2006350132A (ja) | オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム | |
Ghido et al. | Accounting for companding nonlinearities in lossless audio compression | |
US6266368B1 (en) | Data compression/expansion on a plurality of digital information signals | |
JP2000347697A (ja) | 音声記録再生装置および記録媒体 | |
Janssen et al. | Lossless compression of one-bit audio | |
JP2816052B2 (ja) | オーディオデータ圧縮装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060404 |