JP2004233901A

JP2004233901A - オーディオ信号処理装置及びオーディオ信号処理方法

Info

Publication number: JP2004233901A
Application number: JP2003025236A
Authority: JP
Inventors: Yukiko Unno; 由紀子海野; Hajime Ichimura; 元市村; Yasuaki Sato; 康朗佐藤; Hideya Muraoka; 秀哉村岡; Tadao Suzuki; 忠男鈴木
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2003-01-31
Filing date: 2003-01-31
Publication date: 2004-08-19

Abstract

【課題】１ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、圧縮率をより向上させることができるオーディオ信号処理装置及びオーディオ信号処理方法を提供する。
【解決手段】１ビット・オーディオ信号編集機４は、ΔΣ変調器３が出力した１ビット・オーディオ信号Ａの無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の１ビット・オーディオ信号と共に出力する。さらに、１ビット・オーディオ信号編集機４は、無音と推定した区間を特定の１ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は、オーディオ信号処理装置及びオーディオ信号処理方法に関し、特にΔΣ変調された１ビット・オーディオ信号を圧縮するオーディオ信号処理装置及びオーディオ信号処理方法、並びにオーディオ信号処理システムに関する。
【０００２】
【従来の技術】
ΔΣ変調された高速１ビット・オーディオ信号は、従来のデジタルオーディオに使われてきたデータのフォーマット（例えばサンプリング周波数４４．１ｋＨｚ、データ語長１６ビット）に比べて、非常に高いサンプリング周波数と短いデータ語長（例えばサンプリング周波数が４４．１ｋＨｚの６４倍でデータ語長が１ビット）であり、伝送可能周波数帯域が広いことを特長としている。また、ΔΣ変調により１ビット信号であっても、６４倍というオーバーサンプリング周波数に対して低域であるオーディオ帯域において、高いダイナミックレンジをも確保できる。この特徴を生かして高音質のレコーダーやデータ伝送に応用することができる。
【０００３】
ΔΣ変調回路自体はとりわけ新しい技術ではなく、回路構成がＩＣ化に適していて、また比較的簡単にＡＤ変換の精度を得ることができることから、従来からＡＤコンバータの内部などでよく用いられている回路である。ΔΣ変調された信号は、簡単なアナログローパスフィルターを通すことによって、アナログオーディオ信号に戻すことができる。
【０００４】
最近、前記ΔΣ変調に基づいたＤＳＤ（ＤｉｒｅｃｔＳｔｒｅａｍＤｉｇｉｔａｌ）方式により生成された１ビット方式のオーディオストリームデータを記録しているスーパーオーディオコンパクトディスク（ＳｕｐｅｒＡｕｄｉｏＣｏｍｐａｃｔＤｉｓｃ以下、ＳＡ−ＣＤと記す）が知られるようになった。
【０００５】
入力信号に対して６４ｆｓのオーバーサンプリング・ΔΣ変調を施すと１ビット・オーディオ信号が得られる。ＣＤ方式のシステムでは、その直後に１ビットの信号からマルチビットのＰＣＭ符号へのデシメーションが行われるが、ＤＳＤ方式を採用した前記ＳＡ−ＣＤでは前記１ビット・オーディオ信号を直接記録している。
【０００６】
ところで、オーディオ記録／再生で用いられるチャンネル数としては、モノラル、ステレオ２チャンネルなどが古くからあるが、近年２チャンネルを越えるマルチチャンネルオーディオを記録／再生するオーディオアプリケーションが出現してきている。例えば、映画でよく使用されている５．１（６）チャンネルはもとより音楽用に４チャンネルなども用いられる。
【０００７】
例えば、前記ＳＡ−ＣＤでは、ディスク上に、通常２チャンネルステレオの他、最大６個の独立したオーディオチャンネルが規定されている。このため、５．１チャンネルのオーディオソースを格納可能である。これらの規格におけるマルチチャンネルのスピーカ位置の設定は、ＩＴＵ−Ｒ（ｉｎｔｅｒｎａｔｉｏｎａｌｔｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓｕｎｉｏｎｒａｄｉｏｃｏｍｍｕｎｉｃａｔｉｏｎｓｅｃｔｏｒ）の勧告ＢＳ−７７５−１Ｍｕｌｔｉ−ｃｈａｎｎｅｌＳｔｅｒｅｏｐｈｏｎｉｃＳｏｕｎｄＳｙｓｔｅｍｗｉｔｈａｎｄｗｉｔｈｏｕｔＡｃｃｏｍｐａｎｙｉｎｇＰｉｃｔｕｒｅに基づいている。
【０００８】
図２９には、前記勧告によるマルチチャンネルの標準的なスピーカ配置を示す。聴取者Ｕに対するフロントの左Ｌ，右Ｒ、フロントのセンターＣ、サラウンドの左ＬＳ，サラウンドの右ＲＳの５チャンネルの配置である。また、この５チャンネルの配置に、図３０に示すように低域補正（ＬｏｗＦｒｅｑｕｅｎｃｙＥｎｈａｎｃｅｍｅｎｔ：ＬＦＥ）を再生するサブウーハー（ＳｕｂＷｏｏｆｅｒ：ＳＷ）スピーカを加えた５．１チャンネルの配置も標準的となっている。
【０００９】
これら５．１チャンネルや、４チャンネルを含めて何種類かのチャンネル数をサポートする系の場合、それぞれに適合したソースを作成する記録装置、再生装置などが必要となりソースのチャンネル数によってその機能や回路を切り替えて運用する必要がある。
【００１０】
【発明が解決しようとする課題】
ところで、オーディオソースをマルチチャンネルで記録媒体に記録するには、チャンネル数が多いだけ、モノラルや、ステレオ２チャンネルよりもデータ量が多くなってしまう。記録媒体としては、例えば磁気ディスク、光ディスク、光磁気ディスク、ディジタルオーディオテープ、半導体メモリ等がある。音楽用の４チャンネルを例にあげれば、圧縮率を同一とした場合、チャンネル数が多くなるほど一つの記録媒体への記録時間は短くなる。よって、アルバムであれば、曲数が少なくなる。
【００１１】
マルチチャンネル用にΔΣ変調された１ビット・オーディオ信号をマルチチャンネルで圧縮記録する際にも、同様のことがいえる。これは、ΔΣ変調された１ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるために、オーディオ帯域において無音であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【００１２】
また、チャンネル数を一定、例えば最大チャンネル数に固定したシステムの場合、チャンネル数が異なるオーディオアプリケーションをサポートできるが、特にそのソースの伝送系や記録容量が必要以上に増大してしまう。本来、記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、６チャンネルの系に４チャンネルしか利用しないソースを応用する場合、２チャンネル分無音の余分で無駄なデータが増えることになる。これも、ΔΣ変調された１ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系内に伝送されるため、オーディオ帯域において無音であっても有声音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要となるためである。
【００１３】
本発明は、１ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、圧縮率をより向上させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【００１４】
また、本発明は、１ビット・オーディオ信号の圧縮系において、系内で用いられている圧縮技術のアルゴリズムを踏まえて、構成を単純化させることができるオーディオ信号処理装置及びオーディオ信号処理方法の提供を目的とする。
【００１５】
【課題を解決するための手段】
本発明に係るオーディオ信号処理装置は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して１ビット・オーディオ信号を出力するΔΣ変調手段と、前記ΔΣ変調手段が出力した１ビット・オーディオ信号の無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の１ビット・オーディオ信号と共に出力する編集手段と、前記編集手段が出力した前記１ビット・ミュートパターン信号を含む１ビット・オーディオ信号を圧縮する圧縮手段とを備える。
【００１６】
本発明に係るオーディオ信号処理方法は、前記課題を解決するために、アナログオーディオ信号をΔΣ変調して１ビット・オーディオ信号を出力するΔΣ変調工程と、前記ΔΣ変調工程が出力した１ビット・オーディオ信号の無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力する編集工程と、前記編集工程が出力した前記１ビット・ミュートパターン信号を含む１ビット・オーディオ信号を圧縮する圧縮工程とを備える。
【００１７】
ΔΣ変調された１ビット・オーディオ信号の信号波形を基に、無音と推定される区間を切り出し、その区間を特定１ビット・ミュートパターンに置き換え、区間の境目をクロスフェードさせた後、圧縮系へ伝送する。この特定１ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【００１８】
ΔΣ変調後の１ビット・オーディオ信号の無音と推定される区間を切り出し、特定１ビット・ミュートパターン信号の連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する（例えば、（１）「ＡＥＣＦＤＢＡＦ・・・」と並んでいる信号を、（２）「ＡＢＡＢＡＢＡＢ・・・」と置き換えると、（２）に関する情報は「「ＡＢ」がｘ個」だけで済み、「ＡＢｘ」と表せる。よって、その符号効率が良くなるのは自明である。）。
【００１９】
またΔΣ変調された１ビット・オーディオ信号を予め特定１ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位（通常０Ｖ）であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【００２０】
また、本発明に係るオーディオ信号処理装置は、前記課題を解決するために、複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調手段と、複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成手段が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮手段とを備える。
【００２１】
また、本発明に係るオーディオ信号処理方法は、前記課題を解決するために、複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調工程と、複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成工程と、前記ΔΣ変調工程が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成工程が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮工程とを備える。
【００２２】
また、本発明に係るオーディオ信号処理システムは、複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調手段と、複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成手段と、前記ΔΣ変調手段が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成手段が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮手段と、前記圧縮手段が圧縮した１ビット信号を記録媒体に記録する記録手段と、前記記録手段によって記録媒体に記録された圧縮１ビット信号を伸長する伸長手段と、前記伸長手段によって伸長された１ビット信号をアナログ信号に変換する信号処理手段とを備える。
【００２３】
伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル（無音）を特定１ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定１ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【００２４】
利用されていないチャンネルを特定１ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する（例えば、（１）「ＡＥＣＦＤＢＡＦ・・・」と並んでいる信号を、（２）「ＡＢＡＢＡＢＡＢ・・・」と置き換えると、（２）に関する情報は「「ＡＢ」がｘ個」だけで済み、「ＡＢｘ」と表せるとすると、その符号効率が良くなるのは自明である。）。
【００２５】
またΔΣ変調された１ビット・オーディオ信号を予め特定１ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位（通常０Ｖ）であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【００２６】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【００２７】
【発明の実施の形態】
以下、本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法のいくつかの実施の形態について図面を参照しながら説明する。
【００２８】
第１の実施の形態は、２時間以上の映画のマルチチャンネルオーディオ（５．１チャンネル）を情報圧縮の対象とするオーディオ信号処理装置である。５．１チャンネルは、聴取者Ｕに対するフロントの左Ｌ，右Ｒ、フロントのセンターＣ、サラウンドの左ＬＳ，サラウンドの右ＲＳの５チャンネルに、低域補正（ＬｏｗＦｒｅｑｕｅｎｃｙＥｎｈａｎｃｅｍｅｎｔ：ＬＦＥ）チャンネルを加えた構成である。
【００２９】
ＬＦＥは、低域補正という性質上、低域の音がないときには、無音と推定される区間が頻繁に存在する。詳細を後述するが、実際には全てのチャンネルの音声波形を基に、各チャンネル毎に無音と推定される区間を抽出し、例えば区間の長さ、多さ、さらに音質上問題が無いか否かを判定し、対象とするチャンネルを決定する。その結果、この第１の実施の形態では、ＬＦＥチャンネルを対象とする。
【００３０】
図１において、オーディオ信号処理装置１は、入力端子２から入力されるアナログオーディオ信号にΔΣ変調を施すΔΣ変調器３と、ΔΣ変調器３が出力する１ビット・オーディオ信号Ａに後述する編集処理を施して１ビット・オーディオ信号Ａ’を出力する１ビット・オーディオ信号編集機４と、１ビット・オーディオ信号Ａ’を圧縮する圧縮器５とを備えてなる。圧縮器５から出力される圧縮１ビット・オーディオ信号Ｃは、出力端子６から、例えば光ディスクへの記録系や、同軸ケーブル、あるいは光ファイバーケーブルなどの伝送路に導出される。
【００３１】
ΔΣ変調器３は、例えばコンパクトディスクに対するデジタルデータの記録再生時に用いられているサンプリング周波数（Ｆｓ＝４４．１ｋＨｚ）の６４倍の６４Ｆｓを使ってアナログオーディオ信号をΔΣ変調し、１ビット・オーディオ信号を出力する。図２に示すように、入力端子７から入力されたアナログオーディオ信号は、加算器８を介して積分器９に供給される。この積分器９からの積分値は１ビット量子化器１０に供給され、アナログオーディオ信号の中点電位と比較されて１サンプル期間毎に１ビット量子化処理される。この１ビット量子化処理により生成された１ビットオーディオ信号は、１サンプル遅延器１１に供給されて１サンプル期間分遅延される。この遅延信号が加算器８に供給されて、上記アナログオーディオ信号に加算される。そして、加算器８の出力が積分器９、１ビット量子化器１０を介して出力端子１２から１ビット・オーディオ信号Ａとして１ビット・オーディオ信号編集機４に導出される。
【００３２】
１ビット・オーディオ信号編集機４は、ΔΣ変調器３が出力した１ビット・オーディオ信号Ａの無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の１ビット・オーディオ信号と共に出力する。さらに、１ビット・オーディオ信号編集機４は、無音と推定した区間を特定の１ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【００３３】
このため、１ビット・オーディオ信号編集機４は、図３に示すように、無音区間抽出部１４と、１ビット・ミュートパターン置換＆クロスフェード部１５とを備えてなる。無音区間抽出部１４は、ΔΣ変調器３から入力される１ビット・オーディイオ信号Ａのうち無音と推定される区間を抽出し、無音区間の１ビット・オーディオ信号Ａ’’として出力する。１ビット・ミュートパターン置換＆クロスフェード部１５は、無音と推定した区間（無音区間の１ビット・オーディオ信号Ａ’’）を特定の１ビット・ミュートパターン信号に置き換える。無音と推定した区間を特定の１ビット・ミュートパターンに置き換えるとき、無音と推定されなかった区間との境目をクロスフェードする。
【００３４】
図４には、１ビット・オーディオ信号編集機４が無音区間抽出部１４によって無音区間を抽出し、１ビット・ミュートパターン置換＆クロスフェード部１５によって所定の１ビット・ミュートパターン信号に置換する処理手順を示す。すなわち、ステップＳＩにて１ビット・オーディオ信号Ａを入力すると、無音区間抽出部１４では、ある短い一定時間の窓（Ｗｉｎｄｏｗ）を設け、区間（ｘ，ｘ＋１）におけるデータのレベル（Ｌｅｂｅｌ）を検出する（ステップＳ１）。このレベルが所定のｙｄＢ以下であるか否かをステップＳ２にて判定する。ｙは例えば−７９ｄＢや，−８０ｄＢである。ステップＳ２にてレベルがｙｄＢ以下であると判定する（ｙｅｓ）とステップＳ３に進む。
【００３５】
ステップＳ３では、前記区間（ｘ，ｘ＋１）を、所定の１ビット・ミュートパターン信号に置き換える。ここで、無音と推定した区間を特定の１ビット・ミュートパターンに置き換えるときに、無音と推定されなかった区間との境目をクロスフェードする。
【００３６】
図５には、クロスフェード処理を行うために必要な１ビット・ミュートパターン置換＆クロスフェード部の具体的な構成を示す。無音区間抽出部１４で抽出された無音区間の１ビット・オーディオ信号Ａ’’は、制御部１７に供給される。また、無音と推定されなかった区間の１ビット・オーディオ信号Ａは、ディレイライン１９に供給される。制御部１７は、ミュートパターン発生部１８にミュートパターン信号の発生タイミング制御信号を供給する。この発生タイミング制御信号を受けてミュートパターン発生部１８は、所定の１ビット・ミュートパターン信号を発生し、置換・クロスフェード部２０に供給する。置換・クロスフェード部２０には、ディレイラインで、無音区間抽出処理時等のタイミングを合わせた１ビット・オーディオ信号Ａが供給される。置換・クロスフェード部２０は、制御部１７から供給されるフェードタイミング制御信号に基づいて、前記１ビット・オーディオ信号Ａ中の無音区間の１ビット・オーディオ信号Ａ’’を、ミュートパターン発生部１８からの１ビット・ミュートパターン信号に置き換える。このとき、置換・クロスフェード部２０は、１ビット・ミュートパターン信号と、前記１ビット・オーディオ信号Ａ中の無音と推定されなかった区間との境目をクロスフェードして、１ビット・オーディオ信号Ａ’を出力する。
【００３７】
ミュートパターン発生部１８は、例えば＄９６パターンと呼ばれる「１，０，０，１，０，１，１，０」の繰り返しからなる、１ビット・ミュート信号パターンをリニアに発生している。この＄９６パターンについての詳細は後述する。置換・クロスフェード部２０によるクロスフェードは、本件出願人が特開平９−３０７４５２号公報にて開示したディジタル信号処理方法に応じてなされる。簡単に説明すると、前記１ビット・オーディオ信号Ａと、ミュートパターン発生部１８によって生成される１ビット・ミュートパターン信号とのレベルを合わせてから複数サンプルにわたるパターンの一致を検出し、その検出結果に応じて切り換えるという技術である。
【００３８】
前記ステップＳ３により、無音と推定されなかった区間の１ビット・オーディオ信号と、所定の１ビット・ミュートパターン信号は、クロスフェードされ、連続して出力される。次に、ステップＳ４にて、区間が２時間以上のオーディオデータの終了ＥＮＤになったか否かを判定し、ＥＮＤになった（ｙｅｓ）のであれば、ステップＳＯにて前記無音と推定されなかった区間の１ビット・オーディオ信号と、所定の１ビット・ミュートパターン信号とを連続的に出力する。
【００３９】
ステップＳ４にてまだ前記区間が２時間以上のオーディオデータの終了ＥＮＤになっていない（ｎｏ）と判定すれば、ステップＳ１〜ステップＳ３をステップＳ４にてｙｅｓと判定するまで繰り返す。
【００４０】
図１に戻り、圧縮器５について説明する。圧縮器５は、１ビット・オーディオ信号編集機４が出力した１ビット・ミュートパターン信号を含む１ビットオーディオ信号Ａ’を圧縮する。
【００４１】
音声波形の符号化に予測符号化がある。オーディオ信号は、隣接標本間のみならず、さらに離れた点の間でも相関がある。その相関を利用して予測した値と実際の標本値との差を符号化する方法が予測符号化である。差は実際の標本値の分布に比べて変化範囲が小さくて済み、また予測の的中具合により生じる分布の偏りと共に符号化することで効率的な情報圧縮を図ることができる。この原理はデジタルオーディオ信号を圧縮記録する系において有用であり、またΔΣ変調された１ビット・オーディオ信号の圧縮記録系内においても用いられている。
【００４２】
圧縮器５は、圧縮技術として、前記予測符号化の原理に基づいた「ダイレクトストリームトランスファー（以下ＤＳＴ）」を用いる。ＤＳＴとは、ＳＡ−ＣＤにおける１ビット・オーディオ信号の圧縮に用いられているロスレスコーディング技術である（ＵｎｉｔｅｄＳｔａｔｅｓＰａｔｅｎｔＮｏ．６２８９３０６参照）。この技術は、前述の予測符号化の原理に基づいた予測フィルタと算術符号化から成り、予測フィルタ内で入力信号と予測値の差を取り、算術符号化でその差を分布の偏り、すなわち分布確率と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。そして、現在、この技術は前述したように、ＳＡ−ＣＤにおける１ビット・オーディオ信号の圧縮技術として用いられるようになった。
【００４３】
図６には、前記ＤＳＴを行う圧縮器５の構成を示す。１ビット・オーディオ信号編集機４を経た１ビット・オーディオ信号Ａ’は、デジタル信号として扱われるためにデータ変換器２２にて“０”となっていた信号を“−１”に直され、予測フィルタ２３に供給される。予測フィルタ２３は、常に次に続く標本値を予測する。予測フィルタ２３からの予測結果Ｚは、１ビット量子化器２４に供給される。１ビット量子化器２４は、予測結果Ｚに基づいて“０”又は“１”を排他論理和（イクスクルーシブオアＸＯＲ）回路２５に出力する。排他論理和回路２５は、前記１ビット・オーディオ信号Ａ’と、前記予測結果Ｚに基づいた１ビット量子化器２４からの“０”又は“１”との排他論理和を出力する。予測フィルタ２３による予測が当たれば排他論理和回路２５からの出力が０となる。この予測の当たり具合は算術符号化器２７にて確率情報として用いられる。算術符号化器２７は、前記確率情報と、排他論理和回路２５からの出力（予測符号化の原理では「差」に相当する）とを算術符号化を用いて効率良く符号化する。
【００４４】
予測フィルタ２３は、指定回数分の遅延器３１_０，３１_１，３１_２・・・３１_ｎと、係数乗算器３２_０，３２_１，３２_２・・・３２_ｎの組み合わせと、各係数乗算器の合計出力を算出する加算器（Σ）３３とから成る。予測フィルタ２３の遅延器の数と、係数乗算器のフィルタ係数ａ_０，ａ_１，ａ_２・・・ａ_ｎは、１ビット・オーディオ信号Ａ’のフレーム単位毎に、ＤＳＴの結果として記録される。また、予測フィルタ２３が出力した予測結果Ｚは、情報テーブル２６へ記録される。
【００４５】
１ビット量子化器２４は、予測フィルタ２３が出力した予測結果Ｚが０より小さければ“０”を、０以上であれば“１”を出力する。
【００４６】
排他論理和回路２５は、１ビット・オーディオ信号Ａ’と、予測結果Ｚに基づいた１ビット量子化器２４からの前記“０”又は“１”との排他論理和を出力する。１ビット・オーディオ信号Ａ’の各０と１とが、前記“０”又は“１”と、それぞれ一致、つまり（０，０）又は（１，１）であれば「０」を出力する。また、この排他論理和回路２５が「１］を出力するということは、（０，１）又は（１，０）であり、予測が外れたことを示す。
【００４７】
したがって、算術符号化器２７は、排他論理和回路２５が出力する「０」又は「１」を見ることにより、あるインターバルにおける予測が外れた確率を予測の当たり具合として算出することができる。この予測が外れた確率値も確率情報として情報テーブル２６に記録される。
【００４８】
算術符号化器２７は、前記確率情報と、排他論理和回路２５からの出力（予測符号化の原理では「差」に相当する）とを算術符号化を用いて効率良く符号化する。算術符号化器２７は、前記差に相当する出力を、分布の偏り、すなわち分布確率に相当する確率情報と共に符号化する。予測フィルタ内における予測の当たり具合により、差の分布確率が決まることから、予測は当たれば当たるほどその差に対して高い確率を与えることができる。続いて算術符号化器２７において、ある区間の差をその区間における差の分布確率を用いて算術符号化することにより、その区間の差は圧縮された符号となる。
【００４９】
図７には、圧縮器５が行うＤＳＴ処理手順を示す。ステップＳＩにて１ビット・オーディオ信号Ａ’が入力される。すると、ステップＳ１１にてデータ変換器２２は、“０”となっていた信号を“−１”に直し、“１“はそのまま“１”にする。ステップＳ１２にて、予測フィルタ２３は、常に次に続く標本値を予測する。このとき、予測フィルタ２３の遅延器の数と、係数乗算器のフィルタ係数ａ_０，ａ_１，ａ_２・・・ａ_ｎは、ソフトウェア上用いられるものであり、ＤＳＴの結果として、ＳＡ−ＣＤに記録される。無音区間に置き換えられた１ビット・ミュートパターン信号は、パターンの繰り返しのため、音の急激な変化がなく、相関が強い。よって、予測しやすくなる。すなわち、当たり易くなり、遅延器の数を減少することができる。予測フィルタ２３が出力した予測結果Ｚは、ＳＡ−ＣＤの情報テーブル２６にＤＳＴの結果として記録される。
【００５０】
ステップＳ１３にて、１ビット量子化器２４は、予測結果Ｚが０より小さければ“０”を、０以上であれば“１”を出力する。そして、ステップＳ１４にて、排他論理和回路２５は、１ビット・オーディオ信号Ａ’と、予測結果Ｚに基づいた１ビット量子化器２４からの前記“０”又は“１”との排他論理和を出力する。このとき、算術符号化器２７は、排他論理和回路２５が出力する「０」又は「１」を見ることにより、あるインターバルにおける予測が外れた確率を算出することができる。この予測が外れた確率値も情報テーブル２６へ記録される。予測が当たれば当たるほど、前記予測が外れた確率値は低くなる。
【００５１】
そして、ステップＳ１５にて算術符号化器２７は、確率情報算出部によって算出された確率情報と、排他論理和回路２５からの出力（予測符号化の原理では「差」に相当する）とを算術符号化を用いて効率良く符号化する。この結果、ステップＳＯにて、ＤＳＴデータが出力されることになる。
【００５２】
算術符号化の具体例について図８を参照しながら説明する。例えば、排他論理和回路２５が、“００１０００１００１”という合計１０個の０と１を出力したとする。この排他論理和（ＸＯＲ）の結果“００１０００１００１”を算術符号化する例である。０は予測が当たったことを示し、１は外れたことを示している。
【００５３】
先ず、０の確率は７／１０であり、１の確率は３／１０である。よって、（ａ）に示すように、１番目の０の分布確率は［０，７／１０）、つまり０以上、７／１０未満となる。次に、２番目の０は、（ｂ）に示すように、（ａ）に示した７／１０を１とした場合の７／１０となり、その分布確率は［０，４９／１００）となる。次に、３番目の１は、（ｃ）に示すように、（ｂ）に示した４９／１００を１とした場合の３／１０となり、その分布確率は［３４３／１０００，４９／１００）となる。次に、４番目の０は、（ｄ）に示すように、（ｃ）に示した［３４３／１０００，４９／１００）を１とした場合の７／１０となり、その分布確率は［３４３／１０００，３７５９／１００００）となる。そして、（ｅ）に示すように０の分布確率は、［ｘ／１０^１０，ｙ／１０^１０）となる。この算術符号化では、ｘ／１０^１０と、１の分布確率である３／１０を結果として出力する。
【００５４】
もし、予測フィルタによる予測が当たり、１の分布確率が低くなると、算術符号化は容易となる。例えば、排他論理和回路２５が、“００００００００００”という合計１０個の０を出力したとする。０の確率は１０／１０であり、１の確率は０／１０である。よって、図９に示すように、０の分布確率は、［１０／１０，０）となる。このため、算術符号化では、１０^１０／１０^１０＝１と０（１の分布確率）を結果として出力するだけでよい。
【００５５】
すなわち、圧縮器５は、ＤＳＴを行う場合、１ビット・ミュートパターン信号のような連続パターン信号が入力されることで、予測フィルタでの予測が容易になり、予測はより当たるようになる。すなわち、排他論理和からの出力として０の連続値が得られる。このことは、ある間隔において０の連続値を算術符号化することとなり、符号化効率が上がる。
【００５６】
このように、ＤＳＴを採用した圧縮器５では、予測が当たる程、算術符号化が容易になり、出力すべき結果は単純なものとなる。よって例えば記録、又は伝送される全体の情報はより圧縮されることになる。
【００５７】
次に、第１の実施の形態のオーディオ信号処理装置における具体的な処理例について説明する。
【００５８】
図１０は映画の５．１チャンネルオーディオの各チャンネルを音声波形として表示したものである。上からＬ、Ｒ、Ｃ、ＬＦＥ、ＬＳ、ＲＳとなっており、全体の音声分布が見渡せる。この音声波形を基に、各チャンネル毎に無音と推定される区間の抽出を行う。この音声波形を時間軸（横軸）方向とレベル（縦軸）方向にそれぞれ拡大すると、オーディオ帯域において無音部分と有音部分の境界を視覚的に推定することができる。その境界に挟まれた「無音と推定される区間」を図３に示した１ビット・オーディオ信号編集機４内の無音区間抽出部１４で抽出する。
【００５９】
もちろん、図１１に示すように、１ビット・オーディオ信号の無音区間を波形レベルから推定し（１）、その推定無音区間を実際耳で聞き、無音であることを聴覚的に確認して（２）から、その無音区間を切り出し（３）てもよい。
【００６０】
このような処理を全チャンネルに対して行った結果が図１２であり、図３における１ビット・オーディオ信号Ａ’’の状態を表す。この図１２より、ＬＦＥは他のチャンネルと比べ、多くの区間が無音と推定されたことがわかる。
【００６１】
続いてこの無音と推定された区間に、特定１ビット・ミュートパターン信号を割り当て、区間の境目を図５に示したような構成でクロスフェードさせる。第１の実施の形態では特定１ビット・ミュートパターン信号として、前述したように２進表示で”１００１０１１０”、１６進表示で”＄９６”である１ビットパターン信号を用いる。
【００６２】
この“＄９６”パターンについては、本件出願人による特開平９−１５３８１４号公報にて開示されている。以下に説明しておく。図１３は、パターン”＄９６”の周波数成分分布図である。この周波数成分はＦｓ×１／８、Ｆｓ×３／８であり、アナログ復調でローパスフィルタを通る際に除去される阻止周波数と一致する。よってこの区間を再生する際、無信号と同じ中点電圧（通常０Ｖ）であるアナログ信号を再生することになる。即ちその区間はデジタル的にミュートされたことになる。
【００６３】
図１４は無音と推定される区間のオーディオ帯域における周波数成分分布図、図１５はパターン”＄９６”のオーディオ帯域における周波数成分分布図である。図１４より、無音と推定される区間の２０Ｈｚ〜２０ＫＨｚの周波数成分は、その変化範囲が乏しくほぼ一定レベルであることが分かる。また、そのレベルは聴覚的に認識できない範囲にある。図１５より、パターン”＄９６”の２０Ｈｚ〜２０ＫＨｚの周波数成分は存在せず、即ち聴覚的にも音は認識されない。よって、周波数成分の観点からみても、無音と推定される区間を”＄９６”の１ビット・ミュートパターン信号に置き換えるということは、音楽性に影響を与えない。
【００６４】
このような１ビット・ミュートパターン信号である連続パターン信号が前記図６に示した構成のＤＳＴを適用した圧縮器５に入力されることで、予測フィルタ２３での予測が容易になり、予測はより当たるようになる。すなわち、排他論理和回路２５からの出力として０の連続値が得られる。このことは、ある間隔において０の連続値を算術符号化部２７にて算術符号化することとなり、図９を参照した原理にしたがって符号化効率が上がることとなる。
【００６５】
次に、第１の実施の形態についての効果を、２種類の実験によって検証する。第１の実施の形態にかかるオーディオ信号処理装置１による実験を実験２とし、比較例としての実験１と比較する。実験１は、図１６に示すように、ΔΣ変調された１ビット・オーディオ信号Ａ（以下Ａ）を１ビット・オーディオ信号編集機４に伝送せずに、圧縮器５に伝送し、１ビット・オーディオ信号Ｂ（以下Ｂ）を得る。実験２は、図１６に示すように、ΔΣ変調された１ビット・オーディオ信号Ａを１ビット・オーディオ編集機４に伝送し、前記図３〜図５を参照して説明した処理を施した後、圧縮器５に伝送し、１ビット・オーディオ信号Ｃ（以下Ｃ）を得る。
【００６６】
図１７には実験１の結果を、図１８には実験２の結果を示す。実験１（比較例）の１ビット・オーディオ信号Ａに対する１ビット・オーディオ信号Ｂの圧縮率（ゲイン＝Ｇａｉｎ）は、図１７の「Ｇａｉｎｉｎｆｏｒｍａｔｉｏｎ」に示すように平均（Ａｖｅｒａｇｅ）が３．１１４２である。圧縮の比率は、Ａ：Ｂ＝１：１／Ｇａｉｎ＝１：１／３．１１４２となる。これに対して、実験２の１ビット・オーディオ信号Ａに対する１ビット・オーディオ信号Ｃの圧縮率（ゲイン＝Ｇａｉｎ）は、図１８の「Ｇａｉｎｉｎｆｏｒｍａｔｉｏｎ」に示すように平均（Ａｖｅｒａｇｅ）が３．５７４０である。圧縮比率は、Ａ：Ｂ＝１：１／Ｇａｉｎ＝１：１／３．５７４０となる。
【００６７】
また、図１７の「Ｂｙｔｅｉｎｆｏｒｍａｔｉｏｎ」において実験１の１ビット・オーディオ信号Ａのデータサイズ（Ｄａｔａｂｙｔｅｓｉｎｐｕｔ）は１７，３１０，９４１，７１２ｂｙｔｅｓで、１ビット・オーディオ信号Ｂのデータサイズ（Ｄａｔａｂｙｔｅｓｏｕｔｐｕｔ）は５，５５８，８５３，４２８ｂｙｔｅｓであった。これに対して、図１８の「Ｂｙｔｅｉｎｆｏｒｍａｔｉｏｎ」において実験２の１ビット・オーディオ信号Ａのデータサイズ（Ｄａｔａｂｙｔｅｓｉｎｐｕｔ）は１７，３１０，９４１，７１２ｂｙｔｅｓで、１ビット・オーディオ信号Ｃのデータサイズ（Ｄａｔａｂｙｔｅｓｏｕｔｐｕｔ）は４，８４３，７００，５１３ｂｙｔｅｓであった。
【００６８】
以上より、実験２、すなわち本発明を施した結果の方が、圧縮率は向上した。因みにＧａｉｎ（圧縮率）３．５７４０という値は、１ビット・オーディオ信号の圧縮において有意義な値である。
【００６９】
なお、第１の実施の形態は、図１に基本構成を示したように、１ビット・オーディオ信号編集機４が出力した１ビット・オーディオ信号Ａ’を圧縮器５によって圧縮する構成のオーディオ信号処理装置１であった。圧縮器５によって圧縮されて出力された１ビット・オーディオ信号Ｃを図１９に示すような記録系４０にて例えば光ディスクに記録すればマルチチャンネルの光ディスク４１を製造することができる。特に、２時間以上の映画のマルチチャンネルオーディオ（５．１チャンネル）を情報圧縮の対象として、上述したような構成で圧縮すれば、オーディオ部分の圧縮率を、音の品質は落とさず、つまり音楽性に影響を与えずに上げることができる。
【００７０】
上記光ディスク４１は、図２０に示すような構成のオーディオ信号再生装置５０によって再生することができる。なお、図２０には１チャンネル分だけの構成を示すが、マルチチャンネルの場合には、後述するＦＩＲフィルタ、アンプ、出力端子がチャンネル数だけ必要となる。
【００７１】
図２０において、光学ピックアップ５１が読み出した１ビット・オーディオ信号Ｃは、ＲＦアンプ５２によって信号処理され、図１９に示した圧縮器５にて行われるＤＳＴに対応した伸長処理を行う伸長器５３によって伸長される。伸長器５３によって伸長された１ビット・オーディオ信号は、例えばＦＩＲフィルタ５４にてアナログオーディオ信号に変換され、アンプ５５にて増幅された後、出力端子５６から出力される。また、ＲＦアンプ５２からの出力信号はサーボ処理回路５７に供給される。サーボ処理回路５７によって生成されたサーボ用信号は、光学ピックアップ５１をスレッド、フォーカス、トラッキングしたり、スピンドルモータによって光ディスク４１を回転駆動する機構部５８に供給される。
【００７２】
なお、第１の実施の形態では、圧縮器内において、ＤＳＴを施す際に「圧縮パラメータ」と呼ばれるＤＳＴの算術処理に用いる数値をチャンネル毎にカテゴリ化でき、相関の高いチャンネル同士に同じ「圧縮パラメータ」を与えることが可能であった。このカテゴリ化は圧縮率に影響を与えるが、どのようなカテゴリ化を用いても本発明の実施による圧縮率の向上は自明である。
【００７３】
また、第１の実施の形態では、圧縮記録技術にＤＳＴを用いたが、同様の方法はＤＳＴ以外の圧縮記録技術にも適応可能である。
【００７４】
例えば、ハフマン符号化やランレングス符号化を適応することができる。ハフマン符号化の具体例を図２１〜図２４を参照して説明する。図２１において、合計４０ビットである元の１ビット信号は４ビットづつに区切ってみると、「１０１０」というａパターンと、「１０１１」というｂパターンと、「１１００」というｃパターンと、「１１０１」というｄパターンに分けられる。そして、各パターンの出現率を計算すると、ａ：０．４、ｂ：０．３、ｃ：０．２、ｄ：０．１となる。これらの出現率より図２２のハフマン符号木を作成し、各記号に対する葉を作り、確率の最も小さい葉同士を枝で結ぶ。一方の枝に「０」、もう一方に「１」を割り当てる。節点に確率の和を書き、新たな葉とする。これを葉が一枚になるまで繰り返す。すると、ａは”０”、ｂは”１０”、ｃは”１１０”、ｄは”１１１”に符号化できる。これにより、符号化された１ビット信号は、計１９ビットとなる。よって圧縮率は、１９ビット／４０ビットとなる。
【００７５】
前記１ビット・オーディオ信号編集機４によって元の１ビット信号を例えば１０１０１０１１という１ビットパターン信号に置換した後に、そのパターン信号をハフマン符号化すると、図２３に示すように、計４０ビットは「１０１０」というａパターンと、「１０１１」というｂパターンに分けられる。出現率は、ａ：０．５、ｂ：０．５となる。この出現率よりハフマン符号木を作成すると図２４に示すようになる。すると、ａは”０”に、ｂは”１”に符号化できる。これにより、符号化された１ビット信号は、計１０ビットとなる。よって圧縮率は、１０ビット／４０ビットとなり、圧縮率が向上できる。
【００７６】
ランレングス符号化は図２５及び図２６に示すように、連続の長さによる符号化である。４０ビットからなる元の１ビット信号にあって、１は０の連続が０であるので１→０、０１は０の連続が１であるので０１→１、００１は０の連続が２であるので００１→２、０００は０の連続が３であるので０００→３となる。この０〜３によって作られた数列を二値化することで符号化された１ビット信号の合計が計２６ビットとなる。すると、圧縮率は２６ビット／４０ビットとなる。
【００７７】
前記１ビット・オーディオ信号編集機４によって元の１ビット信号を例えば０１０１の繰り返しからなる４０ビットのパターン信号に置換する。そして、ランレングス符号化すると、１のみからなる計２０ビットの符号化された１ビット信号となる。よって、圧縮率は２０ビット／４０ビットとなり、圧縮率が向上できる。
【００７８】
また、第１の実施の形態においては、”＄９６”というバイトパターンの連続であるミュート信号が使用されているが、圧縮記録技術のアルゴリズムに依っては前述した”１０１０”といった４ビット連続信号の方が圧縮率を向上させる場合もある。さらに、１６進数表示で”＄９３”、２進数で”１００１００１１”という１ビット・ミュートパターン信号を用いてもよい。
【００７９】
次に、本発明の第２の実施の形態について図２７及び図２８を用いて説明する。この第２の実施の形態は、図２７に示す構成のオーディオ信号記録装置６０である。４チャンネルのアナログオーディオ信号をΔΣ変調して４チャンネルの１ビット・オーディオ信号を出力するΔΣ変調器６１と、２チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成器６２と、ΔΣ変調器６１が出力した４チャンネルとミュートパターン生成器６２が生成した２チャンネルの特定１ビット・ミュートパターン信号とを圧縮して記録する圧縮記録系６３とを備えてなる。
【００８０】
４チャンネル分のアナログオーディオ信号はΔΣ変調器６１にて１ビット・オーディオ信号にΔΣ変調される。そのデータは、圧縮記録系６３に送られるが、この圧縮記録系６３は６チャンネル分のオーディオ信号をまとめて扱うように構成されている。残りの２チャンネル分は使用されていないわけだが、使用されていないチャンネルのデータに、ミュートパターン生成器６２からの特定１ビット・ミュートパターン信号を使用する。後の１ビット・オーディオ信号は、続いて圧縮記録系６３へ伝送され、情報の圧縮が図られる。圧縮記録系６３は、既に図６〜図９を用いて説明したＤＳＴによって情報を圧縮する。
【００８１】
本来記録伝送するオーディオアプリケーションのチャンネル数を可変にすると、ソースのデータフォーマット、データ並びなどが変化し、チャンネル数に応じた系が必要となる。系の構成を単純化するためにチャンネル数を固定とすると、使用していないチャンネルのデータも記録伝送することになりデータ量の増加を招く。例えば、６チャンネルの系に４チャンネルしか利用しないソースを応用する場合、２チャンネル分無音の余分で無駄なデータが増えることになる。ΔΣ変調された１ビット・オーディオ信号はその信号レベルの大小に関わらず圧縮記録系に伝送されるために、オーディオ帯域において無音部分であっても有音部分と同様に圧縮され、また圧縮に用いる情報も同様に必要とされる。
【００８２】
そこで、図２７に示す構成のオーディオ信号記録装置６０は、伝送するオーディオチャンネル数を一定の値とし、利用されていないチャンネル（無音）を特定１ビット・ミュートパターンに置き換え、圧縮系へ伝送する。この特定１ビット・ミュートパターンとは圧縮技術のアルゴリズムに依存するものとする。圧縮の効率が上がるパターン信号を用いる。
【００８３】
利用されていないチャンネルを特定１ビット・ミュートパターンの連続として置き換えることにより、「無音の音声信号」が「連続パターン信号」となる。このことは、「無秩序な信号の羅列」であった部分が「規則正しく並んだ信号」となるため、圧縮率をより向上させることができ、前記課題を解決する。（例えば、（１）「ＡＥＣＦＤＢＡＦ・・・」と並んでいる信号を、（２）「ＡＢＡＢＡＢＡＢ・・・」と置き換えると、（２）に関する情報は「「ＡＢ」がｘ個」だけで済み、「ＡＢｘ」と表せるとすると、その符号効率が良くなるのは自明である。）
またΔΣ変調された１ビット・オーディオ信号を予め特定１ビット・ミュートパターン信号に置き換えて圧縮するということは、アナログ復調の際、無信号と同じ中点電位（通常０Ｖ）であるアナログ信号を再生することになるが、もともと無音と推定された信号であるため、音楽性へは影響しない。
【００８４】
よって、余分なチャンネル分のデータを加えたとしても、そのデータが無音であり、充分に圧縮できるデータのためデータ増加分としては少なく、系の構成の単純性を維持できる。
【００８５】
なお、圧縮された信号を記録伝送する際に、サブ情報として本来の信号はどのチャンネルであるか、或いはどのチャンネルがこの系を通過する場合に付加されたミュート信号であるかを明示する情報を付加することによりユーザに対して本来のオーディオチャンネルを提示することができる。
【００８６】
図２８は、前記オーディオ信号記録装置６０によって例えば光ディスクに記録されたマルチチャンネルオーディオ信号を再生するオーディオ信号再生装置６５である。伸長再生系６６を備えた構成である。この伸長再生系６６は、前記図２０に示したオーディオ信号再生装置５０のＦＩＲフィルタ、アンプが６チャンネル分ある構成である。
【００８７】
この伸長再生系６６としては構成が６チャンネル固定となっており、入力を再生すると本来の４チャンネル分のオーディオ信号と２チャンネル分のミュート信号が出力される。記録系での入力が６チャンネルの場合も同じ系を使用できるのでチャンネル数によって系を切り替える必要がない。従来チャンネル数を切り替えようとすると切り替わり遷移部において処理を変更する必要があることから、一旦、全チャンネルをミュートして処理が切り替わってからフェードインし再生をする。このため音切れが生じるが、第２の実施の形態ではチャンネル数が替わらないのでそのようなことは起こらない。
【００８８】
ここで１ビット・オーディオ信号をＤＳＴを用いて圧縮記録再生する第２の実施の形態では特定１ビット・ミュートパターン信号として、図１３及び図１５を用いて特性を説明した２進表示で“１００１０１１０”、１６進表示で“＄９６”である１ビットパターン信号を用いる。また、上述した２進表示で“１００１００１１”、１６進表示で“＄９３”であるミュートパターンを用いても良いし、”１０１０”といった４ビット連続信号を用いてもよい。
【００８９】
【発明の効果】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法は、アナログオーディオ信号をΔΣ変調された１ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、無音と推定される区間を特定の１ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送することにより圧縮率の向上を可能にする。このように、圧縮記録技術のアルゴリズムに依存した「音楽性に影響を与えない置き換え」による圧縮率向上の方法及び装置は、今後、記録メディアの発展に伴いその効果を発揮できる。
【００９０】
本発明に係るオーディオ信号処理装置及びオーディオ信号処理方法並びにオーディオ信号処理システムは、マルチチャンネルのアナログオーディオ信号をΔΣ変調された１ビット・オーディオ信号に変換し、それを圧縮し、記録又は伝送する系内において、記録又は伝送するチャンネル数を一定とし、使用しないチャンネルの信号を無音である特定の１ビット・ミュートパターン信号に予め置き換え、圧縮記録系内に伝送し、圧縮再生系で再生する場合に系の処理の構成の簡素化を可能とする。
【図面の簡単な説明】
【図１】オーディオ信号処理装置の構成を示すブロック図である。
【図２】ΔΣ変調器の構成を示すブロック図である。
【図３】１ビット・オーディオ信号編集機の構成を示すブロック図である。
【図４】無音区間推定処理を示すフローチャートである。
【図５】１ビット・ミュートパターン置換＆クロスフェード部の具体例を示すブロック図である。
【図６】ＤＳＴの構成図である。
【図７】ＤＳＴ処理を示すフローチャートである。
【図８】算術符号化を説明するための図である。
【図９】算術符号化と圧縮率向上の関係を示す図である。
【図１０】映画の５．１チャンネルオーディオの各チャンネルを音声波形として表示した図である。
【図１１】無音区間推定方法を説明するための図である。
【図１２】１ビット・オーディオ信号編集機における編集画面を示す図である。
【図１３】パターン＄９６の周波数成分分布図である。
【図１４】無音と推定される区間のオーディオ帯域における周波数成分分布図である。
【図１５】パターン＄９６のオーディオ帯域における周波数成分分布図である。
【図１６】実験１，実験２を示すブロック図である。
【図１７】実験１の結果を示す図である。
【図１８】実験２の結果を示す図である。
【図１９】オーディオ信号記録装置の構成を示すブロック図である。
【図２０】オーディオ信号再生装置の構成を示すブロック図である。
【図２１】ハフマン符号化を説明するための図である。
【図２２】ハフマン符号木を示す図である。
【図２３】ハフマン符号化により圧縮率が向上したことを説明するための図である。
【図２４】出現率ａ：０．５、ｂ：０．５より作成したハフマン符号木を示す図である。
【図２５】ランレングス符号化を説明するための図である。
【図２６】ランレングス符号化により圧縮率が向上したことを説明するための図である。
【図２７】オーディオ信号記録装置の構成を示す図である。
【図２８】オーディオ信号再生装置の構成を示す図である。
【図２９】ＩＴＵ−Ｒの勧告によるマルチチャンネル（５チャンネル）の標準的なスピーカ配置を示す図である。
【図３０】ＩＴＵ−Ｒの勧告によるマルチチャンネル（５．１チャンネル）の標準的なスピーカ配置を示す図である。
【符号の説明】
１オーディオ信号処理装置、３ ΔΣ変調器、４１ビット・オーディオ信号編集機、５圧縮器、１４無音区間抽出部、１５１ビット・ミュートパターン置換＆クロスフェード部

Claims

アナログオーディオ信号をΔΣ変調して１ビット・オーディオ信号を出力するΔΣ変調手段と、
前記ΔΣ変調手段が出力した１ビット・オーディオ信号の無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間の１ビット・オーディオ信号と共に出力する編集手段と、
前記編集手段が出力した前記１ビット・ミュートパターン信号を含む１ビット・オーディオ信号を圧縮する圧縮手段と
を備えることを特徴とするオーディオ信号処理装置。
前記編集手段は、一定時間の窓を設定し、前記ΔΣ変調手段が出力した１ビット・オーディオ信号の所定区間におけるレベルが所定のレベル以下であるときにその区間を無音と推定し、特定の１ビット・ミュートパターン信号に置き換えることを特徴とする請求項１記載のオーディオ信号処理装置。
前記編集手段は、無音と推定した区間を特定の１ビット・ミュートパターン信号に置き換えるとき、前記無音と推定されなかった区間との境目をクロスフェードすることを特徴とする請求項１記載のオーディオ信号処理装置。
前記アナログオーディオ信号は複数ｍ（ｍは２以上の整数）チャンネルの信号であり、前記ΔΣ変調手段は各チャンネル毎の１ビット・オーディオ信号を出力し、前記編集手段はいずれかのチャンネルの内の少なくとも一つのチャンネルの１ビット・オーディオ信号の無音区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力することを特徴とする請求項１記載のオーディオ信号処理装置。
前記圧縮手段が圧縮した１ビット信号を記録媒体に記録する記録手段をさらに備えることを特徴とする請求項１記載のオーディオ信号処理装置。
アナログオーディオ信号をΔΣ変調して１ビット・オーディオ信号を出力するΔΣ変調工程と、
前記ΔΣ変調工程が出力した１ビット・オーディオ信号の無音と推定される区間を抽出し、特定の１ビット・ミュートパターン信号に置き換え、無音と推定されなかった区間と共に出力する編集工程と、
前記編集工程が出力した前記１ビット・ミュートパターン信号を含む１ビット・オーディオ信号を圧縮する圧縮工程と
を備えることを特徴とするオーディオ信号処理方法。
前記圧縮行程が圧縮した１ビット・オーディオ信号を記録媒体に記録する記録工程をさらに備えることを特徴とする請求項６記載のオーディオ信号処理方法。
複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調手段と、
複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成手段と、
前記ΔΣ変調手段が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成手段が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮手段と
を備えることを特徴とするオーディオ信号処理装置。
前記圧縮手段が圧縮した１ビット信号を記録媒体に記録する記録手段をさらに備えることを特徴とする請求項８記載のオーディオ信号処理装置。
複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調工程と、
複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成工程と、
前記ΔΣ変調工程が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成工程が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮工程と
を備えることを特徴とするオーディオ信号処理方法。
前記圧縮工程が圧縮した１ビット信号を記録媒体に記録する記録工程をさらに備えることを特徴とする請求項１０記載のオーディオ信号処理方法。
複数ｍ（ｍは２以上の整数）チャンネルのアナログオーディオ信号をΔΣ変調してｍチャンネルの１ビット・オーディオ信号を出力するΔΣ変調手段と、
複数ｎ（ｎは１以上の整数）チャンネルの特定の１ビット・ミュートパターン信号を出力するミュートパターン生成手段と、
前記ΔΣ変調手段が出力したｍチャンネルの１ビット・オーディオ信号と前記ミュートパターン生成手段が生成したｎチャンネルの特定１ビット・ミュートパターン信号とを圧縮する圧縮手段と、
前記圧縮手段が圧縮した１ビット信号を記録媒体に記録する記録手段と、
前記記録手段によって記録媒体に記録された圧縮１ビット信号を伸長する伸長手段と、
前記伸長手段によって伸長された１ビット信号をアナログ信号に変換する信号処理手段と
を備えることを特徴とするオーディオ信号処理システム。