JP3596978B2

JP3596978B2 - 音声再生装置

Info

Publication number: JP3596978B2
Application number: JP11911696A
Authority: JP
Inventors: 智倉田; 規斉藤; 竜一村島; 俊郎相澤
Original assignee: Renesas Technology Corp; Hitachi ULSI Systems Co Ltd
Current assignee: Renesas Technology Corp; Hitachi Solutions Technology Ltd
Priority date: 1996-05-14
Filing date: 1996-05-14
Publication date: 2004-12-02
Anticipated expiration: 2016-05-14
Also published as: JPH09307508A

Description

【０００１】
【発明の属する技術分野】
本発明は、圧縮された音声データを伸長して再生する音声再生装置に関し、例えばＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ、メディア統合動画像圧縮の国際標準；エムペグ）オーディオに適用して有効な技術に関する。
【０００２】
【従来の技術】
ＭＰＥＧオーディオは、高品質、高能率ステレオ符号化のＩＳＯ／ＩＥＣ標準方式であり、ＩＳＯ／ＩＥＣＳＣ２９／ＷＧ１１に設置されたＭＰＥＧ委員会の中で動画像の符号化と平行して標準化されている。圧縮には３２バンド・サブバンド・コーディング（帯域分割符号化）とＭＤＣＴ（変形離散コサイン変換）が利用され、聴覚心理的な特性を利用して高効率圧縮を実現している。
【０００３】
ＭＰＥＧオーディオは、ＭＰＥＧビディオと組合わされることによって、高効率のマルチメディア情報の圧縮を実現することができ、非圧縮のディジタルオーディオと比べて音質劣化がほとんど無い。また、ＭＰＥＧオーディオはＭＰＥＧビディオと組合わせるだけでなく、ＤＡＢ（ディジタル音楽放送）などに単独で使用することもできる。
【０００４】
そのようなＭＰＥＧオーディオ技術においては、圧縮された音声データのエンコード時に、圧縮音声データに設けられたＣＲＣ（ＣｙｃｌｉｃＲｅｄｕｎｄａｎｃｙＣｈｅｃｋ；巡回冗長検査）情報によりデータエラーが発生したか否かを判定することができる。その判定において、もしデータエラーが発生したと判断された場合には、不所望な音（ノイズ）がスピーカから出力されないように音声出力を中断（ミュートと称される）してから、当該エラーにかかるデータについての伸長圧縮処理を再開する方式が採用される。
【０００５】
尚、ＭＰＥＧオーディオについて記載された文献の例としては、１９９４年８月１日に株式会社アスキーから発行された「ポイント図解式最新ＭＰＥＧ教科書（第１６７頁〜第１８７頁）」がある。
【０００６】
【発明が解決しようとする課題】
しかしながら、ＣＲＣによるデータエラー判別においてデータエラーが発生した場合に音声出力を中断する方式によれば、データエラー発生時にスピーカからの音声出力が中断されてしまうため、聴覚心理的に聞きづらい状態を形成するのが否めない。音声出力の中断が、聴覚心理的に一種のノイズと考えられるからである。
【０００７】
また、ＭＰＥＧオーディオにおいて、ＣＲＣは必ず設定されるものではなく、音声圧縮処理における設定に依存されるから、仮にＭＰＥＧオーディオ再生において、ＣＲＣに基づくエラー判別及び処理（音声出力の中断）を採用したとしても、圧縮された音声データにおいてＣＲＣが設定されていない場合には、音声出力の中断が行われないから、誤ったデータの伸長処理結果がそのままスピーカから出力されることになる。この場合のスピーカから出力は、非常に耳障りなノイズとして感じられる。
【０００８】
本発明の目的は、圧縮データに基づく音声再生におけるノイズ低減を図るための技術を提供することにある。
【０００９】
本発明の前記並びにその他の目的と新規な特徴は本明細書の記述及び添付図面から明らかになるであろう。
【００１０】
【課題を解決するための手段】
本願において開示される発明のうち代表的なものの概要を簡単に説明すれば下記の通りである。
【００１１】
すなわち、圧縮された音声データの伸長前に、当該音声データに含まれる異常部位を検出するエラー検出手段（１９）と、検出された異常部位のデータを、当該異常部位の直前又は直後に存在する正常部位のデータに置換えることで、上記異常部位を修復するための修復手段（１０，１７、又は１３，１７）とを含んで音声再生装置を構成する。上記した手段によれば、修復手段は上記エラー検出手段の検出結果に基づいて異常部位の修復を行い、このことが、圧縮データに基づく音声再生におけるノイズ低減を達成する。
【００１２】
ヘッダに基づいて算出された上記オーディオフレームのサイズをＸで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをＹで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をＺで示すとき、Ｘ＜Ｙ＋Ｚが成立するか否かを判別することにより、音声データに含まれる異常フレームを検出するエラー検出手段（１９）と、上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段（１０，１７）とを含んで音声再生装置を構成することができる。
【００１３】
上記エラー検出手段は、オーディオ周波数の高域に対応する上位バンドのアロケーション情報が論理値“０”となるオーディオフレームが所定数以上続いた場合に、上記上位バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって音声データに含まれる異常フレームを検出するように構成することができる。
【００１４】
また、アロケーション情報に対応するサンプルデータ量の値を得るためのテーブルと、このテーブルを参照してアロケーション情報に対応するサンプルデータ量のおおよその値を求め、その値が所定の基準値を越えるか否かを判定することにより、音声データに含まれる異常フレームを検出するようにエラー検出手段を形成することができる。
【００１５】
さらに、圧縮された音声データに設けられた巡回冗長検査情報又は誤り訂正符号に基づいて、上記音声データに含まれる異常フレームを検出するようにエラー検出手段を形成することができる。
【００１６】
上記修復手段は、上記圧縮された音声データを複数フレーム分記憶可能な記憶手段（１０）と、上記エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、上記記憶手段から上記パーサ処理手段（１３）へ転送制御可能な制御手段（１７）とを含んで形成することができる。また、上記修復手段は、上記異常フレームにおける全てのサブフレームを、異常フレームの直前の正常フレームにおける最終サブフレーム、又は異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換してサブバンド毎のサンプルデータを抽出するパーサ処理手段（１３）と、上記エラー検出手段の検出結果に基づいて、パーサ処理手段の動作を制御する制御手段（１７）とを含んで形成することができる。
【００１７】
【発明の実施の形態】
図１には本発明にかかる音声再生装置の一実施形態例が示される。
【００１８】
図１に示される音声再生装置は、特に制限されないが、ＭＰＥＧオーディオ技術によって形成された圧縮された音声データ（「圧縮音声データ」と称する）を数フレーム分ＦＩＦＯ（先入れ先出し）方式で蓄積可能なバッファメモリ１０と、このバッファメモリ１０の後段に配置され、バッファメモリ１０から伝達された圧縮音声データを伸長して音声を再生するための音声再生部１１と、この音声再生部１１の後段に配置され、音声再生部１１の出力信号を増幅してスピーカ２１を駆動するためのアンプ２０とを含む。
【００１９】
上記バッファメモリ１０に入力される圧縮音声データは、特に制限されないが、ＭＰＥＧオーディオ技術により形成されたものとされる。ＭＰＥＧオーディオ規格では、音声信号を例えば１１５２サンプル毎に分割してフレームを形成し、このフレーム毎に圧縮処理を行うようになっている。この圧縮処理においては、特に制限されないが、音声を受ける人間の感覚の性質を利用して、感度の低い細部の情報を省略して符号量を削減していく方式（知覚符号化と称される）が採用される。
【００２０】
特に制限されないが、音声再生部１１は、ＲＡＭ（ランダム・アクセス・メモリ）１２，１５、パーサ処理部１３、サブバンドフィルタ１４、出力部１６、ヘッダ検出部１８、エラー検出処理部１９、及び制御部１７を含む。上記パーサ処理部１３、サブバンドフィルタ１４、出力部１６、ヘッダ検出部１８、エラー検出処理部１９、及び制御部１７は、特に制限されないが、公知の半導体集積回路製造技術により単結晶シリコン基板などの一つの半導体基板に形成することができる。
【００２１】
パーサ処理部１３は、バッファメモリ１０から伝達された圧縮音声データのフレーム毎の解析を行うことで、各サブバンド毎のサンプルデータを抽出する機能を有する。パーサ処理部１３の後段にはサブバンドフィルタ１４が配置される。このサブバンドフィルタ１４は、上記パーサ処理部１３によって抽出されたサンプルデータを処理して音声データを伸長する機能を有する。サブバンドフィルタ１４の後段には、上記サブバンドフィルタ１４からのデジタルの出力データをアナログ信号にＤ／Ａ変換して後段のアンプ２０に出力するための出力部１６が配置される。そして、バッファメモリ１０から出力された圧縮音声データのフレーム毎のヘッダを検出するためのヘッダ検出部１８、及び上記バッファメモリ１０から出力された圧縮音声データに含まれる異常部位を検出するためのエラー検出処理部１９が設けられ、さらに、上記ヘッダ検出部１８の検出結果、及びエラー検出処理部１９の検出結果に基づいて上記バッファメモリ１０、パーサ処理部１３、サブバンドフィルタ１４、及び出力部１６の動作を制御する制御部１７が設けられている。第１ＲＡＭ１２は、上記パーサ処理部１３でのサンプルデータ抽出処理における作業領域として使用され、また、第２ＲＡＭ１５は上記出力部１６でのＤ／Ａ変換処理における作業領域として使用される。ハードウェア的に一つのＲＡＭの記憶エリアを２分割して使用することで、上記第１ＲＡＭ１２及び上記第２ＲＡＭ１５を形成することができる。
【００２２】
図２にはこの音声再生装置に入力される圧縮音声データの形式が示される。
【００２３】
特に制限されないが、ＭＰＥＧオーディオ技術において、音声信号が１１５２サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、圧縮音声データが形成される。この音声圧縮データの一つのフレームは、図２に示されるように、それ自体単独で音声に復号できる最小単位であり、一定のサンプル数のデータを含む。一つのフレームは、図２に示されるように、ヘッダ、アロケーション情報、スケールファクタ情報、サンプルデータ、及びアンシラリデータを含む。ヘッダは、３２ビット固定長とされ、同期ワード（１２ビット）、ＩＤ（１ビット）、レイヤ（２ビット）、プロテクションビット（１ビット）、ビットレート・インデックス（４ビット）、サンプリング周波数（２ビット）、パディングビット（１ビット）、プライベートビット（１ビット）、モード（２ビット）、モード拡張（２ビット）、コピーライト（１ビット）、オリジナル／コピー（１ビット）、及びエンファシス（２ビット）から成る。
【００２４】
ヘッダに続くアロケーション情報、スケールファクタ情報、及びサンプルデータは、オーディオ・データと総称され、上記ヘッダからオーディオ・データまでが、音声を再生するために使用される可変長データとされる。オーディオ・データの終りがオーディオ復号単位（ＡＡＵ）に達しない場合、残りの部分がアンシラリデータとされる。このアンシラリデータはＭＰＥＧオーディオ以外の任意のデータを挿入することができる。ＭＰＥＧ２オーディオではこのアンシラリデータに、マルチチャネル、マルチリンガルのデータが挿入される。
【００２５】
アロケーション情報は、サンプルデータ中の各サブバンド、各チャネル毎にビット数を割当てている情報であり、図４に示されるように、４ビット構成の情報とされ、正常な情報であれば割当てビット数から算出された値は、サンプルデータのサイズと合致する。
【００２６】
３２のサブバンドについて、２チャネルのデータ（シングル・チャネルのときは１チャネル）がそれぞれ符号化される。また、バウンド（Ｂｏｕｎｄ）で指定されるサブバンド以上については１チャネルのみ符号化される。
【００２７】
スケールファクタは、各サブバンド、各チャネル毎の波形の再生音の倍率を示しており、各６ビットで表される。スケールファクタは、アロケーション情報で０ビットが指定されたものについては省略される。ジョイント・ステレオ・モードで、バウンドに指定されたサブバンド以上についてはモノラル符号化されるが、スケールファクタは２チャネル分が独立に符号化される。
【００２８】
サンプルデータには、１サンプル当りアロケーションで指定されたビット数が割り当てられる。ジョイント・ステレオ・モードの場合、バウンドで指定されたサブバンド以上については、ジョイント・ステレオ符号となり、サンプルとしては１チャネル分のみが符号化される。波形的には左右同一とされ、スケール・ファクタによる音量差でステレオ効果を出す。
【００２９】
次に、異常部位の検出及び修復について、図３のフローチャートに基づいて説明する。
【００３０】
エラー検出処理部１９では、先ず、バッファメモリ１０から出力されるオーディオフレームのヘッダに基づいてオーディオフレームのサイズが算出される（ステップＳ２１）。このオーディオフレームのサイズをＸで示す。次に、ヘッダからサンプルデータの直前までのサイズが計数される（ステップＳ２２）。このヘッダからサンプルデータの直前までのサイズをＹで示す。そして、アロケーション情報から、サブバンド毎に設定されたサンプルデータのサイズの合計値を求める。このサンプルデータのサイズの合計値をＺで示す。
【００３１】
そして、Ｘ＜Ｙ＋Ｚが成立するか否かの判別が行われ、その判別において、Ｘ＜Ｙ＋Ｚが成立しない（ＮＯ）と判断された場合には、圧縮音声データに異常部位が含まれないので、データ置換処理が行われることなく、オーディオフレームのデコードが行われる（ステップＳ２６）。また、上記ステップＳ２４の判別において、Ｘ＜Ｙ＋Ｚが成立する（ＹＥＳ）と判断された場合には、データ修復のためのデータ置換処理が行われてから（ステップＳ２５）、オーディオフレームのデコードが行われる（ステップＳ２６）。
【００３２】
ここで、上記ステップＳ２４での判別について詳述する。
【００３３】
データエラーがサンプルデータの領域で生じても、特定のサンプルデータが被るだけであり大きなノイズにはならない。しかし、アロケーション情報の異常を引き起こすと大きなノイズを発生させる可能性が生じる。アロケーション情報が異常に大きくなっている場合は、高域成分に多くのサンプルデータが割当てられている可能性が高い。高域成分に多くのサンプルデータが割当てられていると、その場合の再生音は、聴覚の性質上、非常に耳障りとなる。
【００３４】
また、サンプルデータ量が大き過ぎると、次のフレームにオーバーラップしてマスクされる危険もある。そこで、図２に示されるように、ヘッダからサンプルデータの直前までのサイズＹと、アロケーション情報から求められたサンプルデータ合計値Ｚとの加算値が（Ｙ＋Ｚ）が、ヘッダに基づいて算出されたオーディオフレームサイズＸよりも大きくなる場合を異常と判断して、データ置換による修復を行うようにしている。尚、ヘッダからサンプルデータの直前までのサイズＹと、アロケーション情報から求められたサンプルデータ合計値Ｚとの加算値（Ｙ＋Ｚ）が、ヘッダに基づいて算出されたオーディオフレームサイズＸよりも小さい場合には、ＭＰＥＧの規格上異常フレームと判定することができないので、データ置換による修復は行わない。
【００３５】
上記ステップＳ２４の判別において、Ｘ＜Ｙ＋Ｚが成立する（ＹＥＳ）と判断されたにもかかわららず、それをそのままにすると、スピーカ２１から非常に耳障りなノイズが出力される恐れがあるので、そのような耳障りなノイズが出力されないように、異常部位の修復が行われてからデコードされるようになっている。
【００３６】
異常部位の修復は次のように行われる。
【００３７】
異常部位をフレーム単位で単に削除しただけでは、オーディオの再生時間が短くなったり、曲調に違和感を生ずることがある。そこで、図５に示されるように、異常フレームＢに代えて、その異常フレームＢの直前に位置する正常フレームＡを使用するようにする。すなわち、異常フレームＢをデコードに使わないで、その異常フレームＢの代わりに正常フレームＡのデータを使用する。その結果、修復後の圧縮音声データのフレーム配列は、再生方向に、フレームＡ、フレームＡ、フレームＣ、フレームＤの順とされ、フレームＡが２回続く。そのようなデータ置換は、図１に示されるバッファメモリ１０からパーサ処理部１３へのフレーム転送制御を制御部１７で制御することによって可能とされる。つまり、バッファメモリ１０から異常フレームＢが出力されて、エラー検出処理部１９により、当該異常フレームＢが検出された場合に、制御部１７の制御により、パーサ処理部１３での当該異常フレームＢについての処理が中止され、直前の正常フレームＡが、バッファメモリ１０からパーサ処理部１３へ再送される。それにより、パーサ処理部１３では、異常フレームＢに代えて正常フレームＡについての処理が行われることになる。異常フレームＢと正常フレームＡとは互いに隣り合うフレームであり、しかもＭＰＥＧオーディオにおける１フレームの再生音が約３０ｍｓ（ミリ秒）であることを考えると、異常フレームＢを正常フレームＡに置換したことの再生音への影響を人間の聴覚で識別するのは非常に困難である。そのようなデータ修復により、例え圧縮音声データに異常フレームが存在していても、上記したデータ置換によるデータ修復が行われることで、スピーカ２１からの再生音に耳障りなノイズが含まれるのを防止することができる。
【００３８】
図５に示されるデータ修復では、異常フレームＢの直前に存在する正常フレームを使用するようにしたが、図６に示されるように、異常フレームＢの直後に存在する正常フレームＣを使用するようにしても良い。すなわち、上記の例に従えば、パーサ処理部１３で異常フレームＢについての処理を行わない代りに、バッファメモリ１０からパーサ処理部１３へのデータ転送において、正常フレームＣについての転送を続けて２回行うようにし、異常フレームＢについての処理に代えて、正常フレームＣについての処理を２回行うにする。そのようにしても、上記したデータ置換による修復が行われることで、スピーカ２１からの再生音に耳障りなノイズが含まれるのを防止することができる。
【００３９】
図７、及び図８には異常フレームＢ，Ｃが連続する場合のデータ修復方法が示される。
【００４０】
すなわち、異常フレームＢ，Ｃが連続して存在する場合には、図７に示されるように、異常フレームＢ，Ｃに代えて、その異常フレームＢ，Ｃの直前の正常フレームＡを使用するか、あるいは図８に示されるように、異常フレームＢ，Ｃに代えて、その異常フレームＢ，Ｃの直後の正常フレームＤを使用すれば、スピーカ２１からの再生音に耳障りなノイズが含まれるのを防止することができる。
【００４１】
エラー検出を次のように行っても良い。
【００４２】
例えば図１４に示されるように、アロケーション情報から算出されたサンプルデータ量の合計に、フレームトップアドレスからサンプルトップアドレス間のデータ量を合計した値が、オーディオフレームの規格サイズを越えた場合に、当該フレームを異常と判断し、その異常フレームについて上記のように修復する。
【００４３】
上記実施態様によれば、以下の作用効果を得ることができる。
【００４４】
（１）異常フレームＢをデコードに使わないで、その異常フレームＢの代わりに正常フレームＡを割当てることで、修復後の圧縮音声データのフレーム配列は、再生方向に、フレームＡ、フレームＡ、フレームＣ、フレームＤの順とされ、それにより、パーサ処理部１３では、異常フレームＢに代えて正常フレームＡについての処理が行われることになる。異常フレームＢと正常フレームＡとは互いに隣り合うフレームであり、しかも１フレームの再生音が約３０ｍｓ（ミリ秒）であることを考えると、異常フレームＢを正常フレームＡに置換したことの再生音への影響を人間の聴覚で識別するのは非常に困難であるから、上記したデータ置換によるデータ修復が行われることで、スピーカ２１からの再生音に、音声の中断などの耳障りなノイズが含まれるのを防止することができる。
【００４５】
（２）上記のデータ修復は、制御部１７の制御によりバッファメモリ１０の読出しアドレス制御によって容易に実現することができる。
【００４６】
次に、他の実施形態について説明する。
【００４７】
図１０には本発明にかかる音声再生装置の別の実施形態例が示される。
【００４８】
図１に示される音声再生装置が図１に示されるのと大きく相違するのは、バッファメモリ１０が省略されている点である。つまり、図１に示される構成ではバッファメモリ１０からパーサ処理部１３へのデータ転送を制御部１７で制御することにより、異常フレームを正常フレームに置換することにより、フレーム単位でデータ修復が行われたが、図１０に示される音声再生装置では、パーサ処理部１３において、正常フレームに含まれる一つのサブフレームを利用してデータ修復が行われる。サブフレームは、例えばオーディオフレームの１／３６のサイズであり、図１に示されるバッファメモリ１０などのように複数フレーム分を記憶するためのメモリは不要である。サブフレームを利用したデータ修復には、第１ＲＡＭ１２などの比較的小さな作業領域があればそれで十分とされる。
【００４９】
ＭＰＥＧ１のオーディオレイヤ２においては、一つのオーディオフレームは１１５２のサンプルデータから構成されており、１フレームは、３６個のサブフレームに細分化される。１サブフレームは３２個のサンプルデータから成る。そこで、エラー検出処理部１９においてエラー検出が行われた場合には、図１１に示されるように、異常フレームＢの直前に存在する正常フレームＡにおけるサブフレーム、又は異常フレームＢの直後に存在する正常フレームＣにおけるサブフレームを利用して異常フレームのデータ修復を行う。例えば図１１に示される修復例では、正常フレームＡの最終サブフレームＡ３６が利用され、異常フレームＢの全てのサブフレームＢ１〜Ｂ３６のデータに代えてサブフレームＡ３６のデータが使用される。その結果、異常フレームＢにおけるサブフレームＢ１〜Ｂ３６に代えて、サブフレームＡ３６が３６回繰返し再生される。
【００５０】
また、図１２に示される修復例では、正常フレームＣの先頭サブフレームＣ１が利用され、異常フレームＢの全てのサブフレームＢ１〜Ｂ３６のデータに代えてサブフレームＣ１のデータが使用される。その結果、異常フレームＢにおけるサブフレームＢ１〜Ｂ３６に代えて、サブフレームＣ１が３６回繰返し再生される。
【００５１】
さらに、異常フレームが２フレーム連続して存在する場合にも、上記したように、異常フレームの直前又は直後のサブフレームを利用することでデータ修復を行うことができる。例えば図７又は図８に示されるように異常フレームＢ，Ｃが存在する場合には、異常フレームＢ，Ｃに代えて、正常フレームＡにおける最終サブフレーム、又は正常フレームＤにおける先頭サブフレームを７２回繰返し再生すれば良い。
【００５２】
エラー検出処理１９によるエラー検出の他の方式について説明する。
【００５３】
ＭＰＥＧオーディオレイヤ２の場合、アロケーション情報は、４ビット幅、３ビット幅、２ビット幅の３種類の読出し幅によりアロケーションテーブルが異なり、２ビット幅のテーブルでの処理の負担が一番小さい。上位５バンドはオーディオ周波数の高域に対応しており、通常は、データ量の低減のため、上位５バンドには大きなデータを割当てないようにしている。そのため、上位５バンドのデータ量に基づいてエラー判定を行うことができる。つまり、上記５バンドに対して２ビット幅で読出し、算出されたサンプルデータ量に基づいてエラー判定を行うことができる。基本的には、上位５バンドのサンプルデータの合計値が所定値を越えた場合を異常とすることができるが、正常なオーディオフレームのなかにも上位５バンドに大きなサンプルデータが割当てられていることも考えられるので、その場合も考慮すれば、図１３に示されるように、２ステップを経て異常判別を行うようにするのが良い。図１３に示されるように、上位５バンドのアロケーション情報が、論理値“０”であるオーディオフレームが一定フレーム数以上続いたか否かの判別を行い（ステップＳ３１）、この判別において一定フレーム以上続いた（ＹＥＳ）と判断された場合には、上位５バンドのサンプルデータ量が一定の値を越えたか否かの判別が行われる（ステップＳ３２）。このステップＳ３２の判別において一定の値を越えたと判断された場合には、異常と判断される（ステップＳ３３）。すなわち、この場合はオーディオ周波数の高域が連続して無い状態から、オーディオ周波数の高域を一定のデータ量以上に含む状態に突然変化するというのは、前者の正常な状態から後者の異常な状態に変化したと理解すべきであり、後者の異常な状態においてデータ修復が行われる。このようにして、異常と判断された場合には、対応データについて上記した方式でデータ修復が行われる。
【００５４】
また、上記ステップＳ３１において一定フレーム以上続かない（ＮＯ）と判断された場合、及び上記ステップＳ３２の判別において一定の値を越えない（ＮＯ）と判断された場合には、正常と判断され（ステップＳ３４）、その場合、データ修復は行われない。
【００５５】
以上のように、正常なオーディオフレームのなかにも上位５バンドに大きなサンプルデータが割当てられていることも考慮して、上位５バンドのアロケーション情報が論理値“０”であるフレームが所定数以上続いることを、先ず最初に判定し、前のオーディオフレームとの相関が見られず、しかも所定数以上の大きなサンプルデータ量が割当てられているオーディオフレームを異常とし、その場合に、上記したオーディオフレームのデータ置換を行うことで、ノイズ低減を図ることができる。
【００５６】
また、図１のエラー検出処理部１９のエラー検出を次のように行うようにしても良い。
【００５７】
アロケーション情報からサンプルデータ量を算出せず、予め形成されたテーブルを参照することにより、対応するサンプルデータ量のおおよその値を得る。すなわち、図１５に示されるように、アロケーションビット（４ビット構成）の重み付けに従った概算の割合に換算するテーブルを図１のエラー検出処理部１９内部のＲＯＭ（リード・オンリー・メモリ）として形成し、そのテーブルに従い、４ビット幅、３ビット幅、２ビット幅でそれぞれ読出されたアロケーションデータの合計値を算出し、それが所定の大きさになる場合に、アロケーション情報に格納されたサンプルデータ量が、実際のサンプルデータ量を越えるものとみなして、そのオーディオフレームを異常と判断する。異常と判断されたフレームについて上記データ置換による修復を行うことで、ノイズ低減を図ることができる。このエラー検出方式では、全てのサンプルデータ量を算出するのに比べて演算処理の負担が軽減されるという利点がある。
【００５８】
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
【００５９】
例えば、図７や図８に示されるように、異常フレームＢ，Ｃが連続して存在する場合に、異常フレームＢについては、その異常フレームＢの直前の正常フレームＡを利用してデータ置換による修復を行い、異常フレームＣについては、その異常フレームＣの直後に存在する正常フレームＤを利用してデータ置換による修復を行うようにしても良い。
【００６０】
図９に示されるように、異常フレームＢ，Ｃ，Ｄが連続して存在する場合には、フレームが３フレーム以上連続して存在する場合には、データ置換による修復を行わずに、当該異常フレームについてミュートをかけて無音状態を形成したほうが好ましい場合がある。特に、異常フレームが５フレーム以上連続して存在する場合には、一旦リセットしてから再生を行うようにすることができる。
【００６１】
また、上記した実施形態例でのエラー検出（異常フレーム検出）を実現する場合、伸長対象とされる圧縮音声データは、エラー検出のための特別の符号を付加する必要がないが、そのような符号が、予め圧縮音声データに形成されるのを前提とすれば、パリティチェックや、ＣＲＣなどの誤り検出技術を利用することにより、データエラーを検出し、その検出結果に基づいてデータ修復を行うようにしても良い。パリティチェックは、ｎビットの中の１つのビットの個数が常に偶数（又は奇数）になるように定め、上記ｎビットの中で１つのビットが誤って反転した場合を検出することができる。連続した文字列の中の各文字コードの同じ桁同士のパリティチェックを行う場合もある。ＣＲＣは、ＣＣＩＴＴやＩＳＯなどの国際機関で勧告された生成多項式を利用して誤り検出を行う技術であり、バースト誤りや、ランダム誤り検出能力を有する。上記したパリティチェック機能やＣＲＣに基づく誤り検出機能を、例えば図１におけるエラー検出処理部１９で実現することで、圧縮音声データのエラー検出を行うことができる。
【００６２】
さらに、上記実施形態例ではＭＰＥＧオーディオのレイヤ２の仕様を用いて説明したが、レイヤ２以外、例えばレイヤ１の仕様を採用しても良い。
【００６３】
上記実施形態例では、５バンドのアロケーション情報が、論理値“０”であるオーディオフレームが一定フレーム数以上続いたか否かの判別や、上位５バンドのサンプルデータ量が一定の値を越えたか否かの判別を行うようにしたが、処理速度との関係で適宜にバンド数を変更することができる。
【００６４】
以上の説明では主として本発明者によってなされた発明をその背景となった利用分野であるＭＰＥＧオーディオに適用した場合について説明したが、本発明はそれに限定されるものではなく、例えばドルビーＡＣ３などのディジタルオーディオ技術に広く適用することができる。
【００６５】
本発明は、少なくとも圧縮された音声データを伸長して再生することを条件に適用することができる。
【００６６】
【発明の効果】
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば下記の通りである。
【００６７】
すなわち、圧縮された音声データの伸長前に、この音声データに含まれる異常部位を検出するエラー検出手段と、検出された異常部位のデータを、異常部位の直前又は直後に存在する正常部位のデータに置換えることで、異常部位を修復するための修復手段とを有することにより、エラー検出手段の検出結果に基づいて異常部位の修復が行われ、それにより圧縮データに基づく音声再生におけるノイズ低減を図ることができる。
【００６８】
ヘッダに基づいて算出された上記オーディオフレームのサイズをＸで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをＹで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をＺで示すとき、Ｘ＜Ｙ＋Ｚが成立するか否かを判別して、音声データに含まれる異常フレームを検出することにより、伸長対象とされる圧縮音声データに、異常フレーム検出のための特別な符号を埋込むこと無く、データ修復のための異常フレーム検出を的確に行うことができる。
【００６９】
上位５バンドのアロケーション情報が論理値“０”となるオーディオフレームが所定数以上続いた場合に、上記５バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって音声データに含まれる異常フレームを検出することにより、伸長対象とされる圧縮音声データに、異常フレーム検出のための特別な符号を埋込むこと無く、データ修復のための異常フレーム検出を的確に行うことができる。
【００７０】
アロケーション情報に対応するサンプルデータ量のおおよその値を得るためのテーブルを参照してアロケーション情報に対応するサンプルデータ量の値を求め、その値が所定の基準値を越えるか否かを判定することにより、異常フレーム検出における演算処理の負荷軽減を図ることができる。これは、異常フレーム検出処理時間を短縮する上で有効とされる。
【００７１】
圧縮された音声データに設けられた巡回冗長検査情報又は誤り訂正符号に基づいて、音声データに含まれる異常フレームを検出するエラー検出手段を設けた場合には、伸長対象とされる圧縮音声データに巡回冗長検査情報又は誤り訂正符号が埋込まれている場合に有効である。
【００７２】
圧縮された音声データを複数フレーム分記憶可能な記憶手段と、エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、記憶手段からパーサ処理手段へ転送制御可能な制御手段とを含んで修復手段を形成することができ、その場合には、パーサ処理手段として既存のものを大幅な回路変更無しに適用することができる。
【００７３】
異常フレームにおける全てのサブフレームを、異常フレームの直前の正常フレームにおける最終サブフレーム、又は異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換することでデータ修復を行う場合には、そのようなデータ修正に必要とされる作業領域が小さくて済む。
【図面の簡単な説明】
【図１】本発明にかかる音声再生装置の一実施形態例の構成ブロック図である。
【図２】上記音声再生装置に入力される圧縮音声データの説明図である。
【図３】上記音声再生装置における異常部位の検出及び修復についてのフローチャートである。
【図４】上記音声再生装置において取扱われる圧縮音声データにおけるアロケーション情報の構成説明図である。
【図５】上記音声再生装置におけるデータ置換処理についての説明図である。
【図６】上記音声再生装置におけるデータ置換処理についての説明図である。
【図７】上記音声再生装置におけるデータ置換処理についての説明図である。
【図８】上記音声再生装置におけるデータ置換処理についての説明図である。
【図９】上記音声再生装置において３個の異常フレームが存在する場合の説明図である。
【図１０】本発明にかかる音声再生装置の他の実施形態例の構成ブロック図である。
【図１１】図１０に示される音声再生装置におけるデータ置換処理についての説明図である。
【図１２】図１０に示される音声再生装置におけるデータ置換処理についての説明図である。
【図１３】図１０に示される音声再生装置における異常部位の検出についてのフローチャートである。
【図１４】図１に示される音声再生装置におけるデータ置換処理についての説明図である。
【図１５】図１０に示される音声再生装置におけるデータ置換処理で参照されるテーブルの説明図である。
【符号の説明】
１０バッファメモリ
１１音声再生部
１２第１ＲＡＭ
１３パーサ処理部
１４サブバンドフィルタ
１５第２ＲＡＭ
１６出力部
１７制御部
１８ヘッダ検出部
１９エラー検出部
２０アンプ
２１スピーカ

Claims

音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
上記ヘッダに基づいて算出された上記オーディオフレームのサイズをＸで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをＹで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をＺで示すとき、Ｘ＜Ｙ＋Ｚが成立するか否かを判別することにより、音声データに含まれる異常フレームを検出するエラー検出手段と、
上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
を含むことを特徴とする音声再生装置。
音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
オーディオ周波数の高域に対応する上位バンドのアロケーション情報が論理値“０”となるオーディオフレームが所定数以上続いた場合に、上記上位バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって上記音声データに含まれる異常フレームを検出するエラー検出手段と、
上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
を含むことを特徴とする音声再生装置。
音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
アロケーション情報とそれに対応するサンプルデータ量との関係で予め形成されたテーブルと、
上記テーブルを参照してアロケーション情報に対応するサンプルデータ量の値を求め、その値が所定の基準値を越えるか否かを判定することにより、音声データに含まれる異常フレームを検出するエラー検出手段と、
上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
を含むことを特徴とする音声再生装置。
フレーム毎の情報解析により各サブバンド毎のサンプルデータを抽出するパーサ処理手段を含み、且つ、上記修復手段は、上記圧縮された音声データを複数フレーム分記憶可能な記憶手段と、
上記エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、上記記憶手段から上記パーサ処理手段へ転送制御可能な制御手段と、
を含む請求項１乃至３のいずれか１項記載の音声再生装置。
上記修復手段は、上記異常フレームにおける全てのサブフレームを、上記異常フレームの直前の正常フレームにおける最終サブフレーム、又は上記異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換えてサブバンド毎のサンプルデータを抽出するパーサ処理手段と、
上記エラー検出手段の検出結果に基づいて、上記パーサ処理手段の動作を制御する制御手段とを含む請求項１乃至３のいずれか１項記載の音声再生装置。