JP3596978B2 - 音声再生装置 - Google Patents

音声再生装置 Download PDF

Info

Publication number
JP3596978B2
JP3596978B2 JP11911696A JP11911696A JP3596978B2 JP 3596978 B2 JP3596978 B2 JP 3596978B2 JP 11911696 A JP11911696 A JP 11911696A JP 11911696 A JP11911696 A JP 11911696A JP 3596978 B2 JP3596978 B2 JP 3596978B2
Authority
JP
Japan
Prior art keywords
data
frame
audio
abnormal
abnormal frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11911696A
Other languages
English (en)
Other versions
JPH09307508A (ja
Inventor
智 倉田
規 斉藤
竜一 村島
俊郎 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Technology Corp
Hitachi Solutions Technology Ltd
Original Assignee
Renesas Technology Corp
Hitachi ULSI Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Technology Corp, Hitachi ULSI Systems Co Ltd filed Critical Renesas Technology Corp
Priority to JP11911696A priority Critical patent/JP3596978B2/ja
Publication of JPH09307508A publication Critical patent/JPH09307508A/ja
Application granted granted Critical
Publication of JP3596978B2 publication Critical patent/JP3596978B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、圧縮された音声データを伸長して再生する音声再生装置に関し、例えばMPEG(Moving Picture Experts Group、メディア統合動画像圧縮の国際標準;エムペグ)オーディオに適用して有効な技術に関する。
【0002】
【従来の技術】
MPEGオーディオは、高品質、高能率ステレオ符号化のISO/IEC標準方式であり、ISO/IEC SC29/WG11に設置されたMPEG委員会の中で動画像の符号化と平行して標準化されている。圧縮には32バンド・サブバンド・コーディング(帯域分割符号化)とMDCT(変形離散コサイン変換)が利用され、聴覚心理的な特性を利用して高効率圧縮を実現している。
【0003】
MPEGオーディオは、MPEGビディオと組合わされることによって、高効率のマルチメディア情報の圧縮を実現することができ、非圧縮のディジタルオーディオと比べて音質劣化がほとんど無い。また、MPEGオーディオはMPEGビディオと組合わせるだけでなく、DAB(ディジタル音楽放送)などに単独で使用することもできる。
【0004】
そのようなMPEGオーディオ技術においては、圧縮された音声データのエンコード時に、圧縮音声データに設けられたCRC(Cyclic Redundancy Check;巡回冗長検査)情報によりデータエラーが発生したか否かを判定することができる。その判定において、もしデータエラーが発生したと判断された場合には、不所望な音(ノイズ)がスピーカから出力されないように音声出力を中断(ミュートと称される)してから、当該エラーにかかるデータについての伸長圧縮処理を再開する方式が採用される。
【0005】
尚、MPEGオーディオについて記載された文献の例としては、1994年8月1日に株式会社アスキーから発行された「ポイント図解式最新MPEG教科書(第167頁〜第187頁)」がある。
【0006】
【発明が解決しようとする課題】
しかしながら、CRCによるデータエラー判別においてデータエラーが発生した場合に音声出力を中断する方式によれば、データエラー発生時にスピーカからの音声出力が中断されてしまうため、聴覚心理的に聞きづらい状態を形成するのが否めない。音声出力の中断が、聴覚心理的に一種のノイズと考えられるからである。
【0007】
また、MPEGオーディオにおいて、CRCは必ず設定されるものではなく、音声圧縮処理における設定に依存されるから、仮にMPEGオーディオ再生において、CRCに基づくエラー判別及び処理(音声出力の中断)を採用したとしても、圧縮された音声データにおいてCRCが設定されていない場合には、音声出力の中断が行われないから、誤ったデータの伸長処理結果がそのままスピーカから出力されることになる。この場合のスピーカから出力は、非常に耳障りなノイズとして感じられる。
【0008】
本発明の目的は、圧縮データに基づく音声再生におけるノイズ低減を図るための技術を提供することにある。
【0009】
本発明の前記並びにその他の目的と新規な特徴は本明細書の記述及び添付図面から明らかになるであろう。
【0010】
【課題を解決するための手段】
本願において開示される発明のうち代表的なものの概要を簡単に説明すれば下記の通りである。
【0011】
すなわち、圧縮された音声データの伸長前に、当該音声データに含まれる異常部位を検出するエラー検出手段(19)と、検出された異常部位のデータを、当該異常部位の直前又は直後に存在する正常部位のデータに置換えることで、上記異常部位を修復するための修復手段(10,17、又は13,17)とを含んで音声再生装置を構成する。上記した手段によれば、修復手段は上記エラー検出手段の検出結果に基づいて異常部位の修復を行い、このことが、圧縮データに基づく音声再生におけるノイズ低減を達成する。
【0012】
ヘッダに基づいて算出された上記オーディオフレームのサイズをXで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをYで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をZで示すとき、X<Y+Zが成立するか否かを判別することにより、音声データに含まれる異常フレームを検出するエラー検出手段(19)と、上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段(10,17)とを含んで音声再生装置を構成することができる。
【0013】
上記エラー検出手段は、オーディオ周波数の高域に対応する上位バンドのアロケーション情報が論理値“0”となるオーディオフレームが所定数以上続いた場合に、上記上位バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって音声データに含まれる異常フレームを検出するように構成することができる。
【0014】
また、アロケーション情報に対応するサンプルデータ量の値を得るためのテーブルと、このテーブルを参照してアロケーション情報に対応するサンプルデータ量のおおよその値を求め、その値が所定の基準値を越えるか否かを判定することにより、音声データに含まれる異常フレームを検出するようにエラー検出手段を形成することができる。
【0015】
さらに、圧縮された音声データに設けられた巡回冗長検査情報又は誤り訂正符号に基づいて、上記音声データに含まれる異常フレームを検出するようにエラー検出手段を形成することができる。
【0016】
上記修復手段は、上記圧縮された音声データを複数フレーム分記憶可能な記憶手段(10)と、上記エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、上記記憶手段から上記パーサ処理手段(13)へ転送制御可能な制御手段(17)とを含んで形成することができる。また、上記修復手段は、上記異常フレームにおける全てのサブフレームを、異常フレームの直前の正常フレームにおける最終サブフレーム、又は異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換してサブバンド毎のサンプルデータを抽出するパーサ処理手段(13)と、上記エラー検出手段の検出結果に基づいて、パーサ処理手段の動作を制御する制御手段(17)とを含んで形成することができる。
【0017】
【発明の実施の形態】
図1には本発明にかかる音声再生装置の一実施形態例が示される。
【0018】
図1に示される音声再生装置は、特に制限されないが、MPEGオーディオ技術によって形成された圧縮された音声データ(「圧縮音声データ」と称する)を数フレーム分FIFO(先入れ先出し)方式で蓄積可能なバッファメモリ10と、このバッファメモリ10の後段に配置され、バッファメモリ10から伝達された圧縮音声データを伸長して音声を再生するための音声再生部11と、この音声再生部11の後段に配置され、音声再生部11の出力信号を増幅してスピーカ21を駆動するためのアンプ20とを含む。
【0019】
上記バッファメモリ10に入力される圧縮音声データは、特に制限されないが、MPEGオーディオ技術により形成されたものとされる。MPEGオーディオ規格では、音声信号を例えば1152サンプル毎に分割してフレームを形成し、このフレーム毎に圧縮処理を行うようになっている。この圧縮処理においては、特に制限されないが、音声を受ける人間の感覚の性質を利用して、感度の低い細部の情報を省略して符号量を削減していく方式(知覚符号化と称される)が採用される。
【0020】
特に制限されないが、音声再生部11は、RAM(ランダム・アクセス・メモリ)12,15、パーサ処理部13、サブバンドフィルタ14、出力部16、ヘッダ検出部18、エラー検出処理部19、及び制御部17を含む。上記パーサ処理部13、サブバンドフィルタ14、出力部16、ヘッダ検出部18、エラー検出処理部19、及び制御部17は、特に制限されないが、公知の半導体集積回路製造技術により単結晶シリコン基板などの一つの半導体基板に形成することができる。
【0021】
パーサ処理部13は、バッファメモリ10から伝達された圧縮音声データのフレーム毎の解析を行うことで、各サブバンド毎のサンプルデータを抽出する機能を有する。パーサ処理部13の後段にはサブバンドフィルタ14が配置される。このサブバンドフィルタ14は、上記パーサ処理部13によって抽出されたサンプルデータを処理して音声データを伸長する機能を有する。サブバンドフィルタ14の後段には、上記サブバンドフィルタ14からのデジタルの出力データをアナログ信号にD/A変換して後段のアンプ20に出力するための出力部16が配置される。そして、バッファメモリ10から出力された圧縮音声データのフレーム毎のヘッダを検出するためのヘッダ検出部18、及び上記バッファメモリ10から出力された圧縮音声データに含まれる異常部位を検出するためのエラー検出処理部19が設けられ、さらに、上記ヘッダ検出部18の検出結果、及びエラー検出処理部19の検出結果に基づいて上記バッファメモリ10、パーサ処理部13、サブバンドフィルタ14、及び出力部16の動作を制御する制御部17が設けられている。第1RAM12は、上記パーサ処理部13でのサンプルデータ抽出処理における作業領域として使用され、また、第2RAM15は上記出力部16でのD/A変換処理における作業領域として使用される。ハードウェア的に一つのRAMの記憶エリアを2分割して使用することで、上記第1RAM12及び上記第2RAM15を形成することができる。
【0022】
図2にはこの音声再生装置に入力される圧縮音声データの形式が示される。
【0023】
特に制限されないが、MPEGオーディオ技術において、音声信号が1152サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、圧縮音声データが形成される。この音声圧縮データの一つのフレームは、図2に示されるように、それ自体単独で音声に復号できる最小単位であり、一定のサンプル数のデータを含む。一つのフレームは、図2に示されるように、ヘッダ、アロケーション情報、スケールファクタ情報、サンプルデータ、及びアンシラリデータを含む。ヘッダは、32ビット固定長とされ、同期ワード(12ビット)、ID(1ビット)、レイヤ(2ビット)、プロテクションビット(1ビット)、ビットレート・インデックス(4ビット)、サンプリング周波数(2ビット)、パディングビット(1ビット)、プライベートビット(1ビット)、モード(2ビット)、モード拡張(2ビット)、コピーライト(1ビット)、オリジナル/コピー(1ビット)、及びエンファシス(2ビット)から成る。
【0024】
ヘッダに続くアロケーション情報、スケールファクタ情報、及びサンプルデータは、オーディオ・データと総称され、上記ヘッダからオーディオ・データまでが、音声を再生するために使用される可変長データとされる。オーディオ・データの終りがオーディオ復号単位(AAU)に達しない場合、残りの部分がアンシラリデータとされる。このアンシラリデータはMPEGオーディオ以外の任意のデータを挿入することができる。MPEG2オーディオではこのアンシラリデータに、マルチチャネル、マルチリンガルのデータが挿入される。
【0025】
アロケーション情報は、サンプルデータ中の各サブバンド、各チャネル毎にビット数を割当てている情報であり、図4に示されるように、4ビット構成の情報とされ、正常な情報であれば割当てビット数から算出された値は、サンプルデータのサイズと合致する。
【0026】
32のサブバンドについて、2チャネルのデータ(シングル・チャネルのときは1チャネル)がそれぞれ符号化される。また、バウンド(Bound)で指定されるサブバンド以上については1チャネルのみ符号化される。
【0027】
スケールファクタは、各サブバンド、各チャネル毎の波形の再生音の倍率を示しており、各6ビットで表される。スケールファクタは、アロケーション情報で0ビットが指定されたものについては省略される。ジョイント・ステレオ・モードで、バウンドに指定されたサブバンド以上についてはモノラル符号化されるが、スケールファクタは2チャネル分が独立に符号化される。
【0028】
サンプルデータには、1サンプル当りアロケーションで指定されたビット数が割り当てられる。ジョイント・ステレオ・モードの場合、バウンドで指定されたサブバンド以上については、ジョイント・ステレオ符号となり、サンプルとしては1チャネル分のみが符号化される。波形的には左右同一とされ、スケール・ファクタによる音量差でステレオ効果を出す。
【0029】
次に、異常部位の検出及び修復について、図3のフローチャートに基づいて説明する。
【0030】
エラー検出処理部19では、先ず、バッファメモリ10から出力されるオーディオフレームのヘッダに基づいてオーディオフレームのサイズが算出される(ステップS21)。このオーディオフレームのサイズをXで示す。次に、ヘッダからサンプルデータの直前までのサイズが計数される(ステップS22)。このヘッダからサンプルデータの直前までのサイズをYで示す。そして、アロケーション情報から、サブバンド毎に設定されたサンプルデータのサイズの合計値を求める。このサンプルデータのサイズの合計値をZで示す。
【0031】
そして、X<Y+Zが成立するか否かの判別が行われ、その判別において、X<Y+Zが成立しない(NO)と判断された場合には、圧縮音声データに異常部位が含まれないので、データ置換処理が行われることなく、オーディオフレームのデコードが行われる(ステップS26)。また、上記ステップS24の判別において、X<Y+Zが成立する(YES)と判断された場合には、データ修復のためのデータ置換処理が行われてから(ステップS25)、オーディオフレームのデコードが行われる(ステップS26)。
【0032】
ここで、上記ステップS24での判別について詳述する。
【0033】
データエラーがサンプルデータの領域で生じても、特定のサンプルデータが被るだけであり大きなノイズにはならない。しかし、アロケーション情報の異常を引き起こすと大きなノイズを発生させる可能性が生じる。アロケーション情報が異常に大きくなっている場合は、高域成分に多くのサンプルデータが割当てられている可能性が高い。高域成分に多くのサンプルデータが割当てられていると、その場合の再生音は、聴覚の性質上、非常に耳障りとなる。
【0034】
また、サンプルデータ量が大き過ぎると、次のフレームにオーバーラップしてマスクされる危険もある。そこで、図2に示されるように、ヘッダからサンプルデータの直前までのサイズYと、アロケーション情報から求められたサンプルデータ合計値Zとの加算値が(Y+Z)が、ヘッダに基づいて算出されたオーディオフレームサイズXよりも大きくなる場合を異常と判断して、データ置換による修復を行うようにしている。尚、ヘッダからサンプルデータの直前までのサイズYと、アロケーション情報から求められたサンプルデータ合計値Zとの加算値(Y+Z)が、ヘッダに基づいて算出されたオーディオフレームサイズXよりも小さい場合には、MPEGの規格上異常フレームと判定することができないので、データ置換による修復は行わない。
【0035】
上記ステップS24の判別において、X<Y+Zが成立する(YES)と判断されたにもかかわららず、それをそのままにすると、スピーカ21から非常に耳障りなノイズが出力される恐れがあるので、そのような耳障りなノイズが出力されないように、異常部位の修復が行われてからデコードされるようになっている。
【0036】
異常部位の修復は次のように行われる。
【0037】
異常部位をフレーム単位で単に削除しただけでは、オーディオの再生時間が短くなったり、曲調に違和感を生ずることがある。そこで、図5に示されるように、異常フレームBに代えて、その異常フレームBの直前に位置する正常フレームAを使用するようにする。すなわち、異常フレームBをデコードに使わないで、その異常フレームBの代わりに正常フレームAのデータを使用する。その結果、修復後の圧縮音声データのフレーム配列は、再生方向に、フレームA、フレームA、フレームC、フレームDの順とされ、フレームAが2回続く。そのようなデータ置換は、図1に示されるバッファメモリ10からパーサ処理部13へのフレーム転送制御を制御部17で制御することによって可能とされる。つまり、バッファメモリ10から異常フレームBが出力されて、エラー検出処理部19により、当該異常フレームBが検出された場合に、制御部17の制御により、パーサ処理部13での当該異常フレームBについての処理が中止され、直前の正常フレームAが、バッファメモリ10からパーサ処理部13へ再送される。それにより、パーサ処理部13では、異常フレームBに代えて正常フレームAについての処理が行われることになる。異常フレームBと正常フレームAとは互いに隣り合うフレームであり、しかもMPEGオーディオにおける1フレームの再生音が約30ms(ミリ秒)であることを考えると、異常フレームBを正常フレームAに置換したことの再生音への影響を人間の聴覚で識別するのは非常に困難である。そのようなデータ修復により、例え圧縮音声データに異常フレームが存在していても、上記したデータ置換によるデータ修復が行われることで、スピーカ21からの再生音に耳障りなノイズが含まれるのを防止することができる。
【0038】
図5に示されるデータ修復では、異常フレームBの直前に存在する正常フレームを使用するようにしたが、図6に示されるように、異常フレームBの直後に存在する正常フレームCを使用するようにしても良い。すなわち、上記の例に従えば、パーサ処理部13で異常フレームBについての処理を行わない代りに、バッファメモリ10からパーサ処理部13へのデータ転送において、正常フレームCについての転送を続けて2回行うようにし、異常フレームBについての処理に代えて、正常フレームCについての処理を2回行うにする。そのようにしても、上記したデータ置換による修復が行われることで、スピーカ21からの再生音に耳障りなノイズが含まれるのを防止することができる。
【0039】
図7、及び図8には異常フレームB,Cが連続する場合のデータ修復方法が示される。
【0040】
すなわち、異常フレームB,Cが連続して存在する場合には、図7に示されるように、異常フレームB,Cに代えて、その異常フレームB,Cの直前の正常フレームAを使用するか、あるいは図8に示されるように、異常フレームB,Cに代えて、その異常フレームB,Cの直後の正常フレームDを使用すれば、スピーカ21からの再生音に耳障りなノイズが含まれるのを防止することができる。
【0041】
エラー検出を次のように行っても良い。
【0042】
例えば図14に示されるように、アロケーション情報から算出されたサンプルデータ量の合計に、フレームトップアドレスからサンプルトップアドレス間のデータ量を合計した値が、オーディオフレームの規格サイズを越えた場合に、当該フレームを異常と判断し、その異常フレームについて上記のように修復する。
【0043】
上記実施態様によれば、以下の作用効果を得ることができる。
【0044】
(1)異常フレームBをデコードに使わないで、その異常フレームBの代わりに正常フレームAを割当てることで、修復後の圧縮音声データのフレーム配列は、再生方向に、フレームA、フレームA、フレームC、フレームDの順とされ、それにより、パーサ処理部13では、異常フレームBに代えて正常フレームAについての処理が行われることになる。異常フレームBと正常フレームAとは互いに隣り合うフレームであり、しかも1フレームの再生音が約30ms(ミリ秒)であることを考えると、異常フレームBを正常フレームAに置換したことの再生音への影響を人間の聴覚で識別するのは非常に困難であるから、上記したデータ置換によるデータ修復が行われることで、スピーカ21からの再生音に、音声の中断などの耳障りなノイズが含まれるのを防止することができる。
【0045】
(2)上記のデータ修復は、制御部17の制御によりバッファメモリ10の読出しアドレス制御によって容易に実現することができる。
【0046】
次に、他の実施形態について説明する。
【0047】
図10には本発明にかかる音声再生装置の別の実施形態例が示される。
【0048】
図1に示される音声再生装置が図1に示されるのと大きく相違するのは、バッファメモリ10が省略されている点である。つまり、図1に示される構成ではバッファメモリ10からパーサ処理部13へのデータ転送を制御部17で制御することにより、異常フレームを正常フレームに置換することにより、フレーム単位でデータ修復が行われたが、図10に示される音声再生装置では、パーサ処理部13において、正常フレームに含まれる一つのサブフレームを利用してデータ修復が行われる。サブフレームは、例えばオーディオフレームの1/36のサイズであり、図1に示されるバッファメモリ10などのように複数フレーム分を記憶するためのメモリは不要である。サブフレームを利用したデータ修復には、第1RAM12などの比較的小さな作業領域があればそれで十分とされる。
【0049】
MPEG1のオーディオレイヤ2においては、一つのオーディオフレームは1152のサンプルデータから構成されており、1フレームは、36個のサブフレームに細分化される。1サブフレームは32個のサンプルデータから成る。そこで、エラー検出処理部19においてエラー検出が行われた場合には、図11に示されるように、異常フレームBの直前に存在する正常フレームAにおけるサブフレーム、又は異常フレームBの直後に存在する正常フレームCにおけるサブフレームを利用して異常フレームのデータ修復を行う。例えば図11に示される修復例では、正常フレームAの最終サブフレームA36が利用され、異常フレームBの全てのサブフレームB1〜B36のデータに代えてサブフレームA36のデータが使用される。その結果、異常フレームBにおけるサブフレームB1〜B36に代えて、サブフレームA36が36回繰返し再生される。
【0050】
また、図12に示される修復例では、正常フレームCの先頭サブフレームC1が利用され、異常フレームBの全てのサブフレームB1〜B36のデータに代えてサブフレームC1のデータが使用される。その結果、異常フレームBにおけるサブフレームB1〜B36に代えて、サブフレームC1が36回繰返し再生される。
【0051】
さらに、異常フレームが2フレーム連続して存在する場合にも、上記したように、異常フレームの直前又は直後のサブフレームを利用することでデータ修復を行うことができる。例えば図7又は図8に示されるように異常フレームB,Cが存在する場合には、異常フレームB,Cに代えて、正常フレームAにおける最終サブフレーム、又は正常フレームDにおける先頭サブフレームを72回繰返し再生すれば良い。
【0052】
エラー検出処理19によるエラー検出の他の方式について説明する。
【0053】
MPEGオーディオレイヤ2の場合、アロケーション情報は、4ビット幅、3ビット幅、2ビット幅の3種類の読出し幅によりアロケーションテーブルが異なり、2ビット幅のテーブルでの処理の負担が一番小さい。上位5バンドはオーディオ周波数の高域に対応しており、通常は、データ量の低減のため、上位5バンドには大きなデータを割当てないようにしている。そのため、上位5バンドのデータ量に基づいてエラー判定を行うことができる。つまり、上記5バンドに対して2ビット幅で読出し、算出されたサンプルデータ量に基づいてエラー判定を行うことができる。基本的には、上位5バンドのサンプルデータの合計値が所定値を越えた場合を異常とすることができるが、正常なオーディオフレームのなかにも上位5バンドに大きなサンプルデータが割当てられていることも考えられるので、その場合も考慮すれば、図13に示されるように、2ステップを経て異常判別を行うようにするのが良い。図13に示されるように、上位5バンドのアロケーション情報が、論理値“0”であるオーディオフレームが一定フレーム数以上続いたか否かの判別を行い(ステップS31)、この判別において一定フレーム以上続いた(YES)と判断された場合には、上位5バンドのサンプルデータ量が一定の値を越えたか否かの判別が行われる(ステップS32)。このステップS32の判別において一定の値を越えたと判断された場合には、異常と判断される(ステップS33)。すなわち、この場合はオーディオ周波数の高域が連続して無い状態から、オーディオ周波数の高域を一定のデータ量以上に含む状態に突然変化するというのは、前者の正常な状態から後者の異常な状態に変化したと理解すべきであり、後者の異常な状態においてデータ修復が行われる。このようにして、異常と判断された場合には、対応データについて上記した方式でデータ修復が行われる。
【0054】
また、上記ステップS31において一定フレーム以上続かない(NO)と判断された場合、及び上記ステップS32の判別において一定の値を越えない(NO)と判断された場合には、正常と判断され(ステップS34)、その場合、データ修復は行われない。
【0055】
以上のように、正常なオーディオフレームのなかにも上位5バンドに大きなサンプルデータが割当てられていることも考慮して、上位5バンドのアロケーション情報が論理値“0”であるフレームが所定数以上続いることを、先ず最初に判定し、前のオーディオフレームとの相関が見られず、しかも所定数以上の大きなサンプルデータ量が割当てられているオーディオフレームを異常とし、その場合に、上記したオーディオフレームのデータ置換を行うことで、ノイズ低減を図ることができる。
【0056】
また、図1のエラー検出処理部19のエラー検出を次のように行うようにしても良い。
【0057】
アロケーション情報からサンプルデータ量を算出せず、予め形成されたテーブルを参照することにより、対応するサンプルデータ量のおおよその値を得る。すなわち、図15に示されるように、アロケーションビット(4ビット構成)の重み付けに従った概算の割合に換算するテーブルを図1のエラー検出処理部19内部のROM(リード・オンリー・メモリ)として形成し、そのテーブルに従い、4ビット幅、3ビット幅、2ビット幅でそれぞれ読出されたアロケーションデータの合計値を算出し、それが所定の大きさになる場合に、アロケーション情報に格納されたサンプルデータ量が、実際のサンプルデータ量を越えるものとみなして、そのオーディオフレームを異常と判断する。異常と判断されたフレームについて上記データ置換による修復を行うことで、ノイズ低減を図ることができる。このエラー検出方式では、全てのサンプルデータ量を算出するのに比べて演算処理の負担が軽減されるという利点がある。
【0058】
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
【0059】
例えば、図7や図8に示されるように、異常フレームB,Cが連続して存在する場合に、異常フレームBについては、その異常フレームBの直前の正常フレームAを利用してデータ置換による修復を行い、異常フレームCについては、その異常フレームCの直後に存在する正常フレームDを利用してデータ置換による修復を行うようにしても良い。
【0060】
図9に示されるように、異常フレームB,C,Dが連続して存在する場合には、フレームが3フレーム以上連続して存在する場合には、データ置換による修復を行わずに、当該異常フレームについてミュートをかけて無音状態を形成したほうが好ましい場合がある。特に、異常フレームが5フレーム以上連続して存在する場合には、一旦リセットしてから再生を行うようにすることができる。
【0061】
また、上記した実施形態例でのエラー検出(異常フレーム検出)を実現する場合、伸長対象とされる圧縮音声データは、エラー検出のための特別の符号を付加する必要がないが、そのような符号が、予め圧縮音声データに形成されるのを前提とすれば、パリティチェックや、CRCなどの誤り検出技術を利用することにより、データエラーを検出し、その検出結果に基づいてデータ修復を行うようにしても良い。パリティチェックは、nビットの中の1つのビットの個数が常に偶数(又は奇数)になるように定め、上記nビットの中で1つのビットが誤って反転した場合を検出することができる。連続した文字列の中の各文字コードの同じ桁同士のパリティチェックを行う場合もある。CRCは、CCITTやISOなどの国際機関で勧告された生成多項式を利用して誤り検出を行う技術であり、バースト誤りや、ランダム誤り検出能力を有する。上記したパリティチェック機能やCRCに基づく誤り検出機能を、例えば図1におけるエラー検出処理部19で実現することで、圧縮音声データのエラー検出を行うことができる。
【0062】
さらに、上記実施形態例ではMPEGオーディオのレイヤ2の仕様を用いて説明したが、レイヤ2以外、例えばレイヤ1の仕様を採用しても良い。
【0063】
上記実施形態例では、5バンドのアロケーション情報が、論理値“0”であるオーディオフレームが一定フレーム数以上続いたか否かの判別や、上位5バンドのサンプルデータ量が一定の値を越えたか否かの判別を行うようにしたが、処理速度との関係で適宜にバンド数を変更することができる。
【0064】
以上の説明では主として本発明者によってなされた発明をその背景となった利用分野であるMPEGオーディオに適用した場合について説明したが、本発明はそれに限定されるものではなく、例えばドルビーAC3などのディジタルオーディオ技術に広く適用することができる。
【0065】
本発明は、少なくとも圧縮された音声データを伸長して再生することを条件に適用することができる。
【0066】
【発明の効果】
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば下記の通りである。
【0067】
すなわち、圧縮された音声データの伸長前に、この音声データに含まれる異常部位を検出するエラー検出手段と、検出された異常部位のデータを、異常部位の直前又は直後に存在する正常部位のデータに置換えることで、異常部位を修復するための修復手段とを有することにより、エラー検出手段の検出結果に基づいて異常部位の修復が行われ、それにより圧縮データに基づく音声再生におけるノイズ低減を図ることができる。
【0068】
ヘッダに基づいて算出された上記オーディオフレームのサイズをXで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをYで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をZで示すとき、X<Y+Zが成立するか否かを判別して、音声データに含まれる異常フレームを検出することにより、伸長対象とされる圧縮音声データに、異常フレーム検出のための特別な符号を埋込むこと無く、データ修復のための異常フレーム検出を的確に行うことができる。
【0069】
上位5バンドのアロケーション情報が論理値“0”となるオーディオフレームが所定数以上続いた場合に、上記5バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって音声データに含まれる異常フレームを検出することにより、伸長対象とされる圧縮音声データに、異常フレーム検出のための特別な符号を埋込むこと無く、データ修復のための異常フレーム検出を的確に行うことができる。
【0070】
アロケーション情報に対応するサンプルデータ量のおおよその値を得るためのテーブルを参照してアロケーション情報に対応するサンプルデータ量の値を求め、その値が所定の基準値を越えるか否かを判定することにより、異常フレーム検出における演算処理の負荷軽減を図ることができる。これは、異常フレーム検出処理時間を短縮する上で有効とされる。
【0071】
圧縮された音声データに設けられた巡回冗長検査情報又は誤り訂正符号に基づいて、音声データに含まれる異常フレームを検出するエラー検出手段を設けた場合には、伸長対象とされる圧縮音声データに巡回冗長検査情報又は誤り訂正符号が埋込まれている場合に有効である。
【0072】
圧縮された音声データを複数フレーム分記憶可能な記憶手段と、エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、記憶手段からパーサ処理手段へ転送制御可能な制御手段とを含んで修復手段を形成することができ、その場合には、パーサ処理手段として既存のものを大幅な回路変更無しに適用することができる。
【0073】
異常フレームにおける全てのサブフレームを、異常フレームの直前の正常フレームにおける最終サブフレーム、又は異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換することでデータ修復を行う場合には、そのようなデータ修正に必要とされる作業領域が小さくて済む。
【図面の簡単な説明】
【図1】本発明にかかる音声再生装置の一実施形態例の構成ブロック図である。
【図2】上記音声再生装置に入力される圧縮音声データの説明図である。
【図3】上記音声再生装置における異常部位の検出及び修復についてのフローチャートである。
【図4】上記音声再生装置において取扱われる圧縮音声データにおけるアロケーション情報の構成説明図である。
【図5】上記音声再生装置におけるデータ置換処理についての説明図である。
【図6】上記音声再生装置におけるデータ置換処理についての説明図である。
【図7】上記音声再生装置におけるデータ置換処理についての説明図である。
【図8】上記音声再生装置におけるデータ置換処理についての説明図である。
【図9】上記音声再生装置において3個の異常フレームが存在する場合の説明図である。
【図10】本発明にかかる音声再生装置の他の実施形態例の構成ブロック図である。
【図11】図10に示される音声再生装置におけるデータ置換処理についての説明図である。
【図12】図10に示される音声再生装置におけるデータ置換処理についての説明図である。
【図13】図10に示される音声再生装置における異常部位の検出についてのフローチャートである。
【図14】図1に示される音声再生装置におけるデータ置換処理についての説明図である。
【図15】図10に示される音声再生装置におけるデータ置換処理で参照されるテーブルの説明図である。
【符号の説明】
10 バッファメモリ
11 音声再生部
12 第1RAM
13 パーサ処理部
14 サブバンドフィルタ
15 第2RAM
16 出力部
17 制御部
18 ヘッダ検出部
19 エラー検出部
20 アンプ
21 スピーカ

Claims (5)

  1. 音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
    上記ヘッダに基づいて算出された上記オーディオフレームのサイズをXで示し、上記ヘッダ、上記アロケーション情報、及びスケールファクタ情報の合計サイズをYで示し、上記アロケーション情報に基づいて算出されたサンプルデータ量をZで示すとき、X<Y+Zが成立するか否かを判別することにより、音声データに含まれる異常フレームを検出するエラー検出手段と、
    上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
    を含むことを特徴とする音声再生装置。
  2. 音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
    オーディオ周波数の高域に対応する上位バンドのアロケーション情報が論理値“0”となるオーディオフレームが所定数以上続いた場合に、上記上位バンドのサンプルデータ量が所定値を越えるか否かの判別を行うことによって上記音声データに含まれる異常フレームを検出するエラー検出手段と、
    上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
    を含むことを特徴とする音声再生装置。
  3. 音声信号が所定サンプル単位のフレームに分割されてフレーム単位で圧縮処理されることにより、ヘッダ、アロケーション情報、スケールファクタ情報、及びサンプルデータを含むオーディオフレームが複数形成されるとき、上記複数のオーディオフレームを順次取込んで伸長することにより音声を再生する音声再生装置において、
    アロケーション情報とそれに対応するサンプルデータ量との関係で予め形成されたテーブルと、
    上記テーブルを参照してアロケーション情報に対応するサンプルデータ量の値を求め、その値が所定の基準値を越えるか否かを判定することにより、音声データに含まれる異常フレームを検出するエラー検出手段と、
    上記エラー検出手段によって検出された異常フレームのデータをその異常フレームの直前又は直後に存在する正常フレームのデータに置換えることで、上記異常フレームを修復するための修復手段と、
    を含むことを特徴とする音声再生装置。
  4. フレーム毎の情報解析により各サブバンド毎のサンプルデータを抽出するパーサ処理手段を含み、且つ、上記修復手段は、上記圧縮された音声データを複数フレーム分記憶可能な記憶手段と、
    上記エラー検出手段の検出結果に基づいて、異常フレームの直前又は直後に存在する正常フレームのデータを、異常フレーム置換用データとして、上記記憶手段から上記パーサ処理手段へ転送制御可能な制御手段と、
    を含む請求項1乃至3のいずれか1項記載の音声再生装置。
  5. 上記修復手段は、上記異常フレームにおける全てのサブフレームを、上記異常フレームの直前の正常フレームにおける最終サブフレーム、又は上記異常フレームの直後の正常フレームにおける先頭サブフレームのデータに置換えてサブバンド毎のサンプルデータを抽出するパーサ処理手段と、
    上記エラー検出手段の検出結果に基づいて、上記パーサ処理手段の動作を制御する制御手段とを含む請求項1乃至3のいずれか1項記載の音声再生装置。
JP11911696A 1996-05-14 1996-05-14 音声再生装置 Expired - Fee Related JP3596978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11911696A JP3596978B2 (ja) 1996-05-14 1996-05-14 音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11911696A JP3596978B2 (ja) 1996-05-14 1996-05-14 音声再生装置

Publications (2)

Publication Number Publication Date
JPH09307508A JPH09307508A (ja) 1997-11-28
JP3596978B2 true JP3596978B2 (ja) 2004-12-02

Family

ID=14753335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11911696A Expired - Fee Related JP3596978B2 (ja) 1996-05-14 1996-05-14 音声再生装置

Country Status (1)

Country Link
JP (1) JP3596978B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100300887B1 (ko) * 1999-02-24 2001-09-26 유수근 디지털 오디오 데이터의 역방향 디코딩 방법
JP2007010855A (ja) * 2005-06-29 2007-01-18 Toshiba Corp 音声再生装置
JP5047519B2 (ja) * 2006-03-24 2012-10-10 パイオニア株式会社 デジタル音声データ処理装置及び処理方法
JP4726088B2 (ja) * 2008-01-31 2011-07-20 富士通テン株式会社 デジタルデータ処理装置および音響再生装置
JP4557267B2 (ja) * 2008-09-12 2010-10-06 株式会社河合楽器製作所 電子楽器演奏システム
US20120300100A1 (en) * 2011-05-27 2012-11-29 Nikon Corporation Noise reduction processing apparatus, imaging apparatus, and noise reduction processing program
JP6061476B2 (ja) * 2012-03-02 2017-01-18 キヤノン株式会社 音声処理装置

Also Published As

Publication number Publication date
JPH09307508A (ja) 1997-11-28

Similar Documents

Publication Publication Date Title
US6446037B1 (en) Scalable coding method for high quality audio
JP5166241B2 (ja) 音声メタデータ確認
KR100904626B1 (ko) Mp3용 트릭 플레이
EP1685565B1 (en) Frame-based audio transmission /storage with cross-fading to remove artifacts
US20070036228A1 (en) Method and apparatus for audio encoding and decoding
JP2001344905A (ja) データ再生装置、その方法及び記録媒体
JP3596978B2 (ja) 音声再生装置
JP4504572B2 (ja) 符号化された信号への補足データの組み込み
US7054380B2 (en) Embedding a first digital information signal into a second digital information signal for transmission via a transmission medium
EP0725385B1 (en) Sub-band audio signal synthesizing apparatus
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JP2004109362A (ja) フレーム構造のノイズ除去装置、フレーム構造のノイズ除去方法およびフレーム構造のノイズ除去プログラム
KR100472402B1 (ko) 복수의정보신호의부호화장치및방법
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JPH07177121A (ja) 情報多重装置
KR0178731B1 (ko) 디지탈 오디오신호의 에러 보정방법 및 이를 이용한 서브밴드복호화장치
JP2902903B2 (ja) オーディオ復号回路及び方法
JP4465075B2 (ja) データストリーム処理方法およびデコーダとその使用方法
JP4530567B2 (ja) デジタルオーディオ復号装置
JP3606388B2 (ja) オーデイオデータ再生方法及びオーデイオデータ再生装置
JP2002073091A (ja) 復号装置
JPH0787031A (ja) 符号化信号復号化装置
JP2005234122A (ja) 画像符号化装置
JPH08162963A (ja) データ符号化装置および復号装置
JP2003005798A (ja) 記録装置および再生装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110917

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110917

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110917

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120917

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120917

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees