JPH10261964A - 情報信号処理装置 - Google Patents
情報信号処理装置Info
- Publication number
- JPH10261964A JPH10261964A JP9066270A JP6627097A JPH10261964A JP H10261964 A JPH10261964 A JP H10261964A JP 9066270 A JP9066270 A JP 9066270A JP 6627097 A JP6627097 A JP 6627097A JP H10261964 A JPH10261964 A JP H10261964A
- Authority
- JP
- Japan
- Prior art keywords
- data
- audio
- recording
- information signal
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 音声などのアナログ情報信号を高効率に符号
化して記録する。 【解決手段】 音声信号を所定のオーディオブロック
(AB)単位でデジタル記録し、再生するシステムであ
り、複数のAB間でABデータに所定の類似関係が存在
する場合又はABデータのピークレベルが所定レベル以
下の場合などに、該当するABデータの記録を省略し、
少なくとも1〜2のABデータを再利用する。また、A
Bデータの利用回数をモードデータに示し、ABデータ
と共に記憶装置に記憶させる。ABデータを再利用する
ことで、記録データ量を削減し、再生時はモードデータ
に示された回数ABデータを繰り返し使用する。更に、
再利用するかどうかの判断基準(類似程度又は指数レベ
ルのピーク)は自動又は任意に変更可能とすることで音
声記録装置としての利便性向上を図る。
化して記録する。 【解決手段】 音声信号を所定のオーディオブロック
(AB)単位でデジタル記録し、再生するシステムであ
り、複数のAB間でABデータに所定の類似関係が存在
する場合又はABデータのピークレベルが所定レベル以
下の場合などに、該当するABデータの記録を省略し、
少なくとも1〜2のABデータを再利用する。また、A
Bデータの利用回数をモードデータに示し、ABデータ
と共に記憶装置に記憶させる。ABデータを再利用する
ことで、記録データ量を削減し、再生時はモードデータ
に示された回数ABデータを繰り返し使用する。更に、
再利用するかどうかの判断基準(類似程度又は指数レベ
ルのピーク)は自動又は任意に変更可能とすることで音
声記録装置としての利便性向上を図る。
Description
【0001】
【発明の属する技術分野】本発明は、音声信号等のアナ
ログ情報信号を効率的に符号化してデジタル記録し、ま
た効率的に再生するための情報信号処理装置に関する。
ログ情報信号を効率的に符号化してデジタル記録し、ま
た効率的に再生するための情報信号処理装置に関する。
【0002】
【従来の技術】従来より、アナログの情報信号を符号化
してデジタル記録することが行われており、例えば、音
声信号はデジタルデータとして、CD(Compact Dis
c)やMD(Mini Disc)などにおいては、アナログ音
声信号がデジタル記録されている。
してデジタル記録することが行われており、例えば、音
声信号はデジタルデータとして、CD(Compact Dis
c)やMD(Mini Disc)などにおいては、アナログ音
声信号がデジタル記録されている。
【0003】また、留守番機能付き電話機等において音
声記録装置として半導体メモリを用い、このメモリに音
声信号をデジタル記録することも試みられている。半導
体メモリを用いた音声記録は、記録・再生が容易であ
り、また装置を小型化する上でも便利なことからその利
用が進んでいる。更に、半導体メモリの大容量化、低価
格化が進む中、音楽などの記録にも半導体メモリの利用
の可能性が提案されるようになっている。
声記録装置として半導体メモリを用い、このメモリに音
声信号をデジタル記録することも試みられている。半導
体メモリを用いた音声記録は、記録・再生が容易であ
り、また装置を小型化する上でも便利なことからその利
用が進んでいる。更に、半導体メモリの大容量化、低価
格化が進む中、音楽などの記録にも半導体メモリの利用
の可能性が提案されるようになっている。
【0004】このような音声信号のデジタル記録におい
ては、アナログ音声信号をデジタル信号に変換する際
に、なるべく原音に忠実に再生ができ、かつ、記録すべ
きデジタルデータ量ができるだけ少ないように符号化す
ることが望まれる。特に、半導体メモリを用いた音声記
録の場合、半導体メモリの低価格化が進んだとはいえ、
記録容量の大きいメモリは高価であるので、できる限り
高効率の符号化を行いデータ量を削減する必要がある。
ては、アナログ音声信号をデジタル信号に変換する際
に、なるべく原音に忠実に再生ができ、かつ、記録すべ
きデジタルデータ量ができるだけ少ないように符号化す
ることが望まれる。特に、半導体メモリを用いた音声記
録の場合、半導体メモリの低価格化が進んだとはいえ、
記録容量の大きいメモリは高価であるので、できる限り
高効率の符号化を行いデータ量を削減する必要がある。
【0005】音声信号の符号化にあたっては、時系列の
音声信号の瞬時値をデジタル値で示すPCM(Pulse Co
de Modulation)方式が一般的に用いられている。しか
し、PCM方式は、符号化の効率が悪く、再生音声の劣
化を防ぐためにサンプリング周波数Fsを高くしたり、
サンプリング値に対するビット割当数を多くするとデー
タ量が増加して記録時間が十分なものとならない。例え
ば、サンプリング周波数Fsを8KHzとし、8ビット
量子化を行うと、データ量は64Kbpsとなり、32
Mbitのメモリを用いても録音時間は、8分44秒で
あり、簡単な音声メモにしか利用することができない。
また、反対に、サンプリング周波数Fsやビット割当数
を下げることでデータ量を低減できるが、再生時の音質
の低下が著しい。
音声信号の瞬時値をデジタル値で示すPCM(Pulse Co
de Modulation)方式が一般的に用いられている。しか
し、PCM方式は、符号化の効率が悪く、再生音声の劣
化を防ぐためにサンプリング周波数Fsを高くしたり、
サンプリング値に対するビット割当数を多くするとデー
タ量が増加して記録時間が十分なものとならない。例え
ば、サンプリング周波数Fsを8KHzとし、8ビット
量子化を行うと、データ量は64Kbpsとなり、32
Mbitのメモリを用いても録音時間は、8分44秒で
あり、簡単な音声メモにしか利用することができない。
また、反対に、サンプリング周波数Fsやビット割当数
を下げることでデータ量を低減できるが、再生時の音質
の低下が著しい。
【0006】そこで、音声信号の符号化に離散コサイン
変換等の技術を用い、音声データを周波数軸上のデータ
に変換し、周波数帯域毎のデータとして符号化する手法
が提案されている。この手法によれば、各周波数帯域の
信号が失われることが少なく、デジタル化による誤差の
影響を小さくすることができ、音質の低下を防ぎ、より
効率的な符号化が可能となる。
変換等の技術を用い、音声データを周波数軸上のデータ
に変換し、周波数帯域毎のデータとして符号化する手法
が提案されている。この手法によれば、各周波数帯域の
信号が失われることが少なく、デジタル化による誤差の
影響を小さくすることができ、音質の低下を防ぎ、より
効率的な符号化が可能となる。
【0007】
【発明が解決しようとする課題】ここで、このような直
交変換を利用する符号化においては、各周波数帯域毎に
レベルデータ(またはこの差分)を得るが、データ量削
減のためには、各周波数帯域毎の割り当てビット数を減
らすことになる。音質を維持するためには、周波数帯域
毎に得られる各レベルデータについての割り当てビット
数をあまり削減することはできない。音質に影響の少な
い低周波や、高周波の帯域についてのビット数を減少す
れば、全体としてのデータ量を削減することができる
が、データ量はなるべく少ない方がよく、さらなるデー
タ削減を図った高効率符号化が求められている。
交変換を利用する符号化においては、各周波数帯域毎に
レベルデータ(またはこの差分)を得るが、データ量削
減のためには、各周波数帯域毎の割り当てビット数を減
らすことになる。音質を維持するためには、周波数帯域
毎に得られる各レベルデータについての割り当てビット
数をあまり削減することはできない。音質に影響の少な
い低周波や、高周波の帯域についてのビット数を減少す
れば、全体としてのデータ量を削減することができる
が、データ量はなるべく少ない方がよく、さらなるデー
タ削減を図った高効率符号化が求められている。
【0008】例えば、時系列のアナログ音声信号は、所
定の短期間ごとにみた場合、連続する期間における信号
が互いに一致していたり若しくは近似している場合も多
い。従来から知られているDPCM(Differential PC
M)やADPCM(Adaptive Differential PCM)方式な
どにおいては、符号化処理において連続するデータを差
分データで表すことで符号化の効率化を図っている。し
かし、この方式は、差分データを所定の割り当てビット
数で表現しており、時系列データの一部において差分が
0或いは0に等しい状態が連続するような場合、データ
量の削減の程度はそれほど高くならず、これらの方式だ
けではさらなる高符号率化を図ることは難しい。
定の短期間ごとにみた場合、連続する期間における信号
が互いに一致していたり若しくは近似している場合も多
い。従来から知られているDPCM(Differential PC
M)やADPCM(Adaptive Differential PCM)方式な
どにおいては、符号化処理において連続するデータを差
分データで表すことで符号化の効率化を図っている。し
かし、この方式は、差分データを所定の割り当てビット
数で表現しており、時系列データの一部において差分が
0或いは0に等しい状態が連続するような場合、データ
量の削減の程度はそれほど高くならず、これらの方式だ
けではさらなる高符号率化を図ることは難しい。
【0009】本発明は、上記課題に鑑みなされたもので
あり、再生時の音質などの劣化を最小限に抑えつつ、情
報信号の共通性やその強度等を積極的に活用して、より
高効率に符号化することを可能とする情報信号処理装置
を提供することを目的とする。
あり、再生時の音質などの劣化を最小限に抑えつつ、情
報信号の共通性やその強度等を積極的に活用して、より
高効率に符号化することを可能とする情報信号処理装置
を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、情報信号を所
定のブロック単位でデジタル記録し、再生するシステム
に適用され、情報信号を所定のブロック単位でデジタル
記録し、再生するシステムに適用され、複数のブロック
間でブロックデータに所定の類似関係が存在する場合、
又はブロックデータのデータピークレベルが所定レベル
以下の場合に、該当するブロックデータの記録を省略し
て、少なくとも1つのブロックデータを前記複数のブロ
ックデータとして再利用することを特徴とする。
定のブロック単位でデジタル記録し、再生するシステム
に適用され、情報信号を所定のブロック単位でデジタル
記録し、再生するシステムに適用され、複数のブロック
間でブロックデータに所定の類似関係が存在する場合、
又はブロックデータのデータピークレベルが所定レベル
以下の場合に、該当するブロックデータの記録を省略し
て、少なくとも1つのブロックデータを前記複数のブロ
ックデータとして再利用することを特徴とする。
【0011】また、再利用する前記ブロックデータの利
用回数を示す付属データを作成し、前記再利用ブロック
データと前記付属データとを記憶装置に記憶させること
を特徴とする。
用回数を示す付属データを作成し、前記再利用ブロック
データと前記付属データとを記憶装置に記憶させること
を特徴とする。
【0012】このようにブロックデータを再利用するこ
とで、記録するデータ量を削減することが可能となる。
さらに、再利用する回数を付属データとして記憶するこ
とで、再生時に付属データを参照してブロックデータを
繰り返し再生すれば、元の情報をより正確に再現するこ
とが可能となる。なお、記録時にブロックデータを再利
用するかどうかの判断基準は、任意に設定可能とするこ
とができる。このようにすれば、ユーザが目的に応じ
て、判断基準を変更することで、記録データ量の削減を
重視したり、再生時の情報信号の劣化防止を重視したり
することができる。
とで、記録するデータ量を削減することが可能となる。
さらに、再利用する回数を付属データとして記憶するこ
とで、再生時に付属データを参照してブロックデータを
繰り返し再生すれば、元の情報をより正確に再現するこ
とが可能となる。なお、記録時にブロックデータを再利
用するかどうかの判断基準は、任意に設定可能とするこ
とができる。このようにすれば、ユーザが目的に応じ
て、判断基準を変更することで、記録データ量の削減を
重視したり、再生時の情報信号の劣化防止を重視したり
することができる。
【0013】また、上記情報信号処理装置において作成
されて記憶された前記ブロックデータと前記付属データ
に基づいて情報信号を再生する際に、前記付属データが
示す利用回数よりも少ない回数だけ前記ブロックデータ
を再生することにより、ユーザの要求に応じて効率的な
再生を行うことを可能とする。
されて記憶された前記ブロックデータと前記付属データ
に基づいて情報信号を再生する際に、前記付属データが
示す利用回数よりも少ない回数だけ前記ブロックデータ
を再生することにより、ユーザの要求に応じて効率的な
再生を行うことを可能とする。
【0014】更に本発明では、前記記憶装置の記憶容量
の残量に応じて、前記ブロックデータを再利用するかど
うかを判断する判断の基準値を変更することを特徴とす
る。ブロックデータを再利用して記憶を行う場合、入力
される情報信号に応じて記憶時間が変化する。そこで、
このように記録容量の残量に基づいて再利用の判断基準
値を自動変更すれば、入力情報信号に関わらず、予定し
た期間の情報信号を確実に記憶させることが容易とな
る。
の残量に応じて、前記ブロックデータを再利用するかど
うかを判断する判断の基準値を変更することを特徴とす
る。ブロックデータを再利用して記憶を行う場合、入力
される情報信号に応じて記憶時間が変化する。そこで、
このように記録容量の残量に基づいて再利用の判断基準
値を自動変更すれば、入力情報信号に関わらず、予定し
た期間の情報信号を確実に記憶させることが容易とな
る。
【0015】
【発明の実施の形態】以下、本発明の好適な実施の形態
(以下、実施形態という)について図面を用いて説明す
る。
(以下、実施形態という)について図面を用いて説明す
る。
【0016】[情報信号の符号化方式の概要]本実施形
態では、情報信号として、例えば、人の声や自然音、楽
器音などのアナログ音声信号を符号化処理対象としてい
る。そして、音声信号を所定周波数でサンプリングして
デジタルデータに変換し、更に、時間軸上のデジタルデ
ータを上述の離散コサイン変換(MDCT:Modified D
iscrete Cosine Transform)を用いて周波数軸上のデー
タへと変換する。但し、情報信号は、音声信号には限ら
れず、アナログ画像信号も同様に適用可能である。
態では、情報信号として、例えば、人の声や自然音、楽
器音などのアナログ音声信号を符号化処理対象としてい
る。そして、音声信号を所定周波数でサンプリングして
デジタルデータに変換し、更に、時間軸上のデジタルデ
ータを上述の離散コサイン変換(MDCT:Modified D
iscrete Cosine Transform)を用いて周波数軸上のデー
タへと変換する。但し、情報信号は、音声信号には限ら
れず、アナログ画像信号も同様に適用可能である。
【0017】図1は、本実施形態の符号化方式における
音声記録データの階層構造を示してる。
音声記録データの階層構造を示してる。
【0018】本実施形態の符号化方式において、音声記
録の最小単位はオーディオブロックであり、各オーディ
オブロックのブロックデータは、上述のMDCTによっ
て得られた10ms期間毎の周波数軸上のデジタルデー
タから形成される。具体的には、まず、MDCTによっ
て、10ms期間毎に得られる周波数データは、DC〜
5KHz付近までの50Hz間隔の100個の微細バン
ドごとの強度を示す信号を求める。本実施形態では、音
質の低下を防止しつつデータ量を削減するために、聴感
上の影響の少ない高周波域(例えば1KHz以上の周波
数帯)については、各バンドの強度信号を3〜12バン
ド程度まとめて取り扱う。つまり高域側の複数のバンド
についてはバンドを結束して取り扱う。また、25Hz
以下を省略して、計100個の微細バンドを25バンド
#分の強度信号に圧縮する。なお、バンド#とは記録の
バンドを示す。更に、各バンド#についてのスペクトラ
ム強度を後述するように指数と仮数で示し、1オーディ
オブロックのデータとする。
録の最小単位はオーディオブロックであり、各オーディ
オブロックのブロックデータは、上述のMDCTによっ
て得られた10ms期間毎の周波数軸上のデジタルデー
タから形成される。具体的には、まず、MDCTによっ
て、10ms期間毎に得られる周波数データは、DC〜
5KHz付近までの50Hz間隔の100個の微細バン
ドごとの強度を示す信号を求める。本実施形態では、音
質の低下を防止しつつデータ量を削減するために、聴感
上の影響の少ない高周波域(例えば1KHz以上の周波
数帯)については、各バンドの強度信号を3〜12バン
ド程度まとめて取り扱う。つまり高域側の複数のバンド
についてはバンドを結束して取り扱う。また、25Hz
以下を省略して、計100個の微細バンドを25バンド
#分の強度信号に圧縮する。なお、バンド#とは記録の
バンドを示す。更に、各バンド#についてのスペクトラ
ム強度を後述するように指数と仮数で示し、1オーディ
オブロックのデータとする。
【0019】図1に示すように、1オーディオブロック
は、4ビットのイニシャルデータと、56ビットの差分
指数及び20ビットの仮数とから構成されており、イニ
シャルデータは、75Hzバンドのスペクトル強度の指
数を示す。また、差分指数は、75Hzバンドに続く2
4バンド#の各スペクトル強度を差分データとして表
し、7ビットで3バンド#分を表示することで、24バ
ンド#分のスペクトル強度を表している。また、仮数は
省略して位相のみを示す。高域側の結束バンドについて
は仮数の表示を省略している。
は、4ビットのイニシャルデータと、56ビットの差分
指数及び20ビットの仮数とから構成されており、イニ
シャルデータは、75Hzバンドのスペクトル強度の指
数を示す。また、差分指数は、75Hzバンドに続く2
4バンド#の各スペクトル強度を差分データとして表
し、7ビットで3バンド#分を表示することで、24バ
ンド#分のスペクトル強度を表している。また、仮数は
省略して位相のみを示す。高域側の結束バンドについて
は仮数の表示を省略している。
【0020】3つのオーディオブロックは、1フレーム
の音声情報を構成する。また、1フレームは、2nビッ
ト(例えば、n=8、つまり256ビット)の固定長に
設定し、これによりフレームを認識するための同期信号
を省略可能としている。また、2nフレーム(例えば、
n=6、つまり64フレーム)で一つのスーパフレーム
を構成している。
の音声情報を構成する。また、1フレームは、2nビッ
ト(例えば、n=8、つまり256ビット)の固定長に
設定し、これによりフレームを認識するための同期信号
を省略可能としている。また、2nフレーム(例えば、
n=6、つまり64フレーム)で一つのスーパフレーム
を構成している。
【0021】1フレームは、それぞれ80ビットからな
る3つのオーディオブロック(AB)のオーディオブロ
ックデータを備え、最短で30ms分の音声情報を表示
する。ここで、連続したブロック間で所定の類似関係を
有する場合や、オーディオブロックの指数ピークレベル
が所定値以下が連続する場合には、2ブロック目からの
いくつかのオーディオブロックの記録を省略する。
る3つのオーディオブロック(AB)のオーディオブロ
ックデータを備え、最短で30ms分の音声情報を表示
する。ここで、連続したブロック間で所定の類似関係を
有する場合や、オーディオブロックの指数ピークレベル
が所定値以下が連続する場合には、2ブロック目からの
いくつかのオーディオブロックの記録を省略する。
【0022】3つのオーディオブロックのそれぞれの利
用回数は、同一フレーム内に例えば15ビットのモード
データを設けてこれを記録する。再生時には、このモー
ドデータに示される利用回数に応じて同一のオーディオ
ブロックを複数回利用してリピート再生する。
用回数は、同一フレーム内に例えば15ビットのモード
データを設けてこれを記録する。再生時には、このモー
ドデータに示される利用回数に応じて同一のオーディオ
ブロックを複数回利用してリピート再生する。
【0023】このようにオーディオブロックを再利用し
て再生することにより、1フレーム当たりの記録再生時
間は最大17.3倍(520ms)までに拡大すること
ができ、記録データ量で再生音声の音質を維持する事が
できる。音声信号などでは、一定の近似した波形がある
程度継続していることが多いので、このような場合に類
似データの記録を省略することが可能となる。また、音
声レベルが低い場合には、そのオーディオブロックを前
のオーディオブロックで代用することが可能となる。
て再生することにより、1フレーム当たりの記録再生時
間は最大17.3倍(520ms)までに拡大すること
ができ、記録データ量で再生音声の音質を維持する事が
できる。音声信号などでは、一定の近似した波形がある
程度継続していることが多いので、このような場合に類
似データの記録を省略することが可能となる。また、音
声レベルが低い場合には、そのオーディオブロックを前
のオーディオブロックで代用することが可能となる。
【0024】更に、再生時間の短縮等を図る場合には、
設定により、再生時、モードデータに示されたリピート
回数より少ない回数だけ記録したオーディオブロックを
再生することとする。
設定により、再生時、モードデータに示されたリピート
回数より少ない回数だけ記録したオーディオブロックを
再生することとする。
【0025】256ビットの1フレームでは、3つのオ
ーディオブロックAB0〜AB2に240ビットが割り
当てられ、これにモードデータとして15ビットが割り
当てられ、残りの1ビットには、サブコードに割り当て
られている。サブコードは、1スーパフレーム分まとめ
られて64ビットで一定の情報を表す。よって、1スー
パフレームが音声記録の一つの単位を成しているが、ス
ーパフレームは、このサブコードにのみ関係したもので
あり、音声データの記録自体はフレーム単位で完結して
いる。
ーディオブロックAB0〜AB2に240ビットが割り
当てられ、これにモードデータとして15ビットが割り
当てられ、残りの1ビットには、サブコードに割り当て
られている。サブコードは、1スーパフレーム分まとめ
られて64ビットで一定の情報を表す。よって、1スー
パフレームが音声記録の一つの単位を成しているが、ス
ーパフレームは、このサブコードにのみ関係したもので
あり、音声データの記録自体はフレーム単位で完結して
いる。
【0026】1スーパフレーム毎のサブコードでは、音
声記録の日時や、ヘッダ若しくはトラック番号等に相当
するフレーズ番号などを記録することが可能である。ま
た1スーパフレームを構成するフレーム数についても各
フレームと同様に2nに設定することで(但し、フレー
ムとスーパフレームとでnを一致させる必要はない)、
再生時にサブコードだけ読み出し、希望のスーパフレー
ムを頭出しすることも容易となる。
声記録の日時や、ヘッダ若しくはトラック番号等に相当
するフレーズ番号などを記録することが可能である。ま
た1スーパフレームを構成するフレーム数についても各
フレームと同様に2nに設定することで(但し、フレー
ムとスーパフレームとでnを一致させる必要はない)、
再生時にサブコードだけ読み出し、希望のスーパフレー
ムを頭出しすることも容易となる。
【0027】以上のような方式によって音声信号を符号
化することで、本実施形態ではビットレート8.5Kb
ps以下の高効率な符号化が可能となる。例えば、32
Mビットのメモリに3932秒(65分32秒)以上の
音声が記録可能となることから、半導体メモリを用いた
IC音声記録や、フロッピーディスクへの音声記録など
に最適である。
化することで、本実施形態ではビットレート8.5Kb
ps以下の高効率な符号化が可能となる。例えば、32
Mビットのメモリに3932秒(65分32秒)以上の
音声が記録可能となることから、半導体メモリを用いた
IC音声記録や、フロッピーディスクへの音声記録など
に最適である。
【0028】具体的な符号化方式及び装置構成について
は、以下に説明する。
は、以下に説明する。
【0029】[MDCT]図2は、MDCT方式による
変換を概念的に示している。まず、アナログ音声信号を
10KHzでサンプリングする。MDCT方式では、こ
れをデジタル変換して得られた100μs毎のデジタル
データを10msの期間毎に分割し、各期間の信号をF
FTによって周波数成分信号に変換する。実際には、連
続する期間のデジタルデータの連続性を確保するため、
20ms期間の音声信号をFFTし、隣接する各期間で
互いに50%オーバラップするように設定し、10ms
毎のオーディオブロックデータを得る。次式(1)は、
コサイン波のウインドの係数W(m)を示している。こ
のウインドの係数を各期間の原信号x(m)に乗算し、
この原信号x(m)をFFT分析することで、次式
(2)に示される微細バンドについて、それぞれスペク
トラムZ(k)を得る。
変換を概念的に示している。まず、アナログ音声信号を
10KHzでサンプリングする。MDCT方式では、こ
れをデジタル変換して得られた100μs毎のデジタル
データを10msの期間毎に分割し、各期間の信号をF
FTによって周波数成分信号に変換する。実際には、連
続する期間のデジタルデータの連続性を確保するため、
20ms期間の音声信号をFFTし、隣接する各期間で
互いに50%オーバラップするように設定し、10ms
毎のオーディオブロックデータを得る。次式(1)は、
コサイン波のウインドの係数W(m)を示している。こ
のウインドの係数を各期間の原信号x(m)に乗算し、
この原信号x(m)をFFT分析することで、次式
(2)に示される微細バンドについて、それぞれスペク
トラムZ(k)を得る。
【0030】
【数1】
【数2】 なお、式(1)(2)において、Mはサンプリング数
(本実施形態では200個)であり、kは微細バンド番
号(1から100、但し1から79までに省略可能)で
ある。
(本実施形態では200個)であり、kは微細バンド番
号(1から100、但し1から79までに省略可能)で
ある。
【0031】また、本実施形態では、MDCTにおい
て、20ms毎の音声信号の200ポイントのデータx
(m)から上式(1)及び(2)によって演算すること
により、コサイン波による窓かけ及びFFTを同時に実
行している。また、演算は16ビットの精度にて精密に
行っている。
て、20ms毎の音声信号の200ポイントのデータx
(m)から上式(1)及び(2)によって演算すること
により、コサイン波による窓かけ及びFFTを同時に実
行している。また、演算は16ビットの精度にて精密に
行っている。
【0032】[バンドの結束]上述のようなMDCTに
より、各オーディオブロックについて50Hz間隔で2
5Hz〜4KHz付近までの79個の微細バンドの周波
数信号が得られる。ここで、音速が340m/sと比較
的遅いことを考えると、1KHzの波長は34cmであ
り、人の頭の直径と同程度の値に相当する。このため、
周波数1KHz程度以上のバンドでは、その位相情報は
重要ではない。よって、1KHz以上のバンドについ
て、位相を表現するのに必要な仮数の記録を省略する。
また、もともと高域側では、近接するバンド間で最も大
きな強度を示す周波数成分しか聞こえなくなるという、
いわゆるマスキング効果が強い。よって、高域では、近
接する2〜12バンドを束ねてもそれによる音質の低下
はわずかであり、複数のバンドを束ね、その強度の平均
レベルで表している。
より、各オーディオブロックについて50Hz間隔で2
5Hz〜4KHz付近までの79個の微細バンドの周波
数信号が得られる。ここで、音速が340m/sと比較
的遅いことを考えると、1KHzの波長は34cmであ
り、人の頭の直径と同程度の値に相当する。このため、
周波数1KHz程度以上のバンドでは、その位相情報は
重要ではない。よって、1KHz以上のバンドについ
て、位相を表現するのに必要な仮数の記録を省略する。
また、もともと高域側では、近接するバンド間で最も大
きな強度を示す周波数成分しか聞こえなくなるという、
いわゆるマスキング効果が強い。よって、高域では、近
接する2〜12バンドを束ねてもそれによる音質の低下
はわずかであり、複数のバンドを束ね、その強度の平均
レベルで表している。
【0033】図3は、79個の微細バンドを圧縮して得
られる全部で25バンド#のバンド番号と担当周波数帯
とを示している。25Hz以下の情報は全体のパフォー
マンスを考慮し、図3に示されているように省略してお
り、75Hz〜3975Hzまでの計78個分の微細バ
ンドを25バンド分の強度信号に圧縮する。バンド番号
0〜15(75Hz〜825Hz)までは、全て微細バ
ンドのまま記録し、バンド番号16から18は連続する
3バンド分をそれぞれ結束し、バンド番号19〜21で
は、連続する6バンドをそれぞれ結束する。結束しても
聴感上ほとんど影響を及ぼさない更に高域側のバンド番
号22〜24については、連続する12バンドを結束し
て表している。このように、本符号化方式では、周波数
つまり音階に対応し、1オクターブ6バンドを目安とし
て図3に示すような各バンド#を設定している。
られる全部で25バンド#のバンド番号と担当周波数帯
とを示している。25Hz以下の情報は全体のパフォー
マンスを考慮し、図3に示されているように省略してお
り、75Hz〜3975Hzまでの計78個分の微細バ
ンドを25バンド分の強度信号に圧縮する。バンド番号
0〜15(75Hz〜825Hz)までは、全て微細バ
ンドのまま記録し、バンド番号16から18は連続する
3バンド分をそれぞれ結束し、バンド番号19〜21で
は、連続する6バンドをそれぞれ結束する。結束しても
聴感上ほとんど影響を及ぼさない更に高域側のバンド番
号22〜24については、連続する12バンドを結束し
て表している。このように、本符号化方式では、周波数
つまり音階に対応し、1オクターブ6バンドを目安とし
て図3に示すような各バンド#を設定している。
【0034】[スペクトラム強度信号の指数化]本実施
形態の符号化方式では、上記25の各バンド#における
スペクトラム強度信号を指数bと仮数aを用いて表現す
る。図4は、各バンドのスペクトラム強度を指数で表し
たものである。また、データ量をより低減するために、
バンド番号0の75Hzバンド#については、バンドの
スペクトラム強度の指数そのものを4ビットで表して、
これをイニシャルデータとする。スペクトラム強度の指
数と4ビットのイニシャルデータとは、図5に示すよう
な対応関係を有し、各バンドの強度の指数b(0〜1
5)の値に応じて対応するイニシャルデータを決める。
形態の符号化方式では、上記25の各バンド#における
スペクトラム強度信号を指数bと仮数aを用いて表現す
る。図4は、各バンドのスペクトラム強度を指数で表し
たものである。また、データ量をより低減するために、
バンド番号0の75Hzバンド#については、バンドの
スペクトラム強度の指数そのものを4ビットで表して、
これをイニシャルデータとする。スペクトラム強度の指
数と4ビットのイニシャルデータとは、図5に示すよう
な対応関係を有し、各バンドの強度の指数b(0〜1
5)の値に応じて対応するイニシャルデータを決める。
【0035】また、残りの24バンド#については、低
域側から隣接低域バンドとの差分を演算して符号化し、
これを記録する。図6は、差分データである指数の変化
値と、差分指数コードとの対応関係を示しており、−2
〜+2の間の指数変化量を指数コードによって0〜4ま
での5値で表現する。なお、この際、誤差が蓄積しない
ように、デコーダを用いてより正確な値が算出できるよ
うに符号化することが好適である。バンド番号16以上
の結束バンド#においても、各結束バンド#の平均値の
指数が示され、広帯域バンド間での差分が求められる。
ここでは、計算は位相を考慮しない。また、位相の記録
も省略することとする。
域側から隣接低域バンドとの差分を演算して符号化し、
これを記録する。図6は、差分データである指数の変化
値と、差分指数コードとの対応関係を示しており、−2
〜+2の間の指数変化量を指数コードによって0〜4ま
での5値で表現する。なお、この際、誤差が蓄積しない
ように、デコーダを用いてより正確な値が算出できるよ
うに符号化することが好適である。バンド番号16以上
の結束バンド#においても、各結束バンド#の平均値の
指数が示され、広帯域バンド間での差分が求められる。
ここでは、計算は位相を考慮しない。また、位相の記録
も省略することとする。
【0036】バンド番号1〜24の24バンド#につい
ての各差分データは、それぞれ図6の差分指数データで
示され、3バンド#ずつまとめ、次式(3)に基づいて
この3バンド#を7ビットで表現する。図7は、3バン
ド#分の差分データの記録コードと、各バンド#につい
ての5値の差分指数コードE0、E1、E2との対応関
係を示している。
ての各差分データは、それぞれ図6の差分指数データで
示され、3バンド#ずつまとめ、次式(3)に基づいて
この3バンド#を7ビットで表現する。図7は、3バン
ド#分の差分データの記録コードと、各バンド#につい
ての5値の差分指数コードE0、E1、E2との対応関
係を示している。
【0037】
【数3】 記録コード27=50・E0+51・E1+52・E2 ・・・(3) このように、差分データを5値とし、かつ3バンド#ま
とめることにより、7ビット×(24/3)、つまり5
6ビットで24バンド分の差分データを表し、バンド番
号1〜24については、1バンド#当たり2.33ビッ
トで表現することを可能としている。
とめることにより、7ビット×(24/3)、つまり5
6ビットで24バンド分の差分データを表し、バンド番
号1〜24については、1バンド#当たり2.33ビッ
トで表現することを可能としている。
【0038】仮数aは、位相を表しており、bで表現さ
れた指数に対し、その係数が「+1」、「0」、「−
1」であるか、又は「+1」、「−1」であるかを表し
ている。
れた指数に対し、その係数が「+1」、「0」、「−
1」であるか、又は「+1」、「−1」であるかを表し
ている。
【0039】バンド番号0〜6までの低域微細バンドの
6バンド#については、図8に示すように3値[−1、
0、+1]の仮数に応じて[0,1,2]の仮数コード
を付す。この3値の仮数コードは、図9に示すように3
バンド#ずつまとめ、各バンド#の仮数コードM0、M
1、M2をまとめて5ビットで示す。これにより、音質
に与える影響の大きい低域6バンド#については、計1
0ビット(5ビット×(6バンド#/3))で3値の仮
数が示され、より正確な差分データが表現されることと
なる。また、低域6バンドに続く10バンド#(図3の
バンド番号6〜15)については、仮数としてその極性
のみの1ビットを記録することとする。1ビットの極性
表示は、「1」で+1を示し、「0」で−1を示すもの
とする。
6バンド#については、図8に示すように3値[−1、
0、+1]の仮数に応じて[0,1,2]の仮数コード
を付す。この3値の仮数コードは、図9に示すように3
バンド#ずつまとめ、各バンド#の仮数コードM0、M
1、M2をまとめて5ビットで示す。これにより、音質
に与える影響の大きい低域6バンド#については、計1
0ビット(5ビット×(6バンド#/3))で3値の仮
数が示され、より正確な差分データが表現されることと
なる。また、低域6バンドに続く10バンド#(図3の
バンド番号6〜15)については、仮数としてその極性
のみの1ビットを記録することとする。1ビットの極性
表示は、「1」で+1を示し、「0」で−1を示すもの
とする。
【0040】バンド番号16以上については、複数のバ
ンドが結束されているため、隣接するバンド#との周波
数差が大きく、隣接するバンド#間で波形合成作用も発
生しない。よって、これらのバンド#では、仮数の記録
は省略し、記録する仮数は、(5ビット×2)+(1ビ
ット×10バンド#)で計20ビットとする。
ンドが結束されているため、隣接するバンド#との周波
数差が大きく、隣接するバンド#間で波形合成作用も発
生しない。よって、これらのバンド#では、仮数の記録
は省略し、記録する仮数は、(5ビット×2)+(1ビ
ット×10バンド#)で計20ビットとする。
【0041】以上の符号化方式により、最低域バンドを
示すイニシャル4ビットと、24バンド#分の差分指数
と、20ビットの仮数データが得られ、これらの計80
ビットでの1オーディオブロックを構成する。
示すイニシャル4ビットと、24バンド#分の差分指数
と、20ビットの仮数データが得られ、これらの計80
ビットでの1オーディオブロックを構成する。
【0042】[オーディオブロックのリピート]音声信
号は、10ms又は20ms単位で考えた場合、同一波
形が継続していることが多く、この場合オーディオブロ
ックを複数回リピートでまかなっても、再生音質の低下
が少ない。そこで、本実施形態では、所定の回数までオ
ーディオブロックの記録を省略し、再生時に記録したオ
ーディオブロックをリピート再生する。また、リピート
回数をモードデータとしてオーディオブロックと共に記
録することで、同一又は類似した内容、或いは強度の指
数レベルの低いオーディオブロックデータの記録を省略
して、記録データ量の低減を図り、記録再生時間を延長
することができる。
号は、10ms又は20ms単位で考えた場合、同一波
形が継続していることが多く、この場合オーディオブロ
ックを複数回リピートでまかなっても、再生音質の低下
が少ない。そこで、本実施形態では、所定の回数までオ
ーディオブロックの記録を省略し、再生時に記録したオ
ーディオブロックをリピート再生する。また、リピート
回数をモードデータとしてオーディオブロックと共に記
録することで、同一又は類似した内容、或いは強度の指
数レベルの低いオーディオブロックデータの記録を省略
して、記録データ量の低減を図り、記録再生時間を延長
することができる。
【0043】図10は、1フレーム中で15ビットが割
り当てられたモードデータの構成を示している。本実施
形態では、オーディオブロックデータABを単独で再利
用する場合と、連続する2オーディオブロックを再利用
する場合及びこれらの組み合わせる場合を考慮して再利
用回数(リピート回数)を決めている。図10に示すよ
うに、「AB0」、「AB0〜AB1」、「AB1」、
「AB1〜AB2」、「AB2」のそれぞれのリピート
回数を3ビットで指定する。これにより、256ビット
の1フレームデータで最長0.52秒に相当する音声の
記録再生が可能となる。
り当てられたモードデータの構成を示している。本実施
形態では、オーディオブロックデータABを単独で再利
用する場合と、連続する2オーディオブロックを再利用
する場合及びこれらの組み合わせる場合を考慮して再利
用回数(リピート回数)を決めている。図10に示すよ
うに、「AB0」、「AB0〜AB1」、「AB1」、
「AB1〜AB2」、「AB2」のそれぞれのリピート
回数を3ビットで指定する。これにより、256ビット
の1フレームデータで最長0.52秒に相当する音声の
記録再生が可能となる。
【0044】また、上記オーディオブロックの再利用
は、連続オーディオブロック間で全ビットが一致してい
る場合に実行でき、その他、所定の類似関係がみられる
場合や、バンドの強度の指数ピークが一定以下の場合な
どにおいて実行することができる。
は、連続オーディオブロック間で全ビットが一致してい
る場合に実行でき、その他、所定の類似関係がみられる
場合や、バンドの強度の指数ピークが一定以下の場合な
どにおいて実行することができる。
【0045】本実施形態では、オーディオブロックを再
利用する場合の条件として、以下(i)〜(iii)を想
定し、いずれの条件を採用するか、そして、その際の具
体的な判断基準について記録及び再生時に外部より任意
に設定可能としている。
利用する場合の条件として、以下(i)〜(iii)を想
定し、いずれの条件を採用するか、そして、その際の具
体的な判断基準について記録及び再生時に外部より任意
に設定可能としている。
【0046】(i)連続するオーディオブロック間で全
ビットが一致; (ii)連続するオーディオブロック間で低域バンド#か
ら所定バンド#までの指数と仮数が一致; (iii)オーディオブロックの指数のピークが一定値以
下: 図11は、これらのオーディオブロックの具体的な再使
用条件を示し、また、各条件に対応づけられた3ビット
のリピートモードを示す。このリピートモードは、サブ
コードに記録することで、ユーザが再生時や次の記録時
などにおいてこれを参照でき、リピートモードと音質の
関係などを知ることが可能となる。
ビットが一致; (ii)連続するオーディオブロック間で低域バンド#か
ら所定バンド#までの指数と仮数が一致; (iii)オーディオブロックの指数のピークが一定値以
下: 図11は、これらのオーディオブロックの具体的な再使
用条件を示し、また、各条件に対応づけられた3ビット
のリピートモードを示す。このリピートモードは、サブ
コードに記録することで、ユーザが再生時や次の記録時
などにおいてこれを参照でき、リピートモードと音質の
関係などを知ることが可能となる。
【0047】再利用の条件として、リピートモード「0
00」に対応する「オーディオブロックの全ビットが一
致」を設定すれば、全く再生音質を劣化させることな
く、連続する同一オーディオブロックの重複記録をなく
すことができる。
00」に対応する「オーディオブロックの全ビットが一
致」を設定すれば、全く再生音質を劣化させることな
く、連続する同一オーディオブロックの重複記録をなく
すことができる。
【0048】また、実際には、オーディオブロック間の
データの相違程度が小さい場合には、一方のオーディオ
ブロックを用いて再生しても音質の低下は少ない。そこ
で、隣接オーディオブロックデータの類似の判断基準を
選択可能とし、良好な音質を確保したい場合には類似の
基準を高くし、音質を多少犠牲にしても記録時間を確保
したい場合には類似の基準を下げるように設定可能とす
る。高域バンド#側であるほど、音質に与える影響が小
さくなることから、類似の基準は図11のリピートモー
ド「001」〜「111」に対応付けられた7段階とす
る(完全一致「000」も含めると全部で8段階とな
る)。このように設定された段階に応じて低域バンド#
0から23〜11バンド#のいずれかまでの指数と仮数
の一致をみてオーディオブロックを再利用するかどうか
を決定する。より高域側のバンド#までの一致を条件と
すれば音質の低下を防止でき、ある程度のバンド#まで
の一致で類似と判定することにすれば、省略するオーデ
ィオブロック数が増加することから記録時間を実質的に
延長することが可能となる。
データの相違程度が小さい場合には、一方のオーディオ
ブロックを用いて再生しても音質の低下は少ない。そこ
で、隣接オーディオブロックデータの類似の判断基準を
選択可能とし、良好な音質を確保したい場合には類似の
基準を高くし、音質を多少犠牲にしても記録時間を確保
したい場合には類似の基準を下げるように設定可能とす
る。高域バンド#側であるほど、音質に与える影響が小
さくなることから、類似の基準は図11のリピートモー
ド「001」〜「111」に対応付けられた7段階とす
る(完全一致「000」も含めると全部で8段階とな
る)。このように設定された段階に応じて低域バンド#
0から23〜11バンド#のいずれかまでの指数と仮数
の一致をみてオーディオブロックを再利用するかどうか
を決定する。より高域側のバンド#までの一致を条件と
すれば音質の低下を防止でき、ある程度のバンド#まで
の一致で類似と判定することにすれば、省略するオーデ
ィオブロック数が増加することから記録時間を実質的に
延長することが可能となる。
【0049】オーディオブロック間のデータの類似の基
準の設定は、音声記録時に行うが、再生時にはこれを参
照する。再生時には、上述のモードデータが示すリピー
ト回数で忠実に再現することが基本であるが、例えば、
記録された音声の話し手の話の速度がゆっくりな場合、
連続するオーディオブロック単位では、データ類似が多
発する。従って、このような場合、再生時にリピート再
生回数を低減することで、音程が変化することなく話速
が速くなるので、聞き難くなることなく再生時間を短縮
できる。
準の設定は、音声記録時に行うが、再生時にはこれを参
照する。再生時には、上述のモードデータが示すリピー
ト回数で忠実に再現することが基本であるが、例えば、
記録された音声の話し手の話の速度がゆっくりな場合、
連続するオーディオブロック単位では、データ類似が多
発する。従って、このような場合、再生時にリピート再
生回数を低減することで、音程が変化することなく話速
が速くなるので、聞き難くなることなく再生時間を短縮
できる。
【0050】本実施形態では、更に別の再利用の判断基
準として、オーディオブロックデータの指数ピークレベ
ルが設定されている。ここで、オーディオブロックデー
タを構成する0〜24バンド#の指数のピークレベル
は、音声信号の強度を表しており、ピークレベルが低く
強度が小さい音声であれば(無音区間など)、その記録
を省略しても、再生時に音質にほとんど影響を与えな
い。そこで、本実施形態においては、再利用条件とし
て、オーディオブロックの指数のピークレベルが所定値
以下であるかどうかについても設定可能としている。
準として、オーディオブロックデータの指数ピークレベ
ルが設定されている。ここで、オーディオブロックデー
タを構成する0〜24バンド#の指数のピークレベル
は、音声信号の強度を表しており、ピークレベルが低く
強度が小さい音声であれば(無音区間など)、その記録
を省略しても、再生時に音質にほとんど影響を与えな
い。そこで、本実施形態においては、再利用条件とし
て、オーディオブロックの指数のピークレベルが所定値
以下であるかどうかについても設定可能としている。
【0051】具体的には、図11のリピートモード「0
01」〜「111」に対応づけられているように、ピー
クレベルの設定基準値は、レベル9以下〜レベル3以下
までの7段階としている。良好な音質を確保する場合に
は基準となる指数のビークレベルを低く設定し、記録時
間を確保する場合にはこれに応じて指数のピークレベル
を高くする。
01」〜「111」に対応づけられているように、ピー
クレベルの設定基準値は、レベル9以下〜レベル3以下
までの7段階としている。良好な音質を確保する場合に
は基準となる指数のビークレベルを低く設定し、記録時
間を確保する場合にはこれに応じて指数のピークレベル
を高くする。
【0052】また、上記オーディオブロック間の類似を
判断基準とする場合と同様に、この指数のピークレベル
に応じたオーディオブロックの再利用は、再生時にはこ
れを参照して再生時間を短縮することが可能となる。す
なわち、モードデータで指定されたリピート回数よりも
実際のリピート回数を低減する。これにより再生時間を
短縮することができる。ピークレベルの基準を低く設定
すれば、再生音質の低下は極めて少なく、またピークレ
ベルの基準を高めに設定すれば多少音質が低下するが再
生時間を短縮できる。例えば、会議・講演会などについ
ての音声記録の再生の場合には、発言者や講演者が話し
ていいない不要な期間などを省略し、再生時間を短縮す
ることが要求されることも多い。そこで、再生時にオー
ディオブロックのリピート回数の減少を一定割合に設定
することとすれば、例えば、話し手の話がとぎれて背景
雑音などが続くような場合に、その背景雑音に相当する
オーディオブロックデータの再生を省略して、再生音質
の低下を防ぎながら再生時間をより短くすることができ
る。
判断基準とする場合と同様に、この指数のピークレベル
に応じたオーディオブロックの再利用は、再生時にはこ
れを参照して再生時間を短縮することが可能となる。す
なわち、モードデータで指定されたリピート回数よりも
実際のリピート回数を低減する。これにより再生時間を
短縮することができる。ピークレベルの基準を低く設定
すれば、再生音質の低下は極めて少なく、またピークレ
ベルの基準を高めに設定すれば多少音質が低下するが再
生時間を短縮できる。例えば、会議・講演会などについ
ての音声記録の再生の場合には、発言者や講演者が話し
ていいない不要な期間などを省略し、再生時間を短縮す
ることが要求されることも多い。そこで、再生時にオー
ディオブロックのリピート回数の減少を一定割合に設定
することとすれば、例えば、話し手の話がとぎれて背景
雑音などが続くような場合に、その背景雑音に相当する
オーディオブロックデータの再生を省略して、再生音質
の低下を防ぎながら再生時間をより短くすることができ
る。
【0053】ところで、上述のようにオーディオブロッ
クを再利用しながら音声記録する場合、入力される音声
信号の状態に依存して、記録時間が増減することとな
る。しかし、録音機は、一般に、音声録音終了までの期
間を想定して録音することが多く、記録可能な時間が明
確であることが望ましい。従って、上記のようなオーデ
ィオブロックの再利用の機能は、入力音声の類似度や強
度等によって記録可能な時間が変化するので、記録時間
の確定という観点では使いづらい場合もある。
クを再利用しながら音声記録する場合、入力される音声
信号の状態に依存して、記録時間が増減することとな
る。しかし、録音機は、一般に、音声録音終了までの期
間を想定して録音することが多く、記録可能な時間が明
確であることが望ましい。従って、上記のようなオーデ
ィオブロックの再利用の機能は、入力音声の類似度や強
度等によって記録可能な時間が変化するので、記録時間
の確定という観点では使いづらい場合もある。
【0054】そこで、半導体メモリなどの記録装置の記
録容量消費量に応じてオーディオブロック再利用の判断
基準値を制御する。つまり、メモリの消費量をモニター
し、上記記録容量消費量と予定録音期間によって決まる
予定消費量とを順次比較し、類似の基準や指数レベルの
基準などの基準値を変更することで、記録時間の調整を
可能とする。記録容量の消費量が多ければ類似基準や指
数レベル基準を緩和して、オーディオブロックのリピー
ト回数を増大させ、消費量が少なければ、上記基準を高
く設定してより高い記録音質を確保するように自動でコ
ントロールする。これにより、希望の時間内に高い音質
で音声記録をすることが可能となり音声記録装置として
の使い易さが向上する。
録容量消費量に応じてオーディオブロック再利用の判断
基準値を制御する。つまり、メモリの消費量をモニター
し、上記記録容量消費量と予定録音期間によって決まる
予定消費量とを順次比較し、類似の基準や指数レベルの
基準などの基準値を変更することで、記録時間の調整を
可能とする。記録容量の消費量が多ければ類似基準や指
数レベル基準を緩和して、オーディオブロックのリピー
ト回数を増大させ、消費量が少なければ、上記基準を高
く設定してより高い記録音質を確保するように自動でコ
ントロールする。これにより、希望の時間内に高い音質
で音声記録をすることが可能となり音声記録装置として
の使い易さが向上する。
【0055】[サブコード]64フレームで1スーパフ
レームを構成し、1フレーム内で微少数のビット(例え
ば1ビット)が割り当てられたサブコードは、1スーパ
フレームで一つの情報表示単位とすることで、64ビッ
トとなり、十分な情報表示能力を持つ。32フレームで
1スーパフレームを構成する場合には、各フレームにサ
ブコードとして2ビット割り当てることとする。
レームを構成し、1フレーム内で微少数のビット(例え
ば1ビット)が割り当てられたサブコードは、1スーパ
フレームで一つの情報表示単位とすることで、64ビッ
トとなり、十分な情報表示能力を持つ。32フレームで
1スーパフレームを構成する場合には、各フレームにサ
ブコードとして2ビット割り当てることとする。
【0056】図12は、64ビットのサブコードの構造
を示し、先頭の12ビットはフレーズ番号、続く3ビッ
トは上述のリピートモード、更に33ビットの記録の日
時、最後の16ビットが誤り検出用CRCとする。記録
の日時は、それぞれバイナリで表現されて記録され、年
は、西暦の下位2桁を7ビットで示す。なお、秒につい
ては、1スーパフレーム毎に記録されることから、各ス
ーパフレームでは、1〜30秒程度の間隔ごとに進むこ
ととなる。フレーズ番号データは、頭出しのためのトラ
ックマークなどとも表されるマーキングとして用いる。
このフレーズ番号は、連続番号を順次、自動的或いは任
意に付すことができ、1Mbit当たり64フレーズが
最大密度となる。大容量のメモリに符号化データを記録
すれば付されるフレーズ数も増加するが12ビットを割
り当てれば、4096までの番号を示すことができるの
で、十分な情報表示能力を備えている。
を示し、先頭の12ビットはフレーズ番号、続く3ビッ
トは上述のリピートモード、更に33ビットの記録の日
時、最後の16ビットが誤り検出用CRCとする。記録
の日時は、それぞれバイナリで表現されて記録され、年
は、西暦の下位2桁を7ビットで示す。なお、秒につい
ては、1スーパフレーム毎に記録されることから、各ス
ーパフレームでは、1〜30秒程度の間隔ごとに進むこ
ととなる。フレーズ番号データは、頭出しのためのトラ
ックマークなどとも表されるマーキングとして用いる。
このフレーズ番号は、連続番号を順次、自動的或いは任
意に付すことができ、1Mbit当たり64フレーズが
最大密度となる。大容量のメモリに符号化データを記録
すれば付されるフレーズ数も増加するが12ビットを割
り当てれば、4096までの番号を示すことができるの
で、十分な情報表示能力を備えている。
【0057】[符号化装置の構成]図13は、上述の符
号化処理を実行する音声符号化処理装置の概略構成を示
している。入力されるアナログ音声信号からは、予め不
要な低域及び高域信号を除去され、アナログ/デジタル
(A/D)変換部10に供給される。A/D変換部10
は、供給されたアナログ音声信号を10KHzのサンプ
リング周波数Fsでサンプリングして、12ビットのデ
ジタルデータに変換する。MDCT処理部12は、A/
D変換部10からの12ビットデジタルデータに対して
MDCTの所定の係数を乗算し、10ms毎の計100
個の微細バンド毎の強度信号のレベルと位相を検出す
る。検出された各微細バンドのうちバンド番号16以上
の高域バンドは、3〜12バンド毎に、各バンドのレベ
ルの絶対値の平均値を求めて結束し、結束バンドとし
て、計25のバンド#に圧縮する。
号化処理を実行する音声符号化処理装置の概略構成を示
している。入力されるアナログ音声信号からは、予め不
要な低域及び高域信号を除去され、アナログ/デジタル
(A/D)変換部10に供給される。A/D変換部10
は、供給されたアナログ音声信号を10KHzのサンプ
リング周波数Fsでサンプリングして、12ビットのデ
ジタルデータに変換する。MDCT処理部12は、A/
D変換部10からの12ビットデジタルデータに対して
MDCTの所定の係数を乗算し、10ms毎の計100
個の微細バンド毎の強度信号のレベルと位相を検出す
る。検出された各微細バンドのうちバンド番号16以上
の高域バンドは、3〜12バンド毎に、各バンドのレベ
ルの絶対値の平均値を求めて結束し、結束バンドとし
て、計25のバンド#に圧縮する。
【0058】指数化処理部14は、得られた25バンド
#の強度信号のレベルを指数、差分指数及び仮数に符号
化する。
#の強度信号のレベルを指数、差分指数及び仮数に符号
化する。
【0059】ABR作成部16は、得られた各指数、差
分指数及び仮数に基づいて、80ビットの記録用オーデ
ィオブロックデータABRを作成し、合成部22とモー
ド決定部18にそれぞれ出力する。モード決定部18
は、外部から設定されたオーディオブロックの再利用条
件に基づき、オーディオブロック間の類似度や指数のピ
ークレベルからオーディオブロックを再利用するかどう
かを判断する。更に、この判断の結果から求まる所定の
オーディオブロックデータのリピート回数を15ビット
のモードデータに示し、これを合成部22に出力する。
分指数及び仮数に基づいて、80ビットの記録用オーデ
ィオブロックデータABRを作成し、合成部22とモー
ド決定部18にそれぞれ出力する。モード決定部18
は、外部から設定されたオーディオブロックの再利用条
件に基づき、オーディオブロック間の類似度や指数のピ
ークレベルからオーディオブロックを再利用するかどう
かを判断する。更に、この判断の結果から求まる所定の
オーディオブロックデータのリピート回数を15ビット
のモードデータに示し、これを合成部22に出力する。
【0060】また、サブコード作成部20は、記録時間
と、フレーズ番号が付された場合にはこのフレーズ番号
とをバイナリデータに変換して、サブコードを作成し、
合成部22に出力する。
と、フレーズ番号が付された場合にはこのフレーズ番号
とをバイナリデータに変換して、サブコードを作成し、
合成部22に出力する。
【0061】合成部22は、サブコードと、モードデー
タ及びモードデータに従って3つのオーディオブロック
を256ビットの1フレームを作成し、ビットストリー
ムとして半導体メモリなどの記録装置24に出力する。
タ及びモードデータに従って3つのオーディオブロック
を256ビットの1フレームを作成し、ビットストリー
ムとして半導体メモリなどの記録装置24に出力する。
【0062】[記録装置への記録]合成部22からの出力
データは、フレーム単位でメモリに記録する。1フレー
ムは、上述のように2nビットに設定することにより、
メモリのアドレスをみることでフレーム識別ができる。
図14は、1Mbitメモリのアドレスとフレームとの
関係を示している。メモリアドレスは、図14では下位
8ビットがフレーム内のビット番号に相当し、その上の
6ビットがフレーム番号を示し、更に上位の6ビットが
スーパフレーム番号を示す。
データは、フレーム単位でメモリに記録する。1フレー
ムは、上述のように2nビットに設定することにより、
メモリのアドレスをみることでフレーム識別ができる。
図14は、1Mbitメモリのアドレスとフレームとの
関係を示している。メモリアドレスは、図14では下位
8ビットがフレーム内のビット番号に相当し、その上の
6ビットがフレーム番号を示し、更に上位の6ビットが
スーパフレーム番号を示す。
【0063】1フレームをn=8、256ビットとした
場合には、アドレスの下位n=8ビットに各フレームデ
ータを格納する。つまり、各フレームの先頭ビットから
最終ビットまでをメモリのアドレス下位nビット「00
・・・00(オール0)」から「11・・・11(オー
ル1)」に順次記録する。これにより、アドレスのフレ
ーム番号を指定すれば、直ちに対応する1フレームデー
タが識別でき、フレーム識別のための同期信号が不要と
なる。
場合には、アドレスの下位n=8ビットに各フレームデ
ータを格納する。つまり、各フレームの先頭ビットから
最終ビットまでをメモリのアドレス下位nビット「00
・・・00(オール0)」から「11・・・11(オー
ル1)」に順次記録する。これにより、アドレスのフレ
ーム番号を指定すれば、直ちに対応する1フレームデー
タが識別でき、フレーム識別のための同期信号が不要と
なる。
【0064】[再生]記録装置24に記録された音声デ
ータの再生に当たっては、デコーダが読み出された1フ
レームのオーディオブロック毎に25バンド#の指数及
び仮数を復号し、更に、各バンド#の信号強度を用いて
逆DCTを行って、周波数軸上のデータを時間軸上のデ
ジタルデータに逆変換する。また、サブコードについて
は、CRCデータを用いて、誤りをチェックし、フレー
ズ番号、リピートモード、記録日時をデコードし、これ
を出力する。
ータの再生に当たっては、デコーダが読み出された1フ
レームのオーディオブロック毎に25バンド#の指数及
び仮数を復号し、更に、各バンド#の信号強度を用いて
逆DCTを行って、周波数軸上のデータを時間軸上のデ
ジタルデータに逆変換する。また、サブコードについて
は、CRCデータを用いて、誤りをチェックし、フレー
ズ番号、リピートモード、記録日時をデコードし、これ
を出力する。
【0065】また、上述のように、再生時にオーディオ
ブロックの再利用条件が設定された場合には、デコーダ
が、設定に基づいてオーディオブロックのリピート再生
回数を決定して、オーディオブロックを再利用する。
ブロックの再利用条件が設定された場合には、デコーダ
が、設定に基づいてオーディオブロックのリピート再生
回数を決定して、オーディオブロックを再利用する。
【0066】
【発明の効果】本発明では、ブロックデータを再利用
し、例えば、ブロックデータが所定の類似関係を有して
いたり、ブロックデータのピークレベルが低い場合など
に、該当するブロックデータの記録は省略し、所定のブ
ロックデータを再利用する事で、少ない記憶データ量で
長期間の情報を記録・再生する事が可能となる。また、
ブロックデータの類似またはブロックデータのピークレ
ベルなどをブロックデータの再利用判断基準とすること
で、再生時の情報信号の劣化を最低限に抑えることがで
きる。
し、例えば、ブロックデータが所定の類似関係を有して
いたり、ブロックデータのピークレベルが低い場合など
に、該当するブロックデータの記録は省略し、所定のブ
ロックデータを再利用する事で、少ない記憶データ量で
長期間の情報を記録・再生する事が可能となる。また、
ブロックデータの類似またはブロックデータのピークレ
ベルなどをブロックデータの再利用判断基準とすること
で、再生時の情報信号の劣化を最低限に抑えることがで
きる。
【0067】また、ブロックデータの再利用回数を付属
データとして記憶すれば、再生時に、この付属データを
参照することで、元の情報信号を正確にかつ容易に再生
することが可能となる。
データとして記憶すれば、再生時に、この付属データを
参照することで、元の情報信号を正確にかつ容易に再生
することが可能となる。
【0068】更に、再生時にも、ブロックデータの再利
用の回数を減少に設定可能とすることで、再生時間の効
率化や短縮化を図ることが可能となる。
用の回数を減少に設定可能とすることで、再生時間の効
率化や短縮化を図ることが可能となる。
【0069】また本発明では、記憶容量に応じてブロッ
クデータの再利用の判断基準を自動的に変更することに
より、再生時の情報信号の劣化を最小限に抑えつつ、所
定の記憶容量の記憶装置に一定期間内の入力情報信号を
確実に記憶することが容易となる。よって、情報記録装
置としての利便性を向上させることが可能となる。
クデータの再利用の判断基準を自動的に変更することに
より、再生時の情報信号の劣化を最小限に抑えつつ、所
定の記憶容量の記憶装置に一定期間内の入力情報信号を
確実に記憶することが容易となる。よって、情報記録装
置としての利便性を向上させることが可能となる。
【図1】 本発明の符号化方式におけるデータ構造を示
す図である。
す図である。
【図2】 本発明のMDCT処理を概念的に示す図であ
る。
る。
【図3】 本発明の微細バンドを一部結束して圧縮して
得られる25バンド#と各バンド#が担当する周波数範
囲を示す図である。
得られる25バンド#と各バンド#が担当する周波数範
囲を示す図である。
【図4】 本発明のMDCTで得られる各バンドのスペ
クトラム強度を指数で表した図である。
クトラム強度を指数で表した図である。
【図5】 本発明のスペクトラム強度の指数とイニシャ
ルデータとの対応関係を示す図である。
ルデータとの対応関係を示す図である。
【図6】 本発明の指数の差分と差分指数コードとの対
応を示す図である。
応を示す図である。
【図7】 本発明の3バンド#分の差分指数コードを表
す7ビットの記録コードと各バンド#の差分指数コード
との対応関係を示す図である。
す7ビットの記録コードと各バンド#の差分指数コード
との対応関係を示す図である。
【図8】 本発明の仮数と仮数コードとの対応関係を示
す図である。
す図である。
【図9】 本発明の3バンド#分の仮数コードを表す5
ビットの記録コードとの対応関係を示す図である。
ビットの記録コードとの対応関係を示す図である。
【図10】 本発明のモードデータの構成を示す図であ
る。
る。
【図11】 本発明のオーディオブロックの再利用条件
及びこの条件と対応する3ビットのリピートモードを示
す図である。
及びこの条件と対応する3ビットのリピートモードを示
す図である。
【図12】 本発明の64ビットのサブコードの構造を
示す図である。
示す図である。
【図13】 本発明の音声符号化処理装置の構成を示す
図である。
図である。
【図14】 本発明の符号化音声データを記憶するメモ
リのアドレスを示す図である。
リのアドレスを示す図である。
10 A/D変換部、12 MDCT処理部、14 指
数化処理部、16 ABR作成部、18 モード決定
部、20 サブコード作成部、22 合成部、24 記
録装置。
数化処理部、16 ABR作成部、18 モード決定
部、20 サブコード作成部、22 合成部、24 記
録装置。
Claims (4)
- 【請求項1】 情報信号を所定のブロック単位でデジタ
ル記録し、再生するシステムに適用され、 複数のブロック間でブロックデータに所定の類似関係が
存在する場合、又はブロックデータのデータピークレベ
ルが所定レベル以下の場合に、該当するブロックデータ
の記録を省略して、少なくとも1つのブロックデータを
前記複数のブロックデータとして再利用することを特徴
とする情報信号処理装置。 - 【請求項2】 請求項1記載の情報信号処理装置におい
て、 前記再利用する前記ブロックデータの利用回数を示す付
属データを作成し、前記再利用ブロックデータと前記付
属データとを記憶装置に記憶させることを特徴とする情
報信号処理装置。 - 【請求項3】 請求項2に記載の情報信号処理装置にお
いて、記憶された前記ブロックデータと前記付属データ
に基づいて情報信号を再生する際に、 前記付属データが示す利用回数よりも少ない回数だけ前
記ブロックデータを再生することを特徴とする情報信号
処理装置。 - 【請求項4】 請求項2記載の情報信号処理装置におい
て、 前記記憶装置の記憶容量の残量に応じて、前記ブロック
データを再利用するかどうか判断する判断の基準値を変
更することを特徴とする情報信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9066270A JPH10261964A (ja) | 1997-03-19 | 1997-03-19 | 情報信号処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9066270A JPH10261964A (ja) | 1997-03-19 | 1997-03-19 | 情報信号処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10261964A true JPH10261964A (ja) | 1998-09-29 |
Family
ID=13310996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9066270A Pending JPH10261964A (ja) | 1997-03-19 | 1997-03-19 | 情報信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10261964A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015187743A (ja) * | 2012-01-09 | 2015-10-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム |
-
1997
- 1997-03-19 JP JP9066270A patent/JPH10261964A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015187743A (ja) * | 2012-01-09 | 2015-10-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3123286B2 (ja) | ディジタル信号処理装置又は方法、及び記録媒体 | |
JP3173218B2 (ja) | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 | |
US5687157A (en) | Method of recording and reproducing digital audio signal and apparatus thereof | |
US6518891B2 (en) | Encoding apparatus and method, recording medium, and decoding apparatus and method | |
JPH07503115A (ja) | サブバンド符号器における誤り防止保護方法 | |
KR20020002241A (ko) | 디지털 오디오장치 | |
JP4211166B2 (ja) | 符号化装置及び方法、記録媒体、並びに復号装置及び方法 | |
JPH096399A (ja) | 信号伝送方法および装置、信号再生方法および装置、並びに量子化方法および装置 | |
JPH10261964A (ja) | 情報信号処理装置 | |
JPH10260695A (ja) | 音声信号符号化装置 | |
US6069865A (en) | Method and apparatus for cutting apart of a main signal and recording it as a synchronous signal | |
US6373421B2 (en) | Voice recording/reproducing device by using adaptive differential pulse code modulation method | |
JPH10269710A (ja) | 情報信号の符号化方法及び情報信号記録装置 | |
JP2002094385A (ja) | 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体 | |
JP3341348B2 (ja) | 情報検出再生装置及び情報記録装置 | |
JP3175456B2 (ja) | ディジタル信号処理装置 | |
JPH0793892A (ja) | 半導体メモリオーディオ記録再生装置 | |
JP3572817B2 (ja) | 情報符号化方法及び情報復号化装置 | |
JP3250367B2 (ja) | 符号化信号復号化方法及びその装置 | |
KR100563161B1 (ko) | 부호화 방법 및 장치, 복호화 방법 및 장치,기록 매체 | |
JP2000347697A (ja) | 音声記録再生装置および記録媒体 | |
KR100317064B1 (ko) | 디지털 음악 고속 녹음장치 및 녹음방법 | |
JP2001356798A (ja) | オーディオ信号符号化・復号化装置 | |
JPH07273659A (ja) | ディジタル信号処理方法及び装置、並びに記録媒体 | |
JP2001175292A (ja) | オーディオ信号符号化・復号化装置 |