JP4822697B2 - ディジタル信号符号化装置およびディジタル信号記録装置 - Google Patents

ディジタル信号符号化装置およびディジタル信号記録装置 Download PDF

Info

Publication number
JP4822697B2
JP4822697B2 JP2004348480A JP2004348480A JP4822697B2 JP 4822697 B2 JP4822697 B2 JP 4822697B2 JP 2004348480 A JP2004348480 A JP 2004348480A JP 2004348480 A JP2004348480 A JP 2004348480A JP 4822697 B2 JP4822697 B2 JP 4822697B2
Authority
JP
Japan
Prior art keywords
block length
block
digital signal
band
orthogonal transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004348480A
Other languages
English (en)
Other versions
JP2006154629A (ja
Inventor
修 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004348480A priority Critical patent/JP4822697B2/ja
Publication of JP2006154629A publication Critical patent/JP2006154629A/ja
Application granted granted Critical
Publication of JP4822697B2 publication Critical patent/JP4822697B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、いわゆる高能率符号化によってディジタルデータの符号化を行うディジタル信号符号化装置に関するものである。また、ディジタル信号符号化装置を備え、ミニディスク、ハードディスク、メモリ等の記録媒体にディジタルデータを記録するディジタル信号記録装置に関するものである。
従来からのディジタルデータを高能率で圧縮符号化する方法としては、ミニディスクで用いられているATRAC(Adaptive Transform Acoustic Coding)が挙げられる。このATRACでは、高能率で圧縮するために、所定時間長のディジタルデータは、帯域分割フィルタであるQMF(Quadrature Mirror Filter)によって、複数の周波数帯域(以下適宜、サブバンドフレームと呼ぶ)に分割され、可変長の時間単位でブロック化される。ブロック化されたディジタルデータは、直交変換方法であるMDCT(Modified Discrete Cosine Transform)処理等によってスペクトルデータに変換され、さらに聴覚心理特性を利用して割り当てられた量子化ビット数で各スペクトルデータがそれぞれ量子化される。
上記ブロックのブロック長決定方法としては特許文献1に次のようなものが開示されている。各サブバンドフレームを時系列に4分割したブロック(b1、b2、b3、b4)毎にピークレベルの大きさ(PK1、PK2、PK3、PK4)を求め、PK1、PK2、PK3、PK4のうち最大ピーク値MAXpkと最小ピーク値MINpkを求め、この最大ピーク値MAXpkと最小ピーク値MINpkの比をある基準範囲の値と比較し、この基準範囲よりも上記比の値が大きい時にはサブバンドフレーム内の信号は過渡的信号であるとして検出し、逆に小さい時には定常的な信号であるとして検出し、また基準範囲内の値となった場合は、これら過渡的信号と定常的信号との中間の信号であると検出する。定常的信号の場合のブロック長は、サブバンドフレームと同じ長さに決定され、過渡的信号、中間の信号の場合にはそれぞれ、サブバンドフレームの1/2、1/4の長さに決定される。
上記で決定されたブロック長の各ブロック毎に直交変換が行われスペクトルデータに変換される。そして、各スペクトルデータに人間の聴覚心理特性に基づく適応的なビット割り当てがされ、割り当てられたビット数で量子化される。
上記聴覚心理特性には、等ラウドネス特性やマスキング効果が挙げられる。等ラウドネス特性は、同じ音圧レベルの音であっても、人間が感じ取る音の大きさが周波数によって変化することを表すものである。従って、人間が感じ取ることができる音の大きさである最小可聴限が、周波数によって変化することを表している。
一方、マスキング効果には、同時マスキング効果と経時マスキング効果とがある。同時マスキング効果とは、ある周波数に強い信号成分が存在するとき、近隣周波数の信号成分が聴覚上、聞こえなく現象である。また、経時マスキング効果とは、大きな音の時間軸方向の前後では、別の音を聴き取り難くなる現象を言う。
このような聴覚心理特性を利用したビット割り当て法、例えば反復法と呼ばれる割り当て法では、入力されたディジタルデータに適応したビット割り当てを、以下のようにして行っている。
まず、各周波数帯域のパワーSを求め、そのパワーSによる他の周波数帯域に対するマスキングしきい値Mを求める。次に、このマスキングしきい値Mと、各周波数帯域をnビットで量子化したときの量子化雑音パワーN(n)とから、マスキングしきい値対雑音比MNR(n)=M/N(n)を求める。続いて、そのマスキングしきい値対雑音比MNR(n)が最小となる周波数帯域にビット割当を行った後、量子化ビット数nを更新しながらマスキングしきい値対雑音比MNR(n)を更新し、再び最小の周波数帯域にビット割り当てが行われる。
特開平4-302530号公報
上記で説明した従来の符号化方法によれば、各サブバンドフレームの信号特性が過渡的であるか、定常的であるかに対応して、ブロック長を選択でき、ディジタルデータの信号特性に適応した高能率の圧縮符号化が可能である。
しかし、上記のように聴覚心理特性を利用して量子化ビット数を割り当てる場合、人間の耳が鈍感な高域へのビット配分が疎になり、特に符号化を行うビットレートが低い場合には、高域へのビット配分がよりいっそう疎となる。例えば、サンプリング周波数が44.1kHzの場合であって、かつビットレートが256kbps程度の場合では18kHz以上、ビットレートが128kbps程度の場合では15kHz以上、ビットレートが64kbps程度では13kHz以上のスペクトル成分でビット配分が極めて疎となる。このように聴覚心理特性を利用したビット割り当てを行う場合には、高域へのビット配分が疎になる。また、人間の聴覚における周波数分解能は高域では低い。従って忠実度の高い符号化のためには、高域では周波数軸上の分解能よりも時間軸上の分解能をより重視すべきであり、従来技術のように高域と低域のそれぞれのサブバンドフレームに対して、同等に信号特性が過渡的であるか、定常的であるかを判定してブロック長を決定することは良好な高能率圧縮符号化とは言い難いという問題があった。
本発明は上記問題点を鑑みてなされたものであり、ディジタルデータの信号特性および周波数帯域に適応した忠実度の高い符号化が可能なディジタル信号符号化装置を提供することを目的とする。また、該ディジタル信号符号化装置を備えたディジタル信号記録装置を提供することも目的とする。
上記目的を達成するため本発明のディジタル信号符号化装置は、所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号を時系列の複数の短いブロック長のブロックに仮に分割し、帯域が低域か中域か高域かを判定するとともに、隣接する2つのブロックの前方のブロック内のピーク値に判定された帯域に応じた係数を乗じた値と後方のブロック内のピーク値とを比較し、後方のブロック内のピーク値が大きい場合には、前記直交変換を行うブロック長を短いブロック長に決定し、前記係数は高域になる程低い値になるよう設定していることを特徴とする。
このような構成によれば、ディジタルデータの信号特性に加え、周波数帯域に適応してブロック長を決定するので、高忠実にディジタルデータを符号化することができる。
また、人間の聴覚における周波数分解能が低い高域において、ブロック長が短くなるように決定されやすくなり、時間軸上の分解能が高くなるので、高忠実にディジタルデータを符号化することができる。
また、本発明のディジタル信号符号化装置は、所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号の信号特性と、符号化を行うビットレートに基づいて、符号化を行うビットレートが低くなる程、前記ブロック長を短いブロック長に決定する傾向となるように、前記ブロック長を決定することを特徴とする。
このような構成によれば、符号化を行うビットレートが低い場合に割り当てられるビットが疎となることを抑制し、高忠実にディジタルデータを符号化することができる。
また、本発明のディジタル信号符号化装置は、所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号の信号特性と、符号化を行う所定のビットレートに基づいて、前記ブロック長を決定することを特徴とする
このような構成によれば、符号化を行うビットレートに適応してブロック長を決定するので、高忠実にディジタルデータを符号化することができる。
また、本発明のディジタル信号記録装置は、本発明のいずれかのディジタル信号符号化装置を備え、該ディジタル信号符号化装置が符号化したディジタル信号を記録媒体に記録することを特徴とする。
本発明のディジタル信号符号化装置によれば、ディジタルデータの信号特性および周波数帯域に適応した忠実度の高い符号化が可能である。また、本発明のディジタル信号記録装置によれば、忠実度の高い符号化ディジタルデータを記録媒体に記録可能である。
本発明に係るディジタル信号符号化装置を採用したディジタル信号記録再生装置として、ここではミニディスク録音再生装置を例に挙げて説明を行う。図1は本発明に係るディジタル信号符号化装置を採用したミニディスク録音再生装置の一構成例を示すブロック図である。
ミニディスク録音再生装置1に設けられた入力端子2には、コンパクトディスク再生装置や衛生放送受信装置等のディジタル音声信号源から出力されたディジタル音声データが例えば光信号としてシリアル入力される。入力端子2に入力された光信号は、光電素子3によって電気信号に変換された後、ディジタルPLL(Phase-Locked-Loop)回路4に入力される。
ディジタルPLL回路4は、入力されたディジタル音声データからクロックの抽出を行うとともに、サンプリング周波数および量子化ビット数に対応したマルチビットデータを再現する。このマルチビットデータは信号源毎に異なるサンプリング周波数(コンパクトディスク;44.1kHz、ディジタルオーディオテープレコーダ;48kHz、衛生放送(Aモード);32kHzなど)で標本化されたディジタルデータである。そこで、ディジタルPLL回路4から出力されたマルチビットデータは周波数変換回路5によってそのサンプリング周波数をミニディスクに対応した44.1kHzに変換される。
音声圧縮回路6は入力されたディジタル音声データをATRAC(Adaptive Tranceform Acoustic Coding)方式によって圧縮符号化を行い、符号化されたディジタル音声データをショックプルーフメモリコントローラ7を介して信号処理回路8に送出する。なお、音声圧縮回路6におけるディジタル音声データの符号化方法については、後ほど詳細に説明を行う。
ショックプルーフメモリコントローラ7で制御されるショックプルーフメモリ9は、音声圧縮回路6から出力されるディジタル音声データの転送速度と、信号処理回路8に入力されるディジタル音声データの転送速度との差を吸収するとともに、再生時における振動等の外乱による再生信号の中断を補間し、ディジタル音声データを保護するためのものである。
信号処理回路8はエンコーダおよびデコーダとしての機能を備えており、ディジタル音声データをシリアルの磁界変調信号にエンコードして記録ヘッド駆動回路10に与える。ヘッド駆動回路10は、記録ヘッド11をミニディスク12上の所定記録位置に移動させるとともに、上記磁界変調信号に対応した磁界を発生させる。このとき、ミニディスク12上の所定記録位置には、光ピックアップ13からレーザー光が照射されており、これによって、上記磁界に対応した磁化パターンがミニディスク12上に記録される。
一方、光ピックアップ13は、ミニディスク12から上記磁化パターンに対応したシリアル信号を再生する。再生されたシリアル信号はRFアンプ14で増幅された後、信号処理回路8によってディジタル音声データにデコードされる。デコードされたディジタル音声データは、ショックプルーフメモリコントローラ7およびショックプルーフメモリ9で外乱による影響を除去された後、音声伸長回路15に送出される。
音声伸長回路15は、ATRAC方式による圧縮符号化の逆変換処理を行い、フルビットのディジタル音声データに復調する。復調されたディジタル音声データは、D/A変換回路16によってアナログ音声データに変換され、出力端子17から外部へ出力される。
なお、RFアンプ14で増幅されたシリアル信号は、サーボ回路18にも入力されている。サーボ回路18は、再生されたシリアル信号に応じてドライバ回路19に制御信号を送出し、該ドライバ回路19を介してスピンドルモータ20の回転速度をフィードバック制御する。このようなフィードバック制御により、ミニディスク12を線速度一定で回転させることができる。
また、サーボ回路18はドライバ回路19を介して送りモータ21の回転速度もフィードバック制御している。このようなフィードバック制御により、ミニディスク12の半径方向に対する光ピックアップ13の変移制御、すなわちトラッキング制御を行うことができる。さらにサーボ回路18は、ドライバ回路19を介して光ピックアップ13のフォーカシング制御も行っている。
信号処理回路8、光ピックアップ13、RFアンプ14、サーボ回路18、およびドライバ回路19等には、図示しない電源回路から電源供給が行われるが、このような電源供給動作や後述する音声圧縮回路6の信号処理動作は、すべてシステムコントロールマイコン22によって集中管理されている。なお、システムコントロールマイコン22には、曲名入力や選曲操作、あるいは音質調整動作等を行うための入力装置23が接続されている。
続いて、上記の音声圧縮回路6におけるディジタルデータ符号化処理について説明する。図2は音声圧縮回路6の一構成例を示すブロック図である。
入力端子29には、周波数変換回路5(図1)からディジタル音声データ(サンプリング周波数は44.1kHz)が入力される。入力されたディジタル音声データは、帯域分割フィルタ30によって、0〜11.025kHzと11.025〜22.05kHzの2つのサブバンドフレームに分割される。さらに、帯域分割フィルタ31は0〜11.025kHzのディジタル音声データを0〜5.5125kHzと5.5125〜11.025kHzの2つのサブバンドフレームに分割する。サブバンドフレームに分割するフィルタは、QMF(Quadrature Mirror Filter)やポリフェーズフィルタがよく利用されており、本実施形態ではQMFを使用した場合であり、帯域を2分割し、従属に接続することによって複数帯域に分割することが可能である。
ブロック長決定部32は、各サブバンドフレーム毎に、後述するブロック長決定方法にて、ブロックの長短を決定する。例えば、図3のように、11.6msの信号波形を4分割するか、分割しないかを決定する。この時、前者はBS1〜BS4、即ち11.6ms/4をブロック長とし、後者はBL、即ち11.6msをブロック長とする。前者は時間分解能を重視した過渡的な信号に用いるが、周波数分解能が1/4に低下する。後者は周波数分解能を重視した定常的な信号に用いるが、時間分解能が1/4に低下する。
窓かけ部33〜35は、上記で決定したブロック長毎のディジタル音声データに対して、図4のような時間特性の窓をかける。直交変換部36〜38は、窓をかけられたデータに対して、MDCT(Modified Discrete Cosine Transform)処理を施すことで、ディジタル音声データのスペクトル変換を行い、MDCT係数を算出する。なお、直交変換方法はMDCTに限らなくても良い。
ブロック長決定部32から出力されたブロック長情報および直交変換部36〜38から出力されたMDCT係数は、量子化ビット数算出部39に入力される。量子化ビット数算出部39は、後述するブロック長に応じた聴覚心理特性を用いて、量子化ビット数とスペクトルの振幅レベルに対応するスケールファクタを算出する。量子化部40では、MDCT係数Kmが(1)式によって量子化され、量子化係数MKmが算出される(Roundは四捨五入を示す)。
MKm= Round[Km(2WLj-1 −1)/SFj] (1)
但し、m:MDCT係数のインデックス
j:量子化周波数帯域のインデックス
Km:MDCT係数
MKm:量子化係数
WLj:量子化ビット数
SFj:スケールファクタ
量子化部40で算出された量子化係数MKm、量子化ビット数算出部39によって算出された各周波数帯域の量子化ビット数WLjおよびスケールファクタSFjは、フレームの補助情報と共にパッキング部41にて符号化され、符号化データとして出力端子42からショックプルーフメモリコントローラ7(図1)へ出力される。
次に、量子化ビット数算出部39についてさらに詳細に説明する。図5は、量子化ビット数算出部39の一構成例を示すブロック図である。
ブロック長判定部45は、入力端子43に入力されたブロック長情報から短ブロックまたは長ブロックかを判定し、スイッチ46における短ブロックに対応した聴覚心理特性を用いるか、長ブロックに対応した聴覚心理特性を用いるかのスイッチングを行う。入力端44に入力されたMDCT係数はスイッチ46のスイッチングに応じて短ブロックまたは長ブロックに対応した聴覚心理特性で量子化ビット数を割り当てされることになる。
短ブロックスケールファクタ算出部51および長ブロックスケールファクタ算出部47は、入力されたMDCT係数をj個の量子化周波数帯域に分割し、各周波数帯域に属するMDCT係数の絶対値の最大値から約2dB毎にスケールファクタを算出する。即ち、各周波数領域のMDCT係数の絶対値の最大値をKmaxj(j=1,2,…J、例えばJ=52)、その時のスケールファクタをSFjとすれば、SFj×2-1/3=<Kmaxj<SFjとなるようなSFjを算出する。
短ブロックパワー算出部52および長ブロックパワー算出部48は入力されたMDCT係数をi個の周波数帯域に分割し、各周波数帯域に属するMDCT係数の2乗和から、各周波数帯域のスペクトルパワーSi(i=1,2,…I、例えばI=25)を算出する。この複数の周波数帯域は、通常、臨界帯域幅、すなわち人間が聴覚で周波数分析を行っていると仮定した場合の分析単位となる帯域に基づき決定されるものである。
長ブロックマスキング算出部49は、長ブロックパワー算出部48で得られたスペクトルパワーから、周波数特性を重視した同時マスキングレベルを計算する。同時マスキングとは、図6のように強い周波数信号が隣接する周波数信号をマスク(聞こえなく)する現象を言う。そして、長ブロック最小可聴限合成部50は、公知の(2)式等で示される最小可聴限特性(図6)と同時マスキングレベルのどちらかマスクレベルの高い方を選択し、最終的なマスキングしきい値Miを決定する。なお、最小可聴限特性は予めテーブルROM等に格納しておいてもよい。
lt(f)= -0.6×3.64×(f/1000)-0.8+6.5×exp(-0.6×(f/1000-3.3)2-10-3×(f/1000)4)(2)
但し、lt(f):最小可聴限特性(dB)
f:周波数(Hz)
また、聴覚心理特性を扱う場合、周波数の単位は、公知の(3)式によってHzから変換されるBark(臨界帯域幅に相当する周波数帯域が等間隔になるような周波数尺度)を用いる(図6の横軸)。
zi = 13×arctan(0.00076×fi)+3.5×arctan((fi/0.0075)2) (3)
但し、zi:周波数(Bark)
fi:周波数(Hz)
最小可聴限とは、人間が可聴できる最小の音圧レベルを言い、約3.3kHz、臨界帯域では約16Barkで最も低く、すなわち感度が良い。図6のように、超低域及び超高域で最小可聴限が高く、特に超高域では高い音圧レベルであっても聞こえないという特性がある。これはまた、超低域及び超高域の周波数は近傍の周波数と識別できにくいとも言える。
短ブロックマスキング算出部53では、短ブロックパワー算出部52で得られたスペクトルパワーから、時間特性を重視した経時マスキングレベルを計算する。経時マスキング特性には時間前方(過去)のバックワードマスキングと、時間後方(未来)のフォワードマスキングがあり、低域の過渡的信号ではピークからバックワードマスキングでは5ms程度、フォワードマスキングでは100ms程度効くとされている。また、より高域の過渡的信号では信号自身の減衰速度も短く、バックワードマスキング、フォワードマスキングの効果も低域より短いものとなる。短ブロック最小可聴限合成部54は、経時マスキングレベルと最小可聴限特性のどちらかマスクレベルの高い方を選択し、最終的なマスキングしきい値Miを決定する。
SMR算出部55は、各周波数帯域のインデックスを前記iとするとき、長ブロックパワー算出部48および短ブロックパワー算出部52で算出されたスペクトルパワーSiと、長ブロック最小可聴限合成部50または短ブロック最小可聴限合成部54で決定された各周波数帯域のマスキングしきい値Miとの比SMRi=Si/Miを全ての周波数帯域にわたって計算する。
MNR算出部56は、まず各周波数帯域のスペクトルパワーSiと、Siをnビットで量子化したときに生じる量子化雑音パワーNi(n)との比、すなわち信号対雑音比SNRi(n)=Si/Ni(n)を求める。なお、この比SNRi(n)は、統計的には信号特性に応じた定数となるので、統計処理によって予め求めておいてもよい。さらに、MNR算出部56は、この信号対雑音比SNRi(n)とSMR算出部55で得られた比SMRiから、マスキングしきい値Miと量子化雑音パワーNi(n)との比、すなわちマスキングしきい値対雑音比MNRi(n)(=SNRi(n)/SMRi)を算出する。なお、i個の周波数帯域(臨界帯域等)(i=1,2,…I、例えばI=25)とj個の量子化周波数帯域(j=1,2,…J、例えばJ=52)の帯域幅が異なる場合、マスキングしきい値対雑音比MNRi(n)を複製や平均化等により量子化周波数帯域のMNRj(n)に変換する。
量子化ビット数算出部57は、各周波数帯域の量子化ビット数nを0から大きくしていき、その都度、各周波数帯域のマスキングしきい値対雑音比MNRj(n)をMNR算出部56を用いて計算する。そして、マスキングしきい値対雑音比MNRj(n)が最小となる周波数帯域から順にビットを割り当ててゆき、所定の割り当て可能ビット数となるまで割り当てを行うと、各周波数帯域の量子化ビット数が決定される。すなわち、スペクトルパワーのSiがマスキングしきい値Miを越えた部分の長さが最も長い周波数帯域から順次ビット割り当てが行われることになる。
以上のように算出された量子化ビット数およびスケールファクタは出力端子58、59から量子化部40(図2)およびパッキング部41(図2)へ出力される。
上述したように聴覚心理特性を利用してスペクトルデータに量子化ビット数を割り当てると、量子化ビット数はパワーの大きい周波数と最小可聴限の低い周波数に集中し、通常の楽音は強い高域成分を含まないので、高域へのビット配分が疎になることから、ブロック長決定部32(図2)は以下の実施形態1のような動作を行い、ブロック長を決定する。これを図7のフローチャートを用いて説明する。
ステップS10では、サブバンドフレームを時系列の4つの短ブロックに仮に分割する。ステップS20では、最初のブロック内のピーク値を求め、変数aに代入する。ステップS30では、変数aを変数bに代入する。ステップS40では、次の隣接するブロック内のピーク値を求め、変数aに代入する。
ステップS50、S70では、現在処理中のサブバンドフレームの帯域が低域か中域か高域かを判定する。そして、ステップS60、S80、S90のように、隣接する時間ブロック前方のピーク値bに、サブバンドフレームの帯域判定結果が低域なら100.9、中域なら100.8、高域なら100.6である係数を掛けて、時間ブロック後方のピーク値aと比較する。
ピーク値aがピーク値bに各係数を掛けたものより大きい場合(ステップS60、S80、S90のY)、ステップS100にて過渡的信号と判断し、ブロック長を短ブロックに決定する。このように、サブバンドフレームの帯域が低域か中域か高域かによって係数を可変とし、高域ほど過渡的信号と判断され、ブロック長が短ブロックに決定されやすいように、係数に重みを付けている。上記係数の場合、隣接する時間ブロック後方のピーク値が時間ブロック前方のピーク値よりも低域で約18dB、中域で約16dB、高域で約12dB増加している場合にブロック長を短ブロックに決定していることになる。
ステップS110では、ピーク値aをピーク値bに代入し、次の隣接する時間ブロックとの比較準備を行う。ステップS120では、4つのブロックがすべて終わったか判定し、終わっていなければ(ステップS120のN)、ステップS40に戻り、以降のステップを繰り返し行う。
もし、ステップS120で、4つのブロックがすべて終わったと判定されれば(ステップS120のY)、終了となる。なお、以上でブロック長が短ブロック長に決定されなかった場合は、ブロック長は長ブロックに決定される。
また、符号化を行うビットレートが低い場合には、上述したような聴覚心理特性を利用してスペクトルデータに量子化ビット数を割り当てると、量子化ビット数は、パワーの大きい周波数と最小可聴限の低い周波数にますます集中し、ますます高域へのビット配分が疎になることから、ブロック長決定部32(図2)は以下の実施形態2のような動作を行うことでブロック長を決定するようにしてもよい。これを図8のフローチャートを用いて説明する。但し、図8はサブバンドフレームの帯域が高域である場合の動作を示す。
ステップS10では、サブバンドフレームを時系列の4つの短ブロックに仮に分割する。ステップS20では、最初のブロック内のピーク値を求め、変数aに代入する。ステップS30では、変数aを変数bに代入する。ステップS40では、次の隣接するブロック内のピーク値を求め、変数aに代入する。
ステップS50、S70では、符号化を行うビットレートを判定する。そして、ステップS60、S80、S90のように、隣接する時間ブロック前方のピーク値bに、ビットレートの判定結果が256kbpsより大きいなら100.9、128kbpsより大きく256kbps以下であれば100.8、128kbps以下であれば100.6である係数を掛けて、時間ブロック後方のピーク値aと比較する。
ピーク値aがピーク値bに各係数を掛けたものより大きい場合(ステップS60、S80、S90のY)、ステップS100にて過渡的信号と判断し、ブロック長を短ブロックに決定する。このように、符号化を行うビットレートによって係数を可変とし、ビットレートが低いほど過渡的信号と判断され、ブロック長が短ブロックに決定されやすいように、係数に重みを付けている。上記係数の場合、隣接する時間ブロック後方のピーク値が時間ブロック前方のピーク値よりも、ビットレートが256kbpsより大きい場合で約18dB、128kbpsより大きくかつ256kbps以下の場合で約16dB、128kbps以下の場合で約12dB増加している場合にブロック長を短ブロックに決定していることになる。
ステップS110では、ピーク値aをピーク値bに代入し、次の隣接する時間ブロックとの比較準備を行う。ステップS120では、4つのブロックがすべて終わったか判定し、終わっていなければ(ステップS120のN)、ステップS40に戻り、以降のステップを繰り返し行う。
もし、ステップS120で、4つのブロックがすべて終わったと判定されれば(ステップS120のY)、終了となる。なお、以上でブロック長が短ブロック長に決定されなかった場合は、ブロック長は長ブロックに決定される。
上記ビットレートに対応した係数の設定は、高域のサブバンドフレームについての実施例であり、中域および低域のサブバンドフレームにおいては、全体的により100.9に近い値に設定するのが好ましい。また、高域のサブバンドフレームについてのみ、ビットレートに対応した係数を設定するようにしてもよい。
なお、以上の説明で、本発明に係るディジタル信号符号化装置をミニディスク録音再生装置に設けられるものとして説明したが、本発明に係るディジタル信号符号化装置の適用範囲がこれに限定されないことは言うまでもない。
は、本発明のミニディスク録音再生装置の一構成例を示すブロック図である。 は、音声圧縮回路の一構成例を示すブロック図である。 は、サブバンドフレームにおけるブロック分割を示す図である。 は、窓関数の一例を示す図である。 は、量子化ビット数算出部の一構成例を示すブロック図である。 は、聴覚心理特性を示す図である。 は、ブロック長決定部の実施形態1の動作を示すフローチャートである。 は、ブロック長決定部の実施形態2の動作を示すフローチャートである。
符号の説明
1 ミニディスク録音再生装置
2 入力端子
3 光電素子
4 ディジタルPLL回路
5 周波数変換回路
6 音声圧縮回路
7 ショックプルーフメモリコントローラ
8 信号処理回路
9 ショックプルーフメモリ
10 記録ヘッド駆動回路
11 記録ヘッド
12 ミニディスク
13 光ピックアップ
14 RFアンプ
15 音声伸長回路
16 D/A変換回路
17 出力端子
18 サーボ回路
19 ドライバ回路
20 スピンドルモータ
21 送りモータ
22 システムコントロールマイコン
23 入力装置
29 入力端子
30、31 帯域分割フィルタ
32 ブロック長決定部
33、34、35 窓かけ部
36、37、38 直交変換部
39 量子化ビット数算出部
40 量子化部
41 パッキング部
42 出力端子
43、44 入力端子
45 ブロック長判定部
46 スイッチ
47 長ブロックスケールファクタ算出部
48 長ブロックパワー算出部
49 長ブロックマスキング算出部
50 長ブロック最小可聴限合成部
51 短ブロックスケールファクタ算出部
52 短ブロックパワー算出部
53 短ブロックマスキング算出部
54 短ブロック最小可聴限合成部
55 SMR算出部
56 MNR算出部
57 量子化ビット数算出部
58、59 出力端子

Claims (4)

  1. 所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、
    前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号を時系列の複数の短いブロック長のブロックに仮に分割し、帯域が低域か中域か高域かを判定するとともに、隣接する2つのブロックの前方のブロック内のピーク値に判定された帯域に応じた係数を乗じた値と後方のブロック内のピーク値とを比較し、後方のブロック内のピーク値が大きい場合には、前記直交変換を行うブロック長を短いブロック長に決定し、前記係数は高域になる程低い値になるよう設定していることを特徴とするディジタル信号符号化装置。
  2. 所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、
    前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号の信号特性と、符号化を行うビットレートに基づいて、前記符号化を行うビットレートが低くなる程、前記ブロック長を短いブロック長に決定する傾向となるように、前記ブロック長を決定することを特徴とするディジタル信号符号化装置。
  3. 所定時間長のディジタル信号を所定の複数の帯域に分割する帯域分割手段と、前記帯域毎に直交変換を行うブロック長を決定するブロック長決定手段と、該ブロック長決定手段で決定されたブロック長のブロック毎に直交変換を行い直交変換信号を生成する直交変換手段と、前記直交変換信号を聴覚心理特性に基づき量子化する量子化手段とを備えるディジタル信号符号化装置であって、
    前記ブロック長決定手段は、分割された前記所定時間長のディジタル信号の信号特性と、符号化を行う所定のビットレートに基づいて、前記ブロック長を決定することを特徴とするディジタル信号符号化装置。
  4. 請求項1〜請求項3のいずれかに記載のディジタル信号符号化装置を備え、該ディジタル信号符号化装置が符号化したディジタル信号を記録媒体に記録することを特徴とするディジタル信号記録装置。
JP2004348480A 2004-12-01 2004-12-01 ディジタル信号符号化装置およびディジタル信号記録装置 Expired - Fee Related JP4822697B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004348480A JP4822697B2 (ja) 2004-12-01 2004-12-01 ディジタル信号符号化装置およびディジタル信号記録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004348480A JP4822697B2 (ja) 2004-12-01 2004-12-01 ディジタル信号符号化装置およびディジタル信号記録装置

Publications (2)

Publication Number Publication Date
JP2006154629A JP2006154629A (ja) 2006-06-15
JP4822697B2 true JP4822697B2 (ja) 2011-11-24

Family

ID=36632985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004348480A Expired - Fee Related JP4822697B2 (ja) 2004-12-01 2004-12-01 ディジタル信号符号化装置およびディジタル信号記録装置

Country Status (1)

Country Link
JP (1) JP4822697B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
JP5793675B2 (ja) * 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186331B2 (ja) * 1993-05-25 2001-07-11 ソニー株式会社 信号変換方法又は装置、並びに記録媒体
JP3334374B2 (ja) * 1994-10-28 2002-10-15 ソニー株式会社 ディジタル信号圧縮方法及び装置
JPH08162964A (ja) * 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
JP3291948B2 (ja) * 1994-12-15 2002-06-17 ソニー株式会社 高能率符号化方法及び装置、並びに伝送媒体
JP2001077698A (ja) * 1999-09-08 2001-03-23 Matsushita Electric Ind Co Ltd オーディオ符号化アプリケーションに対するブロックサイズ決定方法
JP2003216188A (ja) * 2002-01-25 2003-07-30 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、符号化装置、及び記憶媒体

Also Published As

Publication number Publication date
JP2006154629A (ja) 2006-06-15

Similar Documents

Publication Publication Date Title
JP3328532B2 (ja) デジタルデータの符号化方法
US6169973B1 (en) Encoding method and apparatus, decoding method and apparatus and recording medium
JP3307138B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3765622B2 (ja) オーディオ符号化復号化システム
GB2260069A (en) Compressed digital signal processing apparatus and method and storage medium
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
US5864813A (en) Method, system and product for harmonic enhancement of encoded audio signals
JP2001134295A (ja) 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US5754427A (en) Data recording method
US6034315A (en) Signal processing apparatus and method and information recording apparatus
JP4822697B2 (ja) ディジタル信号符号化装置およびディジタル信号記録装置
JP3776004B2 (ja) ディジタルデータの符号化方法
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP3942882B2 (ja) ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
JP4271588B2 (ja) ディジタルデータの符号化方法および符号化装置
De Koning et al. On psychoacoustic noise shaping for audio requantization
JP2003280691A (ja) 音声処理方法および音声処理装置
JP4293833B2 (ja) ディジタル信号記録再生装置及びその制御プログラム
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP4732478B2 (ja) ディジタル信号再生装置、及びその制御プログラム
JP3033150B2 (ja) オーディオ信号の量子化誤差低減装置
JP2002091500A (ja) デジタルデータ符号化方法
JP3408140B2 (ja) 情報符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070302

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20071005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees