JP2005195983A - ディジタルデータの符号化方法および符号化装置 - Google Patents

ディジタルデータの符号化方法および符号化装置 Download PDF

Info

Publication number
JP2005195983A
JP2005195983A JP2004003404A JP2004003404A JP2005195983A JP 2005195983 A JP2005195983 A JP 2005195983A JP 2004003404 A JP2004003404 A JP 2004003404A JP 2004003404 A JP2004003404 A JP 2004003404A JP 2005195983 A JP2005195983 A JP 2005195983A
Authority
JP
Japan
Prior art keywords
digital data
frequency
pure tone
scale factor
maximum value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004003404A
Other languages
English (en)
Other versions
JP4271588B2 (ja
Inventor
Osamu Fujii
修 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004003404A priority Critical patent/JP4271588B2/ja
Publication of JP2005195983A publication Critical patent/JP2005195983A/ja
Application granted granted Critical
Publication of JP4271588B2 publication Critical patent/JP4271588B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 入力ディジタルデータの信号振幅が小さい場合においても純音性を厳密に判定する。
【解決手段】 ディジタルデータを構成するスペクトル成分の最大値に対応するスケールファクタを、各周波数帯域について算出するスケールファクタ算出部31と、該スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更する純音性判定部32とを備えている。
【選択図】 図1

Description

本発明は、ミニディスクなどの記録媒体に楽音や音声等のディジタルデータを記録するにあたって、楽音や音声等に適応して各周波数帯域のスペクトルに対するビット割当てを行い、データ量を圧縮する符号化方法に関する。
楽音や音声等のディジタルデータを高能率で圧縮符号化する方法として、ミニディスクで用いられているATRAC(Adaptive TRansform Acoustic Coding)が挙げられる。このATRACでは、高能率で圧縮するために、上記ディジタルデータは、複数の周波数帯域(以下、適宜サブバンドフレームと呼ぶ)に分割され、可変長の時間単位でブロック化される。ブロック化されたディジタルデータは、MDCT(Modified Discrete Cosine Transform)処理によってスペクトル信号に変換され、さらに聴覚心理特性を利用して割り当てられたビット数で各スペクトル信号がそれぞれ符号化される。
上記の圧縮符号化に適応することができる聴覚心理特性には、等ラウドネス特性やマスキング効果が挙げられる。等ラウドネス特性は、同じ音圧レベルの音であっても、人間が感じ取る音の大きさが周波数によって変化することを表すものである。したがって、人間が感じ取ることができる音の大きさである最小可聴限が、周波数によって変化することを表している。
一方、マスキング効果には、同時マスキングと経時マスキングとがある。同時マスキング効果とは、複数の周波数成分の音が同時に発生しているときに、ある音が別の音を聴き取り難くさせる現象をいう。また、経時マスキング効果とは、大きな音の時間軸方向の前後では、別の音を聴き取り難くなる現象をいう。
このような聴覚心理を利用したビット割り当て法、たとえば反復法と呼ばれる割り当て法では、入力されたディジタルデータに適応したビット割り当てを、以下のようにして行っている。
まず、各周波数帯域のパワーSを求め、そのパワーSによる他の周波数帯域に対するマスキングしきい値Mを求める。次に、このマスキングしきい値Mと、各周波数帯域をnビットで量子化したときの量子化雑音パワーN(n)とから、マスキングしきい値対雑音比MNR(n)=M/N(n)を求める。続いて、そのマスキングしきい値対雑音比MNR(n)が最小となる周波数帯域にビット割当を行った後、該マスキングしきい値対雑音比MNR(n)を更新し、再び最小の周波数帯域にビット割当てが行われる。
特開平10−207489号公報(1998年8月7日公開) 特開2002−351500号公報(2002年12月6日公開)
確かに、上記で説明した従来の符号化方法によれば、楽音や音声等のディジタルデータを高能率で圧縮符号化することができる。
しかしながら、正弦波のように純音性の高いディジタルデータに対して、マスキングしきい値対雑音比MNR(n)を用いてビット割り当てを行うと、自身のパワーあるいはエネルギーによって自身がマスキングの影響を受け、信号対雑音比SNR(n)を用いたビット割り当てを行った場合と比べて、符号化・復号化時の歪率,S/N特性,およびダイナミックレンジといったオーディオ特性が悪化するという課題があった。
また、超低域や超高域の正弦波に対してマスキングしきい値対雑音比MNR(n)を用いたビット割り当てを行うと、最小可聴限もオーディオ特性の悪化の原因となるおそれがあった。なお、超低域の正弦波に対して信号対雑音比SNR(n)を用いたビット割り当てを行った場合には、隣接するサブバンドフレーム間の分析窓のクロスポイントで、知覚可能な量子化誤差が生じるおそれがあった。
一方、ホワイトノイズのように純音性の低いディジタルデータに対して、マスキングしきい値対雑音比MNR(n)を用いたビット割り当てを行うと、自身のパワーあるいはエネルギーによって、マスキングしきい値対雑音比MNR(n)が、広帯域でフラットにならないため、信号対雑音比SNR(n)を用いたビット割り当てを行った場合と比べて、符号化・復号化時の音質が悪化するという課題があった。また、最小可聴限も音質の悪化要因となるおそれがあった。
この点、本件出願人は特許文献1において、このような純音性の高いディジタルデータあるいは純音性の低いディジタルデータを符号化する場合、各周波数帯域の相互に隣接するスペクトルのパワーS(あるいはエネルギー)の差から求めたピークおよびローカルピークとマスキングしきい値Mとの関係に対応して、マスキングしきい値対雑音比MNR(n)を用いたビット割り当てを行うビットレートと、信号対雑音比SNR(n)を用いたビット割り当てを行うビットレートとを可変にする構成のディジタルデータ符号化方法を提案している。
確かに、特許文献1に記載の符号化方法によれば、正弦波のように狭帯域なディジタルデータから、ホワイトノイズのように広帯域なディジタルデータに至るまで、最適なビット割り当てを自動的に行うことができる。したがって、マスキングしきい値対雑音比MNR(n)を用いたビット割り当てに不向きな楽音に対しても音質の劣化を防止することができる。しかしながら、マスキングしきい値対雑音比MNR(n)と信号対雑音比SNR(n)を併用する上記符号化方法では、音質劣化防止のためのアルゴリズムが複雑なものとなってしまう。
この点、本件出願人は特許文献2において、このような純音性の高いディジタルデータあるいは純音性の低いディジタルデータを符号化する場合、各周波数帯域のスペクトルパワーあるいはエネルギーの最大値と平均値から、入力されたディジタルデータの純音性を判定し、純音性の高低に応じてマスキング特性を変更する構成のディジタルデータ符号化方法を提案している。
また、同文献には、ディジタルデータを複数のサブバンドフレームに分割し、純音性の高いディジタルデータあるいは純音性の低いディジタルデータを符号化する場合、各周波数帯域のスペクトルパワーあるいはエネルギーの最大値と平均値から、入力されたディジタルデータの純音性を判定し、純音性の高い場合には、上記周波数帯域のパワーまたはエネルギーの最大値が存在するサブバンドフレームの全ての周波数帯域に、少なくとも最低量子化ビット数以上のビットを割り当てる構成のディジタルデータ符号化方法について記載されている。
確かに、特許文献2に記載の符号化方法によれば、アルゴリズムを複雑化することなく、純音性の高いディジタルデータから、純音性の低いディジタルデータまで、高忠実に符号化することができる。また、超低域であってかつ純音性の高いディジタルデータを符号化する際であっても、隣接するサブバンドフレーム間の分析窓のクロスポイントで、知覚可能な量子化誤差が生じるおそれが少ない。しかしながら、特許文献2に記載の方法では、入力ディジタルデータの信号振幅が小さい場合に純音性の判定が厳密に行えないという問題がある。
本発明は上記の問題点に鑑み、入力ディジタルデータの信号振幅が小さい場合においても純音性を厳密に判定することができるディジタルデータの符号化方法および符号化装置を提供することを目的とする。
本発明のディジタルデータの符号化方法は、上記課題を解決するために、楽音や音声等のディジタルデータを周波数領域に変換し、上記周波数領域を複数の周波数帯域に分割し、分割された各周波数帯域についてビット割り当てを行うディジタルデータの符号化方法において、上記ディジタルデータを構成するスペクトル成分の最大値に対応するスケールファクタを上記各周波数帯域について算出し、該スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更することを特徴としている。
また、本発明のディジタルデータの符号化装置は、楽音や音声等のディジタルデータを周波数領域に変換し、上記周波数領域を複数の周波数帯域に分割し、分割された各周波数帯域についてビット割り当てを行うディジタルデータの符号化装置において、上記ディジタルデータを構成するスペクトル成分の最大値に対応するスケールファクタを上記各周波数帯域について算出するスケールファクタ算出手段と、該スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更する純音性判定手段とを備えていることを特徴としている。
上記構成によれば、スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更する。たとえば、スケールファクタの最大値SFmaxと平均値SFavとの差分値(SFmax−SFav)の大小を、所定の判定基準値xと比較して純音性を判定する場合においては、上記SFmaxの値に応じて上記xの値を変更することが可能となる。
そして、ディジタルデータの信号振幅が小さい場合には、上記SFmaxおよび差分値(SFmax−SFav)が小さくなる。このような場合において純音性の判定を厳密に行うためには、判定基準値xのSFmaxに対する割合kを上げてやる必要がある。一方でディジタルデータの信号振幅が大きい場合には、SFmaxおよび差分値(SFmax−SFav)が大きくなるので、判定基準値xのSFmaxに対する割合kは、上記信号振幅が小さい場合に比べて小さくてもよい。
本発明においては、上述したようにスケールファクタの最大値を用いて、純音性の判定基準を変更するので、判定基準値xのSFmaxに対する割合kを変更することが可能となる。よって、入力ディジタルデータの信号振幅が小さい場合においては、上記kを大きくすることにより、純音性の判定を厳密に行うことができる。一方、入力ディジタルデータの信号振幅が大きい場合においては、上記kを小さくすることにより、純音性の判定を厳密に行うことができる。
したがって、本発明によれば、入力ディジタルデータにおける信号振幅の大小に関わらず純音性の判定を厳密に行うことができるという効果が奏される。
さらに、本発明のディジタルデータの符号化方法においては、上記スケールファクタの最大値および平均値を用いて変更される判定基準を用いて判定された純音性の高低に応じて、マスキング特性を変更し、該変更されたマスキング特性に応じて決定されるマスキングしきい値対雑音比に基づき、上記分割された各周波数帯域についてビット割り当てを行うことが好ましい。
上記構成によれば、純音性の高低に応じて変更されるマスキング特性に応じて、マスキングしきい値対雑音比を決定し、そのマスキングしきい値対雑音比を用いてビット割当てを行うので、信号対雑音比を用いてビット割当てを行った場合と同等のオーディオ特性および音質を得ることができる。
また、聴覚心理特性を利用したほうが好ましい音源には、マスキング特性を基準のものに変更して、通常のマスキングしきい値対雑音比を用いてビット割り当てを行うことができるので、信号対雑音比を用いてビット割り当て行うよりも聴覚的に優れた音質を得ることができる。さらにマスキングしきい値対雑音比と信号対雑音比とを併用してビット割り当てを行う従来の符号化方法と比べて、本発明ではマスキングしきい値対雑音比のみを用いてビット割り当てを行うので、符号化処理のアルゴリズムを簡略化することができるというさらなる効果が奏される。
さらに、聴覚心理特性が一般的な聴覚の人の特性に固定されておらず、該聴覚心理特性のうち、マスキング特性を変更するので、たとえば臨界帯域内でマスキングされてしまうスペクトラムに対してビット割当てを行うか否かを選択することができ、聴覚の優れた人や個人の主観的な好みに応じ、聴取者の聴覚に一致した音質を得ることができるというさらなる効果が奏される。
さらに、本発明のディジタルデータの符号化方法では、上記楽音や音声等のディジタルデータをフィルタにより複数のサブバンドフレームに分割し、分割されたサブバンドフレームを上記周波数領域に変換するとともに、上記フィルタを用いることにより発生する折り返しノイズを除いて、上記スケールファクタの平均値を算出することも好ましい。
すなわち、ディジタルデータを符号化する際には、フィルタを用いて入力ディジタルデータを複数のサブバンドフレームに分割し、該サブバンドフレームを周波数領域に変換する場合もある。このようなサブバンドフレーム分割に用いられるフィルタは、「折り返しノイズ」を発生させることが多い。そして、この折り返しノイズにより、純音の波形と、純音に折り返しノイズが含まれた合成波の波形との区別がつかなくなることがある。なお、「折り返しノイズ」とは、サブバンドフレーム分割する周波数の境界に関して自身と対称な周波数成分に発生するノイズをいう。
上記構成によれば、上記折り返しノイズを除いてスケールファクタの平均値を算出するので、純音と上記合成波との波形を区別することができる。したがって、より厳密に純音性の判定を行うことが可能となるというさらなる効果が奏される。
さらに、本発明のディジタルデータの符号化方法では、上記スケールファクタの最大値を除いて、上記スケールファクタの平均値を算出することが好ましい。
上記構成によれば、スケールファクタの最大値SFmaxが除かれた状態でスケールファクタの平均値SFavが算出されるので、該最大値SFmaxを除かない場合に比べてスケールファクタの平均値SFavが小さくなる。これにより、たとえば差分値(SFmax−SFav)と所定の基準値xとの大小関係に基づき純音性の判定を行う場合において、差分値(SFmax−SFav)が大きくなるので、判定基準値xにより大きなマージンを設定することができる。よって、純音性の誤判定を低減することができるというさらなる効果が奏される。
さらに、本発明のディジタルデータの符号化方法では、上記楽音や音声等のディジタルデータを複数のサブバンドフレームに分割し、分割されたサブバンドフレームを上記周波数領域に変換するとともに、上記ディジタルデータの純音性が高いと判定された場合、上記スケールファクタの最大値が存在するサブバンドフレームに、最低量子化ビット数以上のビットを割り当てることが好ましい。
上記構成によれば、振幅が大きくても聴き取り難い単一周波数(たとえば、超低域の正弦波)であっても、量子化ビットが聴き取り難い特定周波数に偏らず、聴き取り易い周波数成分の特定周波数のノイズを低減することが可能となる。なお、振幅が大きくて聴き取り易い単一周波数は他の周波数をマスクする、すなわちマスカーの作用があるため、必ずしも上記構成を行う必要はない。したがって、超低域であるとともに純音性が高いディジタルデータ(たとえば、超低域の正弦波)を符号化する場合であっても、隣接するサブバンドフレーム間の窓のクロスポイントで、知覚可能な量子化誤差が生じるおそれが少なくなるというさらなる効果が奏される。
本発明によれば、以上のように、スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更するので、入力ディジタルデータにおける信号振幅の大小に関わらず純音性の判定を厳密に行うことができるという効果が奏される。
〔1.ミニディスク録音再生装置の構成〕
本発明に係るディジタルデータの符号化方法を採用したディジタル録音再生装置として、ここではミニディスク録音再生装置を例に挙げて説明を行う。図2は本発明にかかる符号化方法を採用したミニディスク録音再生装置の一構成例を示すブロック図である。
図2に示すように、ミニディスク録音再生装置(符号化装置)1に設けられた入力端子2には、コンパクトディスク再生装置や衛生放送受信装置などのディジタル音声信号源から出力されたディジタル音声データが、たとえば光信号としてシリアル入力される。入力端子2に入力された光信号は、光電素子3によって電気信号に変換された後、ディジタルPLL(Phase-Locked-Loop)回路4に入力される。
ディジタルPLL回路4は、入力されたディジタル音声データからクロックを抽出するとともに、サンプリング周波数および量子化ビット数に対応したマルチビットデータを再現するものである。
このマルチビットデータは信号源毎に異なるサンプリングレート(コンパクトディスク;44.1kHz、ディジタルオーディオテープレコーダ;48kHz、衛生放送(Aモード);32kHzなど)で標本化されたディジタルデータである。そこで、ディジタルPLL回路4から出力されたマルチビットデータは、周波数変換回路5によってそのサンプリングレートがミニディスクに対応した44.1kHzに変換される。
音声圧縮回路6はATRAC(Adaptive TRanceform Acoustic Coding)方式によって入力されたディジタル音声データの符号化を行い、符号化されたディジタル音声データをショックプルーフメモリコントローラ7を介して信号処理回路8に送出するものである。なお、音声圧縮回路6におけるディジタルデータの符号化方法については、後ほど詳細に説明を行う。
ショックプルーフメモリコントローラ7で制御されるショックプルーフメモリ9は、音声圧縮回路6から出力されるディジタル音声データの転送速度と、信号処理回路8に入力されるディジタル音声データの転送速度との差を吸収するとともに、再生時における振動等の外乱による再生信号の中断を補間し、ディジタル音声データを保護するためのものである。
信号処理回路8はエンコーダおよびデコーダとしての機能を備えており、ディジタル音声データをシリアルの磁界変調信号にエンコードしてヘッド駆動回路10に入力する。
ヘッド駆動回路10は、記録ヘッド11をミニディスク12上の所定記録位置に移動させるとともに、上記磁界変調信号に対応した磁界を発生させるものである。このとき、ミニディスク12上の所定記録位置には、光ピックアップ13からレーザー光が照射されており、これによって、上記磁界に対応した磁化パターンがミニディスク12上に形成される。
一方、光ピックアップ13は、ミニディスク12から上記磁化パターンに対応したシリアル信号を再生する。再生されたシリアル信号は高周波アンプ14(以下、RFアンプ14とする)で増幅された後、信号処理回路8によってディジタル音声データにデコードされる。デコードされたディジタル音声データは、ショックプルーフメモリコントローラ7およびショックプルーフメモリ9で外乱による影響を除去された後、音声伸長回路15に送出される。
音声伸長回路15は、ATRAC方式による圧縮符号化の逆変換処理を行い、フルビットのディジタル音声データを復調するものである。復調されたディジタル音声データは、ディジタル/アナログ変換回路16(以下、D/A変換回路16と呼ぶ)によってアナログ音声データに変換され、出力端子17から外部へ出力される。なお、RFアンプ14で増幅されたシリアル信号は、サーボ回路18にも入力されている。
サーボ回路18は、再生されたシリアル信号に応じてドライバ回路19に制御信号を送出し、該ドライバ回路19を介してスピンドルモータ20の回転速度をフィードバック制御するものである。このフィードバック制御により、ミニディスク12を線速度一定で回転させることができる。
また、サーボ回路18はドライバ回路19を介して送りモータ21の回転速度もフィードバック制御している。このようなフィードバック制御により、ミニディスク12の半径方向に対する光ピックアップ13の変移制御、すなわちトラッキング制御を行うことができる。さらにサーボ回路18は、ドライバ回路19を介して光ピックアップ13のフォーカシング制御も行っている。
上記した信号処理回路8、光ピックアップ13、RFアンプ14、サーボ回路18、およびドライバ回路19等には、図示しない電源回路から電源供給が行われるが、このような電源供給動作や後述する信号処理動作は、すべてシステムコントロールマイコン22によって集中管理されている。なお、システムコントロールマイコン22には、曲名入力や選曲操作、あるいは音質調整動作等を行うための入力装置23が接続されている。
〔2.ディジタルデータの符号化処理例1〕
次に、上記した音声圧縮回路6におけるディジタルデータ符号化処理の第1実施形態について説明する。図1は第1実施形態に係るディジタルデータ符号化処理を行う音声圧縮回路6の構成を示すブロック図であり、特に、スペクトル変換部(図示せず)に続くビット割当処理を行う構成を模式化したものである。
図1に示すように、音声圧縮回路の入力端には、その前段に設けられたスペクトル変換部(図示せず)で得られたMDCT係数(ディジタル音声データを構成する周波数成分(スペクトル))が入力される。
なお、スペクトル変換部は、周波数変換回路5から入力されたディジタル音声データ(44.1kHz)を帯域分割フィルタであるQMF(Quadrature Mirror Filter)によって複数のサブバンドフレーム(周波数帯域)に分割し、そのサブバンドフレーム単位毎にMDCT(Modified Discrete Trance Form)処理を施すことで、ディジタル音声データのスペクトル変換を行っている。サブバンドフレームに分割するフィルタは、QMFやポリフェーズフィルタがよく利用されているが、ここではQMFを使用した場合を説明する。
図3はQMFのフィルタ特性を示す図である。図3に示すように、QMFを用いることにより周波数帯域を2分割することができ、さらに、あるQMFに他のQMFを従属に接続することによって、入力されたディジタル音声データを複数のサブバンドフレームに分割することが可能である。さらに、図3が示すとおり、QMFを用いてサブバンドフレーム分割を実行すると、帯域を分割する周波数の境界では強い折り返し歪みが発生する。なお、入力されたディジタル音声データをこのようにサブバンドフレームに分割するステップは、本実施形態のディジタルデータ符号化処理に必ずしも必要ではない。
パワー算出部30(図1参照)は、入力されたMDCT係数をさらにi個の周波数帯域(臨界帯域等)に分割し、各周波数帯域に属するMDCTの2乗和から、各周波数帯域のスペクトルパワーSi(i=1,2,…I、たとえばI=25)を算出するものである。なお、臨界帯域特性とは、周波数選択性・マスキングしきい値等の特定の音響心理学的規則性が有効な広帯域オーディオスペクトルの特性的部分のことである。
スケールファクタ算出部(スケールファクタ算出手段)31は、入力されたMDCT係数をさらにj個の量子化周波数帯域に分割し、各周波数帯域に属するMDCTの絶対値の最大値から約2dB毎にスケールファクタを算出するものである。
すなわち、各周波数領域におけるMDCT係数の絶対値の最大値をKmaxj(j=1,2,…,I、たとえばI=52)、その時のスケールファクタをSFjとすれば、SFj×2−1/3≦Kmaxj<SFjとなるようなSFjを算出する。なお、ミニディスクの記録再生を行う際のスケールファクタは、一般的に約2-5を0dBの基準として、0dB〜約126dBまでの値をとる。
純音性判定部(純音性判定手段)32は、スケールファクタ算出部31で算出されたスケールファクタSFjの最大値SFmaxと平均値SFav(=ΣSFj/J)との差分値(SFmax−SFav)を求めるとともに、該差分値の大小からディジタル音声データの純音性の高低を判定し、その判定結果に基づいて切換部33の切換制御を行うものである。特に、純音性判定部32は、上記差分値と比較を行う判定基準値x1・x2をSFmaxに応じて変化させることで、小振幅時の純音性まで判定することが可能とされている。
具体的には、純音性判定部32は、差分値(SFmax−SFav)が非常に大きい場合に純音性が高いと判断し、差分値(SFmax−SFav)が非常に小さい場合に純音性が低いと判断する。そして、差分値が非常に大きいことを判断するための判定基準値x1は、SFmax>40dBである場合、x1=k×SFmax(0.5<k<0.9)を満たすように設定される。なお、係数kは、SFmaxが大きくなるほど0.5に近づけるように設定され、SFmaxが小さくなるほど係数kを0.9に近づけるように設定される。
一方、差分値(SFmax−SFav)が非常に小さいことを判断するための判定基準値x2は、x2=0.1×SFmaxを満たすように設定される。ミニディスクの場合、SFmaxは、0dB〜約126dBの値を取りうるので、判定基準値x2は、0dB〜約12.6dBとなるが、簡易的に固定値、すなわち約6dBに設定されていてもよい。なお、SFmax−SFavの値は、周波数変換の分解能との関係から、0dB〜90dB程度の値となる。
図4(a)〜図4(d)はスケールファクタ算出部31で算出されたスケールファクタSFjの一例を示す図である。図4(a)に示すように、スケールファクタSFjの最大値SFmaxが非常に大きい場合、たとえばSFmaxが120dBである場合には、上記係数kを0.58に設定することにより判定基準値x1を70dBに設定する。このように算出された判定基準値x1よりもSFmax−SFavの値が大きい場合、すなわちSFmax−SFav≧70dBの場合、純音性判定部32は、入力されたディジタル音声信号の純音性が高い、すなわち入力信号が単一周波数の音声を示すものであると判定して、平坦マスキング算出部35を選択するように切換部33の切換制御を行う。
一方、図4(b)に示すように、スケールファクタSFjの最大値SFmaxが小さい場合、たとえばSFmax=60dBである場合、上記係数kを0.73に設定することにより判定基準値x1を44dBに設定する。このように算出された判定基準値xよりもSFmax−SFavの値が大きい場合、すなわちSFmax−SFav≧44dBの場合、純音性判定部32は、入力されたディジタル音声信号の純音性が高いと判定して、平坦マスキング算出部35を選択するように切換部33の切換制御を行う。
なお、平均値SFav(=ΣSFj/J)を求めるにあたり、スケールファクタSFjの最大値SFmaxを除いた平均SFavrmax(={(ΣSFj)-SFmax}/(J-1))を用いて純音性の判定を行ってもよい。
さらに、SFmaxが、図3で示すような帯域分割する周波数の境界、すなわちH0とH1のクロスポイントの近くにある場合、折り返し周波数帯域SFmaxqmfを除いた平均値SFavrmaxqmf(={(ΣSFj)-SFmax-SFmaxqmf}/(J-2))を用いて純音性の判定を行うとさらに好ましい。なお、「折り返し」とは、クロスポイントに関して自身の周波数成分と対称な周波数の成分をいう。
すなわち、「スケールファクタの最大値」や「折り返しノイズ」を含めて平均値SFavを算出すると、これらを除いて平均値SFavを算出する場合に比べて、平均値SFavの値が大きくなり、差分値(SFmax−SFav)の値が小さくなる。したがって、差分値SFmax−SFavが判定基準値x1以上ならば純音性が高いとする判定するステップにおいて、判定基準値x1をより小さくとる必要が生じる場合がある。
たとえば、図3に示すように、0.2Hzの周波数において0dBの純音を周波数分割した場合、0.3Hzの周波数に約−35dBの折り返しノイズが発生する。つまり、帯域を分割する周波数の境界で強い折り返し歪みが発生する。この場合、0dBの純音の波形と、純音に−35dBの折り返しノイズが含まれた合成波の波形との区別がつかなくなる。したがって、このような帯域分割フィルタの特性を考慮し、折り返しノイズをスケールファクタの平均化の際に除くと、純音の波形と、純音に折り返しノイズが含まれた合成波の波形との区別を付けることができる。
また、周波数変換の性質から、純音性の誤判定を防止するため、上記判定基準値にマージンを設定する必要がある。そこで、上述のようにスケールファクタの最大値SFmaxをスケールファクタの平均化の際に除くことにより、該最大値を除かない場合に比べてスケールファクタの平均値SFavが小さくなる。これにより差分値(SFmax−SFav)の値が大きくなるので、判定基準値をより大きなマージンを設定することができ、誤判定を低減させることができる。
また、図4(c)に示すように、スケールファクタSFjの最大値SFmaxと平均値SFavとの差分値(SFmax-SFav)が非常に小さい場合、すなわちSFmax−SFav≦x2である場合、純音性判定部32は、入力されたディジタル音声信号の純音性が低いと判定して、上記と同様、平坦マスキング算出部35を選択するように切換部33の切換制御を行う。なお、判定基準値x2は、x2=0.1×SFmaxを満たすように設定されていてもよいし、固定値6dBに設定されていてもよい。
一方、図4(d)に示すように、スケールファクタSFjの最大値SFmaxと平均値SFavとの差分値(SFmax-SFav)が上記のいずれにも該当しない場合、たとえば、SFmaxが120dBで、かつ6dB<SFmax-SFav<70dBを満たす場合、純音性判定部32は、入力されたディジタル音声データに対する聴覚心理、すなわちマスキング効果が有効であると判断して、基準マスキング算出部34を選択するように切換部33の切換制御を行う。
上記の純音性判定動作により、基準マスキング算出部34が選択された場合、最小可聴限合成部36は、音声圧縮回路6のテーブルROM(図示せず)に予め格納されている基準マスキング特性と最小可聴限特性とを合成することで、最終的なマスキングしきい値Miを決定する。一方、平坦マスキング算出部35が選択された場合、最小可聴限合成部36は、周波数に重み付けを行っていない平坦なマスキング特性と最小可聴限特性とを合成することで、最終的なマスキングしきい値Miを決定する。なお、基準マスキング特性は、基準マスキング算出部34が、パワー算出部30により算出されるスペクトルパワーに基づき上記テーブルROMを参照することにより算出されるものである。また、平坦なマスキング特性は、平坦マスキング算出部35が、周波数に重み付けをしないマスキングを行うことにより算出されるものである。
SMR算出部37は、各周波数帯域のインデックスを上記iとするとき、パワー算出部30で算出されたスペクトルパワーSiと、最小可聴限合成部36で決定された各周波数帯域のマスキングしきい値Miとの比SMRi=Si/Miを全ての周波数帯域に亘って計算する。
MNR算出部38は、まず各周波数帯域のスペクトルパワーSiをnビットで量子化したときに生じる、スペクトルパワーSiと量子化雑音パワーNi(n)との比、すなわち信号対雑音比SNRi(n)=Si/Ni(n)を求める。なお、この比SNRi(n)は、統計的には信号特性に応じた定数となるので、統計処理によって予め求めておいてもよい。
さらに、MNR算出部38は、この信号対雑音比SNRi(n)とSMR算出部37で得られた比SMRiから、マスキングしきい値Miと量子化雑音パワーNi(n)との比、すなわちマスキングしきい値対雑音比MNRi(n)(=SNRi(n)/SMRi)を算出する。
なお、i個の周波数帯域(臨界帯域等)(i=1,2,…I、たとえばI=25)とj個の量子化周波数帯域(j=1,2,…J、たとえばJ=52)の帯域幅が異なる場合、マスキングしきい値対雑音比MNRi(n)を、複製や平均化等により量子化周波数帯域のMNRj(n)に変換する。また、マスキングしきい値対雑音比MNRi(n)は、上述のようにスペクトルパワーSiや量子化雑音パワーNiに基づいて求める必要は必ずしも無い。たとえば、各周波数帯域のエネルギーの大きさからマスキングしきい値対雑音比MNRi(n)を求めてもよい。
量子化ビット数算出部39は、各周波数帯域の量子化ビット数nを0から大きくしていき、その都度、各周波数帯域のマスキングしきい値対雑音比MNRj(n)を計算する。そして、マスキングしきい値対雑音比MNRj(n)が最小となる周波数帯域から順にビットを割り当てていく。その後、量子化ビット数nを更新する度毎に、マスキングしきい値対雑音比MNRj(n)が最小となる周波数帯域に対するのと同様のビットの割当てを行うと、各周波数帯域の語長が決定される。すなわち、スペクトルパワーSiがマスキングしきい値Miを越えた部分の長さが最も長い周波数帯域から、順次ビット割当てが行われることになる。
量子化部40は、量子化ビット数算出部39によって算出された各周波数帯域の量子化ビット数WL(j)と、スケールファクタ算出部31で算出されたスケールファクタSF(j)と、MDCT係数K(m)とを、次式(1)によって量子化する。
式(1)…MK(m)= Round{K(m)(2WL(j)−1−1)/SF(j)}
但し、m:MDCT係数のインデックス
j:量子化周波数帯域のインデックス
K(m):MDCT係数
MK(m):量子化係数
WL(j):量子化ビット数
SF(j):スケールファクタである。
なお、量子化部40で量子化された量子化係数MK(m)、量子化ビット数算出部39によって算出された各周波数帯域の量子化ビット数WL(j)、およびスケールファクタ算出部31で算出されたスケールファクタSF(j)は、符号化データとして出力される。
上記したディジタルデータの符号化方法であれば、小振幅の正弦波から大振幅の正弦波まで純音性の高いディジタルデータに対して、あるいはホワイトノイズのように純音性の低いディジタルデータに対して、マスキングしきい値対雑音比MNRj(n)のみを用いてビット割り当てを行った場合であっても、信号対雑音比SNRj(n)を用いてビット割り当てを行った場合と同等のオーディオ特性および音質を得ることができる。
つまり、マスキングしきい値Miは、純音性判定部32にて純音性が高いと判定された場合、および純音性が低いと判定された場合において、平坦マスキング算出部35により平坦にされる。したがって、上記SMRi(=Si/Mi)は、信号Siの大きさに正比例するものとなる。なお、SMRiは、SiがMiを越えていれば1以上になり、越えていなければ1以下になるので、より大きいものが重要な周波数成分といえる。
また、マスキングしきい値対雑音比MNRi(n)(=SNRi(n)/SMRi)における分子側のSNRi(n)は、信号特性に応じた定数となるので、上述したように量子化ビット数nを更新する度にビットの割当てを行い各周波数帯域の語長を決定すると、信号Siの大きい周波数成分により多くのビットを割り当てることになる。したがって、上述のようにマスキングしきい値対雑音比MNRj(n)のみを用いてビット割り当てを行った場合であっても、信号対雑音比SNRj(n)を用いてビット割り当てを行った場合と同等のオーディオ特性および音質を得ることができる。
また、上記したディジタルデータの符号化方法であれば、楽音や音声のように、聴覚心理を利用した方が好ましい音源には、通常のマスキングしきい値対雑音比MNRj(n)を用いたビット割り当てを行うので、信号対雑音比SNRj(n)を用いてビット割り当てを行うよりも、聴覚的に優れた音質を得ることができる。さらにマスキングしきい値対雑音比MNRj(n)と信号対雑音比SNRj(n)とを併用する従来の符号化方法に比べて、符号化処理のアルゴリズムを容易に実現することが可能である。
〔3.ディジタルデータの符号化処理例2〕
続いて、音声圧縮回路6におけるディジタルデータの符号化処理の第2実施形態について説明する。図5は、第2実施形態に係るディジタルデータ符号化処理を行う音声圧縮回路6の構成を示すブロック図であり、説明の理解を深めるために音声伸長回路15の構成も合わせて示している。
図5に示すように、音声圧縮回路6の入力端には、周波数変換回路5で得られたディジタル音声データ(44.1kHz)が入力される。音声圧縮回路6の最前段に設けられた周波数帯域分割部41は、入力されたディジタル音声データを複数の周波数帯域(サブバンドフレーム)に分割するものである。分割フィルタとしては、QMF(Quadrature Mirror Filter)やポリフェーズフィルタがよく利用されており、本実施形態ではQMFを使用して説明する。
時間周波数変換部42は、周波数帯域分割部41で得られたサブバンドフレーム単位毎にMDCT処理を施すことでディジタル音声データをMDCT係数に変換する。このとき、MDCT処理によって得られる変換データXm(k)は次式(2)で示される。
Figure 2005195983
ただし、 m:フレーム番号
xm(i):入力信号
h(i):順変換用窓関数
Xm(k):変換データ(MDCT係数)である。なお、図6は順変換用窓関数h(i)の時間特性の一例を示す概念図であり、図7は順変換用窓関数h(i)の周波数特性の一例を示す概念図である。
パワー算出部43は、時間周波数変換部42で得られたMDCT係数をさらにi個の周波数帯域(臨界帯域等)に分割し、各周波数帯域に属するMDCT係数の2乗和から、各周波数帯域のスペクトルパワーSi(i=1,2,…I、たとえばI=25)を算出する。
スケールファクタ算出部(スケールファクタ算出手段)44は、入力されたMDCT係数をさらにj個の量子化周波数帯域に分割し、各周波数帯域に属するMDCTの絶対値の最大値から約2dB毎にスケールファクタを算出する。
すなわち、各周波数領域におけるMDCT係数の絶対値の最大値をKmaxj(j=1,2,…J、たとえばJ=52)、その時のスケールファクタをSFjとすれば、SFj×2−1/3≦Kmaxj<SFjとなるようなSFjを算出する。
純音性判定部(純音性判定手段)45は、スケールファクタ算出部44で算出されたスケールファクタSFjの最大値SFmaxと平均値SFav(=ΣSFj/J)との差分値(SFmax-SFav)を求めるとともに、該差分値の大小からディジタル音声データの純音性の高低を判定し、その判定結果に基づいて量子化ビット数算出部50における量子化ビット数の割り当て制御を行う。なお、純音性判定部45において、上述した第1実施形態に係る符号化処理を実施するための純音性判定部32と同様に、スケールファクタ最大値SFmaxおよび平均値SFavを用いて、純音性の判定基準を変化させてもよい。
図8(a)および図8(b)は本実施形態における量子化ビット数の割り当て制御を説明するための図である。特に、図8(a)は、パワー算出部43で算出されたスペクトルパワーSiを示しており、図8(b)はその際に割り当てられる量子化ビット数の一例を示している。なお、図8(a)および図8(b)では入力されたディジタル音声データが4つのサブバンドフレームSB1〜SB4に分割されている場合を示している。
図8(a)に示すように、スケールファクタSFjの最大値SFmaxと平均値SFav(=ΣSFj/J)との差分値(SFmax−SFav)が非常に大きく、たとえば、SFmaxが120dBでSFmax-SFav≧70dBの場合、かつスケールファクタSFjの最大値SFmaxが所定周波数(たとえば100Hz)以下である場合、純音性判定部45は、入力されたディジタル音声データが超低域であるとともに純音性が高いと判定して、図8(b)に示すように、スケールファクタSFjの最大値SFmaxが存在するサブバンドフレームSB1に、少なくとも最低の量子化ビット数を割り当てるよう、量子化ビット数算出部50に対する指示を行う。
このようなビット割り当てを行うことにより、振幅が大きくても聴き取り難い単一周波数(たとえば、超低域の正弦波)であっても、量子化ビットが聴き取り難い特定周波数に偏らず、聴き取り易い周波数成分のノイズを低減することが可能となる。なお、振幅が大きくて聴き取り易い単一周波数は他の周波数をマスクする、すなわちマスカーの作用があるため、必ずしも上記構成を行う必要はない。したがって超低域であるとともに純音性が高いディジタル音声データ(たとえば、超低域の正弦波)を符号化する場合であっても、隣接するサブバンド間の分析窓のクロスポイントで、知覚可能な量子化誤差が生じるおそれが少なくなる。
パワー算出部43の後段に接続されたマスキング算出部46、最小可聴限合成部47、SMR算出部48、MNR算出部49、および量子化ビット数算出部50は、上述の第1実施形態に係るディジタルデータ符号化処理と同様、マスキングしきい値対雑音比MNRj(n)を用いたビット割り当てを行い、量子化ビット数を決定する。
量子化部51は、上述の第1実施形態に係るディジタルデータ符号化処理と同様、量子化ビット数算出部50によって算出された各周波数帯域の量子化ビット数WL(j)と、スケールファクタ算出部44で算出されたスケールファクタSF(j)と、時間周波数変換部42によって変換されたMDCT係数K(m)とを、上記した式(1)に従って量子化する。
パッキング部52は、量子化ビット数算出部50で得られた量子化係数と、スケールファクタ算出部44で算出されたスケールファクタSF(j)と、量子化ビット数算出部50によって算出された各周波数帯域の量子化ビット数WL(j)とを、圧縮符号化する。このようにして圧縮符号化されたディジタル音声データは、信号処理回路8等を介してミニディスク12に記録される。
一方、ミニディスク12を再生する際、音声伸長回路15のアンパッキング部53および逆量子化部54は、圧縮符号化された符号化データから、量子化係数MK(m)、量子化ビット数WL(j)、およびスケールファクタSF(j)を展開する。さらに、逆量子化部54は、式(3)に従い逆量子化を行う。
I(m)= SF(j)×MK(m)/(2WL(j)−1−1)…式(3)
ただし、m:IMDCT入力信号のインデックス
j:逆量子化周波数帯域のインデックス
I(m):IMDCT入力信号
MK(m):量子化係数
WL(j):量子化ビット数
SF(j):スケールファクタ
周波数時間変換部55は、逆量子化された、IMDCTの入力に対して、サブバンドフレーム単位毎にIMDCT(Inverse Modified Discrete Trance Form)処理を施す。このとき、IMDCT処理によって得られる逆変換信号ym(i),および復元信号x^m(i)は次式(4)で示される。
Figure 2005195983
ただし、m:フレーム番号
ym(i):逆変換データ
f(i):逆変換用窓関数
Xm(k):変換データ
x^m(i):復元信号である。
周波数帯域合成部56は、周波数時間変換部55によって得られた復元信号x^m(k)に対して帯域合成フィルタであるIQMF(Inverse Quadrature Mirror Filter)を用いたフィルタリングを行うことで、元のディジタル音声データを復元し、該ディジタルデータを次段のD/A変換回路16に送出する。
なお、変換データXm(k)が量子化による影響を受けることなく、復元信号x^m(i)で入力信号が復元されるためには、上記した時間周波数変換部42および周波数時間変換部55は、次式(5)を満たすように設計されるべきである。なお、下記の条件はCAS90-10 DSP90-14等により既に公知とされている。
h(i)F(i)+h(i+M)f(i+M)=1
h(2M-i-1)f(i+M)=h(M-i-1) (i=0,…,M-1)…式(5)
一方、変換データXm(k)が量子化による影響を受けた場合について、参考までに説明する。図9(a)および図9(b)は変換データXm(k)が量子化による影響を受けた場合を説明する図である。特に図9(a)は周波数帯域合成部56から出力されるディジタル音声データの一例を示しており、図9(b)は該ディジタル音声データの符号化時におけるビット割り当ての一例を示している。
図9(b)に示すように、サブバンドフレームSB1の低域から1/3程度の周波数成分にのみビットを割り当てた場合、復元信号x^m(i)の周波数特性は図9(a)のようになり、窓関数の周波数特性のノイズが発生する。
このような量子化ノイズは、サブバンドフレームSB1のどの周波数でも少なからず発生するが、この例ではサブバンドフレームSB1の低域からSB1の1/3程度の周波数成分に集中してビットを割り当てるため、残りの2/3の周波数成分における量子化ノイズが知覚されやすい。
したがって、前述した通り、スケールファクタSFjの最大値SFmaxが存在するサブバンドフレームSB1に少なくとも最低の量子化ビット数を割り当てれば、特定周波数のノイズを低減することが可能となる。
なお、上記の実施形態では、本発明に係るディジタルデータの符号化方法をミニディスク録音再生装置に適用した例を挙げて説明を行ったが、本発明の適用範囲がこれに限定されないことは言うまでもない。たとえばCD(Compact Disc)、DVD(Digital Video Disk)、mp3のリーダライタに本発明の符号化方法を適用することも可能である。
また、本発明の符号化方法は、上述した各実施形態に係る符号化方法に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
なお、本発明のディジタルデータの符号化方法は、楽音や音声等のディジタルデータを周波数領域に変換するステップと、上記周波数領域を複数の周波数帯域に分割するステップと、聴覚心理特性を反映して上記周波数帯域のパワーまたはエネルギーの大きさから各周波数帯域のマスキング閾値対雑音比を求めるステップと、上記マスキング閾値対雑音比の大小に基づいて上記周波数帯域毎にビット割り当てを行うステップと、上記分割された周波数帯域毎に算出されるスペクトル成分の最大値に対応するスケールファクタの最大値及び平均値を用いて、純音性の判定基準を変化させるステップを含む構成であってもよい。さらに、上記構成のディジタルデータの符号化方法において、上記ディジタルデータの純音性の高低に応じて、マスキング特性を変更してもよい。
また、本発明のディジタルデータの符号化方法は、楽音、音声等のディジタルデータを複数のサブバンドフレームに分割するステップと、上記サブバンドフレームを周波数領域に変換するステップと、上記周波数領域を複数の周波数帯域に分割するステップと、上記周波数帯域毎にビット割当てを行うステップと、上記分割された周波数帯域毎に算出されるスペクトル成分の最大値に対応するスケールファクタの最大値および平均値を用いて、純音性の判定基準を変化させるステップとを含む構成であってもよい。
さらに、上記スケールファクタの平均値を算出するステップにおいて、スケールファクタの最大値を除いて該平均値を算出してもよい。また、スケールファクタの最大値と上記複数のサブバンドフレームに分割する際のフィルタによる折り返しノイズを除いて平均値を算出してもよい。
また、本発明のディジタルデータの符号化方法は、楽音、音声等のディジタルデータを複数のサブバンドフレームに分割するステップと、上記サブバンドフレームを周波数領域に変換するステップと、上記周波数領域を周波数帯域に分割するステップと、上記周波数帯域毎にビット割当てを行うステップとを有する方法であって、上記分割された周波数帯域毎に算出されるスペクトル成分の最大値に対応するスケールファクタの最大値および平均値を用いて純音性を判定し、入力された上記ディジタルデータの純音性が高い場合、上記周波数帯域ごとに算出されるスペクトル成分の最大値に対応するスケールファクタの最大値が存在するサブバンドフレームの全ての周波数帯域に、少なくとも最低量子化ビット数以上のビットを割り当てる方法であってもよい。
本発明のディジタルデータの符号化方法を用いることにより、入力ディジタルデータにおける信号振幅の大小に関わらず純音性の判定を厳密に行うことができる。したがって、楽音や音声等のディジタルデータを符号化して録音する機器、たとえばミニディスク録音装置における高精度の純音性の判定を実現し、該機器のオーディオ特性および録音されたデータの音質を向上させるのに適している。
図2のミニディスク録音再生装置における音声圧縮回路の一構成例を示すブロック図である。 本発明の一実施形態に係るディジタルデータの符号化方法を採用したミニディスク録音再生装置の構成を示すブロック図である。 QMFのフィルタ特性を示す図である。 (a)ないし(d)は、図1の音声圧縮回路におけるスケールファクタ算出部で算出されたスケールファクタを示す図である。 図2のミニディスク録音再生装置における音声圧縮回路の他の構成例を示すブロック図である。 順変換用窓関数h(i)の時間特性の一例を示す概念図である。 順変換用窓関数h(i)の周波数特性の一例を示す概念図である。 (a)および(b)は、本実施形態における量子化ビット数の割り当て制御を説明するための図である。 (a)および(b)は、変換データXm(k)が量子化による影響を受けた場合を説明する図である。
符号の説明
1 ミニディスク録音再生装置(符号化装置)
31 スケールファクタ算出部(スケールファクタ算出手段)
32 純音性判定部(純音性判定手段)
44 スケールファクタ算出部(スケールファクタ算出手段)
45 純音性判定部(純音性判定手段)

Claims (6)

  1. 楽音や音声等のディジタルデータを周波数領域に変換し、上記周波数領域を複数の周波数帯域に分割し、分割された各周波数帯域についてビット割り当てを行うディジタルデータの符号化方法において、
    上記ディジタルデータを構成するスペクトル成分の最大値に対応するスケールファクタを上記各周波数帯域について算出し、該スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更することを特徴とするディジタルデータの符号化方法。
  2. 上記スケールファクタの最大値および平均値を用いて変更される判定基準を用いて判定された純音性の高低に応じて、マスキング特性を変更し、
    該変更されたマスキング特性に応じて決定されるマスキングしきい値対雑音比に基づき、上記分割された各周波数帯域についてビット割り当てを行うことを特徴とする請求項1に記載のディジタルデータの符号化方法。
  3. 上記楽音や音声等のディジタルデータをフィルタにより複数のサブバンドフレームに分割し、分割されたサブバンドフレームを上記周波数領域に変換するとともに、
    上記フィルタを用いることにより発生する折り返しノイズを除いて、上記スケールファクタの平均値を算出することを特徴とする請求項1または2に記載のディジタルデータの符号化方法。
  4. 上記スケールファクタの最大値を除いて、上記スケールファクタの平均値を算出することを特徴とする請求項1ないし3のいずれか1項に記載のディジタルデータの符号化方法。
  5. 上記楽音や音声等のディジタルデータを複数のサブバンドフレームに分割し、分割されたサブバンドフレームを上記周波数領域に変換するとともに、
    上記ディジタルデータの純音性が高いと判定された場合、上記スケールファクタの最大値が存在するサブバンドフレームに、最低量子化ビット数以上のビットを割り当てることを特徴とする請求項1ないし4のいずれか1項に記載のディジタルデータの符号化方法。
  6. 楽音や音声等のディジタルデータを周波数領域に変換し、上記周波数領域を複数の周波数帯域に分割し、分割された各周波数帯域についてビット割り当てを行うディジタルデータの符号化装置において、
    上記ディジタルデータを構成するスペクトル成分の最大値に対応するスケールファクタを上記各周波数帯域について算出するスケールファクタ算出手段と、
    該スケールファクタの最大値および平均値を用いて、純音性の判定基準を変更する純音性判定手段とを備えていることを特徴とするディジタルデータの符号化装置。
JP2004003404A 2004-01-08 2004-01-08 ディジタルデータの符号化方法および符号化装置 Expired - Fee Related JP4271588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004003404A JP4271588B2 (ja) 2004-01-08 2004-01-08 ディジタルデータの符号化方法および符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004003404A JP4271588B2 (ja) 2004-01-08 2004-01-08 ディジタルデータの符号化方法および符号化装置

Publications (2)

Publication Number Publication Date
JP2005195983A true JP2005195983A (ja) 2005-07-21
JP4271588B2 JP4271588B2 (ja) 2009-06-03

Family

ID=34818324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004003404A Expired - Fee Related JP4271588B2 (ja) 2004-01-08 2004-01-08 ディジタルデータの符号化方法および符号化装置

Country Status (1)

Country Link
JP (1) JP4271588B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム
JP2009508157A (ja) * 2005-09-13 2009-02-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2009527970A (ja) * 2006-02-21 2009-07-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化及び復号
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009508157A (ja) * 2005-09-13 2009-02-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
JP2009527970A (ja) * 2006-02-21 2009-07-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化及び復号
US9009057B2 (en) 2006-02-21 2015-04-14 Koninklijke Philips N.V. Audio encoding and decoding to generate binaural virtual spatial signals
US9865270B2 (en) 2006-02-21 2018-01-09 Koninklijke Philips N.V. Audio encoding and decoding
US10741187B2 (en) 2006-02-21 2020-08-11 Koninklijke Philips N.V. Encoding of multi-channel audio signal to generate encoded binaural signal, and associated decoding of encoded binaural signal
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム

Also Published As

Publication number Publication date
JP4271588B2 (ja) 2009-06-03

Similar Documents

Publication Publication Date Title
JP3328532B2 (ja) デジタルデータの符号化方法
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JPH06244738A (ja) ディジタル信号処理装置又は方法、及び記録媒体
JP3200851B2 (ja) ディジタル信号処理装置,ディジタル信号処理方法及びデータ記録媒体
JP3175446B2 (ja) 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
JP2000330599A (ja) 信号処理方法及び装置、並びに情報提供媒体
JP4271588B2 (ja) ディジタルデータの符号化方法および符号化装置
JP3776004B2 (ja) ディジタルデータの符号化方法
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
US7305346B2 (en) Audio processing method and audio processing apparatus
JP4627737B2 (ja) デジタルデータ復号化装置
JP3942882B2 (ja) ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
JP4649351B2 (ja) デジタルデータ復号化装置
JP4822697B2 (ja) ディジタル信号符号化装置およびディジタル信号記録装置
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP4641272B2 (ja) デジタルデータ復号化装置
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
JP2000036755A (ja) 符号変換方法及び装置、並びにプログラム供給媒体
JP3186489B2 (ja) ディジタル信号処理方法及び装置
JP4293833B2 (ja) ディジタル信号記録再生装置及びその制御プログラム
JP3175456B2 (ja) ディジタル信号処理装置
JP4732478B2 (ja) ディジタル信号再生装置、及びその制御プログラム
JP3334375B2 (ja) ディジタル信号圧縮方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090128

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140306

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees