JP2002351500A - ディジタルデータの符号化方法 - Google Patents

ディジタルデータの符号化方法

Info

Publication number
JP2002351500A
JP2002351500A JP2001158767A JP2001158767A JP2002351500A JP 2002351500 A JP2002351500 A JP 2002351500A JP 2001158767 A JP2001158767 A JP 2001158767A JP 2001158767 A JP2001158767 A JP 2001158767A JP 2002351500 A JP2002351500 A JP 2002351500A
Authority
JP
Japan
Prior art keywords
digital data
frequency
pure tone
frequency band
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001158767A
Other languages
English (en)
Other versions
JP3776004B2 (ja
Inventor
Osamu Fujii
修 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001158767A priority Critical patent/JP3776004B2/ja
Publication of JP2002351500A publication Critical patent/JP2002351500A/ja
Application granted granted Critical
Publication of JP3776004B2 publication Critical patent/JP3776004B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】本発明は、アルゴリズムを複雑化することな
く、純音性の高いディジタルデータから純音性の低いデ
ィジタルデータまで、高忠実に符号化することが可能な
ディジタルデータの符号化方法を提供することを目的と
する。 【解決手段】本発明に係るディジタルデータの符号化方
法は、入力ディジタルデータのスペクトルパワーを算出
するパワー算出部31と、該スペクトルパワーの最大値
と平均値から入力ディジタルデータの純音性の高低を判
定し、その判定結果に応じてマスキング特性を切り換え
る純音性判定部32と、を有している。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ミニディスク等の
記録媒体に楽音や音声等のディジタルデータを記録する
にあたって、前記楽音や音声等に適応して各周波数帯域
のスペクトルに対するビット割り当てを行い、データ量
を圧縮する符号化方法に関する。
【0002】
【従来の技術】楽音や音声等のディジタルデータを高能
率で圧縮符号化する方法として、ミニディスクで用いら
れているATRAC(Adaptive TRansform Acoustic Co
ding)が挙げられる。このATRACでは、ディジタル
データを高能率で圧縮するために、入力ディジタルデー
タは複数の周波数帯域(以下、適宜サブバンドフレーム
と呼ぶ)に分割され、可変長の単位時間でブロック化さ
れる。ブロック化されたディジタルデータはMDCT
(Modified Discrete Cosine Transform)処理によって
スペクトル信号に変換され、さらに聴覚心理特性を利用
して割り当てられたビット数で各スペクトル信号がそれ
ぞれ符号化される。
【0003】上記の圧縮符号化に適用することができる
聴覚心理特性には、等ラウドネス特性やマスキング効果
が挙げられる。等ラウドネス特性とは、同じ音圧レベル
の音であっても、人間が感じ取る音の大きさが周波数に
よって変化することを表すものである。従って、人間が
感じ取ることのできる音の大きさを示す最小可聴限がそ
の音の周波数によって変化することを表している。
【0004】一方、マスキング効果には同時マスキング
効果と経時マスキング効果がある。同時マスキング効果
とは、複数の周波数成分の音が同時に発生しているとき
に、ある音が別の音を聴き取り難くさせる現象を言う。
また、経時マスキング効果とは、大きな音の時間軸方向
の前後では、別の音が聞き取り難くなる現象を言う。
【0005】このような聴覚心理特性を利用したビット
割り当て法、例えば反復法と呼ばれる割り当て法では、
入力されたディジタルデータに適応した実際のビット割
り当てを、次のようにして行っている。
【0006】まず、各周波数帯域のパワーSを求め、そ
のパワーSによる他の周波数帯域に対するマスキング閾
値Mを求める。次に、このマスキング閾値Mと、各周波
数帯域をnビットで量子化したときの量子化雑音パワー
N(n)とから、マスキング閾値対雑音比MNR(n)
=M/N(n)を求める。続いて、そのマスキング閾値
対雑音比MNR(n)が最小となる周波数帯域にビット
の割当てを行った後、該マスキング閾値対雑音比MNR
(n)を更新し、再び最小の周波数帯域にビットの割り
当てが行われる。
【0007】
【発明が解決しようとする課題】確かに、上記で説明し
た従来の符号化方法によれば、楽音や音声等のディジタ
ルデータを高能率で圧縮符号化することができる。
【0008】しかしながら、正弦波のように純音性の高
いディジタルデータに対してマスキング閾値対雑音比M
NR(n)を用いたビット割り当てを行うと、自身のパ
ワー或いはエネルギーによって自身がマスキングの影響
を受けてしまうため、信号対雑音比SNR(n)=S/
N(n)を用いたビット割り当てを行った場合と比べ
て、符号化・復号化時の歪み率、S/N特性、及びダイ
ナミックレンジといったオーディオ特性が悪化するとい
う課題があった。
【0009】また、超低域や超高域の正弦波に対してマ
スキング閾値対雑音比MNR(n)を用いたビット割り
当てを行うと、最小可聴限もオーディオ特性の悪化要因
となるおそれがあった。なお、超低域の正弦波に対して
信号対雑音比SNR(n)を用いたビット割り当てを行
った場合には、隣接するサブバンドフレーム間の分析窓
のクロスポイントで、知覚可能な量子化誤差が生じるお
それがあった。
【0010】一方、ホワイトノイズのように純音性の低
いディジタルデータに対してマスキング閾値対雑音比M
NR(n)を用いたビット割り当てを行うと、自身のパ
ワー或いはエネルギーによって、マスキング閾値対雑音
比MNR(n)が広帯域でフラットにならないため、信
号対雑音比SNR(n)を用いたビット割り当てを行っ
た場合と比べて、符号化・復号化時の音質が悪化すると
いう課題があった。また、最小可聴限も音質の悪化要因
となるおそれがあった。
【0011】この点、本件出願人は、特開平10−20
7489号公報において、純音性の高いディジタルデー
タ或いは純音性の低いディジタルデータを符号化する場
合、各周波数帯域の相互に隣接するスペクトルのパワー
S(或いはエネルギー)の差から求めたピーク及びロー
カルピークとマスキング閾値Mとの関係に対応して、マ
スキング閾値対雑音比MNR(n)を用いたビット割り
当てを行うビットレートと、信号対雑音比SNR(n)
を用いたビット割り当てを行うビットレートとを、可変
させる構成のディジタルデータ符号化方法を提案してい
る。
【0012】確かに、上記の符号化方法によれば、正弦
波のように狭帯域なディジタルデータから、ホワイトノ
イズのように広帯域なディジタルデータに至るまで、最
適なビット割り当てを自動的に行うことができるので、
マスキング閾値対雑音比MNR(n)等の同時マスキン
グを利用したビット割り当てに不向きな楽音に対しても
音質の劣化を防止することができる。しかしながら、マ
スキング閾値対雑音比MNR(n)と信号対雑音比SN
R(n)とを併用する上記の符号化方法では、アルゴリ
ズムが複雑なものとなっていた。
【0013】本発明は上記の問題点に鑑み、アルゴリズ
ムを複雑化することなく、純音性の高いディジタルデー
タから純音性の低いディジタルデータまで、高忠実に符
号化することが可能なディジタルデータの符号化方法を
提供することを第1の目的とする。また、本発明は、超
低域であってかつ純音性の高いディジタルデータを符号
化する際であっても、隣接するサブバンドフレーム間の
分析窓のクロスポイントで、知覚可能な量子化誤差が生
じるおそれの少ないディジタルデータの符号化方法を提
供することを第2の目的とする。
【0014】
【課題を解決するための手段】上記した第1の目的を達
成するために、本発明に係るディジタルデータの符号化
方法では、楽音や音声等のディジタルデータを周波数領
域に変換するステップと、前記周波数領域を複数の周波
数帯域に分割するステップと、聴覚心理特性を反映して
前記周波数帯域のパワーまたはエネルギーの大きさから
各周波数帯域のマスキング閾値対雑音比を求めるステッ
プと、前記マスキング閾値対雑音比の大小に基づいて前
記周波数帯域毎にビット割り当てを行うステップと、を
有するディジタルデータの符号化方法において、前記周
波数帯域のパワーまたはエネルギーの最大値及び平均値
から、入力された前記ディジタルデータの純音性を判定
するステップを有している。
【0015】なお、上記したディジタルデータの符号化
方法においては、前記ディジタルデータの純音性の高低
に応じて、マスキング特性を変更するとよい。
【0016】また、上記した第2の目的を達成するため
に、本発明に係るディジタルデータの符号化方法では、
楽音や音声等のディジタルデータを複数のサブバンドフ
レームに分割するステップと、前記サブバンドフレーム
を周波数領域に変換するステップと、前記周波数領域を
複数の周波数帯域に分割するステップと、前記周波数帯
域毎にビット割り当てを行うステップと、を有するディ
ジタルデータの符号化方法において、前記周波数帯域の
パワーまたはエネルギーの最大値及び平均値から、入力
された前記ディジタルデータの純音性を判定するステッ
プと、前記ディジタルデータの純音性が高い場合、前記
周波数帯域のパワーまたはエネルギーの最大値が存在す
るサブバンドフレームの全ての周波数帯域に、少なくと
も最低量子化ビット数以上のビットを割り当てるステッ
プと、を有している。
【0017】
【発明の実施の形態】本発明に係るディジタルデータの
符号化方法を採用したディジタル録音再生装置として、
ここでは、ミニディスク録音再生装置を例に挙げて説明
を行う。図1は本発明に係るディジタルデータの符号化
方法を採用したミニディスク録音再生装置の一構成例を
示すブロック図である。
【0018】本図に示すミニディスク録音再生装置1に
設けられた入力端子2には、コンパクトディスク再生装
置や衛星放送受信装置などのディジタル音声信号源から
出力されたディジタル音声データが、例えば光信号とし
てシリアル入力される。入力端子2に入力された光信号
は、光電素子3によって電気信号に変換された後、ディ
ジタルPLL(Phase-Locked-Loop)回路4に入力され
る。
【0019】ディジタルPLL回路4は、入力されたデ
ィジタル音声データからクロックの抽出を行うととも
に、サンプリング周波数および量子化ビット数に対応し
たマルチビットデータを再現する。このマルチビットデ
ータは信号源毎に異なるサンプリングレート(コンパク
トディスク;44.1kHz、ディジタルオーディオテ
ープレコーダ;48kHz、衛星放送(Aモード);3
2kHzなど)で標本化されたディジタルデータであ
る。そこで、ディジタルPLL回路4から出力されたマ
ルチビットデータは、周波数変換回路5によってそのサ
ンプリングレートをミニディスクの規格に対応した4
4.1kHzに変換される。
【0020】音声圧縮回路6は、ATRAC(Adaptive
TRansform Acoustic Coding)方式によって入力された
ディジタル音声データの圧縮符号化を行い、符号化され
たディジタル音声データをショックプルーフメモリコン
トローラ7を介して信号処理回路8に送出する。なお、
音声圧縮回路6におけるディジタルデータの符号化方法
については、後ほど詳細に説明を行う。
【0021】ショックプルーフメモリコントローラ7で
制御されるショックプルーフメモリ9は、音声圧縮回路
6から出力されるディジタル音声データの転送速度と、
信号処理回路8に入力されるディジタル音声データの転
送速度との差を吸収するとともに、再生時における振動
等の外乱による再生信号の中断を補間し、ディジタル音
声データを保護するためのものである。
【0022】信号処理回路8は、エンコーダおよびデコ
ーダとしての機能を備えており、入力されたディジタル
音声データをシリアルの磁界変調信号にエンコードして
ヘッド駆動回路10に与える。ヘッド駆動回路10は、
記録ヘッド11をミニディスク12上の所定記録位置に
移動させるとともに、前記磁界変調信号に対応した磁界
を発生させる。このとき、ミニディスク12上の所定記
録位置には、光ピックアップ13からレーザ光が照射さ
れており、これによって前記磁界に対応した磁化パター
ンがミニディスク12上に形成される。
【0023】一方、光ピックアップ13は、ミニディス
ク12から前記磁化パターンに対応したシリアル信号を
再生する。再生されたシリアル信号は高周波アンプ14
(以下、RFアンプ14と呼ぶ)で増幅された後、信号
処理回路8によってディジタル音声データにデコードさ
れる。デコードされたディジタル音声データは、ショッ
クプルーフメモリコントローラ7及びショックプルーフ
メモリ9で外乱による影響を除去された後、音声伸長回
路15に送出される。
【0024】音声伸長回路15は、ATRAC方式によ
る圧縮符号化の逆変換処理を行い、フルビットのディジ
タル音声データを復調する。復調されたディジタル音声
データは、ディジタル/アナログ変換回路16(以下、
D/A変換回路16と呼ぶ)によってアナログ音声デー
タに変換され、出力端子17から外部へ出力される。
【0025】なお、RFアンプ14で増幅されたシリア
ル信号は、サーボ回路18にも入力されている。サーボ
回路18は、再生されたシリアル信号に応じてドライバ
回路19に制御信号を送出し、該ドライバ回路19を介
してスピンドルモータ20の回転速度をフィードバック
制御する。このようなフィードバック制御により、ミニ
ディスク12を線速度一定で回転させることができる。
【0026】また、サーボ回路18は、ドライバ回路1
9を介して送りモータ21の回転速度もフィードバック
制御している。このようなフィードバック制御により、
ミニディスク12の半径方向に対する光ピックアップ1
3の変移制御、すなわちトラッキング制御を行うことが
できる。さらに、サーボ回路18は、ドライバ回路19
を介して光ピックアップ13のフォーカシング制御も行
っている。
【0027】上記した信号処理回路8、光ピックアップ
13、RFアンプ14、サーボ回路18、及びドライバ
回路19等には、図示しない電源回路から電力供給が行
われるが、このような電力供給動作や後述する信号処理
動作は、全てシステムコントロールマイコン22によっ
て集中管理されている。なお、システムコントロールマ
イコン22には、曲名入力や選曲操作、或いは音質調整
動作等を行うための入力装置23が接続されている。
【0028】続いて、上記した音声圧縮回路6における
ディジタルデータ符号化処理の第1実施形態について説
明する。図2は音声圧縮回路6の第1実施形態を示すブ
ロック図であり、特に、スペクトル変換部に続くビット
割当処理部を模式化したものである。
【0029】本図に示すビット割当処理部の入力端に
は、その前段に設けられたスペクトル変換部(図示せ
ず)で得られたMDCT係数(ディジタル音声データを
構成する周波数成分(スペクトル))が入力される。な
お、スペクトル変換部は、周波数変換回路5から入力さ
れたディジタル音声データ(44.1kHz)を、帯域
分割フィルタであるQMF(Quadrature Mirror Filte
r)によって複数の周波数帯域(サブバンドフレーム)
に分割し、そのサブバンドフレーム単位毎にMDCT
(Modified Discrete Cosine Transform)処理を施すこ
とで、ディジタル音声データのスペクトル変換を行って
いる。
【0030】パワー算出部31は、入力されたMDCT
係数をさらにi個の周波数帯域(臨界帯域等)に分割
し、各周波数帯域に属するMDCT係数の2乗和から、
各周波数帯域のスペクトルパワーSi(i=1,2,
…,I、例えばI=25)を算出する。なお、臨界帯域
とは、周波数選択性・マスキング閾値等の特定の音響心
理学的規則性が有効な広帯域オーディオスペクトルの特
性的部分のことである。
【0031】純音性判定部32は、パワー算出部31で
算出されたスペクトルパワーSiの最大値Smaxと平均値
av(=ΣSi/I)との差分値(Smax−Sav)を求め
るとともに、該差分値の大小からディジタル音声データ
の純音性の高低を判定し、その判定結果に基づいて切換
部33の切換制御を行う。
【0032】図3はパワー算出部31で算出されたスペ
クトルパワーSiの一例を示す図である。本図中(a)
に示すように、スペクトルパワーSiの最大値Smaxと平
均値Savとの差分値(Smax−Sav)が非常に大きい場
合、例えばSmax−Sav≧40dBを満たす場合、純音
性判定部32は、入力されたディジタル音声データの純
音性が高いと判定して、平坦マスキング算出部35を選
択するように切換部33の切換制御を行う。
【0033】また、本図中(b)に示すように、スペク
トルパワーSiの最大値Smaxと平均値Savとの差分値
(Smax−Sav)が非常に小さい場合、例えばSmax−S
av≦6dBを満たす場合、純音性判定部32は、入力さ
れたディジタル音声データの純音性が低いと判定して、
上記と同様、平坦マスキング算出部35を選択するよう
に切換部33の切換制御を行う。
【0034】一方、スペクトルパワーSiの最大値Smax
と平均値Savとの差分値(Smax−Sav)が上記のいず
れにも該当しない場合、例えば6dB<Smax−Sav
40dBを満たす場合、純音性判定部32は、入力され
たディジタル音声データに対する聴覚心理、すなわちマ
スキング効果が有効であると判断して、基準マスキング
算出部34を選択するように切換部33の切換制御を行
う。
【0035】上記の純音性判定動作により、基準マスキ
ング算出部34が選択された場合、最小可聴限合成部3
6は、音声圧縮部6のテーブルROM(図示せず)に予
め格納されている基準マスキング特性と最小可聴限特性
とを合成することで、最終的なマスキング閾値Miを決
定する。一方、平坦マスキング算出部35が選択された
場合、最小可聴限合成部36は、周波数に重み付けを行
っていない平坦なマスキング特性と最小可聴限特性とを
合成することで、最終的なマスキング閾値Miを決定す
る。
【0036】SMR算出部37は、各周波数帯域のイン
デックスを前記iとするとき、パワー算出部31で算出
されたスペクトルパワーSiと、最小可聴限合成部36
で決定された各周波数帯域のマスキング閾値Miとの比
SMRi(=Si/Mi)を、全ての周波数帯域に亘って
計算する。
【0037】MNR算出部38は、まず各周波数帯域の
スペクトルパワーSiと、該スペクトルパワーSiをnビ
ットで量子化したときに生じる量子化雑音パワーN
i(n)との比、すなわち信号対雑音比SNRi(n)
(=Si/Ni(n))を求める。なお、この信号対雑音
比SNRi(n)は、統計的には信号特性に応じた定数
となるので、予め統計処理によって求めておいてもよ
い。さらに、MNR算出部38は、この信号対雑音比S
NRi(n)と、SMR算出部37で得られた比SMRi
から、マスキング閾値Miと量子化雑音パワーNiとの
比、すなわちマスキング閾値対雑音比MNRi(n)
(=SNRi(n)/SMRi)を算出する。
【0038】量子化ビット数算出部39は、各周波数帯
域の量子化ビット数nを0から順に大きくしていき、そ
の都度、各周波数帯域のマスキング閾値対雑音比MNR
i(n)を計算する。そして、マスキング閾値対雑音比
MNRi(n)が最小となる周波数帯域から順にビット
を割り当てていく。その後、量子化ビット数nを更新す
る度毎に、マスキング閾値対雑音比MNRi(n)が最
小となる周波数帯域に対する同様のビット割り当てを行
う。所定の割り当て可能ビット数となるまで割り当てを
行うと、各周波数帯域の語長が決定されて出力が行われ
る。すなわち、スペクトルパワーSiの絶対値が、マス
キング閾値Miを超えた部分の長さが最も長い周波数帯
域から順にビット割り当てが行われることになる。
【0039】上記したディジタルデータの符号化方法で
あれば、正弦波のように純音性の高いディジタルデー
タ、或いはホワイトノイズのように純音性の低いディジ
タルデータに対して、マスキング閾値対雑音比MNRi
(n)のみを用いてビット割り当てを行った場合であっ
ても、信号対雑音比SNRi(n)を用いてビット割り
当てを行った場合と同等のオーディオ特性及び音質を得
ることができる。
【0040】また、本実施形態におけるディジタルデー
タの符号化方法であれば、楽音や音声のように、聴覚心
理を利用した方が好ましい音源には、通常のマスキング
閾値対雑音比MNRi(n)を用いたビット割り当てを
行うので、信号対雑音比SNRi(n)を用いてビット
割り当てを行うよりも、聴覚的に優れた音質を得ること
ができる。さらに、マスキング閾値対雑音比MNR
i(n)と信号対雑音比SNRi(n)とを併用する従来
の符号化方法に比べて、アルゴリズムを容易に実現する
ことが可能である。
【0041】続いて、音声圧縮回路6におけるディジタ
ルデータ符号化処理の第2実施形態について説明する。
図4は音声圧縮回路6の第2実施形態を示すブロック図
であり、説明の理解を深めるために音声伸長回路15も
合わせて示している。
【0042】本図に示す音声圧縮回路6の入力端には、
周波数変換回路5で得られたディジタル音声データ(4
4.1kHz)が入力される。音声圧縮回路6の最前段
に設けられた周波数帯域分割部41は、入力されたディ
ジタル音声データを複数の周波数帯域(サブバンドフレ
ーム)に分割する。
【0043】時間周波数変換部42は、周波数帯域分割
部41で得られたサブバンドフレーム単位毎にMDCT
処理を施すことで、ディジタル音声データをMDCT係
数に変換する。このときのMDCT処理によって得られ
る変換データXm(k)は、次の(1)式で示される。
【数1】
【0044】なお、上式中の変数mはブロック番号を表
しており、関数xm(i)は入力信号を表している。ま
た、関数h(i)は順変換用窓関数を表している。図5
は順変換窓関数h(i)の時間特性の一例を示す概念図
であり、図6は順変換窓関数h(i)の周波数特性の一
例を示す概念図である。
【0045】パワー算出部43は、時間周波数変換部4
2で得られたMDCT係数をさらにi個の周波数帯域
(臨界帯域等)に分割し、各周波数帯域に属するMDC
T係数の2乗和から、各周波数帯域のスペクトルパワー
i(i=1,2,…,I、例えばI=25)を算出す
る。
【0046】純音性判定部44は、パワー算出部43で
算出されたスペクトルパワーSiの最大値Smaxと平均値
av(=ΣSi/I)との差分値(Smax−Sav)を求め
るとともに、該差分値の大小からディジタル音声データ
の純音性の高低を判定し、その判定結果に基づいて量子
化ビット数算出部49における量子化ビット数の割り当
て制御を行う。
【0047】図7は本実施形態における量子化ビット数
の割り当て制御を説明するための図であり、パワー算出
部31で算出されたスペクトルパワーSiの一例(a)
と、その際に割り当てられる量子化ビット数の一例
(b)と、を示している。なお、本図では、入力された
ディジタル音声データが4つのサブバンドフレームSB
1〜SB4に分割されている場合を例に挙げて説明を行
う。
【0048】本図中(a)に示すように、スペクトルパ
ワーSiの最大値Smaxと平均値Savとの差分値(Smax
−Sav)が非常に大きく(例えばSmax−Sav≧40d
B)、かつスペクトルパワーSiの最大値Smaxが存在す
る周波数が所定周波数(例えば100Hz)以下である
場合、純音性判定部44は、入力されたディジタル音声
データが超低域であるとともに純音性が高いと判定し
て、本図中(b)に示すように、スペクトルパワーSi
の最大値Smaxが存在するサブバンドフレームSB1
に、少なくとも最低の量子化ビット数を割り当てるよ
う、量子化ビット数算出部49に対する指示を行う。
【0049】このようなビット割り当てを行うことによ
り、特定周波数のノイズを低減することが可能となる。
従って、超低域であるとともに純音性が高いディジタル
音声データ(例えば、超低域の正弦波)を符号化する場
合であっても、隣接するサブバンドフレーム間の分析窓
のクロスポイントで、知覚可能な量子化誤差が生じるお
それが少なくなる。
【0050】パワー算出部43の後段に接続されたマス
キング算出部45、最小可聴限合成部46、SMR算出
部47、MNR算出部48、及び量子化ビット数算出部
49は、前述の第1実施形態と同様、マスキング閾値対
雑音比MNRi(n)を用いたビット割り当てを行い、
量子化ビット数を決定する。
【0051】量子化部50及びパッキング部51は、量
子化ビット数算出部49で得られた量子化ビット数に従
って、入力されたディジタル音声データを圧縮符号化す
る。このようにして圧縮符号化されたディジタル音声デ
ータは、信号処理回路8などを介してミニディスク12
に記録される。
【0052】一方、ミニディスク12を再生する際、音
声伸長回路15のアンパッキング部52及び逆量子化部
53は、圧縮符号化されたディジタル音声データを元の
MDCT係数に復元する。
【0053】周波数時間変換部54は、復元されたMD
CT係数に対して、サブバンドフレーム単位毎にIMD
CT(Inverse Modified Discrete Cosine Transform)
処理を施す。このときのIMDCT処理によって得られ
る復元信号x^m(i)は、次の(2)式で示される。
【数2】
【0054】なお、上式中の変数mはブロック番号を表
しており、関数Xm(k)は変換データ(復元されたM
DCT係数)を表している。また、関数ym(i)は逆
変換信号を表しており、関数f(i)は逆変換用窓関数
を表している。
【0055】続く周波数帯域合成部55は、周波数時間
変換部54によって得られた復元信号x^m(i)を合
成することで元のディジタル音声データを復元し、該デ
ィジタル音声データを次段のD/A変換回路16に送出
する。
【0056】なお、変換データXm(k)が量子化によ
る影響を受けることなく、復元信号x^m(i)から元
のディジタル音声データを復元できるように、上記した
時間周波数変換部42及び周波数時間変換部54は、次
の(3)式を満たすように設計されるべきである。本条
件はCAS90−10やDSP90−14等により既に
公知とされている。
【数3】
【0057】一方、変換データXm(k)が量子化によ
る影響を受けた場合について、参考までに説明する。図
8は変換データXm(k)が量子化による影響を受けた
場合を説明する図であり、周波数帯域合成部55から出
力されるディジタル音声データの一例(a)と、該ディ
ジタル音声データの符号化時におけるビット割り当ての
一例(b)と、を示している。
【0058】本図中(b)に示すように、サブバンドフ
レームSB1の低域から1/3程度の周波数成分にのみ
ビット割り当てを行った場合、復元信号x^m(i)の
周波数特性は本図中(a)のようになり、窓関数の周波
数特性のノイズが発生する。このような量子化ノイズ
は、サブバンドフレームSB1のどの周波数にでも少な
からず発生するが、この例ではサブバンドフレームSB
1の低域から1/3程度に集中してビットを割り当てて
いるため、残りの2/3の周波数成分における量子化ノ
イズが知覚されやすい。従って、前述した通り、スペク
トルパワーSiの最大値Smaxが存在するサブバンドフレ
ームSB1に、少なくとも最低の量子化ビット数を割り
当てれば、特定周波数のノイズを低減することが可能と
なる。
【0059】なお、上記の実施形態では、本発明に係る
ディジタルデータの符号化方法をミニディスク録音再生
装置に適用した例を挙げて説明を行ったが、本発明の適
用範囲がこれに限定されないことは言うまでもない。
【0060】
【発明の効果】本発明に係るディジタルデータの符号化
方法では、楽音や音声等のディジタルデータを周波数領
域に変換するステップと、前記周波数領域を複数の周波
数帯域に分割するステップと、聴覚心理特性を反映して
前記周波数帯域のパワーまたはエネルギーの大きさから
各周波数帯域のマスキング閾値対雑音比を求めるステッ
プと、前記マスキング閾値対雑音比の大小に基づいて前
記周波数帯域毎にビット割り当てを行うステップと、を
有するディジタルデータの符号化方法において、前記周
波数帯域のパワーまたはエネルギーの最大値及び平均値
から、入力された前記ディジタルデータの純音性を判定
するステップを有している。
【0061】なお、上記したディジタルデータの符号化
方法においては、前記ディジタルデータの純音性の高低
に応じて、マスキング特性を変更するとよい。
【0062】このようなディジタルデータの符号化方法
であれば、正弦波のように純音性の高いディジタルデー
タ、或いはホワイトノイズのように純音性の低いディジ
タルデータに対して、マスキング閾値対雑音比のみを用
いてビット割り当てを行った場合であっても、信号対雑
音比を用いてビット割り当てを行った場合と同等のオー
ディオ特性及び音質を得ることができる。
【0063】また、本発明に係るディジタルデータの符
号化方法であれば、楽音や音声のように、聴覚心理を利
用した方が好ましい音源には、通常のマスキング閾値対
雑音比を用いたビット割り当てを行うので、信号対雑音
比を用いてビット割り当てを行うよりも、聴覚的に優れ
た音質を得ることができる。さらに、マスキング閾値対
雑音比と信号対雑音比とを併用する従来の符号化方法に
比べて、アルゴリズムを容易に実現することが可能であ
る。
【0064】また、本発明に係るディジタルデータの符
号化方法では、楽音や音声等のディジタルデータを複数
のサブバンドフレームに分割するステップと、前記サブ
バンドフレームを周波数領域に変換するステップと、前
記周波数領域を複数の周波数帯域に分割するステップ
と、前記周波数帯域毎にビット割り当てを行うステップ
と、を有するディジタルデータの符号化方法において、
前記周波数帯域のパワーまたはエネルギーの最大値及び
平均値から、入力された前記ディジタルデータの純音性
を判定するステップと、前記ディジタルデータの純音性
が高い場合、前記周波数帯域のパワーまたはエネルギー
の最大値が存在するサブバンドフレームの全ての周波数
帯域に、少なくとも最低量子化ビット数以上のビットを
割り当てるステップと、を有している。
【0065】このようなディジタルデータの符号化方法
であれば、特定周波数のノイズを低減することが可能と
なる。従って、超低域であるとともに純音性が高いディ
ジタル音声データ(例えば、超低域の正弦波)を符号化
する場合であっても、隣接するサブバンドフレーム間の
分析窓のクロスポイントで、知覚可能な量子化誤差が生
じるおそれが少なくなる。
【図面の簡単な説明】
【図1】 本発明に係るディジタルデータの符号化方法
を採用したミニディスク録音再生装置の一構成例を示す
ブロック図である。
【図2】 音声圧縮回路6の第1実施形態を示すブロッ
ク図である。
【図3】 パワー算出部31で算出されたスペクトルパ
ワーSiの一例を示す図である。
【図4】 音声圧縮回路6の第2実施形態を示すブロッ
ク図である。
【図5】 順変換窓関数h(i)の時間特性の一例を示
す概念図である。
【図6】 順変換窓関数h(i)の周波数特性の一例を
示す概念図である。
【図7】 第2実施形態における量子化ビット数の割り
当て制御を説明するための図である。
【図8】 変換データXm(k)が量子化による影響を
受けた場合を説明する図である。
【符号の説明】
1 ミニディスク録音再生装置 2 入力端子 3 光電素子 4 ディジタルPLL回路 5 周波数変換回路 6 音声圧縮回路 7 ショックプルーフメモリコントローラ 8 信号処理回路 9 ショックプルーフメモリ 10 記録ヘッド駆動回路 11 記録ヘッド 12 ミニディスク 13 光ピックアップ 14 高周波アンプ(RFアンプ) 15 音声伸長回路 16 ディジタル/アナログ変換回路(D/A変換回
路) 17 出力端子 18 サーボ回路 19 ドライバ回路 20 スピンドルモータ 21 送りモータ 22 システムコントロールマイコン 23 入力装置 31 パワー算出部 32 純音性判定部 33 切換部 34 基準マスキング算出部 35 平坦マスキング算出部 36 最小可聴限合成部 37 SMR算出部 38 MNR算出部 39 量子化ビット数算出部 41 周波数帯域分割部 42 時間周波数変換部 43 パワー算出部 44 純音性判定部 45 マスキング算出部 46 最小可聴限合成部 47 SMR算出部 48 MNR算出部 49 量子化ビット数算出部 50 量子化部 51 パッキング部 52 アンパッキング部 53 逆量子化部 54 周波数時間変換部 55 周波数帯域合成部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】楽音や音声等のディジタルデータを周波数
    領域に変換するステップと、前記周波数領域を複数の周
    波数帯域に分割するステップと、聴覚心理特性を反映し
    て前記周波数帯域のパワーまたはエネルギーの大きさか
    ら各周波数帯域のマスキング閾値対雑音比を求めるステ
    ップと、前記マスキング閾値対雑音比の大小に基づいて
    前記周波数帯域毎にビット割り当てを行うステップと、
    を有するディジタルデータの符号化方法において、 前記周波数帯域のパワーまたはエネルギーの最大値及び
    平均値から、入力された前記ディジタルデータの純音性
    を判定するステップを有することを特徴とするディジタ
    ルデータの符号化方法。
  2. 【請求項2】前記ディジタルデータの純音性の高低に応
    じて、マスキング特性を変更するステップを有すること
    を特徴とする請求項1に記載のディジタルデータの符号
    化方法。
  3. 【請求項3】楽音や音声等のディジタルデータを複数の
    サブバンドフレームに分割するステップと、前記サブバ
    ンドフレームを周波数領域に変換するステップと、前記
    周波数領域を複数の周波数帯域に分割するステップと、
    前記周波数帯域毎にビット割り当てを行うステップと、
    を有するディジタルデータの符号化方法において、 前記周波数帯域のパワーまたはエネルギーの最大値及び
    平均値から、入力された前記ディジタルデータの純音性
    を判定するステップと、前記ディジタルデータの純音性
    が高い場合、前記周波数帯域のパワーまたはエネルギー
    の最大値が存在するサブバンドフレームの全ての周波数
    帯域に、少なくとも最低量子化ビット数以上のビットを
    割り当てるステップと、を有することを特徴とするディ
    ジタルデータの符号化方法。
JP2001158767A 2001-05-28 2001-05-28 ディジタルデータの符号化方法 Expired - Fee Related JP3776004B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001158767A JP3776004B2 (ja) 2001-05-28 2001-05-28 ディジタルデータの符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001158767A JP3776004B2 (ja) 2001-05-28 2001-05-28 ディジタルデータの符号化方法

Publications (2)

Publication Number Publication Date
JP2002351500A true JP2002351500A (ja) 2002-12-06
JP3776004B2 JP3776004B2 (ja) 2006-05-17

Family

ID=19002438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001158767A Expired - Fee Related JP3776004B2 (ja) 2001-05-28 2001-05-28 ディジタルデータの符号化方法

Country Status (1)

Country Link
JP (1) JP3776004B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006523859A (ja) * 2003-04-17 2006-10-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号合成
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
US7965978B2 (en) 2007-02-27 2011-06-21 Sharp Kabushiki Kaisha Transmitting/receiving method, transmitter/receiver, and recording medium therefor
CN104575508A (zh) * 2013-10-15 2015-04-29 京微雅格(北京)科技有限公司 一种音频信号变调的处理方法及其装置
CN111724800A (zh) * 2020-06-18 2020-09-29 长沙深之瞳信息科技有限公司 一种摩尔斯码音频降噪方法及使用该方法的降噪耳机

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006523859A (ja) * 2003-04-17 2006-10-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号合成
JP4834539B2 (ja) * 2003-04-17 2011-12-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号合成
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP2008151958A (ja) * 2006-12-15 2008-07-03 Sharp Corp 信号処理方法、信号処理装置及びプログラム
US7965978B2 (en) 2007-02-27 2011-06-21 Sharp Kabushiki Kaisha Transmitting/receiving method, transmitter/receiver, and recording medium therefor
CN104575508A (zh) * 2013-10-15 2015-04-29 京微雅格(北京)科技有限公司 一种音频信号变调的处理方法及其装置
CN111724800A (zh) * 2020-06-18 2020-09-29 长沙深之瞳信息科技有限公司 一种摩尔斯码音频降噪方法及使用该方法的降噪耳机
CN111724800B (zh) * 2020-06-18 2023-05-12 长沙深之瞳信息科技有限公司 一种摩尔斯码音频降噪方法及使用该方法的降噪耳机

Also Published As

Publication number Publication date
JP3776004B2 (ja) 2006-05-17

Similar Documents

Publication Publication Date Title
JP3328532B2 (ja) デジタルデータの符号化方法
US6169973B1 (en) Encoding method and apparatus, decoding method and apparatus and recording medium
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
JP3498375B2 (ja) ディジタル・オーディオ信号記録装置
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JP3186307B2 (ja) 圧縮データ記録装置及び方法
JPH06244738A (ja) ディジタル信号処理装置又は方法、及び記録媒体
JPH06268608A (ja) 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データの圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体
JP3175446B2 (ja) 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
JP3776004B2 (ja) ディジタルデータの符号化方法
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
JP3942882B2 (ja) ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
JP4271588B2 (ja) ディジタルデータの符号化方法および符号化装置
JP4627737B2 (ja) デジタルデータ復号化装置
JP3531178B2 (ja) ディジタル信号処理装置及び方法
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP4293833B2 (ja) ディジタル信号記録再生装置及びその制御プログラム
JP4822697B2 (ja) ディジタル信号符号化装置およびディジタル信号記録装置
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
JP3175456B2 (ja) ディジタル信号処理装置
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP4732478B2 (ja) ディジタル信号再生装置、及びその制御プログラム
JP3334375B2 (ja) ディジタル信号圧縮方法及び装置
JP2002091500A (ja) デジタルデータ符号化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060221

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100303

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100303

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110303

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120303

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120303

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130303

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130303

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140303

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees