JP2001282295A - 符号化器及び符号化方法 - Google Patents

符号化器及び符号化方法

Info

Publication number
JP2001282295A
JP2001282295A JP2000092280A JP2000092280A JP2001282295A JP 2001282295 A JP2001282295 A JP 2001282295A JP 2000092280 A JP2000092280 A JP 2000092280A JP 2000092280 A JP2000092280 A JP 2000092280A JP 2001282295 A JP2001282295 A JP 2001282295A
Authority
JP
Japan
Prior art keywords
frequency
frequency component
peak value
audio signal
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000092280A
Other languages
English (en)
Inventor
Seiichi Takado
清一 高堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Aiwa Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aiwa Co Ltd filed Critical Aiwa Co Ltd
Priority to JP2000092280A priority Critical patent/JP2001282295A/ja
Publication of JP2001282295A publication Critical patent/JP2001282295A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 符号化された音声信号で再生した場合の音質
を向上させ心地よい音質にする。 【解決手段】 音声信号のマスクレベルMLを設定す
る。音声信号のピークを検出する。ピーク周波数(f
1、f2)のn倍の周波数f3(=n×f1)、f4
(=n×f2)を設定する。ピーク周波数f1のn倍の
周波数f3の音圧が、ピーク周波数f1の音圧d1の1
/n程度の音圧か判断する。ピーク周波数f1のn倍の
周波数f3の音圧が、ピーク周波数f1の音圧d1の1
/nの場合には、ピーク周波数f3を含む帯域でのマス
クレベルを、マスクレベルMLaから0に補正する。ピ
ーク周波数f2のn倍の周波数f4(=n×f2)につ
いても同様に設定する。マスクレベル以上の音声信号に
ついて量子化を行い、圧縮データを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、符号化器及び符号
化方法に係り、より詳しくは、音声信号を符号化する符
号化器及び符号化方法に関する。
【0002】
【従来の技術】従来より、音声信号を圧縮する符号化器
は、人間には可聴域があるという事実に鑑み、次のよう
に定めたマスクレベルML以上の音声信号のみを圧縮し
ている(図7参照)。
【0003】マスクレベルは、静的な音圧感度、存在す
る音の近傍周波数、時間的近傍によって定められるもの
である。即ち、マスクレベルは、周波数と音圧とにより
予め定められ(静的な音圧感度)、また、大きな音の周
りの音(例えば、100Hz範囲内)は聞えないとされ
(存在する音の近傍周波数)、さらに、大きな音の時間
的に前後する音(時間的近傍)は、人間の耳の構造上か
ら聞えないとされて定められている。
【0004】しかしながら、マスクレベル以下の音声信
号を除いて圧縮し、この圧縮された音声信号を復号して
再生しても、聴覚上の音質や音楽性を損なってしまい、
必ずしも心地よい音質と感じられない。
【0005】
【発明が解決しようとする課題】本発明は、上記事実に
鑑み成されたもので、符号化された音声信号で再生した
場合の音質を向上させ心地よい音質にすることの可能な
符号化器及び符号化方法を提案することを目的とする。
【0006】
【課題を解決するための手段】上記目的達成のため請求
項1記載の発明は、音声信号の周波数成分の内のピーク
値を少なくとも1つ検出する検出手段と、前記音声信号
の周波数成分に対する非可聴レベルを設定する設定手段
と、前記ピーク値に対応する周波数の倍音の周波数成分
が、前記ピーク値より所定値小さい値以下か否かを判断
する判断手段と、前記判断手段により前記ピーク値に対
応する周波数の倍音の周波数成分が、前記所定値小さい
値以下であると判断した場合には、少なくとも前記倍音
の周波数成分に対する前記非可聴レベルを小さくなるよ
うに補正する補正手段と、前記非可聴レベル以上の音声
信号の周波数成分を符号化する符号化手段と、を備えて
いる。
【0007】即ち、検出手段は、音声信号の周波数成分
の内のピーク値を少なくとも1つ検出する。設定手段
は、音声信号の周波数成分に対する非可聴レベルを設定
する。
【0008】判断手段は、上記ピーク値に対応する周波
数の倍音(例えば、2倍、3倍、・・・)の周波数成分
が、ピーク値より所定値小さい値以下か否かを判断す
る。例えば、請求項3のように、nを1より大きい自然
数、上記ピーク値をd、上記ピーク値に対応する周波数
をfとした場合、判断手段は、上記ピーク値に対応する
周波数fのn倍の周波数成分が、d/nを含む所定範囲
の上限値以下か否かを判断する。
【0009】補正手段は、判断手段によりピーク値に対
応する周波数fの倍音の周波数成分が、上記所定値小さ
い値以下であると判断した場合には、少なくとも上記倍
音の周波数成分に対する非可聴レベルを小さくなるよう
に補正する。なお、補正手段は、例えば、上記倍音の周
波数成分に対する非可聴レベルを0に補正したり、上記
ピーク値に対応する周波数fのn倍の周波数成分に対す
る非可聴レベルを、d/nに補正したり、してもよい。
【0010】そして、符号化手段は、上記非可聴レベル
(補正後の非可聴レベルを含む)以上の音声信号の周波
数成分を符号化する。
【0011】以上説明したように本発明は、音声信号の
周波数成分の内のピーク値に対応する周波数の倍音の周
波数成分が、上記ピーク値より所定値小さい値以下の場
合、少なくとも上記倍音の周波数成分に対する非可聴レ
ベルを小さくしている。
【0012】ここで、上記ピーク値に対応する周波数の
倍音成分(補正後の非可聴レベル以上)には、人間には
聞こえないとされている部分も含むが、この倍音成分を
含めて符号化された音声信号で再生した場合の音質は向
上し、心地よい音質になるとされている。
【0013】よって、本発明は、符号化された音声信号
で再生した場合の音質を向上させ、心地よい音質にする
ことができる。
【0014】なお、請求項2のように、補正手段は、非
可聴レベル以上の音声信号の周波数成分の量が予め定め
た量より多い場合、非可聴レベル以上の音声信号の周波
数成分の量が予め定めた量以内になるように、非可聴レ
ベルを小さくなるように更に補正する。符号化する量を
一定にすることができる。
【0015】なお、請求項4記載の発明は、請求項1記
載の発明と同様な作用・効果を奏するので、その説明を
省略する。
【0016】
【発明の実施の形態】以下、図面を参照して、本発明の
実施の形態を詳細に説明する。
【0017】図1には、本実施の形態に係る符号化器の
機能ブロック図が示されている。即ち、符号化器は、音
声信号(0〜22KHz)を32バンドに帯域分割する
ポリフェーズフィルターバンク部12と、各サブバンド
(帯域)ごとに12サンプルを一つのブロックとして、
スケールファクタを計算するスケールファクタ計算部1
4を備えている。また、符号化器は、音声信号を高速フ
ーリエ変換するFFT部16と、高速フーリエ変換した
結果とスケールファクタとを用いて、マスクレベルなど
を計算する心理音響モデル計算部18と、各サブバンド
(帯域)ごとに信号レベルのダイナミックレンジを求
め、データのビット数を求める最適ビットアロケーショ
ン計算部20を備えている。さらに、符号化器は、分割
された帯域ごとに、求められたビット数で音声信号を量
子化(圧縮)するサブバンドサンプル量子化(圧縮)部
22と、量子化された音声信号を所定のフォーマットに
フォーマット化して出力するフォーマット化部24を備
えている。
【0018】次に、本実施の形態に係る符号化器の作用
(符号化方法)を、図2に示したフローチャートを参照
して説明する。
【0019】ステップ32で、FFT部16は、入力デ
ータ(音声信号)をFFT解析する。ステップ34で、
図3に示すように、サンプリング周波数fsの1/2ま
でのサブバンド帯域ごとにピークを検出し、例えば上位
の2〜3個を選択する。即ち、図3に示すように、ピー
ク周波数f1、f2が選択される。なお、ピーク周波数
f1の音圧はd1(dB)であり、ピーク周波数f2の
音圧はd2(dB)であった。
【0020】ステップ36で、倍音フィルターを設定す
る。即ち、上記ステップ34で検出されたピーク周波数
(f1、f2)のn倍の周波数を設定する。即ち、上記
例では、図4に示すように、ピーク周波数f1のn(例
えば=2)倍の周波数f3(=n×f1)が設定され、
ピーク周波数f2のn倍の周波数f4(=n×f2)が
設定される。
【0021】ステップ38でマスクレベル(マスクスレ
ショルド、非可聴レベル)を計算する。即ち、前述した
ように、人間の聴覚特性をもとに、その時の聞えない音
圧レベルを計算する。これには、前述した静的な音圧感
度、存在する音の近傍周波数、時間的近傍によってマス
クレベルが計算される。
【0022】ここで、本ステップ38では更に、上記で
設定された倍音周波数の帯域で、ピーク周波数の音圧の
所定値小さい値以下か否か、例えば、1/n程度の信号
が存在するか否かを判断し、ピーク周波数の音圧の1/
n程度の信号が存在すると判断された場合には、マスク
レベルを上記計算されたマスクレベルより小さく、例え
ば、図4に示すように0にする。即ち、ピーク周波数f
1のn倍の周波数f3の音圧は、ピーク周波数f1の音
圧d1の1/n即ち1/2程度の音圧であるので、ピー
ク周波数f3を含む帯域でのマスクレベルを、マスクレ
ベルMLaから0に補正する。また、同様に、ピーク周
波数f2のn倍の周波数f4の音圧が、ピーク周波数f
2の音圧d2の1/n即ち1/2程度の音圧であるの
で、周波数f4を含む帯域のマスクレベルを、マスクレ
ベルMLbから0に補正する。
【0023】一方、図4には示していないが、倍音成分
の帯域で、ピーク周波数の音圧の1/nを数10%以上
超える場合には、マスクレベルは補正しない。
【0024】なお、マスクレベルを、ピーク周波数の音
圧の1/nに補正してもよい。
【0025】以上のようにすることで、後述するように
音質を向上し心地よい音質とされる1/f特性を持たせ
ることができる。
【0026】また、最適ビットアロケーション計算で
は、前述したように、帯域ごとに信号レベルのダイナミ
ックレンジを求め、データのビット数を求める。
【0027】ステップ40で、非伝送サブバンドを決定
する。即ち、上記ステップ38で得られたマスクレベル
から、マスクされて信号が見えなくなるサブバンドを決
定する。即ち、図5に示すように四角で囲まれた範囲が
伝送するバンド(伝送バンド)であり、それ以外の領域
は伝送しない非伝送サブバンドとして決定される。ステ
ップ42では、スケールファクタが計算される。
【0028】ステップ44で、ビットレートを計算す
る。即ち、非伝送サブバンド及びスケールファクタか
ら、伝送するデータ数からビットレートを計算する。ス
テップ46で、上記ステップ44で得られたビットレー
トが目標ビットレートより高いか否かを判断し、高いと
判断された場合には、ステップ38に戻り、以上の処理
(ステップ38〜46)を繰り返す。即ち、例えば、図
6に示すように、上記ステップ38で計算されたマスク
レベルML1を、全体に少し上げ、ビットレートが目標
ビットレートとなるマスクレベルML2を計算し直す。
【0029】一方、ビットレートが目標ビットレートと
なったと判断された場合には、ステップ48で、前述し
たようにマスクレベル以上の音声信号について量子化を
行い、ステップ50で、フォーマット化して圧縮データ
を出力する。
【0030】以上説明したように本実施の形態では、音
声信号の周波数成分のうちのピーク周波数の倍音の周波
数成分がピーク周波数のピーク値よりn分の1以下の場
合、マスクレベルを0にして、倍音成分が符号化されて
いるので、1/f特性を残したまま音楽性を保った圧縮
が可能となる。即ち、符号化された音声信号を復号化し
て再生した場合、音質を向上させ心地よい音質にするこ
とができる。
【0031】なお、本実施の形態では、MPEG Au
dioのアルゴリズムのレイヤIに基づいているが、本
発明はこれに限定されるものではなく、レイヤII、III
等にも同様に適用することができる。
【0032】
【発明の効果】以上説明したように本発明は、音声信号
の周波数成分の内のピーク値に対応する周波数の倍音の
周波数成分が、上記ピーク値より所定値小さい値以下の
場合、少なくとも上記倍音の周波数成分に対する非可聴
レベルを小さくしているので、上記ピーク値に対応する
周波数の倍音成分を符号化の対象に含めることができ、
この符号化された音声信号で再生した場合には、音質を
向上させ心地よい音質にすることができる、という効果
を有する。
【図面の簡単な説明】
【図1】本実施の形態に係る符号化器の機能ブロック図
である。
【図2】符号化器の作用を示すフローチャートである。
【図3】音声信号のピーク周波数を検出することを説明
する説明図である。
【図4】ピーク周波数のn倍の周波数のマスクレベルを
補正することを説明する説明図である。
【図5】伝送バンドを示した図である。
【図6】マスクレベルを補正することを説明する説明図
である。
【図7】従来のマスクレベルを説明する説明図である。
【符号の説明】
18 心理音響モデル計算部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の周波数成分の内のピーク値を
    少なくとも1つ検出する検出手段と、 前記音声信号の周波数成分に対する非可聴レベルを設定
    する設定手段と、 前記ピーク値に対応する周波数の倍音の周波数成分が、
    前記ピーク値より所定値小さい値以下か否かを判断する
    判断手段と、 前記判断手段により前記ピーク値に対応する周波数の倍
    音の周波数成分が、前記所定値小さい値以下であると判
    断した場合には、少なくとも前記倍音の周波数成分に対
    する前記非可聴レベルを小さくなるように補正する補正
    手段と、 前記非可聴レベル以上の音声信号の周波数成分を符号化
    する符号化手段と、 を備えた符号化器。
  2. 【請求項2】 前記補正手段は、前記非可聴レベル以上
    の音声信号の周波数成分の量が予め定めた量より多い場
    合、前記非可聴レベル以上の音声信号の周波数成分の量
    が予め定めた量以内になるように、前記非可聴レベルを
    大きくするように更に補正することを特徴とする請求項
    1記載の符号化器。
  3. 【請求項3】 nを1より大きい自然数、前記ピーク値
    をd、前記ピーク値に対応する周波数をfとした場合、
    前記判断手段は、前記ピーク値に対応する周波数fのn
    倍の周波数成分が、d/nを含む所定範囲の上限値以下
    か否かを判断することを特徴とする請求項1又は請求項
    2記載の符号化器。
  4. 【請求項4】 音声信号の周波数成分の内のピーク値を
    少なくとも1つ検出するステップと、 前記音声信号の周波数成分に対する非可聴レベルを設定
    するステップと、 前記ピーク値に対応する周波数の倍音の周波数成分が、
    前記ピーク値より所定値小さい値以下か否かを判断する
    ステップと、 前記ピーク値に対応する周波数の倍音の周波数成分が、
    前記所定値小さい値以下であると判断した場合には、少
    なくとも前記倍音の周波数成分に対する前記非可聴レベ
    ルを小さくなるように補正するステップと、 前記非可聴レベル以上の音声信号の周波数成分を符号化
    するステップと、 を有する符号化方法。
JP2000092280A 2000-03-29 2000-03-29 符号化器及び符号化方法 Pending JP2001282295A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000092280A JP2001282295A (ja) 2000-03-29 2000-03-29 符号化器及び符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000092280A JP2001282295A (ja) 2000-03-29 2000-03-29 符号化器及び符号化方法

Publications (1)

Publication Number Publication Date
JP2001282295A true JP2001282295A (ja) 2001-10-12

Family

ID=18607634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000092280A Pending JP2001282295A (ja) 2000-03-29 2000-03-29 符号化器及び符号化方法

Country Status (1)

Country Link
JP (1) JP2001282295A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501228A (ja) * 2007-10-31 2011-01-06 ケンブリッジ シリコン ラジオ リミテッド 知覚モデルの適応的調整

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501228A (ja) * 2007-10-31 2011-01-06 ケンブリッジ シリコン ラジオ リミテッド 知覚モデルの適応的調整

Similar Documents

Publication Publication Date Title
CN100555848C (zh) 音频信号处理系统
US6212496B1 (en) Customizing audio output to a user's hearing in a digital telephone
US8964998B1 (en) System for dynamic spectral correction of audio signals to compensate for ambient noise in the listener's environment
US8295496B2 (en) Audio signal processing
US7986797B2 (en) Signal processing system, signal processing apparatus and method, recording medium, and program
JP2002237785A (ja) 人間の聴覚補償によりsidフレームを検出する方法
JP4649546B2 (ja) 補聴器
EP3598440B1 (en) Systems and methods for encoding an audio signal using custom psychoacoustic models
US20080255825A1 (en) Providing translations encoded within embedded digital information
JPH07193548A (ja) 雑音低減処理方法
US6278387B1 (en) Audio encoder and decoder utilizing time scaling for variable playback
JP3765622B2 (ja) オーディオ符号化復号化システム
JPH08102687A (ja) 音声送受信方式
KR20230156156A (ko) 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
JPS62274941A (ja) 音声符号化方式
US20060239472A1 (en) Sound quality adjusting apparatus and sound quality adjusting method
US7565283B2 (en) Method and system for controlling potentially harmful signals in a signal arranged to convey speech
JP2009296297A (ja) 音声信号処理装置および方法
JP2001188599A (ja) オーディオ信号復号装置
JP2001282295A (ja) 符号化器及び符号化方法
JP4311541B2 (ja) オーディオ信号圧縮装置
KR20080068397A (ko) 음성명료도 향상장치 및 방법
JP2000148161A (ja) 自動音質音量制御方法と装置
JP2001343998A (ja) ディジタルオーディオデコーダ
CN113571072B (zh) 一种语音编码方法、装置、设备、存储介质及产品