JPH03132700A - 音声の適応直交変換符号化方法 - Google Patents

音声の適応直交変換符号化方法

Info

Publication number
JPH03132700A
JPH03132700A JP1271011A JP27101189A JPH03132700A JP H03132700 A JPH03132700 A JP H03132700A JP 1271011 A JP1271011 A JP 1271011A JP 27101189 A JP27101189 A JP 27101189A JP H03132700 A JPH03132700 A JP H03132700A
Authority
JP
Japan
Prior art keywords
level
power
value
minimum audible
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1271011A
Other languages
English (en)
Inventor
Norihiko Fuchigami
徳彦 渕上
Masaya Konishi
正也 小西
Sadahiro Yasura
定浩 安良
Yasuhiro Yamada
恭裕 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP1271011A priority Critical patent/JPH03132700A/ja
Priority to US07/597,700 priority patent/US5146222A/en
Priority to EP90311472A priority patent/EP0424162B1/en
Priority to DE69021986T priority patent/DE69021986T2/de
Publication of JPH03132700A publication Critical patent/JPH03132700A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、D CT (Discrete Co51n
e Trans−form) 、 D F T (Di
screte Fourier Trans「orm)
等を用いる音声の直交突換符号化方法に係り、符号レー
トを減少させるために、聴覚の最小可聴レベルを信号の
パワーレベルに適応させて規定するようにした音声の適
応直交変換符号化方法に関する。
(従来の技術) 従来より、音声信号の圧縮符号化を行う場合には、符号
レートを効果的に低減させるために、人間が聴取できな
い信号成分を“不要成分”として符号化から除外するこ
とが考えられている。
一般に正常な聴力を持つ人が“音”として感受できる音
圧の範囲(可聴範囲)は、第5図のように、最大可聴値
と最小可聴値との曲線に囲まれた斜線の領域であると言
われている。したがって、信号を音として再生した時に
最小可聴値以下になるような信号は除去できることにな
る。
ところで、時間軸上の信号波形を、直交変換により周波
数表現した場合に、その係数値は、理論的には、rul
l 5cale値(16bitデータであれば215)
から演算精度の値までを取り得る。したがって、l’u
ll 5cale値を第5図の最大可聴値(約120d
B  S、P、L)とし、それに対応して最小可聴値(
1kHzで約OdB  S、P、L)を決定し、それ以
下の値のサンプルを切り捨てるという方法がとられる。
しかし、f’uiI 5cale値−120dBと考え
ると(0,030dB) 、S、  P、  Lの値が
係数値と対数表示で対応がとれるが、実際の音楽信号で
は、f’ull 5caleまでの値を使っていること
はまれである。
そこで、信号レベルの平均値が約60dBのソースを再
生時にその平均値で(長時間聴取で可能例として)80
dBSS、P、Lとなるようにしたとすると、第6図(
A)において、ある周波数で最小可聴値(以下では、ス
レッシュホルド[Thresholdlと記す)以下と
して切り捨てた斜線部分は、実際の再生時には第6図(
B)となり、聴取できる部分を切り捨てたことになる。
そこで、このような場合には、スレッシュホルドを20
dB下げて設定する必要がある。逆にこのような設定の
もとに、平均レベル80dBの信号を80dBSS、P
、Lで再生した場合には、例えば、第7図(A)及(B
)のように、実際には聴取できない信号が残こることに
なる。
(発明が解決しようとする課題) 上記のように、様々なパワーレベルを持つ信号に対して
、ある1つのスレッシュホルドを決定し、それ以下のレ
ベルのサンプルの切り捨てを行う従来の方法では、再生
時の増幅率によっては信号を切り捨てすぎたり、又は逆
に不要な信号が残ったりするという問題が生じる。
そこで、本発明は、信号レベルを監視し、それに応じて
最小可聴レベルの規定値、スレッシュホルドレベルを適
応的に制御することにより。上記問題を解決し、効率の
よい符号化を可能としすこものである。
(課題を解決するための手段)       、。
本発明は、上記課題を解決するため、直交交換長あるい
はそれ以上の長さの区間について、入力された音声信号
のパワーの総和を算出し、そのパワーレベルに応じて、
直交変換後の周波数軸上での聴覚の最小可聴レベル規定
値を適応的に制御し、規定レベル以下のパワー持つをサ
ンプルを符号化から除外することによって、符号レート
を減少させたことを特徴とする音声の適応直交変換符号
化方法を提供するものである。
(作用) 本発明によれば、人力された音声信号のレベルが監視さ
れ、それに応じて最小可聴レベル規定値、すなわちスレ
ッシュホルドのレベルが適応的に制御される。
(実施例) 本発明になる音声の適応直交変換符号化方法の一実施例
を以下、図面とともに詳細に説明する。
第1図は本符号化方法の手順を示すフローチャート、第
2図は本符号化方法が実行される符号化装置の一例を示
す構成図である。
く符号化方法と符号化装置の構成〉 入力信号(音声信号)は、ウィンド手段1により所定の
直交変換長に切り出されて、次段の直交変換手段(DE
T、DCT)2及びパワー算出手段3に入力される(ス
テップ100)。
そして、直交変換手段2により直交変換され後に、次段
の切り捨て手段5に出力される。また、パワー算出手段
3により、直交変換長またはそれ以上の長さの区間につ
いて入力信号のノくワーレベルが算出される(ステップ
101)。
算出されたパワーレベルは、聴覚特性データ4からのデ
ータとともに、前記切り捨て手段5に出力される。
そして、後に詳述するように、切り捨て手段5で、前記
入力されたパワーレベルに応じて、第3図に示すA及び
Bのように、直交変換後の周波軸上での聴覚の最小可聴
レベル規定値(スレ・ソシュホルド値)が適応的に制御
される(ステップ102)。規定レベル以下のパワーを
持つサンプルは切り捨てられる(ステップ103)。
その結果、規定レベルより大きいレベルのノくワーを持
つサンプルが次段の量子化手段6、符号化手段7により
、符号化出力される(ステ・ツブ104)。
本方法により、スレッシュホルド固定のときに問題とな
る、信号の切り捨てすぎによる音質の劣化や不要信号の
切り残しによる符号の増加が防止され、信号のレベルに
よらずに常に適切なスレッシュホルド以下切り捨ての処
理を行うことができる。また、この方法により、常に処
理区間内の信号のダイナミックレンジをほぼ一定に保つ
ことになるので、区間による符号レートのばらつきを少
なくすることが可能となる。
く入力信号のパワーの算出〉 信号パワーの算出は、直交変換長あるいはそれ以上の長
さの単位区間について行う。区間長を長くすると、信号
パワーの急峻な変化に遅れること、となるので直交変換
長をそのまま用いる方法が良い。信号パワーの算出は直
交変換後の周波数軸上で行う方法でも、変換前の対応す
る時間軸上で行って、それを変換するという方法でも良
い。
前者の場合、直交変換のポイント数をNとすると区間パ
ワーP、は 但し、al、:区間iのj番目に対応する係数値J と書き表される。
規定すべきスレッシュホルド曲線は、必ずしも曲線のま
まで正確に表現する必要はない。本実施では、第4図に
示すように、20Hz〜20 kHz区間を、3本の直
線での折れ線近似により規定する。
なお、第4図において、節す1節Cの周波数はそれぞれ
4 kllz 、  14 kHzとし、a−b、b−
c。
c−dの傾斜は、それぞれ−6,5db10ct、 5
 dbloct。
100 db10員としている。
く最小可聴レベル規定値(スレッシュホルドレベル)の
適応化方法〉 信号パワーに対する適応化方法としては、式■による区
間パワーの対数値に対して、D [db](1−OdB
)だけ下げた値がスレッシュホルドの1kHzにおける
値、つまり (Th)    −1010g10Pi−D   [d
B]kHz ・・・・・・■ とし、これに応じてスレッシュホルド全体を規定する。
次に、各区間のサンプルのパワーと、上で決定したスレ
ッシュホルドを比較し、サンプルパワーがスレッシュホ
ルド以下であればこれを切り捨てるという処理を行う。
く本符号化方法の特長〉 この方法の特長を、前記した第6図(A)及び(B)、
第7図(A)及び(B)へ戻って説明する。両図から明
らかなように、平均レベルを80dB−スレッシュホル
ド(1kHz)に選ぶと、最適なスレッシュホルド処理
になることがわかる。
たたし、実際には区間における区間パワーP。
■ は、図の平均レベルの上下に分布しており、それに伴っ
て区間単位でスレッシュホルドも上下することになる。
この影響を考えると、パワーが平均レベルよりも小さい
場合には第7図(B)の状態と近似になり、パワーが平
均レベルより大きい場合には第7図(B)の状態と近似
になる。前者の場合は音質の劣化がなく、後者の場合に
も実際のトタールバワーが大きいので微小信号はマスキ
ングされ、やはり音質の劣化がない。
また、前者の場合不要信号が残ることにより若干符号量
を損するが、これはスレッシュホルドがある値以下にな
らないように適当な下限値を設定することにより改善さ
れる。後者については符号量は得をすることになる。総
じて、区間によるスレッシュホルドの上下動は悪影響を
及ぼさない。
前記した式■のD [dB]の具体的な値については、
種々の音楽について評価した結果、常識的な再生音量で
聴く場合にD−80〜70[db]と選ぶことにより、
音質の劣化なく目的が達せられることが判明した。
また、スレッシュホルドの下限値については、1 kH
zにおいて10  logloa  =−40〜−50
とすればよい。
(発明の効果) 以上詳述した点から明らかなように、本発明によれば、
様々なパワーレベルを持つ信号に対して、常に適切な最
小可聴値(スレッシュホルドレベル)の規定を行うこと
が可能となり、効果的に符号量を低減させることが出来
る。
また各区間(直交変換長)においてダイナミックレンジ
をほぼ一定に保つことにより、符号量の平滑化も同時に
行われる特長もある。
【図面の簡単な説明】
第1図は本発明になる音声の適応直交変換符号化方法の
一実施例を示すフローチャート、第2図は本符号化方法
を実行する符号化装置の構成図、第3図は本発明の処理
の概念図、第4図は折れ線によるスレッシュホルドの規
定図、第5図は正常な聴力を持つ人の可聴範囲を示す図
、第6図(A)及び(B)は最小可聴値と再生レベルに
より問題が生ずる場合の説明図、第7図(A)及び(B
)は最小可聴値と再生レベルにより問題が生ずる場合の
説明図である。 100・・・直交変換長に切り出すステップ、101・
・・パワーレベル算出ステップ、102・・・適応的に
制御するステップ、103・・・切り捨てステップ、 104・・・量子化・符号化ステップ。 周樗歇(Lo倉) 罰′−め考λ(1−12) 1蕗4昭 弔1 )劇づ反るにCビア) 用板$文(Hz) (八つ 冗 1kl(z 同県(咎(こH匙ノ (−A) ’f6 rl 因旺冬丈CHz) 1り(イミ myy版(Hz) (I3)

Claims (1)

  1. 【特許請求の範囲】 直交変換長あるいはそれ以上の長さの区間について、入
    力された音声信号のパワーの総和を算出し、 そのパワーレベルに応じて、直交変換後の周波数軸上で
    の聴覚の最小可聴レベル規定値を適応的に制御し、 規定レベル以下のパワーを持つサンプルを符号化から除
    外することによって、符号レートを減少させたことを特
    徴とする音声の適応直交変換符号化方法。
JP1271011A 1989-10-18 1989-10-18 音声の適応直交変換符号化方法 Pending JPH03132700A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1271011A JPH03132700A (ja) 1989-10-18 1989-10-18 音声の適応直交変換符号化方法
US07/597,700 US5146222A (en) 1989-10-18 1990-10-17 Method of coding an audio signal by using coding unit and an adaptive orthogonal transformation
EP90311472A EP0424162B1 (en) 1989-10-18 1990-10-18 Method of coding an audio signal by using an orthogonal transformation
DE69021986T DE69021986T2 (de) 1989-10-18 1990-10-18 Verfahren zur Kodierung eines Audiosignals unter Verwendung einer Orthogonaltransformation.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1271011A JPH03132700A (ja) 1989-10-18 1989-10-18 音声の適応直交変換符号化方法

Publications (1)

Publication Number Publication Date
JPH03132700A true JPH03132700A (ja) 1991-06-06

Family

ID=17494169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1271011A Pending JPH03132700A (ja) 1989-10-18 1989-10-18 音声の適応直交変換符号化方法

Country Status (4)

Country Link
US (1) US5146222A (ja)
EP (1) EP0424162B1 (ja)
JP (1) JPH03132700A (ja)
DE (1) DE69021986T2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4124493C1 (ja) * 1991-07-24 1993-02-11 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
JP3404024B2 (ja) * 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63115200A (ja) * 1986-11-04 1988-05-19 株式会社日立製作所 音声分析方式
JPH02121414A (ja) * 1988-10-31 1990-05-09 Fuji Xerox Co Ltd 直交変換符号化装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
DE3703143A1 (de) * 1987-02-03 1988-08-11 Thomson Brandt Gmbh Verfahren zur uebertragung eines audiosignals
BE1000643A5 (fr) * 1987-06-05 1989-02-28 Belge Etat Procede de codage de signaux d'image.
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63115200A (ja) * 1986-11-04 1988-05-19 株式会社日立製作所 音声分析方式
JPH02121414A (ja) * 1988-10-31 1990-05-09 Fuji Xerox Co Ltd 直交変換符号化装置

Also Published As

Publication number Publication date
EP0424162B1 (en) 1995-08-30
EP0424162A2 (en) 1991-04-24
US5146222A (en) 1992-09-08
DE69021986T2 (de) 1996-02-15
EP0424162A3 (en) 1992-08-19
DE69021986D1 (de) 1995-10-05

Similar Documents

Publication Publication Date Title
JP7038788B2 (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
US11429341B2 (en) Dynamic range control for a wide variety of playback environments
US8488809B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP6727194B2 (ja) 効率的なdrcプロファイル伝送
KR100477699B1 (ko) 양자화 잡음 분포 조절 방법 및 장치
EP3761672A1 (en) Using metadata to aggregate signal processing operations
US8054993B1 (en) System for automatic compensation of low frequency audio based on human loudness perceptual models
JPH03132700A (ja) 音声の適応直交変換符号化方法
KR20220071954A (ko) 오디오 신호의 정규화를 수행하는 방법 및 이를 위한 장치
EP4138299A1 (en) A method for increasing perceived loudness of an audio data signal
JP2000003194A (ja) 音声圧縮装置および記録媒体
JPH0758643A (ja) 音声高能率符号化および復号化装置
JPH0746137A (ja) 音声高能率符号化装置
JP2002297192A (ja) デジタルオーディオ復号装置