JP2776300B2 - 音声信号処理回路 - Google Patents

音声信号処理回路

Info

Publication number
JP2776300B2
JP2776300B2 JP7133676A JP13367695A JP2776300B2 JP 2776300 B2 JP2776300 B2 JP 2776300B2 JP 7133676 A JP7133676 A JP 7133676A JP 13367695 A JP13367695 A JP 13367695A JP 2776300 B2 JP2776300 B2 JP 2776300B2
Authority
JP
Japan
Prior art keywords
smr
circuit
audio
samples
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7133676A
Other languages
English (en)
Other versions
JPH08328592A (ja
Inventor
容隆 渋谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP7133676A priority Critical patent/JP2776300B2/ja
Priority to EP19960108793 priority patent/EP0746115A3/en
Priority to US08/656,476 priority patent/US5832427A/en
Publication of JPH08328592A publication Critical patent/JPH08328592A/ja
Application granted granted Critical
Publication of JP2776300B2 publication Critical patent/JP2776300B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号処理回路に関
し、特にMPEGオーディオ方式の音声符号化に用いら
れるサブバンド符号化を行なう音声信号処理回路に関す
る。
【0002】
【従来の技術】テレビジョン等の音声信号の符号化方式
として、サブバンド符号化を利用して、音声信号の情報
量を減らし音声データを伝送または蓄積する技術とし
て、ISO/IEC,JTC1/SC2/WG8で標準
化検討されたMPEG(Moving Picture
Expert Group)における規格案の1つで
あり勧告ISO/IEC−11172−3(1993
年)(文献1)に規定されたMPEG(以下MPEGオ
ーディオ)規格が知られている。
【0003】MPEGオーディオの符号化に用いられて
いるサブバンド符号化回路をブロックで示す図3を参照
すると、このサブバンド符号化回路は入力音声サンプル
SIから信号とマスクの各々のレベルの比である信号対
マスク比(Signal to Mask Rati
o:SMR)を計算しSMR信号SMを出力するSMR
計算部11と入力音声サンプルSIにサブバンドフィル
タ処理を施し結果のサブバンド信号SFを出力するサブ
バンドフィルタ12とを含む音声信号処理回路1と、S
MR信号SMの値にに対応してサブバンド信号SFのビ
ット割当を決定するとともに量子化を行い量子化データ
QDを出力するビット割当/量子化回路2と、量子化デ
ータの供給に応答してビットストリームデータBSを構
成・出力するビットストリーム構成回路3とを備える。
【0004】図3を参照してこのサブバンド符号化回路
の動作について説明すると、音声信号処理回路1のサブ
バンドフィルタ12は、入力音声サンプルSIにサブバ
ンドフィルタ処理を行いサブバンド信号SFを生成す
る。SMR計算部11は、入力音声サンプルSIから上
述のSMRを算出し、SMR信号SMを生成する。ここ
で、マスクレベルとは、このレベル以下の小さい音は人
間の耳には聞こえないという音のレベルのことで、この
レベルはその時に聞いている音の周波数分布により変動
する。ビット割当/量子化回路2はこのSMR信号SM
の値に対応して、上記値が大きい場合には多くのビット
数を小さい場合には少ないビット数をそれぞれ割当るこ
とによりサブバンド信号SFのビット割当を決定する。
これにより、全体の音声信号対応のビットストリームの
ビット数を削減できる。そのビット割当に従いサブバン
ド信号SFを量子化し、量子化データQDをビットスト
リーム構成回路3に供給する。ビットストリーム構成回
路3は、供給を受けた量子化データQDを所定のフオー
マットのビットストリームBSに構成して出力する。
【0005】本発明の対象とする従来の音声信号処理回
路1をブロックで示す図4を参照すると、この従来の音
声信号処理回路は、上述のSMR計算部11と、サブバ
ンドフィルタ12とに加えて、この音声信号処理回路1
の動作を制御する制御回路13とを備える。
【0006】SMR計算部11は、1フレーム分の入力
音声サンプルSIのFFT処理を行いパワースペクトル
PSを出力する1024点のFFT回路111と、FF
T回路111の演算のバッファとして用いるバッファメ
モリ112と、パワースペクトルPSとサブバンド信号
SFとからSMRを算出しSMR信号SMを出力する計
算回路113とを備える。
【0007】次に、図4を参照して、従来の音声信号処
理回路の動作について説明すると、まず、FFT回路1
11は、1フレーム分1152サンプルの入力音声サン
プルSIが入力されると、そのうちの1024サンプル
に対して1024点のFFT処理を行い、このFFT処
理結果の512サンプルのパワースペクトルPSを計算
回路113に供給する。バッファメモリ112は、FF
T回路111の演算用バッファとして用いられ、この所
要メモリ容量は1024点FFTであるので実部と虚部
の複素データの1024サンプル分となる。
【0008】サブバンドフィルタ回路12は、1フレー
ム分1152サンプルの入力音声サンプルSIが入力さ
れると、それを32の周波数帯域に分割して1152サ
ンプルのサブバンド信号SFを計算回路113に出力す
る。
【0009】計算回路113は供給を受けた512サン
プルのパワースペクトルPSと1152サンプルのサブ
バンド信号FSとを用いて32の周波数帯域の各々のS
MRを計算しSMR信号SMを生成する。
【0010】この従来の音声信号処理回路1は1024
点FFT処理を行っているため、複素データ1024サ
ンプル分のバッファを必要としていた。すなわちバッフ
ァメモリ112の所要メモリ容量は、複素データの語長
を24ビットとすると、24(ビット)×1024(サ
ンプル)×2(実部と虚部)=49152ビットものバ
ッファを必要とする。
【0011】
【発明が解決しようとする課題】上述した従来の音声信
号処理回路は、1フレーム分1152サンプルの入力音
声データサンプルのうちの1024サンプルを直接10
24点FFT回路でFFT処理を行っているので、複素
データ1024サンプル分のバッファを必要とするた
め、ハードウェア規模が増大しハードウェア実現の阻害
要因となるという欠点があった。
【0012】
【課題を解決するための手段】本発明の音声信号処理回
路は、所定のフオーマットで量子化された第1の数の音
声サンプルから成るフレーム毎に前記音声サンプルを予
め定めた周波数帯域の信号である第2の数のサブバンド
信号に分割しこのサブバンド毎に信号レベルと聴覚限度
以下のレベルであるマスクレベルとの比である信号対マ
スク比(SMR)を算出する音声信号処理回路におい
て、前記音声サンプルを前記第2の数の周波数帯域に分
割しこの第2の数のサブバンド信号を出力するサブバン
ドフィルタ回路と、前記第1の数の音声サンプルを各々
第3の数の音声サンプルから成る第1および第2の音声
サンプル群に分割しこれら第1および第2の音声サンプ
ル群毎に高速フーリェ変換(FFT)処理を施して前記
第3の数の第1および第2のパワースペクトルサンプル
列を出力するFFT回路と、前記サブバンド信号と前記
第1および第2のパワースペクトルサンプル列との各々
の供給を受けて前記第2の数の周波数帯域のそれぞれに
対応するSMRからなる前記第3の数の第1および第2
のSMR列を計算するSMR計算回路と、前記第2の数
の周波数帯域毎に前記第1および第2のSMR列の各々
の第1および第2のSMR同志を相互比較しこれら第1
および第2のSMRのいずれか大きい方の1つを選択し
前記周波数帯域のSMRとして出力する比較回路とを備
えて構成されている。
【0013】
【実施例】次に、本発明の実施例を図4と共通の構成要
素には共通の参照文字/数字を付して同様にブロックで
示す図1を参照すると、この図に示す本実施例の音声信
号処理回路1Aは、従来のSMR計算部11に代り1フ
レーム分の前半,後半2回の512点FFT計算により
SMRを算出してSMR信号SMを出力するSMR計算
部11Aと、上記前半,後半の各々の576サンプル分
の入力音声サンプルSIの供給毎にサブバンドフィルタ
処理を行い対応のサブバンド信号SFA,SFBを出力
するサブバンドフィルタ12Aと、音声信号処理回路1
Aの動作を制御する制御回路13Aとを備える。
【0014】SMR計算部11Aは、1フレーム分の入
力音声サンプルSIの前半,後半の各々の576サンプ
ルのうちのそれぞれ512サンプルに対して512点F
FTFFT処理を行いそれぞれのパワースペクトルPS
A,PSBを出力する512点のFFT回路111A
と、FFT回路111Aの演算のバッファとして用いる
バッファメモリ112Aと、フレームの前半,後半の各
々のパワースペクトルPSF,PSBとサブバンド信号
SFA,SFBとからそれぞれSMRを算出し前半,後
半の各々のSMR信号SMA,SMBを出力する計算回
路113Aと、前半SMR信号SMAを一時格納し読出
時に格納前半SMR信号SMAMを出力する記憶回路1
14と、後半SMR信号SMBと格納前半SMR信号S
MAMとを比較し大きい方をSMR信号SMとして出力
する比較回路115とを備える。
【0015】次に、図1および各信号の動作のタイムチ
ャートを示す図2を参照して本実施例の動作について説
明すると、まず、FFT回路111Aは、1フレーム分
1152サンプルの入力音声サンプルSIの前半の57
6サンプルが入力されると、そのうちの512サンプル
に対して512点FFT処理を行い、このFFT処理結
果の256サンプルの前半パワースペクトルPSAを計
算回路113Aに供給する。次に、引続いて入力される
後半の576サンプルの入力音声サンプルSIのうちの
512サンプルに対して同様に512点FFT処理を行
い、このFFT結果である256サンプルの後半パワー
スペクトルPSBを計算回路113Aに供給する。バッ
ファメモリ112Aは、FFT111Aの演算バッファ
として用いられ、この所要メモリ容量は512点FFT
であるので実部と虚部の複素データの512サンプル分
となる。
【0016】サブバンドフィルタ12Aは、1フレーム
分1152サンプルの入力音声サンプルSIの前半の5
76サンプルが入力されると、それを32の周波数帯域
に分割して576サンプルの前半サブバンド信号SFA
を計算回路113に出力する。引続いて後半の576サ
ンプルが入力されると、同様に32の周波数帯域に分割
して576サンプルの後半サブバンド信号SFBを計算
回路113に出力する。
【0017】計算回路113Aは、まず256サンプル
の前半パワースペクトルPSAと576サンプルの前半
サブバンド信号SFAとを用いて32の周波数帯域の各
々のSMRを計算し前半SMR信号SMAを生成する。
記憶回路114はこの前半SMR信号SMAを格納し、
後半SMR信号SMBが同様に算出されるまで保持す
る。次に、256サンプルの後半パワースペクトルPS
Bと576サンプルの後半サブバンド信号SFBとを用
いて32の周波数帯域の各々のSMRを計算し後半SM
R信号SMBを生成する。次に、SMR比較回路115
は、記憶回路114に記憶されていた格納前半SMR信
号SMAMと後半SMR信号SMBとの供給を受けこれ
ら32の周波数帯域の各々毎に信号SMAM,SMBと
を比較し、大きい方をSMR信号SMとして出力する。
【0018】このようにFFT回路111Aを512点
FFTとすることにより、本実施例のバッファメモリ1
12Aの所要メモリ容量は従来のバッファメモリ112
における複素データ1024サンプル分に対し、半分の
複素データ512サンプル分で済む。また、従来の10
24点FFT処理と比べて、本実施例ではFFT処理を
512点に減らすことによる分解能の低下により算出S
MRの精度低下による音質劣化が考えられるが、1フレ
ームの前半と後半の2つのSMRを算出し、両者のうち
の大きい方を選ぶことによって、聴覚の時間方向のマス
キング効果を利用でき、音質劣化を低く抑えれことがで
きる。ここで、時間方向のマスキング効果とは、大きい
音を聞いた時刻近傍の小さい音が聞こえ難いという効果
である。1フレームの前半と後半では時間間隔が小さく
十分上記時間方向のマスキング効果を利用できるので、
前半,後半の2つのSMRのうち大きいほうを1フレー
ム全体のSMRとして代表させる。
【0019】本発明および従来の各々の音声処理回路に
よる本実施例および従来の各々の符号化信号をそれぞれ
復号して生成した本実施例および従来の復号音声信号
を、それぞれオーディオシステムに入力して試聴する聴
感評価を行った。その結果、一般的な聴感を持つ被験者
3人がいずれも差を判別できないという結果が得られ
た。
【0020】
【発明の効果】以上説明したように、本発明の音声信号
処理回路は、1フレーム分の音声サンプルを各々第3の
数の音声サンプルから成る第1および第2の音声サンプ
ル群毎にFFT処理を施してこの第3の数の第1,第2
のパワースペクトルサンプル列を出力するFFT回路
と、サブバンド信号と前記第1および第2のパワースペ
クトルサンプル列との各々の供給を受けて第1および第
2のSMR列を計算するSMR計算回路と、第1および
第2のSMRのいずれか大きい方の1つをSMRとして
出力する比較回路とを備えているので、バッファメモリ
の所要メモリ容量を低減でき、ハードウェアの回路規模
を削減できるので、コストも低減できるという効果があ
る。
【図面の簡単な説明】
【図1】本発明の音声信号処理回路の一実施例を示すブ
ロック図である。
【図2】音声信号処理回路を含むサブバンド符号化回路
の一例を示すブロック図である。
【図3】本実施例の音声信号処理回路における動作の一
例を示すタイムチャートである。
【図4】従来の音声信号処理回路の一例を示すブロック
図である。
【符号の説明】
1,1A 音声処理回路 2 ビット割当/量子化回路 3 ビットストリーム構成回路 11,11A SMR計算部 12,12A サブバンドフィルタ 13,13A 制御回路 111,111A FFT回路 112,112A バッファメモリ 113,113A 計算回路 114 記憶回路 115 比較回路
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 H04N 7/13

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定のフオーマットで量子化された第1
    の数の音声サンプルから成るフレーム毎に前記音声サン
    プルを予め定めた周波数帯域の信号である第2の数のサ
    ブバンド信号に分割しこのサブバンド毎に信号レベルと
    聴覚限度以下のレベルであるマスクレベルとの比である
    信号対マスク比(SMR)を算出する音声信号処理回路
    において、 前記音声サンプルを前記第2の数の周波数帯域に分割し
    この第2の数のサブバンド信号を出力するサブバンドフ
    ィルタ回路と、 前記第1の数の音声サンプルを各々第3の数の音声サン
    プルから成る第1および第2の音声サンプル群に分割し
    これら第1および第2の音声サンプル群毎に高速フーリ
    ェ変換(FFT)処理を施して前記第3の数の第1およ
    び第2のパワースペクトルサンプル列を出力するFFT
    回路と、 前記サブバンド信号と前記第1および第2のパワースペ
    クトルサンプル列との各々の供給を受けて前記第2の数
    の周波数帯域のそれぞれに対応するSMRからなる前記
    第3の数の第1および第2のSMR列を計算するSMR
    計算回路と、 前記第2の数の周波数帯域毎に前記第1および第2のS
    MR列の各々の第1および第2のSMR同志を相互比較
    しこれら第1および第2のSMRのいずれか大きい方の
    1つを選択し前記周波数帯域のSMRとして出力する比
    較回路とを備えることを特徴とする音声信号処理回路。
  2. 【請求項2】 前記第2のSMR列の算出終了まで前記
    第1のSMR列を記憶する記憶回路を備えることを特徴
    とする請求項1記載の音声信号処理回路。
  3. 【請求項3】 前記第1,第2および第3の各々の数が
    それぞれ1152,32および512であることを特徴
    とする請求項1記載の音声信号処理回路。
JP7133676A 1995-05-31 1995-05-31 音声信号処理回路 Expired - Lifetime JP2776300B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7133676A JP2776300B2 (ja) 1995-05-31 1995-05-31 音声信号処理回路
EP19960108793 EP0746115A3 (en) 1995-05-31 1996-05-31 Audio signal processing circuit for subband coding
US08/656,476 US5832427A (en) 1995-05-31 1996-05-31 Audio signal signal-to-mask ratio processor for subband coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7133676A JP2776300B2 (ja) 1995-05-31 1995-05-31 音声信号処理回路

Publications (2)

Publication Number Publication Date
JPH08328592A JPH08328592A (ja) 1996-12-13
JP2776300B2 true JP2776300B2 (ja) 1998-07-16

Family

ID=15110290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7133676A Expired - Lifetime JP2776300B2 (ja) 1995-05-31 1995-05-31 音声信号処理回路

Country Status (3)

Country Link
US (1) US5832427A (ja)
EP (1) EP0746115A3 (ja)
JP (1) JP2776300B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
EP1076297A1 (en) * 1999-08-09 2001-02-14 Deutsche Thomson-Brandt Gmbh Method for fast Fourier transformation of audio signals
US7003449B1 (en) * 1999-10-30 2006-02-21 Stmicroelectronics Asia Pacific Pte Ltd. Method of encoding an audio signal using a quality value for bit allocation
KR100749308B1 (ko) * 2000-08-22 2007-08-14 닛신 세이코 가부시키가이샤 내광성이 우수한 승화성염료 전사인쇄용 도장금속판 및인쇄도장금속판
EP1199711A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US20120074242A1 (en) * 2010-09-29 2012-03-29 Abraham Jr Robert James Axial rotatable snow making spray head and method for making snow
CN104271453B (zh) * 2012-05-14 2017-08-08 株式会社可乐丽 具有压紧部的吹塑成型容器
CN110780741B (zh) * 2019-10-28 2022-03-01 Oppo广东移动通信有限公司 模型训练方法、应用运行方法、装置、介质及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5625743A (en) * 1994-10-07 1997-04-29 Motorola, Inc. Determining a masking level for a subband in a subband audio encoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
後藤 「音響信号の高能率符号化」 日本音響学会誌 47巻 12号 (1991)、PP.966−969

Also Published As

Publication number Publication date
JPH08328592A (ja) 1996-12-13
US5832427A (en) 1998-11-03
EP0746115A3 (en) 2000-11-15
EP0746115A2 (en) 1996-12-04

Similar Documents

Publication Publication Date Title
JP3343962B2 (ja) 高能率符号化方法及び装置
JP3104400B2 (ja) オーディオ信号符号化装置及び方法
US7848931B2 (en) Audio encoder
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JP4000261B2 (ja) ステレオ音響信号の処理方法と装置
JPH0591061A (ja) オーデイオ信号処理方法
JP2005523480A (ja) 空間的オーディオのパラメータ表示
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
JP2776300B2 (ja) 音声信号処理回路
US20040181395A1 (en) Scalable stereo audio coding/decoding method and apparatus
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
US20020173969A1 (en) Method for decompressing a compressed audio signal
JP3227942B2 (ja) 高能率符号化装置
US7099823B2 (en) Coded voice signal format converting apparatus
JP3277705B2 (ja) 情報符号化装置及び方法、並びに情報復号化装置及び方法
JPH08166799A (ja) 高能率符号化方法及び装置
JP3088580B2 (ja) 変換符号化装置のブロックサイズ決定法
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US6161088A (en) Method and system for encoding a digital audio signal
JP3082625B2 (ja) 音声信号処理回路
JP2906483B2 (ja) ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3594829B2 (ja) Mpegオーディオの復号化方法
JP3146121B2 (ja) 符号化復号化装置
JPH06324093A (ja) オーディオ信号のスペクトル表示装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980331