JPH0627997A - 音声符号化/復号化装置 - Google Patents

音声符号化/復号化装置

Info

Publication number
JPH0627997A
JPH0627997A JP4180641A JP18064192A JPH0627997A JP H0627997 A JPH0627997 A JP H0627997A JP 4180641 A JP4180641 A JP 4180641A JP 18064192 A JP18064192 A JP 18064192A JP H0627997 A JPH0627997 A JP H0627997A
Authority
JP
Japan
Prior art keywords
data
signal
quantized
quantizing
expansion rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4180641A
Other languages
English (en)
Inventor
Masami Aizawa
雅己 相沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4180641A priority Critical patent/JPH0627997A/ja
Publication of JPH0627997A publication Critical patent/JPH0627997A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、微弱な音声信号を聴覚心理学モデ
ルに基づいて高効率音声符号化する際の情報の欠落を未
然に防止することのできる音声符号化/復号化装置を提
供することを目的とする。 【構成】 本発明の音声符号化/復号化装置は、入力さ
れる音声信号を量子化及び符号化してPCM信号を得る
音声符号化装置において、前記量子化信号の振幅値を所
定長毎に設定される伸長率で伸長する伸長手段と、この
伸長手段で伸長して得られた伸長データを周波数データ
に変換する変換手段と、この変換手段で得られた周波数
データの量子化レベルを聴覚心理学モデルにより算出す
る量子化レベル算出手段と、この量子化レベル算出手段
によって算出された量子化レベルにより周波数データ毎
に量子化を行う量子化手段と、この量子化手段で量子化
された量子化データと前記伸長率に係るデータとを1デ
ータ単位化する単位化手段ととを備えて構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、聴覚心理学モデルを応
用した音声符号化/復号化装置に関し、特に音声出力の
大小に拘らず音声の再生を正確に行い得る音声符号化/
復号化装置に関するものである。
【0002】
【従来の技術】近年、音声を符号化して伝送する際に、
伝送量を少くするためにデータ圧縮が行われる。このデ
ータ圧縮による伝送方法に、弱小音の周波数成分は大き
い音の周波数成分に隠れてしまい聴覚上認識されないと
いう聴覚心理学モデルを応用して、周波数分析した音声
の内、弱小音の周波数成分を伝送しないようにしたもの
がある。
【0003】以下、データ圧縮にこの聴覚心理学モデル
を応用した従来の音声符号化/復号化装置について図8
及び図9のブロック図を参照して説明する。
【0004】図8は従来の音声符号化装置における、標
本化及び量子化して得られた16ビットPCM(Pul
se Code Modulation;パルス符号変
調方式)音声信号110を、聴覚心理学モデルを応用し
てデータ圧縮する処理部分を示すものである。
【0005】まず、入力される音声信号110をブロッ
ク化処理部101で512サンプル毎のブロックに分割
し、このブロック化したデータ111をスペクトル分析
器103及び量子化レベル算出器105に入力する。ス
ペクトル分析器103は、この入力されたデータ111
を周波数データ117に分解し、量子化器107に出力
する。
【0006】また、量子化レベル算出器105では、聴
覚心理学モデル(参考文献:「聴覚と音響心理」日本音
響学会編、コロナ社)に基づき、人が聴くことのできる
最小の音圧である最小可聴限及び聴感上、他の音により
かき消されてしまう音圧であるマスキングスレショルド
以下の信号を削除する量子化レベルをスペクトル毎に決
定し、量子化器107に送る。
【0007】量子化器107は量子化レベル算出器10
5からのスペクトル毎の量子化レベルに基づき、スペク
トル分析器103からの周波数データ117を量子化
し、マルチプレクサ109に送る。
【0008】マルチプレクサ109は量子化された周波
数データを、1486ビットのフレーム内の所定のフォ
ーマットで時分割多重し、ビットストリーム119を伝
送する。
【0009】次に、図9を参照して従来の音声復号化装
置について説明する。図9において、時分割多重された
ビットストリーム131がデ・マルチプレクサ121に
入力される。デ・マルチプレクサ121では、この入力
された時分割多重化ビットストリーム131より周波数
データ133をパラレルデータとして合成器123に送
る。合成器123では分解された周波数データ133を
合成し、時間波形を16ビットPCM出力信号139と
して出力する。
【0010】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声符号化装置にあっては、入力される16ビ
ットPCM音声信号をブロック化した後、周波数データ
117に分解し、スペクトル毎に聴覚心理学モデルに基
づく量子化レベルで単純に量子化していることから、最
小可聴限及びマスキングスレショルド以下の信号の削除
により、本来、聞こえるはずの音が聞こえないことがあ
る。
【0011】例えば、図3に示す様に微少な信号の聴覚
心理学モデルに基づく量子化について想定すると、その
スペクトルをスペクトルSA として、また最小可聴限を
周波数可聴限度ラインHP として図5のように示すこと
ができる。また、音声符号化において最小可聴限HP
下の信号を削減するため、伝送される音声は領域Aで示
される部分となる。したがって、伝送された信号を復号
化したときには、前記領域Aに係る部分のみが復号化さ
れることになる。この様な状態で出力側のボリュームを
上げると、領域Aの音圧を単に上げただけであることか
ら、図7に示すように、領域Cの部分が再生により聞こ
えてくることになる。
【0012】すなわち、聴覚心理学モデルによる高効率
音声符号化を行わない音は、本来なら図6に示すように
スペクトルSB となるはずである。しかしながら、実際
には図7に示すスペクトルSC のように領域Da 及び領
域Db が削除された領域Cの部分となることから、必要
な情報が削られてしまい、最小可聴限より上にある聞こ
えるはずの音が聞こえないことになる。
【0013】本発明は、上記課題に鑑みてなされたもの
で、微弱な音声信号を聴覚心理学モデルに基づいて高効
率音声符号化する際の情報の欠落を未然に防止すること
のできる音声符号化/復号化装置を提供することを目的
とする。
【0014】
【課題を解決するための手段】上記目的を達成するため
本願第1の発明は、入力される音声信号を量子化及び符
号化してPCM信号を得る音声符号化装置において、前
記量子化信号の振幅値を所定長毎に設定される伸長率で
伸長する伸長手段と、この伸長手段で伸長して得られた
伸長データを周波数データに変換する変換手段と、この
変換手段で得られた周波数データの量子化レベルを聴覚
心理学モデルにより算出する量子化レベル算出手段と、
この量子化レベル算出手段によって算出された量子化レ
ベルにより周波数データ毎に量子化を行う量子化手段
と、この量子化手段で量子化された量子化データと前記
伸長率に係るデータとを1データ単位化する単位化手段
とを有することを要旨とする。
【0015】また、本願第2の発明は、入力されるPC
M信号を復号化して音声信号を得る音声復号化装置にお
いて、1データ単位毎に量子化データと前記伸長率に係
るデータとを分離する分離手段と、この分離手段で分離
された量子化データの周波数データを逆変換する逆変換
手段と、この逆変換手段で逆変換された信号の振幅値を
前記分離手段で分離された伸長率に基づいて復長する復
長手段とを有することを要旨とする。
【0016】
【作用】本願第1の発明の音声符号化装置は、まず伸長
手段によって量子化信号の振幅値を所定長毎に設定され
る伸長率で伸長して微弱な音声信号を予め補正してお
く。この伸長データを周波数データに変換し、さらに聴
覚心理学モデルにより算出した量子化レベルに従って周
波数データ毎に量子化を行う。従って、微弱な音声信号
時に最小可聴限より下側となる音声信号に係る情報の欠
落が防止される。また、このときの伸長率は、量子化デ
ータと1データ単位化され伝送される。
【0017】本願第2の発明の音声復号化装置は、まず
分離手段において1データ単位毎に量子化データと前記
伸長率に係るデータとを分離する。次に、この分離され
た量子化データの周波数データを逆変換手段で逆変換し
て得られた信号の振幅値を対応する伸長率に基づいて復
長することにより、情報の欠落の無い微弱な音声信号を
含む音声信号を得ることができる。
【0018】
【実施例】次に本発明の一実施例について図面を参照し
ながら説明する。図1は音声符号化装置における、標本
化及び量子化して得られた16ビットPCM音声信号1
1を、聴覚心理学モデルを応用してデータ圧縮する処理
部分を示すブロック図である。
【0019】まず、図1を参照して本実施例の音声符号
化装置の構成を説明する。音声信号11が入力される振
幅伸長器1と、この振幅伸長器1の後段に並列に接続さ
れるスペクトル分析器3及び量子化レベル算出器5と、
さらにこの振幅伸長器1と信号線を介して接続されるマ
ルチプレクサ9と、このマルチプレクサ9と前記スペク
トル分析器3との間に接続される量子化器7によって構
成される。
【0020】また、前記振幅伸長器1とマルチプレクサ
9との間の信号線を介して、当該振幅伸長器1における
伸長率に係るデータ、すなわち伸長率データ13がマル
チプレクサ9に出力される。マルチプレクサ9において
は、この伸長率データ13を量子化データと共にパケッ
ト化して伝送する。さらに、スペクトル分析器3に接続
される量子化器7において、量子化レベル算出器5で算
出された量子化レベルに従って周波数データ17が量子
化される。
【0021】次に、図1を参照して本実施例の動作を説
明する。まず、標本化及び量子化して得られた音声信号
11が振幅伸長器1に入力される。この振幅伸長器1に
おいては、この入力された音声信号11を512サンプ
ル毎にブロック化し、このブロック化で得られた個々の
ブロック毎に図3に示すブロック中の振幅値の最大値v
が図4に示す入力レンジ最大値Vと等しくなるように個
々のブロック毎に設定される伸長率で振幅値の伸長が行
なわれる。
【0022】この振幅伸長器1で伸長された伸長データ
15は、スペクトル分析器3及び量子化レベル算出器5
にそれぞれ送られると共に、伸長データ15の伸長率に
係る伸長率データ13は各ブロック毎に6ビットに符号
化されマルチプレクサ9に送られる。
【0023】スペクトル分析器3に送られた伸長データ
15は、スペクトル分析器3において周波数データ17
に分解され量子化器7に送られる。一方、量子化レベル
算出器5においては、振幅伸長器1から送られた伸長デ
ータ15に基づき、聴覚心理学モデルによる最小可聴限
及びマスキングスレショルド以下の信号を削除するため
の量子化レベルがスペクトル毎に決定され、量子化器7
に送られる。
【0024】量子化器7は量子化レベル算出器5からの
スペクトル毎の量子化レベルにもとずき、スペクトル分
析器3からの周波数データ17を量子化し、マルチプレ
クサ9に送る。マルチプレクサ9は振幅伸長器1からの
伸長量を示す6ビットデータ13と量子化された周波数
データとを、1486ビットのフレーム内の所定のフォ
ーマットで時分割多重をおこないパケット化し、ビット
ストリーム19を伝送する。
【0025】次に、図2を参照して、音声復号化装置の
構成について説明する。図2に示す音声復号化装置は、
時分割多重されたビットストリーム31が入力されるデ
・マルチプレクサ21と、このデ・マルチプレクサ21
に接続される、周波数データに分解されたデータ33を
合成する合成器23と、さらにこの合成器23の後段に
接続される振幅復長器25によって構成される。
【0026】この音声復号化装置の動作を図2を参照し
て説明する。図2においてビットストリーム31の時分
割多重されたデータはデ・マルチプレクサ21により周
波数データ33を合成器23に、伸長量35は振幅復長
器25に送られる。
【0027】合成器23では分解された周波数データ3
3を合成し、時間波形の出力37を振幅復長器25に出
力する。
【0028】振幅復長器25では合成器23から送られ
た時間波形37がデ・マルチプレクサ21からの伸長量
のデータ35により、もとの振幅に復長されて16ビッ
トPCM出力39として出力される。
【0029】次に、本実施例の作用を図5乃至図7を参
照して説明する。ここで、図3に示す微少な信号のスペ
クトルが図5に示すスペクトルSA で表されるものとす
る。まず、振幅伸長器1により図3に示す微小な信号は
図4の様に振幅伸長される。この伸長された伸長信号の
スペクトルは図6に示すスペクトルSB となる。すなわ
ち、従来の様に伸長を行わずに(図5のスペクトルSA
のままで)で聴覚心理学モデルを適用し、最小可聴限H
P 以下の情報を削減した場合と比較すると、出力側のボ
リュームを上げた場合、聞こえてくる音のスペクトルは
本実施例の場合図6に示すスペクトルSB であり、従来
の場合、領域Da 及び領域Db が欠落したスペクトルS
C (図7)となる。これにより、本実施例の場合には、
領域Da及び領域Db の部分の情報に基づく音声を再生
することが可能となり、より原音に近い音声として再生
することが可能となる。
【0030】上述してきたように、本実施例において
は、聴覚心理学モデルを適用した高効率音声符号化を行
う前に振幅伸長を行うようにしたので、符号化の際の微
少な音響信号における情報の削除を防止することができ
る。
【0031】これにより本来聞こえないはずの微少な音
響信号の周波数成分を、1486ビットに該1486ビ
ットの約0.4%に相当する6ビットを追加するだけ
で、保存することができ、本来聞こえないはずの音響信
号の周波数成分を、ボリュームを操作して音量を大きく
したときに、より原音に近い音響として再生することが
可能となる。
【0032】
【発明の効果】以上説明したように本発明の音声符号化
/復号化装置は、量子化信号の振幅値を所定長毎に設定
される伸長率で伸長した後に、聴覚心理学モデルによる
量子化レベルにより量子化を行うようにしたので、微弱
な音声信号における聴覚心理学モデルに基づく高効率音
声符号化の際の情報の欠落を未然に防止することがで
き、大音量で微弱な音声信号を再生した際の自然な音域
による再生に効果を奏するものである。
【図面の簡単な説明】
【図1】本発明に係る一実施例の概略の構成を示すブロ
ック図である。
【図2】時間軸上の振幅伸長を説明するための図であ
る。
【図3】図1に示す実施例の作用を説明する為の図であ
る。
【図4】従来の音声符号化/復号化装置の構成を示すブ
ロック図である。
【図5】本発明に係る一実施例の概略の構成を示すブロ
ック図である。
【図6】時間軸上の振幅伸長を説明するための図であ
る。
【図7】図1に示す実施例の作用を説明する為の図であ
る。
【図8】従来の音声符号化/復号化装置の構成を示すブ
ロック図である。
【図9】従来の音声符号化/復号化装置の構成を示すブ
ロック図である。
【符号の説明】
1 振幅伸長器 3 スペクトル分析器 5 量子化レベル算出器 7 量子化器 9 マルチプレクサ 11 PCM音声信号 13 伸長率データ 15 伸長データ 17 周波数データ 19 ビットストリーム 21 デ・マルチプレクサ 23 合成器 25 振幅復長器 31 ビットストリーム 33 周波数データ 35 伸長率データ 37 出力 HP 周波数可聴限度ライン

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力される音声信号を量子化及び符号化
    してPCM信号を得る音声符号化装置において、 前記量子化信号の振幅値を所定長毎に設定される伸長率
    で伸長する伸長手段と、 この伸長手段で伸長して得られた伸長データを周波数デ
    ータに変換する変換手段と、 この変換手段で得られた周波数データの量子化レベルを
    聴覚心理学モデルにより算出する量子化レベル算出手段
    と、 この量子化レベル算出手段によって算出された量子化レ
    ベルにより周波数データ毎に量子化を行う量子化手段
    と、 この量子化手段で量子化された量子化データと前記伸長
    率に係るデータとを1データ単位化する単位化手段とを
    有することを特徴とする音声符号化装置。
  2. 【請求項2】 入力されるPCM信号を復号化して音声
    信号を得る音声復号化装置において、 1データ単位毎に量子化データと前記伸長率に係るデー
    タとを分離する分離手段と、 この分離手段で分離された量子化データの周波数データ
    を逆変換する逆変換手段と、 この逆変換手段で逆変換された信号の振幅値を前記分離
    手段で分離された伸長率に基づいて復長する復長手段と
    を有することを特徴とする音声復号化装置。
JP4180641A 1992-07-08 1992-07-08 音声符号化/復号化装置 Pending JPH0627997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4180641A JPH0627997A (ja) 1992-07-08 1992-07-08 音声符号化/復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4180641A JPH0627997A (ja) 1992-07-08 1992-07-08 音声符号化/復号化装置

Publications (1)

Publication Number Publication Date
JPH0627997A true JPH0627997A (ja) 1994-02-04

Family

ID=16086749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4180641A Pending JPH0627997A (ja) 1992-07-08 1992-07-08 音声符号化/復号化装置

Country Status (1)

Country Link
JP (1) JPH0627997A (ja)

Similar Documents

Publication Publication Date Title
JP3352406B2 (ja) オーディオ信号の符号化及び復号方法及び装置
EP0737350B1 (en) System and method for performing voice compression
JP3343962B2 (ja) 高能率符号化方法及び装置
WO1994028633A1 (fr) Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
JP2007017908A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP3601473B2 (ja) ディジタルオーディオ圧縮回路および伸長回路
JP2971796B2 (ja) 低ビット速度のオーディオエンコーダおよびデコーダ
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
RU2214047C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
WO2001065542A1 (fr) Dispositif de codage/decodage de la voix et procede associe
JP2003228399A (ja) 符号化装置、復号化装置および音響データ配信システム
JPH0627997A (ja) 音声符号化/復号化装置
JP3230365B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
JPH10116098A (ja) オーディオ信号を符号化又は復号化する方法及び回路配置
JP2002215192A (ja) オーディオ情報処理装置及び処理方法
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP2001094432A (ja) サブバンド符号化・復号方法
JPH10228289A (ja) 音声圧縮伸長装置およびその方法
KR960003626B1 (ko) 변환 부호화된 오디오 신호의 난청자용 복호화 방법
JP3152114B2 (ja) オーディオ信号の符号化装置及び復号化装置
WO2002005433A1 (en) A method, a device and a system for compressing a musical and voice signal
JP3099569B2 (ja) 音響信号の伝送方法
JPH0232397A (ja) 音声信号処理装置
KR20020029244A (ko) 엠피 쓰리 인코더/디코더