JPH07295593A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH07295593A
JPH07295593A JP6082131A JP8213194A JPH07295593A JP H07295593 A JPH07295593 A JP H07295593A JP 6082131 A JP6082131 A JP 6082131A JP 8213194 A JP8213194 A JP 8213194A JP H07295593 A JPH07295593 A JP H07295593A
Authority
JP
Japan
Prior art keywords
voiced
unvoiced
parameter
spectrum envelope
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6082131A
Other languages
English (en)
Inventor
Tadashi Yonezaki
正 米崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6082131A priority Critical patent/JPH07295593A/ja
Publication of JPH07295593A publication Critical patent/JPH07295593A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 入力音声に近い周波数特性の音声が合成で
き、量子化効率を向上できる音声符号化装置を提供する
ことを目的とする。 【構成】 符号化部Aでは、ピッチ推定器2が入力音声
の基本周波数に対応させた基本周波数パラメータを符号
化する。有声・無声判定器4が、周波数帯域分割器3に
より分割された高調波帯域毎の有声帯域か無声帯域かの
判定結果に対応させた有声・無声判定パラメータを符号
化する。パラメータ量子化器6が、スペクトル包絡算出
器5により算出されたスペクトル包絡線に対応させたス
ペクトル包絡線パラメータを量子化する。これらの符号
を多重化器7が多重化して復号部Bに伝送する。復号部
Bでは、分離器11が、符号化部Aから伝送された多重
化信号を各パラメータ毎の符号に分離し、ピッチ復号器
12が基本周波数を、有声・無声判定復号器13が有声
・無声判定を、スペクトル包絡復号器14がスペクトル
包絡線を算出する。スペクトル振幅推定器15がスペク
トル包絡線に対応する高調波の振幅値を求める。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル電話やディ
ジタル録音器に使用する音声符号化装置に関するもので
ある。
【0002】
【従来の技術】近年、データを伝送または蓄積する媒体
が有限であることから、高音声品質かつ高圧縮率を実現
する音声符号化装置が望まれている。
【0003】以下、従来の音声符号化装置について説明
する。図2は従来の音声符号化装置のブロック図を示す
ものであり、入力された音声を符号化する符号化部が符
号化側として構成され、符号化によって発生した符号を
音声に復号する復号部が復号側として構成されている。
【0004】まず、符号化部の構成を図2(a)を用い
て説明する。図2(a)において、41は音声を入力す
る音声入力装置である。42はピッチ推定器で、入力音
声の基本周波数を推定する。この基本周波数を基に、4
3の周波数帯域分割器で周波数帯域を高調波帯域毎に分
割する。44の有声・無声判定器では、分割された高調
波帯域毎に、その帯域が有声帯域であるか無声帯域であ
るかを判定する。一方、45の直交変換器で、入力され
た音声をフーリエ変換しパワースペクトルを算出する。
46のスペクトル振幅推定器で、パワースペクトルから
各帯域の高調波振幅値を求め、47のスペクトル振幅量
子化器で、その振幅値を量子化する。このようにして得
られた符号を48の多重化器により多重化する。
【0005】次に、復号部の構成を図2(b)を用いて
説明する。図2(b)において、51は符号化側から送
られてきた符号をパラメータ単位に分割する分離器であ
る。52はピッチ復号器、53は有声・無声判定復号器
で、それぞれ、合成のための基本周波数、有声・無声判
定を復号する。54のスペクトル振幅復号器で、高調波
振幅を復号し、55の有声音発生器と56の無声音発生
器で、それぞれ、有声帯域と無声帯域の音声を生成す
る。57は音声合成器で、得られた有声音と無声音を加
算し合成音声とする。
【0006】以上のように構成され音声符号化装置につ
いて、以下その動作について説明する。まず、音声入力
装置41で入力された音声は、ピッチ推定器42によっ
て基本周波数が抽出される。ここで得られた基本周波数
を基に、周波数帯域分割器43によって、周波数軸が基
本周波数の高調波帯域単位のブロックに分割される。以
後、この高調波帯域毎に処理される。まず、有声・無声
判定器44によって、各高調波帯域は有声帯域または無
声帯域と判定される。一方、直交変換器45で、入力音
声はフーリエ変換され、パワースペクトルが算出され
る。このパワースペクトルから、有声・無声判定結果を
考慮した高調波振幅値がスペクトル振幅推定器46によ
って求められる。更に、求められた振幅値はスペクトル
振幅量子化器で量子化される。以上の処理によって得ら
れた符号は多重化器48によって多重化され復号側に伝
送される。以上が符号化側の動作である。
【0007】つぎに、復号側では、分離器51で、伝送
された符号をパラメータ毎の符号に分離し、それぞれ、
ピッチ復号器52により基本周波数が複合され、有声・
無声判定復号器53により有声・無声判定が複合され、
スペクトル振幅復号器54により高調波振幅値が復号さ
れる。次に、有声音発生器55では、高調波周波数に基
づき、高調波振幅値を最大振幅とする余弦波によって有
声音声を合成し、無声音発生器56では、周波数軸上で
白色雑音を無声音の周波数特性を持たせた雑音に加工
し、それを逆フーリエ変換することによって無声音声を
合成する。このようにして得られた有声音声と無声音声
を音声合成器57によって、時間軸上での加算によって
合成する。
【0008】
【発明が解決しようとする課題】しかしながら上記のよ
うな従来の音声符号化装置では、高調波帯域毎に独立さ
せて高調波の振幅値を求め、この値を量子化していたの
で、振幅を求める際に、高調波間の振幅のバランスを考
慮しておらず、入力された音声に対して合成音声の周波
数特性が若干異なるという問題を有していた。
【0009】また、全周波数帯域に対する分割数は、入
力された音声の基本周波数によって決定される。従っ
て、基本周波数によって高調波の分割帯域数が変化する
ので、高調波帯域毎のスペクトル振幅値を量子化する場
合の量子化効率が低下するという問題を有していた。
【0010】本発明は、上記従来の問題を解決するもの
で、入力された音声に対して近い周波数特性を持つ音声
が合成でき、また、入力音声の基本周波数によって決定
される高調波の分割帯域数によって影響されずに量子化
することができ、この場合の量子化効率を向上させるこ
とができる音声符号化装置を提供することを目的とす
る。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに本発明の音声符号化装置は、入力された音声を符号
化する符号化部と、前記符号化によって発生した符号
を、前記音声に復号する復号部とで構成された音声符号
化装置において、前記符号化部に、前記音声を入力する
音声入力装置と、入力された音声の基本周波数を推定
し、この基本周波数に対応させて決定した基本周波数パ
ラメータを符号化するピッチ推定器と、推定された前記
基本周波数に従って、周波数帯域を分割する周波数帯域
分割器と、分割された帯域毎に、各帯域が有声帯域か無
声帯域かを判定し、この有声・無声判定の結果に対応さ
せて決定した有声・無声判定パラメータを符号化する有
声・無声判定器と、入力された前記音声からスペクトル
包絡線を求めるスペクトル包絡算出器と、このスペクト
ル包絡線を表すスペクトル包絡線パラメータを量子化し
て符号化するパラメータ量子化器と、前記各符号化によ
って、各パラメータに対応して得られた符号を多重化す
る多重化器とを備え、前記復号部に、前記符号化部から
伝送された多重化信号を各パラメータ単位の前記符号に
分離する分離器と、分離された前記符号に対応させて復
号した前記基本周波数パラメータから、前記基本周波数
を出力するピッチ復号器と、分離された前記符号に対応
させて復号した前記有声・無声判定パラメータから、前
記有声・無声判定の結果を出力する有声・無声判定復号
器と、分離された前記符号に対応させて復号した前記ス
ペクトル包絡線パラメータから、前記スペクトル包絡線
を算出するスペクトル包絡復号器と、前記スペクトル包
絡線に基づいて、各帯域の前記有声・無声判定に従って
前記基本周波数の高調波のスペクトル振幅値を求めるス
ペクトル振幅推定器と、得られた前記スペクトル振幅値
の余弦波である有声音を発生する有声音発生器と、得ら
れた前記スペクトル振幅値の特性を持つ雑音である無声
音を発生する無声音発生器と、前記有声音と無声音を合
成する音声合成器とを備えた構成とする。
【0012】
【作用】この構成によると、高調波の振幅値はスペクト
ル包絡線から求められるので、高調波帯域毎の高調波振
幅推定誤差のばらつきを減少させることができる。また
同時に、スペクトル包絡線を表すスペクトル包絡線パラ
メータは一定次元で求めることができる。
【0013】
【実施例】以下、本発明の一実施例の音声符号化装置に
ついて、図面を参照しながら説明する。
【0014】図1は本実施例の音声符号化装置のブロッ
ク図を示すものであり、図1(a)に示すように、入力
された音声を符号化する符号化部Aと、図1(b)に示
すように、符号化によって発生した符号を音声に復号す
る復号部Bとで構成されている。
【0015】まず、符号化部Aの構成を図1(a)を用
いて説明する。図1(a)において、1は音声を入力す
る音声入力装置である。2はピッチ推定器で、入力音声
の基本周波数を推定する。この基本周波数を基に、3の
周波数帯域分割器で周数帯域を高調波帯域毎に分割し、
4の有声・無声判定器で、分割した高調波帯域毎に、そ
の帯域が有声帯域であるか無声帯域であるかを判定す
る。5のスペクトル包絡算出では、入力音声のスペクト
ル包絡線を求め、このスペクトル包絡線を決定するスペ
クトル包絡線パラメータを6のパラメータ量子化器によ
って求める。このようにして得られた符号を7の多重化
器により多重化する。
【0016】次に、復号部Bの構成を図1(b)を用い
て説明する。図1(b)において、11は符号化部Aか
ら送られてきた多重化信号を各パラメータ単位の符号に
分離する分離器である。12はピッチ復号器、13は有
声・無声判定復号器で、それぞれ、合成のための基本周
波数、有声・無声判定を復号する。14のスペクトル包
絡復号器で、入力音声のスペクトル包絡線を表すスペク
トル包絡線パラメータを復号し、スペクトル包絡線を算
出する。15のスペクトル振幅推定器で、与えられたス
ペクトル包絡線を得るような高調波周波数の線スペクト
ルの振幅値を求める。この振幅値を基に16の有声音発
生器と17の無声音発生器で、それぞれ、有声帯域と無
声帯域の音声を生成する。18は音声合成器で、得られ
た有声音と無声音を加算し合成音声とする。
【0017】以上のように構成された音声符号化装置に
ついて、その動作を説明する。まず、音声入力装置1で
入力された音声は、ピッチ推定器2によって、基本周波
数が抽出され、この基本周波数に対応させて決定された
基本周波数パラメータが符号化される。また、ここで得
られた基本周波数を基に、周波数帯域分割器3によっ
て、周波数帯域が基本周波数の高調波帯域単位に分割さ
れる。更に、有声・無声判定器4によって、各高調波帯
域が有声帯域か無声帯域かが判定され、この有声・無声
判定の結果に対応させて決定された有声・無声判定パラ
メータが符号化される。
【0018】一方、スペクトル包絡算出器5では、入力
音声のスペクトル包絡線を求める。このスペクトル包絡
線を決定するスペクトル包絡線パラメータは一定次元で
あり、このスペクトル包絡線パラメータをパラメータ量
子化器6で量子化する。
【0019】以上の処理によって得られた各符号は多重
化器7により多重化され、この多重化信号は復号部Bに
対して伝送される。以上が符号化部Aの動作である。次
に、復号部Bでは、分離器11で、伝送された多重化信
号を各パラメータ毎の符号に分離し、それぞれ、ピッチ
復号器12により基本周波数が、有声・無声判定復号器
13により有声・無声判定が、スペクトル包絡復号器1
4によりスペクトル包絡線を決定するスペクトル包絡線
パラメータが復号され、このスペクトル包絡線が算出さ
れる。これら諸パラメータにより、合成音声のスペクト
ル包絡線が入力音声のスペクトル包絡線に等しくなるよ
うな高調波の振幅値をスペクトル振幅推定器15によっ
て求める。以上が復号部Bの動作である。
【0020】また通常は、入力音声をSin(n)(ここ
で、nは自然数とする)、合成音声をSout (n)とし
たとき、基本周波数の高調波周波数の余弦波を重ね合わ
せることで音声を合成していることを考慮し、高調波の
スペクトル振幅値をam (ここで、mは高調波の次数を
表す自然数とする)とし、高調波の周波数をωm とし、
高調波の位相をφm とすると、 Sout (n)=Σ[am ・cos(n・ωm +φm )] と表すことができる。
【0021】従って、入力音声からスペクトル包絡線を
求める関数をFとしてスペクトル包絡算出器5に持ち、
その逆関数、つまり、与えられたスペクトル包絡線を得
るような高調波周波数の線スペクトルの振幅値をF-1
してスペクトル振幅推定器15に持つものとすると、 Sout (n)=F-1{F[Sin(n)]} となり、Sout (n)=Sin(n)が成立し、スペクト
ル振幅推定器15のF-1によって、スペクトル振幅am
を推定することができる。ただし、無声帯域の振幅は算
出された線スペクトルのパワーを、帯域内で平均化した
値とする。
【0022】次に、有声音発生器16では、高調波周波
数に基づき、高調波振幅値を最大振幅とする余弦波によ
って有声音声を合成し、無声音発生器17では、白色雑
音を加工し、無声音部の周波数特性を持たせた雑音によ
って無声音声を合成する。このようにして得られた有声
音と無声音を音声合成器18によって、時間軸上での加
算によって合成する。
【0023】以上の動作により、スペクトル包絡線が入
力音声(Sin(n))と等しい高調波の振幅値を得るこ
とができ、入力音声と等しい周波数特性をもつ音声を合
成することができる。また同時に、入力音声のスペクト
ル包絡線を決定するスペクトル包絡線パラメータを一定
次元で表現することができ、このスペクトル包絡線パラ
メータを量子化する場合に、高調波の帯域数の変動の影
響を受けることなく効率のよい量子化が実現できる。
【0024】
【発明の効果】以上のように本発明によれば、高調波の
振幅値は、高調波間の振幅のバランスを考慮できるスペ
クトル包絡線から求められるので、高調波帯域毎の高調
波振幅推定誤差のばらつきを減少させることができる。
また同時に、スペクトル包絡線を表すスペクトル包絡線
パラメータは一定次元で求めることができる。
【0025】そのため、入力された音声に対して近い周
波数特性を持つ音声が合成でき、また、入力音声の基本
周波数によって決定される高調波の分割帯域数によって
影響されずに量子化することができ、この場合の量子化
効率を向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声符号化装置のブロック
【図2】従来の音声符号化装置のブロック図
【符号の説明】
1 音声入力装置 2 ピッチ推定器 3 周波数帯域分割器 4 有声・無声判定器 5 スペクトル包絡算出器 6 パラメータ量子化器 7 多重化器 11 分離器 12 ピッチ復号器 13 有声・無声判定復号器 14 スペクトル包絡復号器 15 スペクトル振幅推定器 16 有声音発生器 17 無声音発生器 18 音声合成器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を符号化する符号化部
    と、前記符号化によって発生した符号を、前記音声に復
    号する復号部とで構成された音声符号化装置において、
    前記符号化部に、前記音声を入力する音声入力装置と、
    入力された音声の基本周波数を推定し、この基本周波数
    に対応させて決定した基本周波数パラメータを符号化す
    るピッチ推定器と、推定された前記基本周波数に従っ
    て、周波数帯域を分割する周波数帯域分割器と、分割さ
    れた帯域毎に、各帯域が有声帯域か無声帯域かを判定
    し、この有声・無声判定の結果に対応させて決定した有
    声・無声判定パラメータを符号化する有声・無声判定器
    と、入力された前記音声からスペクトル包絡線を求める
    スペクトル包絡算出器と、このスペクトル包絡線を表す
    スペクトル包絡線パラメータを量子化して符号化するパ
    ラメータ量子化器と、前記各符号化によって、各パラメ
    ータに対応して得られた符号を多重化する多重化器とを
    備え、前記復号部に、前記符号化部から伝送された多重
    化信号を各パラメータ単位の前記符号に分離する分離器
    と、分離された前記符号に対応させて復号した前記基本
    周波数パラメータから、前記基本周波数を出力するピッ
    チ復号器と、分離された前記符号に対応させて復号した
    前記有声・無声判定パラメータから、前記有声・無声判
    定の結果を出力する有声・無声判定復号器と、分離され
    た前記符号に対応させて復号した前記スペクトル包絡線
    パラメータから、前記スペクトル包絡線を算出するスペ
    クトル包絡復号器と、前記スペクトル包絡線に基づい
    て、各帯域の前記有声・無声判定に従って前記基本周波
    数の高調波のスペクトル振幅値を求めるスペクトル振幅
    推定器と、得られた前記スペクトル振幅値の余弦波であ
    る有声音を発生する有声音発生器と、得られた前記スペ
    クトル振幅値の特性を持つ雑音である無声音を発生する
    無声音発生器と、前記有声音と無声音を合成する音声合
    成器とを備えた音声符号化装置。
JP6082131A 1994-04-21 1994-04-21 音声符号化装置 Pending JPH07295593A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6082131A JPH07295593A (ja) 1994-04-21 1994-04-21 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6082131A JPH07295593A (ja) 1994-04-21 1994-04-21 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH07295593A true JPH07295593A (ja) 1995-11-10

Family

ID=13765865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6082131A Pending JPH07295593A (ja) 1994-04-21 1994-04-21 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH07295593A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001249698A (ja) * 2000-03-06 2001-09-14 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ取得方法、音声復号方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001249698A (ja) * 2000-03-06 2001-09-14 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ取得方法、音声復号方法及び装置

Similar Documents

Publication Publication Date Title
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100602975B1 (ko) 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
KR101376100B1 (ko) 대역폭 확장 복호화 방법 및 장치
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
JP5063363B2 (ja) 音声合成方法
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
EP1222659A1 (en) Lpc-harmonic vocoder with superframe structure
US5664051A (en) Method and apparatus for phase synthesis for speech processing
WO2006001218A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2003096325A1 (en) Coding method, coding device, decoding method, and decoding device
JP3765171B2 (ja) 音声符号化復号方式
JPH11510274A (ja) 線スペクトル平方根を発生し符号化するための方法と装置
JP5063364B2 (ja) 音声合成方法
JP3519859B2 (ja) 符号器及び復号器
JP3144009B2 (ja) 音声符号復号化装置
JPH1020888A (ja) 音声符号化・復号化装置
JP2001044847A (ja) 可逆符号化方法、可逆復号化方法、これらの装置及びその各プログラム記録媒体
US20020165681A1 (en) Noise signal analyzer, noise signal synthesizer, noise signal analyzing method, and noise signal synthesizing method
JP2003150198A (ja) 音声符号化装置および音声復号化装置
JPH1020897A (ja) 適応変換符号化方式および適応変換復号方式
JPH07295593A (ja) 音声符号化装置
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置