JP3227608B2 - 音声符号化装置および音声復号化装置 - Google Patents

音声符号化装置および音声復号化装置

Info

Publication number
JP3227608B2
JP3227608B2 JP24944190A JP24944190A JP3227608B2 JP 3227608 B2 JP3227608 B2 JP 3227608B2 JP 24944190 A JP24944190 A JP 24944190A JP 24944190 A JP24944190 A JP 24944190A JP 3227608 B2 JP3227608 B2 JP 3227608B2
Authority
JP
Japan
Prior art keywords
waveform
basic
codebook
pitch
interosseous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP24944190A
Other languages
English (en)
Other versions
JPH04125700A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP24944190A priority Critical patent/JP3227608B2/ja
Priority to US07/696,410 priority patent/US5228086A/en
Priority to DE69129131T priority patent/DE69129131T2/de
Priority to EP91107414A priority patent/EP0457161B1/en
Publication of JPH04125700A publication Critical patent/JPH04125700A/ja
Application granted granted Critical
Publication of JP3227608B2 publication Critical patent/JP3227608B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】
本発明は、音声を符号化・復号化する音声符号化装置
および音声復号化装置に関するものである。
【0002】
【従来の技術】
従来、低ビットレート(4.8kbps程度)の音声符号化
を実現する方式としては、線型予測分析などの周波数分
析を利用して音声の周波数的特徴を抽出し、音源情報と
合せて符号化する音声分析合成符号化方式と、音声の冗
長性を用いて波形自身を符号化する音声波形符号化方式
とがある。
【0003】 更に、波形符号化の形態で低ビットレートを実現する
方法の一つとして骨組符号化という方式がある。
【0004】 この方式では、まず、音声信号をピッチ分析すること
によってピッチ情報と1ピッチの基本波形を得て、その
基本波形の形状を表す数種類のパルスの時系列(骨組)
を検索し、その骨組情報を得る。次に、その骨組の間に
張られる波形(滑間波形)の情報を符号化して骨間波形
情報を得て、上記ピッチ情報と骨組情報と骨間波形情報
とを利用して音声の符号化・復号化を行う。
【0005】 この方式により、音声波形の概形は、ピッチ情報と1
ピッチの基本波形の形状を表す骨組の位置と大きさとに
よって符号化ができる。また、1ピッチの基本波形の概
形は骨組情報で符号化されるので、骨間波形は端点固定
に正規化すればベクトル量子化により低ビットレートで
符号化することができる。従って、良質な復号音声を得
ることができる音声波形符号化の形態を取りながらも、
簡単なデータ処理で低ビットレートの音声符号化を実現
することができる。
【0006】 この方式について詳細に説明する。
【0007】 図3は、従来の音声符号化装置および音声復号化装置
の機能ブロック図である。各ブロックの説明を以下に述
べる。
【0008】 符号器19においては、まず、入力音声信号21をサンプ
リングしてディジタル信号に変換し、一定時間長(1フ
レーム)ごとに区切る。
【0009】 次に、ピッチ分析部22において、その区間内のピッチ
を求め、ピッチ情報とする。そして、ピッチ情報を基
に、区間内の波形から1ピッチの平均的な波形を求め、
これを基本波形として骨組検索部23に送る。
【0010】 骨組検索部23では、まず、ピッチ分析部22で作成され
た基本波形の形状を分析し、何段階の骨組を立てるかを
考慮しながら、骨組の段階に応じて、正と負で絶対値最
大となるポイントを検索し、その信号の位置と信号の振
幅とを骨組情報とする。
【0011】 ここで、ここ骨組検索法について、詳細に説明する。
【0012】 1ピッチの基本波形はどれもインパルス応答的形状で
あるが、その形状は発声者・発声状況によって様々であ
る。従って、その概形を骨組で表すにはその段階を波形
の形状に応じて決定する必要がある。すなわち、なだら
かな山の形状の波形には段数を少なく設定し、正負に激
しく振動する波形には段数を多く設定する必要がある。
そこで、この骨組段数を考慮しながら骨組検索を行うア
ルゴリズムを以下に述べる。 (1)初期値設定を行う。 Xi(i=1,L):1ピッチ基本波形。Lは長さ。 D:骨組段数の最大値。 K:1〜Lまでの位置を要素とする探索の禁止領域集合。
初期値としてK=φ(空集合)とする。 M:探索段数。初期値M=0。 Hj=(Ax、An、Ix、In):骨組情報。
【0013】 MAXの信号値Ax、MINの信号値An、MAXの位置Ix、MINの
位置Inの4つの値により構成される。 (2)M=M+1 (3)
【0014】
【数1】 Xmax=max{Xi|i=1,L iK}=Xi1 Xmin=min{Xi|i=1,L iK}=Xi2 HM=(Xmax、Xmin=、i1、i2) (4)i1とi2を中心として、前後のXiの符号が変化しな
い区間の位置全てを禁止領域としてKの要素に加える。 (5)M=DまたはKが1〜L全てを要素として持つ時
は、(6)へ。それ以外の場合は(2)へ。 (6)Hj=(j=1,M)の位置の部分のみを取り出し
て、大きさの順番に並べる。 (7)小さい方から、その位置がMAXの位置であるか、M
INの位置であるかを調べる。そのどちらかが2つ連続し
て続いた場合はM=M−1として(6)へ。MAXとMINが
全て交互に並んでいる場合は(8)へ。 (8)Mを骨組段数、Hj(j=1,M)を骨組情報として
検索を終了する。 上記アルゴリズムにより分類された基本波形の集合の
例を図4に示す。図4(a)に示す波形は1段の骨組に
より符号化されると分類された波形の例である。図4
(b)に示す波形は2段の例、図4(c)に示す波形は
3段の例である。第4図では実線で1ビットの基本波形
を、破線で骨組の位置を示す。また、基本波形と骨組情
報の関係について、骨組が2段の場合を例として、図5
に示す。A11、A12、A21、A22が骨組の位置情報、B11、B
12、B21、B22が信号値情報である。
【0015】 次に骨間波形選択部24の機能を図6を用いて説明す
る。ただし、図6は骨組が1段の場合の概念図である。
【0016】 まず、前記骨組情報を基に、1ピッチ内において、骨
組となるMAX信号CiからMIN信号C2までの間に張られる波
形と、MIN信号C2からMAX信号C1までの間に張られる波形
とを求めて、これを基本骨間波形D1、D2とする。次に、
それぞれの基本骨間波形を端点固定(時間的・パワー
的)に正規化して信号E1、E2とする。
【0017】 そして、骨間波形符号帳25に格納されている番号付け
られた骨間波形サンプルと比較し、正規化された基本骨
間波形に最も近い骨間波形サンプルに付いている番号N
およびMを骨間波形情報とする。そして、上記のピッチ
情報、骨組情報、骨間波形情報を単位時間の音声の符号
として伝送する。
【0018】 この時に用いられる骨間波形符号帳25は、予め音声を
分析することによって得られる基本骨間波形を多くの音
声をデータについて集め、それぞれを端点固定(時間的
・パワー的)に正規化して番号を付けて格納することに
よって作成される。
【0019】 ここで、その作成方法について詳細に述べる。上記骨
間波形符号帳25はそのサイズが大きい程その符号化歪は
小さくなるのは自明である。高音質の実現するためには
骨間波形符号25のサイズは大きい事が望ましい。しか
し、低ビットレートを実現するためには骨間波形情報の
ビット数が小さい事が望ましく、また、符号器19を実時
間で動作させるためには骨間波形符号帳25とのマッチン
グに要する計算量は少ないのが望ましい。従って、サイ
ズは小さいながらも符号化歪が小さいという効率の良い
骨間波形符号帳25が必要となる。この骨間波形符号帳25
を作成するために、充分大きな骨間波形サンプル集合に
対してサンプルとセントロイド(重心)間のユークリッ
ド距離が最小になるようなクラスタリングを行い、作成
しようとする符号帳サイズの数のクラスに分けてそのク
ラスタのセントロイド(重心)で骨間波形符号帳25を作
成するという技術的手段を用いる。
【0020】 本従来例に用いたクラスタリング・アルゴリズムは細
胞分裂型のアルゴリズムである。そのアルゴリズムを以
下に述べる。 (1)K=1 (2)K個のクラスタのセントロイドを単純平均により
求める。そして、それぞれのクラスタに属する全てのサ
ンプルとセントロイドとのユークリッド距離を求め、そ
の最大値をそのクラスタの歪とする。 (3)K個のクラスタの中で最も歪の大きいクラスタの
セントロイドの附近に2つのセントロイドを作る。(細
胞分裂の核になる。) (4)K+1個のセントロイドを基にクラスタリングを
行い、セントロイドを求め直す。 (5)空のクラスタがあればそのセントロイドを抹消し
て(3)へ。 (6)K+1個のクラスタの歪を(2)と同様に求め、
その総和の変化量が予め設定した微小な閾値以下であれ
ば(7)へ、閾値より大きければ(4)へ。 (7)K+1個が目標のクラスタ数に達していなければ
K=K+1として(2)へ、達していれば(8)へ。 (8)すべてのクラスタのセントロイドを求め、符号帳
を作成する。
【0021】 次に、復号器の機能を図3及び図7を用いて説明す
る。ただし、図7は骨組が1段の場合の波形図である。
【0022】 まず、図3に示す復号器20内の骨組形成部26において
は、前記符号化によって得られるピッチ情報と骨組情報
を基に、音声の骨組のC1、C2を形成する。
【0023】 図7の上部は、この骨組の一例である。骨組が骨組情
報に基づいて形成されている様子を示す。そして、波形
合成部27においては、骨間波形情報NおよびMに基づい
て、符号基19に格納されている骨間波形符号帳25と同じ
骨間波形符号帳28から基本骨間波形E1およびE2を選び、
骨組に応じて時間的・パワー的に変換して各骨の間に張
り、この合成波形Fを出力音声29とする。図7下部はこ
の波形合成の一例である。骨間波形情報に基づいて、骨
間波形符号帳28から選び出した骨間波形サンプルによっ
て、骨組の間に基本骨間波形を張っている様子を示す。
【0024】
【発明が解決しようとする課題】
上記骨組符号化方式により、低ビットレートの簡単な
データ処理でありながら、自然で滑らかな合成音声が得
られる。
【0025】 しかしながら、この方式における問題点として、復号
化された音声の明瞭度が悪いことが挙げられる。これは
大きく3つのことが原因と考えられる。まず、1ピッチ
の基本波形を1分析区間における1ピッチ波形の平均波
形としているために、波形の細部構造がなまってしまう
こと。次に、符号帳参照時における符号化歪。そして、
分析区間の間で波形を滑らかに接合させるために波形の
重ね合わせを行っている点である。
【0026】 この符号化方式が1ピッチ波形を符号化する形態をと
っているために、3番目の原因は避けられないが、残り
の2つの原因については改善の余地がある。
【0027】 本発明は、簡単なデータ処理で低ビットレート・高音
質の音声波形符号化を行うことができ、復号化された音
声の明瞭度を劣化させずに音声の符号化・復号化を行う
ことを目的とするものである。
【0028】
【課題を解決するための手段】
この目的を達成するために、本発明は、音声信号を一
定時間毎に区切り、その分析区間毎にピッチ分析を行
い、そのピッチ情報を用いて分析区間を代表する1ピッ
チの長さの基本波形を求める基本波形抽出手段と、分析
区間毎に線形予測分析を行い、分析区間の周波数的特徴
を表す線形予測パラメータを抽出するパラメータ抽出手
段と、基本波形に対してパラメータを用いてフィルタリ
ングを行い、1ピッチの長さの線形予測残差を求める基
本予測残差波形抽出手段と、予め決められた規則に従
い、上記基本予測残差波形の正と負それぞれにおける絶
対値最大点の位置と振幅を表すパルスの時系列(骨組)
を求め符号化する骨組符号化手段と、番号付けられた複
数の骨間波形サンプルが格納されている骨間波形符号帳
と、骨間符号化手段で得られた骨組の間に張られる骨間
波形を骨間波形符号帳を利用して符号化する骨間波形符
号化手段を設けるように構成されている。
【0029】 また、本発明は、符号化された情報を基に、数種類の
パルスの時系列(骨組)を作成する骨組復号化手段と、
番号付けられた複数の骨間波形サンプルが格納されてい
る骨間波形符号帳と、骨間波形符号化手段によって符号
化された波形の形状の情報を基に、骨間波形符号帳を利
用し時系列(骨組)の間に張られる骨間波形復号化し、
基本予測残差波形を作成する骨間波形復号化手段と、骨
間波形復号化手段により作成された基本予測残差波形に
対して、符号器から伝送されてきたパラメータを用いて
フィルタリングを行い、1ピッチの基本波形を求める基
本波形復号化手段と、基本波形復号化手段によって復号
化された1ピッチの基本波形を用いて1分析区間内の波
形を復号化する分析区間内波形復号化手段を設けるよう
に構成されている。
【0030】 更に、好ましくは、骨間波形符号帳が、音声信号を分
析することによって得られる複数の骨間波形のそれぞれ
を、時間的およびパワー的に端点固定して正規化し、番
号付けして格納することによって作成される。
【0031】
【作用】
本発明は、上記構成により、符号器に線形予測分析部
を置き、音声波形の周波数的特徴を線形予測パラメータ
の形態で復号器に送るようにしている。
【0032】 すなわち、まず、入力音声に対して線形予測分析を行
い、線形予測係数を求める。線形予測係数は符号帳によ
り符号化し、パラメータ情報とする。
【0033】 次に、入力音声に対してピッチ分析を行いピッチ情報
を求める。ピッチ情報を基に1ピッチの平均的な波形
(基本波形)を求め、更に、上記線形予測係数を用いて
フィルタリングすることによって基本残差波形を求め
る。そして、その基本残差波形の形状を表す数種類のパ
ルスの時系列(骨組)を検索して骨組情報を得る。さら
にその骨組の間に張られる波形(骨間波形)の情報を骨
間波形符号帳を用いて符号化し、骨間波形情報を求め
る。そして、上記パラメータ情報、ピッチ情報、骨組情
報、骨間波形情報を復号器に送る。
【0034】 復号器側では、まず、ピッチ情報、骨組情報、骨間波
形情報を基に基本残差波形を求める。次に、パラメータ
情報を用いてフィルタリングを行い、基本波形を求め
る。そして、基本波形を分析区間に並べることによって
波形を復号化する。
【0035】 以上の符号化方式により、音声波形の周波数的特徴を
線形予測パラメータの形態で復号器を送り、復号器側で
は復号化された基本残差波形に対して合成フィルタで周
波数的特徴を与えることにより、復号化させた音声の明
瞭度を劣化させずに音声の符号化・復号化を行うことが
できる。
【0036】 これにより、音声の周波数的特徴はパラメータ情報で
伝えることができる。また1ピッチの基本残差波形の概
形は骨組の位置と大きさで符号化ができ、骨間波形は端
点固定に正規化すればベクトル量子化により低ビットレ
ートで符号化することができる。しかも、1ピッチの基
本波形の復号化部においては、基本残差波形を合成した
後、パラメータ情報に基づき線形予測係数を用いてフィ
ルタリングを行うことにより、入力音声の周波数的特徴
を直接基本波形に与えることができる。従って、復号化
された音声の明瞭性を向上させることができる。
【0037】
【実施例】
以下、本発明の一実施例について図面を参照しながら
説明する。図1は本発明の一実施例における音声符号化
装置および音声復号化装置のブロック結線図である。
【0038】 各ブロックの説明を以下に述べる。
【0039】 符号器1においては、まず、入力音声信号3をサンプ
リングしてディジタル信号に変換し、一定時間長(1フ
レーム)ごとに区切る。
【0040】 線形予測分析部6では、各フレーム毎に線形予測分析
を行い、線形予測係数を求める。求めた線形予測係数
は、パラメータ符号化部5において、圧縮性・補間性の
良いLSPパラメータに変換し、更に、LSPパラメータの符
号帳4を用いてベクトル量子化し、これをパラメータ情
報として復号器2に送る。
【0041】 この時に用いるパラメータ符号帳4は次の手順で作成
する。まず、予め多くの音声データに対して線形予測分
析を行い、LSPパラメータの母集団を作成する。次に、
このLSPパラメータの母集団に対してサンプルとセント
ロイド(重心)間の平均ユークリッド距離が最小になる
ようなクラスタリングを行い、作成しようとする符号帳
サイズの数のクラスに分けて、そのクラスタのセントロ
イド(重心)で符号帳を作成する。この時のクラスタリ
ングアルゴリズムの手順については、上記従来技術にお
ける骨間波形符号帳作成のためのクラスタリングアルゴ
リズムの説明の部分において詳細に記した。
【0042】 次に、ピッチ分析部7において、その分析区間内のピ
ッチを求めピッチ情報とする。そして、ピッチ情報を復
号器2へ送る。次に、上記ピッチ情報を基に、フレーム
内の波形から1ピッチの平均的な波形(基本波形)を求
める。更に、上記線形予測分析部6にて求められた線形
予測係数を用いて、基本波形に対してフィルタリングを
行い、1ピッチの基本残差波形を求め、これを骨組検索
部8に送る。
【0043】 骨組検索部8では、まず、上記ピッチ分析部7で作成
された基本残差波形の形状を分析し、何段階の骨組を立
てるかを考慮しながら、骨組の段数に応じて、正と負で
絶対値最大となるポイントを検索し、その信号の位置と
信号の振幅とを骨組情報とする。この骨組の段数を決め
ながら骨組を検索する方法について詳細な説明は、上記
従来技術における骨組検索法の説明部分において詳細に
記した。
【0044】 骨間波形符号化部9では、骨組検索部8において求め
られた骨組情報に基づき、基本残差波形の骨組の間に張
られる部分波形(基本骨間波形)を端点固定(時間的・
パワー的)に正規化し、骨間波形符号帳10に格納されて
いる番号付けられた骨間波形サンプルと比較し、正規化
された基本骨間波形に最も近い骨間波形サンプルに付い
ている番号を骨間波形情報とする。この骨間波形選択方
法の具体的な説明については、上記従来技術における図
6を用いた骨間波形選択部24の説明の部分において詳細
に記した。
【0045】 また、この時にも用いる骨間波形符号帳10は、予め音
声を骨組分析することによって得られる基本骨間波形を
多くの音声データについて集め、それぞれを端点固定
(時間的・パワー的)に正規化して番号を付けて格納す
ることによって作成される。骨間波形符号帳作成の際の
クラスタリングアルゴリズムの手順については、上記従
来技術における骨間波形符号帳作成のためのクラスタリ
ングアルゴリズムの説明の部分において詳細に記した。
【0046】 次に、図1および図2を用いて、復号器2の機能を説
明する。
【0047】 まず、骨組形成部11においては、前記符号化によって
得られるピッチ情報と骨組情報を基に、1ピッチの基本
残差波形の骨組を形成する。図2上部においては、この
時の1ピッチの基本残差波形の骨組C1、C2を形成してい
る様子を示す。
【0048】 基本残差波形合成部12においては、骨間波形情報に基
づいて、符号器1に格納されている骨間波形符号帳10と
同じ骨間波形符号帳13から基本骨間波形を選び、骨組に
応じて時間的・パワー的に変換して各骨の間に張り、基
本残差波形を合成する。図2中部においては、骨間波形
情報M、Nに基づいて、骨間波形符号帳13から基本骨間
波形E1、E2を選び、骨組C1、C2に応じて時間的・パワー
的に変換して各骨の間に張り、基本残差波形Fを作成し
ている様子を示す。
【0049】 パラメータ復号化部15においては、符号器1から送ら
れてきたパラメータ情報に基づき、符号器1に格納され
ているパラメータ符号帳4と同じパラメータ符号帳14か
らLSPパラメータを選び、これを基本波形復号化部16に
送る。
【0050】 基本波形復号化部16においては、LSPパラメータを用
いて基本残差波形に対してフィルタリングを行い基本波
形G(図2)を作成する。
【0051】 そして、波形復号化部17においては、復号化された1
ピッチの基本波形を分析区間の始端から終端まで並べる
ことによって音声波形H(図2)を作成し、これを出力
音声18とする。
【0052】 この音声符号化法の効果を示すために、この音声符号
化・復号化のシミュレーション実験を行う。符号化され
る音声データは、女性アナウンサー1名の発声した天気
予報の音声「天気予報。気象庁予報部午後1時30分発表
の天気予報をお知らせします。日本の南岸には、東西に
のびる前線が停滞し、前線上の八丈島の東や、北九州の
五島列島付近には低気圧があって、東北東に進んでいま
す。」を8kHzサンプリングでA/D変換したディジタル音
声データで、長さは約20秒である。音声データは20msec
(1フレーム)毎に分析窓40msecで分析する。線形予測
分析の次数は10次、LSPパラメータは128のDFTを用いて
検索した。なお、パラメータ符号帳4および14のサイズ
は4096である。
【0053】 骨組検索部8における骨組段数は最大を3段とした。
2段と3段の骨組位置情報と3段の骨組ゲイン情報につ
いては、複数の情報をベクトルとして骨間波形と同様に
符号帳による符号化を行い、ビットレートの節約を行っ
た。
【0054】 骨間検索部8においては、ビットレートをさらに下げ
るために、各段数に応じて適応ビット割当てを行った。
骨間波形情報を求めるための骨間波形符号帳10のサイズ
を各段数と波形の長さに応じて変化させて短い波形は小
さい符号帳で、長い波形は大きな符号帳で符号化するよ
うにした。
【0055】 骨間波形符号帳10は、上記音声データを含まない男女
50名の各約10秒間の音声データを分析することによって
得られた骨間波形サンプル集合を基に上記クラスタリン
グ・アルゴリズムを用いて作成した。なお、サンプル集
合のサイズは約2万個である。
【0056】 また、復号器2の波形復号化部17においては、40msec
の三角形窓を用いて波形を重ね合わせることにより、合
成波形を滑らかに接合する処理を行う。
【0057】 本システムにおける音声データ1単位(20msec)当た
りのビット割当てについては下記の(表1)に示す。
【0058】
【表1】 上記条件による符号化実験の結果、低ビットレートで
ありながら、滑らかで自然な音声が合成できた。S/N比
でも約10dBが得られた。この音声データ以外の音声で同
様の実験を試みたところ5〜10dBのS/N比が得られ、音
質も良かった。従来の音声符号化装置および音声符号化
および音声復号化装置との比較実験では、S/N比では同
等であるが、視聴実験によれば、本発明による音声符号
化装置および音声復号化装置の方が明瞭性が良いとの評
価を得た。
【0059】 上記シミュレーション実験により、本発明による音声
符号化装置および音声復号化装置によって、低ビットレ
ートで明瞭性のある音声符号化・復号化が実現できてい
ることが検証された。
【0060】
【発明の効果】
以上のように本発明は、骨組符号化器に線形予測分析
部を置き、音声波形の周波数的特徴を線形予測パラメー
タの形態で復号器に送り、復号器側では復号化された基
本残差波形に対して合成フィルタで周波数的特徴を与え
るようにしたので、1ピッチの基本波形の復号化部にお
いては、基本残差波形を合成した後、パラメータ情報に
基づき線形予測係数を用いてフィルタリングを行うこと
により、入力音声の周波数的特徴を直接基本波形に与え
ることができ、低ビットレートの簡単なデータ処理で高
音質の音声波形符号化を行うことができ、かつ復号化さ
れた音声の明瞭度を劣化させずに音声の符号化・復号化
を行うことが可能となる。
【図面の簡単な説明】
【図1】 本発明の一実施例における音声符号化装置および音声復
号化装置の機能ブロック図
【図2】 本発明の一実施例における音声復号化装置機能説明図
【図3】 従来の骨組符号化方式に基づく音声符号化装置および音
声復号化装置を示す機能ブロック図
【図4】 従来の骨組検索アルゴリズムより骨組段数別に分類され
た基本波形の集合を示した波形図
【図5】 従来の骨組符号化方式に基づく音声符号化装置および音
声復号化装置の基本波形と骨組情報の関係について骨組
が2段の場合を例として示した波形図
【図6】 従来の骨組符号化方式に基づく音声符号化装置の機能説
明図
【図7】 従来の骨組符号化方式に基づく音声復号化装置の機能説
明図
【符号の説明】
1……符号器 2……復号器 3……入力音声信号 4……パラメータ符号帳 5……パラメータ符号化部 6……線形予測分析部 7……ピッチ分析部 8……骨組検索部 9……骨間波形符号化部 10……骨間波形符号帳 11……骨組形成部 12……基本残差波形合成部 13……骨間波形符号帳 14……パラメータ符号帳 15……パラメータ復号化部 16……基本波形復号化部 17……波形復号化部 18……出力音声

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を一定時間毎に区切り、その分析
    区間毎にピッチ分析を行い、そのピッチ情報を用いて分
    析区間を代表する1ピッチの長さの基本波形を求める基
    本波形抽出手段と、上記分析区間毎に線形予測分析を行
    い、分析区間の周波数的特徴を表す線形予測パラメータ
    を抽出するパラメータ抽出手段と、上記基本波形に対し
    て上記パラメータを用いてフィルタリングを行い、1ピ
    ッチの長さの線形予測残差を求める基本予測残差波形抽
    出手段と、予め決められた規則に従い、上記基本予測残
    差波形の正と負それぞれにおける絶対値最大点の位置と
    振幅を表すパルスの時系列(骨組)を求め符号化する骨
    組符号化手段と、番号付けられた複数の骨間波形サンプ
    ルが格納されている骨間波形符号帳と、上記骨組符号化
    手段で得られた骨組の間に張られる骨間波形を上記骨間
    波形符号帳を利用して符号化する骨間波形符号化手段を
    有する音声符号化装置。
  2. 【請求項2】骨間波形符号帳が、音声信号を分析するこ
    とによって得られる複数の骨間波形のそれぞれを、時間
    的およびパワー的に端点固定して正規化し、番号付けし
    て格納することによって作成されることを特徴とする請
    求項1記載の音声符号化装置。
  3. 【請求項3】符号化された情報を基に、数種類のパルス
    の時系列(骨組)を作成する骨組復号化手段と、番号付
    けられた複数の骨間波形サンプルが格納されている骨間
    波形符号帳と、骨間波形符号化手段によって符号化され
    た波形の形状の情報を基に、上記骨間波形符号帳を利用
    し上記時系列(骨組)の間に張られる骨間波形を復号化
    し、基本予測残差波形を作成する骨間波形復号化手段
    と、上記骨間波形復号化手段により作成された基本予測
    残差波形に対して、符号器から伝送されてきた上記パラ
    メータを用いてフィルタリングを行い、1ピッチの基本
    波形を求める基本波形復号化手段と、上記基本波形復号
    化手段によって復号化された1ピッチの基本波形を用い
    て1分析区間内の波形を復号化する分析区間内波形復号
    化手段を有する音声復号化装置。
  4. 【請求項4】骨間波形符号帳が、音声信号を分析するこ
    とによって得られる複数の骨間波形のそれぞれを、時間
    的およびパワー的に端点固定して正規化し、番号付けし
    て格納することによって作成されることを特徴とする請
    求項3記載の音声復号化装置。
JP24944190A 1990-05-18 1990-09-18 音声符号化装置および音声復号化装置 Expired - Lifetime JP3227608B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP24944190A JP3227608B2 (ja) 1990-09-18 1990-09-18 音声符号化装置および音声復号化装置
US07/696,410 US5228086A (en) 1990-05-18 1991-05-06 Speech encoding apparatus and related decoding apparatus
DE69129131T DE69129131T2 (de) 1990-05-18 1991-05-07 Einrichtung zur Sprachcodierung und Verwandte Decodierungseinrichtung
EP91107414A EP0457161B1 (en) 1990-05-18 1991-05-07 Speech encoding apparatus and related decoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24944190A JP3227608B2 (ja) 1990-09-18 1990-09-18 音声符号化装置および音声復号化装置

Publications (2)

Publication Number Publication Date
JPH04125700A JPH04125700A (ja) 1992-04-27
JP3227608B2 true JP3227608B2 (ja) 2001-11-12

Family

ID=17193016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24944190A Expired - Lifetime JP3227608B2 (ja) 1990-05-18 1990-09-18 音声符号化装置および音声復号化装置

Country Status (1)

Country Link
JP (1) JP3227608B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JP3523827B2 (ja) 2000-05-18 2004-04-26 沖電気工業株式会社 音声データ録音再生装置
KR100821499B1 (ko) * 2000-12-14 2008-04-11 소니 가부시끼 가이샤 정보 추출 장치

Also Published As

Publication number Publication date
JPH04125700A (ja) 1992-04-27

Similar Documents

Publication Publication Date Title
US6161091A (en) Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
TW412719B (en) Method and apparatus for reproducing speech signals and method for transmitting same
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
WO2006001218A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
WO2006121101A1 (ja) 音声符号化装置およびスペクトル変形方法
JPS63502302A (ja) 外部のボイシングまたはピッチ情報を使用することなく音声を合成する方法および装置
US5673364A (en) System and method for compression and decompression of audio signals
JP3236592B2 (ja) デジタル音声符号器において使用するための音声符号化方法
US4703505A (en) Speech data encoding scheme
US4985923A (en) High efficiency voice coding system
JP3227608B2 (ja) 音声符号化装置および音声復号化装置
US5228086A (en) Speech encoding apparatus and related decoding apparatus
JPH10143199A (ja) 音声符号化方法および復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2853266B2 (ja) 音声符号化装置および音声復号化装置
Copperi et al. Vector quantization and perceptual criteria for low-rate coding of speech
JP2780458B2 (ja) ベクトル量子化法および音声符号化復合化装置
Zhang et al. Embedded RPE based on multistage coding
JP2000298500A (ja) 音声符号化方法
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3232728B2 (ja) 音声符号化方法
WO2012172750A1 (ja) パルス位置探索装置、符号帳探索装置、及びこれらの方法
JPH05265494A (ja) 音声符号化・復号化装置
JPH10124093A (ja) 音声圧縮符号化方法および装置
KR100624545B1 (ko) 티티에스 시스템의 음성압축 및 합성방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080907

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080907

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090907

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090907

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 10