JPH03156499A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH03156499A
JPH03156499A JP1294856A JP29485689A JPH03156499A JP H03156499 A JPH03156499 A JP H03156499A JP 1294856 A JP1294856 A JP 1294856A JP 29485689 A JP29485689 A JP 29485689A JP H03156499 A JPH03156499 A JP H03156499A
Authority
JP
Japan
Prior art keywords
sound source
signal
sound
circuit
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1294856A
Other languages
English (en)
Other versions
JP2596143B2 (ja
Inventor
Eisuke Hanada
英輔 花田
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1294856A priority Critical patent/JP2596143B2/ja
Publication of JPH03156499A publication Critical patent/JPH03156499A/ja
Application granted granted Critical
Publication of JP2596143B2 publication Critical patent/JP2596143B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号を低いビットレートで高品質に符号化
するための音声符号化方式に関する。
〔従来の技術〕
音声信号を低いビットレート、例えば16kb/s程度
以下で伝送する方式としては、マルチパルス符号化法な
どが知られている。これらは音源信号を複数個のパルス
の組合せ(マルチパルス)で表し、声道の特徴をデジタ
ルフィルタで表し、音源パルスの情報とフィルタの係数
を、一定時間区間(フレーム)毎に求めて伝送している
。この方法の詳細については、例えばアラセキ、オザワ
、オノ。
オチアイ氏による“Multi−pulse Exci
ted 5peechCoder Ba5ed on 
Maximun+ Cross−correlatio
n 5e−arch A1gorithm″、 (GL
OBECOM 83. IHEB GlobalTel
ecoa+a+unication+講演番号23.3
.1983) (文献1)に記載されている。この方法
では、声道情報と音源信号を分離してそれぞれ表現する
こと、および音源信号を表現する手段として複数のパル
ス列の組合せ(マルチパルス)を用いることにより、復
号後に良好な音声信号を出力することができる。
音声信号をより低いビットレートで伝送する方法として
は、マルチパルス音源のピッチ毎の単周期性(ピッチ相
関)を利用したピッチ予測マルチパルス法が提案されて
いる。この方法の詳細は、例えば、特願昭58−139
022号明細書(文献2)に詳しいのでここでは説明を
省略する。
また、音声信号をさらに低いビットレートで伝送する方
法としては、音源パルスの情報とフィルタの情報を一定
時間毎ではなく、入力された音声信号を分析して得られ
る音響的特徴が継続している区間毎に区切り(以下、音
声信号を区切る一連の処理をセグメンテーションといい
、セグメンテーションの結果得られた各区間をセグメン
トと呼ぶ。)、各セグメント毎に音源を求めることによ
って良好な再生音声を得る方法をとることができる。こ
の方法については特願平1−23255号明細書(文献
3)に詳しいのでここでは説明を省略する。
〔発明が解決しようとする課題〕
しかしながら、文献1と文献2に掲載されている従来方
法では、ビットレートが充分に高く音源パルスの数が充
分なときは音質が良好であったが、ビットレートを下げ
て行くと音質が低下するという問題点があった。
また、前記文献3に掲載されている方法でも、セグメン
トの長さが長くなった場合に音質が低下するという問題
点があった。
本発明の目的は、ビットレートが高いところでも、ある
いはビットレートを下げていっても、また同じ音響的特
徴を有する区間長が長くなっても、従来よりも良好な音
声を少ない演算量で実現可能な音声符号化方式を提供す
ることにある。
〔課題を解決するための手段〕
本発明の音声符号化方式は、離散的な音声信号を入力し
、前記音声信号のスペクトル包絡を表すスペクトルパラ
メータと前記音声信号の音響的特徴を表すパラメータを
抽出し、前記抽出された音響的特徴を表すパラメータを
用いて前記音声信号を分類し、前記分類結果に応じて予
め複数種類用意した音源モデルの中から最適なモデルを
選択し、前記選択された音源モデルを用いて、音声信号
を同一の特徴の連続している可変時間長のセグメントに
分割して音源信号を計算し、前記選択された音源信号を
表す符号と前記スペクトルパラメータと前記セグメント
長とを量子化して出力することを特徴とする。
本発明によれば、離散的な音声信号を入力し、前記音声
信号のスペクトル包絡を表すスペクトルパラメータと前
記音声信号の音響的特徴を表すパラメータを抽出し、前
記音響的特徴を用いて前記音声信号を分類し、前記分類
結果に応じて予め複数種類用意した音源モデルの中から
最適なモデルを選択し、前記選択された音源モデルと前
記スペクトルパラメータを用いて計算した再生音声と前
記入力音声との歪を計算することにより前記音声信号を
一定でない時間長を持つ区間に分割し、前記区間におい
て前記選択された音源信号を表す符号と前記スペクトル
パラメータと前記区間長とを量子化して出力するのが好
適である。
また本発明によれば、離散的な音声信号を入力し、予め
定められた時間長の区間に分割したのち前記音声信号の
スペクトル包絡を表すスペクトルパラメータと前記音声
信号の音響的特徴を表すパラメータを抽出し、隣接する
区間から求めた前記パラメータ同士の距離を求めること
によって前記音響的特徴が継続しているセグメントとし
て前記区間長に等しいか長いセグメント長を決定した後
に、前記抽出された音響的特徴を表すパラメータを用い
て前記セグメント長の音声信号を分類し、前記分類結果
に応じて予め複数種類用意した音源モデルの中から最適
なものを選択し、前記選択された音源モデルに従い音源
信号を計算して、前記選択された音源信号を表す符号と
前記計算されたスペクトルパラメータと前記セグメント
長とを量子化して出力するのが好適である。
〔実施例〕
第1図は、第1の実施例である音声符号化方式を実施す
る音声符号化装置のブロック図である。
第2図は、入力信号との歪を計算しつつ音源信号を計算
する場合における音源信号計算回路及びセグメント長決
定回路のブロック図を示す。
まず第1の実施例による符号化方式において、入力信号
と再生信号との歪を計算しつつ行うセグメントの区間長
(以下、セグメントの区間長を略してセグメント長とい
う。)の決定方法について第2図を用いて説明する。
信号入力端子310からは、予め定められた例えば10
+wsec、の区間長(以下、第1フレームという)の
信号が入力される。また、スペクトルパラメータ入力端
子300からは、第1フレームの入力信号から計算され
たスペクトルパラメータが入力される。音響パラメータ
入力端子305からは、第1フレームの入力信号の音響
的特徴を表すパラメータが入力される。
音源選択回路306は、入力された音響的特徴を表すパ
ラメータを用いて予め複数個用意された音源モデルから
最適なモデルを選択する。音源計算回路320は、第1
フレームの入力信号と選択された音源モデルとを用いて
音源信号を計算する。第1フレームに対する処理が終了
すると、現在のセグメント長を前記区間長に設定する。
バッフ1330は、計算された音源信号と現在のセグメ
ント長とを蓄積し、第1フレームの入力信号をそのまま
出力する。
次に信号入力端子340から次のフレームの入力信号を
入力する。信号形成回路345は、バッファ330から
出力された信号に続けて、入力端子340からの入力信
号を加えた区間長の入力信号を出力する。
音源計算回路350は、信号形成回路345からの出力
信号に対して前記選択された音源モデルを用いて音源信
号を計算する。
再生フィルタ360は、入力されたスペクトルパラメー
タと計算された音源信号とを用いて音声信号を再生する
歪計算回路370は、再生フィルタ360によって再生
された再生信号と入力信号との歪を計算する。
境界判定回路380は、計算された歪と予め定められた
判定値とを比較する。歪が判定値よりも小さい場合はセ
グメント長を更新し音源計算回路320の出力である音
源信号と更新されたフレーム長をバッファ330に蓄積
し、バッファ330は蓄積された音声信号を信号形成回
路345へ出力する。そして次のフレームの入力信号に
対する処理を行う。
一方、歪が判定値よりも大きい場合は、対象としている
入力信号の開始点に境界があると判定し、バッファ33
0に蓄積されている音源信号とセグメント長を出力端子
390に出力する。
さて第1図に戻り、入力端子500から離散的な音声信
号を入力する。時間分割回路510では、入力された音
声信号を予め定められた時間長(例えば10w5ec、
)のフレームに分割する。スペクトルパラメータ抽出回
路520では、フレームの音声信号のスペクトルを表す
スペクトルパラメータを、周知のLPG分析法によって
求める。量子化器530は、求められたスペクトルパラ
メータを量子化する。逆量子化器540は、量子化され
たスペクトルパラメータを逆量子化して出力する。
音響的特徴抽出回路550は、フレームの入力信号から
種々の音響的特徴を表すパラメータを抽出して出力する
。音響的特徴としては、いずれも周知の方法によって求
めることができるパワ、高周波数域のパワと低周波数域
のパワの比、ピッチゲイン、フレーム内におけるパワの
変化率等を用いることができる。
特徴分類回路560は、出力された音響的特徴を表すパ
ラメータを用いて、フレーム内の人力信号を分類すると
共に、入力信号を符号化する際に用いる音源モデルを決
定し、音源コードブック選択回路580とマルチパルス
音源計算回路590と母音部音源計算回路600のうち
、決定された音源モデルを計算する回路を動作させ、そ
れ以外の音源計算回路の動作を停止する0分類の種類と
しては、例えば母音性信号、摩擦性信号、過渡的信号な
どがある。
音源コードブック選択回路580とマルチパルス音源計
算回路590と母音部音源計算回路600は、第2図で
説明したような方法を用い、入力信号と音源モデルを用
いて計算した再生信号との歪を計算することにより、セ
グメントの時間長を算出するとともにそれぞれの音源モ
デルのパラメータを量子化して出力する。
このうち母音部音源計算回路600は、例えば小澤氏に
よる“種々の音源を用いる4、8kb八音へ符号化方式
(SPMEX)”  (電子情報通信学会音声研究会資
料5P89−21989年1文献4)の中で用いられて
いる改良ピッチ補間マルチパルス音源を音源モデル−と
して用い、音源パラメータを量子化して出力する。
また、音源コードブック選択回路580は、特徴分類回
路560が音源としてコードブックを用いることが適当
であることを示す分類を行った場合(例えば摩擦性信号
の場合)に、音源コードブック585を用いて音源コー
ドを選択する。音源コードブックの種類及び選択方法に
ついては例えばシュレーダー、アタル両氏による“C0
DE−EXCITE[l Ll−NEARPRI!DI
CTION (CELP) : HIGH−QtlAL
ITY 5PEECHAT Vll!RY LOW B
IT RATES” (ICASSP ’85  講演
番号25.1.11985) (文献5)と題した論文
等に詳しいのでここでは説明を略す。
またマルチパルス音源計算回路590は、特徴分類回路
560が音源としてマルチパルスを用いることが適当で
あることを示す分類を行った場合(例えば過渡性信号の
場合)に、例えば文献1に見られるような周知の方法で
音源パルスを計算する。
量子化器530の出力と、特徴分類回路560の出力と
、各音源計算回路580.590.600の出力である
音源信号を表す符号とセグメント長を表す符号は、マル
チプレクサ610の入力となる。マルチプレクサは、こ
れらの入力を効率的に多重化して出力する。
次に、第2の実施例を説明する。
第3図は、第2の実施例である音声符号化方式を実施す
る音声符号化装置のブロック図である。
第4図は、予めセグメント長を決定した後に音源計算を
行う場合におけるセグメント長を算出する回路のブロッ
ク図を示す。
第2の実施例において、予めセグメント長を決定した後
に音源計算を行う場合におけるセグメント長の決定方法
について第4図を用いて説明する。
初期パラメータ入力端子200からは、現セグメントの
音響的特徴を表すパラメータ(以下、これを初期パラメ
ータと呼ぶ。)の値が入力される。
また信号入力回路210からは初期パラメータを求めた
フレームの次のフレーム以後の入力音声信号が入力され
、バッファ215に蓄積される。バッファ215からは
、■フレーム毎に蓄積された信号が出力される。
音響的特徴抽出回路220は、バッファ215から出力
された音声信号から、入力された初期パラメータと同じ
種類の音響的特徴を表すパラメータを抽出する。
距離計算回路230は、抽出されたパラメータと初期パ
ラメータとの距離を算出する。
境界判定回路240は、算出された距離と予め定めたし
きい値を比較してセグメントが終了しているかどうかを
決定する。
判定結果出力回路250は、境界判定回路の結果出力に
応じて次の動きをする。境界があると判定された場合は
、セグメント長を出力する。境界ではないと判定された
場合はさらに次のフレームの人力信号の取り込みを行い
、以上の処理を繰り返す。
第3図に戻るが、第1図と同じ番号を付した構成要素は
第1図と同様の動作をするので説明を省略する。
第3図において、特徴分類回路560は、音響的特徴抽
出回路550から出力された音響的特徴を表すパラメー
タを用いて、フレーム内の入力信号を分類すると共に、
入力信号を符号化する際に用いる音源信号を決定し、音
源コードブック選択回路580とマルチパルス音源計算
回路590と母音部計算回路600のうち、入力信号を
最適に表す音源モデルを用いるものを動作させ、それ以
外の音源計算回路の動作を停止する。
有効時間長計算回路570は、第3図で説明したような
方法で、セグメントの時間長を計算して出力する。
以上述べた各実施例は本発明の一構成に過ぎず、種りの
変形も可能である。
マルチパルスの計算方法としては、文献1に示した方法
の他に、種々の周知な方法を用いることができる。
また、スペクトルパラメータとしては、他の周知なパラ
メータ(線スペクトル対、ケプストラム。
メルケプストラム、対数断面積比等)を用いることもで
きる。
また、セグメント長を決定するための判定値は、固定の
数値としてもよいし、セグメント長に応じて算出した数
値としてもよい。
また、求める歪は、例えば2乗誤差としてもよいし、こ
の他周知の距離尺度を用いることができる。
また、特徴分類回路が行う分類は上に示したもののみな
らず、他の分類としてもよい。
また、分類に応じて用いる音源も上の例に示した以外の
ものを用いることができる。
〔発明の効果〕
本発明によれば、音源信号を予め用意した複数個の音源
の中から最適なものを選択して用いて音声信号を同一の
特徴の連続している可変時間長のセグメントに分割して
音源信号を計算することにより、従来の方法に比べ少な
い伝送情報量で音声信号を良好に表すことができるとい
う大きな効果がある。
【図面の簡単な説明】
第1図、第2図は、本発明の第1の実施例を説明するた
めのブロック図、 第3図、第4図は、本発明の第2の実施例を説明するた
めのブロック図である。 200  ・・・・初期パラメータ入力回路210、3
40・・信号入力端子 215、330・・バッファ 220、550・・音響的特徴抽出回路230  ・・
・・距離算出回路 240、380・・境界判定回路 250 ・・・・判定結果出力回路 300  ・・・・初期信号入力端子 305  ・・・・音響パラメータ入力端子306  
・・・・音源選択回路 310  ・・・・スペクトルパラメータ入力端子32
0、350・・音源計算回路 信号形成回路 再生フィルタ 歪計算回路 出力端子 入力端子 時間分割回路 スペクトルパラメータ計算回路 量子化器 逆量子化器 特徴分類回路 有効時間長計算回路 音源コードブック選択回路 音源コードブック マルチパルス計算回路 母音音源計算回路 マルチプレクサ a〜 第2 図

Claims (1)

    【特許請求の範囲】
  1. (1)離散的な音声信号を入力し、前記音声信号のスペ
    クトル包絡を表すスペクトルパラメータと前記音声信号
    の音響的特徴を表すパラメータを抽出し、前記抽出され
    た音響的特徴を表すパラメータを用いて前記音声信号を
    分類し、前記分類結果に応じて予め複数種類用意した音
    源モデルの中から最適なモデルを選択し、前記選択され
    た音源モデルを用いて、音声信号を同一の特徴の連続し
    ている可変時間長のセグメントに分割して音源信号を計
    算し、前記選択された音源信号を表す符号と前記スペク
    トルパラメータと前記セグメント長とを量子化して出力
    することを特徴とする音声符号化方式。
JP1294856A 1989-11-15 1989-11-15 音声符号化方法 Expired - Fee Related JP2596143B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1294856A JP2596143B2 (ja) 1989-11-15 1989-11-15 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1294856A JP2596143B2 (ja) 1989-11-15 1989-11-15 音声符号化方法

Publications (2)

Publication Number Publication Date
JPH03156499A true JPH03156499A (ja) 1991-07-04
JP2596143B2 JP2596143B2 (ja) 1997-04-02

Family

ID=17813139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1294856A Expired - Fee Related JP2596143B2 (ja) 1989-11-15 1989-11-15 音声符号化方法

Country Status (1)

Country Link
JP (1) JP2596143B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01155400A (ja) * 1987-12-14 1989-06-19 Hitachi Ltd 音声符号化方式
JPH01257999A (ja) * 1988-04-08 1989-10-16 Nec Corp 音声信号符号化復号化方法及び音声信号符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01155400A (ja) * 1987-12-14 1989-06-19 Hitachi Ltd 音声符号化方式
JPH01257999A (ja) * 1988-04-08 1989-10-16 Nec Corp 音声信号符号化復号化方法及び音声信号符号化装置

Also Published As

Publication number Publication date
JP2596143B2 (ja) 1997-04-02

Similar Documents

Publication Publication Date Title
JP3196595B2 (ja) 音声符号化装置
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JPH09160596A (ja) 音声符号化装置
JP3248215B2 (ja) 音声符号化装置
JPH06348300A (ja) 合成手段による解析法技術を用いる音声のコード化器における励起ゲインの量子化の為の方法と装置
JPH03156499A (ja) 音声符号化方法
JPH03156498A (ja) 音声符号化方式
EP1083548B1 (en) Speech signal decoding
JP3153075B2 (ja) 音声符号化装置
JPH06131000A (ja) 基本周期符号化装置
JP3019342B2 (ja) 音声符号化方式
JP3515216B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JPH05232996A (ja) 音声符号化装置
JP3515215B2 (ja) 音声符号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP3101430B2 (ja) 音声伝送方式
JP3092654B2 (ja) 信号符号化装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2847730B2 (ja) 音声符号化方式
JPH043878B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees