JPH03156498A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH03156498A
JPH03156498A JP1294855A JP29485589A JPH03156498A JP H03156498 A JPH03156498 A JP H03156498A JP 1294855 A JP1294855 A JP 1294855A JP 29485589 A JP29485589 A JP 29485589A JP H03156498 A JPH03156498 A JP H03156498A
Authority
JP
Japan
Prior art keywords
sound source
signal
sound
calculated
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1294855A
Other languages
English (en)
Inventor
Eisuke Hanada
英輔 花田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1294855A priority Critical patent/JPH03156498A/ja
Publication of JPH03156498A publication Critical patent/JPH03156498A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は音声信号を低いビットレートで高品質に符号化
するための音声符号化方式に関する。
〔従来の技術〕
音声信号を低いビットレート、例えば16kb/s程度
以下で伝送する方式としては、マルチパルス符号化法な
どが知られている。これらは音源信号を複数個のパルス
の組合せ(マルチパルス)で表し、声道の特徴をデジタ
ルフィルタで表し、音源パルスの情報とフィルタの係数
を、一定時間区間(フレーム)毎に求めて伝送している
。この方法の詳細については、例えばアラセキ、オザワ
、オノ。
オチアイ氏による“Multi−pulse Exci
ted 5peechCoder Ba5ed on 
Maximum Cross−correlation
 5e−arch Algorithm”、 (GLO
BECOM 83. IEEE GlobalTele
communication、講演番号23.3.19
83) (文献1)に記載されている。この方法では、
声道情報と音源信号を分離してそれぞれ表現すること、
および音源信号を表現する手段として複数のパルス列の
組合せ(マルチパルス)を用いることにより、復号後に
良好な音声信号を出力することができる。
音声信号をより低いビットレートで伝送する方法として
は、マルチパルス音源のピッチ毎の単周期性(ピッチ相
関)を利用したピッチ予測マルチパルス法が提案されて
いる。この方法の詳細は、例えば、特願昭58−139
022号明細書(文献2)に詳しいのでここでは説明を
省略する。
また、音声信号をさらに低いビットレートで伝送する方
法としては、音源パルスの情報とフィルタの情報を一定
時間毎ではなく、入力された音声信号を分析して得られ
る音響的特徴が持続している区間毎に区切り(以下、音
声信号を区切ったうえ分類する一連の処理をセグメンテ
ーションといい、セグメンテーションの結果得られた各
区間をセグメントと呼ぶ。)、各セグメント毎に音源を
求める方法をとることによって良好な再生音声を得る方
法をとることもできる。これらの方法については特願平
1−23255号明細書(文献3)に詳しいのでここで
は説明を省略する。
〔発明が解決しようとする課題〕
しかしながら、文献1と文献2に掲載されている従来方
法では、ビットレートが充分に高く音源パルスの数が充
分なときは音質が良好であ、ったが、ビットレートを下
げて行くと音質が低下するという問題点があった。
また、前記文献3に掲載されている方法でも、特に周期
性を利用した音源を選択した場合でかつセグメントの長
さが長くなった場合に音質が低下するという問題点があ
った。
本発明の目的は、ビットレートが高いところでも、ある
いはビットレートを下げていっても、また同じ音響的特
徴を有する区間長が長くなっても、従来よりも良好な音
声を少ない演算量で実現可能な音声符号化方式を提供す
ることにある。
〔課題を解決するための手段〕
本発明の音声符号化方式は、 離散的な音声信号を入力し、予め定められた時間長の区
間に分割したのち分析しスペクトル包絡を表すスペクト
ルパラメータと音響的特徴を表すパラメータとを抽出し
、前記音響的特徴を利用して前記音声信号を分類して予
め複数種類用意した音源モデルの中から最適なものを選
択し、前記音響的特徴が母音性を示すときは前記選択さ
れた音源モデルと前記スペクトルパラメータを用いて計
算した再生音声と前記入力音声との歪を計算することに
より前記区間長に等しいかまたは長いセグメント長を求
めて前記音声信号を分割し、前記選択された音源信号を
表す符号と前記計算されたスペクトルパラメータと前記
セグメントの時間長と前記計算された音源信号とを量子
化して出力することを特徴とする。
〔実施例〕
第1図は、本発明の音声符号化方式を実施する音声符号
化装置のブロック図である。
第2図は、母音性を示すセグメントにおける音源信号計
算回路及びセグメント長決定回路のブロック図を示す。
まず本発明による符号化方式において、母音性を示すセ
グメントにおけるセグメントの区間長(以下、セグメン
トの区間長を略してセグメント長という。)の決定方法
について第2図を用いて説明する。
信号入力端子310からは、予め定められた例えば10
m5ec、の区間長(以下、第1フレームという)の信
号が入力される。また、スペクトルパラメータ入力端子
300からは、第1フレームの入力信号から計算された
スペクトルパラメータが入力される。音響パラメータ入
力端子305からは、第1フレームの入力信号の音響的
特徴を表すパラメータが入力される。
音源選択回路306は、入力された音響的特徴を表すパ
ラメータを用いて予め複数個用意された音源モデルから
最適なモデルを選択する。音響的特徴が母音を示すとき
は、音源計算回路320は第1フレームの入力信号と選
択された音源モデルとを用いて音源信号を計算する。第
1フレームに対する処理が終了すると、2現在のセグメ
ント長を前記区間長に設定する。
バッファ330は、計算された音源信号と現在のセグメ
ント長とを蓄積し、第1フレームの入力信号をそのまま
出力する。
次に信号入力端子340からバッファ330の出力信号
の時間的に次のフレームの入力信号を入力する。信号形
成回路345は、バッファ330から出力された信号に
続けて、入力端子340からの入力信号を加えた区間長
の入力信号を作成して出力する。
音源計算回路350は、信号形成回路345からの出力
信号に対して前記選択された音源モデルを用いて音源信
号を計算する。
再生フィルタ360は、入力されたスペクトルパラメー
タと計算された音源信号とを用いて音声信号を再生する
歪計算回路370は、再生フィルタ360によって再生
された再生信号と入力信号との歪を計算する。
境界判定回路380は、計算された歪と予め定められた
判定値とを比較する。歪が判定値よりも小さい場合はセ
グメント長を更新し音源計算回路320の出力である音
源信号と更新されたフレーム長をバッファ330に蓄積
し、バッファ330は蓄積された音声信号を信号形成回
路345へ出力する。そして次のフレームの入力信号に
対する処理を行う。
一方、歪が判定値よりも大きい場合は、対象としている
入力信号の開始点に境界があると判定し、バッファ33
0に蓄積されている音源信号とセグメント長を出力端子
390に出力する。
以上示したような方法を用いることによって、文献2に
おける方法に対しても大幅に計算量を削減した上、誤差
を良好に小さく保つことが可能である。
さて第1図に戻り、入力端子500から離散的な音声信
号を入力する。時間分割回路510では、入力された音
声信号を予め定められた時間長(例えば10m5ec、
)のフレームに分割する。スペクトルパラメータ抽出回
路520では、フレームの音声信号のスペクトルを表す
スペクトルパラメータを、周知のLPG分析法によって
求める。量子化器530は、求められたスペクトルパラ
メータを量子化する。逆量子化器540は、量子化され
たスペクトルパラメータを逆量子化して出力する。
音響的特徴抽出回路550は、フレームの入力信号から
種々の音響的特徴を表すパラメータを抽出して出力する
。特徴分類回路560は、出力された音響的特徴を表す
パラメータを用いて、フレーム内の入力信号が母音性の
特徴を持っているかどうか判定する。判定に用いる音響
的特徴としては例えばフレーム内のパワまたはRMS、
ピッチゲインなど周知の方法によって求めることができ
るパラメータがある。
分類結果が母音性信号である場合は、特徴分類回路56
0はマルチパルス音源計算回路590の作動を停止し母
音部音源計算回路600を作動させる。
母音部音源計算回路600は第2図で説明したような方
法を用いてセグメントの区間長を算出するとともに、例
えば小澤氏による“種々の音源を用いる4゜8kb/s
音声符号音声式(SPMEX)” (電子情報通信学会
音声研究会資料5P89−21989年1文献4)の中
で用いられている改良ピッチ補間マルチパルス音源を音
源モデルとして用いて、求めたセグメントの音源信号を
計算して量子化して出力する。
一方、分類結果が母音性信号でない場合は、特徴分類回
路560は母音部音源計算回路600の作動を停止しマ
ルチパルス音源計算回路590を動作させる。マルチパ
ルス音源計算回路590は、特徴分類回路560が入力
信号が母音性信号でないという分類結果を出力した場合
に、例えば文献lに見られるような周知の方法で音源パ
ルスを計算する。
量子化器530の出力と、特徴分類回路560の出力と
、各音源計算回路590.600の出力である音源信号
を表す符号とセグメント長を表す符号は、マルチプレク
サ610の入力となる。マルチプレクサは、これらの入
力を効率的に多重化して出力する。
以上述べた構成は本発明の一構成に過ぎず、種々の変形
も可能である。
マルチパルスの計算方法としては、文献1に示した方法
の他に、種々の周知な方法を用いることができる。
また、スペクトルパラメータとしては、他の周知なパラ
メータ(線スペクトル対、ケプストラム。
メルケブストラム、対数断面積比等)を用いることもで
きる。
また、セグメント長を決定するための判定値は、どの場
合でも1つの数値としてもよいし、セグメント長に応じ
て算出した数値としてもよい。
また、求める歪は、例えば2乗誤差としてもよいし、こ
の他周知の距離尺度を用いてもよい。
また、分類に応じて用いる音源は、上の例に示した以外
に例えば文献4の中で用いられているように、予め複数
種類の音源モデルを用意して入力信号の音響的特徴によ
って最適な音源モデルを切り替えて用いる形とすること
もできる。例えば母音性以外の信号の音源としては破裂
、過渡性のときにマルチパルス音源、摩擦性のときに乱
数コードブック音源を用いることができる。前者につい
ては前記文献1に、後者については例えばシュレーダー
、アタル両氏による“C0DE−EXCITED LI
NEARPREDICTION (CELP) : H
IGH−QUALITY 5PEECHATVERY 
LOW BIT RATES” (ICASSP ’8
5講演番号25.1.11985) (文献5)と題し
た論文等に詳しい。
〔発明の効果〕
本発明によれば、音源信号を予め用意した複数個の音源
の中から最適なものを選択して用いて音声信号を同一の
特徴の連続している可変時間長のセグメントに分割して
音源信号を計算することにより、従来の方法に比べ少な
い伝送情報量で音声信号を良好に表すことができるとい
う大きな効果がある。
【図面の簡単な説明】
第1回は本発明による音声符号化方法を実施する音声符
号化装置の構成を示すブロック図、第2図は音源信号計
算回路及びセグメント長決定回路の一構成例を示すブロ
ック図である。 300  ・・・・初期信号入力回路 310  ・・・・スペクトルパラメータ入力端子32
0 ・・・・音源計算回路 330  ・・・・バッファ 340  ・・・・信号入力回路 345  ・・・・信号形成回路 350 ・・・・音源計算回路 360  ・・・・再生フィルタ 370 ・・・・歪計算回路 80 90 00 10 20 30 40 50 60 90 00 10 境界判定回路 出力端子 入力端子 時間分割回路 スペクトルパラメータ計算回路 量子化器 逆量子化器 音響的特徴抽出回路 特徴分類回路 マルチパルス計算回路 母音音源計算回路 マルチプレクサ

Claims (1)

    【特許請求の範囲】
  1. (1)離散的な音声信号を入力し、予め定められた時間
    長の区間に分割したのち分析しスペクトル包絡を表すス
    ペクトルパラメータと音響的特徴を表すパラメータとを
    抽出し、前記音響的特徴を利用して前記音声信号を分類
    して予め複数種類用意した音源モデルの中から最適なも
    のを選択し、前記音響的特徴が母音性を示すときは前記
    選択された音源モデルと前記スペクトルパラメータを用
    いて計算した再生音声と前記入力音声との歪を計算する
    ことにより前記区間長に等しいかまたは長いセグメント
    長を求めて前記音声信号を分割し、前記選択された音源
    信号を表す符号と前記計算されたスペクトルパラメータ
    と前記セグメントの時間長と前記計算された音源信号と
    を量子化して出力することを特徴とする音声符号化方式
JP1294855A 1989-11-15 1989-11-15 音声符号化方式 Pending JPH03156498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1294855A JPH03156498A (ja) 1989-11-15 1989-11-15 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1294855A JPH03156498A (ja) 1989-11-15 1989-11-15 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH03156498A true JPH03156498A (ja) 1991-07-04

Family

ID=17813127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1294855A Pending JPH03156498A (ja) 1989-11-15 1989-11-15 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH03156498A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130796B2 (en) 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130796B2 (en) 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected

Similar Documents

Publication Publication Date Title
JP3196595B2 (ja) 音声符号化装置
EP2991075A2 (en) Speech coding method, speech decoding method, speech coding apparatus and speech decoding apparatus
JP2903533B2 (ja) 音声符号化方式
US6917914B2 (en) Voice over bandwidth constrained lines with mixed excitation linear prediction transcoding
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
JP3248215B2 (ja) 音声符号化装置
JPH10177398A (ja) 音声符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JPH03156498A (ja) 音声符号化方式
JP3019342B2 (ja) 音声符号化方式
JP3153075B2 (ja) 音声符号化装置
JP2596143B2 (ja) 音声符号化方法
EP1688918A1 (en) Speech decoding
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3515216B2 (ja) 音声符号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3515215B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP2508002B2 (ja) 音声符号化方法とその装置