JPS621000A - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPS621000A
JPS621000A JP61063329A JP6332986A JPS621000A JP S621000 A JPS621000 A JP S621000A JP 61063329 A JP61063329 A JP 61063329A JP 6332986 A JP6332986 A JP 6332986A JP S621000 A JPS621000 A JP S621000A
Authority
JP
Japan
Prior art keywords
frame
analysis
representative
frames
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61063329A
Other languages
English (en)
Other versions
JPH0754438B2 (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPS621000A publication Critical patent/JPS621000A/ja
Publication of JPH0754438B2 publication Critical patent/JPH0754438B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は入力音声信号を分析して特徴パラメータを抽出
する場合における区分的最適関数近似方法に特徴を有す
る音声処理装置に関する。
〔従来の技術〕
入力音声信号を分析してその特徴パラメータを抽出し、
スペクトル包格データと音源データとからなる特徴パラ
メータを伝送路を介して合成側から合成側に送出し、合
成側ではこれら特徴パラメータにもとづいて入力音声信
号を再生する音声分析合成方式とその装置はよく知られ
ている。
このような音声分析合成方法とその装置において、入力
音声に関する分析情報のうちの特徴パラメータを分析フ
レーム単位で分析側から合成側に送出する代9に、それ
ぞれ相連続する複数個の分析周期からなる区分を矩形関
数等の階段状関数によって入力音声と最適近似せしめた
うえこれら各区分の分析フレーム数と代表特徴パラメー
タとを音源情報とともに分析側から合成側に供給するこ
とによって伝送データ量の圧縮を図る手法は可変長フレ
ームボコーダ等の応用によっても近時よく知られつつあ
る。
可変長フレームとして設定される区分は、入力音声を矩
形近似等を介して入力音声を最適近似せしめて得られる
ものでアシ、演算量の点から効率的はDPが多用される
このDPによる各区分ごとの代表分析フレームの選択は
、各区分ごとに設定される最大数M個の代表分析フレー
ム数(1<M<K、ただしKは各区分の分析フレーム総
数)を残留歪を評価尺度としてこれを最小とする組合せ
の内容を決定するものである。残留歪は近似関数と入力
音声信号とによって示される特徴パラメータの空間ベク
トル距離によって示されこれが小さい程近低度が高いも
のとなる。
〔発明が解決しようとする問題点〕
しかしながら上述したDPを利用する従来の区分的最適
近似関数近似には次に述べるような欠点がある。
すなわち、相連続する区分に対し前区分で選択された最
終分析フレームと現区分で選択される先行代表分析フレ
ームはそれぞれの区分を対象とするDP千手法個別に決
足され基本的には連続性を保持しないことが多い。つま
り前区分の最終選択代表フレームとは無関係に現フレー
ムの第1番目の代表分析フレームが選択されてこのため
隣接区分間の代表フレームの不連続による近似性の低下
が避けられないことが多いという欠点がある。
本発明の目的も上述した欠点を除去し1区分間の連続性
を大幅に改善した処理効率のよい区分的最適関数近似方
法を有する音声処理装置を提供することにある。
〔問題点を解決するための手段〕
本発明による音声処理装置は、予め設定した一定の分析
フレームごとに入力音声信号を分析して特徴パラメータ
を抽出したうえ予め設定した複数個の連続する前記分析
フレームからなる区分ごとの前記特徴パラメータから任
意の数の代表特徴パラメータを選択して前記各区分を区
分的最適関数によって近似する区分的最適関数近似方法
とその装置において、前区分の最終選択フレームによっ
て第1番目の代表フレームより時間的に先行して存在す
る現区分の先行フレームが代替されることを許容するD
Pにもとづいて前記各区分を最適近似せしめる区分的最
適関数近似手段を備えて構成される。
〔実施例〕
次に図面を参照して本発明の詳細な説明する。
第1図は本発明による音声処理装置における区分的最適
関数近似方法の一実施例の構成を示すブロック図である
第1図に示す実施例の構成は区分的最適関数近似器1と
して示し、また音源情報分析器100も併記して示して
いる。区分的最適関数近似器1はLSP分析器11.パ
ラメータメモリ12 、 DPプロセッサ13および前
区分選択パラメータメモリ14等を備えて構成される。
LAF分析器11は入力音声を受けると、予め定めた分
析フレームごとにこれをL P C(LinearPr
ediction Coefficient、線形予測
係数)分析してLPC係数を抽出したあとこれら分析7
レームごとのLPC係数から公知の技術、たとえば二ニ
ートン(Newton)の反復法を利用する高次方程式
を解く手法などを利用して予め設定する次数のL 8 
P (Line Spectrum Pa1rs、線ス
ペクトル対)係数列を求めこれら特徴パラメータをパラ
メータメモリ12に供給する。
L)P、!’ロセッサ13はこうしてパラメータメモリ
12に供給された分析フレームごとのパラメータに対し
自薦プログラムの制御のもとに区分的最適関数近似をD
P千手法利用して実施する。DPグロセッt13はこの
処理において、パラメータメモリ12から常時前区分で
の最終選択フレームを読出して前区分選択パラメータメ
モリ14に格納せしめ、前区分の最終選択フレームのL
AF係数を含むLSF係数列を対象として区分的最適関
数近似を実行する。このようにして前区分の最終選択フ
レームによって現区分の先行選択フレームが代替される
ことを許容するDP処理を実施することにより現区分の
特徴パラメータのみを対象とするDP処理に比して残留
歪を大幅に減少した近似結果を得ている。
このようにして得られた選択特徴パラメータデータは音
源情報分析器100によって抽出された音源情報データ
とともに伝送路を介して合成側に送出される。
音源情報分析器100は入力音声の音源情報としての音
源の強さ、有声/無声/無音の別ならびにピッチ周期に
関するデータを公知の手段で分析2レーAごとに抽出し
出力する。
次に本発明の最も重要な部分であるDPプロセッサ13
の動作を図を用いて説明する。餓2図紘特徴パラメータ
ベクトル分析周期を10=sec。
区分長を200m5ec(従って一区分内に20ケの特
徴パラメータベクトルが含まれる)1代表特徴パラメー
タベクトル数を5とした場合のDP−jロセッサ13の
説明図である。DPプロセッサ13は5ケの代表パラメ
ータベクトルを選択し、且つ代表パラメータベクトルが
代表する区間を決定するものであシ、その動作は以下の
通りである。
第2図に於いて■は前区分の最終代表分析フレーム■〜
@は現区分の分析フレーム番号である。
さて、第1代表分析フレーム候補としては区分中の時間
的先行順で分析7レーム■〜[相]のうちいずれかが対
象となる。同様にして第5フレーム候補となるのが分析
フレーム■〜[相]である。
また第1代表分析フレーム候補に引続いて第2代表分析
フレーム候補とな9うる分析フレームは、分析フレーム
■もしくは[相]が代表分析フレームとして指定される
ことを条件に入れると分析フレーム■〜@のうちのいず
れかが対象となり、全く同様にして第4フレーム候補は
分析フレーム■〜■のうちのいずれかが対象となシ、ま
た第3フレーム候補としては分析フレーム■〜[相]の
うちいずれかが対象となることも自明の内容である。
さて、第2図において、いま仮に分析フレーム■が第1
フレームとして選択された場合を考えてみる。これに対
して第2フレームとなりうる可能性のある分析フレーム
は■〜@である。これら第1および第2フレーム候補の
組合せを例とし発生する歪を考えてみると次のようにな
る。
分析フレーム代着によるスペクトル歪すなわち時間歪は
1代表分析2v−ムと代替される分析7レームとのスペ
クトル距離によって表わすことができ次の(1)式によ
って示される。
(1)式においてi、jはスペクトル距離Dijの計測
を行なう2つの分析フレームのフレーム番号であムi、
jの特徴パラメータベクトル要素である。
(1)式で示されるDijはフレーム相互間のスペクト
ル距離であるとともに観点を変えると分析フレームjを
iでで代替する場合に発生するスペクトル歪、すなわち
時間歪である。
さて1分析フレーム■と■とがそれぞれ第1および第2
代表分析フレームとなったような場合はフレーム代替に
よる時間歪は発生しない。
次に、第2代表分析フレームとして分析7レーム■が選
択された場合を考えてみると次の(2)式に示すD3が
分析フレーム■〜■を、第2代表分析フレームを■とし
、この■を含む現区文2ヶの代表フレームと前区分最終
選択フレーム■とにより代表した場合の最小の総長とし
て定義される。
(り (2)式においてD3は第2代表分析フレーム候補とし
て分析フレーム(3)を選択したときに発生する総長で
あり、またり、およびD富 鉱それぞれ第1代表分析フ
レームとして分析フレーム(1)tたは(2)を選択し
たときのそれぞれの総長を表わす。
上述した第1代表分析フレーム候補における総長は下記
(3)式により求められる。
(3)式においてD1〜I)ts  はそれぞれ分析フ
レーム■、■〜■、■〜■、・・・・・・、■〜[相]
を第1代表分析フレームを各々■、■、■、・・・・・
・、@とした場合に、第1代表分析フレームと、前区分
最終選択フレーム■とで代表したことにより発生する総
歪、DX、2〜D116 は次の(4)〜(5)式で定
義される時間歪の和を示す0 (4) 、 (53式においてdL、□ は分析フレー
ム■と0間の時間歪11dL、i  は分析7レーム■
と0間の時間歪である。
再び(2)式の説明に戻る。(2)式に於いてDl、3
はフレーム■〜■を代表フレーム■と■とを用いて最適
に近似した場合の歪を表わし下記(11)式で示される
又5D1slはフレーム■、■間に代替すべき7レーム
が存在しないためDg、s:Qとなる。
さて1次に第2代表分析フレームとして分析フレーム■
が選ばれる場合の最小の総歪D4について考えてみる。
この場合は第1代表分析フレームとして存在しうる可能
性があるのは分析フレーム■のほかに■(7)式におい
てDI e4  e n、 e4  ならびにD l 
m 4はそれぞれ時間歪を表わし、たとえばD 1 z
 4は次の式で示される。
(8)式においてdhlおよびdl、3 は分析フレー
ム■と■との間に介在する分析フレーム■と■とがそれ
ぞれ分析フレーム■によって代表されるときに発生する
時間歪、d41寓およびd4,3は分析フレーム■と■
との間に介在する分析フレーム■と■とがそれぞれ分析
フレーム■によって代表されるときに発生する時間歪で
ある。
前述した(7)式の意味することは、第2代表分析フレ
ームとして■を選択した場合、これによって最小の諾否
を与える第1代表分析7レームならびに、これら第1お
よび第2代表分析フレームによって代表される分析フレ
ームの組合せが決定されるということである。このよう
にして第1から第5までの各代表分析フレーム候補を対
象として次次に同様な手順で(2)式や(7)式に示す
ような諾否を第5代表分析7レーム候補まで求めていく
。このような諾否は入力音声信号のスペクトル包絡パラ
メータとの近似処理差いわゆる残留歪を最小とする近似
関数を設定する尺匿となるものである。
こうしてたとえば分析フレーム■を第2代表分析フレー
ムとする場合は第1代表分析フレームとしては歩行の分
析フレーム■〜■が、また分析フレーム■が第2代表分
析フレームとなる場合は先行の分析フレーム■〜■がそ
れぞれ第1代表分析フレームとなシうる設定で諾否を計
算しつつ第5代表分析フレーム候補に及び、この第5代
表分析フレーム候補の分析フレーム■−[相]にはさら
に次の演算を実施する。
(9)式によって示されるり、は第5代表分析7レーム
として分析フレーム■から@までのいずれかが選択され
たとき、これによって代表される他の分析フレームによ
る諾否の影響を最小とするもの+19      +5
1 を選択することを示し、D5〜D20はそれぞれ第5代
表分析フレームとして分析フレーム■〜[相]のいずれ
かが選択されたときそれら分析フレームに発生する諾否
であシ、また、Σ ds、iは分析フ1=6 レーム■と分析フレーム■から@までのそれぞれとの時
間歪の総和を、4 66m”  は分析7レーム■と分
析フレーム■から[相]までのそれぞれとの時間歪の総
和を、またd   は分析フレーム[相]。
19.20 0間の時間歪を示す。
(9)式によって決定されるDJ  が区分ごとに決定
したとき、直ちに第1から第5代表分析フレーム候補の
組合せのり侑認否の最小なりPパスを決定する5個の代
表分析2レームとこれら代表分析フレームにより七代表
される分析フレームが決定され、こうして区分的最適関
数近似による可変長フレーム化が容易に実施される。
次にDP70セッサ13を図面を用いて詳細に説明する
。第7図はDPプロセッサ13の構成を示すブロック図
であり、パラメータメモリ12と前区分選択パラメータ
メモリ14とを併記しである。第8図に示すDPプロセ
ッサ13は時間歪算出器131と制御演算器133とで
構成されている。制御演算器は例えば!イクロプロセッ
サをペースにした計算システムでありRAMvi−内蔵
している。この内蔵RAMを説明の都合上、エリア表現
する事とする。これらのエリアはFORTRNグログラ
ムで次のように表現されるものである。
DIMEN8ION   ALsX@、nLsp(2o
、N)、■Dp(5,20,2)。
−QDP(5,20)、DMABI(2*N)。
Ql(20)、QB(20) さて、前区分選択パラメータメモリ14に記憶されてい
るフレーム■ON次LSFパラメータがアトシスライン
142より供給されるアドレス信号に対応して、入出力
ライ/141を介し、制御      l演算器133
へ供給される。制御演算器133はこのデータをエリア
人L8F  へ記憶する。次にパラメータメモリ12に
記憶されているフレーム■〜[相]のN次LSFパラメ
ータがアドレスライン122より供給されるアドレス信
号に対応して、出力ライン121を介し、制御演算器1
33へ供給される。制御演算器133はこのデータをエ
リアBL8Pへ記憶する。
最初に制御演算器133は(3)式に示すD1〜I)t
sを算出し、対応するパスを決定する。Ds  d″0
”であるなめ、縮歪を記憶するためのエリアQDP(1
,1)t”0”とする。又、7レーム■に代替すtl、
;byフレーム存在しないため、DPバxを記憶するエ
リア(1,1,1)=0  ■が代替するフレームの範
囲を示すエリア(1,1,2)=1が書込まれる。内■
を示すDPパスをここでは′″0”で表現している。
先ずdL l が次のように算出される。エリアDMA
B1の番地(1)〜(へ)にALi9Fの番地(1)〜
(へ)のデータが、DMAB1番地(N+1)〜(2*
N)にBLIP  の番地(1,1)〜(1,N)のデ
ータが転送される。制御演算器133はDMABIのデ
ータを番地(2*N)より順々に(1)まで連続的に出
力ライ/134を介して時間歪算出器131へ出力する
。制御演算器133は又、このデータに同期したパルス
、2*N個分をクロックライン135を介して時間歪算
出器131へ出力する。
第8図は時間歪算出器131を詳細に説明するためのブ
ロック図である。第8図に於いて時間歪算出器131は
レジスタ1311−1〜N、1312−1〜N1減算f
i1313−1〜N 、掛算器1314−1〜N、Jl
算器1315−1〜N1およびアキエムレータ1316
を有して構成される。レジスタ1311および1312
は例えば16bit  のレジスタであシ、クロックラ
イン135t−介して供給されるパルスに同期してデー
タを記憶する。出力ライン134を介して供給されたデ
ータは、前述の2*N個分のパルスによ91次々と記憶
され、最終的にはレジスタ1311−1にDMAB 1
(1) 、レジスタ1311−NK DMABI(tl
)、レジスタ1312−IICIMABI(N+1)、
レジスタ1312−NK DMABI(2*N)の内容
が記憶される。即ち、レジスタ1311−1−Nにフレ
ーム■の、レジスタ1312−1〜Nにフレーム■のN
次LSFデータが記憶される。減算器1313−1はレ
ジスタ1311−1  に記憶されているフレーム■の
パラメータP1 と、レジスタ1312−1 に記憶さ
れているフレーム■のパラメータP1との差を算出し掛
算器1314−1に出力する。掛算器1314−1はこ
の差の二乗を算出し、掛算器1315−1 の一つの入
力端子へ出力する。
掛算器1315−1 の他の入力端子には秤数としてス
ペクトル感度W1が印加されている。従って掛算器13
15−1の出力はWl (PI −Ps  )  とな
る◎同様に1315−Hの出力はW (P“−P“))
2  NN となる。その結果アキエムレータ1316の出力は前記
(1)式に示す時間歪をフレーム■、■間で算出した時
間歪d1□となる。時間歪算出器131は算出したdL
工を入力ライン136へ出力する。
再び第7図を用いて説明する。制御演算器133は入力
ライン136を介して供給されたd  をり、1 エリアQ1の番地(1)に記憶する。
次にazet  がd    と同様に次のように算出
される。エリアDMABIの番地(1)〜(へ)に5L
SPの番地(2,1)〜(2,N)のデータが、DMA
BIの番地(N+1)〜(2*N)にBLSFの番地(
1,1)〜(1,N)のデータが転送される。制御演算
器133はDMAEIのデータを時間歪算出器131へ
出力する。時間歪算出器133はd31を算出し制御演
算器133へ出力する。制御演算器133はd8,1を
−CIJ7Q1O番地(20)K書込む。尚、この番地
(20)はイメージ上の番地(0)に相等する。
制御演算器133は更に見1(1)のデータと91(2
0)のデータとを比較し、小さいデータt−DL、! 
s即ちD茸 とし、このB2  をエリアQDP(1,
2)に記憶する。熱論DL、2決定と同時に最小のもの
がdL、1か d29、かが44J明している。この結
果に基づいてエリアIDP(1,2,1)〜(1e 2
 s 2 )に次のデータが書込まれる。IDP(1,
2,1)はDPパスとして■に対応する′0”を書込ま
れる。
IDP(1,2,2)  は代表フレーム■に代替され
るフレームの範囲をフレームの番号で表現したもの、こ
の場合は@1”又は12”が書込まれる。
次に制御演算器133はDs(”D    )をり、3 算出する。まずフレーム■にクレーム■、■が代替され
る場合の歪、Σ dLiが次の手順で算出さ凰=19 れる@dL 1が前述の手順で算出されエリアQ1(2
)に記憶される。次にdL  2が dL 1と同様に
算出される。制御演算器133はこのdL、1とQ 1
(2)の内容の和、即ち、Σdh、iを求め、これをエ
リアQ i (2)に再び記憶する。
次にdL、1+d3,2  が次のように算出される。
dl、1が算出され、エリアQ 1 (1)に書込まれ
る。
更にd31.が前述のd3,1と同様の手順で求められ
る。制御演算器133はこのdlyeとQ 1(1)の
内容の和、即ちdL、1+d3,2を求め、これをエリ
アQ 1 (1)に再び記憶する。
が算出されQ 1 (20)の内容と加算され、再びQ
l(20)に書込まれる。
制御演算器133はQ 1 (1) 、 Q 1 (2
) 、 Q 1 (20)の内容のうち蝦小のものを検
索し、この結果を馬、3、即ちDlとし、このDsをエ
リアQDP (1,3’)に、対応するDPパスをエリ
アIDP(1,3,1)〜(1゜3.2 )に書込む。
熱論IDP (1,3,1)はDPババスして■に対応
する@O”が書込まれる。
I DP (1,3,2)には代表フレーム■に代替さ
れるフレームの範囲がフレーム番号の形式で書込まれる
。この場合は′1” @ 2 tJ、又は′″3、′の
いずれかが書込まれる事となる。
(υ 〜DI@(=DL  □6)を算出し、諾否をQDP(
114)〜(1,16)へDPパスデータをIDP(1
*4tμ)〜(1,16,μ)、(μ=1.・・・、2
)に瞥込む。
以上が第1代表分析フレーム候補に関するL)Pプロセ
ッサ13の処理の詳細である。
引続いてDPプロセッサ13は第2代表分析フレーム候
補に関する処理を実施する。前述のように第2代表分析
7レーム候補は■〜@が対象となる。
最初にフレーム■に関する処理が行なわれる。
■を第2代表分析フレーム候補とした場合、パスの対象
となる第1代表分析7レーム候補は■のみである。又、
フレーム■、■間には被代替フレームは存在しない。従
ってDl ex ” Oである。又、前述のようにD:
1′=Oであり p鵞” D I ” D l s 2
であるためり、=Oとなる。制御演算器133は諾否′
″θ″をQDP(2,2)に書込む。更に制御演算器1
33はDPパスデータとしてIDP(2,2,1)に@
1″を(2,2,2)に12”を書込む0次にフレーム
■に関する処理が行なわれる。■を第2代表分析フレー
ム候補とした場合、パスの対象となる第1代表分析フレ
ーム候補は■および■である。まずフレームΦ、■を代
表フレームと 。
して、フレーム■をどちらかの代表フレーム、もしくは
これらの補間データで代替した場合の時間歪D1.3が
DL 2と同様の方法で算出され、エリアQ B (1
)に書込まれる。次にパスの対象をフレーム■とし元場
合の時間歪1)意esをQ B (2)に書込む。熱論
5Dlssは0”である。更に制御演算器133はQ 
B (1)の内容にQDP(1,1)の内容を加算し、
これを再びQB(1)に書込む。同様にQB(2)の内
容にQ D p (1e 2 )の内容を加算し、これ
を再びQ B (2)に書込む。更に制御演算器133
はQ B (1)とQB(2)の内容の大小を比較し、
小さいものを選択し、これをDlへしてQDP (2,
3)を書込み、対応するDPパス情報をI DP (2
,3,1)−、、(2,3,2)に書込む。なお、上記
のDlを算出する処理は前記(2)式を実行したもので
るる。
次にフレーム■に関する処理が、パスの対象をフレーム
■〜■として実施される。上記と同様の手順でD 1 
e4 s o、 s4 m DI e4がQB(1)、
QB(2)、QB(3)に書込まれる。次にQB(五)
(i−4,2,3)の内容とQDP(1,1)(i=t
、z、a)の内容とQDP(1、i ) (i=x 、
 2 、 s)  の内容の加算結果が再びQB(i)
(i=x 、 z 、 s )に書込まれる。QB(i
l(i=1.・・−・・3)の最小値が検索され、これ
t”DiとしてQDP(2,4)に書込み、対応するD
Pパス情報をI DP (2,4,1)〜(2,4,2
)に書込む。
なお、上記D4に関する処理は前記(7)式を実行した
ものである。
以下、同様にり、−Dl丁が算出されQDP(2゜5)
〜(2,17)  に書込まれる。無論DPパス情報も
IDPの対応する番地に書込まれる。
引続きDPプロセッサ13は第3代表フレーム候補に関
する処理をフレーム■〜[相]を対象として。
第4代表フレーム候補に関する処理をフレーム■〜■を
対象として、第5代表フレーム候補に関する処理をフレ
ーム■〜@を対象として実施する。
最後にDPプロセッサ13は前記(9)式に示す処理を
以下の手順で実施する。制御演算器133はdie@を
算出し、この結果とQDP (5,s )の内容を加算
し、加算結果f7I:QDP (5,5)へ再3込む。
次にcistyを算出し、同様にQ D P(5,5)
の内容と加算し、結果t−QDP (5,5)へ書込む
以下、久々とd 8*I  edll*@  I・・・
・・・dIs’・をQDP(5,5)にアキエムレート
する。このアキd   ・を算出する。更に制御演算器
133は19.20 QDP(5,5)〜QDP(5,20)の内容の最小値
即ち(14)式に示すDJを求め、第5代表フレームを
決定する。第5代表フレームが決定されるとIDPに記
憶されているDPパスデータから、第4〜第1代表フレ
ームが同時に決定され、更に第1第5代表フレームが奥
接他のフレームを代替する区間、及び代表フレームの補
間データが他のフレームをを代替する区間が決定される
。これらの区間情報はリピートビットとして符号化器2
01へ出力される。又、第1〜第5代表フレームのパラ
メータはBLSP  よシ符号化器201へ出力される
0更に第5代表フレームのパラメータは次の区分の■と
して前区分選択イくラメータメモリ14へ出力される。
本実施例においてはLAP分析器11によるLSF係数
列抽出の際の前処理として、入力音声データの高域強調
を行なうために波形の一次差分を利用してプリエン7フ
シス処理を実施′し・さらに自己相関係数領域における
Lag関数によるLagワインドワ処理を実施してLS
F係数間の最小周波数間隔を広けLSF量子化感度の低
減を図って合成側のディジタルフィルタの安定度を増大
させる処理を行なっている。さらに本実施例ではLSP
係数は10次の次数とし、かくして得られた分析フレー
ムごとのLSF係数に対しDPプロセッサ13は前述の
DP処理を行なう。DPプロセッサ13は制御演算器1
33に内蔵されたプ・四グラムの制御のもとに前区分の
最終選択フレームにより現区分の選択フレームが代替さ
れることを許容するDP処理が行なわれる。なお、第1
図におけるDP処理は矩形関数による近似を実施してい
るがこれを固定傾斜区間型台形関数による近似としても
よい。
第3図は第1図に示す区分的最適関数近似方法を利用し
た可変長フレーム型ボコーダの一実施の構成を示すブロ
ック図である。
第3図に示す可変長フレーム圧縮ダは可変長フレームボ
コダ分析側2および可変長フレームボコーダ合成側3を
備えて構成される。さらに可変長フレームボコーダ分析
側2は区分的最適関数近似器1.音源情報分析器100
.符号化器201゜202およびマルチプレクサ203
を備えて構成され、また可変長7レ一ムボコーダ合成側
3はデマルチプレクサ301.ピッチパルス発生器30
2゜雑音発生器303.切替器304.可変増幅器30
5、補間器306.LSP合成フィルタ307゜D/A
コンバータ308およびL P F (Low Pa5
spilter) 309 f、備えて構成される。
分析器の区分的最適関数近似器1と音源情報分析器10
0はそれぞれ選択特徴パラメータデータと音源情報デー
タとを出力し符号化器201゜202によって符号化を
受けたのちマルチプレクサ203に供給され所定の形式
の多重化処理を行なって伝送ライノ2001を介して合
成側に送出される。
本実施例において区分的最適関数近似器1は区分的最適
関数近似を行なってフレーム圧縮、を図ったLAP係数
を選択特徴パラメータとして出力する。すなわち予め設
定した分析フレーム数を単位とする区分ごとに予め設定
した最大数以下の数の代表フレームとこれら代表フレー
ムにたって表現されるフレーム数に関する情報を出力し
また音源情報分析器100は音源の強さ、有声/無声/
無音の別、ピッチ周期に関するデータを出力する。
さて1合成側ではデマルチプレクサ301によって多重
化分離を行ないさらに復号化したデータのうち選択特徴
パラメータデータは補間器306に、音源情報データの
うちピッチ周期データはビッチパルス発生器302に、
有声/無声/無晋判別データは切替器304に、また音
源強度データは可変利得増幅器305にそれぞれ供給さ
れる。
補間器306は区分ごとに選択された代表フレームによ
るLSP係数列ならびにこの代表フレームによって指定
される分析フレームに関する情報にもとづいて区分ごと
の全分析フレームに関する −LSF係数を補間、再生
しこれ’1L8F合成フィルタ307に供給しそのフィ
ルタ係数として利用せしめる。
一方、切替器304は、入力した有声/無声/無音判別
データが有声を指定するときはピッチパルス発生器30
2の出力を、また無声もしくは無音を指定するときは雑
音発生器303の出力を可変利得増幅器305に供給せ
しめるように切替える。従っ1 有声のときはピッチ周
期に対厄した繰返し周波数のピッチパルスが、また無声
もしくは無音のときは雑音発生器3.03の発生する白
色雑音がそれぞれ可変利得増幅器305に供給される。
可変利得増幅器305は音源強度データに対応した利得
設定を行なってピッチパルスもしくは白色雑音を増幅し
たうえこれらを駆動音源としてLAF合成フィルタ30
7に供給し、かくしてL8F合成フィルタ307はディ
ジタル量の入力音声を再生し、このあとD / A 3
 yメータ308.LPF’309を介してアナログ量
の音声として出力されるO このようにして第1図に示す区分的最適関数近似方法を
用いた可変長フレーム型ボコーダが奥深できる。
第4図は第1図に示す区分的最適関数近似方法を利用し
、かつ分析データを蓄積しつつ入力音声を合成する音声
合成器の一実施例の構成を示すブロック図である。
第4図に示す音声合成器4はメモリ310を除く他の構
成要素はすべて第3図に示す可変長フレームボコーダ合
成側3の同一記号のものと同一であるのでこれらに関す
る詳細な説明は省略する。
音声合成器4のメモリ310には予め設定した各種音声
資料に対して本発明による区分的最適関数近似を°施し
て得られた特徴パラメータと音源情報に関する符号化デ
ータが蓄積されておシ、制御ライン4001を介して受
ける読出しコマンド信号を入力するごとにこの読出しコ
マンド信号によって指定された内容の音声資料に関する
特徴パラメータ情報と音源情報とを、デマルチプレクサ
301に出力する。
デマルチプレクサ301はこうして供給された入力をデ
コードし、特徴パラメータデータは補間器306に、ま
た音源情報のうちピッチ周期データはピッチパルス発生
器302に、有声/無声/無音判別データは切替器30
4に、音源強直データは可変利得増幅器30゛5にそれ
ぞれ供給される。
切替器304は、入力する有声/無声/無音判別データ
が有声を指定するときピッチパルス発生器302の出力
を、また無声/無音を指定するときは雑音発生器303
の出力を可変利得増幅器305に供給するように切替る
LSF合成フィルム307は可変利得増幅器305の出
力を受けるとこれを駆動音源とし、また補間器306か
ら受ける特徴パラメータをフィルタ係数として動作し入
力音声信号を再生する。このディジタル再生信号はD/
Aコンバータ308 、LPF309 を介して所望の
アナログ量に変換され出力      1される。
第4図に示す実施例において、メモリ310に蓄積され
る分析データは分析側において第1図に示す区分的最適
関数近似手段にもとづいて抽出された特徴パラメータを
利用するものであシ、本実施例においてはLAP係数列
を特徴パラメータとして利用している。
第5図は第1図に示す区分的最適関数近似方法を利用し
て抽出した入力音声の特徴パラメータを用いる波形符号
化装置の一実施例の構成を示すブロック図である。
第5図に示す波形符号化装置5は区分的最適関数近似器
1.ノイズ重み付は器501.符号化復号化器502.
補間器503.相関係数算出器504゜自己相関係数算
出器505.マルチパルス検索器506、符号化器50
7およびマルチプレクサ508を備えて構成され、これ
ら構成要素のうち区分的最適関数近似器1とマルチグレ
クt508以外の部分が区分的最適関数近似器1によっ
て抽出された特徴パラメータを利用して入力音声の波形
符号化を図る部分であり、本実施例ではこれらの構成要
素によって音源波形としてのマルチパルスを公知の相関
領域評価手法を利用して求めている。
入力音声は区分的最適関数近似器1とノイズ重み付は器
501とに供給される。
ノイズ重み付は器501は区分的最適関数近似器1によ
って抽出される特徴パラメータの次数や音声資料等にも
とづいて決定した伝達関数のノイズフィルタを有し区分
的最適関数近似器1の出力との畳み込み乗算を実施する
区分的最適関数近似器1は所定の次数のLPG係数を区
分的最適関数近似方法によって抽出しこの特徴パラメー
タをノイズ重み付は器501に供給する。この特徴パラ
メータはまた符号化復号化器502にも供給されて符号
化されマルチプレクサ508に特徴パラメータデータ太
して供給される符号化された特徴パラメータはふれれび
復号化され危あと補間器503に供給される。
補間器503は区分的最適関数近似器1から符号化復号
化器502を介して供給される特徴パラメータが区分ご
とに選択された代表分析フレームとこの代表分析フレー
ムによって指定される分析フレームの情報とを利用し特
徴パラメータを代表分析フレーム間で補間処理し分析フ
レームごとに再生したあと声道フィルタのイ/パルスポ
/スを求めこれを相互相関係算出器505と自己相関係
数算出器505とに供給する。
相互相関係数算出器504はこうして供給される声道フ
ィルタのインパルスレスポンスとノイズ重み付は後の入
力音声データとの畳み込み積分を行なって両者の相互相
関をとり得られた相互相関係数をマルチパルス検索器5
04に供給する。
自己相関係数算出器505は補間器503から声道フィ
ルタのインパルスレスポンスに関するデータを受けると
この自己相関係数を計算しこれをマルチパルス検索器5
06に供給する。
マルチパルス検索器506はこうして入力した相互相関
係数と自己相関係数とを利用し公知の相関領域評価にも
とづく手法によってマルチパルス列を検索しこれを符号
化器507によって符号化したうえこれを音源データと
してマルチプレクサ508に供給する。この音源データ
は音源波形情報そのものといってよく、このようにして
特徴パラメータを利用する波形符号化装置が実現できる
なお、この場合符号化すべき波形情報は特徴パラメータ
から得られたマルチパルスを利用しているが他の波形情
報抽出手段、たとえば合成フィルタとは周波数応答特性
が逆なLPG逆フィルタを備え区分的最適関数近似器1
からLPCパラメータの供給を受けつつこれと入力音声
信号とによって残差信号を発生しこの波形情報を符号化
するなどの手段によっても同様に波形符号化できること
は明らかである。
第6図は第1図に示す区分的最適関数近似方法を利用し
た圧縮DP型単語音声認識味装の一実施例の構成を示す
ブロック図である。
第6図に示す圧縮DP型単語音声認識装置6は区分的最
大関数近似器lのほか切替器601.標準バタンメモリ
602.バタンマツチング器603および最小距離検索
器604を備えて構成される。
第6図に示す圧縮DP型単語音声認識装置6は特定話者
の発する単語音声に関する特徴パラメータを標準バタン
として予めストアしてお@i’れと入力する単語音声の
特徴パラメータのバタンマツチングを実施して人力単語
音声を認識するものでありその基本動作は次のようであ
る。
すなわち、区分的最大関数近似器1は第1図によって示
した如く入力音声信号の分析フレームごとにLPC係数
を所定の次数で抽出したあと公知の手法でLSFパラメ
ータに変換し、このめとI)P手法によってフレーム圧
縮を予め設定する区分単位で実施する。こうして区分ご
とに予め設定した最大数を越えない代表2レームと、こ
の代表フレ□−ムによって指定される分析フレームの最
適組合せが選択され、このようにして得られた可変長フ
レームが先ず切替器601の登録時の接続によっテ標準
バタンメモリ602にストアされる。
次に切替器601が認識側に切替られ特定話者が標準バ
タンメモIJ 602に内蔵されている単語音声を発す
ると登録時と全く同じ処理を受けてバタンマツチング器
603にLSFパラメータが供給される。
バタンマツチング器603はスペクトル距離計測器や補
間器等を備え、区分的最大関数近似器1によって圧縮処
理された両人力の区分ごとの代表分析フレーム間に補間
値を設定しつつスペクトル距離計測器で両人力の特徴パ
ラメータバタンのスペクトル距離を予め設定する範囲の
対応点間で求めこれを全標準バタンについて実施したあ
と次に最小距離検索器604に標準バタン指定番号とと
もに供給する。
最小距離検索器604はスペクトル距離が最小の標準バ
タンを選定しその指定番号を認識結果として出力、かく
して圧縮DP型単語音声認識処理が区分的最小関数近似
方法を利用して実現できる。
なお第6図に於いて登録時、認識時共に区分的最適関数
近似器を用いて標準バタン、被認識ノ(タン共にフレー
ム圧縮を実施しているが、これは登録時のみフレーム圧
縮を実施する構成に容易に変更し得る。
上述した第3〜第6図はいずれも第1図によって説明し
た区分的最適関数近似方法を利用する装置でありこれに
よって処理量に比し再生品質の優れた効率のいい近似手
段を実現することてできる。
〔発明の効果〕
以上説明した如く本発明によれば、区分的最適関数近似
方法とその装置において、前区分の最終選択フレームに
より現区分の選択フレームが代替されることを許容する
動的計画法を用いた区分的最適関数近似を実施する手段
を備えることによって近似度対処理量の著しい効果化が
図れる。
【図面の簡単な説明】
第1図は本発明による音声処理装置の区分別量を詳細に
説明するための説明図、第3図は第1図に示す区分的最
適関数近似方法を利用した可変長フレーム型ボコーダの
一実施例の構成を示すブロック図、第4図は第1図に示
す区分的最適関数近似方法を利用し、かつ分析データを
蓄積しつつ入力音声を合成する音声合成器の一実施例の
構成を示すブロック図、第5図は第1図に示す区分的最
適関数近似方法を利用して抽出した入力音声の特徴パラ
メータを用いる波形符号化装置の一実施例の構成を示す
ブロック図、第6図は第1図に示す区分的最適関数近似
方法全利用した圧縮13P型単語音声認識装置の一実施
例の構成を示すブ四ツク図、第7図は第1図に示すDP
プロセッサ13の一実施例を詳細に示すブロック図、第
8図は第7図に示す時間歪算出器131の一実施例を詳
細に示すブロック図である。 1・・・・・・区分的最適関数近似器、2・・・・・・
可変長フレームボコーダ分析側、3・・・・・・可変長
フレームボコーダ合成側、4・・・・・・音声合成器、
5・・・・・・波形符号化装置、6・・・・・・圧縮D
P型単誤音声認識装置。 11・・・・・・LSF分析器、12・・・・・・パラ
メータメモリ、13・・・・・・DPプロセッサ、1t
・・・・・・前区分選択パラメータメモリ、201・・
・・・・符号化器、202・・・・・・符号化器、20
3・・・・・・マルチプレクサ、3o1・・・・・・デ
マルチブレフサ、302・・・・・・ピッチパルス発生
器、303・・・・・・雑音発生器、304・・・・・
・切替器、305・・・・・・可変利得増幅器、306
・・・・・・補間器、307″・・・・・・LAF合成
フィルタ、308・・・・・・1)/Aコンバータ、3
09・・・・・・LPF、310・・・・・・メモlJ
、501・・・・・・ノイズ重み付は器、502・・・
・・・符号化復号化器、503・・・・・・補間器、5
04・・・・・・相互相関係数算出器、505・・・・
・・自己相関係数算出器、506・・・・・・マルチパ
ルス検索器%507・・・・・・符号化器、508・・
・・・・マルチプレクサ、601・・・・・・切替器、
602・・・・・・標準バタンメモリ、603・・・・
・・バタンマツチング器、604・・・・・・最小距離
検索器、100・・・・・・音源情報分析器、131・
・・・・・時間歪算出器、133・・・・・・制御演算
器、1311−1〜N・・・・・・レジスタ、1312
−1〜N・・・・・・レジスタ、1313−1〜N・・
・・・・減算器%1314−1〜N・・・・・・掛算器
、1315−1〜N・・・・・・掛算器、1316 ・
・・・・・アーキエムレータ。 窮1図 の〜[相] 今所フレーん番号 窟Z図 箭4目 笥7図 DPブ°U乞ツプ

Claims (1)

    【特許請求の範囲】
  1. 予め設定した一定の分析フレームごとに入力音声信号を
    分析して特徴パラメータを抽出したうえ予め設定した複
    数個の連続する前記分析フレームからなる区分ごとの前
    記特徴パラメータから任意の数の代表特徴パラメータを
    選択して前記各区分を区分的最適関数によって近似する
    音声処理装置において、前区分の最終選択フレームによ
    って現区分の先行フレームが代替されることを許容する
    動的計画法(DynamicProgramming、
    以下DPと略称する)にもとづいて前記各区分を最適近
    似せしめる区分的最適関数近似手段を備えて成ることを
    特徴とする音声処理装置。
JP61063329A 1985-03-20 1986-03-19 音声処理装置 Expired - Lifetime JPH0754438B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP5732485 1985-03-20
JP60-57324 1985-03-20

Publications (2)

Publication Number Publication Date
JPS621000A true JPS621000A (ja) 1987-01-06
JPH0754438B2 JPH0754438B2 (ja) 1995-06-07

Family

ID=13052394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61063329A Expired - Lifetime JPH0754438B2 (ja) 1985-03-20 1986-03-19 音声処理装置

Country Status (1)

Country Link
JP (1) JPH0754438B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042648A1 (fr) * 2001-11-16 2003-05-22 Matsushita Electric Industrial Co., Ltd. Codeur de signal vocal, decodeur de signal vocal, procede de codage de signal vocal et procede de decodage de signal vocal
US7191126B2 (en) 2001-09-03 2007-03-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound decoder performing multiplexing and demultiplexing on main codes in an order determined by auxiliary codes

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191126B2 (en) 2001-09-03 2007-03-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound decoder performing multiplexing and demultiplexing on main codes in an order determined by auxiliary codes
US7756699B2 (en) 2001-09-03 2010-07-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound encoding method with multiplexing order determination
US7756698B2 (en) 2001-09-03 2010-07-13 Mitsubishi Denki Kabushiki Kaisha Sound decoder and sound decoding method with demultiplexing order determination
WO2003042648A1 (fr) * 2001-11-16 2003-05-22 Matsushita Electric Industrial Co., Ltd. Codeur de signal vocal, decodeur de signal vocal, procede de codage de signal vocal et procede de decodage de signal vocal

Also Published As

Publication number Publication date
JPH0754438B2 (ja) 1995-06-07

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
JP6290858B2 (ja) 発話の入力オーディオエンコーディングを、対象歌曲にリズム的に調和する出力へと自動変換するための、コンピュータ処理方法、装置、及びコンピュータプログラム製品
CN101578659A (zh) 音质转换装置及音质转换方法
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
KR100422261B1 (ko) 음성코딩방법및음성재생장치
JPH08248994A (ja) 声質変換音声合成装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JPH11259066A (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JPS621000A (ja) 音声処理装置
JPH0736119B2 (ja) 区分的最適関数近似方法
JPS63118200A (ja) マルチパルス符号化装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPS62102294A (ja) 音声符号化方式
JP3112462B2 (ja) 音声符号化装置
JPH05224689A (ja) 音声合成装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPS6032100A (ja) Lsp型パタンマッチングボコ−ダ
JPS5914752B2 (ja) 音声合成方式
JPH11296195A (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JPH0358100A (ja) 規則型音声合成装置
JP3263136B2 (ja) 信号のピッチ同期位置抽出方式及び信号合成方式
JP2508002B2 (ja) 音声符号化方法とその装置
JPS5965895A (ja) 音声合成方法
JPS59176782A (ja) デジタル音響装置
JPH0731520B2 (ja) 可変長フレ−ム型パタンマツチングボコ−ダ

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term