JPS5960500A - 音響信号分析装置 - Google Patents

音響信号分析装置

Info

Publication number
JPS5960500A
JPS5960500A JP17180982A JP17180982A JPS5960500A JP S5960500 A JPS5960500 A JP S5960500A JP 17180982 A JP17180982 A JP 17180982A JP 17180982 A JP17180982 A JP 17180982A JP S5960500 A JPS5960500 A JP S5960500A
Authority
JP
Japan
Prior art keywords
filter
parameter
parameters
standard
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17180982A
Other languages
English (en)
Other versions
JPS6329280B2 (ja
Inventor
坂田 富生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP17180982A priority Critical patent/JPS5960500A/ja
Publication of JPS5960500A publication Critical patent/JPS5960500A/ja
Publication of JPS6329280B2 publication Critical patent/JPS6329280B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野」 この発明は、音声認識装置゛に使用される音響信号分析
装置dに関する。
〔発明の技術的背景とその問題点〕
近年、音声認識装置は、各分野に多用されるなど、極め
て有用な装置になりつつある。このような音声認識装置
は、基本的には入力音声信号を分析して特徴パラメータ
(スペクトルパラメータ)を抽出する分析部、この分析
部からのスペクトルパラメータに正規1ヒ等の処理を行
なう前処理部および認識結果を出力する認識部とからな
る。すなわち、分析部で抽出されたスペクトルパラメー
タに基づいて、入力音声信号の音韻、音節、および単語
等の認識が行なわれることになろう 上記分析部は、音響分析装置からなり、上記スペクトル
パラメータとして、チャネルフィルタによる周波数スペ
クトルが利用される。このチャネルフィルタは、例えば
デジタルフィルタで、対fil波数帯域を適当に分割す
るように周波数特性が設定されたものである。
ところで、音声認識装置は、特定の話者だけを特徴とす
る特定話者用と、不特定多数の話者を特徴とする特定話
者用とに大別される。この中で、特定話者用音声i忍識
装置では、話者は予め自分の声を標準・?ターンとして
登録しておく必要がある。これは、同一の音韻、単語で
あっても、音響分析装fFI Vcより帛られる特徴・
ぐラメータから々るA’ターンは、話者によって変動し
また同じ話者でもその時々によって相当変動するからで
ある。この変動は、通常、発声者毎の発声器官形状の相
違に起因する周波数方向の変動、および発声の仕方の相
違に起因する時間軸方向の変動枯大別できる。従来では
、上記の変動の中で時間軸方向の変動は、不等間隔サン
プリング、ダイナミックプログ2ミング等の手段により
吸収されていた。しかしながら、周波数軸方向の変動に
対しては、これを吸収するための効果的な手段がなかっ
た。そのため、話者毎に全ての標準ノ9ターンを登録す
る必要があり、認識対象語数が増加した場合には標準パ
5ターンの登録が話者にとって大きな・負担になる。ま
た、多くの話者の標準・母ターンを登録しておくことに
なるため、標鴎ハターンを記憶するメモリは大容歌のも
のが必要となる欠点があった。
〔発明の目的〕
この発明は上記の事情を攬みてなされたもので、特定話
者用音声認識装置において、話者毎の周波数軸方向の変
動に影響されない特徴パラメータを抽出して、認識に必
要な標準パターンの登録礒を特別に大きくすることなく
、確実に音声認識を行なうことができるようにした高性
能の音響分析装置を提供することを目的とする。
〔発明のid要〕
すなわち、この発明においては 1,4i波数分析用の
例えばデジタルフィルタであるチャネルフィルタを構成
する各BPFの周波数特性を、話者毎の周波数軸方向の
変動を吸収するように可変設定する。この手段として、
予め設定される標準スペクトルノ々ラメータとチャネル
フィルタから出力するスペクトルノクラメータに基づい
て、制御パラメータ計算手段により所定の制御ffl+
パラメータを求める。このtlilJ 御パラメータに
基づいて、話者に適合した周波数特性、すなわち標準ス
ペクトルノヤラメータに適合するようなチャネルフィル
タの周波数特性を設定するようなフィルタパラメータを
フィルタパラメータ計算手段より求めるものである。
〔発明の実施例〕
以下図面を参照してこの発明の一実施例について説明す
る。図はこの発明に係る音響分析装置の構成を示すブロ
ック図である。図中、1はアナログ・7′ジタル変換部
(以下A/D変換部と称する)で、アナログ信号である
音声入力−信号Sを量子化されたサンプル値のデジタル
信号系列に変換する。デジタルフィルタ部2は、上記デ
ジタル信号系列が与えられ、フィルタパラメータFに基
づいて周波数分析を行なって、音声入力信号Sに対応す
るスペクトル・ぐラメータ(特徴/4ラメータ)Pを抽
出し出力する。フィルタパラメータFは、フィルタ/臂
うメータ計算部3により算出されて設定される。このフ
ィルタノ臂うメータ計算部3は、制能1パラメータ人と
標準フィルタノぐラメータBとに基づいて、入力信号S
の発生源である話者の声道特性に尊台したデジタルフィ
ルタ部2の周波数特性を得ることができるようなフィル
タフ92メータFを算出する。標準フィルタパラメータ
Bは、予め標賭フィルタノやラメータメモリ4゛に格納
されているっまた、制仰ノ千うメータAは、側副パラメ
ータ計算部5で算出されて出力する。この制ill /
#シラメータ計算5は、スペクトルノ卆うメータPおよ
び標準スペクトルパラメータRとに基づいて制量パラメ
ータ人を算出して出力する。標準スペクトルノぐラメー
タRは、予め音韻カテゴリ1かに標準スペクトルノや2
メータメモリ6に格納されている。そして、例えばキー
z’  He等の外部入力装置(図示せず)から与えら
れる音韻カテゴリコードCにより、そのコードCに対応
する標準スペクトルパラメータRがメモリ6から選択さ
れて出力する。
このような構成において、その動作を説明する。いま発
声者から発声した音声入力信号Sは、A/D変換部1で
サンプリング、I子1ヒされてデジタル値の時系列(i
t号りとして変換される。
デジタルフィルタ部2は、nチャネル分のバンドi4ス
フイルタ(BPF’)の機能をHし、上記のようなデジ
タル信号りに対して各チャネルのBPF出力を時分割で
計算し、1フレーム毎にnチャネル分の川波数スペクト
ルパラメータセットP1〜pnを出力する。この場合、
標準フィルタパラメータBが、標準フィルタパラメータ
メモリ4からフィルタノ量うメータ計算部3を介して、
そのままフィルタ・ぐラメータFとしてデジタルフィル
タ部2に与えられる。すなわち、デジタルフィルタ部2
は、標準の周波数特性で動作することになる。さらに、
発声者は、発声する音韻のカテがリコードCをキーピー
ド等により与える。このコードCにより、標準スペクト
ルノやラメータメモリ6は、そのカテがリコードに対応
する音韻の標準スペクトルノ臂うメータ七ツ)Rを制御
/ぐラメータ計算部5へ出力する。
制御パラメータ計算部5は、このノやラメータセツ)R
を一時的に記憶する。一方、発声者の音声信号Sから抽
出された上記スペクトルノやラメータセットの系列P 
i I 〜II’ i n (i = 1 、2・・・
n)も制ωllノやラメータ計算部5へ与えられる。
+1i11匍ノ臂ラメ一タ計算部5は、スにクトルパラ
メータセットの系列Pi、〜Pinから適当なフレーム
jのス(クトルノ母うメータセットPjl〜Pjnを抽
出し、これを一時的に記憶しておく。この場合、フレー
ムjの選択方法としては、音声区間中でエネルギーが最
大になるフレーム、または隣接フレーム間のスペクトル
変化が最小になるフレーム等が考えられるっそして、発
声者が、予め決められた種類の音韻を入力し終ると、制
御パラメータ計算部5では下記のような・方法により、
制御パラメータAを算出する。いま、仮に発声者から与
えられる音韻数が3つの場合とする。この場合、入力さ
れた音韻から抽出した3f!類のスペクトルパラメータ
セラ)Pおよび標準スペクトルノやラメータセットRを
下記のようになるとする。すなわち、 のように、それぞれ行列で表現される。
ここで、 PiJ:i番目の入力音韻のjチャネルのくやラメータ
値。
RIJ’:1番目の標準音韻のjチャネルの7やラメー
タ値。
であり、[i=1〜3Jおよび「j=1〜n」である。
そして、制御ノクラメータAについても、同様に のように行列で表現されるとする。そして、スペクトル
ノ譬うメータセットPおよび標準スペクトルパラメータ
セラ)Rとの間には、下記のような関係式が成立する。
すなわち、 A −P=R・・・・・四・・・・曲・・曲間+4)で
ある。この式(4)より、制71111 z4’ラメー
タAは、各入力音韻スペクトルPとそれに対応する標準
スペクトルRとのずれを補正するための、入力音韻スペ
クトル/ぐラメータPに対する補正係数となる。上記式
(4)から、制御パラメータAを求めることができる。
すなわち、Aは A=P−R・・−・・・・・・・・・・・・・・(5)
である。こ、でP はPの一般逆行列であり、「P+−
(PT−P)−1・p T Jの式で求めることができ
る。但し、P は転置行列である。ところで、上記式(
3)に示すように、iti!In…パジメータAが3重
対角行列で表現される場合、人力音韻スペクトルPの標
準スペクトルRに対するずれが隣接したチャネル範囲内
におさまると仮定できるとした場合である。これに対し
て、上記ずれがもつと大きい場合には、さらに広い帯行
列で表現する必要があり、そのため入力する音韻の種類
もそれに合わせて増加する必要がある。
上記のようにして求められた制御パラメータAは、フィ
ルタパラメータ計算部3に与えられる。フィルタパラメ
ータ計算部3は、側副パラメータ数タよび標孕フイルタ
ノやラメータBとから、新たなフィルタフ9ラメータF
を算出して、その結果をデジタルフィルタ部2に出力す
る。
具体的には、フィルタパラメータ計算部3では下記のよ
うな手法により、フィルタパラメータFを算出する。ま
ず、制御パラメータA11〜Annより、修正用ノぐラ
メータ”11〜E nnを求める。
B i 、 I = l −A i  、 i (+ 
= 1〜n  ) =・・f61E+ 、 j  ==
 Ai 、 j(+ == 1〜n  、、j==i−
g〜1十g)・・・・・・・・ (7) である。ここで、gは、上記式(3)の帯行列の幅をm
とすると、rg=(m−1)/2Jで与えられる。入力
音韻スペクトルPが標準スペクトルRと一致するときは
、E、1〜InnはOとなるから、E目〜Ennはデジ
タルフ・イルタ部2の周波数特性、すなわち標県フィル
タ・ぐラメータα目〜α、!、α、1〜αn!(!は1
チャネル分のフィルタパラメータ数)の修正の程度を表
わす。この修正・卆うメータHat〜Ennは、以下の
ような関係式で表現さ几る。すなわち、となり、ここで
[Hコは係数行列である。この式(8)および修正ノぐ
ラメータB□、〜Ennにより、フィルタノぐラメータ
の修正項δα1.・・・δαn!を求める。そして、新
たなフィルタノやラメータF(α“、□〜α°、!、α
清〜α°nメ)は、のような関係式で表現される。すな
わち、フィルタパラメータFは、標準フィルタノぐラメ
ータBに修修正項δα、、・・・δαn!を加えること
により、求められる。このようにして、算出されたフィ
ルタノやラメータFがデジタルフィルタ部2に与えられ
、デジタルフィルタ部2は、フィルタ/4’ラメ−ター
Fにより定まる周波数特性を有するチャネルフィルタと
して動作する。
このようにして、複数の音・韻カテゴリに対応する周波
数スペクトル(標準スペクトルパラメータR)に基づい
て、デジタルフィルタ部2を構成する各BPFの周波数
特性を所定の値に変更することができる。したがって、
発声器からの音声信号Sが、発声者の発声器官構造のイ
目違等に起因してその音声の周波数特性に変動を生じて
も、その変動に応じてデジタルフィルタ部2の周波数特
性を可変できるため、周波数軸方向の変動を吸収できる
ことになる。そのため、発声者毎の周波数変動が除去さ
れた安定なスペクトルパラメータ(特徴パラメータ)を
抽出することができる。
なお、上記実施例において、制1ffI!パラメータA
およびフィルタパラメータFを算出するためのアルゴリ
ズムは他のものでもよい。また、デジタルフィルタ部2
は、例えばクロック周波数により周波数特性の可変なス
イッチト・キャパシタフィルタ等のチャネルフィルタで
もよい。
〔発明の効果〕
以上詳述したようにこの発明によれば、特定話者用音声
認識装置において、話者(発声者)毎の周波数軸方向に
対する変動に影響されない安定な音声の特致ノクラメー
タを抽出できる。したがって、音声認識に必要な標準パ
ターンの登録績を特別に大きくすることなく、確実に音
声認識を行なうことができるものである。
【図面の簡単な説明】
図はこの発明の一実施例に係る音響分析装置の11 a
Mを示すブロック図である。 2・・・デジタルフィルタ部、3・・・フイルタノ母う
メータ計!fF、部、4・・・標準フィルタパラメータ
メモリ、5・・・制匍ノヤラメータ計算部、6・・・標
準スペクトルパラメータメモリ。

Claims (1)

    【特許請求の範囲】
  1. フイルタノやラメータの設定により周波数特性が可変さ
    れ音響入力信号に対応するスペクトルパラメータを抽出
    するチャネルフィルタ手段と、予め音韻カテゴリ毎に設
    定される標準スペクトルパラメータを記憶するメモリと
    、このメモリからの標準スペクトルパラメータおよび上
    記チャネルフィルタ手段からのスイクトルノやラメータ
    に基づいて所定の制量パラメータを算出する制御ノ4ラ
    メータ計算手段と、上記制d/4′ラメ、−タに基づい
    て上記標皐スペクトルノやラメータに適合するような上
    記フィルタ手段の周波数特性を設定するための上記フィ
    ルタ・ぐラメータを算出するフィルタパラメータ計算手
    段とを具備することを特徴とする音響信号分析装置。
JP17180982A 1982-09-30 1982-09-30 音響信号分析装置 Granted JPS5960500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17180982A JPS5960500A (ja) 1982-09-30 1982-09-30 音響信号分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17180982A JPS5960500A (ja) 1982-09-30 1982-09-30 音響信号分析装置

Publications (2)

Publication Number Publication Date
JPS5960500A true JPS5960500A (ja) 1984-04-06
JPS6329280B2 JPS6329280B2 (ja) 1988-06-13

Family

ID=15930121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17180982A Granted JPS5960500A (ja) 1982-09-30 1982-09-30 音響信号分析装置

Country Status (1)

Country Link
JP (1) JPS5960500A (ja)

Also Published As

Publication number Publication date
JPS6329280B2 (ja) 1988-06-13

Similar Documents

Publication Publication Date Title
US5842162A (en) Method and recognizer for recognizing a sampled sound signal in noise
US7016833B2 (en) Speaker verification system using acoustic data and non-acoustic data
Gu et al. Perceptual harmonic cepstral coefficients for speech recognition in noisy environment
JPS58100199A (ja) 音声認識及び再生方法とその装置
JPH036517B2 (ja)
WO1993018505A1 (en) Voice transformation system
JPS5844500A (ja) 音声認識方式
JPS5960500A (ja) 音響信号分析装置
Upadhyay et al. Robust recognition of English speech in noisy environments using frequency warped signal processing
JPH05307395A (ja) 音声合成装置
D'haes et al. Discrete cepstrum coefficients as perceptual features
JPS6075898A (ja) 単語音声認識装置
Makhoul Methods for nonlinear spectral distortion of speech signals
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JPH0441357B2 (ja)
Sakai et al. A procedure for formant domain extraction
US5899974A (en) Compressing speech into a digital format
JPH0814759B2 (ja) スペクトル正規化装置
Alku et al. Linearity of the function between the sound pressure level of speech and the negative peak amplitude of the differentiated glottal flow for voices of different intensities
JPS60200296A (ja) 音声認識装置
JPS61290496A (ja) 音声認識装置
Psutka et al. The influence of a filter shape in telephone-based recognition module using PLP parameterization
Blomberg et al. A device for automatic speech recognition
JPS6060077B2 (ja) アナログ信号合成装置
JPS6036598B2 (ja) 音声合成装置