JPH0145920B2 - - Google Patents

Info

Publication number
JPH0145920B2
JPH0145920B2 JP56150370A JP15037081A JPH0145920B2 JP H0145920 B2 JPH0145920 B2 JP H0145920B2 JP 56150370 A JP56150370 A JP 56150370A JP 15037081 A JP15037081 A JP 15037081A JP H0145920 B2 JPH0145920 B2 JP H0145920B2
Authority
JP
Japan
Prior art keywords
time series
parameter
input
parameter time
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56150370A
Other languages
English (en)
Other versions
JPS5852694A (ja
Inventor
Yasuo Sato
Tadayasu Sugita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56150370A priority Critical patent/JPS5852694A/ja
Publication of JPS5852694A publication Critical patent/JPS5852694A/ja
Publication of JPH0145920B2 publication Critical patent/JPH0145920B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、単音節音声認識装置、特に音声信号
の周波数分析結果にもとづいて特徴パラメータ時
系列を抽出して認識処理を行なう単音節音声認識
装置において、入力音声についての入力特徴パラ
メータ時系列を少数の区間に区分し、各区間毎に
例えばパラメータ値を平均化した平均値からなる
縮小特徴パラメータ時系列を抽出し、当該縮小特
徴パラメータ時系列によつて認識対象候補単音節
を選び出し、該候補単音節に対して照合をとるよ
うにして処理速度を大幅に向上するようにした単
音節音声認識装置に関するものである。
単音節音声認識システムにおいては、単音節音
声信号の周波数分析結果を利用して各音素の特徴
を表わす特徴パラメータを抽出し、該抽出された
特徴パラメータと登録単音節に対応した予め登録
されている特徴パラメータと照合して未知入力単
音節音声の認識を行なうようにされる。即ち上記
特徴パラメータとして例えば第1ホルマント周波
数および第2ホルマント周波数などをサンプリン
グしてこのパラメータを使用するようにされる。
しかし、上記照合に当つてデータ処理量が大とな
り、認識カテゴリ数が大となるにつれて上記照合
処理に要する時間が大となる。
このため、上記特徴パラメータが時間的に急変
する区間となだらかに変化する区間とが存在する
ことに着目し、前者区間において密にサンプリン
グし、後者区間において粗にサンプリングするこ
とによつて、即ち不均一なサンプリング点でサン
プリングすることによつて、より少ない標本数の
もとで認識率を高める方式が考慮されている(特
願昭52―43972号)。
この方式に対して、種々の特徴量により予め認
識対象候補をしぼつた上で、より詳細な照合処理
を行なうようにして処理速度を向上させる種々の
方式(特願昭53―53965号、特願昭53―53966号、
特願昭53―53967号)が提案されているが、上記
特徴量を抽出する抽出アルゴリズムが複雑である
とか、候補を大幅にしぼることが困難であるとい
つた問題点を含んでいる。
本発明は、上記の点を改善することを目的と
し、比較的簡単なアルゴリズムの下で、効率よく
認識対象単音節候補を決定し、単音節音声認識率
を向上させると共に、認識処理時間の削減を図る
ことを目的としている。そのため、本発明の単音
節音声認識装置は、未知入力単音節の音声信号を
分析し、当該音声信号から抽出された入力特徴パ
ラメータ時系列と予め登録されている登録特徴パ
ラメータ時系列とを照合して、未知入力単音節音
声の認識を行なう単音節音声認識装置において、
上記未知入力単音節音声の始端から該単音節音声
に含まれる母音定常部までの上記入力特徴パラメ
ータ時系列を、すべての該入力特徴パラメータ時
系列について同一個数であつて多くても10個以下
の区間に分割する手段と、この分割された各区間
内のパラメータ値を平均した値または区間境界値
からなる入力縮小パラメータ時系列を抽出する手
段と、この抽出結果と予め同一の手法で抽出され
予め登録されている登録縮小パラメータ時系列と
を照合することによつて認識対象候補単音節を決
定する手段とを備えたことを特徴としている。以
下図面を参照しつつ説明する。
第1図は本発明の一実施例の考え方を説明する
説明図、第2図は本発明の他の一実施例の考え方
を説明する説明図、第3図は上記処理を行なう本
発明の一実施例構成、第4図は上記第2図に対応
した一実施例における区間決定を行なう処理につ
いてフローチヤートの形で表わした説明図を示
す。
第1図図示の如く、時点T0からTEまでの間に、
サンプリングされた特徴パラメータPが存在する
ものとするとき、本発明の第1の実施例の場合、
時点T0からTEまでの時間を例えば5つの等分さ
れた点TE/5,2TE/5,3TE/5,4TE/5,
TEを決定する。そして、時点T0ないしTE/5ま
での間の各特徴パラメータ値を平均し、時点
TE/5ないし2TE/5までの間の各特徴パラメー
タ値を平均し、……時点4TE/5ないしTEまでの
間の各特徴パラメータ値を平均し、例えば5個の
平均値パラメータよりなる縮小パラメータ時系列
を抽出するようにする。なお、上記特徴パラメー
タ値を平均する代わりに、簡略化し区間境界値か
らなる縮小パラメータ時系列を抽出するようにし
てもよい。
上記縮小パラメータ時系列の抽出にあたつて、
単音節音声、例えば「マ(ma)」の音について、
開始時点T0は、単音節音声の始端すなわち「m」
音の最初にとればよい。終りの時点TEは、単音
節音声の最終端にとるようにすることも考えられ
るが、第1図図示「a」部に示す如く、母音には
比較的安定した定常性を示す部分、即ち特徴パラ
メータ値の変化の少ない部分があり、この点を母
音代表点としてTEとすることが望ましい。そう
すれば、単音節音声の母音部のうち不安定な要素
を含む後方部分を排除することができ、認識率の
向上を図ることができる。
本発明の第2の実施例の場合、上記第1の実施
例において時間軸上で等間隔に区分されるのに対
して、特徴パラメータの変化率が比較的大きい箇
所での区間間隔を小に選ぶようにしている。即
ち、特徴パラメータPが第1図図示の如くあるも
のとするとき、このパラメータPの変動量を累積
した値即ち累積変動量を第2図図示の如く時間を
横軸にとつて描く。このように描かれた図形につ
いて、累積変動量の最大値TAVを例えば5等分
した値1/5TAV、2/5TAV、3/5TAV、4/5 TAV、TAVを選ぶ。そして累積変動量が上記値
1/5TAV,2/5TAV,……となる時点T1,T2, ……TEを抽出し、時点T0からT1までの間の第1
図図示の各特徴パラメータ値を平均し、時点T1
からT2までの間の第1図図示の各特徴パラメー
タ値を平均し、……,時点T4からTEまでの間の
第1図図示の各特徴パラメータ値を平均し、例え
ば5個の平均値パラメータよりなる縮小パラメー
タ時系列を抽出するようにする。
上記縮小パラメータ時系列の平均値パラメータ
について考察すると該平均値パラメータは次の如
きものと考えてよい。例えば本発明に用いる第1
図図示の特徴パラメータPとしてパラメータMj
(tn)とXj(tn)とを考慮するものとすると、各
パラメータは公知のように次の如く表わされる。
Mj(tn)=Ni=1 Pi(tn)WijFi/Ni=1 Pi(tn)Wij ……(1) (但しj=1,2) Xj(tn)=Ni=1 Pi(tn)aij/Ni=1 Pi(tn) ……(2) (但しj=1,2) 第(1)式に示す特徴パラメータMj(tn)はモーメ
ント法にもとづくパラメータであつて、パラメー
タM1(tn)は第1フオルマントに対応し、パラメ
ータM2(tn)は第2フオルマントに対応してい
る。また第(2)式に示す特徴パラメータXj(tn)は
帯域別電力に対応したパラメータであつて、パラ
メータX1(tn)は正規化低域電力に対応し、パラ
メータX2(tn)は正規化高域電力に対応してい
る。
今区間をNf個に区分したものとしたとき、上
記平均値パラメータは、第(1)式のパラメータMj
(tn)と第(2)式のパラメータXj(tn)とに対して
夫々次の如く表わされる。即ち Mf j(k)=1/(nk−nk-1okm=n k-1+1 Mj(tm) ……(3) (但しk=1〜Nf Nf:区分数 nNf:単語区間総数) Xf j(k)=1/(nk−nk-1okm=n k-1+1 Xj(tm) ……(4) (但しk=1〜Nf Nf:区分数 nNf:単語区間総数) 上記第1図を参照して説明した場合の時点1/5 TE,2/5TE……は次の如く表わされる。
tok=k/Nf・TE ……(5) また第2図を参照して説明した場合の時点T1
T2,……は次の如く表わされる。
Tok:k/NfTAVに対応する ……(6) ここで、 TAV=TEtn=0 V(tn) ……(7) (但しV(tn):変動量) また第(7)式における変動量V(tn)は (但しPは帯域フイルタ群の出力) で与えられる。
上記の如く累積変動量によつて決定される区間
は、例えばモーメント法にもとづくパラメータや
帯域別電力に対応したパラメータなど、各パラメ
ータ毎に独立に求めるようにしてよい。
第3図は本発明の一実施例構成を示す。図中の
符号1は帯域フイルタ群、2はパラメータ抽出回
路、3は母音代表点決定回路、4は入力特徴パラ
メータ時系列バツフア、5はパラメータ平均区間
決定回路、6はパラメータ平均回路、7および8
は夫々切換回路であつて登録モードと認識モード
とを切換えるもの、9は登録単音節縮小パラメー
タ時系列登録部であつてメモリによつて構成され
るもの、10は縮小パラメータ時系列照合部・候
補決定部、11は登録単音節特徴パラメータ時系
列登録部であつて各登録単音節についての特徴パ
ラメータ時系列を格納するメモリによつて構成さ
れるもの、12は候補選択回路であつて登録部1
1から読出される各特徴パラメータ時系列のうち
で本発明にいう認識対象候補単音節に対応するも
ののみを選択するもの、13は特徴パラメータ時
系列・照合判定部、14は出力回路を表わす。
入力単音節音声信号が帯域フイルタ群1に入力
され、パラメータ抽出回路2によつて入力単音節
音声信号に対応した入力特徴パラメータが抽出さ
れる。この抽出された入力特徴パラメータは、母
音代表点決定回路3に入力され、母音代表点決定
回路3は、第1図を用いて説明した如く、時点
TEとして母音代表点を用いるべく、母音の定常
性を示す部分の検出を行なう。ここで決定された
母音代表点までの入力特徴パラメータは入力特徴
パラメータ時系列の形でバツフア4に一時セツト
される。パラメータ平均区間決定回路5は第1図
図示時点1/5TE,2/5TE,……の場合で言えば時 点TEを抽出した上でT0ないしTEまでの間を5等
分した時点1/5TE,2/5TE,……,TEを決定す る。なお第2図図示の時点T1,T2……について
は第4図を参照して後述する。上記時点にもとづ
いて区間が決定されると、パラメータ平均回路6
はバツフア4の内容にもとづいて各区間毎にパラ
メータ値の平均値を演算する。
登録モードの場合、切換回路7および8は図示
上方のルートがとられる。そして、パラメータ平
均回路6によつて抽出された縮小パラメータ時系
列(この場合登録単音節縮小パラメータ時系列)
が夫々図示登録部9に登録され、また図示バツフ
ア4にセツトされた特徴パラメータ時系列が図示
登録部11に登録される。
認識モードの場合、切換回路7および8は図示
下方のルートがとられる。そしてパラメータ平均
回路6によつて抽出された縮小パラメータ時系列
(この場合入力縮小パラメータ時系列)が図示照
合部・候補決定部10に導びかれる。このとき図
示登録部9から登録単音節縮小パラメータ時系列
が順次読出され、入力縮小パラメータ時系列と照
合され、本発明にいう認識痴象候補単音節を決定
する。該照合部・候補決定部10においては例え
ば単音節間距離Sr即ち登録縮小パラメータ時系列
と入力縮小パラメータ時系列との間のチエビシエ
フ距離を演算する。該距離Srは次の式で与えられ
る。
SrNi=1 〔|Mf 1r(i)−Mf 1(i)|+|Mf 2r(i)−Mf 2(i)| +|Xf 1r(i)−Xf 1(i)|+|Xf 2r(i)−Xf 2(i)|
〕…(9) 但し、上記Mf jrやXf jrは登録単音節縮小パラメ
ータ時系列に対応するものであり、上記Mf jやXf j
は入力縮小パラメータ時系列に対応するものであ
る。
照合部・候補決定部10において上記第(9)式に
もとづいて幾個かの認識対象候補単音節が決定さ
れると、この候補単音節名が候補選択回路12に
通知される。このとき、図示省略した制御部から
の制御によつて図示登録部11から特徴パラメー
タ時系列が夫々順次読出される。そして候補選択
回路12によつて、候補単音節として指定された
単音節に対応する登録単音節特徴パラメータ時系
列のみが選択され、図示照合判定部13に導びか
れる。上記認識モードの場合、切換回路7は図示
下方のルートをとつており、図示バツフア4にセ
ツトされている特徴パラメータ時系列(このとき
入力特徴パラメータ時系列)が上記照合判定部1
3に導びかれる。これによつて、入力特徴パラメ
ータ時系列は、上記候補単音節に対応する各登録
単音節特徴パラメータ時系列と照合される。この
場合の照合に当つては公知のダイナミツク・プロ
グラミング(DP)照合が行なわれるものと考え
てよい。このようにして抽出された1つの単音節
カテゴリが出力回路14に出力される。
上記第2図に示す時点T1,T2,……を決定す
る場合、第3図図示のパラメータ平均区間決定回
路5は第4図にフローチヤートの形で示す如き処
理を行なうものと考えてよい。即ち、 (1) パラメータ抽出回路2によつて抽出されたパ
ラメータにもとづいて各パラメータ毎に独立に
第2図に示す如き累積変動量TAVを抽出する。
(2) そして累積変動量TAVの値を例えば5等分
した値DTAVを決定する。
(3) そして最初に時点T1を求めるべくJ=1と
しておき、レジスタAVHに上記値DTAVをセ
ツトし、計時スタート・レジスタTS(J)に値T
(I)をセツトする。
(4) 以下順次特徴パラメータの累積値AV(I)がレ
ジスタAVHの内容と等しいか大となるときま
で、特徴パラメータ値を累算してゆく。
(5) 累積値AV(I)がレジスタAVHの内容を等し
いか大となると、そのときのタイミング値T(I)
が時点T1用レジスタTE(I)にセツトされ、上記
レジスタTS(J+1)に値T(I+1)をセツ
トし、レジスタAVHに値(AVH+DTAV)
をセツトし、次の時点T2を求めるべくJ=2
とする。
(6) 以下同様に累積値AV(I)がレジスタAVHの
内容と等しいか大となるまで、特徴パラメータ
値を累算してゆく。即ち、時点T2,T3,T4
求めてゆく。
(7) そして累積回路Iが値Nに達すると、即ち累
算処理が第2図図示時点TEに対応する特徴パ
ラメータの累算に達すると、その時点で時点
TEが決定される。
以上説明した如く、本発明によれば、比較的簡
易に効率よく認識対象単音節候補をしぼることが
できるので、認識処理時間の大幅な削減を図るこ
とができる。特に、入力縮小パラメータ時系列の
抽出にあたつて、母音部から音声終端までの不安
定部分が除去されるので、候補決定の精度がよ
く、また、候補の決定の照合では、パラメータ数
が同一個数で扱われるので、計算量削減の効果が
大きい。
【図面の簡単な説明】
第1図は本発明の一実施例の考え方を説明する
説明図、第2図は本発明の他の一実施例の考え方
を説明する説明図、第3図は上記処理を行なう本
発明の一実施例構成、第4図は上記第2図に対応
した一実施例における区間決定を行なう処理につ
いてフローチヤートの形で表わした説明図を示
す。 図中、Pは特徴パラメータ、2はパラメータ抽
出回路、3は母音代表点決定回路、4は入力特徴
パラメータ時系列バツフア、5はパラメータ平均
区間決定回路、6はパラメータ平均回路、7およ
び8は夫々切換回路、9は登録単音節縮小パラメ
ータ時系列登録部、10は縮小パラメータ時系列
照合部・候補決定部、11は登録単音節特徴パラ
メータ時系列登録部、12は候補選択回路、13
は特徴パラメータ時系列・照合判定部を表わす。

Claims (1)

  1. 【特許請求の範囲】 1 未知入力単音節の音声信号を分析し、当該音
    声信号から抽出された入力特徴パラメータ時系列
    と予め登録されている登録特徴パラメータ時系列
    とを照合して、未知入力単音節音声の認識を行な
    う単音節音声認識装置において、 上記未知入力単音節音声の始端から該単音節音
    声に含まれる母音定常部までの上記入力特徴パラ
    メータ時系列を、すべての該入力特徴パラメータ
    時系列について同一個数であつて多くても10個以
    下の区間に分割する手段と、 この分割された各区間内のパラメータ値を平均
    した値または区間境界値からなる入力縮小パラメ
    ータ時系列を抽出する手段と、 この抽出結果と予め同一の手法で抽出され予め
    登録されている登録縮小パラメータ時系列とを照
    合することによつて認識対象候補単音節を決定す
    る手段とを備えたことを特徴とする単音節音声認
    識装置。
JP56150370A 1981-09-22 1981-09-22 単音節音声認識装置 Granted JPS5852694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56150370A JPS5852694A (ja) 1981-09-22 1981-09-22 単音節音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56150370A JPS5852694A (ja) 1981-09-22 1981-09-22 単音節音声認識装置

Publications (2)

Publication Number Publication Date
JPS5852694A JPS5852694A (ja) 1983-03-28
JPH0145920B2 true JPH0145920B2 (ja) 1989-10-05

Family

ID=15495504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56150370A Granted JPS5852694A (ja) 1981-09-22 1981-09-22 単音節音声認識装置

Country Status (1)

Country Link
JP (1) JPS5852694A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53128905A (en) * 1977-04-15 1978-11-10 Hiroya Fujisaki Voice discrimination system
JPS56101199A (en) * 1980-01-16 1981-08-13 Matsushita Electric Ind Co Ltd Voice identifier

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53128905A (en) * 1977-04-15 1978-11-10 Hiroya Fujisaki Voice discrimination system
JPS56101199A (en) * 1980-01-16 1981-08-13 Matsushita Electric Ind Co Ltd Voice identifier

Also Published As

Publication number Publication date
JPS5852694A (ja) 1983-03-28

Similar Documents

Publication Publication Date Title
US5749066A (en) Method and apparatus for developing a neural network for phoneme recognition
US5355432A (en) Speech recognition system
JPS6129519B2 (ja)
JPS6129518B2 (ja)
JPH0145920B2 (ja)
JP3477751B2 (ja) 連続単語音声認識装置
JP2543584B2 (ja) 音声標準パタン登録方式
JP2001083978A (ja) 音声認識装置
JP3352144B2 (ja) 音声認識装置
JP3458285B2 (ja) 音声認識装置
JP3007357B2 (ja) 音声認識装置の辞書更新方式
JPH0115079B2 (ja)
JP2577891B2 (ja) 単語音声予備選択装置
JP3411074B2 (ja) 母音区間検出装置及び母音区間検出方法
JP2760096B2 (ja) 音声認識方式
JPH09305195A (ja) 音声認識装置および音声認識方法
EP0245252A1 (en) System and method for sound recognition with feature selection synchronized to voice pitch
JPS63223696A (ja) 音声パタ−ン作成方式
KR970029327A (ko) 음성 인식 방법 및 이에 적합한 음성 패턴의 시간 정규화 방법
JP3473704B2 (ja) 音声認識装置
JPS6131878B2 (ja)
JPH0731506B2 (ja) 音声認識方法
JPH0634193B2 (ja) キ−ワ−ド抽出装置
JPH04204899A (ja) 音声認識装置
JPS6155680B2 (ja)