JPS6328315B2

JPS6328315B2 -

Info

Publication number: JPS6328315B2
Application number: JP55086916A
Authority: JP
Inventors: Akihiko Takeuchi; Juji Kijima; Atsuhito Kobayashi; Kazunari Hatanaka
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1980-06-26
Filing date: 1980-06-26
Publication date: 1988-06-08
Also published as: JPS5713494A

Description

【発明の詳細な説明】本発明は、音声認識処理装置、特に辞書中に格
納される各カテゴリの特徴時系列パターンに対応
して、当該カテゴリ毎の当該カテゴリとして判定
可能な類似度の限界を示す変形限界値を上記辞書
中に格納しておき、上記変形限界値が複数個以上
判定可を示しているかいずれも判定不可を示して
いる場合に、最も可能性の高い少なくとも２つの
カテゴリについて、いわば相互の差異を拡大した
形で判定を行なうようにした音声認識処理装置に
関するものである。

従来から音声認識処理装置においては、未知入
力音声を分析した結果にもとづいて入力音声特徴
時系列パターンを抽出し、当該入力音声特徴時系
列パターンと辞書中に格納しておいた標準特徴時
系列パターンとを照合し、最も類似度の高いカテ
ゴリを答として決定するようにしている。しか
し、カテゴリ数が大となりまたは不特定話者によ
る音声を認識しようとすると、上記標準特徴時系
列パターンによつて最も類似度の高いものを決定
するのみでは十分でない。

本発明は、上記の点を解決することを目的とし
ており、各標準特徴時系列毎に（カテゴリ毎に）
自己に対する類似度が或る値以下になれば未知入
力音声を自己カテゴリに属するものと確定するこ
とに疑問があるという限界を示す変形限界値を用
意しておき、全カテゴリに対する照合結果につい
て上記変形限界値以内にあるカテゴリが単一であ
る場合にはそのまま未知入力音声が当該カテゴリ
に属するものと決定し、変形限界値以内にあるカ
テゴリが複数個存在するかあるいは全カテゴリに
ついて上記変形限界値以外にあるかの場合に、最
も可能性の高い少なくとも２つのカテゴリ相互間
で最終的な判定を行なわせるようにすることを目
的としている。そしてそのため、本発明の音声認
識処理装置は、未知入力音声を分析した結果にも
とづいて入力音声の特徴を抽出する第１の入力音
声特徴抽出部をそなえ、該特徴抽出部によつて抽
出された入力音声特徴時系列パターンと予め用意
された辞書の内容とにもとづいて類似度を決定し
音声認識を行なう音声認識処理装置において、上記辞書の内容としてカテゴリ名と当該カテゴ
リの特徴時系列パターンと当該カテゴリ毎の当該
カテゴリとして判定可能な類似度の限界を示す変
形限界値とを格納しておく辞書と、上記未知入力音声を分析した結果にもとづい
て、互に近似する関係が予め判つている少なくと
も２つの音声相互間における差異特徴を拡大して
抽出する第２の入力音声特徴抽出部と、上記入力音声特徴時系列パターンと上記辞書の
内容とを照合した結果の類似度と当該辞書の内容
を示すカテゴリ名と上記変形限界値とを対にして
対応づける対応づけ部と、上記類似度と上記変形限界値とを比較した結果
をカテゴリ名毎に保持する変形限界内メモリと、
全カテゴリの照合終了時に、複数個のカテゴリに
対応して上記変形限界値以内であることを示して
いるかあるいはすべてのカテゴリにおいて上記変
形限界値以外であることを示している場合に、最
も可能性の高い少なくとも２つのカテゴリに関し
て上記第２の入力音声特徴抽出部によつて抽出さ
れた差異特徴にもとづいて判定する判定部とをそ
なえたことを特徴としている。以下図面を参照しつつ説
明する。

第１図は本発明の一実施例構成を示し、第２図
は第１図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。

第１図において、１は分析回路、２は第１の入
力音声特徴抽出部、３は第２の入力音声特徴抽出
部、４は入力音声特徴時系列パターン・メモリ、
５は辞書メモリ、６は辞書管理回路部、７は照合
回路部であつて例えばDPマツチングによつて距
離（類似度）計算を行なうもの、８は＃０対応づ
け回路部であつて上記類似度とカテゴリ名とを対
応づけるもの、９は最大類似度メモリであつて例
えば全カテゴリについて夫々類似度を格納するも
の（勿論最大の類似度をもつカテゴリ名と次位の
類似度をもつカテゴリ名とを抽出して保持するも
のであつてもよい）、１０は＃１対応づけ回路部
であつて類似度とカテゴリ名と当該カテゴリに対
応する変形限界値とを対応づけて限界内にあるカ
テゴリについて類似度が限界内にある指示を例え
ば論理「１」として指摘するもの、１１は変形限
界内メモリであつて例えば全カテゴリに対応して
上記限界内にある指示を１ビツトで保持するも
の、１２は判定回路部であつて第２図に示す如き
処理を行なつて１つの答を得るものを表わしてい
る。また１３は制御回路部であつて、各部に対す
る制御を行なうものを表わしている。

辞書５には、各カテゴリに対応して、カテゴリ
名と当該カテゴリに対応する標準特徴時系列パタ
ーンと当該カテゴリに対応して与えられる上記変
形限界値とを対にして保持している。

第１の入力音声特徴抽出部２は、分析回路１か
らの出力にもとづいて特徴時系列パターンを抽出
する。また第２の入力音声特徴抽出部３は、例え
ば次の如き特徴を抽出すると考えてよい。即ち、
例えば入力音声／ichi／と／hachi／とが比較的
区別しにくいことが判つている場合、／ｉ／と／
ha／とに対応する範囲の特徴を重点的に抽出す
るようにされるものと考えてよい。

未知入力音声は分析回路１によつて分析され、
その結果は特徴抽出部２と３とに夫々導びかれ
る。第１の入力音声特徴抽出部２によつて抽出さ
れた特徴時系列パターンはパターン・メモリ４に
セツトされる。そしてパターンと辞書５から順次
読出される標準時系列パターンとが照合回路部７
によつて照合され、類似度が計算される。該類似
度は＃０対応づけ回路部８を介して、例えば各カ
テゴリ毎に類似度を表わす値がメモリ９に保持さ
れる。一方＃１対応づけ回路部１０において、上
記類似度と上述の変形限界値とが比較され、当該
カテゴリに対する類似度が変形限界値以内であれ
ば、メモリ１１内にカテゴリ名対応に論理「１」
がセツトされ、変形限界値以上であれば論理
「０」がセツトされる。

判定回路部１２は、第２図にフローチヤートの
形で示す如く判定処理を行なう。即ち、 (1) メモリ１１内の論理「１」の数を数え、論理
「１」の数即ちCinが値１であれば、即ち変形
限界値以内のものが唯１つのみであれば当該論
理「１」をもつカテゴリを答として出力する。

(2) 上記論理「１」の数即ちCinが値「１」でな
くかつCinが値「０」でない場合、論理「１」
をもつカテゴリのうちで類似度が最大のものと
次大のものとをメモリ９から読出す。

(3) 上記論理「１」の数即ちCinが値「１」でな
くかつCinが値「０」である場合、即ちすべて
のカテゴリについて変形限界値以外にある場合
メモリ９に格納されている全体のカテゴリのう
ち類似度が最大のものと次大のものとをメモリ
９から読出す。

(4) 上記項(2)と(3)とのいずれかによつて２つの候
補カテゴリが選ばれた場合、次のようにする。
即ち例えば単語の先頭などに着目して上述の如
く／ｉ／と／ha／とを識別できるような特徴
などを図示特徴抽出部３によつて用意されてい
る−これを判定法(A)と呼ぶ。用意されていない
場合これを判定法(B)と呼ぶ。

(5) 判定法(A)を使用できる場合、図示特徴抽出部
３からの出力にもとづいて、上記２つの候補カ
テゴリの１つを決定する。

(6) 判定法(A)を使用できない場合、例えば図示メ
モリ９の内容を利用して最大の類似度をもつカ
テゴリを選んで答とする。

以上説明した如く、本発明によれば、予め誤認
識し易い単語が判つている場合などにおいて、第
２の入力音声特徴抽出部３からの出力を利用する
ことができ、認識率を一段と向上できる。

【図面の簡単な説明】

第１図は本発明の一実施例構成を示し、第２図
は第１図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。図中１は分析回路、２は第１の入力音声特徴抽
出部、３は第２の入力音声特徴抽出部、４は入力
音声特徴時系列パターン・メモリ、５は辞書メモ
リ、７は照合回路部、８，１０は夫々対応づけ回
路部、９，１１は夫々メモリ、１２は判定回路部
を表わす。

Claims

【特許請求の範囲】１未知入力音声を分析した結果にもとづいて入
力音声の特徴を抽出する第１の入力音声特徴抽出
部をそなえ、該特徴抽出部によつて抽出された入
力音声特徴時系列パターンと予め用意された辞書
の内容とにもとづいて類似度を決定し音声認識を
行なう音声認識処理装置において、上記辞書の内容としてカテゴリ名と当該カテゴ
リの特徴時系列パターンと当該カテゴリ毎の当該
カテゴリとして判定可能な類似度の限界を示す変
形限界値とを格納しておく辞書と、上記未知入力音声を分析した結果にもとづい
て、互に近似する関係が予め判つている少なくと
も２つの音声相互間における差異特徴を拡大して
抽出する第２の入力音声特徴抽出部と、上記入力音声特徴時系列パターンと上記辞書の
内容とを照合した結果の類似度と当該辞書の内容
を示すカテゴリ名と上記変形限界値とを対にして
対応づける対応づけ部と、上記類似度と上記変形限界値とを比較した結果
をカテゴリ名毎に保持する変形限界内メモリと、
全カテゴリの照合終了時に、複数個のカテゴリに
対応して上記変形限界値以内であることを示して
いるかあるいはすべてのカテゴリにおいて上記変
形限界値以外であることを示している場合に、最
も可能性の高い少なくとも２つのカテゴリに関し
て上記第２の入力音声特徴抽出部によつて抽出さ
れた差異特徴にもとづいて判定する判定部とをそ
なえたことを特徴とする音声認識処理装置。