JPS6265089A

JPS6265089A - 音声認識装置

Info

Publication number: JPS6265089A
Application number: JP60205924A
Authority: JP
Inventors: 安田　晴剛
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1985-09-18
Filing date: 1985-09-18
Publication date: 1987-03-24

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】挟恢分災本発明は、音声認識装置に関する。

従来技術マルチテンプレートを使用する音声認識装置において、
例えば、女性辞書、男性辞書、単音節辞書などの数種類
の辞書を有する場合、通常の単語と同様にＬＩ＆識処理
を行わねばならないため、処理時間が数倍かかる欠点を
有している。

１−一匁本発明は、上述のごとき実情に鑑みてなされたもので、
特に、マルチテンプレートを使用する音声認識装置にお
いて、音声認識処理の高速化を図ることを目的としてな
されたものである。

豆−一双本発明は、上記目的を達成するため、入力された音声の
特徴をある時間周期で抽出し、あらかしめ登録されてい
る単語辞書パターンとの類似度を算出し、最も類似度の
高いものを結果として出力する手段と、語頭又は語尾の
ｎフレームの情報を用いて辞書のそれと同様に類似度を
求めてＱ個を残す予備選択手段と、同じ単語辞書を数種
類有するマルチプレート手段を有する音声認識装置にお
いて、予備選択において残されたＱ個に対して上位に位
内に同種のテンプレートグループ内の単語が１個以上あ
る場合、前記Ｑ個の対象単語について、当該種類のテン
プレートグループのみを本選択の対象とすること、或い
は、予備選択において残されたＱ個の内、上位に位に同
種のテンプレートのグループが１回の内ｙ回選ばれた場
合、残されたＱ個の対象単語について本選択を当該種類
のテンプレートに対してのみ行うこと、或いは、予備選
択において残されたＱ個に対して本選択において上位ｍ
個に同種のテンプレートのグループがｍｅ選ばれた場合
、次回以降、本選択において当該種類のみのテンプレー
トを認識対象とすることを特徴としたものである。

マルチテンプレート方式の音声認識処理装置においては
１例えば男性と女性のマルチテンプレートの場合は、２
種類の同一辞書となり、単音節などにおいては数種類の
同一辞書を持つ、従って。

認識処理は対象単語すべてに対して行わねばならず、こ
の処理時間は単一辞書に対して同一単語の数倍かかるこ
とになる。しかし、本来、認識装置の使用者は頻繁に入
れ替わる場合は比較的少なく、本発明はこの点に鑑みて
なされたもので、その使用者のタイプに沿って対象単語
を減らして認識処理を行おうとするものである。以下、
本発明の実施例に基づいて説明する。

第１図は、本発明の一実施例を説明するための電気的ブ
ロック線図で０図中、ｌはマイク、２は前処理部、３は
特徴抽出部、４は予備選択処理部、５は辞書グループ部
、６は上位Ｑ単語のグループ分は部、７は指定辞書抽出
部、８は本選択処理部、９は結果出力部で、以下、本発
明の実施例につき、第３図に示すＢＴＳＰ方式を用いて
説明する。なお、第３図において、Ａは音声パワーの波
形、Ｂは閾値、Ｃは音声区間の波形で１周知のように、
音声パワー波形がある閾値Ｂを越える区間を音声区間と
するものである。

第１図において、認識処理はます語頭のｎフレームが入
力された時点で入力の語頭ｎフレームを入力し、そのデ
ータと辞書のそれをマツチング処理を行い、対象総単語
から類似度の高い順にＱ単語を抽出する。このＱ！１．
語に対して音声終端を検出したら、このＱ単語に対して
本選択処理を行い最高類似度のものを結果として出力す
る。この様な！！！識処理において、例えば、辞書が男
性９女性の２種のテンプレートを有している場合を考え
ると、この場合において予備選択の上位に位の中に例え
ば、男性の辞書系列がｉ個以上存在したとすると、その
話者は男性であると判断し、本選択処理においては、Ω
単語の内、男性辞書のみを本選択の対象とし本選択処理
を行う。

第２図は、本発明の他の実施例を説明するための電気的
ブロック線図で、図中、１０は上位ｍ単語の結果側部で
、この実施例は上記に更に過去Ｘ回の実績を考慮したも
の、つまり話者の変化はそれ程大きくないと考え、過去
Ｘ回の認識の内、ｙ回が上位に位内に、片方の辞書系列
がｉ個以上存在した場合のみ、本選択の対象を片方の辞
書系列に指定するようにしたものである。

なお、上記においては、予備選択に注目したが、本選択
結果についても同様のことがいえる。但し、その結果は
次回以降に用いることになる。つまり、予備選択におい
て残されたΩ単語に対して本選択を行い、その結果の上
位ｍ個の内、同種のテンプレートがｍｓ個あった場合、
次回においては、そのテンプレートのみを認識の対象と
する。このようにすれば話者の変化の少いことを考慮し
て、次回以降の認識対象を減らすことができ、認識速度
を速めることができる。

以上の場合、話者の変化が少いことを前提としたが、当
然１例えば話者が男性から女性へ変化した場合、上記の
如くその前の段階での結果で辞書が固定された場合、は
とんどの場合、類似度が低いか１選ばれた１位と２位の
比が１に近い、従って、その場合には、この条件を用い
、該条件の場合は前述の辞書の選択を中止し、残された
Ω単語に対してすべて本認識を行う、このようにすれば
。

話者が変わってもその変化に随意対応して行き。

処理速度を高速化することができる。

羞−一果以上の説明から明らかなように、本発明によると、マル
チテンプレートにおける処理速度の向上をはかることが
できる。

【図面の簡単な説明】

第１図及び第２図は、それぞれ本発明の詳細な説明する
ための電気的ブロック線図、第３図は、ＢＴＳＰ方式に
おける音声認識処理の流れを示す図である。１・・・マイク、２・・・前処理部、３・・・特徴抽出
部、４・・・予備選択処理部、５・・・辞書グループ部
、６・・・上位ＱｍＵＪのグループ分は部、７・・・指
定辞書抽出部、８・・・本選択処理部、９・・・結果出
力部、１０・・・上位ｍ単語の結果側部。特許出願人　　株式会社　リコー第　　１　　図第２図第３図

Claims

【特許請求の範囲】

（１）、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のｎフレームの情報を用いて辞
書のそれと同様に類似度を求めてｌ個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチテンプレート
手段を有する音声認識装置において、予備選択において
残されたｌ個に対して上位ｋ位内に同種のテンプレート
グループ内の単語がｉ個以上ある場合、前記ｌ個の対象
単語について、当該種類のテンプレートグループのみを
本選択の対象とすることを特徴とする音声認識装置。
（２）、１位の得点がある類似度の閾値以下になつた場
合、又は１位と２位の比率がある値以下になつた場合、
再び全体を認識対象とすることを特徴とする特許請求の
範囲第（１）項に記載の音声認識装置。
（３）、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のｎフレームの情報を用いて辞
書のそれと同様に類似度を求めてｌ個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチプレート手段
を有する音声認識装置において、予備選択において残さ
れたｌ個の内、上位ｋ位に同種のテンプレートのグルー
プがｘ回の内ｙ回選ばれた場合、前記残されたｌ個の対
象単語について本選択を当該種類のテンプレートに対し
てのみ行うことを特徴とする音声認識装置。
（４）、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のｎフレームの情報を用いて辞
書のそれと同様に類似度を求めてｌ個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチテンプレート
手段を有する音声認識装置において、予備選択において
残されたｌ個に対して、本選択において上位ｍ個に同種
のテンプレートのグループがｍｅ選ばれた場合、次回以
降、本選択において当該種類のみのテンプレートを認識
対象とすることを特徴とする音声認識装置。