JPS6265089A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6265089A JPS6265089A JP60205924A JP20592485A JPS6265089A JP S6265089 A JPS6265089 A JP S6265089A JP 60205924 A JP60205924 A JP 60205924A JP 20592485 A JP20592485 A JP 20592485A JP S6265089 A JPS6265089 A JP S6265089A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- dictionary
- recognition device
- speech recognition
- templates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
挟恢分災
本発明は、音声認識装置に関する。
従来技術
マルチテンプレートを使用する音声認識装置において、
例えば、女性辞書、男性辞書、単音節辞書などの数種類
の辞書を有する場合、通常の単語と同様にLI&識処理
を行わねばならないため、処理時間が数倍かかる欠点を
有している。
例えば、女性辞書、男性辞書、単音節辞書などの数種類
の辞書を有する場合、通常の単語と同様にLI&識処理
を行わねばならないため、処理時間が数倍かかる欠点を
有している。
1−一匁
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、マルチテンプレートを使用する音声認識装置にお
いて、音声認識処理の高速化を図ることを目的としてな
されたものである。
特に、マルチテンプレートを使用する音声認識装置にお
いて、音声認識処理の高速化を図ることを目的としてな
されたものである。
豆−一双
本発明は、上記目的を達成するため、入力された音声の
特徴をある時間周期で抽出し、あらかしめ登録されてい
る単語辞書パターンとの類似度を算出し、最も類似度の
高いものを結果として出力する手段と、語頭又は語尾の
nフレームの情報を用いて辞書のそれと同様に類似度を
求めてQ個を残す予備選択手段と、同じ単語辞書を数種
類有するマルチプレート手段を有する音声認識装置にお
いて、予備選択において残されたQ個に対して上位に位
内に同種のテンプレートグループ内の単語が1個以上あ
る場合、前記Q個の対象単語について、当該種類のテン
プレートグループのみを本選択の対象とすること、或い
は、予備選択において残されたQ個の内、上位に位に同
種のテンプレートのグループが1回の内y回選ばれた場
合、残されたQ個の対象単語について本選択を当該種類
のテンプレートに対してのみ行うこと、或いは、予備選
択において残されたQ個に対して本選択において上位m
個に同種のテンプレートのグループがme選ばれた場合
、次回以降、本選択において当該種類のみのテンプレー
トを認識対象とすることを特徴としたものである。
特徴をある時間周期で抽出し、あらかしめ登録されてい
る単語辞書パターンとの類似度を算出し、最も類似度の
高いものを結果として出力する手段と、語頭又は語尾の
nフレームの情報を用いて辞書のそれと同様に類似度を
求めてQ個を残す予備選択手段と、同じ単語辞書を数種
類有するマルチプレート手段を有する音声認識装置にお
いて、予備選択において残されたQ個に対して上位に位
内に同種のテンプレートグループ内の単語が1個以上あ
る場合、前記Q個の対象単語について、当該種類のテン
プレートグループのみを本選択の対象とすること、或い
は、予備選択において残されたQ個の内、上位に位に同
種のテンプレートのグループが1回の内y回選ばれた場
合、残されたQ個の対象単語について本選択を当該種類
のテンプレートに対してのみ行うこと、或いは、予備選
択において残されたQ個に対して本選択において上位m
個に同種のテンプレートのグループがme選ばれた場合
、次回以降、本選択において当該種類のみのテンプレー
トを認識対象とすることを特徴としたものである。
マルチテンプレート方式の音声認識処理装置においては
1例えば男性と女性のマルチテンプレートの場合は、2
種類の同一辞書となり、単音節などにおいては数種類の
同一辞書を持つ、従って。
1例えば男性と女性のマルチテンプレートの場合は、2
種類の同一辞書となり、単音節などにおいては数種類の
同一辞書を持つ、従って。
認識処理は対象単語すべてに対して行わねばならず、こ
の処理時間は単一辞書に対して同一単語の数倍かかるこ
とになる。しかし、本来、認識装置の使用者は頻繁に入
れ替わる場合は比較的少なく、本発明はこの点に鑑みて
なされたもので、その使用者のタイプに沿って対象単語
を減らして認識処理を行おうとするものである。以下、
本発明の実施例に基づいて説明する。
の処理時間は単一辞書に対して同一単語の数倍かかるこ
とになる。しかし、本来、認識装置の使用者は頻繁に入
れ替わる場合は比較的少なく、本発明はこの点に鑑みて
なされたもので、その使用者のタイプに沿って対象単語
を減らして認識処理を行おうとするものである。以下、
本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で0図中、lはマイク、2は前処理部、3は
特徴抽出部、4は予備選択処理部、5は辞書グループ部
、6は上位Q単語のグループ分は部、7は指定辞書抽出
部、8は本選択処理部、9は結果出力部で、以下、本発
明の実施例につき、第3図に示すBTSP方式を用いて
説明する。なお、第3図において、Aは音声パワーの波
形、Bは閾値、Cは音声区間の波形で1周知のように、
音声パワー波形がある閾値Bを越える区間を音声区間と
するものである。
ロック線図で0図中、lはマイク、2は前処理部、3は
特徴抽出部、4は予備選択処理部、5は辞書グループ部
、6は上位Q単語のグループ分は部、7は指定辞書抽出
部、8は本選択処理部、9は結果出力部で、以下、本発
明の実施例につき、第3図に示すBTSP方式を用いて
説明する。なお、第3図において、Aは音声パワーの波
形、Bは閾値、Cは音声区間の波形で1周知のように、
音声パワー波形がある閾値Bを越える区間を音声区間と
するものである。
第1図において、認識処理はます語頭のnフレームが入
力された時点で入力の語頭nフレームを入力し、そのデ
ータと辞書のそれをマツチング処理を行い、対象総単語
から類似度の高い順にQ単語を抽出する。このQ!1.
語に対して音声終端を検出したら、このQ単語に対して
本選択処理を行い最高類似度のものを結果として出力す
る。この様な!!!識処理において、例えば、辞書が男
性9女性の2種のテンプレートを有している場合を考え
ると、この場合において予備選択の上位に位の中に例え
ば、男性の辞書系列がi個以上存在したとすると、その
話者は男性であると判断し、本選択処理においては、Ω
単語の内、男性辞書のみを本選択の対象とし本選択処理
を行う。
力された時点で入力の語頭nフレームを入力し、そのデ
ータと辞書のそれをマツチング処理を行い、対象総単語
から類似度の高い順にQ単語を抽出する。このQ!1.
語に対して音声終端を検出したら、このQ単語に対して
本選択処理を行い最高類似度のものを結果として出力す
る。この様な!!!識処理において、例えば、辞書が男
性9女性の2種のテンプレートを有している場合を考え
ると、この場合において予備選択の上位に位の中に例え
ば、男性の辞書系列がi個以上存在したとすると、その
話者は男性であると判断し、本選択処理においては、Ω
単語の内、男性辞書のみを本選択の対象とし本選択処理
を行う。
第2図は、本発明の他の実施例を説明するための電気的
ブロック線図で、図中、10は上位m単語の結果側部で
、この実施例は上記に更に過去X回の実績を考慮したも
の、つまり話者の変化はそれ程大きくないと考え、過去
X回の認識の内、y回が上位に位内に、片方の辞書系列
がi個以上存在した場合のみ、本選択の対象を片方の辞
書系列に指定するようにしたものである。
ブロック線図で、図中、10は上位m単語の結果側部で
、この実施例は上記に更に過去X回の実績を考慮したも
の、つまり話者の変化はそれ程大きくないと考え、過去
X回の認識の内、y回が上位に位内に、片方の辞書系列
がi個以上存在した場合のみ、本選択の対象を片方の辞
書系列に指定するようにしたものである。
なお、上記においては、予備選択に注目したが、本選択
結果についても同様のことがいえる。但し、その結果は
次回以降に用いることになる。つまり、予備選択におい
て残されたΩ単語に対して本選択を行い、その結果の上
位m個の内、同種のテンプレートがms個あった場合、
次回においては、そのテンプレートのみを認識の対象と
する。このようにすれば話者の変化の少いことを考慮し
て、次回以降の認識対象を減らすことができ、認識速度
を速めることができる。
結果についても同様のことがいえる。但し、その結果は
次回以降に用いることになる。つまり、予備選択におい
て残されたΩ単語に対して本選択を行い、その結果の上
位m個の内、同種のテンプレートがms個あった場合、
次回においては、そのテンプレートのみを認識の対象と
する。このようにすれば話者の変化の少いことを考慮し
て、次回以降の認識対象を減らすことができ、認識速度
を速めることができる。
以上の場合、話者の変化が少いことを前提としたが、当
然1例えば話者が男性から女性へ変化した場合、上記の
如くその前の段階での結果で辞書が固定された場合、は
とんどの場合、類似度が低いか1選ばれた1位と2位の
比が1に近い、従って、その場合には、この条件を用い
、該条件の場合は前述の辞書の選択を中止し、残された
Ω単語に対してすべて本認識を行う、このようにすれば
。
然1例えば話者が男性から女性へ変化した場合、上記の
如くその前の段階での結果で辞書が固定された場合、は
とんどの場合、類似度が低いか1選ばれた1位と2位の
比が1に近い、従って、その場合には、この条件を用い
、該条件の場合は前述の辞書の選択を中止し、残された
Ω単語に対してすべて本認識を行う、このようにすれば
。
話者が変わってもその変化に随意対応して行き。
処理速度を高速化することができる。
羞−一果
以上の説明から明らかなように、本発明によると、マル
チテンプレートにおける処理速度の向上をはかることが
できる。
チテンプレートにおける処理速度の向上をはかることが
できる。
第1図及び第2図は、それぞれ本発明の詳細な説明する
ための電気的ブロック線図、第3図は、BTSP方式に
おける音声認識処理の流れを示す図である。 1・・・マイク、2・・・前処理部、3・・・特徴抽出
部、4・・・予備選択処理部、5・・・辞書グループ部
、6・・・上位QmUJのグループ分は部、7・・・指
定辞書抽出部、8・・・本選択処理部、9・・・結果出
力部、10・・・上位m単語の結果側部。 特許出願人 株式会社 リコー 第 1 図 第2図 第3図
ための電気的ブロック線図、第3図は、BTSP方式に
おける音声認識処理の流れを示す図である。 1・・・マイク、2・・・前処理部、3・・・特徴抽出
部、4・・・予備選択処理部、5・・・辞書グループ部
、6・・・上位QmUJのグループ分は部、7・・・指
定辞書抽出部、8・・・本選択処理部、9・・・結果出
力部、10・・・上位m単語の結果側部。 特許出願人 株式会社 リコー 第 1 図 第2図 第3図
Claims (4)
- (1)、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のnフレームの情報を用いて辞
書のそれと同様に類似度を求めてl個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチテンプレート
手段を有する音声認識装置において、予備選択において
残されたl個に対して上位k位内に同種のテンプレート
グループ内の単語がi個以上ある場合、前記l個の対象
単語について、当該種類のテンプレートグループのみを
本選択の対象とすることを特徴とする音声認識装置。 - (2)、1位の得点がある類似度の閾値以下になつた場
合、又は1位と2位の比率がある値以下になつた場合、
再び全体を認識対象とすることを特徴とする特許請求の
範囲第(1)項に記載の音声認識装置。 - (3)、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のnフレームの情報を用いて辞
書のそれと同様に類似度を求めてl個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチプレート手段
を有する音声認識装置において、予備選択において残さ
れたl個の内、上位k位に同種のテンプレートのグルー
プがx回の内y回選ばれた場合、前記残されたl個の対
象単語について本選択を当該種類のテンプレートに対し
てのみ行うことを特徴とする音声認識装置。 - (4)、入力された音声の特徴をある時間周期で抽出し
、あらかじめ登録されている単語辞書パターンとの類似
度を算出し、最も類似度の高いものを結果として出力す
る手段と、語頭又は語尾のnフレームの情報を用いて辞
書のそれと同様に類似度を求めてl個を残す予備選択手
段と、同じ単語辞書を数種類有するマルチテンプレート
手段を有する音声認識装置において、予備選択において
残されたl個に対して、本選択において上位m個に同種
のテンプレートのグループがme選ばれた場合、次回以
降、本選択において当該種類のみのテンプレートを認識
対象とすることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60205924A JPS6265089A (ja) | 1985-09-18 | 1985-09-18 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60205924A JPS6265089A (ja) | 1985-09-18 | 1985-09-18 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6265089A true JPS6265089A (ja) | 1987-03-24 |
Family
ID=16514992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60205924A Pending JPS6265089A (ja) | 1985-09-18 | 1985-09-18 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6265089A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127023U (ja) * | 1990-03-31 | 1991-12-20 | ||
JP2012529080A (ja) * | 2009-06-04 | 2012-11-15 | マイクロソフト コーポレーション | 再認識および統計的分類を使用する認識 |
-
1985
- 1985-09-18 JP JP60205924A patent/JPS6265089A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127023U (ja) * | 1990-03-31 | 1991-12-20 | ||
JP2012529080A (ja) * | 2009-06-04 | 2012-11-15 | マイクロソフト コーポレーション | 再認識および統計的分類を使用する認識 |
US8930179B2 (en) | 2009-06-04 | 2015-01-06 | Microsoft Corporation | Recognition using re-recognition and statistical classification |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5588073A (en) | Online handwritten character recognizing system and method thereof | |
EP0784280A3 (en) | Auto-index method | |
JPS6265089A (ja) | 音声認識装置 | |
Bagde et al. | A handwritten recognition for free style Marathi script using genetic algorithm | |
JPS6173200A (ja) | 音声認識装置 | |
JP2532618B2 (ja) | ピッチ抽出装置 | |
JPS61261798A (ja) | 音声認識装置 | |
JPS61133995A (ja) | 音声認識方式 | |
JP2654008B2 (ja) | 音声認識方式 | |
JPS62133499A (ja) | 音声認識装置 | |
JPS5739478A (en) | Recognition system | |
JPS608990A (ja) | 文字認識方式 | |
JPS62262898A (ja) | 音声認識装置 | |
JPS56160200A (en) | Hearing aid | |
JPH04115383A (ja) | オンライン手書き文字認識装置の文字認識方式 | |
EP0856835A3 (en) | Speaker recognition device | |
JPS6167899A (ja) | 音声認識装置 | |
JPH07104911B2 (ja) | パタ−ン認識装置 | |
CN113223497A (zh) | 智能语音识别处理方法及系统 | |
JPS55138179A (en) | Character recognition unit | |
JPS6075897A (ja) | 不特定話者用音声認識方式 | |
JPS60260096A (ja) | 音声認識装置 | |
JPS6347797A (ja) | 単語音声予備選択方式 | |
JPS6283799A (ja) | 音声認識装置 | |
JPS575182A (en) | Character recognition processing system |