JPS61165797A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61165797A JPS61165797A JP60006084A JP608485A JPS61165797A JP S61165797 A JPS61165797 A JP S61165797A JP 60006084 A JP60006084 A JP 60006084A JP 608485 A JP608485 A JP 608485A JP S61165797 A JPS61165797 A JP S61165797A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- recognition
- section
- correction
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、誤認識された単音節音声を容易に確実に訂正
できる音声認識装置に関する。
できる音声認識装置に関する。
(従来技術と問題点)
音声認識装置は、多数の方式のものが発表されているが
、1oo4確実に認識できるものはなく、誤認識を訂正
するためのなんら1かの訂正機構が設けられている。従
来訂正機構としては、以下に示す様なものがある。
、1oo4確実に認識できるものはなく、誤認識を訂正
するためのなんら1かの訂正機構が設けられている。従
来訂正機構としては、以下に示す様なものがある。
キー操作もしくは、音声入力によシ訂正モードにした後
、 (1)再度、同じ音声を入力する。
、 (1)再度、同じ音声を入力する。
(2)第2位以下の候補群から正解をさがす。
上記(1)の方法では、同様の誤シをくシ返す可能性が
高いという欠点がある。(2)の方法では正解が著しく
低位の侯補となった場合、操作が煩しく時間を要する。
高いという欠点がある。(2)の方法では正解が著しく
低位の侯補となった場合、操作が煩しく時間を要する。
また、候補群の中に正解がふくまれていない時は訂正で
きないという不都合がある。
きないという不都合がある。
さらに(1)の同じ音声を入力するかわりに、(3)
認識対象の単音節と一対一に対応づけた比較的誤認識
の少ない単語を予め記憶させておき、その単語音声を入
力して誤認識した単音節の訂正をする。
認識対象の単音節と一対一に対応づけた比較的誤認識
の少ない単語を予め記憶させておき、その単語音声を入
力して誤認識した単音節の訂正をする。
という方法もあるが、この方法では上記一対一に対応づ
けられた音声のパタンも記憶しておかなくてはならない
ため、メモリ量を多く必要とし、操作者もその対応関係
を記憶しておかなければならないという欠点がある。
けられた音声のパタンも記憶しておかなくてはならない
ため、メモリ量を多く必要とし、操作者もその対応関係
を記憶しておかなければならないという欠点がある。
(発明の目的)
本発明の目的は、このような従来の欠点を除去せしめて
、操作の慎しさを伴なわず容易にしかも確実に1誤認識
された音声を訂正することのできる音声認識装置を提供
することKある。
、操作の慎しさを伴なわず容易にしかも確実に1誤認識
された音声を訂正することのできる音声認識装置を提供
することKある。
(発明の構成)
本発明によると、入力された音声を分析して特徴量を計
算する音声分析部と、音声区間を検出する音声検出部と
、検出された音声を認識する認識部と、前記音声区間が
闇値以上であった場合認識を行なう認識モードから認識
結果を訂正する訂正モードに変更するモード切り変え部
と、予め定められた単音節配列順序を記憶する単音節配
列順序記憶部と、前記検出された音声区間長が闇値以上
の音声の母音部と訂正用に入力された2つ以上の単音節
音声の認識結果と前記単音節配列順序とを照合して誤認
識された音声の訂正を行なう認識音声訂正部を有する音
声認識装置が得られる。
算する音声分析部と、音声区間を検出する音声検出部と
、検出された音声を認識する認識部と、前記音声区間が
闇値以上であった場合認識を行なう認識モードから認識
結果を訂正する訂正モードに変更するモード切り変え部
と、予め定められた単音節配列順序を記憶する単音節配
列順序記憶部と、前記検出された音声区間長が闇値以上
の音声の母音部と訂正用に入力された2つ以上の単音節
音声の認識結果と前記単音節配列順序とを照合して誤認
識された音声の訂正を行なう認識音声訂正部を有する音
声認識装置が得られる。
(発明の原理)
次に本発明の原理について述べる。認識モードにおける
動作は(従来技術と問題点)で述べた如〈従来と同じで
よいので詳細は省略する。今、操作者が単音節音声「ブ
」の訂正を行なう場合を考える。まず、操作者は、単音
節音声「グ」の母音「つ」を通常の単音節音声よりも長
く引き延ばして発声するととくよって、認識装置のモー
ドを再登録モードに切シ変えるとともに、母音「つ」を
認識させる。以下、この引き延ばした音声を母音部引き
延ばし音声と称する。次に所定の単音節順序例えば50
音忙従って、「パ」桁の単音節[パ。
動作は(従来技術と問題点)で述べた如〈従来と同じで
よいので詳細は省略する。今、操作者が単音節音声「ブ
」の訂正を行なう場合を考える。まず、操作者は、単音
節音声「グ」の母音「つ」を通常の単音節音声よりも長
く引き延ばして発声するととくよって、認識装置のモー
ドを再登録モードに切シ変えるとともに、母音「つ」を
認識させる。以下、この引き延ばした音声を母音部引き
延ばし音声と称する。次に所定の単音節順序例えば50
音忙従って、「パ」桁の単音節[パ。
ビ、グ・・Jを発声して、「パ」桁であることを認識さ
せる。認識装置は「つ」段と「パ」桁という情報から、
訂正する単音節が「プ」であることを認識する。これK
よりてギー操作を行なわすK。
せる。認識装置は「つ」段と「パ」桁という情報から、
訂正する単音節が「プ」であることを認識する。これK
よりてギー操作を行なわすK。
容易に誤認識した音声を訂正できる。
(実施例)
以下、本発明の実施例について図面を参照して詳細に説
明する。
明する。
第1図は、本発明の一実施例を示す音声認識装置のブロ
ック図である。マイクロフォンlよシ入力された入力音
声信号は、音声分析部2に送られそこでんつ変換、プリ
エンファシス等が行なわれた後周波数分析され、特徴パ
ラメータであるスペクトルバタンとパワーが計算される
。音声検出部3では音声のパワーを監視することたより
音声区間が切シ出される。そして、モード切り換え部で
後述の如く、認識モード、訂正モードとモード−の選択
が行なわれた後、音声区間の特徴パラメータが認識部5
へ送られる。認識部5では入力“音声の特徴パラメータ
と、前もって登録されている単音節音声の特徴パターン
との類似度が計算され、その類似度を比較して最大の類
似度をもつ特徴パターンのカテゴリが認識結果として選
ばれる。これらの音声分析、音声検出、認識等の機能は
従来と同じであってよく、特願昭51−61984号明
細書。
ック図である。マイクロフォンlよシ入力された入力音
声信号は、音声分析部2に送られそこでんつ変換、プリ
エンファシス等が行なわれた後周波数分析され、特徴パ
ラメータであるスペクトルバタンとパワーが計算される
。音声検出部3では音声のパワーを監視することたより
音声区間が切シ出される。そして、モード切り換え部で
後述の如く、認識モード、訂正モードとモード−の選択
が行なわれた後、音声区間の特徴パラメータが認識部5
へ送られる。認識部5では入力“音声の特徴パラメータ
と、前もって登録されている単音節音声の特徴パターン
との類似度が計算され、その類似度を比較して最大の類
似度をもつ特徴パターンのカテゴリが認識結果として選
ばれる。これらの音声分析、音声検出、認識等の機能は
従来と同じであってよく、特願昭51−61984号明
細書。
特公昭56−28279号公報1%願昭49−2418
号明細書等に述ぺられておシ、また本発明の要旨には直
接関係しないのでモード切シ変え部4の動作は、現時点
が認識モードである場合、入力音声区間が閾値以下なら
認識モードのまま、入力音声区間が闇値以上なら訂正モ
ードに変更される。また、現時点が訂正モードである場
合、訂正音声認識部6かも訂正終了信号が送られたら認
識モードになる。
号明細書等に述ぺられておシ、また本発明の要旨には直
接関係しないのでモード切シ変え部4の動作は、現時点
が認識モードである場合、入力音声区間が閾値以下なら
認識モードのまま、入力音声区間が闇値以上なら訂正モ
ードに変更される。また、現時点が訂正モードである場
合、訂正音声認識部6かも訂正終了信号が送られたら認
識モードになる。
本発明の原理は、訂正モードにおいて適用される。操作
者が誤認識され九結果を「プJと訂正したい場合、「プ
」の母音「つ」を通常の単音節よシ長く引き延ばして発
声(1秒穆度)シ、認識装置を訂正モードに切シ変える
とともに、母音「つ」を認識させる。次に所定の単音節
順序例えば50音順に従って、パ桁の単音節を順に2語
以上「パ。
者が誤認識され九結果を「プJと訂正したい場合、「プ
」の母音「つ」を通常の単音節よシ長く引き延ばして発
声(1秒穆度)シ、認識装置を訂正モードに切シ変える
とともに、母音「つ」を認識させる。次に所定の単音節
順序例えば50音順に従って、パ桁の単音節を順に2語
以上「パ。
ビ2グ・・・jを発声してパ桁の子音であることを認識
させる。この発声は区切って発声されるが、ポーズは短
かくても良い。そして「つ1段と「パ」桁という情報か
ら、訂正すべき単音節「プ」を認識させる。以下、その
動作を詳細に述べる。
させる。この発声は区切って発声されるが、ポーズは短
かくても良い。そして「つ1段と「パ」桁という情報か
ら、訂正すべき単音節「プ」を認識させる。以下、その
動作を詳細に述べる。
第2図に認識声訂正部6のブロック図を示す。
制御部61は、モード切ヤ換え部4かも、訂正モードを
示す信号を受けとると、認識部5から、認識結果カテゴ
リ「つ」を受けとシ、認識候補ラティス記憶部62に記
憶させる。まず、母音「つ」の認識結果が領域62m
に格納される。なお、単音節における十分長く発声され
た母音の認識率は100%正解なることが知られている
ので、第1位の候補だけとする。次K「パ、ビ、ブ・・
・」の認識結果を認識部5から受けとり領域62b以降
に順次記憶する。子音部も含めた認識は、母音認識はど
高い認識率は期待できないので、第2位候補以降の認識
結果とその類似度も記憶する。記憶する候補数は予め定
めておき、本実施例では3位までの候補を記憶するもの
とする。無音区間が一定以上続いたら、音声入力終了と
判断して、制御部61は各部を以下の様に制御する。今
、操作者が訂正入力音声「パ、ビ、グ、ぺJと発声した
時の認識結果が、例えば第3図に示すようKなったとす
る。かっこ内の数字は類似度を表わし、その値が大きい
ほど正解である確立が高いとする。各認識結果候補は制
御部61の制御を受けて、比較部63に転送され、単音
節配列順序記憶部7に記憶された単音節配列順序と順次
比較される。そして等しい順序のものの類似度が加算器
64に送られ、類似度が加算され、最終的に単音節配列
順序記憶部7の順序と等しいすべての指名とその加算さ
れた類似度和が、指名記憶部65に記憶される。ただし
、認識候補ラティス記憶部62の領域62aに記憶され
ている母音の段の音声(表1の場合は「プ」 )につい
ては、先に誤認識されていて、この場合も3位までの中
に正確が含まれていない確立が高いので比較は行なわな
い。例えば認識候補ラティス記憶部62に記憶されてい
る認識結果が第3図のようだとすると順次比較された結
果として指名記憶部65にパ桁類似度和(15+18+
17=) 50.7桁類似度和(11+14+10=)
35が記憶される。次に制御部61の制御により指名記
憶部65から各指名の類似度和が順次比較部63に転送
されて、大小比較され最大の類似度和をもつ指名「パ桁
」が制御部61に送られる。制御部61では「パ桁」と
認識候補ラティス記憶部62の領域62m に記憶され
ている「つ段」という情報とを、単音節配列順序記憶部
7に記憶されている単音節列名と参照して単音節名「プ
」を判定する。そして、その単音節名「プ」が訂正され
六結果として表示部8に表示される。以上の動作が終了
したら、制御部61はモード切シ変え部に訂正終了信号
を送シ、認識モードにもどシ再び認識が行なわれる。
示す信号を受けとると、認識部5から、認識結果カテゴ
リ「つ」を受けとシ、認識候補ラティス記憶部62に記
憶させる。まず、母音「つ」の認識結果が領域62m
に格納される。なお、単音節における十分長く発声され
た母音の認識率は100%正解なることが知られている
ので、第1位の候補だけとする。次K「パ、ビ、ブ・・
・」の認識結果を認識部5から受けとり領域62b以降
に順次記憶する。子音部も含めた認識は、母音認識はど
高い認識率は期待できないので、第2位候補以降の認識
結果とその類似度も記憶する。記憶する候補数は予め定
めておき、本実施例では3位までの候補を記憶するもの
とする。無音区間が一定以上続いたら、音声入力終了と
判断して、制御部61は各部を以下の様に制御する。今
、操作者が訂正入力音声「パ、ビ、グ、ぺJと発声した
時の認識結果が、例えば第3図に示すようKなったとす
る。かっこ内の数字は類似度を表わし、その値が大きい
ほど正解である確立が高いとする。各認識結果候補は制
御部61の制御を受けて、比較部63に転送され、単音
節配列順序記憶部7に記憶された単音節配列順序と順次
比較される。そして等しい順序のものの類似度が加算器
64に送られ、類似度が加算され、最終的に単音節配列
順序記憶部7の順序と等しいすべての指名とその加算さ
れた類似度和が、指名記憶部65に記憶される。ただし
、認識候補ラティス記憶部62の領域62aに記憶され
ている母音の段の音声(表1の場合は「プ」 )につい
ては、先に誤認識されていて、この場合も3位までの中
に正確が含まれていない確立が高いので比較は行なわな
い。例えば認識候補ラティス記憶部62に記憶されてい
る認識結果が第3図のようだとすると順次比較された結
果として指名記憶部65にパ桁類似度和(15+18+
17=) 50.7桁類似度和(11+14+10=)
35が記憶される。次に制御部61の制御により指名記
憶部65から各指名の類似度和が順次比較部63に転送
されて、大小比較され最大の類似度和をもつ指名「パ桁
」が制御部61に送られる。制御部61では「パ桁」と
認識候補ラティス記憶部62の領域62m に記憶され
ている「つ段」という情報とを、単音節配列順序記憶部
7に記憶されている単音節列名と参照して単音節名「プ
」を判定する。そして、その単音節名「プ」が訂正され
六結果として表示部8に表示される。以上の動作が終了
したら、制御部61はモード切シ変え部に訂正終了信号
を送シ、認識モードにもどシ再び認識が行なわれる。
以上、本発明の原理を実施例に基づいて説明したが、こ
れらの記載は本発明の範囲を限定するものではない。特
に、第1図の単音節配列順序記憶部7に記憶させる順序
を50音順としたが、他の所定の順序としても良いのは
明白である。また、訂正入力音を4語入力する例をあげ
であるが、4語に限らず2語以上であれば良い。
れらの記載は本発明の範囲を限定するものではない。特
に、第1図の単音節配列順序記憶部7に記憶させる順序
を50音順としたが、他の所定の順序としても良いのは
明白である。また、訂正入力音を4語入力する例をあげ
であるが、4語に限らず2語以上であれば良い。
(発明の効果)
以上に述べたとおり、本発明忙よればキー操作の煩わし
さを伴わず、誤認識された音声を容易にしかも確実に訂
正することができる音声認識装置が得られる。
さを伴わず、誤認識された音声を容易にしかも確実に訂
正することができる音声認識装置が得られる。
第1図及び第2図は、本発明の一実施例を示すブロック
図、第3図は本発明の詳細な説明する九めの図である。 図において、 1−・iイク四ホン、2・・・音声分析部、3・・・音
声検出部、4・・・モード切り変え部、5・・・認識部
、6・・・認識音声訂正部、7・・・単音節配列順序記
憶部、8・・・表示部、61・・・制御部、62・・・
認識候補ラティス記憶部、63・−比較部、64−・加
算器、65・−指名記憶部 を表6す・ 1.、、ア、、よ内厚 晋
、つL
J多 Z 図
図、第3図は本発明の詳細な説明する九めの図である。 図において、 1−・iイク四ホン、2・・・音声分析部、3・・・音
声検出部、4・・・モード切り変え部、5・・・認識部
、6・・・認識音声訂正部、7・・・単音節配列順序記
憶部、8・・・表示部、61・・・制御部、62・・・
認識候補ラティス記憶部、63・−比較部、64−・加
算器、65・−指名記憶部 を表6す・ 1.、、ア、、よ内厚 晋
、つL
J多 Z 図
Claims (1)
- 入力された音声を分析して特徴量を計算する音声分析部
と、音声区間を検出する音声検出部と、検出された音声
を認識する認識部とを有する音声認識装置において、前
記音声検出部で検出された音声区間長が閾値以上であっ
た場合、認識を行なう認識モードから認識結果を訂正す
る訂正モードに変更するモード切り換え部と、予め定め
られた単音節配列順序を記憶する単音節配列順序記憶部
と、前記検出された声区間長が閾値以上の音声の母音部
と訂正用に入力された2つ以上の単音節音声の認識結果
と前記単音節配列順序とを照合して誤認識された音声の
訂正を行なう認識音声訂正部を有することを特徴とした
音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60006084A JPS61165797A (ja) | 1985-01-17 | 1985-01-17 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60006084A JPS61165797A (ja) | 1985-01-17 | 1985-01-17 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61165797A true JPS61165797A (ja) | 1986-07-26 |
Family
ID=11628675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60006084A Pending JPS61165797A (ja) | 1985-01-17 | 1985-01-17 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61165797A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06104022A (ja) * | 1992-09-18 | 1994-04-15 | Yazaki Corp | 圧接ターミナル |
-
1985
- 1985-01-17 JP JP60006084A patent/JPS61165797A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06104022A (ja) * | 1992-09-18 | 1994-04-15 | Yazaki Corp | 圧接ターミナル |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JPH07219579A (ja) | 音声認識装置 | |
JP3523382B2 (ja) | 音声認識装置及び音声認識方法 | |
JPS6316766B2 (ja) | ||
JPH04248596A (ja) | 音声認識訂正装置 | |
JPS597998A (ja) | 連続音声認識装置 | |
JPS61165797A (ja) | 音声認識装置 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JP2006039382A (ja) | 音声認識装置 | |
JP3039453B2 (ja) | 音声認識装置 | |
JP2686085B2 (ja) | 音声認識システム | |
WO2019030810A1 (ja) | 音声認識装置および音声認識方法 | |
JPH1063295A (ja) | 認識結果を自動訂正する単語音声認識方法およびこの方法を実施する装置 | |
JP2547611B2 (ja) | 文章作成システム | |
JPH08146996A (ja) | 音声認識装置 | |
JPS62111295A (ja) | 音声認識装置 | |
JPS61165796A (ja) | 音声認識装置 | |
JPS6312000A (ja) | 音声認識装置 | |
JPS62150298A (ja) | パタンマツチング方式 | |
JPS63118198A (ja) | 音声認識装置 | |
JPS62166399A (ja) | 音声認識方法 | |
JPH08335093A (ja) | 音声認識方法およびこの方法を実施する装置 | |
JPH0585918B2 (ja) | ||
JPS62119600A (ja) | 単語音声認識装置 | |
JPS62218997A (ja) | 単語音声認識装置 |