JPH04232997A - 音声認識装置における認識結果表示方式 - Google Patents
音声認識装置における認識結果表示方式Info
- Publication number
- JPH04232997A JPH04232997A JP2408738A JP40873890A JPH04232997A JP H04232997 A JPH04232997 A JP H04232997A JP 2408738 A JP2408738 A JP 2408738A JP 40873890 A JP40873890 A JP 40873890A JP H04232997 A JPH04232997 A JP H04232997A
- Authority
- JP
- Japan
- Prior art keywords
- section
- candidate
- recognition
- candidates
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 abstract description 4
- 239000000872 buffer Substances 0.000 description 11
- 101100112111 Caenorhabditis elegans cand-1 gene Proteins 0.000 description 6
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は音声認識装置における認
識結果表示方式に関し、具体的には音声によってデータ
等を入力可能な装置(ワードプロセッサ、パソコン等)
において好適に実施される。
識結果表示方式に関し、具体的には音声によってデータ
等を入力可能な装置(ワードプロセッサ、パソコン等)
において好適に実施される。
【0002】
【従来の技術】音声による入力にはキーボード入力等と
異なり、“確からしさ”が含まれている。従って、現状
レベルの音声認識装置では入力された音声を誤認識し、
正確に入力されないこともある。そこで、音声認識装置
では、入力された音声に対して認識処理を行った結果得
られた複数の認識候補に対して文法的に正しいと思われ
る候補文字列を作成し、“確からしい”候補から順に画
面上に表示している。
異なり、“確からしさ”が含まれている。従って、現状
レベルの音声認識装置では入力された音声を誤認識し、
正確に入力されないこともある。そこで、音声認識装置
では、入力された音声に対して認識処理を行った結果得
られた複数の認識候補に対して文法的に正しいと思われ
る候補文字列を作成し、“確からしい”候補から順に画
面上に表示している。
【0003】例えば、入力音声「/こ/く/み/ん/は
/」に対する単音節認識結果として表1に示すような音
節ラティスが形成される。
/」に対する単音節認識結果として表1に示すような音
節ラティスが形成される。
【0004】
【表1】
【0005】認識では、あいまいさを含むため、表1に
示したように音節の候補として出力され、これに基づい
て音節単位の認識結果の組み合わせを考えて文節の候補
文字列へと展開し、“確からしさ”の順に表2に示す候
補文字列を作成する。
示したように音節の候補として出力され、これに基づい
て音節単位の認識結果の組み合わせを考えて文節の候補
文字列へと展開し、“確からしさ”の順に表2に示す候
補文字列を作成する。
【0006】
【表2】
【0007】この候補文字列をメニュー方式で例えば図
4のように表示していた。オペレータは、このメニュー
表示を見て正解の文字列を選択し、正解の文字列をカー
ソル等により指示して音声入力を完了する(この技術の
詳細については、特開昭60−205594号公報を参
照)。
4のように表示していた。オペレータは、このメニュー
表示を見て正解の文字列を選択し、正解の文字列をカー
ソル等により指示して音声入力を完了する(この技術の
詳細については、特開昭60−205594号公報を参
照)。
【0008】
【発明が解決しようとする課題】上記表2に示されるよ
うに、入力音声に対する各候補文字列の違いは1文字程
度のごくわずかなものであることが多く、その結果メニ
ュー表示(図4)は、類似した候補文字列が多数並んだ
状態となる。従って、このメニュー表示の候補文字列の
中から正解の文字列を選択する際、オペレータは各候補
相互の違いがわかりにくかった。そのため選択操作にお
いて、オペレータに余計な負担がかかり、正解文字列の
選択誤りもよく起こっていた。本発明は、上記問題点に
鑑み、オペレータが候補文字列の相互の違いを明確に認
識でき、候補文字列の選択作業が容易となって正解文字
列の選択誤りを減少させる音声認識装置における認識結
果表示方式を提供するものである。
うに、入力音声に対する各候補文字列の違いは1文字程
度のごくわずかなものであることが多く、その結果メニ
ュー表示(図4)は、類似した候補文字列が多数並んだ
状態となる。従って、このメニュー表示の候補文字列の
中から正解の文字列を選択する際、オペレータは各候補
相互の違いがわかりにくかった。そのため選択操作にお
いて、オペレータに余計な負担がかかり、正解文字列の
選択誤りもよく起こっていた。本発明は、上記問題点に
鑑み、オペレータが候補文字列の相互の違いを明確に認
識でき、候補文字列の選択作業が容易となって正解文字
列の選択誤りを減少させる音声認識装置における認識結
果表示方式を提供するものである。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するために、単語、文節、或は文章単位で発声された
音声を認識し、複数の認識候補に対応する文字列を表示
する音声認識装置において、前記各候補文字列を、その
隣接する候補文字列との相違点を強調して表示すること
を特徴としている。
成するために、単語、文節、或は文章単位で発声された
音声を認識し、複数の認識候補に対応する文字列を表示
する音声認識装置において、前記各候補文字列を、その
隣接する候補文字列との相違点を強調して表示すること
を特徴としている。
【0010】
【作用】本発明によれば、音声認識処理の結果得られた
複数の認識候補に対応する文字列を表示する際各候補文
字列はその隣接の候補文字列との相違点が強調されて表
示される。
複数の認識候補に対応する文字列を表示する際各候補文
字列はその隣接の候補文字列との相違点が強調されて表
示される。
【0011】
【実施例】以下、本発明の認識結果表示方式の一実施例
を図面を参照しながら説明する。図1は、本方式を採用
した音声認識装置の機能構成を示すブロック図である。 音声入力用マイク1から入力された音声は、音声の各種
分析を行う音声分析部2、音節区間の検出を行う音節区
間検出部3、音節標準パターンとの尤度を用いて認識を
行う音節認識部4及び辞書部6を参照して文法的に正し
い候補列を作成する言語処理部5を経て最終的に表示部
7にて候補列が表示される。上記音声分析部2から言語
処理部5までの処理は従来通りであり、本発明の特徴は
候補列を表示する表示部7の処理にある。
を図面を参照しながら説明する。図1は、本方式を採用
した音声認識装置の機能構成を示すブロック図である。 音声入力用マイク1から入力された音声は、音声の各種
分析を行う音声分析部2、音節区間の検出を行う音節区
間検出部3、音節標準パターンとの尤度を用いて認識を
行う音節認識部4及び辞書部6を参照して文法的に正し
い候補列を作成する言語処理部5を経て最終的に表示部
7にて候補列が表示される。上記音声分析部2から言語
処理部5までの処理は従来通りであり、本発明の特徴は
候補列を表示する表示部7の処理にある。
【0012】図2に表示部7の処理動作を説明するフロ
ーチャート図を示す。ステップ1で1番目の候補を通常
文字表示した後、ステップ2でバッファcand1に1
番目の候補を格納する。ステップ3でnを2とし、ステ
ップ4で全候補数がn個以上存在するか否か判断する。 全候補数がn個未満であれば処理を終了し、n個以上で
あればステップ5に進んで、バッファcandにn番目
の候補を格納する。ステップ6でiを1とした後、ステ
ップ7でバッファcandに格納された候補の文字数と
バッファcand1に格納された候補の文字数とが共に
i個以上であるか否か判断する。共にi個以上であれば
バッファcandに格納された候補のi番目の文字とバ
ッファcand1に格納された候補のi番目の文字とが
一致しているか否か判断する。一致しておればステップ
9でバッファcandに格納された候補のi番目の文字
を通常文字表示する。一方、異なる場合はステップ10
でバッファcandに格納された候補のi番目の文字を
強調文字で表示する。そしてステップ11でiを+1更
新させてステップ7に戻り処理を続ける。又、ステップ
7でバッファcand、cand1の候補文字数が共に
i個未満であれば、ステップ12に進み、バッファca
ndに格納された候補をバッファcand1に移し、ス
テップ13でnを+1更新させた後、ステップ4に戻っ
て処理を続ける。上記動作を全候補に対して行い、1番
目の候補列から順に隣接してメニュー表示すると、隣接
する候補列同士はその相違する文字が強調して表示され
る。
ーチャート図を示す。ステップ1で1番目の候補を通常
文字表示した後、ステップ2でバッファcand1に1
番目の候補を格納する。ステップ3でnを2とし、ステ
ップ4で全候補数がn個以上存在するか否か判断する。 全候補数がn個未満であれば処理を終了し、n個以上で
あればステップ5に進んで、バッファcandにn番目
の候補を格納する。ステップ6でiを1とした後、ステ
ップ7でバッファcandに格納された候補の文字数と
バッファcand1に格納された候補の文字数とが共に
i個以上であるか否か判断する。共にi個以上であれば
バッファcandに格納された候補のi番目の文字とバ
ッファcand1に格納された候補のi番目の文字とが
一致しているか否か判断する。一致しておればステップ
9でバッファcandに格納された候補のi番目の文字
を通常文字表示する。一方、異なる場合はステップ10
でバッファcandに格納された候補のi番目の文字を
強調文字で表示する。そしてステップ11でiを+1更
新させてステップ7に戻り処理を続ける。又、ステップ
7でバッファcand、cand1の候補文字数が共に
i個未満であれば、ステップ12に進み、バッファca
ndに格納された候補をバッファcand1に移し、ス
テップ13でnを+1更新させた後、ステップ4に戻っ
て処理を続ける。上記動作を全候補に対して行い、1番
目の候補列から順に隣接してメニュー表示すると、隣接
する候補列同士はその相違する文字が強調して表示され
る。
【0013】文字の強調表示の形態は何通りか考えられ
、図3に具体的な表示例を示す。これら表示例は従来技
術で説明したものと同様の「こ/く/み/ん/は/」を
入力音声とした時に得られる候補列を例としている。 図3(a)は隣接する各候補列の相違する文字にアンダ
ーラインを付した例、図3(b)は網かけを行った例、
図3(c)は文字サイズを大きくした例である。これら
の強調表示は、ワードプロセッサ等では周知の表示方法
であり、ここでは特に表示方法の説明を行なわない。
、図3に具体的な表示例を示す。これら表示例は従来技
術で説明したものと同様の「こ/く/み/ん/は/」を
入力音声とした時に得られる候補列を例としている。 図3(a)は隣接する各候補列の相違する文字にアンダ
ーラインを付した例、図3(b)は網かけを行った例、
図3(c)は文字サイズを大きくした例である。これら
の強調表示は、ワードプロセッサ等では周知の表示方法
であり、ここでは特に表示方法の説明を行なわない。
【0014】
【発明の効果】本発明によれば、入力音声に対する複数
の認識候補をメニュー表示する際、隣接する候補間での
相違する文字が強調されて表示されるため、オペレータ
は各候補間の違いを的確に把握でき、正解候補の選択操
作が容易となる。
の認識候補をメニュー表示する際、隣接する候補間での
相違する文字が強調されて表示されるため、オペレータ
は各候補間の違いを的確に把握でき、正解候補の選択操
作が容易となる。
【0015】従って、認識結果に対する確認作業が容易
となり、発声された単語、文節、或は文章の決定に要す
る時間を短縮することができる。
となり、発声された単語、文節、或は文章の決定に要す
る時間を短縮することができる。
【図1】本発明方式を実施する音声認識装置の機能構成
を示すブロック図である。
を示すブロック図である。
【図2】本発明の表示処理の一実施例を説明するフロー
チャート図である。
チャート図である。
【図3】メニュー表示の具体的な表示例である。
【図4】従来におけるメニュー表示の表示例である。
1 マイク
2 音声分析部
3 音節区間検出部
4 音節認識部
5 言語処理部
6 辞書部
7 表示部
Claims (1)
- 【請求項1】 単語、文節、或は文章単位で発声され
た音声を認識し、複数の認識候補に対応する文字列を表
示する音声認識装置において、前記各候補文字列を、そ
の隣接する候補文字列との相違点を強調して表示するこ
とを特徴とする音声認識装置における認識結果表示方式
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2408738A JPH04232997A (ja) | 1990-12-28 | 1990-12-28 | 音声認識装置における認識結果表示方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2408738A JPH04232997A (ja) | 1990-12-28 | 1990-12-28 | 音声認識装置における認識結果表示方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04232997A true JPH04232997A (ja) | 1992-08-21 |
Family
ID=18518156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2408738A Pending JPH04232997A (ja) | 1990-12-28 | 1990-12-28 | 音声認識装置における認識結果表示方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04232997A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006023572A (ja) * | 2004-07-08 | 2006-01-26 | Mitsubishi Electric Corp | 対話装置 |
JP2010139826A (ja) * | 2008-12-12 | 2010-06-24 | Toyota Motor Corp | 音声認識システム |
JP2018097123A (ja) * | 2016-12-12 | 2018-06-21 | トヨタ自動車株式会社 | 情報処理装置 |
-
1990
- 1990-12-28 JP JP2408738A patent/JPH04232997A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006023572A (ja) * | 2004-07-08 | 2006-01-26 | Mitsubishi Electric Corp | 対話装置 |
JP4684583B2 (ja) * | 2004-07-08 | 2011-05-18 | 三菱電機株式会社 | 対話装置 |
JP2010139826A (ja) * | 2008-12-12 | 2010-06-24 | Toyota Motor Corp | 音声認識システム |
JP2018097123A (ja) * | 2016-12-12 | 2018-06-21 | トヨタ自動車株式会社 | 情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
JP3762191B2 (ja) | 情報入力方法、情報入力装置及び記憶媒体 | |
JPH04232997A (ja) | 音声認識装置における認識結果表示方式 | |
JP4220151B2 (ja) | 音声対話装置 | |
JPS634206B2 (ja) | ||
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
JP4012228B2 (ja) | 情報入力方法、情報入力装置及び記憶媒体 | |
JPS6229796B2 (ja) | ||
JPH0630052B2 (ja) | 音声認識表示装置 | |
JP4797307B2 (ja) | 音声認識装置及び音声認識方法 | |
JP3036591B2 (ja) | 音声認識装置 | |
JPS62212870A (ja) | 文章読み上げ校正装置 | |
JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
JPH03221999A (ja) | 音声認識装置 | |
JPH05119793A (ja) | 音声認識方法及び装置 | |
JPS60205594A (ja) | 認識結果表示方式 | |
JPH10143503A (ja) | 音声ワードプロセッサ | |
JPH02298997A (ja) | 音声認識装置 | |
JPH06130989A (ja) | 音声認識装置 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JPS60200336A (ja) | 音声入力処理装置 | |
JPH05151259A (ja) | 文入力処理方式 | |
JPH0374426B2 (ja) | ||
JPH0458381A (ja) | 光学的文字読取装置 | |
JPS6365566A (ja) | カナ漢字変換装置 |