JPH11231891A

JPH11231891A - 音声を認識するシステムおよび方法

Info

Publication number: JPH11231891A
Application number: JP10325079A
Authority: JP
Inventors: Jennifer Ceil Lai; ジェニファー・セイル・ライ; John George Vergo; ジョン・ジョージ・ヴァーゴ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-12-16
Filing date: 1998-11-16
Publication date: 1999-08-27
Also published as: KR19990062566A; US6006183A; EP0924687A3; EP0924687A2; KR100297514B1

Abstract

(57)【要約】【課題】変換されたテキストを、その変換がどの程度
正確であるかを示すシステム信頼性レベルに従って表示
するシステムを提供すること。【解決手段】音声を認識するコンピュータ・システムお
よび方法は、音声認識部が１つまたは複数の表示された
単語を認識するときに有する信頼性レベルを表示する。
このシステムおよび方法によって、音声認識誤りを迅速
に識別することができる。個々に認識される単語の複数
の信頼性レベルは、可視的に表示される。さらに、この
システムおよび方法によって、システムのユーザは、可
視表示をいつ出すかを決定するしきい値レベルを選択す
ることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声認識システムに
関する。さらに具体的には、本発明は音声認識システム
のためのユーザ・インタフェースに関し、また、さらに
具体的には、ユーザが音声認識ディクテーション・シス
テムからの変換結果をレビューするときにユーザを援助
する方法および装置に関する。

【０００２】

【従来の技術】テキスト処理システム（たとえば、ロー
タス・ワードプロ（ＬｏｔｕｓＷｏｒｄＰｒｏ^TM）お
よびノベル社のワード・パーフェクト（ＷｏｒｄＰｅ
ｒｆｅｃｔ^TM）のような、スペル・チェック機能を有す
るワード・プロセッサ）は、スペルの誤った単語（すな
わち、ワード・プロセッサの内部の辞書によって認識さ
れない単語）を、通常のテキストとは異なったカラーで
表示することができる。異なった形態として、マイクロ
ソフト・ワード（ＭｉｃｒｏｓｏｆｔＷｏｒｄ ^TM）は
通常のテキストとは異なったカラーでスペルの誤った単
語に下線を付ける。そのような場合、単語を辞書と対照
することによって単語の有効性を確認することは簡単で
ある。単語のスペルは正しいか、正しくないかのどちら
かである。しかし、このような局面における既知のテキ
スト処理システムは、スペルの誤りの可能性だけを処理
する。さらに、テキスト処理システムのスペルチェック
機能は二者択一の真／偽基準のみを使用して単語が正し
いスペルかどうかを決定するので、これらのシステムは
単語を表示するために２つのカラーの１つを選択する。
言い換えれば、灰色の濃淡が存在しない。単語が正しい
スペルであれば、それは１つのカラーで表示され、単語
のスペルが正しくないのではないかとシステムが判断し
た場合には、単語は第２のカラーで表示される。文法チ
ェック・システムも同様に動作する。すなわち、そのシ
ステムは、正しい文法が使用されたか使用されなかった
かの判断に基づいて、２つのカラーの１つを選択してテ
キストを表示する。

【０００３】これに対して、本発明の方法および装置は
音声認識誤りを処理する。さらに具体的には、本発明の
方法および装置は、音声認識システムがユーザによって
話された単語を認識する場合の信頼性のレベルに基づ
き、音声認識誤りを処理する。本発明の方法および装置
によれば、音声認識エンジンがどれくらいの確率で単語
を正しく認識したかどうかの計算された確率に相関した
表示が発生される。単語が正しく認識される場合でも認
識されない場合でも、表示された単語は常に正しいスペ
ルである。さらに、本発明のシステムは、単語の表示方
法を決定する場合に、マルチレベルの信頼性表示を提供
することによってマルチレベルの基準をサポートする。

【０００４】他の分野では、既知のデータ視覚化システ
ムは、量的情報を伝えるためにカラーおよび他の視覚属
性を使用する。たとえば、脳波測定（ＥＥＧ）システム
は脳のカラー輪郭マップを表示し、その場合、カラーは
電気的活動の振幅を表示する。さらに、気象システム
は、降雨量または温度が異なったカラーによって表わさ
れるマップを表示する。輪郭マップはカラーの対応する
レンジで高度と深さを表示する。しかし、そのようなデ
ータ視覚化システムがテキストに応用されることはなか
った。具体的には、そのようなデータ視覚化システムが
音声認識／ディクテーション・システムによって作成さ
れたテキストに応用されることはなかった。

【０００５】さらに他の分野では、いくつかの音声認識
ディクテーション・システムは、発声された命令を認識
する能力を有する。たとえば、テキストを口述している
人は、「テキストのこの部分に下線」とか「この文書を
印刷」とかの命令を発声する。そのような場合、入って
きた音声信号とデコードされたテキストの間の一致が信
頼性の低いスコアである場合、発声された命令は認識さ
れなかったものとしてフラグを付けられる。そのような
場合、システムはユーザ・インタフェース上に或る標識
（たとえば、疑問符または「何でしょうか？」のような
コメント）を表示する。しかし明らかに、そのようなシ
ステムは、発声された命令が認識されたかどうかを単に
表示するだけで、その性質としてはマルチレベルではな
く二者択一式である。前記の例では、システムは、それ
がユーザの命令を実行できないことを示す。したがっ
て、ユーザは何らかのアクションを取る必要がある。こ
のようなシステムでは、どの程度命令を満足させること
ができるかの変動的信頼性レベルを反映するような方式
でテキスト表示問題を処理することはできない。

【０００６】さらに他の分野では、R.Hartson および
D.Hix編 Advances in Human-Computer Interaction, 4:
216-218, Ablex, 1993, に掲載されている J.R.Rhyne
およびG.C.Wolf の "Recognition Based User Interfac
es," と題する章は、「認識候補間の類似性が接近して
いて置換誤りの可能性が高いとき、インタフェースは直
ちに結果を強調表示することができる」と述べている。
しかし、これは二者択一基準の他の例であるにすぎず、
本発明のマルチレベル信頼性表示とは対比されるべきも
のである。さらに、この文献は本発明と異なり単に置換
誤りを処理するだけであり、ユーザ制御が存在しない。
本発明は置換誤りのみでなく削除誤りおよび挿入誤りを
問題とし、さらにユーザ制御を提供する。

【０００７】

【発明が解決しようとする課題】これまで、ユーザが音
声認識技術を使用してテキストを口述するとき、認識誤
りを検出するのは困難であった。典型的には、ユーザは
記録された文書を注意深く一語一語読み取り、挿入、削
除、および置換を探す必要があった。たとえば、「ther
e are no signs of cancer」という文章は、削除誤りに
よって「there are signs of cancer」となる可能性が
あった。この種の誤りは、文書を急いで校正していると
き容易に犯すものである。

【０００８】したがって、変換がどの程度正確であるか
を示すシステムの信頼性レベルに従って、変換されたテ
キストを表示するシステムの提供が望まれる。さらに、
そのようなシステムがその信頼性レベルを二者択一式よ
りも多い標識で表示できることが望ましい。

【０００９】従来技術の欠点は、次のような目的を有す
る本発明によって克服される。

【００１０】本発明の目的は、改善された音声認識シス
テム・インタフェースを提供することである。

【００１１】本発明の他の目的は、認識されたテキスト
に対する音声エンジンの信頼性レベルをユーザに表示す
る音声認識インタフェースを提供することである。

【００１２】本発明の他の目的は、音声エンジンによっ
て認識された表示テキストの信頼性レベルを音声認識イ
ンタフェースで設定できるようにするエンド・ユーザ制
御を提供することである。

【００１３】

【課題を解決するための手段】本発明は、音声認識部が
１つまたは複数の表示された単語に対して有する信頼性
レベルを表示する音声認識コンピュータ・システムおよ
びその方法に関する。信頼性レベルは、ユーザ・インタ
フェース上に表示される１つまたは複数の単語に関連し
た標識（たとえば、カラー）を使用して表わされる。シ
ステムは、音声信号を音声認識部へ入力する音声入力装
置（たとえばマイクロホン）を有する。音声認識部は音
声入力装置からの音声信号をテキスト（たとえば１つま
たは複数の単語）へ変換する。音声認識部内の信頼性レ
ベル・プロセスは、認識される各単語のためにスコア
（信頼性レベル）を発生する。次に、信頼性レベル標識
プロセスは、ユーザ・インタフェース上で表示される１
つまたは複数の単語の各々に関連して、１つまたは複数
の標識を発生する。この標識は、スコアが入る１つまた
は複数のサブレンジの１つに関連している。単語は、ユ
ーザ・インタフェース上で、信頼性スコアを反映するテ
キスト属性（たとえばカラー）を有するテキストとして
表示される。

【００１４】

【発明の実施の形態】図１は単語を信頼性レベルに相関
した属性と共に表示するシステムおよび方法を示す。話
し手はマイクロホン（１７０）に向かって声を出す。マ
イクロホンは音声信号を音声エンジン・プロセス（１６
０）へ転送する。音声エンジン・プロセスはソフトウェ
アであるか、ソフトウェアとハードウェアの組み合わせ
であってよい。これらは入力音声信号をディジタル化し
て認識部（１９０）で認識機能を実行する。認識部（１
９０）は音声信号をテキスト（すなわち、１つまたは複
数の単語）へ変換する。この認識および変換は、当技術
分野で周知の多くの異なった方法で実行されてよい。各
単語は信頼性レベル・スコア割り当て部（２００）によ
って信頼性レベル・スコアを割り当てられる。この信頼
性レベル・スコアは、認識部（１９０）が音声信号をテ
キストへ変換したときの正確度を決定するアルゴリズム
を使用して割り当てられる。各単語および割り当てられ
た信頼性レベル・スコアは単語／スコアの対（２１０）
を形成し、それらの各々はグラフィカル・ユーザ・イン
タフェース（ＧＵＩ）アプリケーション（１５０）へ送
られる。ＧＵＩアプリケーション（１５０）はユーザ制
御部（１４０）から情報を受け取る。それによって、シ
ステムのユーザはスコアしきい値を選択して、スコアが
それよりも大きい（または小さい）ときにデフォルトの
属性を使用して単語を表示させることができる。さら
に、ユーザは、ユーザ制御部（１４０）を経由して情報
を与え、単語を表示するのにどのカラー・マップおよび
／または属性マップを使用するかを制御することができ
る。しきい値およびマップの使用については、後で詳細
に説明する。

【００１５】単語／スコアの対を受け取ると、ＧＵＩア
プリケーション（１５０）は信頼性レベル標識プロセス
（ＣＬＩＰ）（１８０）およびユーザ制御部（１４０）
からの情報（もしあれば）を使用して、各々の単語（１
１０、１２０、１３０）へカラーおよび／または属性を
割り当てる。ＣＬＩＰは、信頼性レベル・スコア割り当
て部（２００）によって割り当てられたスコアを見て、
どのカラーおよび／または属性をそのスコアに関連させ
るかを決定するマッピング・アルゴリズムである。した
がって、単語を表示するために使用されたカラーおよび
／または属性は、認識部が音声信号をテキストへ変換し
たときの正確度を反映する。

【００１６】選択されるカラーは或るレンジの異なった
カラーのマップから選択されても、単一のカラーの異な
った濃淡のマップから選択されてもよい。さらに、選択
される属性は、フォント・タイプ、ポイント・サイズ、
ボールド、イタリック、下線、二重下線、大文字化、フ
ラッシング、ブリンキングなどの特徴を含むか、これら
特徴の任意の組み合わせを含むものであってよい。一
度、単語およびそれに関連したカラーおよび／または属
性が各単語について決定されると、その対は出力装置
（１０５）上で表示される。そのとき、各単語（１１
０、１２０、１３０）は関連したカラーおよび／または
属性で表示される。

【００１７】図２は、図１に関連して説明した実施例で
実行されるステップをフローチャート形式で示す。図２
において、話し手がマイクロホンへ話すことによって生
成された音声信号は、音声信号をテキストまたは単語へ
デコードする認識部（１９０）およびスコアを単語へ割
り当てる信頼性レベル・スコア割り当て部（２００）を
含む音声エンジン・プロセス（１６０）へ送られる。こ
のスコアは、音声認識システムが処理された音声信号を
変換したときの信頼性レベルを反映する。次に、各単語
は、その関連したスコアと共に、音声エンジン・プロセ
ス（１６０）内の信頼性レベル・スコア割り当て部（２
００）からＧＵＩアプリケーション（１５０）へ送られ
る。ＧＵＩアプリケーション（１５０）は、しきい値お
よびカラーおよび／または属性のマッピングを制御する
ためにユーザ制御部（１４０）から情報を受け取って、
その情報をＧＵＩアプリケーション（１５０）内のＣＬ
ＩＰ（１８０）で使用することができる。次に、ＣＬＩ
Ｐ（１８０）は各単語に与えられたスコアおよびユーザ
からの情報（もしあれば）に基づいて各単語にカラーお
よび／または属性を割り当てる。このようにして、ＧＵ
Ｉアプリケーション（１５０）は、その出力として、各
単語および関連したカラーおよび／または属性を有す
る。次に、この情報は、単語および関連したカラーおよ
び／または属性を表示するために使用される。この関連
したカラーおよび／または属性は、各単語に関連した信
頼性レベルを示す。

【００１８】図３はＣＬＩＰ（図１および図２の１８
０）の詳細を示すフローチャートである。単語／スコア
の対（２１０）はＣＬＩＰ（１８０）によって受け取ら
れ、ＣＬＩＰ（１８０）はデフォルトのカラーおよびフ
ォント属性を単語へ割り当てる（１８１）。単語および
そのスコアがレビューされる（１８２）。もし単語のス
コアがしきい値以上であれば、その単語はデフォルトの
カラーおよび属性で表示される（２２０）。もしそのス
コアが、ユーザまたはシステムによって定義されるしき
い値（１４１）よりも下であれば、単語および関連した
スコアはカラー・マッピングをチェックするプロセス
（１８３）へ渡される。カラー・マップ（２４０）が使
用されるとき、適切なカラー（単語のスコアによって決
定される）が単語へマップされる（１８５）。カラーが
マップされたか否かを問わず、プロセスは、単語の属性
マッピングがスコアに基づいて変更される必要があるか
どうかをチェックする（１８４）。変更される必要があ
れば、属性マッピング・プロセス（１８４）は属性マッ
プ２３０を使用してスコアに基づき正しいフォント属性
をマップする（１８６）。次に、適切なカラーおよび属
性を有する単語が表示される（２２０）。

【００１９】本発明の種々の変更例が可能である。たと
えば、図３のフローチャートにおいて、単語／スコアの
対がしきい値よりも上（下ではなく）であるとき、カラ
ーおよび／または属性のマッピングを実行することがで
きる。さらに、カラー・マッピングまたは属性マッピン
グは順次にではなく単独で実行することができる。すな
わち、カラー・マッピングまたは属性マッピングを単独
で使用することができる。

【００２０】本発明は特定の実施形態を参照して説明さ
れたが、この技術分野に知識を有する者にとっては、多
くの変更形態が可能であることが容易に分かる。したが
って、そのような変更形態のすべては、請求項で定義さ
れるような本発明の範囲に含まれるものである。

【００２１】まとめとして、本発明の構成に関して以下
の事項を開示する。（１）音声を１つまたは複数の単語から成るテキストに
変換する音声認識部と、前記１つまたは複数の単語を表
示するユーザ・インタフェースとを備え、前記音声認識
部は前記１つまたは複数の単語のために少なくとも３つ
の可能なスコアの１つを割り当てる信頼性レベル・スコ
ア割り当て部を含み、前記スコアは前記１つまたは複数
の単語が正しく認識されたことの信頼性の尺度であり、
前記１つまたは複数の単語の各々は前記スコアに基づく
表示特性を有する、音声認識システム。（２）前記表示特性がデフォルトの表示特性および２つ
以上の他の表示特性を含む、上記（１）に記載の音声認
識システム。（３）前記デフォルトの表示特性が通常のテキストであ
る、上記（２）に記載の音声認識システム。（４）前記スコアがしきい値よりも下であるとき、前記
１つまたは複数の単語が前記２つ以上の他の表示特性の
１つで表示され、それによって誤りの可能性を示す、上
記（２）に記載の音声認識システム。（５）音声を１つまたは複数の単語から成るテキストに
変換する音声認識部と、ユーザ・インタフェースと、ユ
ーザ制御部とを備え、前記音声認識部は前記１つまたは
複数の単語のために少なくとも３つの可能なスコアの１
つを割り当てる信頼性レベル・スコア割り当て部を含
み、前記ユーザ・インタフェースは前記１つまたは複数
の単語を前記スコアに基づいて表示し、前記１つまたは
複数の単語は、前記スコアが複数のサブレンジのいずれ
に入るかに応じて、１つまたは複数の標識に従って表示
され、前記ユーザ制御部は、ユーザによる前記サブレン
ジの定義を可能にする、音声認識システム。（６）前記標識の各々が異なったカラーである、上記
（５）に記載の音声認識システム。（７）前記標識の各々が少なくとも１つの異なったフォ
ント属性である、上記（５）に記載の音声認識システ
ム。（８）前記標識の各々が単一カラーの異なった濃淡また
は灰色の異なった濃淡の１つである、上記（５）に記載
の音声認識システム。（９）音声を１つまたは複数の単語から成るテキストに
変換する音声認識部と、ユーザ・インタフェースとを備
え、前記音声認識部は前記１つまたは複数の単語のため
に少なくとも３つの可能なスコアの１つを割り当てる信
頼性レベル・スコア割り当て部を含み、前記ユーザ・イ
ンタフェースは前記１つまたは複数の単語を前記スコア
に従って表示し、表示される１つまたは複数の単語は前
記スコアに基づいて連続したレンジのカラーへマップさ
れ、それによって前記スコアの異なったもののために異
なったカラー表示が提供される、音声認識システム。（１０）音声を認識する方法であって、入力音声を１つ
または複数の単語から成るテキストに変換するステップ
と、前記１つまたは複数の単語の各々のために少なくと
も３つの可能な信頼性レベル・スコアの１つを割り当て
るステップと、割り当てられたスコアに基づいて前記１
つまたは複数の単語を表示するステップとを含み、前記
信頼性レベル・スコアは前記１つまたは複数の単語が正
しく認識されたことの信頼性の尺度であり、前記１つま
たは複数の単語の各々は前記信頼性レベル・スコアに基
づく表示特性を有する、音声認識方法。（１１）前記表示特性がデフォルトの表示特性および２
つ以上の他の表示特性を含む、上記（１０）に記載の音
声認識方法。（１２）前記デフォルトの表示特性が通常のテキストで
ある、上記（１１）に記載の音声認識方法。（１３）前記１つまたは複数の単語の前記スコアがしき
い値よりも下であるとき、前記１つまたは複数の単語が
前記２つ以上の他の表示特性の１つで表示される、上記
（１１）に記載の音声認識方法。（１４）音声を認識する方法であって、入力音声を１つ
または複数の単語から成るテキストへ変換するステップ
と、前記１つまたは複数の単語の各々のために少なくと
も３つの信頼性レベル・スコアの１つを割り当てるステ
ップと、割り当てられたスコアに従って前記１つまたは
複数の単語を表示するステップとを含み、前記信頼性レ
ベル・スコアの各々が複数のサブレンジの中のどれに入
るかに応じて、前記１つまたは複数の単語が１つまたは
複数の標識に従って表示され、前記サブレンジはユーザ
によって定義される、音声認識方法。（１５）前記複数の標識の各々のために異なったカラー
を提供するステップを含む、上記（１４）に記載の音声
認識方法。（１６）前記複数の標識の各々のために少なくとも１つ
の異なったフォント属性を提供するステップを含む、上
記（１４）に記載の音声認識方法。（１７）前記１つまたは複数の標識の各々のために単一
カラーの異なった濃淡または灰色の異なった濃淡の１つ
を提供するステップを含む、上記（１４）に記載の音声
認識方法。（１８）音声を認識する方法であって、入力音声を１つ
または複数の単語から成るテキストに変換するステップ
と、前記１つまたは複数の単語の各々のために少なくと
も３つの可能な信頼性レベル・スコアの１つを割り当て
るステップと、前記信頼性レベル・スコアに従って前記
１つまたは複数の単語を表示するステップとを含み、表
示される前記１つまたは複数の単語が前記信頼性レベル
・スコアに基づいて連続したレンジのカラーへマップさ
れ、それによって前記信頼性レベル・スコアの異なった
もののために異なったカラー表示が提供される、音声認
識方法。（１９）テキスト中の単語に関連した少なくとも３つの
可能なスコアの１つを割り当てるプロセスと、前記スコ
アに基づく視覚属性に従って前記テキストを表示するユ
ーザ・インタフェースとを備える、システム。（２０）前記視覚属性の各々が異なったカラーまたは単
一カラーの異なった濃淡の１つである、上記（１９）に
記載のシステム。（２１）前記視覚属性の各々が、少なくとも１つの異な
ったフォント属性である、上記（１９）に記載のシステ
ム。（２２）テキスト中の単語に関連した少なくとも３つの
可能なスコアの１つを割り当てるステップと、前記スコ
アに基づく視覚属性に従って前記テキストを表示するス
テップとを含む、方法。（２３）前記視覚属性の各々が異なったカラーまたは単
一カラーの異なった濃淡の１つである、上記（２２）に
記載の方法。（２４）前記視覚属性の各々が、少なくとも１つの異な
ったフォント属性である、上記（２２）に記載の方法。

【図面の簡単な説明】

【図１】本発明の実施例のブロック図である。

【図２】図１に示されたシステムで実行されるステップ
を示すフローチャートである。

【図３】信頼性レベル標識プロセスの詳細を示すフロー
チャートである。

【符号の説明】１０５出力装置１１０単語１２０単語１３０単語１４０ユーザ制御部１５０ＧＵＩアプリケーション１６０音声エンジン・プロセス１７０マイクロホン１８０信頼性レベル標識プロセス１９０認識部２００信頼性レベル・スコア割り当て部２１０単語／スコアの対

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジョン・ジョージ・ヴァーゴアメリカ合衆国10598、ニューヨーク州ヨークタウン・ハイツウェリントン・コート 51

Claims

【特許請求の範囲】

【請求項１】音声を１つまたは複数の単語から成るテキ
ストに変換する音声認識部と、前記１つまたは複数の単語を表示するユーザ・インタフ
ェースとを備え、前記音声認識部は前記１つまたは複数の単語のために少
なくとも３つの可能なスコアの１つを割り当てる信頼性
レベル・スコア割り当て部を含み、前記スコアは前記１
つまたは複数の単語が正しく認識されたことの信頼性の
尺度であり、前記１つまたは複数の単語の各々は前記スコアに基づく
表示特性を有する、音声認識システム。
【請求項２】前記表示特性がデフォルトの表示特性およ
び２つ以上の他の表示特性を含む、請求項１に記載の音
声認識システム。
【請求項３】前記デフォルトの表示特性が通常のテキス
トである、請求項２に記載の音声認識システム。
【請求項４】前記スコアがしきい値よりも下であると
き、前記１つまたは複数の単語が前記２つ以上の他の表
示特性の１つで表示され、それによって誤りの可能性を
示す、請求項２に記載の音声認識システム。
【請求項５】音声を１つまたは複数の単語から成るテキ
ストに変換する音声認識部と、ユーザ・インタフェース
と、ユーザ制御部とを備え、前記音声認識部は前記１つまたは複数の単語のために少
なくとも３つの可能なスコアの１つを割り当てる信頼性
レベル・スコア割り当て部を含み、前記ユーザ・インタフェースは前記１つまたは複数の単
語を前記スコアに基づいて表示し、前記１つまたは複数
の単語は、前記スコアが複数のサブレンジのいずれに入
るかに応じて、１つまたは複数の標識に従って表示さ
れ、前記ユーザ制御部は、ユーザによる前記サブレンジの定
義を可能にする、音声認識システム。
【請求項６】前記標識の各々が異なったカラーである、
請求項５に記載の音声認識システム。
【請求項７】前記標識の各々が少なくとも１つの異なっ
たフォント属性である、請求項５に記載の音声認識シス
テム。
【請求項８】前記標識の各々が単一カラーの異なった濃
淡または灰色の異なった濃淡の１つである、請求項５に
記載の音声認識システム。
【請求項９】音声を１つまたは複数の単語から成るテキ
ストに変換する音声認識部と、ユーザ・インタフェース
とを備え、前記音声認識部は前記１つまたは複数の単語のために少
なくとも３つの可能なスコアの１つを割り当てる信頼性
レベル・スコア割り当て部を含み、前記ユーザ・インタフェースは前記１つまたは複数の単
語を前記スコアに従って表示し、表示される１つまたは
複数の単語は前記スコアに基づいて連続したレンジのカ
ラーへマップされ、それによって前記スコアの異なった
もののために異なったカラー表示が提供される、音声認識システム。
【請求項１０】音声を認識する方法であって、入力音声を１つまたは複数の単語から成るテキストに変
換するステップと、前記１つまたは複数の単語の各々のために少なくとも３
つの可能な信頼性レベル・スコアの１つを割り当てるス
テップと、割り当てられたスコアに基づいて前記１つまたは複数の
単語を表示するステップとを含み、前記信頼性レベル・スコアは前記１つまたは複数の単語
が正しく認識されたことの信頼性の尺度であり、前記１
つまたは複数の単語の各々は前記信頼性レベル・スコア
に基づく表示特性を有する、音声認識方法。
【請求項１１】前記表示特性がデフォルトの表示特性お
よび２つ以上の他の表示特性を含む、請求項１０に記載
の音声認識方法。
【請求項１２】前記デフォルトの表示特性が通常のテキ
ストである、請求項１１に記載の音声認識方法。
【請求項１３】前記１つまたは複数の単語の前記スコア
がしきい値よりも下であるとき、前記１つまたは複数の
単語が前記２つ以上の他の表示特性の１つで表示され
る、請求項１１に記載の音声認識方法。
【請求項１４】音声を認識する方法であって、入力音声を１つまたは複数の単語から成るテキストへ変
換するステップと、前記１つまたは複数の単語の各々のために少なくとも３
つの信頼性レベル・スコアの１つを割り当てるステップ
と、割り当てられたスコアに従って前記１つまたは複数の単
語を表示するステップとを含み、前記信頼性レベル・スコアの各々が複数のサブレンジの
中のどれに入るかに応じて、前記１つまたは複数の単語
が１つまたは複数の標識に従って表示され、前記サブレ
ンジはユーザによって定義される、音声認識方法。
【請求項１５】前記複数の標識の各々のために異なった
カラーを提供するステップを含む、請求項１４に記載の音声認識方法。
【請求項１６】前記複数の標識の各々のために少なくと
も１つの異なったフォント属性を提供するステップを含
む、請求項１４に記載の音声認識方法。
【請求項１７】前記１つまたは複数の標識の各々のため
に単一カラーの異なった濃淡または灰色の異なった濃淡
の１つを提供するステップを含む、請求項１４に記載の音声認識方法。
【請求項１８】音声を認識する方法であって、入力音声を１つまたは複数の単語から成るテキストに変
換するステップと、前記１つまたは複数の単語の各々のために少なくとも３
つの可能な信頼性レベル・スコアの１つを割り当てるス
テップと、前記信頼性レベル・スコアに従って前記１つまたは複数
の単語を表示するステップとを含み、表示される前記１つまたは複数の単語が前記信頼性レベ
ル・スコアに基づいて連続したレンジのカラーへマップ
され、それによって前記信頼性レベル・スコアの異なっ
たもののために異なったカラー表示が提供される、音声認識方法。
【請求項１９】テキスト中の単語に関連した少なくとも
３つの可能なスコアの１つを割り当てるプロセスと、前記スコアに基づく視覚属性に従って前記テキストを表
示するユーザ・インタフェースとを備える、システム。
【請求項２０】前記視覚属性の各々が異なったカラーま
たは単一カラーの異なった濃淡の１つである、請求項１
９に記載のシステム。
【請求項２１】前記視覚属性の各々が、少なくとも１つ
の異なったフォント属性である、請求項１９に記載のシ
ステム。
【請求項２２】テキスト中の単語に関連した少なくとも
３つの可能なスコアの１つを割り当てるステップと、前記スコアに基づく視覚属性に従って前記テキストを表
示するステップとを含む、方法。
【請求項２３】前記視覚属性の各々が異なったカラーま
たは単一カラーの異なった濃淡の１つである、請求項２
２に記載の方法。
【請求項２４】前記視覚属性の各々が、少なくとも１つ
の異なったフォント属性である、請求項２２に記載の方
法。