JP2008310004A - 音声認識装置、音声認識方法、及び音声認識プログラム - Google Patents

音声認識装置、音声認識方法、及び音声認識プログラム Download PDF

Info

Publication number
JP2008310004A
JP2008310004A JP2007157377A JP2007157377A JP2008310004A JP 2008310004 A JP2008310004 A JP 2008310004A JP 2007157377 A JP2007157377 A JP 2007157377A JP 2007157377 A JP2007157377 A JP 2007157377A JP 2008310004 A JP2008310004 A JP 2008310004A
Authority
JP
Japan
Prior art keywords
word
correction
unit
recognized
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007157377A
Other languages
English (en)
Inventor
Takuya Hirai
卓哉 平井
Atsushi Yamashita
敦士 山下
Tomohiro Terada
智裕 寺田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2007157377A priority Critical patent/JP2008310004A/ja
Publication of JP2008310004A publication Critical patent/JP2008310004A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】誤認識された発話内容を確実に1ステップで認識されるべき発話内容に訂正することができる音声認識装置を提供する。
【解決手段】音声入力可能な音声認識装置に向けられている。本発明は、単語を記憶する記憶部と、ユーザが発話した音声を取り込む音声入力部と、記憶部に記憶された単語を参照して、音声入力部が取り込んだ音声の表す単語を認識する認識部と、認識部が認識した単語を訂正するための訂正単語を作成する訂正単語作成部と、訂正単語作成部が作成した訂正単語に基づいて、認識部が認識した単語を訂正して出力する単語訂正部とを備える。
【選択図】図1

Description

本発明は、音声認識装置、音声認識方法、及び音声認識プログラムに関し、より特定的には、誤認識された発話内容を認識されるべき発話内容に訂正する音声認識装置、音声認識方法、及び音声認識プログラムに関する。
ユーザが発話した単語を認識する音声認識技術は、予め機器側で用意している辞書内に登録している単語群と、ユーザが発話した単語の音素データを比較し、辞書に登録されている単語群の中から、最も確からしい(第一位候補)単語を認識結果として出力する。この処理の代表的なものとしては、隠れマルコフモデル(HMM)等がある。
この場合、辞書内に登録されている単語をユーザが発話したときでも、統計処理を行っているため、必ずしも正しく認識されるとは限らない。そこで、ユーザが発話した単語と、機器が認識した単語が異なる場合(以下、誤認識と称する)、ユーザは、機器に所望する動作を行わせるために、誤認識された単語を訂正する必要がある。
このとき、従来の音声認識装置は、前回認識した単語と予め定められた訂正用の制御語(例えば、〜を訂正)とを併せて、次に発話される前に辞書に登録し、誤認識をした単語を訂正することができるようにしている(例えば、特許文献1参照)。
特開2000−315096号公報
しかしながら、特許文献1に記載の音声認識装置では、誤認識を訂正するためには、訂正用の制御語を抽出して、訂正が必要なことを認識するステップと、本来認識されるべき単語に訂正するための単語の再入力を受付けるステップの2つのステップを踏まなくてはならない。このため、操作数が多くなり、ユーザにとっては利便性に欠ける。
そこで、本発明は、上記問題に鑑みてなされた。すなわち、誤認識された発話内容を確実に1ステップで認識されるべき発話内容に訂正することができる音声認識装置、音声認識方法、及び音声認識プログラムを提供することを目的とする。
本発明の第1の局面は、音声入力可能な音声認識装置に向けられている。本発明は、単語を記憶する記憶部と、ユーザが発話した音声を取り込む音声入力部と、記憶部に記憶された単語を参照して、音声入力部が取り込んだ音声の表す単語を認識する認識部と、認識部が認識した単語を訂正するための訂正単語を作成する訂正単語作成部と、訂正単語作成部が作成した訂正単語に基づいて、認識部が認識した単語の訂正して出力する単語訂正部とを備える。
また、単語訂正部は、訂正単語作成部が作成した訂正単語に基づいて、認識部が認識した単語を本来認識されるべき単語になるように置換する訂正を行うことが好ましい。
また、単語訂正部は、訂正単語作成部が作成した訂正単語に基づいて、認識部が認識した単語を本来認識されるべき単語になるように削除する訂正を行うことが好ましい。
また、ツリー構造を構成するメニュー画面のノードと単語とが対応している場合において、訂正単語作成部は、現在のメニュー画面のノードの階層を含む下位の階層のノード、及び上位の階層のノードに対応する単語を含む単語群に基づいて、訂正単語を作成することが好ましい。
また、訂正単語作成部は、1単語からなる訂正単語を作成することが好ましい。
また、訂正単語作成部は、複数単語からなる訂正単語を作成することが好ましい。
また、単語訂正部は、ユーザに対して、単語の訂正に際しての発話方法を教示する補助報知を行うことが好ましい。
本発明の第2の局面は、音声入力可能な音声認識方法に向けられている。本発明は、ユーザが発話した音声を取り込む音声入力ステップと、記憶部に記憶された単語を参照して、音声入力ステップで取り込んだ音声の表す単語を認識する認識ステップと、認識ステップで認識した単語を訂正するための訂正単語を作成する訂正単語作成ステップと、訂正単語作成ステップで作成した訂正単語に基づいて、認識ステップで認識した単語を訂正して出力する単語訂正ステップとを備える。
本発明の第3の局面は、音声入力可能な音声認識装置のコンピュータで実行される音声認識プログラムに向けられている。本発明は、コンピュータに、ユーザが発話した音声を取り込む音声入力ステップと、記憶部に記憶された単語を参照して、前記音声入力ステップで取り込んだ音声の表す単語を認識する認識ステップと、認識ステップで認識した単語を訂正するための訂正単語を作成する訂正単語作成ステップと、訂正単語作成ステップで作成した訂正単語に基づいて、認識ステップで認識した単語を訂正して出力する単語訂正ステップとを実行させる。
誤認識された発話内容を確実に1ステップで認識されるべき発話内容に訂正することができる音声認識装置を提供することができる。
以下、本発明の実施の形態に係る音声認識装置について、図面に従って詳細に説明する。
図1は、本発明の実施の形態に係る音声認識装置100の全体構成を示すブロック図である。図1において、音声認識装置100は、音声入力部110、記憶部120、音声認識部130、訂正単語作成部140、単語訂正部150、及び出力部160を備える。
音声入力部110は、ユーザが発話した音声を取り込む、例えばマイクである。記憶部120は、様々な単語を表すデータを格納している、例えばCD−RAM、DVD−RAM、HDD(ハードディスクドライブ)、又はメモリである。
記憶部120は、図2に示すように、各単語を表すデータそれぞれに対応するメニュー画面の各画像データをノードで表したツリー構造で記憶している。このツリー構造では、各メニュー画面の画像データはノードIDで表されるアドレスに記憶されている。例えば、図3に示すように、単語“A”に対応するメニュー画面の画像データは、ノードIDN01で表されるアドレスに記憶されている。
音声認識部130は、音声入力部110が取り込んだユーザの発話した音声に対応する単語を表すデータと記憶部120に格納されている単語を表すデータとの一致不一致を参照して、ユーザが発話した音声の表す単語を認識する。音声認識部130は、例えば、入力された音声データを音素レベルで分解したデータと、記憶部120に記憶されている単語の音素の標準パターンに変換したデータとを比較し、記憶部120に記憶されている単語の中から確率統計処理を用いて、確からしい単語を抽出する。この単語抽出の際、処理方法としては、現在多くの音声認識技術に用いられている隠れマルコフモデル(HMM)等が用いられてもよい。
訂正単語作成部140は、音声認識部130が認識した単語を訂正するための訂正単語を表すデータを作成する。単語訂正部150は、訂正単語作成部140が作成した訂正単語の表すデータに基づいて、音声認識部130が認識した単語を表すデータを別の単語を表すデータに置換したり、不要な単語を表すデータを削除する訂正を行う。
出力部160は、各メニュー画面を表示したり、メニュー画面に応じた音声案内を行う、ディスプレイやスピーカで構成される。
以下、本発明の実施の形態に係る音声認識装置100の置換単語作成処理について、図4のフロー図に従って説明する。なお、図5に示すテーブルT100の関係が予め定められていると仮定する。テーブルT100は、認識単語C110と、ノードIDC120と、親ノードC130と、子ノードC140の要素から構成される。認識単語C110は、各ノードC120に記載されているノードを音声で指す際の単語が記載されており、親ノードC130はノードIDC120に記載されているノードの一つ上の階層で、かつ直接関連しているノードを指している。子ノードC140は、ノードIDC120と親ノードC130から、ノードIDC120に記載されているノード以下に間接的にぶら下がっているノードを含めたノードIDが記載されている。
まず、ユーザが“B”と発話し、音声認識部130が“B”と認識した場合、訂正単語作成部140は、図5の認識単語C110を参照し、認識単語“B”のノードIDを元に、記憶部120から各単語"A"、"B"、"C"、"D"、"E"、"F"、"G"、"H"、"I"、"J"、K"、"L"、及び"M"を抽出する(ステップS401)。
次に、訂正単語作成部140は、それらの抽出単語と認識単語“B”とを比較し(ステップS402)、認識単語“B”と異なるか否かを判定する(ステップS403)。ここで、ステップS403で、認識単語と抽出した単語とを比較する理由は、例えば「“B”じゃなくて“B”」というのは意味的に訂正を表していることにならず、また、認識単語“B”が“C”と音響的に近い単語である場合、ユーザが「“B”じゃなくて“C”」と発話したのにも関わらず、再度“C”を“B”と誤認識してしまうことを事前に回避し、誤認識する確率を減らすためである。
ステップS403において、認識単語“B”と同じであると判定された場合、訂正単語作成部140はステップS405に処理を移す。一方、ステップS403において、認識単語“B”と異なると判定された場合、訂正単語作成部140は、ステップS401で抽出した単語と組み合わせて訂正単語を作成して、記憶部120に記憶させる(ステップS404)。ここで作成される訂正単語とは、認識した単語を取り消し、抽出した単語を再認識させるような単語である。訂正単語作成部140は、例えば、「“B”じゃなくて“C”」や、「“B”を“C”に修正する」等の「(認識した単語)+(置換先の単語)」の組み合わせを1つの訂正単語として作成して、記憶部120に記憶させる。なお、訂正単語作成部140は、現在のノードの階層を含む下位の階層のノード、及び上位の階層のノードに対応する単語を含む単語群に基づいて、訂正単語を作成してもよい。
次に、訂正単語作成部140は、抽出した全単語について、ステップS403の比較処理が終了したか否かを判定する(ステップS405)。ステップS405において、比較処理が終了していないと判定された場合、訂正単語作成部140は、再度ステップS402に処理を戻す。一方、ステップS405において、比較処理が終了したと判定された場合、訂正単語作成部140は置換単語作成処理を終了する。
以下、本発明の実施の形態に係る音声認識装置100の削除単語作成処理について、図6のフロー図に従って説明する。特に、認識した単語数が複数である場合について説明する。なお、この削除単語作成処理は、認識した単語数が複数である場合に行われることに限定されない。
まず、ユーザが「“A”、“D”」と発話し、音声認識部130が「“A”、“D”」と認識したと仮定する。
訂正単語作成部140は、入力された認識単語とそれを削除する意味を表す単語とを組み合わせた訂正単語を作成し、記憶部120に記憶させる(ステップS601)。例えば、「“D”を削除する」や「“D”はいらない」や「“D”を訂正」等が訂正単語になる。訂正単語作成部140は、このような訂正単語を認識された単語毎に作成する。
以下、本発明の実施の形態に係る音声認識装置100の訂正処理について、図7のフロー図に従って説明する。
ユーザが発話し、音声認識部130が正しく音声を認識したと仮定する。単語訂正部150は、音声認識部130が認識した単語が置換単語か否か判定する(ステップS701)。これは、別個のIDが付与されている、又は訂正を表す特定の単語(本例の場合は、「じゃなくて」や「に修正する」という文字列)が含まれているか否かで判定される。
ステップS701において、例えば、「“B”じゃなくて“C”」という置換単語であると判定された場合、単語訂正部150は、置換先の単語を抽出する(ステップS702)。これは、本例の場合、単語“C”が置換先の単語である。単語訂正部150は、この置換先の単語“C”を認識単語とする(ステップS703)。このようにすることで、ユーザが「“B”じゃなくて“C”」と発話し、音声認識部130が「“B”じゃなくて“C”」を認識すると、本来認識されるべき単語“C”が認識される。そして、本来認識されるべき単語“C”に対応するメニュー画面の画像データが出力部160を介して出力される。
これにより、従来、訂正が必要なことを認識するステップと、本来認識されるべき単語に訂正するための単語の再入力を受付けるステップの2つのステップを踏まないと所望するノードには到達できなかったが、1ステップで所望するノードに到達することができる。具体的な例を図2を用いて以下に説明する。
現在、ノードN01に所属していたとする。そして、ユーザがノードN04を指し示すために“C”と発話したが、“A”と認識された場合は、ノードN02を指すこととなり、所属するノードがノードN02となる。ここで、従来の場合、再度、前に所属していたノードであるノードN01に戻るような修正のステップを踏み、次に、もう一度“C”と発話し直す必要があった。
しかしながら、ユーザが訂正単語、例えば「“A”じゃなくて“C”」を発話した場合、ノードN04からノードN02に1ステップで遷移することができる。これにより、ユーザはステップ数を減らすことができ、楽に操作することができる。
一方、ステップS701において、置換単語でないと判定された場合、単語訂正部150は、音声認識部130が認識した単語が削除単語か否か判定する(ステップS704)。これは、固有のIDを情報として付与されている、又は「はいらない」や「を削除する」や「を訂正」等の文字列が含まれているか否かで判定される。
ステップS704において、削除単語でないと判定された場合、単語訂正部150は処理を終了する。一方、ステップS704において、例えば、「“A”はいらない」という削除単語であると判定された場合、単語訂正部150は、削除先の単語を削除する(ステップS705)。これは、本例の場合、単語“A”が削除先の単語である。単語訂正部150は、この削除先の単語“A”を削除する。このようにすることで、先にユーザが「“A”、“D”」と発話し、音声認識部130が「“A”、“D”」と認識した場合であっても、本来認識されるべき単語“D”が認識される。そして、本来認識されるべき単語“D”に対応するメニュー画面の画像データが出力部160を介して出力される。
これにより、ユーザは“A”、“D”を発話していながら、“D”のみを削除し、“A”のみが指すノードに所属することができる。すなわち、訂正単語を発話することで、2度の発話をすることなく、1度の発話でノード間の移動をすることができる。具体的な例を図2を用いて以下に説明する。
遷移するノードの観点から見ると、まず、ユーザは、ノードN01に所属する“A”と“D”を発話することで、ノードN05に遷移する。しかしながら、認識した内容がユーザの所望した内容とは異なったため、ユーザが訂正単語を発話し、ノードN02に遷移した。従来であれば、ノードN05からノードN02に遷移するためには、ノードN05から、一度前回の所属ノード(ノードN01)に移動して、再度、ユーザが“D”を発話することで、移動することができた。
しかしながら、ユーザが訂正単語、例えば「“D”じゃない」を発話した場合、ノードN05からノードN02に1ステップで遷移することができる。これにより、ユーザはステップ数を減らすことができ、楽に操作することができる。
なお、本実施の形態では、1単語の音声認識を例にしているが、複数の単語を連続で認識する場合は、訂正単語作成部140が「“A”」、「じゃなくて」、及び「“C”」という3単語を1つの訂正単語として作成することで、ユーザが「“A”」、「じゃなくて」、「“C”」とそれぞれの単語の間を空けて発話したとしても誤認識を軽減することができる。また、訂正単語作成部140が、例えば、「“A”じゃなくて」、及び「“C”」の2つの単語を1つの訂正単語として作成することで、ユーザが「“A”じゃなくて」、「“C”」とそれぞれの単語の間を空けて発話したとしても誤認識を軽減することができる。
なお、単語訂正部150は、音声認識部130が単語を認識した場合、単語の訂正に際しての発話方法を教示する補助報知を出力部160を介して行ってもよい。図8は音声認識部130が“A”と認識した時のディスプレイ上の表示例である。図8の認識単語表示領域120は、音声認識部130で認識した単語を表示しており、候補表示領域121には、“A”に関連付いたノードN01の下の階層のノード(ノードN04、ノードN05)に対応する単語を表示している。そして、操作ヒント122は、訂正単語の使用例を表示し、それを発話したときの動作をユーザに報知している。このような、操作ヒントを表示することで、ユーザはあらかじめ訂正単語を覚えておく必要がなく、スムーズに訂正単語を発話することができる。この際、操作ヒント122には、図8のように、今回認識した単語(今回の場合は、“A”)を含む形で表示すると、さらにユーザに分かり易く訂正単語の使い方を伝えることができる。なお、この報知は、表示する場合に限られず、音声により行われてもよい。
また、本発明は、上述した実施の形態を実現するソフトウェアのプログラム(実施の形態では図に示すフロー図に対応したプログラム)が装置に供給され、その装置のコンピュータが、供給されたプログラムを読出して、実行することによっても達成させる場合を含む。したがって、本発明の機能処理をコンピュータで実現するために、コンピュータにインストールされるプログラム自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現させるための音声認識プログラムも含む。
このように、本発明によれば、誤認識された発話内容を確実に1ステップで認識されるべき発話内容に訂正することができる音声認識装置、音声認識方法、及び音声認識プログラムを提供することができる。
上記実施の形態で説明した構成は、単に具体例を示すものであり、本願発明の技術的範囲を制限するものではない。本願の効果を奏する範囲において、任意の構成を採用することが可能である。
本発明は、誤認識された発話内容を確実に1ステップで認識されるべき発話内容に訂正することができるという効果を有し、音声で短時間に機器を操作する操作方法等として有用である。
本発明の実施の形態に係る音声認識装置の全体構成を示すブロック図 本発明の実施の形態に係る音声認識装置の動作説明のためのツリー構造を示す図 本発明の実施の形態に係る音声認識装置の図2に記載のツリー構造の各ノードと対応する単語を示すノード単語対応表 本発明の実施の形態に係る音声認識装置の置換単語作成処理を示すフロー図 本発明の実施の形態に係る音声認識装置の図2に記載のツリー構造の関係をテーブルとして表した表 本発明の実施の形態に係る音声認識装置の削除単語作成処理を示すフロー図 本発明の実施の形態に係る音声認識装置の訂正処理を示すフロー図 本発明の実施の形態における音声認識装置の出力画面例
符号の説明
100 音声認識装置
110 音声入力部
120 記憶部
130 音声認識部
140 訂正単語作成部
150 単語訂正部
160 出力部

Claims (9)

  1. 音声入力可能な音声認識装置であって、
    単語を記憶する記憶部と、
    ユーザが発話した音声を取り込む音声入力部と、
    前記記憶部に記憶された単語を参照して、前記音声入力部が取り込んだ音声の表す単語を認識する認識部と、
    前記認識部が認識した単語を訂正するための訂正単語を作成する訂正単語作成部と、
    前記訂正単語作成部が作成した訂正単語に基づいて、前記認識部が認識した単語を訂正して出力する単語訂正部とを備える、音声認識装置。
  2. 前記単語訂正部は、前記訂正単語作成部が作成した訂正単語に基づいて、前記認識部が認識した単語を本来認識されるべき単語になるように置換する訂正を行うことを特徴とする、請求項1に記載の音声認識装置。
  3. 前記単語訂正部は、前記訂正単語作成部が作成した訂正単語に基づいて、前記認識部が認識した単語を本来認識されるべき単語になるように削除する訂正を行うことを特徴とする、請求項1に記載の音声認識装置。
  4. ツリー構造を構成するメニュー画面のノードと単語とが対応している場合において、前記訂正単語作成部は、現在のメニュー画面のノードの階層を含む下位の階層のノード、及び上位の階層のノードに対応する単語を含む単語群に基づいて、訂正単語を作成することを特徴とする、請求項1〜3のいずれかに記載の音声認識装置。
  5. 前記訂正単語作成部は、1単語からなる訂正単語を作成することを特徴とする、請求項1〜4のいずれかに記載の音声認識装置。
  6. 前記訂正単語作成部は、複数単語からなる訂正単語を作成することを特徴とする、請求項1〜4のいずれかに記載の音声認識装置。
  7. 前記単語訂正部は、ユーザに対して、単語の訂正に際しての発話方法を教示する補助報知を行うことを特徴とする、請求項1〜6のいずれかに記載の音声認識装置。
  8. 音声入力可能な音声認識方法であって、
    ユーザが発話した音声を取り込む音声入力ステップと、
    記憶部に記憶された単語を参照して、前記音声入力ステップで取り込んだ音声の表す単語を認識する認識ステップと、
    前記認識ステップで認識した単語を訂正するための訂正単語を作成する訂正単語作成ステップと、
    前記訂正単語作成ステップで作成した訂正単語に基づいて、前記認識ステップで認識した単語を訂正して出力する単語訂正ステップとを備える、音声認識方法。
  9. 音声入力可能な音声認識装置のコンピュータで実行される音声認識プログラムであって、
    前記コンピュータに、
    ユーザが発話した音声を取り込む音声入力ステップと、
    記憶部に記憶された単語を参照して、前記音声入力ステップで取り込んだ音声の表す単語を認識する認識ステップと、
    前記認識ステップで認識した単語を訂正するための訂正単語を作成する訂正単語作成ステップと、
    前記訂正単語作成ステップで作成した訂正単語に基づいて、前記認識ステップで認識した単語を訂正して出力する単語訂正ステップとを実行させる、音声認識プログラム。
JP2007157377A 2007-06-14 2007-06-14 音声認識装置、音声認識方法、及び音声認識プログラム Pending JP2008310004A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007157377A JP2008310004A (ja) 2007-06-14 2007-06-14 音声認識装置、音声認識方法、及び音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007157377A JP2008310004A (ja) 2007-06-14 2007-06-14 音声認識装置、音声認識方法、及び音声認識プログラム

Publications (1)

Publication Number Publication Date
JP2008310004A true JP2008310004A (ja) 2008-12-25

Family

ID=40237665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007157377A Pending JP2008310004A (ja) 2007-06-14 2007-06-14 音声認識装置、音声認識方法、及び音声認識プログラム

Country Status (1)

Country Link
JP (1) JP2008310004A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190067582A (ko) * 2017-12-07 2019-06-17 현대자동차주식회사 사용자의 발화 에러 보정 장치 및 그 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190067582A (ko) * 2017-12-07 2019-06-17 현대자동차주식회사 사용자의 발화 에러 보정 장치 및 그 방법
CN109903770A (zh) * 2017-12-07 2019-06-18 现代自动车株式会社 用于校正用户的话语错误的装置及其方法
KR102518543B1 (ko) * 2017-12-07 2023-04-07 현대자동차주식회사 사용자의 발화 에러 보정 장치 및 그 방법

Similar Documents

Publication Publication Date Title
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
JP2009098490A (ja) 音声認識結果編集装置、音声認識装置およびコンピュータプログラム
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
JP5478478B2 (ja) テキスト修正装置およびプログラム
US20120310643A1 (en) Methods and apparatus for proofing of a text input
JP5874640B2 (ja) 音声変換装置、携帯電話端末、音声変換方法およびプログラム
JP2013068952A (ja) 音声認識結果の統合
JP2002117026A (ja) 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム
US20120203553A1 (en) Recognition dictionary creating device, voice recognition device, and voice synthesizer
JP2007093789A (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP2011002656A (ja) 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム
JP2014063088A (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JP2008090625A (ja) 文字入力装置、文字入力方法、制御プログラム、および、記録媒体
JP2006053906A (ja) コンピューティングデバイスへの入力を提供するための効率的なマルチモーダル方法
JP2014202832A (ja) 編集装置、方法、及びプログラム
CN104538032B (zh) 一种融合用户反馈的汉语语音识别方法及系统
JP2013109061A (ja) 音声データ検索システムおよびそのためのプログラム
JP3104661B2 (ja) 日本語文章作成装置
JP2013050742A (ja) 音声認識装置および音声認識方法
JP2012003090A (ja) 音声認識装置および音声認識方法
JP2010164918A (ja) 音声翻訳装置、および方法
JP2008310004A (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP2014134640A (ja) 文字起こし装置およびプログラム
JP2012063526A (ja) 端末装置、音声認識方法および音声認識プログラム
JP2009086063A (ja) 音声認識装置およびコンピュータプログラム