JP5396426B2 - 音声認識装置、音声認識方法及び音声認識プログラム - Google Patents

音声認識装置、音声認識方法及び音声認識プログラム Download PDF

Info

Publication number
JP5396426B2
JP5396426B2 JP2011095368A JP2011095368A JP5396426B2 JP 5396426 B2 JP5396426 B2 JP 5396426B2 JP 2011095368 A JP2011095368 A JP 2011095368A JP 2011095368 A JP2011095368 A JP 2011095368A JP 5396426 B2 JP5396426 B2 JP 5396426B2
Authority
JP
Japan
Prior art keywords
section
speech recognition
input
sections
processing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011095368A
Other languages
English (en)
Other versions
JP2012226220A (ja
Inventor
伸 小栗
真也 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2011095368A priority Critical patent/JP5396426B2/ja
Priority to PCT/JP2012/060478 priority patent/WO2012144525A1/ja
Publication of JP2012226220A publication Critical patent/JP2012226220A/ja
Application granted granted Critical
Publication of JP5396426B2 publication Critical patent/JP5396426B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Description

本発明は、音声認識装置、音声認識方法及び音声認識プログラムに関する。
入力された音声に対して音声認識処理を行い、文節ごとの認識結果の語句の候補を表示し、表示された複数の語句から所望の語句をユーザに選択させることにより音声認識結果の文章を確定する技術が知られている。また、音声認識結果における信頼度の低い文節をユーザに認識させるために、その文節の表示色を変更して表示する技術が知られている。一方、特許文献1には、音声認識手段により認識された音声に含まれる単語を辞書手段から抽出表示すると共に、当該単語と競合する確率が高い競合単語を抽出して表示し、ユーザに表示した競合単語を選択させる装置が開示されている。さらに、特許文献2には、音声認識により得られた音声に含まれる第1候補の語彙を表示すると共に、第2候補以降の語彙をユーザに選択可能に表示する装置が記載されている。
特開2006−146008号公報 特開平9−50291号公報
しかしながら、従来の音声認識技術では、音声認識結果の候補の中に所望の語句がない場合に、その修正を行うことができず、一旦、音声認識結果を文章として確定させた後に、誤りのある区間を選択して修正を行わなければならなかった。そのため、従来の音声認識技術では、認識結果の修正が煩雑であった。
そこで、本発明は、上記問題点に鑑みてなされたものであり、音声認識結果における認識の誤りがある区間の修正を容易に実施することが可能な音声認識装置、音声認識方法及び音声認識プログラムを提供することを目的とする。
上記課題を解決するために、本発明の音声認識装置は、入力音声を取得する音声取得手段と、複数の語句を記憶している辞書記憶手段と、音声取得手段により取得された入力音声を複数の区間に区切り、辞書記憶手段を参照して複数の区間毎に音声認識処理を実施し、音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識手段と、音声認識手段により出力された音声認識処理結果を提示する認識結果表示手段と、認識結果表示手段により提示された音声認識処理結果における区間に対して、少なくとも保留指定の入力を受け付ける指定受付手段と、認識結果表示手段による音声認識処理結果の提示において、指定受付手段により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示手段と、音声認識処理結果から保留区間を抽出し、抽出した保留区間の語句を編集可能に制御する編集制御手段と、編集制御手段により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付手段と、を備え、編集制御手段は、音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、ことを特徴とする。
また、上記課題を解決するために、本発明の音声認識方法は、入力音声を取得する音声取得ステップと、音声取得ステップにおいて取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して複数の区間毎に音声認識処理を実施し、音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識ステップと、音声認識ステップにおいて出力された音声認識処理結果を提示する認識結果提示ステップと、認識結果提示ステップにおいて提示された音声認識処理結果における区間に対して、少なくとも保留指定の入力を受け付け可能な指定入力受付ステップと、認識結果提示ステップにおける音声認識処理結果の提示において、指定入力受付ステップにおいて保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示ステップと、音声認識処理結果から保留区間を抽出し、抽出した保留区間の語句を編集可能に制御する編集制御ステップと、編集制御ステップにおいて編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付ステップと、を有し、編集制御ステップは、音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、ことを特徴とする。
また、上記課題を解決するために、本発明の音声認識プログラムは、コンピュータに、入力音声を取得する音声取得機能と、音声取得機能により取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して複数の区間毎に音声認識処理を実施し、音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識機能と、音声認識機能により出力された音声認識処理結果を提示する認識結果提示機能と、認識結果提示機能により提示された音声認識処理結果における区間に対して、少なくとも保留指定の入力を受け付け可能な指定入力受付機能と、認識結果提示機能による音声認識処理結果の提示において、指定受付機能により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示機能と、音声認識処理結果から保留区間を抽出し、抽出した保留区間の語句を編集可能に制御する編集制御機能と、編集制御機能により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付機能と、を実現させ、編集制御機能は、音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、ことを特徴とする。
本発明の音声認識装置、音声認識方法及び音声認識プログラムによれば、音声認識処理結果における区間ごとに保留指定の入力が受け付けられ、保留指定された保留区間がその他の区間と識別可能に表示されるので、音声認識処理結果において修正を要する区間の認識が容易となる。そして、保留区間の語句が編集可能に制御され、当該保留区間に対する文字列の入力が受け付けられるので、保留区間の語句の修正が実施される。従って、保留区間の修正が容易となる。
また、一の保留区間に対する修正入力を行うことにより、連続する複数の保留区間に対応する区間の修正が可能であるので、保留区間が統合されない場合において必要とされた後続する保留区間の削除操作が必要とされない。従って、ユーザの操作低減が可能となる。
また、本発明の音声認識装置は、編集制御手段により統合された一の保留区間に対応する入力音声に対して音声認識処理されて得られた語句を、音声認識手段により出力された音声認識処理結果から抽出する再認識手段と、再認識手段により抽出された語句を、一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段とを更に備えることを特徴とする。
上記構成によれば、複数の保留区間が統合された一の保留区間に対応する音声認識処理結果の語句が訂正候補の語句として表示されるので、ユーザが所望する、当該一の保留区間に対する訂正候補を提示できる可能性が高められる。従って、音声認識結果の修正におけるユーザの操作低減が可能となる。
また、本発明の音声認識装置は、編集制御手段により統合された一の保留区間に含まれる複数の区間の音声認識処理結果として音声認識手段により出力された語句に基づき、辞書記憶手段を検索する再検索手段と、再検索手段により検索された語句を、一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段とを更に備えることを特徴とする。
上記構成によれば、複数の保留区間が統合された一の保留区間に対応する語句が語彙を記憶した記憶手段の再検索により抽出され、抽出された語句が訂正候補の語句として表示されるので、ユーザが所望する、当該一の保留区間に対する訂正候補を提示できる可能性が高められる。従って、音声認識結果の修正におけるユーザの操作低減が可能となる。
また、本発明の音声認識装置では、修正入力受付手段により受け付けられた入力文字列に基づき辞書記憶手段を検索して入力文字列を含む訂正候補語句を抽出し、該訂正候補語句の末尾の文字列と、音声認識手段により出力された音声認識処理結果における保留区間の直後の文字列とが一致する場合に、該一致した文字列を省いて訂正候補語句を表示する訂正候補表示手段を更に備えることを特徴とする。
上記構成によれば、訂正候補語句の末尾の文字列が、保留区間の直後の文字列と一致する場合に、訂正候補語句の末尾における当該文字列が削除された上で表示されるので、訂正候補語句の選択後において当該文字列の削除操作が必要とされない。従って、ユーザの操作低減が可能となる。
音声認識結果における認識の誤りがある区間の修正を容易に実施することが可能となる。
音声認識装置の機能的構成を示すブロック図である。 音声認識装置のハードブロック図である。 音声認識処理結果を表すデータの構成及びデータの内容の例、及び表示語句データの例を示す図である。 音声認識処理結果を表示する表示画面の例を示す図である。 認識結果等格納部14に記憶された、指定入力後における音声認識処理結果の文字列情報(指定入力後文字列情報)、及び保留区間情報の構成及びデータの例を示す図である。 保留区間を示す表示画面の例を示す図である。 保留区間に対する修正入力後の指定入力後文字列情報及び保留区間情報の例を示す図である。 修正入力が実施された後の音声認識処理結果を示す表示画面の例を示す図である。 音声認識処理結果を表すデータの構成及びデータの内容の例、及び音声認識処理結果を表示する表示画面の例を示す図である。 指定入力後における指定入力後文字列情報、保留区間情報、及び表示画面の例を示す図である。 複数の保留区間が統合された後における指定入力後文字列情報、保留区間情報、及び表示画面の例を示す図である。 音声認識装置における、訂正候補表示処理に関わる機能構成を示すブロック図である。 音声認識処理結果を表すデータの構成及びデータの内容の例、及び表示画面の例を示す図である。 音声認識装置における、保留区間に対する訂正候補の語句を表示する処理に関わる機能構成を示すブロック図である。 保留指定が行われた後の指定入力後文字列情報、辞書DBから抽出された訂正候補語句、及び訂正候補語句が表示された表示画面の例を示す図である。 音声認識方法の処理内容を示すフローチャートである。 連続する複数の区間に対して保留指定の入力が行われた場合の処理内容を示すフローチャートである。 保留区間に対する訂正候補の語句を表示する処理内容を示すフローチャートである。 音声認識プログラムの構成を示す図である。
本発明に係る音声認識装置、音声認識方法及び音声認識プログラムの実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
図1は、音声認識装置1の機能的構成を示すブロック図である。本実施形態の音声認識装置1は、例えば、入力された音声に対して音声認識処理を行い、認識処理結果の文章における文節ごとの認識結果の語句の候補を表示し、表示された複数の語句から所望の語句をユーザに選択させることにより音声認識処理結果の文章を確定する装置であって、例えば、携帯端末により構成される。
図1に示すように、音声認識装置1は、機能的には、音声取得部11(音声取得手段)、音声認識部12(音声認識手段)、辞書DB13(辞書記憶手段)、認識結果等格納部14、認識結果表示部15(認識結果表示手段)、指定受付部16(指定受付手段)、保留区間情報記憶部17、保留区間表示部18(保留区間表示手段)、編集制御部19(編集制御手段)及び修正入力受付部20(修正入力受付手段)を備える。
図2は、音声認識装置1のハードウエア構成図である。音声認識装置1は、物理的には、図2に示すように、CPU101、主記憶装置であるRAM102及びROM103、データ送受信デバイスである通信モジュール104、ハードディスク、フラッシュメモリ等の補助記憶装置105、入力デバイスであるキーボード等の入力装置106、ディスプレイ等の出力装置107などを含むコンピュータシステムとして構成されている。図1に示した各機能は、図2に示すCPU101、RAM102等のハードウエア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104、入力装置106、出力装置107を動作させるとともに、RAM102や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。再び、図1を参照し、音声認識装置1の各機能部について詳細に説明する。
音声取得部11は、入力音声を取得する部分であって、例えばマイクといった装置により構成される。音声取得部11は、入力音声を表す入力音声信号を音声認識部12に送出する。
音声認識部12は、音声取得部11により取得された入力音声を複数の区間に区切り、辞書DB13を参照して複数の区間毎に音声認識処理を実施し、音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する部分である。具体的には、音声認識処理結果は、入力音声における各区間毎に、複数の認識結果の候補を含む。なお、音声認識部12により実施される音声認識処理は、周知の技術により実現可能である。音声認識部12は、音声認識処理結果を認識結果等格納部14に記憶させる。
辞書DB13は、複数の語句を記憶している記憶手段である。辞書DB13は、音声認識処理に際して、音声認識部12により参照される。また、後述するように、辞書DB13は、音声認識処理結果の修正に際しても参照される。
認識結果等格納部14は、音声認識処理結果を記憶する部分である。図3(a)は、音声認識処理結果を表すデータの構成及びデータの内容の例を示す図である。図3(a)に示すように、音声認識処理結果は、複数に区切られた文節(区間)毎に、音声認識結果の候補の語句を領域L,Lに記憶している。各文節は、文節IDにより識別される。例えば、文節IDが「4」の文節は、音声認識結果の候補の語句として、「高速」、「放送」、「妄想」及び「拘束」等を有している。これらの複数の語句のうち、音声認識結果として尤もらしい語句が、最上位の語句として領域Lに記憶されている。文節IDが「4」の文節では、「高速」が尤もらしい結果として記憶されている。また、その他の音声認識結果の候補の語句は、領域Lに記憶される。
また、認識結果等格納部14は、仮の音声認識処理結果として認識結果表示部15に表示される表示語句データを含む。図3(b)は、表示語句データの例を示す図である。表示語句データは、図3(a)に示す音声認識処理結果における、各文節の音声認識結果として尤もらしい語句の連結により構成される。即ち、図3(b)に示す例では、表示語句データは、図3(a)に示す音声認識処理結果のデータのうち、各文節の最上位に記憶されている語句を連結させた文字列「この料理には高速使われていますか」を記憶している。
また、認識結果等格納部14は、指定入力が行われた後における、音声認識処理結果を表す文字列情報である指定入力後文字列情報も記憶できる。なお、指定入力については後述する。
認識結果表示部15は、音声認識部12により出力された音声認識処理結果を提示する部分である。図4は、認識結果表示部15により表示された音声認識処理結果の表示画面の例を示す図である。図4に示すように、認識結果表示部15は、表示領域Dに音声認識処理結果の文章を表示させる。具体的には、認識結果表示部15は、例えば、図3(b)に例示される表示語句データを表示領域Dに表示させる。また、認識結果表示部15は、各文節(区間)の音声認識結果の候補の語句を表示領域Dに表示させる。図4に示す例では、表示領域Dにおいてポインタが「高速」にあるので、「高速」、「放送」、「妄想」及び「拘束」等の語句が、当該文節における音声認識結果の候補の語句として表示領域Dに表示されている。
指定受付部16は、認識結果表示部15により提示された音声認識処理結果における各区間に対して、少なくとも保留指定の入力を受け付ける部分である。具体的には、指定受付部16は、音声認識処理結果における各文節(区間)毎に、例えば、「確定指定」、「保留指定」及び「削除指定」といったユーザからの指定入力を受け付ける。指定入力は、図4の表示画面例における操作部S,S,Sの操作により実現される。
音声認識処理結果の文章を確定させるために、ユーザは、文節毎に表示領域Dに表示される認識結果の候補の語句の中から所望の語句を選択し、「確定指定」の操作を実施する。この「確定指定」の操作により、当該文節の認識結果の語句が確定される。一方、表示領域Dに表示される認識結果の候補の語句の中に所望の語句が存在しない場合には、ユーザは、「保留指定」の操作を実施する。「保留指定」の操作が実施されると、指定受付部16は、保留指定された区間である保留区間に関する情報を認識結果等格納部14又は保留区間情報記憶部17に記憶させる。
図5(a)は、認識結果等格納部14に記憶された、指定入力後における音声認識処理結果の文字列情報(指定入力後文字列情報)を示す図である。図5(a)では、「この」、「料理」、「には」、「使わ」、「れて」、「いますか」といった文節に対して「確定指定」が入力され、文節ID「4」により識別される文節に対して「保留指定」が入力された場合の例が示されている。即ち、指定受付部16は、ある文節に対して「保留指定」が入力されると、指定入力後文字列情報における当該文節に対応する領域に、保留区間であることを示すデータを記憶させる。図5(a)に示す例では、保留区間に対応する領域に、当該文節の文字数に相当する数の「*」のデータが記憶されている。
一方、図5(b)は、保留区間情報記憶部17に記憶された、保留区間に関する保留区間情報の構成及びデータの例を示す図である。即ち、 保留区間情報記憶部17は、保留区間情報を記憶する部分である。指定受付部16は、ある区間に対して「保留指定」が入力されると、図5(b)に示すように、保留区間を識別する保留区間IDに対応付けて、保留区間の文節ID及び当該文節の文字数を保留区間情報として保留区間情報記憶部17に記憶させる。なお、保留区間の情報は、認識結果等格納部14又は保留区間情報記憶部17のいずれかに記憶されれば足りる。即ち、保留区間情報が、図5(a)の例に示すように認識結果等格納部14に記憶される場合には、音声認識装置1は保留区間情報記憶部17を有さないこととしてもよい。
保留区間表示部18は、認識結果表示部15による音声認識処理結果の提示において、指定受付部16により保留指定の受け付けをされた保留区間を、保留指定されていない区間と識別可能な態様で表示する部分である。図6は、保留区間表示部18による、保留区間の表示画面の例を示す図である。図6に示すように、保留区間表示部18は、例えば、保留区間に対応する文字の数の「*」といった態様で、表示領域Dに保留区間を表示する。これにより、音声認識処理結果において修正を要する区間の認識が容易となる。
編集制御部19は、音声認識処理結果から保留区間を抽出し、抽出した保留区間の語句を編集可能に制御する部分である。具体的には、編集制御部19は、認識結果等格納部14における指定入力後文字列情報(図5(a)参照)を参照して保留区間を抽出する。または、編集制御部19は、保留区間情報記憶部17(図5(b)参照)を参照して保留区間の文節IDを抽出する。そして、編集制御部19は、抽出した保留区間の語句を、修正入力された語句による編集が可能なように制御する。このとき、編集制御部19は、編集可能であることを示すカーソルを当該保留区間の表示位置に表示させることができる。
修正入力受付部20は、編集制御部19により編集可能に制御された保留区間に対する文字列の入力を受け付ける部分である。具体的には、修正入力受付部20は、ユーザによる文字入力を受け付け、指定入力後文字列情報において保留区間として記憶されていた区間(図5(a)参照)に、受け付けた文字列(語句)を記憶させる。図7(a)は、保留区間に対する修正入力後の指定入力後文字列情報の例を示す図である。図7(a)に示すように、修正入力受付部20は、図5に示した保留区間に対する修正入力として「香草が」といった語句が入力されると、指定入力後文字列情報における当該保留区間に対応する領域に、入力された語句「香草が」を記憶させる。また、保留区間情報記憶部17において保留区間の情報を記憶していた場合には、保留区間に対する修正入力が行われると、修正入力受付部20は、図7(b)に示すように、当該保留区間に関する保留区間情報を削除する。そして、図8に示すように、認識結果表示部15は、修正入力が実施された後の指定入力後文字列情報を表示領域Dに表示させる。
また、指定入力後文字列情報において、例えば、「この 料理 には ** 使われて ***」というように、複数の文節(区間)が保留区間とされていた場合には、編集制御部19、修正入力受付部20及び認識結果表示部15は、以下のように機能する。即ち、編集制御部19は、文頭から保留区間を検索し、文字列「この料理には」の直後の保留区間を検出すると、当該保留区間を編集可能に制御する。そして、当該保留区間に対する修正入力が修正入力受付部20により受け付けられると、認識結果表示部15は、当該保留区間への修正入力を反映した指定入力後文字列情報を表示領域Dに表示させる。続いて、ある保留区間に対する修正入力の受け付けが完了すると、編集制御部19は、更に文末に向かって検索を実施し、次に検出した保留区間を抽出する。上記の例では、編集制御部19は、文字列「使われて」の直後の保留区間を抽出する。そして、編集制御部19は、当該保留区間を編集可能に制御すると共に、当該保留区間が編集可能であることを示すカーソルを当該保留区間の表示位置に表示させる。以下同様に、保留区間に対する修正入力が修正入力受付部20により受け付けられると、認識結果表示部15は、当該保留区間への修正入力を反映した指定入力後文字列情報を表示領域Dに表示させる。このように、一の保留区間に対する修正入力が実施されると、編集制御部19により次の保留区間が編集可能に制御されるので、編集可能な区間を指定するためのカーソルを次の保留区間に移動する操作の削減が可能となる。
次に、連続する複数の文節(区間)に対して保留指定の入力が行われた場合の各機能部の動作について説明する。ここでは、図9(a)に示すような音声認識処理結果が認識結果等格納部14に記憶されているものとして説明する。図9(a)に示すように、領域Lには、文節毎の尤もらしさの最上位の候補の語句として、「私」、「は」、「日々」、「公園」、「に」、「行き」、「ます」といった語句が記憶されている。この場合には、認識結果表示部15は、図9(b)に示すように、「私は日々公園に行きます」といった文章を表示領域Dに表示する。
続いて、「日々」及び「公園」の語句に対応する文節(区間)に対して、ユーザによる「保留指定」の入力が行われると、指定受付部16は、図10(a)に示すように、指定入力後文字列情報における当該区間に対応する領域に、保留区間を示すデータを記憶させる。ここでは、指定受付部16は、「日々」及び「公園」の2つの区間に対応する領域のそれぞれに、「**」及び「****」といったデータを記憶させる。又は、指定受付部16は、図10(b)に示す保留区間情報を保留区間情報記憶部17に記憶させてもよい。ここでは、指定受付部16は、保留区間ID「1」及び「2」の保留区間情報として、それぞれ文節ID「3」、文字数「2」及び文節ID「4」、文字数「4」といったデータを保留区間情報記憶部17に記憶させる。このとき、保留区間表示部18は、図10(c)に示すように、「日々」及び「公園」の語句に対応する文節が保留区間であることを識別可能に表示領域Dに表示させる。
編集制御部19は、図10(a)に示される指定入力後文字列情報を文頭から探索して、保留区間を抽出する。そして、編集制御部19は、指定入力後文字列情報をさらに探索して、抽出した保留区間に後続する区間が保留区間であるか否かを判定する。編集制御部19は、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する。即ち、編集制御部19は、図11(a)に示すように、指定入力後文字列情報における連続する保留区間を、一の保留区間に統合する。図11(a)では、統合された一の保留区間は、「******」といったデータにより示される。
または、編集制御部19は、図10(b)に示される保留区間情報を参照し、値が最も小さい保留区間IDを有する保留区間情報を抽出する。そして、編集制御部19は、保留区間情報記憶部17の保留区間情報をさらに探索して、抽出した保留区間の文節IDに後続する文節が保留区間として記憶されているか否かを判定する。編集制御部19は、保有区間情報において、文節IDが連続する複数の文節を保留区間として抽出した場合に、当該複数の文節の保留区間情報を一の保留区間情報に統合する。即ち、編集制御部19は、図11(b)に示すように、指定入力後文字列情報における連続する保留区間を、一の保留区間に統合する。図11(b)では、統合された保留区間情報は、保留区間IDが「1」の保留区間情報として、文節ID「3,4」及び文字数「6」といった情報を含む。
このように、連続する保留区間が一の保留区間に統合されることにより、一の保留区間に対する修正入力を実施することにより、連続する複数の保留区間に対応する全区間の修正が可能となる。これにより、保留区間が統合されない場合において必要とされた後続する保留区間の削除操作が不要となる。従って、ユーザの操作低減が可能となる。
次に、連続する保留区間が統合された場合における、当該区間に対する訂正候補の語句を表示する訂正候補表示処理のための各機能部の動作及び処理内容について説明する。図12は、音声認識装置1における訂正候補表示処理に関わる機能部を示すブロック図である。なお、図12では、図1に示した機能部は省略されている。図12に示すように、音声認識装置1は、再認識部21(再認識手段)、再検索部22(再検索手段)及び訂正候補表示部23(訂正候補表示手段)を更に備えることができる。
再認識部21は、編集制御部19により統合された一の保留区間に対応する入力音声に対して音声認識処理されて得られた語句を、音声認識部12により出力された音声認識処理結果から抽出する部分である。以下、再認識部21の処理内容について具体的に説明する。
図13(a)は、音声認識部12から出力された音声認識処理結果を表すデータの構成及びデータの内容の例を示す図である。この音声認識処理結果は、認識結果等格納部14に記憶されている。図9及び図10に示されるように、文節ID「3」及び「4」に対応する区間が保留区間に指定されると共に、図11に示されるように、これらの区間が編集制御部19により一の保留区間に統合された場合には、再認識部21は、図13(a)に示される音声認識処理結果を参照して、当該一の保留区間に対応する語句を抽出する。その際、一の保留区間に統合された保留区間の文字数との差異が所定数以内の文字数の語句を音声認識処理結果より抽出する。例えば、所定数を「1」と設定していたとすると、再認識部21は、統合された保留区間情報の文字数が「6」であるため、文字数が「5」から「7」の語句を音声認識処理結果より検索し、再認識部21は、音声認識処理結果の領域Lにおける語句「日比谷公園」を抽出する。そして、再認識部21は、抽出した語句を訂正候補として訂正候補表示部23に送出する。
また、音声認識装置1では、再検索部22により訂正候補の語句が検索されることとしてもよい。再検索部22は、編集制御部19により統合された一の保留区間に含まれる複数の区間の音声認識処理結果として音声認識部12により出力された語句に基づき、辞書DB13を検索する部分である。
具体的には、再検索部22は、統合された一の保留区間に関して、音声認識結果の候補として表示されていた語句をキーとして、いわゆる「あいまい検索」を実施する。あいまい検索は、キーとされた語句との一致の度合いに関する閾値を一定程度低下させて実施される検索である。即ち、あいまい検索では、通常の検索処理よりも、キーとされた語句との一致の度合いが低い語句が検索される。図9〜13に示す例では、再検索部22は、「ひびこうえん」といった語句をキーとして、辞書DB13を検索(あいまい検索)し、検索結果を訂正候補表示部23に送出する。
訂正候補表示部23は、再認識部21又は再検索部22により抽出された語句を、一の保留区間の語句の訂正候補の語句として表示する部分である。具体的には、再認識部21又は再検索部22により訂正候補の語句として「日比谷公園」が抽出された場合には、訂正候補表示部23は、一の保留区間の訂正候補の語句として、「日比谷公園」を表示する。図13(b)は、訂正候補表示部23により訂正候補の語句が表示された表示画面の例を示す図である。図13(b)に示すように、訂正候補表示部23は、訂正候補の語句「日比谷公園」を表示領域Dの当該保留区間に対応する位置に表示させる。
以上説明した再認識部21及び訂正候補表示部23によれば、複数の保留区間が統合された一の保留区間に対応する音声認識処理結果の語句が訂正候補の語句として表示されるので、ユーザが所望する、当該一の保留区間に対する訂正候補を提示できる可能性が高められる。また、再検索部22及び訂正候補表示部23によれば、複数の保留区間が統合された一の保留区間に対応する語句が語彙を記憶した記憶手段の再検索により抽出され、抽出された語句が訂正候補の語句として表示されるので、ユーザが所望する、当該一の保留区間に対する訂正候補を提示できる可能性が高められる。従って、音声認識結果の修正におけるユーザの操作低減が可能となる。なお、音声認識装置1は、再認識部21及び再検索部22のいずれか一方を備えることとしてもよい。
次に、保留区間に対する訂正候補の語句を表示する処理について説明する。図14は、当該処理に関わる機能部を示すブロック図である。
修正入力受付部20は、編集制御部19により編集可能に制御された保留区間に対する修正入力のための文字列の入力を受け付ける。そして、修正入力受付部20は、受け付けた文字列を訂正候補表示部23に送出する。
訂正候補表示部23は、修正入力受付部20により受け付けられた入力文字列に基づき辞書DB13を検索して入力文字列を含む訂正候補語句を抽出し、抽出した訂正候補語句の末尾の文字列と、音声認識手段により出力された音声認識処理結果における保留区間の直後の文字列とが一致する場合に、一致した文字列を省いて訂正候補語句を表示する。続いて、図15を参照して、訂正候補の語句の表示処理を具体的に説明する。
図15(a)は、保留指定が行われた後の指定入力後文字列情報を示す図である。この指定入力後文字列情報は、認識結果等格納部14に格納されている。ここでは、図15(a)に示す文字列「留守中に***を受けました」のうちの3番目の区間に保留指定が行われたものとする。続いて、修正入力として、文字列「で」がユーザにより入力されたとすると、修正入力受付部20は、文字列「で」の入力を受け付ける。そして、修正入力受付部20は、文字列「で」を訂正候補表示部23に送出する。次に訂正候補表示部23は、文字列「で」に基づき、辞書DB13を検索する。ここでは、訂正候補表示部23は、例えば、図15(b)に示されるような訂正候補語句「でんわを」、「でんわが」、「でんわに」を、辞書DB13から抽出したものとする。
この場合に、訂正候補表示部23は、図15(b)に示される訂正候補語句の末尾の文字列と、図15(a)に示される指定入力後文字列情報における保留区間の直後の文字列との一致の有無を判定し、一致する場合には、一致した文字列を省いて当該訂正候補語句を表示する。具体的には、図15(b)に示される訂正候補語句「でんわを」の末尾の文字列「を」と、図15(a)に示される指定入力後文字列情報における保留区間「***」の直後の文字列「を」とが一致するので、訂正候補表示部23は、訂正候補語句「でんわを」の末尾の文字列「を」を省き、語句「でんわ」を訂正候補語句として表示する。図15(c)は、訂正候補語句が表示された表示画面の例である。図15(c)に示されるように、訂正候補表示部23は、訂正候補語句「でんわ」、「でんわが」、「でんわに」を表示領域D10に表示させる。例えば所望の入力文章が「留守中にでんわを受けました」である場合に、訂正候補語句として「でんわを」ではなく「でんわ」が表示され、この訂正候補語句「でんわ」を保留区間の訂正語句として選択することにより、文字列「を」を後に削除する操作が不要となる。これにより、ユーザの操作負担の低減が可能となる。
なお、音声認識装置1は、図14を参照して説明した、保留区間に対する訂正候補の語句を表示する機能と、図12を参照して説明した、訂正候補の語句を表示する訂正候補表示処理の機能とを併せて備えることとしてもよい。
続いて、音声認識装置1における音声認識方法の処理内容を説明する。図16は、音声認識方法の処理内容を示すフローチャートである。
まず、音声取得部11は、入力音声を取得する(S1)。次に、音声認識部12は、音声取得部11により取得された入力音声を複数の区間に区切り、辞書DB13を参照して複数の区間毎に音声認識処理を実施し、音声認識処理結果を出力する(S2)。この音声認識処理結果は、認識結果等格納部14に格納される。続いて、認識結果表示部15は、音声認識部12により出力された音声認識処理結果を所定の表示装置により提示させる(S3)。
指定受付部16は、音声認識処理結果の各文節における最も文節IDの値が小さい文節を選択する(S4)。即ち、指定受付部16は、指定入力がされていない区間のうち最も文頭に近い区間を選択する。次に、指定受付部16は、選択された区間に対する、保留指定、確定指定等の指定入力を受け付ける(S5)。このとき、保留区間表示部18は、音声認識処理結果における、指定受付部16により保留指定の受け付けをされた保留区間を、保留指定されていない区間と識別可能な態様で表示する。そして、指定受付部16は、ステップS5において指定入力を受け付けた文節(区間)が、音声認識処理結果における最後の文節であるか否かを判定する(S6)。最後の文節でない場合には、ステップS4〜S6の処理が繰り返される。一方、最後の文節である場合には、処理手順はステップS7に進められる。
ステップS7において、編集制御部19は、音声認識処理結果から保留区間を抽出し、抽出した保留区間の語句を編集可能に制御する(S7)。続いて、修正入力受付部20は、編集制御部19により編集可能に制御された保留区間に対する文字列の入力(修正入力)を受け付ける(S8)。そして、編集制御部19は、ステップS8において修正入力を受け付けた保留区間が、音声認識処理結果における最後の保留区間であるか否かを判定する(S9)。そして、全ての保留区間に対する修正入力の受け付けが行われるまで、ステップS7〜S9の処理が繰り返される。
次に、図17を参照して、連続する複数の文節(区間)に対して保留指定の入力が行われた場合の処理内容を説明する。図17は、音声認識装置1における当該処理内容を示すフローチャートである。図17に示す処理は、図16のフローチャートにおけるステップS7のサブルーチンとして実行されることができる。
まず、編集制御部19は、音声認識処理結果から保留区間を取得する(S11)。次に、編集制御部19は、音声認識処理結果をさらに探索して、ステップS11において取得した保留区間に後続する区間が保留区間であるか否かを判定する(S12)。後続する区間が保留区間であると判定された場合には、処理手順はステップS13に進められる。一方、後続する区間が保留区間であると判定されなかった場合には、本フローチャートに示す処理手順は終了する。
ステップS13において、編集制御部19は、連続する複数の保留区間を抽出して、当該複数の保留区間を統合して一の保留区間として編集可能に制御する(S13)。次に、再認識部21は、編集制御部19により統合された一の保留区間に対応する入力音声に対して音声認識処理されて得られた語句を、音声認識部12により出力された音声認識処理結果から訂正候補の語句として抽出する(S14)。または、再検索部22は、編集制御部19により統合された一の保留区間に含まれる複数の区間の音声認識処理結果として音声認識部12により出力された語句に基づき、辞書DB13を検索し、検索により得られた語句を一の保留区間に対する訂正候補の語句として出力する(S14)。
次に、訂正候補表示部23は、再認識部21により抽出された語句又は再検索部22により検索された語句を、一の保留区間の語句の訂正候補の語句として表示する(S15)。そして、指定受付部16は、訂正候補表示部23により表示された訂正候補の語句に対する指定入力を受け付ける(S16)。
次に、図18を参照して、保留区間に対する訂正候補の語句を表示する処理内容を説明する。図18は、音声認識装置1における当該処理内容を示すフローチャートである。図18に示す処理は、図16のフローチャートにおけるステップS8のサブルーチンとして実行されることができる。
まず、修正入力受付部20は、保留区間に対する修正入力を受け付ける(S21)。そして、修正入力受付部20は、受け付けた文字列を訂正候補表示部23に送出する。次に、訂正候補表示部23は、修正入力受付部20により受け付けられた入力文字列に基づき辞書DB13を検索して入力文字列を含む訂正候補語句を抽出する(S22)。続いて、訂正候補表示部23は、訂正候補語句の末尾の文字列と、音声認識処理結果における保留区間の直後の文字列との一致の有無を判定する(S23)。両文字列が一致する場合には、処理手順はステップS24に進められる。
ステップS24において、訂正候補表示部23は、訂正候補語句の末尾における、保留区間直後の文字列と一致した文字列を削除する(S24)。そして、ステップS25において、訂正候補表示部23は、訂正候補の語句を提示する(S25)。
次に、コンピュータを、本実施形態の音声認識装置1として機能させるための音声認識プログラムについて説明する。図19は、図1,12及び14に示した音声認識装置1に対応する音声認識プログラム1mの構成を示す図である。
音声認識プログラム1mは、音声認識処理を統括的に制御するメインモジュール10m、音声取得モジュール11m、音声認識モジュール12m、辞書DB13m、認識結果等格納モジュール14m、認識結果提示モジュール15m、指定受付モジュール16m、保留区間情報記憶モジュール17m、保留区間表示モジュール18m、編集制御モジュール19m及び修正入力受付モジュール20mを備えて構成される。また、音声認識プログラム1mは、再認識モジュール21m、再検索モジュール22m及び訂正候補表示モジュール23mを更に備えて構成されてもよい。そして、各モジュール10m〜23mにより、音声認識装置1における各機能部11〜23のための各機能が実現される。なお、音声認識プログラム1mは、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図12に示されるように、記録媒体1dのプログラム格納領域1rに記憶される態様であってもよい。
以上説明した本実施形態の音声認識装置1、音声認識方法及び音声認識プログラムでは、音声認識処理結果における区間ごとに保留指定の入力が指定受付部16により受け付けられ、保留指定された保留区間がその他の区間と識別可能に保留区間表示部18により表示されるので、音声認識処理結果において修正を要する区間の認識が容易となる。そして、編集制御部19により保留区間の語句が編集可能に制御され、修正入力受付部20により当該保留区間に対する文字列の入力が受け付けられるので、保留区間の語句の修正が実施される。従って、保留区間の修正が容易となる。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
1…音声認識装置、11…音声取得部、12…音声認識部、13…辞書DB、14…認識結果等格納部、15…認識結果表示部、16…指定受付部、17…保留区間情報記憶部、18…保留区間表示部、19…編集制御部、20…修正入力受付部、21…再認識部、22…再検索部、23…訂正候補表示部、1d…記録媒体、1m…音声認識プログラム、1r…プログラム格納領域、10m…メインモジュール、11m…音声取得モジュール、12m…音声認識モジュール、14m…認識結果等格納モジュール、15m…認識結果提示モジュール、16m…指定受付モジュール、17m…保留区間情報記憶モジュール、18m…保留区間表示モジュール、19m…編集制御モジュール、20m…修正入力受付モジュール、21m…再認識モジュール、22m…再検索モジュール、23m…訂正候補表示モジュール。

Claims (6)

  1. 入力音声を取得する音声取得手段と、
    複数の語句を記憶している辞書記憶手段と、
    前記音声取得手段により取得された入力音声を複数の区間に区切り、前記辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識手段と、
    前記音声認識手段により出力された音声認識処理結果を提示する認識結果表示手段と、
    前記認識結果表示手段により提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付ける指定受付手段と、
    前記認識結果表示手段による音声認識処理結果の提示において、前記指定受付手段により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示手段と、
    前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御手段と、
    前記編集制御手段により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付手段と、を備え、
    前記編集制御手段は、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
    ことを特徴とする音声認識装置。
  2. 前記編集制御手段により統合された一の保留区間に対応する入力音声に対して音声認識処理されて得られた語句を、前記音声認識手段により出力された音声認識処理結果から抽出する再認識手段と、
    前記再認識手段により抽出された語句を、前記一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段と
    を更に備えることを特徴とする請求項1に記載の音声認識装置。
  3. 前記編集制御手段により統合された一の保留区間に含まれる複数の区間の音声認識処理結果として音声認識手段により出力された語句に基づき、前記辞書記憶手段を検索する再検索手段と、
    前記再検索手段により検索された語句を、前記一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段と
    を更に備えることを特徴とする請求項1に記載の音声認識装置。
  4. 前記修正入力受付手段により受け付けられた入力文字列に基づき前記辞書記憶手段を検索して前記入力文字列を含む訂正候補語句を抽出し、該訂正候補語句の末尾の文字列と、前記音声認識手段により出力された音声認識処理結果における前記保留区間の直後の文字列とが一致する場合に、該一致した文字列を省いて前記訂正候補語句を表示する訂正候補表示手段を更に備えることを特徴とする請求項1に記載の音声認識装置。
  5. 入力音声を取得する音声取得ステップと、
    前記音声取得ステップにおいて取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識ステップと、
    前記音声認識ステップにおいて出力された音声認識処理結果を提示する認識結果提示ステップと、
    前記認識結果提示ステップにおいて提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付け可能な指定入力受付ステップと、
    前記認識結果提示ステップにおける音声認識処理結果の提示において、前記指定入力受付ステップにおいて保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示ステップと、
    前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御ステップと、
    前記編集制御ステップにおいて編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付ステップと、を有し、
    前記編集制御ステップは、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
    ことを特徴とする音声認識装置における音声認識方法。
  6. コンピュータに、
    入力音声を取得する音声取得機能と、
    前記音声取得機能により取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識機能と、
    前記音声認識機能により出力された音声認識処理結果を提示する認識結果提示機能と、
    前記認識結果提示機能により提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付け可能な指定受付機能と、
    前記認識結果提示機能による音声認識処理結果の提示において、前記指定受付機能により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示機能と、
    前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御機能と、
    前記編集制御機能により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付機能と、を実現させ、
    前記編集制御機能は、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
    ことを特徴とする音声認識プログラム。
JP2011095368A 2011-04-21 2011-04-21 音声認識装置、音声認識方法及び音声認識プログラム Active JP5396426B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011095368A JP5396426B2 (ja) 2011-04-21 2011-04-21 音声認識装置、音声認識方法及び音声認識プログラム
PCT/JP2012/060478 WO2012144525A1 (ja) 2011-04-21 2012-04-18 音声認識装置、音声認識方法及び音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011095368A JP5396426B2 (ja) 2011-04-21 2011-04-21 音声認識装置、音声認識方法及び音声認識プログラム

Publications (2)

Publication Number Publication Date
JP2012226220A JP2012226220A (ja) 2012-11-15
JP5396426B2 true JP5396426B2 (ja) 2014-01-22

Family

ID=47041631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011095368A Active JP5396426B2 (ja) 2011-04-21 2011-04-21 音声認識装置、音声認識方法及び音声認識プログラム

Country Status (2)

Country Link
JP (1) JP5396426B2 (ja)
WO (1) WO2012144525A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6327745B2 (ja) * 2014-02-24 2018-05-23 日本放送協会 音声認識装置、及びプログラム
US10074366B2 (en) * 2014-04-08 2018-09-11 Sony Corporation Information processing device, information processing method, and program
US10950240B2 (en) * 2016-08-26 2021-03-16 Sony Corporation Information processing device and information processing method
WO2018043137A1 (ja) * 2016-08-31 2018-03-08 ソニー株式会社 情報処理装置及び情報処理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63278173A (ja) * 1987-05-11 1988-11-15 Nec Corp 文書入力方式
JPH06282293A (ja) * 1993-03-29 1994-10-07 Sony Corp 音声認識装置
JP3104661B2 (ja) * 1997-11-25 2000-10-30 日本電気株式会社 日本語文章作成装置
JP2002140094A (ja) * 2000-11-01 2002-05-17 Mitsubishi Electric Corp 音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4509361B2 (ja) * 2000-11-16 2010-07-21 株式会社東芝 音声認識装置、認識結果修正方法及び記録媒体
JP4020083B2 (ja) * 2004-02-16 2007-12-12 日本電気株式会社 書き起こしテキスト作成支援システムおよびプログラム
JP2006039954A (ja) * 2004-07-27 2006-02-09 Denso Corp データベース検索装置、プログラム及びナビゲーション装置
JP4574390B2 (ja) * 2005-02-22 2010-11-04 キヤノン株式会社 音声認識方法
JP2009098490A (ja) * 2007-10-18 2009-05-07 Kddi Corp 音声認識結果編集装置、音声認識装置およびコンピュータプログラム

Also Published As

Publication number Publication date
WO2012144525A1 (ja) 2012-10-26
JP2012226220A (ja) 2012-11-15

Similar Documents

Publication Publication Date Title
RU2379767C2 (ru) Коррекция ошибок для систем распознавания речи
US8954329B2 (en) Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information
US8407039B2 (en) Method and apparatus of translating language using voice recognition
US8949133B2 (en) Information retrieving apparatus
EP2523188A1 (en) Speech recognition system and method based on word-level candidate generation
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2002014954A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
CN104715005B (zh) 信息处理设备以及方法
JP5396426B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP3104661B2 (ja) 日本語文章作成装置
JP3795692B2 (ja) 文字処理装置および方法
JP5364412B2 (ja) 検索装置
JP5688677B2 (ja) 音声入力支援装置
JP4189336B2 (ja) 音声情報処理システム、音声情報処理方法及びプログラム
JP4966324B2 (ja) 音声翻訳装置、および方法
KR102091684B1 (ko) 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치
JP2009140287A (ja) 検索結果表示装置
JP6499228B2 (ja) テキスト生成装置、方法、及びプログラム
KR20130128172A (ko) 장애인을 위한 이동통신 단말기 및 문자생성방법
JP3903841B2 (ja) 自動通訳装置及び自動通訳用プログラム
JP2006031725A (ja) 文字処理装置
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JPWO2005076259A1 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
KR100960490B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
JP2005234136A (ja) 音声認識サーバ、音声入力システム、及び、音声入力方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131021

R150 Certificate of patent or registration of utility model

Ref document number: 5396426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250