JP2005234136A - 音声認識サーバ、音声入力システム、及び、音声入力方法 - Google Patents

音声認識サーバ、音声入力システム、及び、音声入力方法 Download PDF

Info

Publication number
JP2005234136A
JP2005234136A JP2004041945A JP2004041945A JP2005234136A JP 2005234136 A JP2005234136 A JP 2005234136A JP 2004041945 A JP2004041945 A JP 2004041945A JP 2004041945 A JP2004041945 A JP 2004041945A JP 2005234136 A JP2005234136 A JP 2005234136A
Authority
JP
Japan
Prior art keywords
block
communication terminal
voice
speech
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004041945A
Other languages
English (en)
Other versions
JP4347716B2 (ja
Inventor
Naonobu Yamashita
直信 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2004041945A priority Critical patent/JP4347716B2/ja
Publication of JP2005234136A publication Critical patent/JP2005234136A/ja
Application granted granted Critical
Publication of JP4347716B2 publication Critical patent/JP4347716B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】 ネットワークを利用して音声文字入力を実現する際の通信データ容量を低減することである。
【解決手段】 音声入力システム1は、入力された音声を送信する通信端末10と、この音声を認識する音声認識サーバ20とから構成される。音声認識サーバ20は、入力された音声を受信するとこれを認識し、認識結果から複数のブロック(単語や文節)を作成する。作成されたブロックの内、先頭のブロックが通信端末10宛に送信され、認識結果が正しい場合には、要求に応じて次のブロックが送信される。認識結果が誤っている場合には、通信端末10は、修正候補の送信を音声認識サーバ20に要求する。音声認識サーバ20は、通信端末10にて修正されたブロックを受信すると、当該ブロックを基に後続のブロックを再音声認識し、認識結果を返信する。
【選択図】 図1

Description

端末にて入力された音声をネットワーク側で認識する技術に関する。
従来、ユーザの音声を認識し、認識結果をテキストデータとして表示する技術が実用化されている。かかる機能を有する装置の中には、音声が誤認識された場合に、正規の入力が容易に可能となるように、修正候補の一覧をユーザに提示するものある(例えば、特許文献1参照。)。一方で、装置単体での音声認識には、高い処理能力とデータ記憶容量が要求される。このため、音声認識機能をもたない端末においても音声による文字入力が可能となるように、ネットワークを利用した音声文字入力技術の開発が検討されている。
特開平9−297595号公報
しかしながら、ネットワークを利用して端末とサーバ装置との間で音声文字入力技術を実現しようとすると、以下のような問題点が懸念される。すなわち、音声認識機能を有するサーバ装置が、文や文章単位での音声認識(ディクテーション認識)を行おうとすると、誤認識があった場合に、これを修正するための単語や文節単位の候補リスト(以下、「修正候補」と記す。)を一括して端末宛に送信することになる。ところが、音声認識された文や文章の中には、単語や文節単位でみると正しく認識されているブロックもある場合が多く、この場合には、修正の必要のないブロックに関してまで、修正候補が送信されてしまう。このことは、通信データ容量を低減する観点から非効率的である。
そこで、本発明の課題は、ネットワークを利用して音声文字入力を実現する際の通信データ容量を低減することである。
本発明に係る音声認識サーバは、通信端末にて入力された音声を認識する音声認識手段と、前記音声認識手段による音声認識結果を複数のブロックに分割して前記通信端末宛に順次送信させると共に、当該通信端末からの要求に応じて、前記複数のブロックのうち、該要求のあったブロックの修正候補を前記通信端末宛に送信させる制御を行う制御手段とを備える。
本発明に係る音声入力方法は、通信端末にて入力された音声を認識する音声認識ステップと、前記音声認識ステップにおける音声認識結果を複数のブロックに分割して前記通信端末宛に送信する認識結果送信ステップと、当該通信端末からの要求に応じて、前記認識結果送信ステップにて送信された前記複数のブロックのうち、前記要求のあったブロックの修正候補を前記通信端末宛に送信する修正候補送信ステップとを含む。
これらの発明によれば、入力された音声の認識結果は、複数のブロック(単語、文節などの構成単位)に一旦分割された後に、各ブロック単位で順次、通信端末宛に送信される。これにより、ブロックに対する修正が必要となった場合には、通信端末は、当該ブロックに関する修正候補のみを要求及び取得することができる。換言すれば、音声認識サーバは、正しい認識の行われたブロックの修正候補に関しては、送信処理を省略することができるので、その分の通信データ容量が低減される。通信データ容量の低減は、通信負荷の低減、通信時間の短縮、通信コストの節約などの効果を導き得るほかに、通信端末におけるメモリ容量の効率的な使用にも資する。
本発明に係る音声認識サーバにおいて好ましくは、前記音声認識手段は、前記通信端末から送信された、ブロックの修正結果を使用して、当該ブロックに後続するブロックを再認識し、前記制御手段は、前記音声認識手段により再認識されたブロックを前記通信端末宛に送信させる制御を行う。
本発明によれば、音声認識サーバは、誤って音声認識されたブロックの修正候補を送信した後に、通信端末にて選択された正しい修正候補(修正結果)を受信したときには、当該ブロックの後続ブロックの再認識に際して、上記修正結果を反映させる。そして、再認識されたブロックは、ブロック単位で通信端末宛に送信される。すなわち、入力音声を構成する複数のブロックに対する音声認識は、自ブロックよりも先に認識されたブロックの正しい認識結果が活用されているため、高精度なものとなる。これにより、ブロックの認識精度は、先行するブロックの認識結果が確定する度に徐々に増していき、修正候補の要求が不要となる確率も高まっていく。その結果、修正候補の要求及び提供に伴う通信データ量の増大は抑制される。
本発明に係る音声入力システムは、上述した音声認識サーバと、当該音声認識サーバと通信可能に接続された通信端末とを備える音声入力システムであって、前記通信端末は、音声を入力して前記音声認識サーバ宛に送信する音声入力手段と、前記音声認識サーバによる音声認識結果をブロック単位で表示して、ブロックの修正候補の提示を要求する要求手段とを備える。
本発明によれば、通信端末においては、入力された音声の認識結果が、文や文章単位ではなく単語や文節といったブロック単位でユーザに提示される。したがって、ユーザは、音声認識結果の正否をブロック毎に確認することができる。提示されたブロックが正しく認識されている場合には、たとえ他のブロックが誤って認識されている場合であっても、正しいブロックに関しては修正候補の送信を要求する必要はないので、ユーザによる入力文字の確定効率は向上する。また、入力音声をブロック単位で確定可能となるので、確定後のブロックを、それ以降のブロックの認識に再利用することができ、入力音声の認識精度が向上する。
本発明によれば、ネットワークを利用して音声文字入力を実現する際の通信データ容量を低減することが可能となる。
以下、添付図面を参照しながら、本発明に係る音声入力システムの一実施形態について説明する。図1に示すように、音声入力システム1は、通信端末10と音声認識サーバ20とを少なくとも備えて構成される。通信端末10と音声認識サーバ20とは、ネットワークNを経由して双方向に各種信号の送受信が可能なように接続されている。ネットワークNは、その種別を問わないが、例えば、インターネットを始めとする公衆回線網、あるいは、高速デジタル回線などの専用回線網である。
まず、通信端末10の構成を説明する。
通信端末10は、音声入力インタフェース11(音声入力手段に対応)と、認識結果提示部12(要求手段に対応)と、修正候補格納部13と、認識結果修正部14とを備えて構成される。これら各構成部分は、バスを介して各種信号の入出力が可能なように接続されている。通信端末10は、例えば携帯電話である。
詳細な処理内容に関しては、動作説明において後述するが、各構成部分は、以下に説明する機能を有する。
音声入力インタフェース11は、ユーザの発した音声を音声信号に変換し、音声認識サーバ20宛に送信する。認識結果提示部12は、音声認識サーバ20からブロック単位で送信される認識結果を受信し、これをユーザに提示する。誤った認識結果を提示した場合には、修正候補の送信を要求してこれを受信し、ユーザに選択を促す。また、認識結果提示部12は、選択された修正候補を修正結果として送信すると共に、受信された認識結果の確定を行う。
修正候補格納部13は、物理的には、EEPROM(Electrically Erasable and Programmable Read Only Memory)等の内蔵メモリにより構成される。修正候補格納部13は、機能的には、要求に応じて音声認識サーバ20から送信された修正候補を受信し、これを格納する。また、認識結果の確定後に、ブロックの修正候補を削除する。
認識結果修正部14は、ハードウェアとしての操作ボタンや入力キーにより構成され、ユーザからの指示に従って、誤った認識結果あるいは修正候補が入力音声に合致するように適宜変更を加える。
次に、音声認識サーバ20の構成を説明する。
音声認識サーバ20は、音声認識部21(音声認識手段に対応)と、ディクテーション辞書22と、ブロック制御部23(制御手段に対応)と、修正結果受信部24とを備えて構成される。これら各構成部分は、バスを介して各種信号の入出力が可能なように接続されている。
音声認識部21は、ディクテーション辞書22を参照しながら、受信された音声信号の波形を文字列として認識する。そして、この認識結果に修正候補を付加して、ブロック制御部23に出力する。
ディクテーション辞書22には、入力音声から文字列を特定可能なように、音声信号の波形パターンに、テキストデータが対応付けて登録されている。テキストデータとしては、最も確率の高い認識結果に加えて、二番目、三番目に確率の高い修正候補が複数格納されている。テキストデータは、ブロック化を容易にする観点から、単語や文節といった言語単位に区切って格納されている。例えば、認識結果として“手編みを”が格納されている場合には、発音がこれに近い“手紙を”、“手書きを”といったデータが修正候補として同時に格納されている。
ブロック制御部23は、ROM(図示せず)に予め記録されているプログラムを読み出し、当該プログラムに従って、ブロックの作成、送受信、確定、削除処理といった統括的制御を行う。例えば、認識結果が“私に/手編みを/作りなさい”である場合には、これら三つの文節のそれぞれがブロック1,2,3となるように、三つのブロックが作成される。ブロック制御部23は、作成したブロックを通信端末10宛に送信し、確定信号の返信を契機として、送信したブロックを認識結果に確定する。また、不要となったブロックを削除する。
修正結果受信部24は、通信端末10から送信された修正結果を受信し、これをブロック制御部23に出力する。
次に動作を説明する。
まず、図2のフローチャートを参照して、通信端末10側の動作を説明する。通信端末10のユーザの音声が音声入力インタフェース11により入力されると(S1)、ネットワークNを経由して、入力音声が音声認識サーバ20宛に送信される。S2では、入力音声の認識結果は、一括して送信されず、認識結果を構成する複数のブロックのうち、まず、先頭の1ブロックが通信端末10宛に送信される。このブロックの認識結果は、通信端末10のユーザによって確認され、正しく認識されている場合には(S3;Yes)、認識結果の確定が為される(S10)。
これに対して、認識結果が誤っている場合には(S3;No)、音声認識サーバ20に対して修正候補の送信が要求される(S4)。通信端末10が修正候補を受信すると(S5)、ユーザは、提示された修正候補の中から正しい修正候補の有無を確認する。確認の結果、正しい修正候補が提示されている場合には(S6;Yes)、その修正候補が正しい認識結果として選択される(S7)。これに対して、提示された修正候補の中に正しい認識結果が存在しない場合には(S6;No)、通信端末10のユーザが自ら、キー入力による修正を行う(S8)。
S9では、S7又はS8で修正された認識結果が修正結果として、通信端末10から音声認識サーバ20宛に送信される。この処理を以って、修正された認識結果が正しい認識結果に確定する。確定された旨は、音声認識サーバ20宛に通知される(S10)。この時点で、入力音声から作成された全てのブロックに関して認識結果が確定している場合には(S11;Yes)、通信端末10側の一連の処理は終了する。一方、認識結果が確定していないブロックが存在する場合には(S11;No)、当該ブロックの送信が音声認識サーバ20に対して要求される(S12)。このブロックは、S10で認識結果の確定したブロックの直後に位置するブロックである。当該ブロックに関するS2〜S12の処理は、S1で入力された音声の全ブロックの認識結果が確定するまで、繰り返し実行される。
続いて、図3のフローチャートを参照して、音声認識サーバ20側の動作を説明する。音声認識サーバ20は、T1で音声信号を受信すると、この音声信号の認識を行う(T2)。音声認識処理に関しては、周知慣用の音声処理技術であるので、詳細な説明は省略するが、単語や文節の認識候補は、音声波形を解析することのみならず、その前に位置する単語や文節から文や文章の構成を推測することで抽出される。T3では、認識結果とその修正候補がブロック化される。
次いで、ブロック化された認識結果とその修正候補のうち、認識結果の先頭に位置する1ブロックが通信端末10宛に送信される(T4)。その後、当該ブロックに関して、修正候補の送信要求が受信された場合には(T5)、認識結果が誤っていたと判断することができるので、T3でブロック化された修正候補が通信端末10宛に送信される(T6)。音声認識サーバ20は、上記ブロックの修正結果を受信すると(T7)、この修正結果をもとに、誤認識したブロックを修正する(T8)。この処理を以って、次のブロックの認識に使用されるべくブロックの内容が確定する(T9)。
T10において、ブロックの認識結果が確定された旨の通知を通信端末10から受けると、T1で受信された音声信号の認識結果を構成する全てのブロックが確定したか否かの判定が為される(T11)。判定の結果、全ブロックが確定している場合には(T11;Yes)、上記認識結果は不要となるので削除される(T12)。一方、確定していないブロックが存在する場合には(T11;No)、音声認識サーバ20は、当該ブロックの送信要求を待機し、これを受信すると(T13)、その直前に位置するブロックに対する修正の有無を確認する。
上記ブロックが修正されている場合には(T14;Yes)、音声認識サーバ20は、修正後の確定ブロックを反映させて、次のブロックの再認識処理を実行する(T15)。再認識処理の実行後は、T3に戻り、認識結果のブロック化を含む一連の処理が実行される。T3〜T15の処理は、T2における認識結果を構成する全ブロックが確定するまで繰り返し実行される。
なお、T14において、直前のブロックの修正が無い場合には(T14;No)、再認識処理を行う必要がないので、T15及びT3の各処理は省略され、T4以降の処理が実行される。
図4及び図5は、通信端末10と音声認識サーバ20とが連携して実行する音声入力処理を説明するためのフローチャートである。説明の前提として、本実施の形態では、通信端末10のユーザが“私に手紙を下さい”という文言の音声入力を所望する状況を想定する。
まずA1では、通信端末10において、音声入力インタフェース11を介した音声の入力が行われる。通信端末10のユーザが“私に手紙を下さい”なる音声を発すると、この音声信号がネットワークN経由で音声認識サーバ20宛に送信される。音声認識サーバ20では、音声認識部21により、ディクテーション辞書22を参照した上述の音声認識処理が実行される(A2)。音声認識部21は、正しくは“私に手紙を下さい”と認識すべきところを、誤って“私に手編みを作りなさい”という認識結果を出力する(A3)。
認識結果は、その修正候補と共に、ブロック制御部23に入力され(A4)、ブロック制御部23によりブロックが作成される。ブロックは、単語や文節を一単位として作成され、作成されたブロックには、認識順序を表す数字が先頭から順に付加される(A5)。例えば、A3では、“私に手編みを作りなさい”という認識結果が得られたので、この認識結果は三つのブロック1〜3に分解される。すなわち、ブロック1として“私に”が、ブロック2として“手編みを”が、ブロック3としては“作りなさい”がそれぞれ作成される。
A6では、認識結果の一部であるブロック1が、ブロック制御部23により、通信端末10宛に送信される。このブロック1(私に)は、通信端末10の認識結果提示部12により表示装置に表示される(A7)。これにより、通信端末10のユーザは、“私に”の入力音声が正しく認識されたことを確認する。ブロック1の確定が指示されると、その旨を通知する信号(確定信号)が、認識結果提示部12により、音声認識サーバ20宛に送信される(A8)。音声認識サーバ20は、ブロック制御部23により確定信号を受信し、この受信処理を以って、ブロック1を“私に”に確定する(A9)。
このように、正しい認識結果が得られたブロック1に関しては、通信端末10側で使用されることのない修正候補が送受信されることがないので、通信データ容量が減少する。これにより、通信負荷の低減、通信時間の短縮、通信コストの節約などが実現される。また、通信端末10の受信するデータは必要最小限となるので、限られたメモリ容量を効率的に使用することができる。
ブロック1の確定後、ブロック制御部23は、ブロック1に後続するブロック2を通信端末10宛に送信する(A10)。ブロック2としての“手編みを”は、A7と同様に、認識結果提示部12により表示装置に表示される(A11)。通信端末10のユーザは、所望の文字列“手紙を”が誤認識されたことを表示内容から検知し、修正候補の提示を要求する。この要求は、認識結果提示部12から音声認識サーバ20に対する修正候補要求信号の送信により完了する(A12)。
ブロック制御部23は、上記修正候補要求信号の入力を契機として、A4で入力された修正候補である“手紙を”、“手書きを”を通信端末10宛に送信する(A13)。この修正候補は、修正候補格納部13に一旦格納された後、認識結果提示部12に出力される(A14)。A15では、認識結果提示部12は、複数の修正候補を表示装置に表示することでユーザに提示し、ユーザによる選択を待機する。本実施の形態では、“手編みを”の修正候補として、“手紙を”、“手書きを”の二種類の文字列がユーザに提示される。
正しい修正候補である“手紙を”をユーザが選択すると、かかる文字列が修正結果として、認識結果提示部12から認識結果修正部14に出力される(A16)。なお、A15で掲げられた修正候補の中に正しい文字列がない場合には、これに近い任意の修正候補が選択された後に、認識結果修正部14による修正が施される。このように、修正結果は、必要に応じて認識結果修正部14を経由した後、音声認識サーバ20宛に送信される(A17)。そして、修正結果である文字列“手紙を”は、音声認識サーバ20の修正結果受信部24により受信され(A18)、ブロック制御部23にてブロック2に確定する(A19)。
上述のように、修正候補の送信は、音声認識結果が誤りであったブロック2に関してのみ行えば足りるので、全てのブロックの修正候補を一括して送信する従来の方法と比較して、所要の送信データ容量は格段に減少する。
図5に移り、A20では、入力対象であるブロック1〜3のうち、現時点で確定済みのブロックの識別番号1,2が、音声認識部21に通知される。音声認識部21では、ブロック1,2に相当する文字列“私に手紙を”に続く語彙として、“作りなさい”が再認識される(A21)。図4のA2における音声認識処理は、“私に手編みを”に繋がる文字列の認識処理として実行されたため、“作りなさい”という誤った認識結果が出力された。これに対して、A21における音声認識処理は、正しい認識結果である“私に手紙を”に繋がる文字列の認識処理として実行されるため、“下さい”という正しい認識結果が得られる可能性が高い(A22)。
A23では、A21による認識結果“下さい”とその修正候補が、音声認識部21からブロック制御部23に出力される。出力先のブロック制御部23は、再認識結果を基にブロック1〜3の作成を行う(A24)。このとき作成されるブロック1,2,3は、それぞれ“私に”、“手紙を”、“下さい”である。A25では、これらのブロックのうち、未確定のブロック3が、ブロック制御部23により、通信端末10宛に送信される。
通信端末10は、認識結果提示部12により、ブロック3の文字列“下さい”をユーザに提示する(A26)。ユーザは、提示内容を参照して、入力した音声が正しく認識されていることを確認すると、確定指示を出す。この確定指示は、確定信号として、認識結果提示部12から音声認識サーバ20宛に送信される(A27)。音声認識サーバ20は、確定信号の受信により、ブロック3を“下さい”に確定する(A28)。音声認識サーバ20は、この確定処理を以って、図4のA1で入力された音声の認識結果が全て確定したものと判断し、不要となったブロック1〜3を削除する(A29)。
通信端末10においても、ブロック3の確定信号の送信処理(A27)を以って、入力音声の認識結果が全て確定したものと判断される(A30)。A31では、認識結果提示部12から修正候補格納部13に対して、修正候補の削除が指示され、この指示を受けた修正候補格納部13は、図4のA13で格納された修正候補を削除する(A32)。これにより、初期化が完了し、更に別の音声入力処理の実行が可能となる。
以上説明したように、本実施の形態における音声入力システム1によれば、通信端末10にて入力された音声の認識結果が、単語や文節のブロックに区切られた後に、音声認識サーバ20からブロック単位で送信される。送信されたブロックに誤認識が無かった場合には、通信端末10は、次なるブロックの認識結果の送信を要求し、有った場合にのみ、誤認識されたブロックに関する修正候補の送信を要求する。このため、音声入力された単語や文節ごとの誤認識の有無に関わらず全てのブロックの修正候補を送受信していた従前のシステムと比較して、正しく認識されたブロックの修正候補リストの送受信データ容量が減少する。より具体的には、通信端末は、従来技術では、ブロック1〜3の認識結果、及びブロック1〜3の修正候補を受信しなければならなかったが、本発明では、ブロック1〜3の認識結果、及びブロック2の修正候補を受信すれば足りる。このため、ブロック1,3の容量分のデータ受信が節減される。
更には、入力音声の誤認識の誘発を抑制することができるという効果もある。すなわち、入力音声は、音声波形のみから単純に認識されるのみではなく、先に認識されたブロックに繋がる確率の高い単語や文節が優先的に選択されるしくみとなっている。このため、1ブロックの誤認識が以降のブロックの認識結果に負の影響を与えてしまう。換言すれば、1ブロックの誤認識が他のブロックの誤認識を誘発する。これが認識精度を低下させる要因となる。音声入力システム1によれば、音声の認識結果がブロック単位で順次ユーザに提示され、その正否が確認された上で、後続のブロックに関する音声認識が再度実行される。したがって、誤って認識されたブロックが後続のブロックの認識に影響を与えることがなくなり、これに伴う誤認識の誘発が抑制される。その結果、入力音声の認識精度が向上する。
なお、上記実施の形態に記載の内容は、本発明に係る音声入力システムの好適な一例であり、本発明は、かかる態様に限定されるものではない。
例えば、上記実施の形態では、通信端末10として携帯電話を例示した。しかし、通信端末10は、これに限らず、PDA(Personal Digital Assistance)やPHSのように通信機能を備えた情報機器であればよく、その用途やサイズによって、本発明の適用対象を限定するものではない。
音声入力システムの機能的構成を示すブロック図である。 音声入力処理の実行に際しての通信端末の動作を説明するためのフローチャートである。 音声入力処理の実行に際しての音声認識サーバの動作を説明するためのフローチャートである。 音声入力システムが実行する音声入力処理を説明するためのフローチャートの前半部分である。 音声入力システムが実行する音声入力処理を説明するためのフローチャートの後半部分である。
符号の説明
1…音声入力システム、10…通信端末、11…音声入力インタフェース、12…認識結果提示部、13…修正候補格納部、14…認識結果修正部、20…音声認識サーバ、21…音声認識部、22…ディクテーション辞書、23…ブロック制御部、24…修正結果受信部、N…ネットワーク

Claims (4)

  1. 通信端末にて入力された音声を認識する音声認識手段と、
    前記音声認識手段による音声認識結果を複数のブロックに分割して前記通信端末宛に順次送信させると共に、当該通信端末からの要求に応じて、前記複数のブロックのうち、該要求のあったブロックの修正候補を前記通信端末宛に送信させる制御を行う制御手段と
    を備えることを特徴とする音声認識サーバ。
  2. 前記音声認識手段は、前記通信端末から送信された、ブロックの修正結果を使用して、当該ブロックに後続するブロックを再認識し、
    前記制御手段は、前記音声認識手段により再認識されたブロックを前記通信端末宛に送信させる制御を行うことを特徴とする請求項1に記載の音声認識サーバ。
  3. 請求項1に記載の音声認識サーバと、当該音声認識サーバと通信可能に接続された通信端末とを備える音声入力システムであって、
    前記通信端末は、
    音声を入力して前記音声認識サーバ宛に送信する音声入力手段と、
    前記音声認識サーバによる音声認識結果をブロック単位で表示して、ブロックの修正候補の提示を要求する要求手段と
    を備えることを特徴とする音声入力システム。
  4. 通信端末にて入力された音声を認識する音声認識ステップと、
    前記音声認識ステップにおける音声認識結果を複数のブロックに分割して前記通信端末宛に送信する認識結果送信ステップと、
    当該通信端末からの要求に応じて、前記認識結果送信ステップにて送信された前記複数のブロックのうち、前記要求のあったブロックの修正候補を前記通信端末宛に送信する修正候補送信ステップと
    を含むことを特徴とする音声入力方法。
JP2004041945A 2004-02-18 2004-02-18 音声認識サーバ、音声入力システム、及び、音声入力方法 Expired - Fee Related JP4347716B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004041945A JP4347716B2 (ja) 2004-02-18 2004-02-18 音声認識サーバ、音声入力システム、及び、音声入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004041945A JP4347716B2 (ja) 2004-02-18 2004-02-18 音声認識サーバ、音声入力システム、及び、音声入力方法

Publications (2)

Publication Number Publication Date
JP2005234136A true JP2005234136A (ja) 2005-09-02
JP4347716B2 JP4347716B2 (ja) 2009-10-21

Family

ID=35017171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004041945A Expired - Fee Related JP4347716B2 (ja) 2004-02-18 2004-02-18 音声認識サーバ、音声入力システム、及び、音声入力方法

Country Status (1)

Country Link
JP (1) JP4347716B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010048890A (ja) * 2008-08-19 2010-03-04 Ntt Docomo Inc クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム
JP2010055044A (ja) * 2008-04-22 2010-03-11 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム
JP2017015097A (ja) * 2016-10-07 2017-01-19 兵神装備株式会社 回転容積型ポンプの遠隔モニタリングシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055044A (ja) * 2008-04-22 2010-03-11 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム
JP4709887B2 (ja) * 2008-04-22 2011-06-29 株式会社エヌ・ティ・ティ・ドコモ 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム
TWI427620B (zh) * 2008-04-22 2014-02-21 Ntt Docomo Inc A speech recognition result correction device and a speech recognition result correction method, and a speech recognition result correction system
JP2010048890A (ja) * 2008-08-19 2010-03-04 Ntt Docomo Inc クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム
JP2017015097A (ja) * 2016-10-07 2017-01-19 兵神装備株式会社 回転容積型ポンプの遠隔モニタリングシステム

Also Published As

Publication number Publication date
JP4347716B2 (ja) 2009-10-21

Similar Documents

Publication Publication Date Title
CN108255290B (zh) 移动装置上的模态学习
KR101255402B1 (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
JP4446312B2 (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
KR102201937B1 (ko) 후속 음성 쿼리 예측
KR101109265B1 (ko) 텍스트 입력 방법
US20160078020A1 (en) Speech translation apparatus and method
US9123339B1 (en) Speech recognition using repeated utterances
JP4680691B2 (ja) 対話システム
US20130282359A1 (en) Method and apparatus of translating language using voice recognition
US7496513B2 (en) Combined input processing for a computing device
WO2014208231A1 (ja) ローカルな音声認識を行なう音声認識クライアント装置
US20060293889A1 (en) Error correction for speech recognition systems
JPH10187406A (ja) 音声認識中に認識されたワードをバッファする方法及びシステム
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
US8326597B2 (en) Translation apparatus, method, and computer program product for detecting language discrepancy
JP5688677B2 (ja) 音声入力支援装置
US11468902B2 (en) Voice recognition device and voice recognition method
JP4347716B2 (ja) 音声認識サーバ、音声入力システム、及び、音声入力方法
WO2012144525A1 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2012063526A (ja) 端末装置、音声認識方法および音声認識プログラム
KR102373247B1 (ko) 네트워크를 이용한 사용자 적응 음성 명령 인식 방법 및 그 장치
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
JPH09230889A (ja) 音声認識応答装置
EP4095847A1 (en) Method and apparatus for processing voice recognition result, electronic device, and computer medium
TW201351205A (zh) 語音輔助鍵盤輸入

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090716

R150 Certificate of patent or registration of utility model

Ref document number: 4347716

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees