JP2010002830A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2010002830A JP2010002830A JP2008163145A JP2008163145A JP2010002830A JP 2010002830 A JP2010002830 A JP 2010002830A JP 2008163145 A JP2008163145 A JP 2008163145A JP 2008163145 A JP2008163145 A JP 2008163145A JP 2010002830 A JP2010002830 A JP 2010002830A
- Authority
- JP
- Japan
- Prior art keywords
- input
- cursor
- character string
- voice
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】音声を入力する音声入力部と、入力された音声を認識し、その音声に対応した認識文字列を生成する音声認識部と、前記認識文字列を表示する表示エリアを有する表示部と、前記表示エリアの任意の位置を指定するカーソルを表示エリアに表示させ、かつ移動させるカーソル制御部と、前記表示エリアに表示された認識文字列とカーソルとの相対的な位置関係に基づいて、新たに入力された音声に対応する第1の認識文字列と、すでに表示エリアに表示された第2の認識文字列とに対する編集処理を実行するキーワード入力制御部とを備えたことを特徴とする。
【選択図】図2
Description
たとえば、「いんさつ」というキーワードを、音声で入力したとすると、音声認識機能により、「いんさつ」という文字情報、あるいはかな漢字変更した後に「印刷」という文字情報が取得され、その認識結果が表示画面上に表示されていた。
さらに、特許文献1には、入力された音声を認識し、複数の認識結果候補について、それぞれの属性(スコア,意味,重要度)を考慮して、それらの認識結果候補の表示態様を決定することにより、良好な操作性を実現する音声認識装置が開示されている。
また、一般に、キーボード等を用いてキーワードを入力してデータベース検索を行う場合、スペースで区切って複数のキーワードを入力し、その複数のキーワードをすべて含む情報を検索(AND検索)したり、複数のキーワードのいずれかを含む情報を検索(OR検索)したりしていた。
また、特許文献1では、認識結果の表示態様(表示の大きさなど)として適切なものを選択し、操作性の向上を図ったものであるが、誤認識があった場合には、やはり、再入力のための特定の入力操作が必要である。また、複数のキーワードを音声入力することについては言及されていない。
したがって、複数のキーワードを連続して音声入力しそれらを認識した後に、すべてのキーワードを使ってAND検索などの検索処理をすることはできず、また、誤認識した場合は、利用者に再入力を求める入力操作をしてもらう必要があった。
これによれば、入力された音声を認識した結果である認識文字列の編集処理を容易にすることができ、特に、多数の認識文字列を音声で入力する場合の利用者の入力操作の負担を軽減できる。
これによれば、カーソルと第2の認識文字列との相対的な位置関係が利用者の所望のものとなるように、カーソルの位置を移動させる容易な入力操作をするだけで、認識文字列の置換ができる。この発明の機能は、後述する実施例の図8の(a11),(a12),および(a15)に関係する。
これによれば、表示エリアに表示された複数個の第2の認識文字列(キーワード)を、区切り文字で容易に視覚的に区別でき、第1の認識文字列および複数個の第2の認識文字列に対する編集処理が可能となる。
この発明の機能は、後述する実施例の図2の(a−5)および(a−6),図8の(a13)〜(a17)に関係する。
これによれば、利用者が所望の位置へのカーソル移動と容易な入力操作をするだけで、すでに入力され表示エリアに表示されている第2の認識文字列の表示はそのままで、新たに音声入力された第1の認識文字列の追加ができる。
この発明の機能は、後述する実施例の図8の(a13)に関係する。
これによれば、利用者が所望の位置へのカーソル移動と容易な入力操作をするだけで、すでに入力され表示されている第2の認識文字列の一部分を、新たに音声入力された第1の認識文字列に変更(置換)することができる。
この発明の機能は、後述する実施例の図8の(a16)に関係する。
これによれば、利用者が所望の位置へのカーソル移動と容易な入力操作をするだけで、すでに入力されていたすべての第2の認識文字列を、新たに音声入力された第1の認識文字列に変更することができる。
この発明の機能は、すでに入力されていたすべての第2の認識文字列を全置換すること、言いかえれば認識文字列の再入力を意味し、後述する実施例の図8の(a14)に関係する。
これによれば、利用者が所望の位置へのカーソル移動と容易な入力操作をするだけで、すでに入力されていた複数個のキーワードのうち、所望の1つのキーワードのみを、新たに音声入力された第1の認識文字列に変更することができる。
この発明の機能は、すでに入力されていた複数個の第2の認識文字列の中の任意の位置に表示されている所望の1つのキーワードを置換することを意味し、後述する実施例の図8の(a17)に関係する。
また、この発明は、音声入力部と、音声認識部と、表示部と、カーソル制御部と、キーワード入力制御部とを備えた音声認識装置の編集方法であって、前記音声入力部によって音声を入力し、前記音声認識部によって、入力された音声を認識してその音声に対応した認識文字列を生成し、前記認識文字列と、表示部の表示エリアの中を移動可能なカーソルとを表示部に表示させ、前記カーソル制御部によってカーソルを表示エリアの所望の位置に移動させた後、前記キーワード入力制御部が、表示エリアに表示された認識文字列とカーソルとの相対的な位置関係に基づいて、新たに入力された音声に対応する第1の認識文字列と、すでに表示エリアに表示された第2の認識文字列とに対する編集処理を実行することを特徴とする音声認識装置の編集方法を提供するものである。
<この発明の音声認識装置の構成>
図1に、この発明の音声認識装置の構成ブロック図を示す。
この発明の音声認識装置は、主として、音声入力部100,記憶部200,表示部300,操作入力部400,音声認識部501,キーワード入力制御部502,カーソル制御部503,処理実行部504とから構成される。
このような音声認識装置は1つの専用のハードウェアとして実現してもよいが、この音声認識装置の機能を、パーソナルコンピュータ(PC)や、電子辞書や携帯電話などの携帯型の情報端末など種々の情報処理装置の一つの機能として実現してもよい。
表示部300としては、たとえばCRT,LCD,有機EL,PDPなどのディスプレイを用いることができる。この発明では、表示部300に、主として、音声認識した結果の候補となる文字情報を表示したり、認識結果候補のうち確定した複数個の文字情報が表示される。
また、表示部300には、カーソルが表示され、カーソルが表示された位置に入力音声を認識した後の文字情報を追加したり、カーソル位置の前後にある文字情報の消去や変更が行われる。このように、文字情報やカーソルを表示する領域は、後述する図3のキーワード表示エリア301に相当する。
音声認識部501は、マイク100から入力された音声を認識して文字情報に変換する部分であり、記憶部200に記憶された音響データベース(DB)201や、認識辞書202を用いて、入力された音声を文字情報に変換し、1または複数個の認識結果の候補を生成する部分である。
この発明では、特に、表示部に表示されたカーソルとすでに音声入力された認識文字列との相対位置関係によって、認識文字列の追加,削除,変更(置換),再入力(全置換)等の編集処理をすることを特徴とする。
処理実行部504は、音声入力され認識した結果、確定された認識文字列に対して実行すべき機能を、実際に実行する部分である。たとえば、入力された認識文字列が辞書の検索に用いる文字列であれば、その認識文字列を見出語として、記憶部200に予め記憶された辞書や文例データベース204の検索処理を実行する部分である。
上記した検索処理部は、処理実行部504の一つの機能ブロックに相当する。
認識辞書202は、音声認識対象となる文字情報の発音情報等を含み、マイクに向かって発音された音声信号を対応する文字に変換するのに用いられるデータベースである。
キーワード処理ルール203とは、音声認識後確定されたキーワードに対してどのような処理を行うかを記述したルールであり、図7に示したような情報である。たとえば、後述するように、すでに入力が確定された認識文字列Sの直後にカーソルがある場合に、次の音声V2が入力されたときは、その認識文字列Sを、新たに入力された音声V2に対応する文字情報(認識文字列)に変更(置換)する処理をするというルールR1が、予め記憶されている。
処理ルール205は、確定した1または複数のキーワードに対して実行する処理内容を予め設定したものであり、たとえば、複数のキーワードを用いて文例データベースから用例を検索する処理などがある。
すなわち、音声認識処理そのものは従来技術と同様の処理を利用することができ、入力された音声に最も近いと判断する1つの候補の文字情報のみを表示してもよいし、あるいは、複数個の候補が抽出されたときは、それらの候補をすべて表示させて利用者に選択してもらうようにしてもよい。
以下の実施例では、特に示さない限り音声認識の後、入力された音声に対応する1つの文字情報が確定したものとして説明する。また、確定した後の文字情報を、認識文字列と呼ぶ。
また、新たに入力された音声に対応する認識文字列は、上記した第1の認識文字列に相当する。
図3に、この発明の音声認識装置の一実施例の概観図を示す。
図3では、主として、利用者が情報を入力する部分(100,401〜406)と、入力された文字情報を表示して確認する部分(301,302)とを示している。マイク100は、音声入力部100に相当し、配置する位置は、図示した位置に限られない。
図3において、401は音声入力ボタンであり、このボタンを押した後にマイク100に向かって発声された音声が入力される。
402〜405は表示部300に表示されたカーソルを移動させるためのキーであり、それぞれ、カーソルを右,左,上,下へ移動させるためのキーである。406は、文字や記号の入力、あるいは表示部300に表示された文字列を直接編集するための文字入力キーである。
キーワード表示エリア301に表示された認識文字列(キーワード)を用いて検索を実行させる場合、その検索の開始を意味する入力操作としては、音声入力ボタン401を押し下げることにしてもよい。
図2に、この発明の音声認識装置で行う音声入力の概略実施例を示す。
図2では、表示部300を、1行のみの文字列を表示するものとして説明する。ただし、一般的なCRTやLCDのように、複数行の文字列が表示可能なものを利用してもよい。
図2において、(a−1)は、音声入力待ち状態を示している。このとき、表示部300の左端には、1つのカーソル11が表示されている。
たとえば、「ふらいと」という音声がマイク(音声入力部)に入力されたとする。このとき、発声された音声信号は、音声認識部501に与えられ、音響DB201と認識辞書202とを用いて、音声認識処理が行われる。音声認識処理により、発声された音声信号に対応する1または複数個の文字情報の候補が抽出される。
一方、「ふらいと」という音声に対して複数個の文字情報の候補が抽出されたとき、たとえば、仮に「フライト」,「クライト」,「フライス」などの候補が抽出されたとすると、これらの3つの候補を表示部に表示させ、利用者に、どれが意図するものであるかを特定する入力をしてもらう。すなわち、利用者に、認識文字列を確定するための操作入力をしてもらう。
この操作入力は、たとえば、文字列確定用の専用キーを入力することにより行えばよい。
カーソル11の移動は、たとえば、操作入力部400に相当するカーソルを左へ移動させるための専用キーやマウスを利用すればよい。
このように、音声入力が確定された認識文字列(第2の認識文字列)の中に重ねてカーソルが表示されている状態で、次の音声入力がされた場合、カーソルが重ねて表示されている認識文字列を、この次に新たに音声入力された認識文字列(第1の認識文字列)に変更する。
たとえば、(a−3)の状態で、「ひこうき」という音声が入力されたとする。このとき「ひこうき」という音声に対して、「飛行機」という新たな認識文字列(第1の認識文字列)が確定されたとすると、「フライト」というすでに表示されていた認識文字列(第2の認識文字列)が消去され、(a−4)のように、「フライト」が表示されていたのと同じ位置に、「飛行機」という新たな認識文字列が表示される。
上記のように、表示状態(a−2)から(a−4)の状態へ変化させようとする場合、利用者は、状態(a−3)のように、カーソル11を左へ移動させる操作をした後、新たに入力したいキーワードに相当する音声を入力すればよい。すなわち、すでに入力された認識文字列を消去させるための特別な操作をする必要がない。
このとき、(a−5)の状態のように、カーソル制御部503によって、末尾文字「機」の直後に、区切り文字12であるスペースが挿入され、そのスペースの後ろに、カーソル11が表示される。区切り文字12としては、スペースの他に、利用者がそれと認識できる他の記号や文字を使用してもよい。
また、区切り文字12の入力は、図3に示すカーソル右移動キー402を用いることができる。ただし、区切り文字12の入力は、このキーを押し下げること以外に、特定の文字入力キー406の押下や、特定の音声入力で行ってもよい。
表示状態が(a−5)の状態のときに、音声入力がされた場合、「区切り文字12の直後にカーソルがある状態で音声入力がされると、新たに入力された音声に対応する認識文字列を追加して表示部に表示させる」というキーワード処理ルール203が適用される。キーワード入力制御部502が、このキーワード処理ルール203に基づいて処理を実行すると、(a−6)の状態のような表示となる。
この発明では、この3つの例に限られることなく、後述するように、表示部に表示されたカーソルとすでに確定した認識文字列(確定単語)との相対的な位置関係によって、次に入力される音声に対応する認識文字列について種々の編集処理をすることができる。
図6(a)では、図2の(a−2)の状態で、利用者が音声入力ボタン401を押し下げた場合に、文例表示エリア302に表示される文例の一実施例を示している。ここでは、処理実行部504によって、「フライト」という文字列を含む文例を、文例DB204の中から検索する。図6(a)では、検索によって文例DBの中に見つけられた「フライト」という認識文字列を含む3つの文例が表示されている。
図4に、この発明のキーワード入力制御処理の一実施例のフローチャートを示す。
まず、ステップS1において、音声入力があるか否か、チェックする。すなわち、図3の操作入力部400である音声入力ボタン401が押し下げられ、さらに、音声入力部100であるマイクから音声が入力されるのを待つ。
ステップS1において音声入力があったときは、ステップS2へ進む。ここで、入力された音声は、記憶部200に記憶されるとともに、音声認識部501へ与えられる。
ステップS2において、入力された音声について音声認識処理を行う。音声認識は、上記したように音響DB201と認識辞書202とを用いて行う。音声認識の結果、入力音声が1つの認識文字列に確定されると、その認識文字列(確定単語)Sを、記憶部200に記憶する。
ここで、カーソルの表示位置の情報とは、キーワード表示エリア301の中で先頭(左端)から末尾(右端)までの間のどの位置にカーソルがあるかを示す情報である。
カーソル11が表示エリア301の先頭にある場合、ステップS10へ進む。
一方、カーソル11が先頭にない場合、ステップS5へ進み、表示エリア301に確定入力されている認識文字列(単語)の個数を示す変数Nを、1に初期化する。
また、たとえば、N=1のときは、表示エリア301の先頭の位置にある単語と、カーソルとが接触しているか否かチェックされる。
ステップS6で、接触していると判断されたとき、ステップS11へ進む。接触していないと判断されたときはステップS7へ進む。
ステップS8において、N番目の単語が、表示エリア301の中に、存在するか否かチェックする。確定入力された単語Sが複数個ある場合、確定入力された順番に、複数個の単語Sを記憶部200に記憶しておく。そして、この記憶部200に記憶されている単語群を調べ、その中に先頭からN番目の単語が存在するか否か、チェックする。
たとえば、N=2のとき、図2の(a−6)の状態であったとすると、2番目の単語(予約)が存在するので、ステップS6へ戻る。
N番目の単語が存在しない場合は、ステップS9へ進む。
ステップS9において、現在のカーソルの位置に、ステップS2で確定された単語Sを表示し、カーソルを単語Sの後ろ、すなわち単語Sの末尾文字のすぐ右側に表示させる。
このステップS10は、すでに入力されている確定単語を全部削除して、新たなキーワードを音声で再入力する場合に相当する。
このステップS10の後、ステップS9が実行されると、現在のカーソルの位置は表示エリア301の先頭であるので、表示エリア301の先頭にステップS2の確定単語Sを表示させ、カーソル11を、その単語Sの後ろ、すなわちすぐ右側に表示させる。
このステップS11の後に、ステップS9が実行されると、カーソルに接触していた単語を削除した後、その単語が表示されていた位置に、新たに入力された単語Sを表示し、さらにカーソルをその単語Sの後ろ、すなわちすぐ右側に表示させる。
この図4のフローチャートは、カーソルの表示位置への単語Sの新規追加(ステップS9)と、単語Sへの置換(ステップS11,S9)と、単語Sの再入力(全置換、ステップS10,S9)の処理を含むものである。
なお、ステップS11でN番目以降の単語を全て削除する処理にすることも可能である。
その他、カーソルの位置の移動は、キー入力の他、カーソル移動の指示を意味する音声入力をすることによっても可能である。たとえば、「カーソル右へ」というような音声入力をしてもよい。
ステップS20において、操作入力部400のキーの入力があるか否か、チェックする。ここでは、4つのキー(402〜405)の入力の有無を監視する。
いずれかのキー入力があった場合、ステップS21へ進む。どのキーの入力があったかの判断は、操作入力部400から与えられる信号をもとに、カーソル制御部503が判断する。
ステップS26において、「カーソル左移動キー(403)」が入力されたか否かチェックし、その場合ステップS27へ進み、そうでない場合ステップS29へ進む
ステップS29では、入力されたキーが、カーソルを右または左に移動するキー以外のキーなので、その他のキーに割り当てられた処理を実行する。
たとえば、図2の(a−1)の状態では、カーソルの左側に文字がないので処理を終了する。また、図2の(a−2)の状態では、カーソルの左側に文字があるので、一文字分だけカーソルを左側に移動させると、図2の(a−3)の状態となる。
たとえば、図2の(a−3)の状態で、カーソル右移動キーが押下られると、(a−2)の状態となる。
一方、カーソルの右側に文字がない場合、ステップS24へ進み、現在のカーソルの表示位置の左側に区切り文字12があるか否かチェックする。ここで、たとえば図2の(a−5)の状態のように、区切り文字12がある場合は、処理を終了する。
一方、図2の(a−4)の状態のように、区切り文字12がない場合は、ステップS25へ進む。
たとえば、図2の状態(a−4)の場合、ステップS25の処理によって、(a−5)のような表示状態となる。
以上が、カーソル制御部503によって行われるカーソル表示位置の移動処理の一実施例である。
上記したように、キーワード表示エリア301に表示されているカーソル11とすでに確定された認識文字列(確定単語)との相対的な位置関係によって、次に音声入力されるキーワードの編集処理が異なる。
この相対的位置関係と実行される編集処理との関係を示したものが、キーワード処理ルール203であり、コンピュータで実行できるプログラム形式で予め記憶部200に記憶される。
ここでは、7つのルール(R1〜R7)を示している。
新たな音声入力が行われたとき、これらのルールのうち、カーソルと認識文字列との相対的な位置関係に対応したいずれかのルールが選択されて、編集処理が実行される。
たとえば、ルールR1は、「認識文字列(単語S)の直後にカーソルがあるとき、カーソルに接触しているその単語Sを、音声入力された新たな単語Nに変更(置換)する」というルールである。
このルールR1は、図2の(a−2)のような表示状態や後述する図8の(a11)の表示状態のときに適用されるルールである。
以下に、音声でキーワードを入力する場合のいくつかの実施例を説明する。ここでは、音声入力の後すでに確定した認識文字列が、表示エリア301に存在する場合に、さらに新たなキーワードを音声入力をしたとき、表示エリア301の表示内容がどのように変化するかを説明する。
図8に、この発明のキーワードの音声入力時において、キーワード表示エリア301の表示内容の変化の説明図を示す。ここでは、新たに、「ひこうき」という音声を入力し、「飛行機」という認識文字列が確定入力されるものとする。
図8の入力例(a11)の表示状態Aでは、すでに入力確定している認識文字列(単語S)が「フライト」であり、カーソル11がその文字列の末尾文字「ト」のすぐ右側にある場合を示している。
このとき、新たな音声入力(ひこうき)があったとすると、認識文字列(単語S)の「フライト」が、新たな認識文字列(単語N)である「飛行機」に変更され、表示状態Bのようになる。
この入力例(a11)では、上記したように、図7のルールR1が適用される。
この状態Aで、「ひこうき」が音声入力されたとすると、図7のルールR2が適用され、カーソル11に接触している「フライト」を、新たな単語Nである「飛行機」に変更する。
このとき、表示状態Bのように、カーソル11は、新たな単語Nの末尾文字「機」の直後に表示される。
この状態Aで、「ひこうき」が音声入力されたとすると、図7のルールR3が適用され、区切り文字12の後ろに、新たな単語Nである「飛行機」を追加する。このとき、表示状態Bのように、カーソル11は、新たな単語Nの末尾文字「機」の直後に表示される。
表示状態Bでは、新たな単語Nである「飛行機」と、その直後にカーソル11とが表示される。
この状態Aで、「ひこうき」が音声入力されたとすると、図7のルールR5が適用され、カーソル11に接触している単語S(フライト)を、新たな単語Nである「飛行機」に変更する。
区切り文字12の右側にある「予約」という認識文字列は、表示状態Bのように変更されずにそのまま表示される。この場合は、すでに入力確定され表示されている複数個の認識文字列のうち、所望の1つの認識文字列のみを、新たな音声入力で変更する場合に相当する。
この場合、多数の認識文字列が表示されている状態で、先頭からいくつかの単語を残し、途中から後方の単語群を一括して変更する場合に有効な入力方法である。
この状態Aで、「ひこうき」が音声入力されたとすると、図7のルールR7が適用され、カーソル11の直前に「予約」という単語Sが存在するので、カーソル11に接触しているその単語S(予約)を、新たな単語Nである「飛行機」に変更する。
以上、図8に示した7つの実施例は、新たに音声入力されたキーワード(認識文字列)を表示エリア内に表示する例を示したものであり、これに限るものではなく、この他にも種々の入力処理が考えられる。
ただし、各表示状態Aのような状態とした後は、音声入力ボタン401を押し、所望の音声を入力するだけで、それぞれの対応するキーワード処理ルールが自動的に適用されて、表示状態Bとなる。
したがって、すでに入力確定されたキーワードの変更,再入力(全置換),一部置換などの編集処理を容易な操作ですることが可能となり、利用者の操作負担を軽減できる。
200 記憶部
201 音響DB
202 認識辞書
203 キーワード処理ルール
204 文例DB
205 処理ルール
300 表示部
301 キーワード表示エリア
302 文例表示エリア
400 操作入力部
401 音声入力ボタン
402 カーソル右移動キー
403 カーソル左移動キー
404 カーソル上移動キー
405 カーソル下移動キー
406 文字入力キー
501 音声認識部
502 キーワード入力制御部
503 カーソル制御部
504 処理実行部
Claims (9)
- 音声を入力する音声入力部と、
入力された音声を認識し、その音声に対応した認識文字列を生成する音声認識部と、
前記認識文字列を表示する表示エリアを有する表示部と、
前記表示エリアの任意の位置を指定するカーソルを表示エリアに表示させ、かつ移動させるカーソル制御部と、
前記表示エリアに表示された認識文字列とカーソルとの相対的な位置関係に基づいて、新たに入力された音声に対応する第1の認識文字列と、すでに表示エリアに表示された第2の認識文字列とに対する編集処理を実行するキーワード入力制御部とを備えたことを特徴とする音声認識装置。 - 前記カーソルが表示された位置が、前記表示エリアに表示された第2の認識文字列の中、あるいは前記表示エリアに表示された第2の認識文字列の末尾文字の直後である場合、前記キーワード入力制御部が、前記第2の認識文字列を削除し、前記新たに入力された音声に対応する第1の認識文字列を、前記第2の認識文字列が表示されていた位置に追加して表示させることを特徴とする請求項1の音声認識装置。
- 前記表示エリアのカーソルが表示されている位置に区切り文字を入力することが可能な操作入力部をさらに備え、
前記表示エリアに表示された第2の認識文字列が、すでに入力された複数個の音声にそれぞれ対応する複数個のキーワードからなる場合、前記複数個のキーワードは、隣接するキーワードの間に前記操作入力部の入力によって挿入された区切り文字によって分離されて前記表示部の表示エリアに表示されることを特徴とする請求項1の音声認識装置。 - 前記カーソルが前記区切り文字の直後に表示されている場合、そのカーソルの後方にキーワードが存在しないときは、
前記キーワード入力制御部が、前記第1の認識文字列を、前記区切り文字の直後に追加することを特徴とする請求項3の音声認識装置。 - 前記カーソルが前記区切り文字の直後に表示されている場合、そのカーソルの後方に1または複数のキーワードが存在するときは、
前記キーワード入力制御部が、カーソルの後方に存在する1または複数のキーワードを、前記第1の認識文字列に変更することを特徴とする請求項3の音声認識装置。 - 前記カーソルが前記表示部の表示エリアの先頭に表示されている場合、
前記キーワード入力制御部は、前記表示エリアに表示されているすべての第2の認識文字列を削除し、前記第1の認識文字列のみを前記表示エリアに表示させることを特徴とする請求項1の音声認識装置。 - 前記カーソルが、前記複数個のキーワードのうち特定のキーワードの直後である場合、
前記キーワード入力制御部が、前記特定のキーワードのみを前記第1の認識文字列に変更し、特定のキーワード以外のキーワードはそのまま表示させることを特徴とする請求項3の音声認識装置。 - 前記キーワードを含む文例を有する電子情報データベースと、前記表示エリアに表示された1または複数個のキーワードを用いて前記電子情報データベースを検索する検索処理部とをさらに備えたことを特徴とする請求項3の音声認識装置。
- 音声入力部と、音声認識部と、表示部と、カーソル制御部と、キーワード入力制御部とを備えた音声認識装置の編集方法であって、
前記音声入力部によって音声を入力し、
前記音声認識部によって入力された音声を認識してその音声に対応した認識文字列を生成し、
前記認識文字列と、前記表示部の表示エリアの中を移動可能なカーソルとを表示部に表示させ、
前記カーソル制御部によってカーソルを表示エリアの所望の位置に移動させた後、前記キーワード入力制御部が、表示エリアに表示された認識文字列とカーソルとの相対的な位置関係に基づいて、新たに入力された音声に対応する第1の認識文字列と、すでに表示エリアに表示された第2の認識文字列とに対する編集処理を実行することを特徴とする音声認識装置の編集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008163145A JP2010002830A (ja) | 2008-06-23 | 2008-06-23 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008163145A JP2010002830A (ja) | 2008-06-23 | 2008-06-23 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010002830A true JP2010002830A (ja) | 2010-01-07 |
Family
ID=41584589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008163145A Pending JP2010002830A (ja) | 2008-06-23 | 2008-06-23 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010002830A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140067191A (ko) * | 2012-11-01 | 2014-06-05 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
WO2015059976A1 (ja) * | 2013-10-24 | 2015-04-30 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143593A (ja) * | 1991-11-15 | 1993-06-11 | Ricoh Co Ltd | 文字列修正方式 |
JPH06290174A (ja) * | 1993-03-31 | 1994-10-18 | Hitachi Software Eng Co Ltd | 文書処理装置の編集モード切り替え方法および装置 |
JPH10134050A (ja) * | 1996-10-31 | 1998-05-22 | Sharp Corp | 文書処理装置 |
JP2000311040A (ja) * | 1998-10-19 | 2000-11-07 | Toshihiko Okabe | データ引き渡し装置、データ引き渡し方法、及びデータ引き渡しプログラムを記録した記録媒体 |
JP2001060192A (ja) * | 1999-08-20 | 2001-03-06 | Nippon Hoso Kyokai <Nhk> | 文字データ修正装置および記憶媒体 |
JP2002117026A (ja) * | 2000-06-23 | 2002-04-19 | Microsoft Corp | 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム |
-
2008
- 2008-06-23 JP JP2008163145A patent/JP2010002830A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143593A (ja) * | 1991-11-15 | 1993-06-11 | Ricoh Co Ltd | 文字列修正方式 |
JPH06290174A (ja) * | 1993-03-31 | 1994-10-18 | Hitachi Software Eng Co Ltd | 文書処理装置の編集モード切り替え方法および装置 |
JPH10134050A (ja) * | 1996-10-31 | 1998-05-22 | Sharp Corp | 文書処理装置 |
JP2000311040A (ja) * | 1998-10-19 | 2000-11-07 | Toshihiko Okabe | データ引き渡し装置、データ引き渡し方法、及びデータ引き渡しプログラムを記録した記録媒体 |
JP2001060192A (ja) * | 1999-08-20 | 2001-03-06 | Nippon Hoso Kyokai <Nhk> | 文字データ修正装置および記憶媒体 |
JP2002117026A (ja) * | 2000-06-23 | 2002-04-19 | Microsoft Corp | 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140067191A (ko) * | 2012-11-01 | 2014-06-05 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
KR101992191B1 (ko) * | 2012-11-01 | 2019-06-24 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
WO2015059976A1 (ja) * | 2013-10-24 | 2015-04-30 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JPWO2015059976A1 (ja) * | 2013-10-24 | 2017-03-09 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4829901B2 (ja) | マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置 | |
JP3962763B2 (ja) | 対話支援装置 | |
JP5257330B2 (ja) | 発言記録装置、発言記録方法、プログラム及び記録媒体 | |
US6510412B1 (en) | Method and apparatus for information processing, and medium for provision of information | |
JP2003223437A (ja) | 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム | |
JP6064629B2 (ja) | 音声入出力データベース検索方法、プログラム、及び装置 | |
WO2004001570A1 (ja) | 自然言語による既存データの記述方法及びそのためのプログラム | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
JP2008539477A (ja) | すべてより少ない文字、もしくは、与えられた(1つ以上の)文字のすべてより少ないストローク、またはその両方を供給することによる、表意言語の句の省略された手書き入力 | |
JP5119671B2 (ja) | 音声出力装置及び音声出力プログラム | |
JP2010002830A (ja) | 音声認識装置 | |
JP2003167600A (ja) | 音声認識装置及び方法、ページ記述言語表示装置及びその制御方法、並びにコンピュータ・プログラム | |
KR20160000449A (ko) | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 | |
JP2005173999A (ja) | 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体 | |
JP4509361B2 (ja) | 音声認識装置、認識結果修正方法及び記録媒体 | |
JP2008234049A (ja) | 要約文生成装置及び要約文生成プログラム | |
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
JP5008248B2 (ja) | 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体 | |
JP2005044103A (ja) | 文書作成装置、文書作成方法およびプログラム | |
JP2006031385A (ja) | 音声入力による検索システムと方法並びにプログラム | |
KR101651909B1 (ko) | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 | |
JP2002014751A (ja) | オンラインヘルプシステム | |
JP4305515B2 (ja) | 音声出力装置及び音声出力プログラム | |
JP2001109740A (ja) | 中国語文書作成装置及び中国語文書作成方法 | |
JP2007171275A (ja) | 言語処理装置及び現後処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130305 |