JP2020118872A

JP2020118872A - 情報入力システム及び方法

Info

Publication number: JP2020118872A
Application number: JP2019010710A
Authority: JP
Inventors: 威彦西村; Takehiko Nishimura; 覚野間元; Satoru Nomamoto
Original assignee: Fam Time Co Ltd
Current assignee: Fam Time Co Ltd
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2020-08-06

Abstract

【課題】ユーザーが音声によって複数のテキストを断続的に入力する情報入力システムを提供する。【解決手段】本発明に係る情報入力システムは、入力部から入力された単語に応じた検索対象データを提供する情報入力システムであって、ユーザが発した日本語の音声を単語ごとにテキストに変換し、テキストが処理実行コマンドでも編集コマンドでもない場合、テキストを入力テキストとして出力部へ表示し、テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する制御部を備える。【選択図】図１

Description

本発明は、音声で単語を入力する情報入力システム及び方法に関するものである。

近年、音声操作アプリが開発されてきている。これらのアプリで重要な要素が音声認識で、音声によってテキストデータを入力する仕組みである。音声認識はキーボード入力やフリック入力などの操作を覚える必要がない為、子供やシニアでも入力できる入力インターフェースとして期待されている。
多くの音声認識は、基本的にユーザが発した声の一定時間の静寂を終話と判断し、その終話までに話した文章を、音声認識によってテキストに変換させる方式となっている。

先行技術として、一定時間の静寂を終話と判断し、終話までの音声をテキスト変換し、さらにその内容を修正する音声入力システムが開発されている。
例えば、鷲野による、「音声検索インターフェース装置および音声入力検索方法」では、音声入力されたテキストを画面上で修正する仕組みが考案されている。しかし、これらの技術は、ユーザが発したテキストが正解であることが前提となっており、更にユーザが発したテキストを音声認識するのは１回のみとなっている。

特開2012-22251

これらは、目的地の入力など、ユーザが話す内容が変更しない場合や、音声認識の精度が高い場合には機能する。
しかし、検索システムなどの、ユーザーが入力する値の検索結果に応じて、複数回に及び、異なるテキストを入力し直す場合は、改めて全てのテキスト情報を入力する必要がある。

例えば、手元に人参があり、何か他の食材とのレシピを検索する際には、「人参」の他に、「豚肉」などと別の単語も音声入力して、複数の単語で検索することが多い。しかし、複数の単語で検索した結果、作りたいレシピが見つけられなかった場合、「人参」は残して、「豚肉」を他の食材に変えたい場合でも、再度、「人参」、「牛肉」などと全ての情報を入力する必要があり、「人参」というテキスト情報は毎回重複して音声入力する必要がある。

更に、音声認識の精度が低い場合も、意図しない入力がされる場合がある。例えば、ユーザが「人参」、「玉ねぎ」、「豚肉」と言ったつもりでも、音声認識で「人参」、「玉ねぎ」、「振った肉」などと誤認識される場合がある。こういった場合、複数のキーワードを入力して、最後の単語だけ誤認識された場合でも、最初から言い直す必要がある。

更に、音声認識によって、日本語で複数の単語を、それぞれ独立した単語として複数入力することが難しい。英語の場合は、そもそも英語の文章が分かち書きされているため、ユーザが意識せずに複数の単語を発声しても、自然に「carrot pork」などと間にスペースが入力され、複数の単語がそれぞれ独立した単語としてデータが入力される。一方で日本語は文章が分かち書きされない為、「人参豚肉」と入力され、「人参」と「豚肉」というそれぞれ独立した複数の単語ではなく、「人参豚肉」という一つの単語として入力されてしまう。また、既存の音声認識技術で「人参、、、豚肉」と発声しても、人参の後の数秒の静寂で音声認識が終了してしまい、「人参」しか認識されない。また、この静寂の時間を調整したとしても、結局「人参豚肉」と独立した複数の単語として入力することができない。

本発明は、上記の課題に鑑み、音声で複数の単語を入力する際に、単語単位で認識結果を表示し、再度音声認識状態になる事と、削除やクリアなどの音声コマンドによって音声認識結果を修正しやすくする事で、より効率的に音声によって情報入力できるシステム及び方法を提供することを目的とする。

本発明の第１の特徴は、入力部から入力された単語に応じた検索結果データを提供する情報入力システムであって、ユーザが発した日本語の音声を単語ごとにテキストに変換し、前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示し、前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する解析部を備える情報入力システムである。
第１の特徴に係る情報入力システムによると、単語単位で音声認識結果を画面に表示し、音声認識状態になるサイクルを繰り返すことができる。また、「検索」、「終了」などの、音声認識状態を完了し、次の処理に進めるような音声コマンドを準備することができる。さらに、画面に表示する音声認識結果の単語は画面上で、単語単位でワンタップで削除できるようにする「削除」、「クリア」などの、データ修正用の音声コマンドを準備することができる。
本発明の第２の特徴は、入力部から入力された単語に応じた検索対象データを提供する情報入力方法であって、ユーザが発した日本語の音声を単語ごとにテキストに変換する変換ステップと、前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示する表示ステップと、前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示する処理実行ステップと、前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する編集ステップとを備える情報入力方法である。
第２の特徴に係る情報入力方法によると、単語単位で音声認識結果を画面に表示し、音声認識状態になるサイクルを繰り返すことができる。また、「検索」、「終了」などの、音声認識状態を完了し、次の処理に進めるような音声コマンドを準備することができる。さらに、画面に表示する音声認識結果の単語は画面上で、単語単位でワンタップで削除できるようにする「削除」、「クリア」などの、データ修正用の音声コマンドを準備することができる。

本発明によると、音声で複数の単語を入力する際に、単語単位で認識結果を表示し、再度音声認識状態になる事と、削除やクリアなどの音声コマンドによって音声認識結果を修正しやすくする事で、より効率的に音声によって情報入力できるシステム及び方法を提供することができる。

実施例に係る情報入力装置（情報入力システム）の構成を示す機能ブロック図実施例に係る情報入力システムの構成の一例を示す図音声コマンドデータの構成例を示す図レシピデータの構成例を示す図実施例に係る情報入力方法の第一の例を説明するためのフローチャート情報入力システムのテキスト入力画面の表示例を示す図情報入力システムの処理実行結果の表示例を示す図実施例に係る情報入力方法の第二の例を説明するためのフローチャート情報入力システムの検索実行画面の表示例を示す図（その１）情報入力システムの検索実行画面の表示例を示す図（その２）情報入力システムの検索実行画面の表示例を示す図（その３）実施例の情報入力システムに係るコンピュータのハードウェア構成を示す図

以下に、本願の開示する情報入力システムの実施例を図面に基づいて詳細に説明する。以下においては、情報入力システムとして、検索システムを例にとり説明する。検索システムは、ユーザの入力部からの入力された音声データを、音声認識処理によってテキスト化されたデータを検索条件として画面に表示し、検索条件による検索結果を表示する。以下の説明では、特定の検索対象データとしてレシピデータの検索を例に挙げ、説明する。
なお、この実施例によりこの発明が限定されるものではない。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。例えば、検索対象データを食材データや、記事データ、ユーザーデータなどにしてもよい。
本発明では、システムが入力された音声に対して、単語単位で終話処理を行い、認識された単語を画面表示し、再度音声認識状態になる事で、断続的に複数の単語を認識し続ける事を特徴とする。また、削除やクリアなどの特定の音声コマンドで、音声操作のみで入力された単語を編集できる機能を有することを特徴とする。

（情報入力装置の機能構成）
図１は、入力された単語に応じたレシピデータを提供することを目的とした情報入力システムに係る情報入力装置の構成を示す機能ブロック図である。また、図２は、情報入力システム全体のシステム構成の一例を示す図である。情報入力装置１００は、通信部１０１と、入力部１０２と、出力部１０３と、制御部１１０と、記憶部１２０とを有する。

通信部１０１は、例えばNIC(Network Interface Card)等によって実現される。通信部１０１は、ネットワークを介して後述するサーバー装置２００と有線または無線で接続され、サーバー装置２００との間で情報の通信を司る通信インターフェースである。

入力部１０２は、例えば、後述するマイクや画面等のユーザーインターフェースにおけるユーザが入力をする処理部である。入力された情報は制御部１１０のインプットとなる。

出力部１０３は、例えば、モニタ、スピーカー等の各種の出力媒体に、制御部１１０において生成された解析結果などを出力する処理部である。出力部１０２は、後述するユーザインタフェースにおける操作に応じて表示形式を変更してもよい。

実施例に係る情報入力装置１００は、通信部１０１を介してサーバー装置２００と通信可能に接続される。

（記憶部の各構成）
記憶部１２０は、サーバ装置２００が生成した指示データ１２１と、レシピデータ１２２を有する。記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。

コマンドデータ１２１は、各コマンドのテキストデータを保持する。図３は、コマンドデータのデータ構造の一例を示す図である。図３の例に示すように、コマンドデータ１２１は、各コマンドIDに対して、コマンドテキストとサブコマンドテキスト候補のデータが対応付けられる。例えば、コマンドデータ１２１は、コマンドID「do」に係るコマンドテキスト「処理実行」と、サブコマンドテキスト候補の「実行」、「検索」、「Go」とを対応づける。またコマンドIDは、「delete」、「clear」などの削除を表すコマンドも用意する。なお、図３の例では、各項目のコマンドテキストデータがコマンドIDと関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。

レシピデータ１２２は、各レシピのデータを保持する。図４は、レシピデータのデータ構造の一例を示す図である。図４の例に示すように、レシピデータ１２２は、各レシピIDに対して、レシピ名とキーワードのデータが対応付けられる。例えば、コマンドデータ１２２は、レシピID「fc00001」に係るレシピ名「にんじんしりしり」と、キーワードの「にんじん」、「ごま」、「醤油」、「ごま油」などとを対応づける。なお、図４の例では、各項目のレシピデータがレシピIDと関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。

（制御部の各構成）
制御部１１０は、図１に示すように、解析部１１１と、検出部１１２と、表示部１１３とを有する。制御部１１０の機能は、例えば、ＣＰＵ（Central Processing Unit）が所定のプログラムを実行することで実現することができる。また、制御部１１０の機能は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの集積回路により実現することができる。
解析部１１１は、ユーザが発した日本語の音声を単語ごとにテキストに変換し、テキストが処理実行コマンドでも編集コマンドでもない場合、テキストを入力テキストとして出力部へ表示し、テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じたレシピデータを出力部へ表示し、テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する。
検出部１１２は、ユーザが情報入力装置に対して発した声を検出したり、表示部のタッチやタッチした領域を検出することで、情報入力装置の制御に必要な入力を検出する。
表示部１１３は、ユーザの操作に応じて作業内容や作業指示の内容を表示する。また、表示部１１３は、作業指示内容の詳細度に応じた作業指示の情報を出力する。

情報入力装置１００は、ユーザに実施して欲しい作業内容のテキストを出力部１０３や表示部１１３によって出力する。出力する方法は、出力部１０３を介した音声によっても、表示部１１３を介した画面によっても、またその両方を介しても良いとする。出力する内容は記憶部１２０に記録されている作業指示データ１２２によって提供される。

ユーザが発したコマンドの音声は、入力部１０２のマイクによって音声データとして記録され、その音声データは解析部１１１の音声認識によってテキストに変換される。この変換処理は、ユーザーの発声の完了を待たずに実施しても良い。解析部１１１によって解析された結果はテキストデータに変換され、表示部１１３によってユーザに提供される。

なお、解析部で実行される音声認識、音声合成は、Amazon EchoやGoogle Homeなどのサービスのように、ネットワークを介してクラウド上などで実行されても良い。

（情報入力方法）
以下、制御部１１０が有する各部の詳細な処理について説明する。
この処理は、ユーザの入力部からの入力された音声データを、音声認識処理によってテキスト化されたデータを検索条件として画面に表示し、検索条件による検索結果を表示する。

なお、今回は実施例としてレシピの検索を例に説明するが、本発明はレシピの検索に特定されるわけではなく、データの検索やキーワードの入力など、様々な単語入力に適用する事ができる。

図５は、情報入力システムが実行する処理手順の第一の例を説明するためのフローチャートである。

まず、情報入力システムは、ユーザからの入力を待つ（ステップS１０）。その後、ユーザが発した音声をテキストに変換する（ステップS１１）。すると、その入力されたテキストが処理実行のコマンドテキストであるかどうかを確認する（ステップS１２）。入力されたテキストが処理実行コマンドかどうかは、図３の音声コマンドデータの構成例のように、入力されたテキストが「処理実行」の他に、「実行」、「検索」だった場合も、コマンドIDが「do」と認識され、実行される。
入力テキストが処理実行であった場合（ステップS１２でYes）、次の特定処理である、検索を行い（ステップS１３）、処理は終了する。なお、特定処理を行う時に、テキストが入力されていない場合、全検検索として処理を実行しても良いし、全検検索できないように、テキストが入力されていないと処理が実行されないようにしても良い。
入力テキストが処理実行ではなかった場合（ステップS１２でNo）、入力テキストが編集コマンドであるか確認する（ステップS１４）。編集コマンドとは、図３の音声コマンドデータの構成例のように、コマンドIDがdeleteやclearの場合である。これは、入力テキストが、コマンドID「delete」の「削除」、「戻る」、「バック」や、コマンドID「clear」の「クリア」、「全消去」、「オールクリア」の、何れでもないことを意味する。
入力テキストが編集コマンドでなかった場合（ステップS１４でNo）、認識されたテキストを、入力テキストとして追加し（ステップS１５）、入力を待つ処理に戻る（ステップS１０）。入力テキストが編集コマンドであった場合（ステップS１４でYes）、テキストの編集処理を実施し（ステップS１６）、入力を待つ処理に戻る（ステップS１０）。

図６は、情報入力システムのテキスト入力画面の表示例を示す図である。図６の例では、表示部１０は、情報入力処理によって入力されたテキストが順次、追加される。例えば図５の情報入力システムの処理手順で、ユーザが「ニンジン」と発話し、その音声データが音声認識で「にんじん」と認識されると、「にんじん」のテキストに変換される（ステップS１１）。「にんじん」は「処理実行」ではない為（ステップS１２でNo）、次の処理に進み、「にんじん」は編集コマンドにも該当しない為（ステップS１４でNo）、「にんじん」というテキストが入力テキストとして追加する（ステップS１５）。この時、表示部１０aのように、「にんじん」と表記されたオブジェクトが生成される。表示部１０aは、更にテキストを表示する表示部１０aaと、削除記号を示す表示部１０abとで構成されても良い。

これによって、ユーザは、「ニンジン」と発話し、システムが「にんじん」と認識したことを画面で確認することができる。もし、「ニンジン」と発話したのに、「虹」などと誤認識された場合も、誤認識された事を画面で確認することができる。その場合は、削除記号の表示部１０abなどをタップすることで、「虹」を削除した上で、「ニンジン」ともっと丁寧に発話するなどして、「ニンジン」と意図した認識がされるまで何度か発声して修正することができる。
また、ユーザーが「ニンジン」の次に、「ブタニク」と発話した場合は、図６のように、「にんじん」と入力された表示部１０aの次に、「豚肉」と入力された表示部１０bが表示されます。
なお、キャンセルボタンの表示部１１をタップする事で、入力処理をキャンセルさせることもできる。
また、表示部１２の検索ボタンをタップすると、検索が実行される。これは、図５の次の特定処理を行う（ステップS１３）と同じである。

また、図５のフローチャートで、入力テキストが編集コマンドであった場合（ステップS１４でYes）の、テキスト編集処理（ステップS１６）を、図６を使って説明する。
図６のように表示部１０に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「delete」に該当する、「削除」や「戻る」だった場合、図６の表示部１０に表示されている表示部１０aの「にんじん」と表示部１０bの「豚肉」の二つのうち、最後に入力された表示部１０bの「豚肉」のみが削除される。

同じく、図６のように表示部１０に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「clear」に該当する、「クリア」や「全消去」、「オールクリア」だった場合、図６の表示部１０に表示されている、全てのデータが削除対象となり、表示部１０aの「にんじん」と表示部１０bの「豚肉」の二つの両方のデータが削除される。
この処理はテキストが2つのみの状況だけでなく、3つや4つ、10個といった状況でも、「delete」は1件ずつ削除し、「clear」は全件が削除される。これによって音声だけで入力テキストを編集することができる。
一方、「にんじん」と「豚肉」のうち、最初の「にんじん」だけを削除したい場合は、音声コマンドではなく画面の表示部１０abの削除記号をタップする事で削除することができる。

図７は、情報入力システムの処理実行結果の表示例示す図である。図７の例では、表示部１１３は、入力テキスト表示領域１０で、情報入力処理で入力されたテキストを表示する。また、表示領域２０で、処理が実行された結果を表示する。今回の場合では、図４のレシピデータ１２２から「にんじん」、「豚肉」が含まれるレシピIDが「fc00003」のレシピ名「八宝菜」を表示領域２０aに、「fc00005」のレシピ名「にんじん豚バラ炒め」を表示領域２０bに検索結果として表示している。表示領域３０は情報入力処理に戻る為のボタンで、タップすると情報入力処理に戻る。

図８は、情報入力システムの第二の例を示すためのフローチャートである。第二の例では、情報入力と検索処理実行を繰り返すようなパターンを説明する。

まず、情報入力システムは、ユーザからの入力を待つ（ステップS２０）。その後、ユーザから発話があったかどうか確認する（ステップS２１）。ユーザからの発話があった場合（ステップS２１でYes）、ユーザが発した音声をテキストに変換する（ステップS２２）。次にユーザから発した音声を変換した入力テキストが編集コマンドであるか確認する（ステップS２３）。編集コマンドとは、図３の音声コマンドデータの構成例のように、コマンドIDが「delete」や「clear」の場合である。これは、入力テキストが、コマンドID「delete」の「削除」、「戻る」、「バック」や、コマンドID「clear」の「クリア」、「全消去」、「オールクリア」の、何れでもないことを意味する。

入力テキストが編集コマンドでなかった場合（ステップS２３でNo）、認識されたテキストを、入力テキストとして追加し（ステップS２４）、入力されたテキストによる検索処理を実行し、検索処理結果を出力し（ステップS２５）、入力を待つ処理に戻る（ステップS２０）。
入力テキストが編集コマンドであった場合（ステップS２３でYes）、テキストの編集処理を実施し（ステップS２６）、入力されたテキストによる検索処理を実行し、検索処理結果を出力し（ステップS２５）、入力を待つ処理に戻る（ステップS２０）。

ユーザからの入力を待った後、ユーザの発話がなかった場合（ステップS２１でNo）、画面に検索結果があり、ユーザが1件選択したかどうかを確認する（ステップS２７）。画面に検索結果が表示していなかったり、ユーザが何もレシピを選択しなかった場合（ステップS２７でNo）、処理は再び入力を待つに戻る（ステップS２０）。画面に検索結果が表示されており、ユーザがレシピを1件選択した場合（ステップS２７でYes）、次のレシピ詳細情報参照画面などへ遷移し、情報入力処理は終了する。

図９は、情報入力システムのテキスト入力画面の表示例を示す図である。図９の例では、表示部１０は、情報入力処理によって入力されたテキストが順次、追加される。表示部２０は、検索結果を表示する領域で、情報入力によって順次、検索結果が追加される。表示領域３０は情報入力処理に戻る為のボタンで、タップすると情報入力処理に戻る。
例えば図８の情報入力システムの処理手順で、ユーザが「ニンジン」と発話し、その音声データが音声認識で「にんじん」と認識されると、「にんじん」のテキストに変換される（ステップS２２）。「にんじん」は編集コマンドに該当しない為（ステップS２３でNo）、「にんじん」というテキストが入力テキストとして追加し（ステップS２４）、入力テキスト「にんじん」のレシピデータに対する検索処理結果を出力する（ステップS２５）。図４のレシピデータの構成例では、レシピデータ１２２に対して、「にんじん」が含まれるデータを検索し、その結果を出力する。

図１０は、情報入力システムのテキスト入力処理結果の表示例を示す図である。表示部１０に「にんじん」が追加されている。この時、表示部１０aのように、「にんじん」と表記されたオブジェクトが生成される。表示部１０aは、更にテキストを表示する表示部１０aaと、削除記号を示す表示部１０abとで構成されても良い。

また、表示部２０には「にんじん」による検索結果が表示される。今回の場合では、図４のレシピデータ１２２から「にんじん」が含まれるレシピIDが「fc00001」のレシピ名「にんじんしりしり」を表示領域２０aに、「fc00002」のレシピ名「にんじん甘辛煮」を表示領域２０bに検索結果として表示している。
これによって、ユーザは、「ニンジン」と発話し、システムが「にんじん」と認識したことを画面で確認することができる。もし、「ニンジン」と発話したのに、「虹」などと誤認識された場合も、誤認識された事を画面で確認することができる。その場合は、削除記号の表示部１０abなどをタップすることで、「虹」を削除した上で、「ニンジン」ともっと丁寧に発話するなどして、「ニンジン」と意図した認識がされるまで何度か発声して修正することができる。

また、ユーザは、「にんじん」と入力した検索結果も画面で確認することができる。もし、この検索結果で自分の欲しいレシピが表示されていれば、選択することもできる。例えば表示部２０aに表示されている「にんじんしりしり」をタップ操作などで選択すると、図８のフローチャートの検索結果があり、適当な1件が選択された状態となり（ステップS２７でYes）、処理は終了する。

また、ユーザは、更に情報を追加することもできる。図１０のように「にんじん」が入力されている状態で、図８の情報入力システムの処理手順で、ユーザが「ブタニク」と発話し、その音声データが音声認識で「豚肉」と認識されると、「豚肉」のテキストに変換される（ステップS２２）。「豚肉」は編集コマンドに該当しない為（ステップS２３でNo）、「豚肉」というテキストが、既存の「にんじん」の後に入力テキストとして追加し（ステップS２４）、入力テキスト「にんじん」と「豚肉」のレシピデータに対する検索処理結果を出力する（ステップS２５）。図４のレシピデータの構成例では、レシピデータ１２２に対して、「にんじん」と「豚肉」が含まれるデータを検索し、その結果を出力する。

図１１は、情報入力システムのテキスト入力処理結果の表示例を示す図である。表示部１０に「にんじん」と「豚肉」が追加されている。この時、表示部１０aのように、「にんじん」と表記されたオブジェクトと、表示部１０bのように、「豚肉」と表記されたオブジェクトが生成される。表示部１０aは、更にテキストを表示する表示部１０aaと、削除記号を示す表示部１０abとで、表示部１０bは、更にテキストを表示する表示部１０baと、削除記号を示す表示部１０bbとで構成されても良い。

また、表示部２０には「にんじん」と「豚肉」による検索結果が表示される。今回の場合では、図４のレシピデータ１２２から「にんじん」、「豚肉」が含まれるレシピIDが「fc00003」のレシピ名「八宝菜」を表示領域２０aに、「fc00005」のレシピ名「にんじん豚バラ炒め」を表示領域２０bに検索結果として表示している。

また、図８のフローチャートで、入力テキストが編集コマンドであった場合（ステップS２３でYes）の、テキスト編集処理（ステップS２６）を、図９、図１０、図１１を使って説明する。
図１１のように表示部１０に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「delete」に該当する、「削除」や「戻る」だった場合、図１１の表示部１０に表示されている表示部１０aの「にんじん」と表示部１０bの「豚肉」の二つのうち、最後に入力された表示部１０bの「豚肉」のみが削除される。そして、残された「にんじん」の入力データによる検索処理結果を出力し（ステップS２５）、入力を待つ状態となる。その結果は、図１０と同じ状態となる。

同じく、図１１のように表示部１０に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「clear」に該当する、「クリア」や「全消去」、「オールクリア」だった場合、図１１の表示部１０に表示されている、全てのデータが削除対象となり、表示部１０aの「にんじん」と表示部１０bの「豚肉」の二つの両方のデータが削除される。
この処理はテキストが2つのみの状況だけでなく、3つや4つ、10個といった状況でも、「delete」は1件ずつ削除し、「clear」は全件が削除される。これによって音声だけで入力テキストを編集することができる。そして、入力データのない状態での検索処理が実施され（ステップS２５）、入力を待つ状態となる。その結果は、図９と同じ状態となる。

一方、「にんじん」と「豚肉」のうち、最初の「にんじん」だけを削除したい場合は、音声コマンドではなく画面の表示部１０abの削除記号をタップする事で削除することができる。

（実施例の効果）
情報入力システムは、キーボードやフリック入力ができないユーザーでも、複数のテキストを音声によって入力することができる。これにより、より複雑な条件の検索や、何度も検索結果を見ながら条件を変更するような、インタラクティブな検索を提供することができる。

情報入力システムは、テキスト1つ単位で再度入力待ちの状態になる為、様々なテキストを一度に（一息で）入力する必要は無く、自分のペースで発声して入力することができる。

（情報入力端末のハードウェア構成）
図１２は、実施例のトレーニング端末に係るコンピュータのハードウェア構成を示す図である。図１２が示すように、コンピュータ３００は、各種演算処理を実行するＣＰＵ３０１と、ユーザからのデータ入力を受け付けたり、処理結果を表示する画面装置３０２と、マイク３０３、スピーカー３０４とを有する。また、コンピュータ３００は、他の装置と接続するためのインターフェース装置３０５と、補助記憶装置３０６と各種情報を一時記憶するメモリ装置３０７とを有する。また、コンピュータ３００は、他の装置と無線により接続するための無線通信装置３０８とを有する。また、各装置３０１〜３０８は、バス３０９に接続される。

補助記憶装置３０６には、図１に示した制御部１１０の解析部１１１、検出部１１２および表示部１１３の各処理部と同様の機能を有する表示プログラムが記憶される。
また、補助記憶装置３０６には、検索処理などを実現するための各種データが記憶される。

ＣＰＵ３０１は、補助記憶装置３０６に記憶された各プログラムを読み出して、メモリ装置３０７に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ３００を、図１に示した制御部１１０の解析部１１１、検出部１１２および表示部１１３として機能させることができる。

なお、上記の情報入力システムは、必ずしも補助記憶装置３０６に記憶されている必要はない。例えば、コンピュータ３００が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ３００が読み出して実行するようにしてもよい。コンピュータ３００がインタフェース装置３０５を介して読み取り可能な記憶媒体は、例えば、ＣＤ−ＲＯＭやＤＶＤディスク、ＵＳＢ（Universal Serial Bus）メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、ＬＡＮ（Local Area Network）等に接続された装置にこのプログラムを記憶させておき、コンピュータ３００がこれらからプログラムを読み出して実行するようにしてもよい。

以上、本発明の実施例について詳述したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の容姿の範囲内において、種々の変形・変更が可能である。

１００情報入力装置
１０１通信部
１０２入力部
１０３出力部
１１０制御部
１１１解析部
１１２検出部
１１３表示部
１２０記憶部
１２１コマンドデータ
１２２レシピデータ
２００サーバー装置

Claims

入力部から入力された単語に応じた検索対象データを提供する情報入力システムであって、
ユーザが発した日本語の音声を単語ごとにテキストに変換し、
前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示し、
前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、
前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する、
制御部を備えることを特徴とする情報入力システム。
入力部から入力された単語に応じた検索対象データを提供する情報入力方法であって、
ユーザが発した日本語の音声を単語ごとにテキストに変換する変換ステップと、
前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示する表示ステップと、
前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示する処理実行ステップと、
前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する編集ステップと
を備えることを特徴とする情報入力方法。