JP2020118872A - 情報入力システム及び方法 - Google Patents

情報入力システム及び方法 Download PDF

Info

Publication number
JP2020118872A
JP2020118872A JP2019010710A JP2019010710A JP2020118872A JP 2020118872 A JP2020118872 A JP 2020118872A JP 2019010710 A JP2019010710 A JP 2019010710A JP 2019010710 A JP2019010710 A JP 2019010710A JP 2020118872 A JP2020118872 A JP 2020118872A
Authority
JP
Japan
Prior art keywords
input
text
command
carrot
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019010710A
Other languages
English (en)
Inventor
威彦 西村
Takehiko Nishimura
威彦 西村
覚 野間元
Satoru Nomamoto
覚 野間元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fam Time Co Ltd
Original Assignee
Fam Time Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fam Time Co Ltd filed Critical Fam Time Co Ltd
Priority to JP2019010710A priority Critical patent/JP2020118872A/ja
Publication of JP2020118872A publication Critical patent/JP2020118872A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】 ユーザーが音声によって複数のテキストを断続的に入力する情報入力システムを提供する。【解決手段】本発明に係る情報入力システムは、入力部から入力された単語に応じた検索対象データを提供する情報入力システムであって、ユーザが発した日本語の音声を単語ごとにテキストに変換し、テキストが処理実行コマンドでも編集コマンドでもない場合、テキストを入力テキストとして出力部へ表示し、テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する制御部を備える。【選択図】図1

Description

本発明は、音声で単語を入力する情報入力システム及び方法に関するものである。

近年、音声操作アプリが開発されてきている。これらのアプリで重要な要素が音声認識で、音声によってテキストデータを入力する仕組みである。音声認識はキーボード入力やフリック入力などの操作を覚える必要がない為、子供やシニアでも入力できる入力インターフェースとして期待されている。
多くの音声認識は、基本的にユーザが発した声の一定時間の静寂を終話と判断し、その終話までに話した文章を、音声認識によってテキストに変換させる方式となっている。
先行技術として、一定時間の静寂を終話と判断し、終話までの音声をテキスト変換し、さらにその内容を修正する音声入力システムが開発されている。
例えば、鷲野による、「音声検索インターフェース装置および音声入力検索方法」では、音声入力されたテキストを画面上で修正する仕組みが考案されている。しかし、これらの技術は、ユーザが発したテキストが正解であることが前提となっており、更にユーザが発したテキストを音声認識するのは1回のみとなっている。

特開2012-22251
これらは、目的地の入力など、ユーザが話す内容が変更しない場合や、音声認識の精度が高い場合には機能する。
しかし、検索システムなどの、ユーザーが入力する値の検索結果に応じて、複数回に及び、異なるテキストを入力し直す場合は、改めて全てのテキスト情報を入力する必要がある。
例えば、手元に人参があり、何か他の食材とのレシピを検索する際には、「人参」の他に、「豚肉」などと別の単語も音声入力して、複数の単語で検索することが多い。しかし、複数の単語で検索した結果、作りたいレシピが見つけられなかった場合、「人参」は残して、「豚肉」を他の食材に変えたい場合でも、再度、「人参」、「牛肉」などと全ての情報を入力する必要があり、「人参」というテキスト情報は毎回重複して音声入力する必要がある。
更に、音声認識の精度が低い場合も、意図しない入力がされる場合がある。例えば、ユーザが「人参」、「玉ねぎ」、「豚肉」と言ったつもりでも、音声認識で「人参」、「玉ねぎ」、「振った肉」などと誤認識される場合がある。こういった場合、複数のキーワードを入力して、最後の単語だけ誤認識された場合でも、最初から言い直す必要がある。
更に、音声認識によって、日本語で複数の単語を、それぞれ独立した単語として複数入力することが難しい。英語の場合は、そもそも英語の文章が分かち書きされているため、ユーザが意識せずに複数の単語を発声しても、自然に「carrot pork」などと間にスペースが入力され、複数の単語がそれぞれ独立した単語としてデータが入力される。一方で日本語は文章が分かち書きされない為、「人参豚肉」と入力され、「人参」と「豚肉」というそれぞれ独立した複数の単語ではなく、「人参豚肉」という一つの単語として入力されてしまう。また、既存の音声認識技術で「人参、、、豚肉」と発声しても、人参の後の数秒の静寂で音声認識が終了してしまい、「人参」しか認識されない。また、この静寂の時間を調整したとしても、結局「人参豚肉」と独立した複数の単語として入力することができない。



本発明は、上記の課題に鑑み、音声で複数の単語を入力する際に、単語単位で認識結果を表示し、再度音声認識状態になる事と、削除やクリアなどの音声コマンドによって音声認識結果を修正しやすくする事で、より効率的に音声によって情報入力できるシステム及び方法を提供することを目的とする。
本発明の第1の特徴は、入力部から入力された単語に応じた検索結果データを提供する情報入力システムであって、ユーザが発した日本語の音声を単語ごとにテキストに変換し、前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示し、前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する解析部を備える情報入力システムである。
第1の特徴に係る情報入力システムによると、単語単位で音声認識結果を画面に表示し、音声認識状態になるサイクルを繰り返すことができる。また、「検索」、「終了」などの、音声認識状態を完了し、次の処理に進めるような音声コマンドを準備することができる。さらに、画面に表示する音声認識結果の単語は画面上で、単語単位でワンタップで削除できるようにする「削除」、「クリア」などの、データ修正用の音声コマンドを準備することができる。
本発明の第2の特徴は、入力部から入力された単語に応じた検索対象データを提供する情報入力方法であって、ユーザが発した日本語の音声を単語ごとにテキストに変換する変換ステップと、前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示する表示ステップと、前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示する処理実行ステップと、前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する編集ステップとを備える情報入力方法である。
第2の特徴に係る情報入力方法によると、単語単位で音声認識結果を画面に表示し、音声認識状態になるサイクルを繰り返すことができる。また、「検索」、「終了」などの、音声認識状態を完了し、次の処理に進めるような音声コマンドを準備することができる。さらに、画面に表示する音声認識結果の単語は画面上で、単語単位でワンタップで削除できるようにする「削除」、「クリア」などの、データ修正用の音声コマンドを準備することができる。

本発明によると、音声で複数の単語を入力する際に、単語単位で認識結果を表示し、再度音声認識状態になる事と、削除やクリアなどの音声コマンドによって音声認識結果を修正しやすくする事で、より効率的に音声によって情報入力できるシステム及び方法を提供することができる。
実施例に係る情報入力装置(情報入力システム)の構成を示す機能ブロック図 実施例に係る情報入力システムの構成の一例を示す図 音声コマンドデータの構成例を示す図 レシピデータの構成例を示す図 実施例に係る情報入力方法の第一の例を説明するためのフローチャート 情報入力システムのテキスト入力画面の表示例を示す図 情報入力システムの処理実行結果の表示例を示す図 実施例に係る情報入力方法の第二の例を説明するためのフローチャート 情報入力システムの検索実行画面の表示例を示す図(その1) 情報入力システムの検索実行画面の表示例を示す図(その2) 情報入力システムの検索実行画面の表示例を示す図(その3) 実施例の情報入力システムに係るコンピュータのハードウェア構成を示す図
以下に、本願の開示する情報入力システムの実施例を図面に基づいて詳細に説明する。以下においては、情報入力システムとして、検索システムを例にとり説明する。検索システムは、ユーザの入力部からの入力された音声データを、音声認識処理によってテキスト化されたデータを検索条件として画面に表示し、検索条件による検索結果を表示する。以下の説明では、特定の検索対象データとしてレシピデータの検索を例に挙げ、説明する。
なお、この実施例によりこの発明が限定されるものではない。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。例えば、検索対象データを食材データや、記事データ、ユーザーデータなどにしてもよい。
本発明では、システムが入力された音声に対して、単語単位で終話処理を行い、認識された単語を画面表示し、再度音声認識状態になる事で、断続的に複数の単語を認識し続ける事を特徴とする。また、削除やクリアなどの特定の音声コマンドで、音声操作のみで入力された単語を編集できる機能を有することを特徴とする。
(情報入力装置の機能構成)
図1は、入力された単語に応じたレシピデータを提供することを目的とした情報入力システムに係る情報入力装置の構成を示す機能ブロック図である。また、図2は、情報入力システム全体のシステム構成の一例を示す図である。情報入力装置100は、通信部101と、入力部102と、出力部103と、制御部110と、記憶部120とを有する。
通信部101は、例えばNIC(Network Interface Card)等によって実現される。通信部101は、ネットワークを介して後述するサーバー装置200と有線または無線で接続され、サーバー装置200との間で情報の通信を司る通信インターフェースである。
入力部102は、例えば、後述するマイクや画面等のユーザーインターフェースにおけるユーザが入力をする処理部である。入力された情報は制御部110のインプットとなる。
出力部103は、例えば、モニタ、スピーカー等の各種の出力媒体に、制御部110において生成された解析結果などを出力する処理部である。出力部102は、後述するユーザインタフェースにおける操作に応じて表示形式を変更してもよい。
実施例に係る情報入力装置100は、通信部101を介してサーバー装置200と通信可能に接続される。
(記憶部の各構成)
記憶部120は、サーバ装置200が生成した指示データ121と、レシピデータ122を有する。記憶部120は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。
コマンドデータ121は、各コマンドのテキストデータを保持する。図3は、コマンドデータのデータ構造の一例を示す図である。図3の例に示すように、コマンドデータ121は、各コマンドIDに対して、コマンドテキストとサブコマンドテキスト候補のデータが対応付けられる。例えば、コマンドデータ121は、コマンドID「do」に係るコマンドテキスト「処理実行」と、サブコマンドテキスト候補の「実行」、「検索」、「Go」とを対応づける。またコマンドIDは、「delete」、「clear」などの削除を表すコマンドも用意する。なお、図3の例では、各項目のコマンドテキストデータがコマンドIDと関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。
レシピデータ122は、各レシピのデータを保持する。図4は、レシピデータのデータ構造の一例を示す図である。図4の例に示すように、レシピデータ122は、各レシピIDに対して、レシピ名とキーワードのデータが対応付けられる。例えば、コマンドデータ122は、レシピID「fc00001」に係るレシピ名「にんじんしりしり」と、キーワードの「にんじん」、「ごま」、「醤油」、「ごま油」などとを対応づける。なお、図4の例では、各項目のレシピデータがレシピIDと関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。
(制御部の各構成)
制御部110は、図1に示すように、解析部111と、検出部112と、表示部113とを有する。制御部110の機能は、例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。また、制御部110の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができる。
解析部111は、ユーザが発した日本語の音声を単語ごとにテキストに変換し、テキストが処理実行コマンドでも編集コマンドでもない場合、テキストを入力テキストとして出力部へ表示し、テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じたレシピデータを出力部へ表示し、テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する。
検出部112は、ユーザが情報入力装置に対して発した声を検出したり、表示部のタッチやタッチした領域を検出することで、情報入力装置の制御に必要な入力を検出する。
表示部113は、ユーザの操作に応じて作業内容や作業指示の内容を表示する。また、表示部113は、作業指示内容の詳細度に応じた作業指示の情報を出力する。

情報入力装置100は、ユーザに実施して欲しい作業内容のテキストを出力部103や表示部113によって出力する。出力する方法は、出力部103を介した音声によっても、表示部113を介した画面によっても、またその両方を介しても良いとする。出力する内容は記憶部120に記録されている作業指示データ122によって提供される。

ユーザが発したコマンドの音声は、入力部102のマイクによって音声データとして記録され、その音声データは解析部111の音声認識によってテキストに変換される。この変換処理は、ユーザーの発声の完了を待たずに実施しても良い。解析部111によって解析された結果はテキストデータに変換され、表示部113によってユーザに提供される。
なお、解析部で実行される音声認識、音声合成は、Amazon EchoやGoogle Homeなどのサービスのように、ネットワークを介してクラウド上などで実行されても良い。

(情報入力方法)
以下、制御部110が有する各部の詳細な処理について説明する。
この処理は、ユーザの入力部からの入力された音声データを、音声認識処理によってテキスト化されたデータを検索条件として画面に表示し、検索条件による検索結果を表示する。

なお、今回は実施例としてレシピの検索を例に説明するが、本発明はレシピの検索に特定されるわけではなく、データの検索やキーワードの入力など、様々な単語入力に適用する事ができる。
図5は、情報入力システムが実行する処理手順の第一の例を説明するためのフローチャートである。
まず、情報入力システムは、ユーザからの入力を待つ(ステップS10)。その後、ユーザが発した音声をテキストに変換する(ステップS11)。すると、その入力されたテキストが処理実行のコマンドテキストであるかどうかを確認する(ステップS12)。入力されたテキストが処理実行コマンドかどうかは、図3の音声コマンドデータの構成例のように、入力されたテキストが「処理実行」の他に、「実行」、「検索」だった場合も、コマンドIDが「do」と認識され、実行される。
入力テキストが処理実行であった場合(ステップS12でYes)、次の特定処理である、検索を行い(ステップS13)、処理は終了する。なお、特定処理を行う時に、テキストが入力されていない場合、全検検索として処理を実行しても良いし、全検検索できないように、テキストが入力されていないと処理が実行されないようにしても良い。
入力テキストが処理実行ではなかった場合(ステップS12でNo)、入力テキストが編集コマンドであるか確認する(ステップS14)。編集コマンドとは、図3の音声コマンドデータの構成例のように、コマンドIDがdeleteやclearの場合である。これは、入力テキストが、コマンドID「delete」の「削除」、「戻る」、「バック」や、コマンドID「clear」の「クリア」、「全消去」、「オールクリア」の、何れでもないことを意味する。
入力テキストが編集コマンドでなかった場合(ステップS14でNo)、認識されたテキストを、入力テキストとして追加し(ステップS15)、入力を待つ処理に戻る(ステップS10)。入力テキストが編集コマンドであった場合(ステップS14でYes)、テキストの編集処理を実施し(ステップS16)、入力を待つ処理に戻る(ステップS10)。
図6は、情報入力システムのテキスト入力画面の表示例を示す図である。図6の例では、表示部10は、情報入力処理によって入力されたテキストが順次、追加される。例えば図5の情報入力システムの処理手順で、ユーザが「ニンジン」と発話し、その音声データが音声認識で「にんじん」と認識されると、「にんじん」のテキストに変換される(ステップS11)。「にんじん」は「処理実行」ではない為(ステップS12でNo)、次の処理に進み、「にんじん」は編集コマンドにも該当しない為(ステップS14でNo)、「にんじん」というテキストが入力テキストとして追加する(ステップS15)。この時、表示部10aのように、「にんじん」と表記されたオブジェクトが生成される。表示部10aは、更にテキストを表示する表示部10aaと、削除記号を示す表示部10abとで構成されても良い。

これによって、ユーザは、「ニンジン」と発話し、システムが「にんじん」と認識したことを画面で確認することができる。もし、「ニンジン」と発話したのに、「虹」などと誤認識された場合も、誤認識された事を画面で確認することができる。その場合は、削除記号の表示部10abなどをタップすることで、「虹」を削除した上で、「ニンジン」ともっと丁寧に発話するなどして、「ニンジン」と意図した認識がされるまで何度か発声して修正することができる。
また、ユーザーが「ニンジン」の次に、「ブタニク」と発話した場合は、 図6のように、「にんじん」と入力された表示部10aの次に、「豚肉」と入力された表示部10bが表示されます。
なお、キャンセルボタンの表示部11をタップする事で、入力処理をキャンセルさせることもできる。
また、表示部12の検索ボタンをタップすると、検索が実行される。これは、図5の次の特定処理を行う(ステップS13)と同じである。

また、図5のフローチャートで、入力テキストが編集コマンドであった場合(ステップS14でYes)の、テキスト編集処理(ステップS16)を、図6を使って説明する。
図6のように表示部10に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「delete」に該当する、「削除」や「戻る」だった場合、図6の表示部10に表示されている表示部10aの「にんじん」と表示部10bの「豚肉」の二つのうち、最後に入力された表示部10bの「豚肉」のみが削除される。

同じく、図6のように表示部10に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「clear」に該当する、「クリア」や「全消去」、「オールクリア」だった場合、図6の表示部10に表示されている、全てのデータが削除対象となり、表示部10aの「にんじん」と表示部10bの「豚肉」の二つの両方のデータが削除される。
この処理はテキストが2つのみの状況だけでなく、3つや4つ、10個といった状況でも、「delete」は1件ずつ削除し、「clear」は全件が削除される。これによって音声だけで入力テキストを編集することができる。
一方、「にんじん」と「豚肉」のうち、最初の「にんじん」だけを削除したい場合は、音声コマンドではなく画面の表示部10abの削除記号をタップする事で削除することができる。
図7は、情報入力システムの処理実行結果の表示例示す図である。図7の例では、表示部113は、入力テキスト表示領域10で、情報入力処理で入力されたテキストを表示する。また、表示領域20で、処理が実行された結果を表示する。今回の場合では、図4のレシピデータ122から「にんじん」、「豚肉」が含まれるレシピIDが「fc00003」のレシピ名「八宝菜」を表示領域20aに、「fc00005」のレシピ名「にんじん豚バラ炒め」を表示領域20bに検索結果として表示している。表示領域30は情報入力処理に戻る為のボタンで、タップすると情報入力処理に戻る。
図8は、情報入力システムの第二の例を示すためのフローチャートである。第二の例では、情報入力と検索処理実行を繰り返すようなパターンを説明する。

まず、情報入力システムは、ユーザからの入力を待つ(ステップS20)。その後、ユーザから発話があったかどうか確認する(ステップS21)。ユーザからの発話があった場合(ステップS21でYes)、ユーザが発した音声をテキストに変換する(ステップS22)。次にユーザから発した音声を変換した入力テキストが編集コマンドであるか確認する(ステップS23)。編集コマンドとは、図3の音声コマンドデータの構成例のように、コマンドIDが「delete」や「clear」の場合である。これは、入力テキストが、コマンドID「delete」の「削除」、「戻る」、「バック」や、コマンドID「clear」の「クリア」、「全消去」、「オールクリア」の、何れでもないことを意味する。

入力テキストが編集コマンドでなかった場合(ステップS23でNo)、認識されたテキストを、入力テキストとして追加し(ステップS24)、入力されたテキストによる検索処理を実行し、検索処理結果を出力し(ステップS25)、入力を待つ処理に戻る(ステップS20)。
入力テキストが編集コマンドであった場合(ステップS23でYes)、テキストの編集処理を実施し(ステップS26)、入力されたテキストによる検索処理を実行し、検索処理結果を出力し(ステップS25)、入力を待つ処理に戻る(ステップS20)。

ユーザからの入力を待った後、ユーザの発話がなかった場合(ステップS21でNo)、画面に検索結果があり、ユーザが1件選択したかどうかを確認する(ステップS27)。画面に検索結果が表示していなかったり、ユーザが何もレシピを選択しなかった場合(ステップS27でNo)、処理は再び入力を待つに戻る(ステップS20)。画面に検索結果が表示されており、ユーザがレシピを1件選択した場合(ステップS27でYes)、次のレシピ詳細情報参照画面などへ遷移し、情報入力処理は終了する。
図9は、情報入力システムのテキスト入力画面の表示例を示す図である。図9の例では、表示部10は、情報入力処理によって入力されたテキストが順次、追加される。表示部20は、検索結果を表示する領域で、情報入力によって順次、検索結果が追加される。表示領域30は情報入力処理に戻る為のボタンで、タップすると情報入力処理に戻る。
例えば図8の情報入力システムの処理手順で、ユーザが「ニンジン」と発話し、その音声データが音声認識で「にんじん」と認識されると、「にんじん」のテキストに変換される(ステップS22)。「にんじん」は編集コマンドに該当しない為(ステップS23でNo)、「にんじん」というテキストが入力テキストとして追加し(ステップS24)、入力テキスト「にんじん」のレシピデータに対する検索処理結果を出力する(ステップS25)。図4のレシピデータの構成例では、レシピデータ122に対して、「にんじん」が含まれるデータを検索し、その結果を出力する。

図10は、情報入力システムのテキスト入力処理結果の表示例を示す図である。表示部10に「にんじん」が追加されている。この時、表示部10aのように、「にんじん」と表記されたオブジェクトが生成される。表示部10aは、更にテキストを表示する表示部10aaと、削除記号を示す表示部10abとで構成されても良い。
また、表示部20には「にんじん」による検索結果が表示される。今回の場合では、図4のレシピデータ122から「にんじん」が含まれるレシピIDが「fc00001」のレシピ名「にんじんしりしり」を表示領域20aに、「fc00002」のレシピ名「にんじん甘辛煮」を表示領域20bに検索結果として表示している。
これによって、ユーザは、「ニンジン」と発話し、システムが「にんじん」と認識したことを画面で確認することができる。もし、「ニンジン」と発話したのに、「虹」などと誤認識された場合も、誤認識された事を画面で確認することができる。その場合は、削除記号の表示部10abなどをタップすることで、「虹」を削除した上で、「ニンジン」ともっと丁寧に発話するなどして、「ニンジン」と意図した認識がされるまで何度か発声して修正することができる。
また、ユーザは、「にんじん」と入力した検索結果も画面で確認することができる。もし、この検索結果で自分の欲しいレシピが表示されていれば、選択することもできる。例えば表示部20aに表示されている「にんじんしりしり」をタップ操作などで選択すると、図8のフローチャートの検索結果があり、適当な1件が選択された状態となり(ステップS27でYes)、処理は終了する。
また、ユーザは、更に情報を追加することもできる。図10のように「にんじん」が入力されている状態で、図8の情報入力システムの処理手順で、ユーザが「ブタニク」と発話し、その音声データが音声認識で「豚肉」と認識されると、「豚肉」のテキストに変換される(ステップS22)。「豚肉」は編集コマンドに該当しない為(ステップS23でNo)、「豚肉」というテキストが、既存の「にんじん」の後に入力テキストとして追加し(ステップS24)、入力テキスト「にんじん」と「豚肉」のレシピデータに対する検索処理結果を出力する(ステップS25)。図4のレシピデータの構成例では、レシピデータ122に対して、「にんじん」と「豚肉」が含まれるデータを検索し、その結果を出力する。

図11は、情報入力システムのテキスト入力処理結果の表示例を示す図である。表示部10に「にんじん」と「豚肉」が追加されている。この時、表示部10aのように、「にんじん」と表記されたオブジェクトと、表示部10bのように、「豚肉」と表記されたオブジェクトが生成される。表示部10aは、更にテキストを表示する表示部10aaと、削除記号を示す表示部10abとで、表示部10bは、更にテキストを表示する表示部10baと、削除記号を示す表示部10bbとで構成されても良い。

また、表示部20には「にんじん」と「豚肉」による検索結果が表示される。今回の場合では、図4のレシピデータ122から「にんじん」、「豚肉」が含まれるレシピIDが「fc00003」のレシピ名「八宝菜」を表示領域20aに、「fc00005」のレシピ名「にんじん豚バラ炒め」を表示領域20bに検索結果として表示している。
また、図8のフローチャートで、入力テキストが編集コマンドであった場合(ステップS23でYes)の、テキスト編集処理(ステップS26)を、図9、図10、図11を使って説明する。
図11のように表示部10に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「delete」に該当する、「削除」や「戻る」だった場合、図11の表示部10に表示されている表示部10aの「にんじん」と表示部10bの「豚肉」の二つのうち、最後に入力された表示部10bの「豚肉」のみが削除される。そして、残された「にんじん」の入力データによる検索処理結果を出力し(ステップS25)、入力を待つ状態となる。その結果は、図10と同じ状態となる。
同じく、図11のように表示部10に二つのテキストである、「にんじん」と「豚肉」が表示されている状況で、入力テキストがコマンドID「clear」に該当する、「クリア」や「全消去」、「オールクリア」だった場合、図11の表示部10に表示されている、全てのデータが削除対象となり、表示部10aの「にんじん」と表示部10bの「豚肉」の二つの両方のデータが削除される。
この処理はテキストが2つのみの状況だけでなく、3つや4つ、10個といった状況でも、「delete」は1件ずつ削除し、「clear」は全件が削除される。これによって音声だけで入力テキストを編集することができる。そして、入力データのない状態での検索処理が実施され(ステップS25)、入力を待つ状態となる。その結果は、図9と同じ状態となる。

一方、「にんじん」と「豚肉」のうち、最初の「にんじん」だけを削除したい場合は、音声コマンドではなく画面の表示部10abの削除記号をタップする事で削除することができる。


(実施例の効果)
情報入力システムは、キーボードやフリック入力ができないユーザーでも、複数のテキストを音声によって入力することができる。これにより、より複雑な条件の検索や、何度も検索結果を見ながら条件を変更するような、インタラクティブな検索を提供することができる。
情報入力システムは、テキスト1つ単位で再度入力待ちの状態になる為、様々なテキストを一度に(一息で)入力する必要は無く、自分のペースで発声して入力することができる。
(情報入力端末のハードウェア構成)
図12は、実施例のトレーニング端末に係るコンピュータのハードウェア構成を示す図である。図12が示すように、コンピュータ300は、各種演算処理を実行するCPU301と、ユーザからのデータ入力を受け付けたり、処理結果を表示する画面装置302と、マイク303、スピーカー304とを有する。また、コンピュータ300は、他の装置と接続するためのインターフェース装置305と、補助記憶装置306と各種情報を一時記憶するメモリ装置307とを有する。また、コンピュータ300は、他の装置と無線により接続するための無線通信装置308とを有する。また、各装置301〜308は、バス309に接続される。
補助記憶装置306には、図1に示した制御部110の解析部111、検出部112および表示部113の各処理部と同様の機能を有する表示プログラムが記憶される。
また、補助記憶装置306には、検索処理などを実現するための各種データが記憶される。
CPU301は、補助記憶装置306に記憶された各プログラムを読み出して、メモリ装置307に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ300を、図1に示した制御部110の解析部111、検出部112および表示部113として機能させることができる。
なお、上記の情報入力システムは、必ずしも補助記憶装置306に記憶されている必要はない。例えば、コンピュータ300が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ300が読み出して実行するようにしてもよい。コンピュータ300がインタフェース装置305を介して読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN(Local Area Network)等に接続された装置にこのプログラムを記憶させておき、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。

以上、本発明の実施例について詳述したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の容姿の範囲内において、種々の変形・変更が可能である。
100 情報入力装置
101 通信部
102 入力部
103 出力部
110 制御部
111 解析部
112 検出部
113 表示部
120 記憶部
121 コマンドデータ
122 レシピデータ
200 サーバー装置

Claims (2)

  1. 入力部から入力された単語に応じた検索対象データを提供する情報入力システムであって、
    ユーザが発した日本語の音声を単語ごとにテキストに変換し、
    前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示し、
    前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示し、
    前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する、
    制御部を備えることを特徴とする情報入力システム。
  2. 入力部から入力された単語に応じた検索対象データを提供する情報入力方法であって、
    ユーザが発した日本語の音声を単語ごとにテキストに変換する変換ステップと、
    前記テキストが処理実行コマンドでも編集コマンドでもない場合、前記テキストを入力テキストとして出力部へ表示する表示ステップと、
    前記テキストが処理実行コマンドであった場合、それまでに入力された入力テキストに応じた検索対象データを出力部へ表示する処理実行ステップと、
    前記テキストが編集コマンドであった場合、それまでに入力された入力テキストを出力部の表示から削除する編集ステップと
    を備えることを特徴とする情報入力方法。
JP2019010710A 2019-01-25 2019-01-25 情報入力システム及び方法 Pending JP2020118872A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019010710A JP2020118872A (ja) 2019-01-25 2019-01-25 情報入力システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019010710A JP2020118872A (ja) 2019-01-25 2019-01-25 情報入力システム及び方法

Publications (1)

Publication Number Publication Date
JP2020118872A true JP2020118872A (ja) 2020-08-06

Family

ID=71890685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019010710A Pending JP2020118872A (ja) 2019-01-25 2019-01-25 情報入力システム及び方法

Country Status (1)

Country Link
JP (1) JP2020118872A (ja)

Similar Documents

Publication Publication Date Title
CN107516511B (zh) 意图识别和情绪的文本到语音学习系统
US9236045B2 (en) Methods and apparatus for proofing of a text input
KR102191425B1 (ko) 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
CN103714048B (zh) 用于校正文本的方法和系统
JP3581881B2 (ja) 音声補完方法、装置および記録媒体
JP2013068952A (ja) 音声認識結果の統合
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
CN111462740A (zh) 非语音字母语言的话音辅助应用原型测试的话音命令匹配
JP2016045420A (ja) 発音学習支援装置およびプログラム
JP4729902B2 (ja) 音声対話システム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
CN112002304B (zh) 语音合成方法及装置
JP2012008375A (ja) 音声記録装置、そのデータ処理方法、およびプログラム
JP2006011641A (ja) 情報入力方法及びその装置
KR20170009486A (ko) 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기
JP4220151B2 (ja) 音声対話装置
JP6746886B2 (ja) 学習支援装置及びその学習支援装置用のプログラム
JP2020118872A (ja) 情報入力システム及び方法
JP2008243076A (ja) 翻訳装置、方法及びプログラム
JP6538399B2 (ja) 音声処理装置、音声処理方法およびプログラム
JP3958908B2 (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体