JP2014203018A - 入力処理装置、入力処理方法及びプログラム - Google Patents

入力処理装置、入力処理方法及びプログラム Download PDF

Info

Publication number
JP2014203018A
JP2014203018A JP2013081025A JP2013081025A JP2014203018A JP 2014203018 A JP2014203018 A JP 2014203018A JP 2013081025 A JP2013081025 A JP 2013081025A JP 2013081025 A JP2013081025 A JP 2013081025A JP 2014203018 A JP2014203018 A JP 2014203018A
Authority
JP
Japan
Prior art keywords
recognition result
voice
input
display
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013081025A
Other languages
English (en)
Inventor
高雄 大岩
Takao Oiwa
高雄 大岩
圭介 松井
Keisuke Matsui
圭介 松井
正起 山下
Masaki Yamashita
正起 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hokkaido NS Solutions Corp
Original Assignee
Hokkaido NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hokkaido NS Solutions Corp filed Critical Hokkaido NS Solutions Corp
Priority to JP2013081025A priority Critical patent/JP2014203018A/ja
Publication of JP2014203018A publication Critical patent/JP2014203018A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Cash Registers Or Receiving Machines (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】音声入力結果を適切に利用することにより、ユーザが迅速に希望する内容を入力することのできる入力処理装置を提供することを目的とする。【解決手段】音声入力を受け付ける音声受付手段と、音声受付手段が受け付けた音声に対する音声認識処理を行う音声認識処理手段と、音声認識処理による認識結果と複数の選択肢とを選択可能に表示装置に表示する表示処理手段と、表示装置に表示された選択肢又は認識結果のユーザによる選択入力を受け付ける選択受付手段とを有することによって課題を解決する。【選択図】図3

Description

本発明は、入力処理装置、入力処理方法及びプログラムに関する。
従来、飲食店等において、オーダー端末が利用されている。店員は、オーダー端末に設けられたハードキーや、液晶等のタッチパネルに表示されたメニューを選択することにより、客の注文内容を入力する。
また、このような店員の手入力とは別に、音声入力を受け付けるタイプのオーダー端末も提案されている。例えば、特許文献1には、音声入力及び操作入力の両方の機能を備え、音声モードに切り替えられた場合に、音声入力を受け付けることができるオーダー端末が開示されている。さらに、特許文献2には、手書き文字の入力を受け付けることのできるオーダー端末が開示されている。
しかしながら、音声認識処理は、誤認識を起こし易いという欠点を有している。特に、オーダー端末が利用されるレストラン等の飲食店では、客や店員の声、BGM等ノイズが多く、誤認識の問題が顕著となる。これに対し、音声認識技術においては、複数の認識結果をユーザに提示し、ユーザが正しいものを選択することで、この欠点を補うといった対処法が提案されている。
特許第4755918号公報 特許第4115335号公報
しかしながら、飲食店等において、客の注文を受ける際に、複数の認識結果候補から正しいものを選択する等、誤認識された内容をいちいち修正することとすると、店員の作業が煩雑になり、店員の負荷が大きくなるという問題がある。
特に、音声入力とキー入力とを異なるモードで実行するようなオーダー端末においては、音声認識により、良好な結果が得られない場合に、店員は、モードを切り替えた上で、手作業により誤認識の内容を修正する必要があり、操作が非常に煩雑であった。
本発明はこのような問題点に鑑みなされたもので、音声入力結果を適切に利用することにより、ユーザが迅速に希望する内容を入力することのできる入力処理装置を提供することを目的とする。
そこで、本発明は、音声入力を受け付ける音声受付手段と、前記音声受付手段が受け付けた音声に対する音声認識処理を行う音声認識処理手段と、前記音声認識処理による認識結果と複数の選択肢とを選択可能に表示装置に表示する表示処理手段と、前記表示装置に表示された前記選択肢又は前記認識結果のユーザによる選択入力を受け付ける選択受付手段とを有することを特徴とする。
本発明によれば、音声入力結果を適切に利用することにより、ユーザは、迅速に希望する内容を入力することができる。
図1は、オーダー端末を示す図である。 図2は、タッチパネルの表示例を示す図である。 図3は、オーダー端末を示す図である。 図4は、注文頻度テーブルの一例を示す図である。 図5は、入力受付処理を示すフローチャートである。 図6は、音声認識結果欄の表示例を示す図である。 図7は、音声認識結果欄の表示例を示す図である。 図8は、音声認識結果欄の表示例を示す図である。 図9は、タッチパネルの表示例を示す図である。 図10は、認識結果表示処理を示すフローチャートである。 図11は、認識結果表示処理を説明するための図である。 図12Aは、タッチパネルの表示例を示す図である。 図12Bは、タッチパネルの表示例を示す図である。 図13は、履歴テーブルの一例を示す図である。 図14は、認識結果表示処理を示すフローチャートである。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
図1は、第1の実施形態にかかる入力処理装置としてのオーダー端末10を示す図である。オーダー端末10は、飲食店において客の注文内容を受け付ける装置である。例えば、店員はオーダー端末10を携帯し、客の注文内容をオーダー端末10に入力する。そして、注文内容が確定した後、店員による操作により、オーダー端末10は、注文内容をサーバ装置20に送信する。サーバ装置20は、注文内容を受信し、管理する。
オーダー端末10は、ハードウェア構成として、制御部11と、表示部12と、記憶部13と、操作入力部14と、音声入力部15と、通信部16とを有している。制御部11は、CPUを有し、オーダー端末10全体を制御する。表示部12は、例えば液晶画面等の表示装置であり、各種情報を表示する。記憶部13は、ROMやRAM、HDD等であり、各種情報を記憶する。
操作入力部14は、例えばタッチパネルやハードキー等であり、ユーザが入力操作を行うためのものである。なお、本実施形態にかかるオーダー端末10は、表示部12と操作入力部14とを一体化したタッチパネルを備えるものとする。音声入力部15は、マイクであり、音声が入力される。通信部16は、例えばLAN等のネットワークを介してサーバ装置20と各種情報を送受信する。なお、後述するオーダー端末10の機能や処理は、制御部11としてのCPUがROM等の記憶部13に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
図2は、タッチパネルの表示例を示す図である。図2に示すタッチパネル17には、商品欄210と、音声認識結果欄220と、注文欄230と、送信ボタン240と、取消ボタン241とが表示されている。商品欄210は、商品名欄211と、数量欄216とを有している。商品名欄211には、複数の商品名ボタン214が配置されている。商品名ボタン214は、ユーザから商品の選択を受け付けるためのボタンであり、ユーザが選択可能な選択肢を示す情報である。数量欄216には、複数の数字ボタン217が配置されている。数字ボタン217は、ユーザから商品の注文数の入力を受け付けるためのボタンである。
商品名欄211は、上位欄212と一般欄213とを有している。上位欄212には、注文頻度の高い上位3つの商品の商品名ボタン214が表示される。一般欄213には、注文可能なすべての商品の商品名ボタン214が表示される。このように、タッチパネル17において、注文頻度の高い商品の商品名ボタン214は、他の商品名ボタン214と区別して配置されている。したがって、ユーザは、注文頻度の高い商品の商品名ボタン214を容易に見つけ出し、選択することができる。
なお、本実施形態にかかるオーダー端末10は、処理対象となる商品を複数のジャンルに分類して管理するものとする。これに対応し、一般欄213においては、ユーザによりジャンルタブ215が選択されると、ジャンルタブ215のジャンルに属する商品の商品名ボタン214が表示される。
音声認識結果欄220には、音声入力部15に入力された音声に対する音声認識処理の結果(認識結果)が表示される。音声認識結果欄220は、ユーザから認識結果の選択を受け付けるための情報である。すなわち、音声認識結果欄220は、商品名ボタン214と同様に、ユーザが選択可能な選択肢の1つである。ユーザが、商品名ボタン214、数字ボタン217又は音声認識結果欄220を指でタッチすると、操作入力部14は、タッチに対応する選択入力を受け付ける。
注文欄230は、ユーザにより選択された商品及び数量を注文内容として表示する。例えば、ユーザによりチーズケーキの商品名ボタン214が選択され、「4」の数字ボタン217が選択された場合には、注文欄230には、「チーズケーキ 4」が表示される。また、音声認識結果欄220の「ホットコーヒー」がユーザにより選択された場合には、注文欄230には、「ホットコーヒー」が表示される。続いて、ユーザにより「3」の数字ボタン217が選択されると、注文欄230には、「ホットコーヒー」に対応付けて数量「3」が表示される。
送信ボタン240は、注文欄230に表示される注文内容をサーバ装置20に送信するためのボタンである。送信ボタン240が選択されると、注文内容がサーバ装置20に送信される。取消ボタン241は、注文欄230に表示される注文内容の選択を取り消すためのボタンである。なお、オーダー端末10が、タッチパネル17へ各種情報を表示する処理等については、後に詳述する。
図3は、オーダー端末10の機能構成を示す図である。オーダー端末10は、音声受付部100と、音声認識部101と、操作受付部102と、注文頻度テーブル103と、履歴テーブル104と、テーブル管理部105と、表示処理部106と、注文内容送信部107とを有している。
音声受付部100は、音声入力部15に入力された音声を受け付ける。音声認識部101は、音声認識辞書に基づいて、音声受付部100が受け付けた音声に対する音声認識処理を行う。ここで、音声認識辞書は、記憶部13等に予め格納されているものとする。音声認識辞書には、認識対象とする単語(商品名)が予め登録されているものとする。そして、音声認識部101は、音声認識辞書に登録されている単語と音声とを比較し、各単語と音声との尤度を算出する。そして、音声認識部101は、最大尤度を示す単語を特定し、最大尤度が尤度閾値以上である場合に、最大尤度を示す単語を認識結果として得る。ここで、尤度は、認識結果の確からしさを評価する評価値である。尤度閾値は、例えば記憶部13等に予め記憶されているものとする。
操作受付部102は、操作入力部14に入力されたユーザ操作を受け付ける。操作受付部102は、具体的には、ユーザにより商品欄210の商品名ボタン214や数字ボタン217がタップ等の操作により選択されると、タップされたボタンの選択入力を受け付ける。また、ユーザにより、音声認識結果欄220がタップされると、タップされた音声認識結果欄220の選択入力を受け付ける。
注文頻度テーブル103は、オーダー端末10が扱う商品の商品名と、各商品の注文頻度とを対応付けて記憶する。図4は、注文頻度テーブル103の一例を示す図である。図4に示すように、注文頻度テーブル103は、ジャンルと、商品名と、注文頻度とを対応付けて格納している。ここで、注文頻度は、ユーザが選択可能な選択肢としての商品が一定の期間(週、日、時間帯等)に注文(選択)された回数であり、選択頻度の一例である。すなわち、注文頻度テーブル103は、選択肢毎の選択頻度を記憶する。
履歴テーブル104は、音声認識部101により得られた認識結果と、認識結果に対応する音声の発話タイミングとを対応付けて記憶する。ここで、発話タイミングは、認識結果に対応する音声が発話されたタイミングを示す情報である。本実施形態においては、発話タイミングは、音声受付部100が認識結果に対応する音声を取得した受付タイミングとする。また、他の例としては、発話タイミングは、音声認識部101により認識結果が得られたタイミングであってもよい。
テーブル管理部105は、注文頻度テーブル103及び履歴テーブル104を管理する。テーブル管理部105は、例えば注文頻度テーブル103の注文頻度を更新する。テーブル管理部105はまた例えば、履歴テーブル104に新たな認識結果と発話タイミングとを対応付けて蓄積する。
表示処理部106は、音声認識部101による認識結果、操作受付部102が受け付けた操作内容、注文頻度テーブル103に格納される情報等に基づいて、タッチパネル17に表示する表示データを生成し、表示データをタッチパネル17に表示する。ここで、表示データは、図2に示す商品欄210、音声認識結果欄220及び注文欄230等を表示するための情報である。さらに、表示処理部106は、表示データを生成する際に、注文頻度テーブル103に格納されている各商品の注文頻度に基づいて、商品欄210における商品名ボタン214の表示位置を決定する(表示位置決定処理)。より具体的には、表示処理部106は、注文頻度上位3つの商品の商品名ボタン214の表示位置を上位欄212に決定する。なお、一般欄213における商品名ボタン214の表示位置は予め定められているものとする。
なお、他の例としては、商品欄210は、上位欄212を有さず、一般欄213のみを有することとしてもよい。さらに、この場合において、表示処理部106は、ジャンルタブ215毎に一覧表示される商品名ボタン214が注文頻度順に配列されるように各商品名ボタン214の表示位置を決定してもよい。このように、表示処理部106は、注文頻度に基づいて、商品欄210における商品名ボタン214の配置を決定すればよく、具体的な商品名ボタン214の配置は、実施の形態に限定されるものではない。
注文内容送信部107は、ユーザにより送信ボタン240がタップ操作等により選択され、操作入力部14に操作内容が入力されると、送信ボタン240が選択されたタイミングにおいて、注文欄230に表示されている注文内容をサーバ装置20に送信する。
図5は、オーダー端末10による入力受付処理を示すフローチャートである。例えば電源投入時や不図示の開始ボタン押下時に入力受付処理が実行される。なお、入力受付処理が行われる前の初期状態においては、表示処理部106は、商品欄210、音声認識結果欄220及び注文欄230等を含む表示データを生成し、これをタッチパネル17に表示している。なお、音声認識結果欄220及び注文欄230は、初期状態においては、空欄である。
入力受付処理が開始すると、S100において、操作入力部14は、ユーザによる操作入力を開始する。さらに、音声入力部15は、音声入力を開始する。これに対応し、操作受付部102は、操作入力部14に入力された操作内容の受け付けを開始し、音声受付部100は、音声入力部15に入力された音声の受付を開始する。このように、オーダー端末10は、処理を開始すると、操作入力だけでなく音声入力を常に受け付け可能な状態になる。これにより、オーダー端末10は、オーダー端末10を所持する店員等が意図的にオーダー端末10に入力した音声だけでなく、客が注文のために発した音声等も音声入力部15に入力することができる。
次に、S101において、音声受付部100が音声入力を受け付けると(S101,Yes)、S102において、音声認識部101は、入力された音声に対し音声認識処理を施す。ここで、S101の処理は、音声受付処理の一例であり、S102の処理は、音声認識処理の一例である。音声認識部101は、認識結果の尤度が尤度閾値以上である場合に(S103,Yes)、認識結果が得られたと判定する。そして、S104において、テーブル管理部105は、認識結果と発話タイミングとを履歴テーブル104に蓄積する。次に、S105において、表示処理部106は、認識結果を音声認識結果欄220に表示する。これにより、タッチパネル17には、認識結果が商品名ボタン214とともに、ユーザが選択可能な選択肢として表示される。ここで、S105の処理は、表示処理の一例である。一方、S103において、認識結果の尤度が尤度閾値未満である場合には(S103,No)、音声認識部101は、処理を終了する。
例えば、「メロン」の認識結果が得られた場合には、S105の処理により、図2に示すように、音声認識結果欄220には、「メロン」の文字列が表示される。これにより、ユーザは、商品欄210に表示された複数の商品名ボタン214と同様に、認識結果を1つの選択肢として選択することができるようになる。
また、ユーザが商品名ボタン214、数字ボタン217又は音声認識結果欄220をタップ操作により選択したとする。この場合には、操作受付部102は、選択内容を受け付け(S101,No、S106,Yes)、S107へ処理を進める。S107において、表示処理部106は、選択された商品名又は数量を注文欄230に表示する。より具体的には、表示処理部106は、商品名ボタン214又は音声認識結果欄220が選択された場合には、対応する商品名と、デフォルト値としての数量「1」とを注文欄230に表示する。また、表示処理部106は、数字ボタン217が選択された場合には、注文欄230において、処理対象となっている商品名に対応する数量を表示する。ここで、S106の処理は、選択受付処理の一例である。
このように、本実施形態にかかるオーダー端末10においては、ユーザは、予め商品欄210に表示されている商品名ボタン214だけでなく、音声入力により得られた認識結果を選択肢として選択することができる。
なお、ユーザは、商品名ボタン214を数量分タップ等の操作により選択することにより、数量を指定することも可能である。この場合には、操作受付部102は、操作回数に応じた数量の入力を受け付ける。
また、ユーザが送信ボタン240をタップ操作により選択したとする。この場合には、操作受付部102は、送信ボタン240の選択入力を受け付け(S101,No、S106,No)、処理をS108へ進める。S108において、注文内容送信部107は、送信ボタン240が選択されたタイミングにおいて、注文欄230に表示されている注文内容をサーバ装置20に送信する。次に、S109において、テーブル管理部105は、注文内容送信部107により送信された注文内容に基づいて、注文頻度テーブル103に格納されている、注文内容に含まれる商品の注文頻度の値を更新する。S109の処理は、選択頻度格納処理の一例である。
次に、S110において、表示処理部106は、更新後の注文頻度に基づいて、上位欄212の商品名ボタン214の表示を更新するか否かを判定する。表示処理部106は、注文頻度の上位3つの商品名が変更になった場合に、商品名ボタン214の表示位置を更新すると判定することとする。表示処理部106は、上位欄212の表示を更新すると判定した場合には(S110,Yes)、更新後の注文頻度が上位3位内の商品の商品名ボタン214を上位欄212に表示する(S111)。ステップS110において、表示処理部106は、上位欄212の表示を更新しないと判定した場合には(S110,No)、入力受付処理を終了する。
このように、本実施形態にかかるオーダー端末10は、ユーザからの操作入力を受け付けるとともに、音声入力を常に受け付ける。このように、並行して処理を実行することにより、制御部111を効率的に活用することができる。そして、オーダー端末10は、音声認識処理を実行し、認識結果が得られると、商品名ボタン214とともに、認識結果を表示する。したがって、ユーザは、正しい認識結果が得られた場合には、認識結果を注文内容として選択することができる。これにより、ユーザ(店員)が、商品欄210において、客から注文された商品を検索する手間を省くことができる。
また正しい認識結果が得られなかった場合には、ユーザは、音声認識モードから商品選択モードへの切り替え等の操作を行うことなく、認識結果とともに表示されている商品欄210の商品名ボタン214を選択すればよい。このように、本実施形態にかかるオーダー端末10においては、正しい認識結果が得られた場合と、正しい認識結果が得られなかった場合とのいずれの場合においても、ユーザは簡単な操作により希望の選択肢を選択することができる。すなわち、オーダー端末10は、音声認識結果と商品名ボタン214とを選択可能に表示し、さらに音声入力結果を適切に利用するので、ユーザは、迅速に希望する内容を入力することができる。
次に、第1の実施形態にかかるオーダー端末10の第1の変更例について説明する。実施形態にかかるオーダー端末10は、商品名を音声認識結果として得て、これを選択肢として音声認識結果欄220に表示していたが、選択肢とする情報は、これに限定されるものではない。他の例としては、オーダー端末10は、商品名と数量とを音声認識結果として得て、それぞれを選択肢として音声認識結果欄220に表示してもよい。図6は、音声認識結果欄220に商品名と数量とを表示する例を示す図である。この場合、ユーザは、商品名「メロン」221と数量「1」222とをそれぞれ選択肢として選択できるものとする。
本例において、例えば、商品名のみ正しい認識結果が得られたとする。この場合には、ユーザは商品名「メロン」221のみ選択する。これに対応して、表示処理部106により「メロン」が注文欄230に追加表示される。続いて、ユーザは、正しい数量の数字ボタン217を選択する。これに対応し、ユーザにより選択された数字ボタン217に対応する数量が注文欄230に追加表示される。
一方、商品名については正しい認識結果が得られず、数量のみが正しい認識結果が得られたとする。この場合には、ユーザは、商品名ボタン214により正しい商品名を選択する。これに対応し、選択された商品名ボタン214に対応する商品名が注文欄230に追加表示される。続いて、ユーザが、音声認識結果欄220の数量「1」222を選択すると、これに対応して、数量「1」が注文欄に追加表示される。
第2の変更例としては、表示処理部106は、さらに音声認識結果欄220に音声認識処理により得られた複数の認識結果候補を表示してもよい。例えば、表示処理部106は、最大尤度を示す単語「メロン」を音声認識結果欄220に表示する。表示処理部106は、さらに図7に示すように、尤度順に複数の認識結果候補223をユーザが選択可能に表示してもよい。例えば、ユーザにより音声認識結果欄220がロングタップ等、「メロン」の選択操作と異なる操作が入力された場合に、表示処理部106は、認識結果候補223を表示することとしてもよい。なお、認識結果候補の表示形式は、本例に限定されるものではない。他の例としては、表示処理部106は、音声認識結果欄220内に「メロン」に続いて並列に認識結果候補223を表示してもよい。
第3の変更例としては、音声認識部101は、自然言語処理を行い、表示処理部106は、音声認識結果欄220に自然言語処理により得られた文字列を表示してもよい。図8は、音声認識結果欄220に自然言語処理の結果を表示する例を示す図である。この場合には、ユーザは、文字列に含まれる各単語224a〜224dをそれぞれ選択肢として選択できるものとする。
第4の変更例としては、注文頻度テーブル103を更新する処理及び上位欄212に表示する商品名ボタン214を更新する処理を行うタイミングは、実施形態に限定されるものではない。他の例としては、注文頻度テーブル103を更新する処理は、S104において、ユーザから選択入力を受け付けた後のタイミングにおいて行うこととしてもよい。また、他の例としては、上位欄212に表示する商品名ボタン214の更新処理は、例えば24時間毎等一定期間が経過する度に行うこととしてもよい。
第5の変更例としては、オーダー端末10は、ハードキーをさらに備えてもよい。この場合には、操作受付部102は、ハードキーへの操作入力も受け付けることとする。また、タッチパネル17に表示された選択ボタンの一部の機能は、ハードキーに割り当てられてもよい。
第6の変更例としては、サーバ装置20が管理対象の複数のオーダー端末10それぞれの注文頻度をまとめた注文頻度テーブルを管理することとしてもよい。この場合には、各オーダー端末10は、例えば1日1回など、定期的にサーバ装置20から注文頻度テーブルを取り込む。そして、各オーダー端末10は、注文に応じて、注文頻度テーブルの注文頻度を更新し、更新後の注文頻度テーブルを、例えば1日1回など定期的にサーバ装置20に送信する。
一方、サーバ装置20は、複数のオーダー端末10から受信した注文頻度テーブルをマージし、複数のオーダー端末10による注文頻度を商品名に対応付けて記憶する注文頻度テーブルを格納する。これにより、各オーダー端末10は、店全体などの適切な単位での注文頻度が記憶された注文頻度テーブルを利用することができる。
(第2の実施形態)
次に、第2の実施形態について説明する。第2の実施形態にかかるオーダー端末は、新たな認識結果が得られる度に、新たな認識結果を音声認識結果欄に表示し、適宜古い認識結果を音声認識結果欄から削除する。
図9は、第2の実施形態にかかるタッチパネル17の表示例を示す図である。音声認識結果欄250には、複数の入力欄251a〜251cが設けられている。表示処理部106は、音声認識部101により新たな認識結果が得られる度に音声認識結果欄250に新たな認識結果を追加し、適宜古い認識結果を音声認識結果欄250から削除する。なお、図9に示す例においては、音声認識結果欄250は、3つの入力欄251を有することとしたが、入力欄251の数は実施の形態に限定されるものではない。
図10は、第2の実施形態にかかるオーダー端末10による入力受付処理(図5)における認識結果表示処理(S105)の詳細を示すフローチャートである。認識結果表示処理は、入力受付処理((図5)におけるS104の処理に続いて、S105の処理に替えて、実行される処理である。
S120において、表示処理部106は、音声認識結果欄250の入力欄251a〜251cに空欄があるか否かを判定する。すなわち、表示処理部106は、入力欄251a〜251cの数に相当する最大表示数の音声認識結果が得られたか否かを判定する。
S120において、空欄がある場合には(S120,Yes)、S121において、表示処理部106は、新たに得られた認識結果を空欄に表示する。なお、本実施形態においては、表示処理部106は、発話タイミングの古い順に、入力欄251a,251b,251cに順に認識結果を追加することとする。すなわち、表示処理部106は、発話タイミングに基づいて複数の認識結果を配列して表示する。
一方で、S120において、空欄がない場合(S120,No)、S122において、表示処理部106は、入力欄251a〜251cから削除対象の認識結果を選択する(削除対象選択処理)。本実施形態にかかる表示処理部106は、認識結果に対応する音声の発話タイミングが最も古いものを削除対象として選択する。
次に、S123において、表示処理部106は、削除対象の認識結果を削除し、残りの認識結果を発話タイミング順に入力欄251aから順に配置する。そして、表示処理部106は、空欄となった入力欄251cに新たな認識結果を表示する。このように、表示処理部106は、新たな認識結果を表示する際においても、発話タイミング順に認識結果を配列する。
図11は、認識結果表示処理を説明するための図である。例えば、1人目の客が注文のために「メロン1つと、バニラ2つと、ミント1つをお願いします。」と発話し、続いて2人目の客が「紅茶を3つお願いします。それから、バニラを2つお願いします。」と発話したとする。
この場合には、音声認識処理により、まず認識結果「メロン」が得られる。これに対応し、表示処理部106は、図11の1段目に示すように、左端の入力欄251aに認識結果「メロン」を表示する。続いて、認識結果「バニラ」が得られ、これに対応し、表示処理部106は、図11の2段目に示すように2つ目の入力欄251bに認識結果「バニラ」を表示する。続いて、認識結果「ミント」が得られ、表示処理部106は、図11の3段目に示すように、右端の入力欄251cに認識結果「ミント」を表示する。以上で、入力欄251に空欄がなくなる。
続いて、認識結果「紅茶」が得られると、表示処理部106は、入力欄251に空欄がないため(S120,No)、削除対象として、発話タイミングの最も古い認識結果「メロン」を選択する(S122)。そして、メロンを入力欄251aから削除する。表示処理部106はさらに、各認識結果の発話タイミング順に認識結果を表示すべく、入力欄251b,251cに表示される認識結果「バニラ」及び「ミント」をそれぞれ入力欄251a,251bへスライドさせる。そして、表示処理部106は、これにより生じた入力欄251cの空欄に新たな認識結果「紅茶」を追加する。
同様に、認識結果「バニラ」が得られると、表示処理部106は、このとき入力欄251aに表示されていた認識結果「バニラ」を削除し、認識結果「ミント」及び「紅茶」をそれぞれ入力欄251a,251bへスライドさせる。そして、表示処理部106は、これにより生じた入力欄251cの空欄に新たに得られた認識結果「バニラ」を追加する。
このように、表示処理部106は、複数の認識結果を発話タイミングに沿って配列して表示する。さらに、表示処理部106は、入力欄の数より多い数の認識結果が得られた場合には、古い認識結果を削除し、新たな認識結果を表示する。
なお、第2の実施形態にかかるオーダー端末10のこれ以外の構成及び処理は、第1の実施形態にかかるオーダー端末10の構成及び処理と同様である。
以上のように、第2の実施形態にかかるオーダー端末10は、複数の音声認識結果を、発話タイミングに沿って配列して表示することができる。さらに、オーダー端末10は、新たな認識結果が得られると、古い認識結果を適宜削除し、新たな認識結果を表示することができる。これにより、ユーザは、認識結果として希望する商品名が、音声認識結果欄250に表示された場合には、希望の商品名を示す認識結果を選択することができる。一方で、希望する商品名が表示さない場合には、同時に表示されている商品名ボタン214を選択することができる。
第2の実施形態の第1の変更例としては、表示処理部106は、認識結果に対応する音声の発話タイミングだけでなく、認識結果としての商品名に対応する商品の注文頻度に基づいて、削除対象の認識結果を選択することとしてもよい。より具体的には、表示処理部106は、発話タイミングが比較的古い場合であっても、注文頻度が閾値以上の認識結果については削除対象としないこととしてもよい。また他の例としては、表示処理部106は、発話タイミングに対し、注文頻度に基づく重み値を乗じた値の大小関係に基づいて、削除対象を選択することしてもよい。なお、表示処理部106が削除対象を選択するための処理は実施形態に限定されるものではなく、設計者等が自由に設定できるものとする。
次に、第2の変更例について説明する。例えば、注文を受ける際に、客が「バニラを1つ下さい。」と発話した際に、店員が「バニラを1つですね。」と繰り返す場合がある。この場合に、入力欄に「バニラ」の認識結果が2つ表示されるのは、ユーザにとって使い勝手が悪い。そこで、表示処理部106は、一の認識結果が得られたタイミングから一定時間内に同一の認識結果が得られた場合には、音声認識結果欄250に、同一の認識結果1つを表示することとしてもよい。
(第3の実施形態)
次に、第3の実施形態にかかるオーダー端末10について説明する。第3の実施形態にかかるオーダー端末10の音声認識部101は、商品名だけでなく、数量についても音声認識を行う。そして、オーダー端末10は、音声認識結果欄に、商品名と数量とを対応付けて表示する。オーダー端末10はまた、履歴テーブルに格納されている過去の認識結果をユーザ操作に応じて音声認識結果欄に表示することができる。
図12A及び図12Bは、第3の実施形態にかかるタッチパネル17の表示例を示す図である。図12Aに示すように、音声認識結果欄260には、複数の入力欄261が設けられている。さらに、ユーザ操作に応じて、図12Bに示すように、表示処理部106は、音声認識結果欄260により多くの入力欄261を表示することができる。本実施形態においては、表示処理部106は、通常時には、図12Aに示すように3個の入力欄261を表示し、ユーザ操作を受け付けた場合に、図12Bに示すように9個の入力欄261を表示する。
図12Bに示す複数の入力欄261には、発話タイミングに沿って複数の認識結果が配置されている。本実施形態においては、右下の角の入力欄261には、発話タイミングの最も新しい認識結果が表示される。さらに、最下段には左方向に順に新しい認識結果が表示され、続く認識結果は下から2段目の右端に表示される。
さらに、本実施形態にかかるオーダー端末10は、ユーザによるフリック等の操作により、音声認識結果欄260に表示させる認識結果を切り替えることができる。例えば図12Bに示す状態において、表示処理部106は、音声認識結果欄260に対し下方向へのフリック操作が行われた場合には、表示中の認識結果よりも過去に得られた認識結果を表示する。一方で、表示処理部106は、音声認識結果欄260に対し上方向へのフリック操作が行われた場合には、表示中の認識結果よりも後に得られた認識結果を表示する。
表示処理部106はまた、図12Aに示す音声認識結果欄260においても、同様に認識結果を切り替えて表示することができる。例えば、表示処理部106は、音声認識結果欄260に対し右方向へのフリック操作が行われた場合には、表示中の認識結果よりも過去に得られた認識結果を表示する。
なお、他の例としては、オーダー端末10は、音声認識結果欄260にスクロールバー等を表示し、ユーザによる表示切替指示の入力を受け付け、表示切替指示に応じて、入力欄261に表示する認識結果を切り替えてもよい。
ここで、実際のタッチパネル17上の9個の入力欄261を表示エリアと称することとする。また、タッチパネル17上に表示されないものの、フリック等の操作により表示される仮想的な表示エリアを非表示エリアと称することとする。ここで、表示エリア及び非表示エリアに表示可能な認識結果の数は予め設定されているものとする。非表示エリアは、表示エリアに比べて多い数の認識結果を表示することができる。本実施形態においては、表示エリアに9個、非表示エリアに20個(最大表示数)の認識結果を表示できることとする。
さらに、各入力欄261には、商品名と数量とが対応付けて表示されている。例えば、表示処理部106は、「メロン」及び「1つ」の認識結果を得た場合には、これらに対応して、図12Bの右下の入力欄261に示すように、商品名「メロン」と数量「1」とを対応付けて表示する。
なお、オーダー端末10の表示画面が比較的大きく、音声認識結果欄260に9個の入力欄261を表示しつつ、商品欄210を表示しても、ユーザによる見易さが損なわれない場合には、切替操作を不要としてもよい。すなわち、表示処理部106は、常に9個の入力欄261を表示することとしてもよい。
図13は、第3の実施形態にかかる履歴テーブル110の一例を示す図である。履歴テーブル110は、商品名と、数量と、発話タイミングと、注文タイミングとを記憶している。商品名と数量とは、認識結果により得られる情報である。商品名と、数量と、発話タイミングとは、認識結果が得られた場合に、テーブル管理部105により登録される。なお、音声認識処理により商品名の認識結果のみが得られ、対応する数量の認識結果が得られなかった場合には、テーブル管理部105は、数量にデフォルト値の「1」を登録することとする。なお、他の例としては、テーブル管理部105は、この場合に、数量の欄を空欄とすることとしてもよい。
注文タイミングは、操作受付部102が、音声認識結果欄260に表示されている認識結果としての商品名の選択入力を受け付けたタイミングである。操作受付部102が選択入力、すなわち注文を受け付けた場合に、テーブル管理部105は、商品名に対応付けて、注文タイミングを格納する。
図14は、第3の実施形態にかかるオーダー端末10による入力受付処理(図5)における認識結果表示処理(S105)の詳細を示すフローチャートである。S200において、表示処理部106は、表示エリアに空欄が存在するか否かを判定する。空欄が存在する場合に(S200,Yes)、表示処理部106は、処理をS201へ進める。S201において、表示処理部106は、新たに得られた認識結果を空欄に表示し、処理を終了する。
一方、S200において、空欄が存在しない場合に(S200,No)、S202において、表示処理部106は、新たな認識結果と同一の商品名を示す認識結果が表示エリアに存在するか否かを判定する。同一の商品名を示す認識結果が存在する場合には(S202,Yes)、表示処理部106は、処理をS203へ進める。S203において、表示処理部106は、同一の商品名の認識結果が注文済みか否かを判定する。表示処理部106は、同一の商品名の認識結果に対する注文の選択入力を操作受付部102が既に受け付けている場合、すなわち履歴テーブル110の注文タイミングが格納されている場合に、注文済みと判定する。
注文済みである場合には(S203,Yes)、S204において、表示処理部106は、既に表示されている同一の商品名の認識結果に対応付けられている数量の値に、新たに得られた数量の値を加算する。そして、表示処理部106は、加算後の値を表示し、処理を終了する。例えば、商品名「ホットコーヒー」と数量「2」とが対応付けて表示エリアに表示されている状態において、新たな認識結果として商品名「ホットコーヒー」と数量「3」が得られたとする。この場合には、表示処理部106は、既に表示されている商品名「ホットコーヒー」に対応付けて加算結果の数量「5」を表示する。
S202において同一の商品名を示す認識結果が存在しない場合(S202,No)及びS203において同一の商品名の認識結果が注文済みでない場合(S203,No)には、表示処理部106は、処理をS205へ進める。
S205において、表示処理部106は、表示エリアに注文済みの認識結果が存在するか否かを判定する。表示エリアに注文済みの認識結果が存在する場合には(S205,Yes)、表示処理部106は、処理をS206へ進める。S206において、表示処理部106は、注文済みの認識結果を削除する。次に、S207において、表示処理部106は、削除処理により生じた空欄に新たな認識結果を表示し、処理を終了する。
なお、認識結果は、数量を指定するためにユーザにより複数回選択される可能性がある。そこで、S205において、注文済みの認識結果のうち一定期間経過した認識結果を優先的に削除対象として選択することとしてもよい。
S205において、表示エリアに注文済みの認識結果が存在しない場合には(S205,No)、表示処理部106は、処理をS208へ進める。S208において、表示処理部106は、表示エリアに時間閾値以上の発話後時間が経過している認識結果が存在するか否かを判定する。ここで、発話後時間とは、発話タイミングから、S208の処理タイミングまでの間の時間長である。時間閾値は予め定められた値であり、例えば記憶部13等に予め設定されているものとする。
S208において、時間閾値以上の発話後時間が経過している認識結果が存在する場合には(S208,Yes)、表示処理部106は、処理をS206へ進める。すなわち、表示処理部106は、S206において、時間閾値以上の発話後時間が経過した認識結果を削除し、S207において、削除により生じた空欄に新たな認識結果を表示する。
なお、S205,S208において複数の認識結果が削除対象として特定されている場合には、S206において、表示処理部106は、注文タイミングが最も古い認識結果を削除対象とする。また、他の例としては、表示処理部106は、発話タイミングが最も古い認識結果を削除対象としてもよい。
一方、S208において、時間閾値以上の発話後時間が経過した認識結果が存在しない場合には(S208,No)、表示処理部106は、処理をS209へ進める。S209において、表示処理部106は、非表示エリアに注文済みの認識結果が存在するか否かを判定する。S209において、非表示エリアに注文済みの認識結果が存在する場合に(S209,Yes)、S210において、表示処理部106は、非表示エリアの注文済みの認識結果を削除し、処理をS212へ進める。
S209において、非表示エリアに注文済みの認識結果が存在しない場合には(S209,No)、S211において、表示処理部106は、発話タイミングが最も古い認識結果を特定し、これを削除し、処理をS212へ進める。次に、S212において、表示処理部106は、新たな認識結果を非表示エリアのうち、表示エリアに最も近い位置に配置する。表示処理部106は、より具体的には、非表示エリアの認識結果1つのみを新たに表示エリアに表示させる場合に、表示対象として選択される位置に新たな認識結果を配置する。以上で、処理は終了する。
なお、S205,S208,S209の処理は、削除対象を選択する処理であり、いずれも削除対象選択処理の一例である。第3の実施形態にかかるオーダー端末10のこれ以外の構成及び処理は、他の実施形態にかかるオーダー端末10の構成及び処理と同様である。
以上のように、第3の実施形態にかかるオーダー端末10は、商品名だけでなく数量の認識結果を選択肢として表示することができる。さらに、本実施形態にかかるオーダー端末10は、ユーザ操作により、過去に得られた認識結果も表示することができる。したがって、ユーザは、選択し損ねた認識結果を再度表示させ、選択することができる。
さらに、本実施形態にかかるオーダー端末10は、同一商品名を示す認識結果が得られた場合には、数量の加算結果を選択肢として表示することができる。したがって、ユーザは、数量の合計値を1回選択するだけで、合計数量を入力することができる。
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
以上、上述した各実施形態によれば、音声入力結果を適切に利用することにより、ユーザが迅速に希望する内容を入力することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 オーダー端末
11 制御部
12 表示部
13 記憶部
14 操作入力部
15 音声入力部
16 通信部
100 音声受付部
101 音声認識部
102 操作受付部
103 注文頻度テーブル
104 履歴テーブル
105 テーブル管理部
106 表示処理部
107 注文内容送信部

Claims (12)

  1. 音声入力を受け付ける音声受付手段と、
    前記音声受付手段が受け付けた音声に対する音声認識処理を行う音声認識処理手段と、
    前記音声認識処理による認識結果と複数の選択肢とを選択可能に表示装置に表示する表示処理手段と、
    前記表示装置に表示された前記選択肢又は前記認識結果のユーザによる選択入力を受け付ける選択受付手段と
    を有することを特徴とする入力処理装置。
  2. 前記音声認識処理手段は、前記音声受付手段が受け付けた複数の音声それぞれに対する音声認識処理を行い、
    前記表示処理手段は、複数の前記認識結果を前記表示装置に表示することを特徴とする請求項1に記載の入力処理装置。
  3. 前記表示処理手段は、前記複数の認識結果を、各認識結果に対応する音声の発話タイミングに基づいて配列して前記表示装置に表示することを特徴とする請求項2に記載の入力処理装置。
  4. 前記音声認識処理手段により最大表示数より多い数の前記認識結果が得られた場合に、削除対象の前記認識結果を選択する削除対象選択手段をさらに有し、
    前記表示処理手段は、前記削除対象の前記認識結果に替えて、新たに得られた前記認識結果を前記表示装置に表示することを特徴とする請求項2又は3に記載の入力処理装置。
  5. 前記削除対象選択手段は、前記認識結果に対応する音声の発話タイミングに基づいて、前記削除対象の認識結果を選択することを特徴とする請求項4に記載の入力処理装置。
  6. 前記選択肢毎の選択頻度を格納する選択頻度格納手段をさらに有し、
    前記削除対象選択手段は、前記発話タイミング及び前記選択頻度に基づいて、前記削除対象の前記認識結果を選択することを特徴とする請求項5に記載の入力処理装置。
  7. 前記削除対象選択手段は、前記選択入力の対象とされた前記認識結果を、前記削除対象の前記認識結果として選択することを特徴とする請求項4に記載の入力処理装置。
  8. 前記表示処理手段は、前記選択肢に対する数量及び前記選択肢それぞれの音声認識結果を選択可能に表示し、
    前記選択受付手段は、前記選択肢及び前記数量のうち少なくとも一方の選択入力を受け付けることを特徴とする請求項1乃至7の何れか1項に記載の入力処理装置。
  9. 前記表示処理手段は、同一の選択肢の前記音声認識結果が得られた場合に、前記選択肢に対応する前記音声認識結果として得られた前記数量の加算結果に対応付けて、前記同一の選択肢の前記音声認識結果を表示することを特徴とする請求項8に記載の入力処理装置。
  10. 前記選択肢毎の選択頻度を格納する選択頻度格納手段と、
    前記選択頻度に基づいて、前記選択肢の表示位置を決定する表示位置決定手段と
    をさらに有し、
    前記表示処理手段は、前記表示位置に配置された前記選択肢を前記表示装置に表示することを特徴とする請求項1に記載の入力処理装置。
  11. 入力処理装置が実行する入力処理方法であって、
    音声入力を受け付ける音声受付ステップと、
    前記音声受付ステップにおいて受け付けた音声に対する音声認識処理を行う音声認識処理ステップと、
    前記音声認識処理による認識結果と複数の選択肢とを選択可能に表示装置に表示する表示処理ステップと、
    前記表示装置に表示された前記選択肢又は前記認識結果のユーザによる選択入力を受け付ける選択受付ステップと
    を含むことを特徴とする入力処理方法。
  12. コンピュータを、
    音声入力を受け付ける音声受付手段と、
    前記音声受付手段が受け付けた音声に対する音声認識処理を行う音声認識処理手段と、
    前記音声認識処理による認識結果と複数の選択肢とを選択可能に表示装置に表示する表示処理手段と、
    前記表示装置に表示された前記選択肢又は前記認識結果のユーザによる選択入力を受け付ける選択受付手段と
    して機能させるためのプログラム。
JP2013081025A 2013-04-09 2013-04-09 入力処理装置、入力処理方法及びプログラム Pending JP2014203018A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013081025A JP2014203018A (ja) 2013-04-09 2013-04-09 入力処理装置、入力処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013081025A JP2014203018A (ja) 2013-04-09 2013-04-09 入力処理装置、入力処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2014203018A true JP2014203018A (ja) 2014-10-27

Family

ID=52353468

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013081025A Pending JP2014203018A (ja) 2013-04-09 2013-04-09 入力処理装置、入力処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2014203018A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212135A (ja) * 2015-04-30 2016-12-15 日本電信電話株式会社 音声入力装置、音声入力方法、およびプログラム
WO2023032207A1 (ja) * 2021-09-06 2023-03-09 日本電気株式会社 注文支援装置、システム及び方法、並びに、コンピュータ可読媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212135A (ja) * 2015-04-30 2016-12-15 日本電信電話株式会社 音声入力装置、音声入力方法、およびプログラム
WO2023032207A1 (ja) * 2021-09-06 2023-03-09 日本電気株式会社 注文支援装置、システム及び方法、並びに、コンピュータ可読媒体

Similar Documents

Publication Publication Date Title
KR102262453B1 (ko) 텍스트 예측용 이모지
EP2972690B1 (en) Text prediction based on multiple language models
EP2972691B1 (en) Language model dictionaries for text predictions
US9002708B2 (en) Speech recognition system and method based on word-level candidate generation
US9760560B2 (en) Correction of previous words and other user text input errors
US20040153975A1 (en) Text entry mechanism for small keypads
US10248383B2 (en) Dialogue histories to estimate user intention for updating display information
US20110060984A1 (en) Method and apparatus for word prediction of text input by assigning different priorities to words on a candidate word list according to how many letters have been entered so far by a user
US20110047456A1 (en) Method and Apparatus for Text Input
EP3207466A1 (en) Text prediction integration
EP3080713A1 (en) Using statistical language models to improve text input
EP2631816A1 (en) Non-temporary computer-readable medium in which data processing terminal, data search method and control program are stored
JPWO2012008167A1 (ja) 文字入力における候補の表示方法
JP2013149273A (ja) 入力順非依存式文字入力機構を提供するための方法、装置、およびコンピュータプログラム
JP2014203018A (ja) 入力処理装置、入力処理方法及びプログラム
JP2020149401A (ja) 情報処理装置及びプログラム
JP7114307B2 (ja) 情報処理装置
JP2011113116A (ja) 情報提供装置
JP6051175B2 (ja) 携帯端末、携帯端末用プログラム及びキーワード入力方法
US7716195B2 (en) Search methods
KR20150072397A (ko) 문자 메시지 작성 방법 및 이를 이용한 휴대 단말기
CN107851110B (zh) 信息处理装置以及信息提示系统
EP1791066A1 (en) Search method for an address book database
JP6644852B1 (ja) カラオケシステム
JP6250129B2 (ja) 携帯端末、携帯端末用プログラム及びキーワード入力方法