JP2007225793A - データ入力装置及び方法並びにプログラム - Google Patents

データ入力装置及び方法並びにプログラム Download PDF

Info

Publication number
JP2007225793A
JP2007225793A JP2006045522A JP2006045522A JP2007225793A JP 2007225793 A JP2007225793 A JP 2007225793A JP 2006045522 A JP2006045522 A JP 2006045522A JP 2006045522 A JP2006045522 A JP 2006045522A JP 2007225793 A JP2007225793 A JP 2007225793A
Authority
JP
Japan
Prior art keywords
voice
data
input
name
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006045522A
Other languages
English (en)
Other versions
JP4755918B2 (ja
Inventor
Masanori Takeuchi
雅則 竹内
Naoki Sekine
直樹 関根
Makoto Nozawa
誠 野沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2006045522A priority Critical patent/JP4755918B2/ja
Publication of JP2007225793A publication Critical patent/JP2007225793A/ja
Application granted granted Critical
Publication of JP4755918B2 publication Critical patent/JP4755918B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cash Registers Or Receiving Machines (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】周囲の雑音や会話等の影響を受け難い上、発話の内容に類似したものが多かったり促音や撥音を含むことが多かったりする場合でも音声を利用して確実にデータを入力できるようにする。
【解決手段】音声入力の開始と終了を検出し、その検出された音声入力開始から終了までの区間内に入力された音声を認識する。認識された音声データで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出し、抽出された複数の対象毎の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得する。得られた複数の対象名を出力し、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理する。
【選択図】 図5

Description

本発明は、音声認識技術を利用したデータ入力装置及び音声認識手段を備えたコンピュータのデータ入力方法並びに音声認識手段を備えたコンピュータを本発明のデータ入力装置として機能させるためのプログラムに関する。
近年、入力手段としてキーボード等の代わりに音声を用いる音声認識の技術が開発され、様々な分野で実用化されつつある。音声認識は、通常、入力された音声信号から音声の特徴量である音声パターンを計算し、予め用意されている標準パターンと比較した上で類似度が高いものを抽出するという仕組みである。
このような音声認識技術を利用して、例えばレストラン等の飲食店において客のオーダに従ったデータ入力を処理するようにしたデータ入力装置も、既に知られている(例えば、特許文献1参照)。
特開2004−326513号公報
しかしながら一般に、現在の音声認識技術は標準パターンの音声と同じように発話しなければ認識されない確率が高い。すなわち認識率は、人間の発話内容に左右され易い。一方、飲食店では「ラーメン」,「タンメン」,「タンタンメン」等のように品目名が似通ったメニュー商品が多々ある。これらの品目名の音声を確実に認識させるためには、1音ずつ正確にかつ丁寧に発話しなければならない。このため、オーダの音声入力には時間がかかるという懸念がある。また、様々な客層の客が出入りする飲食店の店内では、周囲の雑音や会話に影響されて音声を認識できない場合もある。しかも、「北京ダック」の「ッ」や「ハンバーグセット」の「ン」や「ッ」のような促音や撥音を含む品目名を発話すると、音声が一時的に無音すなわち非音声となるため、「ン」や「ッ」の手前で音声が終わったと認識されて誤認識が発生する場合もある。このような点から、接客を伴う飲食店向けのオーダ入力装置に音声認識技術を適用するのは実用にそぐわないと考えられていた。
本発明はこのような事情に基づいてなされたもので、その目的とするところは、周囲の雑音や会話等の影響を受け難い上、発話の内容に類似したものが多かったり促音や撥音を含むことが多かったりする場合でも音声を利用して確実にデータを入力することができ、データ入力作業の簡便化を図り得るデータ入力装置及びその方法並びにプログラムを提供しようとするものである。
本発明に係るデータ入力装置は、複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと対象名の音声データとを記憶する記憶手段と、音声入力の開始と終了を検知する入力区間検知手段と、この入力区間検知手段により検知された音声入力開始から終了までの区間内に音声入力手段を介して入力された音声パターンを認識する音声認識手段と、この音声認識手段により認識された音声パターンデータで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出する類似名検索手段と、この類似名検索手段により抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得する類似データ取得手段と、この類似データ取得手段により得られた複数の対象名を選択可能に出力する出力手段と、この出力手段により出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理する音声入力データ処理手段とを備えたものである。
また、本発明に係るデータ入力方法は、複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと対象名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段と、この音声入力手段を介して入力された音声を認識する音声認識手段とを備えたコンピュータが、音声入力の開始と終了を検知し、その検出された音声入力開始から終了までの区間内に入力された音声パターンを認識し、認識された音声パターンデータで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出し、抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得し、得られた複数の対象名を出力し、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理するようにしたものである。
また、本発明に係るプログラムは、複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと前記対象名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段とを備えたコンピュータに、音声入力の開始と終了を検出する入力区間検出機能と、検出された音声入力開始から終了までの区間内に音声入力手段を介して入力された音声を認識する音声認識機能と、認識された音声データで記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出する類似名検索機能と、抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を記憶手段から取得する類似データ取得機能と、得られた複数の対象名を選択可能に出力する出力機能と、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに記憶手段から読み出した対象コードを入力データとして処理する音声入力データ処理機能とを実現させるためのものである。
かかる手段を講じた本発明によれば、周囲の雑音や会話等の影響を受け難い上、発話の内容に類似したものが多かったり促音や撥音を含むことが多かったりする場合でも音声を利用して確実にデータを入力することができ、データ入力作業の簡便化を図ることができる効果を奏する。
以下、本発明を実施するための最良の形態について、図面を用いて説明する。
なお、この実施の形態は、飲食店において客が注文するメニュー商品のオーダデータ入力を処理するデータ入力装置,いわゆるオーダ入力装置に本発明を適用した場合である。
図1は本実施の形態におけるオーダ入力装置1の外観を示す斜視図であり、図2は同オーダ入力装置1の要部構成を示すブロック図である。オーダ入力装置1は、装置本体11とディスプレイユニット12とから構成されている。また、音声を入力する音声入力手段としてマイクロホン13が設けられている。ディスプレイユニット12は、例えば液晶を利用したディスプレイ121とタッチパネルセンサ122とからなるタッチパネル式のものである。なお、マイクロホン13は、図示の如く装置本体11から突出して設けられているものに限定されるものではなく、例えばディスプレイユニット12に内蔵されていてもよい。
装置本体11には、コンピュータの中枢部分を担うCPU(Central Processing Unit)111、前記CPU111の動作を制御するプログラム等の固定的データが予め格納されたROM(Read Only Memory)112、前記CPU111によってデータの書込みや読出しが行われるRAM(Random Access Memory)113、大容量の記憶媒体であるHDD(Hard Disk Drive)114、LAN(Local Area Network)等の通信ネットワークを介して接続される電子機器とのデータ通信を制御する通信インターフェイス115、前記ディスプレイ121の画面表示を制御する表示コントローラ116、前記タッチパネルセンサ122からタッチ検出信号が入力されるタッチパネルインターフェイス117、前記マイクロホン13から入力されたアナログの音声信号をディジタル信号に変換するA/Dコンバータ118及びこのA/Dコンバータ118から出力されるディジタル音声信号に基づいて音声認識を行う音声認識エンジン119が搭載されている。そしてCPU111と、ROM112,RAM113,HDD114,通信インターフェイス115,表示コントローラ116,タッチパネルインターフェイス117及び音声認識エンジン119とは、アドレスバス,データバス等のバスラインBLで電気的に接続されている。
通信インターフェイス115には、各客のオーダデータを記憶管理するステーションが接続されている。また、厨房への調理指示を行う厨房端末機や、飲食代金の会計を処理するPOS端末機等の電子機器が接続されている。
HDD114には、図3に示すように、メニューマスタファイル31,音声メニューファイル32,音響辞書ファイル33等の種々のデータファイルが保存されている。
メニューマスタファイル31には、当該オーダ入力装置1が使用される飲食店で提供される各種のメニュー商品をそれぞれ識別するための各メニュー品コードに対応して、そのメニュー品コードによって特定される飲食メニュー商品の品目名,単価等のメニュー商品に関する種々のデータが格納されている。
音声メニューファイル32には、前記各メニュー品コードに対応して、そのメニュー品コードによって特定されるメニュー商品の品目名と、この品目名を発話したときの音声の特徴量を数値化した標準的な音声パターンである品目名音声データとが格納されている。ここに、音声メニューファイル32は、複数の対象(注文対象品)をそれぞれ識別する対象名(品目名)及びこの対象名に対応して設定された対象コード(品コード)と上記対象名の音声データとを記憶する記憶手段を構成している。なお、音声メニューファイル32に品目名データを記憶せず、メニューマスタファイル31の品目名データを利用してもよい。
音響辞書ファイル33には、所定の語句を発話したときの音声の特徴量を数値化した標準的な音声パターンデータである語句音声データが格納されている。音声メニューファイル32と音響辞書ファイル33との違いについて説明すると、音響辞書ファイル33は、音声認識エンジン119がマイクロホン13から入力された音声の認識を行う際に使用するデータファイルであるのに対し、音声メニューファイル32は、CPU111が音声認識エンジン119で認識された音声パターンデータに類似する品目名音声データを抽出する際に使用するデータファイルである。
例えばメニュー商品「ラーメン」,「タンメン」,「タンタンメン」の3品目を例にすると、音響辞書ファイル33には語句「ラー」と語句「メン」と語句「タン」の各語句音声データが格納されている。一方、音声メニューファイル32には、メニュー商品「ラーメン」のメニューコードに対しては、語句「ラー」と語句「メン」の2つの語句音声データを結合した品目名音声データが格納されており、メニュー商品「タンメン」のメニューコードに対しては、語句「タン」と語句「メン」の2つの語句音声データを結合した品目名音声データが格納されており、メニュー商品「タンタンメン」のメニューコードに対しては、語句「タン」,語句「タン」及び語句「メン」の3つの語句音声データを結合した品目名音声データが格納されている。
かかる構成のオーダ入力装置は、音声によるオーダデータ入力機能を実現するためのプログラムがROM112に保存されている。また、このプログラムを実行する上で必要なメモリエリアとして、図4に示すように、入力音声データメモリ41と、対比音声データメモリ42と、オーダ候補テーブル43の各メモリエリアがRAM113に形成されている。因みにオーダ候補テーブル43は、1からの昇順に設定されたテーブル番号に対応して、メニュー品コード,品目名及び一致率の各データを書き込めるようになっている。なお、プログラムはHDD114に保存し、起動時にCPU111が読み出してRAM113のプログラムエリアに展開するようにしてもよい。
しかして、例えば電源オンによりオーダ入力装置1が立ち上がり、業務メニューの中からオーダ入力業務が選択されると、上記プログラムが起動する。これにより、CPU111は、図5の流れ図に示す手順に従い客のオーダデータ入力を処理するものとなっている。
先ず、CPU111は、ST(ステップ)1として座席情報,人数,担当者情報等のオーダ入力に関する初期情報の入力画面をディスプレイ121に表示させる。また、RAM113に形成されているオーダメモリ(不図示)をクリアする。次に、CPU111は、ST2として上記初期情報が入力されるのを待機する。そして、タッチパネルセンサ122からの信号により、これらの座席情報,人数,担当者情報等が入力されたことを検知したならば、CPU111は、ST3としてディスプレイ121の画面をオーダ入力画面50に切換える。
なお、初期情報の項目は、座席情報,人数及び担当者情報の3項目に限定されるものではなく、他の項目を組み合わせても良い。また、いずれかの項目を省略してもよい。あるいは初期情報の入力を無くし、立ち上がり後の初期画面をオーダ入力画面50としてもよい。
オーダ入力画面50の一例を図7に示す。図示するようにオーダ入力画面50には、「0」〜「9」のテンキー51の他、複数のメニュー分類キー52、複数のメニューキー53、乗算キー54、確認キー55、取消キー56、音声認識キー57等のタッチキーイメージが表示されている。また、オーダ入力内容を確認するためのオーダメニュー欄58や、置数データを表示するための置数表示欄59等が形成されている。各メニュー分類キー52には、単品メニュー,セットメニュー,飲料メニュー,デザートメニュー等のように各種の飲食メニュー商品を分類する項目がそれぞれ割り当てられている。各メニューキー53には、上記メニュー分類キー52のタッチ操作により選択されたメニュー分類項目に属する各種飲食メニュー商品の品目がそれぞれ割り当てられる。
オーダ入力画面50を表示後、CPU111は、ST4として音声によるオーダデータ入力が宣言されたか否かを判断する。音声によるオーダデータ入力が宣言されていない場合には、CPU111は、ST5としてキー操作によるオーダデータ入力が行われたか否かを判断する。キー操作によるオーダデータ入力が行われていない場合には、CPU111は、ST7の処理に進む。
ST5にてタッチパネルセンサ122からの信号により各メニューキー53のなかのいずれかのメニューキーがタッチ操作されたことを検知した場合には、そのタッチ操作されたメニューキーに割り当てられているメニュー商品のオーダデータ入力が宣言されたので、CPU111は、ST6としてオーダデータ入力処理を実行する。すなわち、当該メニュー商品のメニュー品コードとオーダ点数nをRAM113のオーダメモリ(不図示)に登録する。また、当該メニュー商品の品目名とオーダ点数nをオーダメニュー欄58に表示させる。なお、オーダ点数nは初期値を「1」とし、テンキー51と乗算キー54によって乗数が入力された場合にはその乗数とする。その後、CPU111は、ST7の処理に進む。ST7では、CPU111は、オーダデータ入力の確認が宣言されたか否かを判断する。オーダデータ入力の確認が宣言されていない場合には、ST4の処理に戻る。
ST7にてタッチパネルセンサ122からの信号により確認キー55がタッチ操作されたことを検知した場合には、オーダデータ入力の確認が宣言されたので、CPU111は、ST8としてオーダデータ入力済か否かを判断する。オーダメモリにデータが登録されていない場合には、オーダデータ入力済でないので、ST4の処理に戻る。
ST8にてオーダメモリにデータが登録されている場合には、オーダデータ入力済なので、CPU111は、ST9としてディスプレイ121の画面をオーダ確認画面に切換える。図示しないが、オーダ確認画面には、オーダデータ入力されたメニュー商品の品名,オーダ点数,価格や合計金額等が表示される。また、オーダの確定を宣言する確定キーのタッチキーイメージが表示される。
ここで、ST10としてタッチパネルセンサ122からの信号により上記確定キーがタッチ操作されたことを検知したならば、CPU111は、ST11として通信インターフェイス115を介して接続されたステーションに対し、オーダメモリに登録されたオーダデータを送信する。以上で、1客に対するオーダ入力処理を終了し、CPU111は、ディスプレイ121の画面を初期情報入力画面に戻す。
ST4にてタッチパネルセンサ122からの信号により音声認識キー57がタッチ操作されたことを検知した場合には、音声によるオーダデータ入力が宣言されたので、CPU111は、ST12としてディスプレイ121の画面を音声オーダ入力画面60に切換える。
音声オーダ入力画面60の一例を図8に示す。図示するように音声オーダ入力画面60には、テンキー61の他、複数の候補メニューキー62、乗算キー63、確認キー64、取消キー65、音声認識終了キー66、発話キー67等のタッチキーイメージが表示されている。また、オーダ入力内容を確認するためのオーダメニュー欄68や、置数データを表示するための置数表示欄69等が形成されている。複数の候補メニューキー62には、この時点では1つもメニュー商品の品目が表示されていない。発話キー67には、「このボタンを押しながら発話してください」なるメッセージが表示されている。ここに、CPU111は、ディスプレイ121に発話キー67、つまりは音声入力指示用のタッチキーイメージを表示させる画面制御手段を構成する。
音声オーダ入力画面60を表示させた後、CPU111は、ST13として音声認識終了が宣言されたか否かを判断する。音声入力終了が宣言されていない場合には、CPU111は、ST14として発話キー67がオン操作されたか否かを判断する。発話キー67がオン操作されていない場合には、CPU111は、ST13の処理に戻る。
ST14にてタッチパネルセンサ122からの信号により発話キー67がタッチ操作されたことを検知すると、CPU111は、マイクロホン13を介して入力され、A/Dコンバータ118にてディジタルデータに変換された音声データを音声認識エンジン119に取込む。この音声データの取込みは、ST16として発話キー67から指が離されてオフ操作されるまで継続する。そして、発話キー67のオフ操作を検知すると、CPU111は、ST17として音声認識エンジン119を動作させて、発話キー67がオン操作されている期間中に取り込んだ音声データの音声パターンを認識する。
ここに、CPU111は、ST14及びST16の処理により、音声入力の開始と終了を検知する入力区間検知手段を構成する。また、ST15の処理により、音声入力開始から終了までの区間内に音声入力手段を介して入力された音声パターンを認識する音声認識手段を構成する。
入力された音声データの音声パターン認識を終了すると、CPU111は、ST18として図6に具体的に示すメニュー候補検索処理を実行する。すなわちCPU111は、ST31として認識した音声パターンに相当する入力音声データを入力音声データメモリ41に上書きする。また、ST32としてオーダ候補テーブル43からメニュー品コード,品目名及び一致率の各データをクリアして、オーダ候補テーブル43を初期化する。
次に、CPU111は、ST33として音声メニューファイル32から1メニュー商品の品目名音声データを読み込み、対比音声データメモリ42に上書きする。そして、ST34として入力音声データメモリ41内の入力音声データと対比音声データメモリ42内の品目名音声データとを比較して、音声パターンの一致率を算出する。
次に、CPU111は、ST35として上記音声パターンの一致率が予め設定されたしきい値P(例えば50%)を超えているか否かを判断する。ここで、一致率がしきい値P以下の場合には、CPU111は、ST38の処理に進む。
これに対し、一致率がしきい値Pを越える場合には、CPU111は、ST36として当該品目名音声データに対応するメニュー品コードと品目名を音声メニューファイル32から読み込む。そして、このメニュー品コード,品目名及び一致率の各データをオーダ候補テーブル43に書き込む。しかる後、ST37としてオーダ候補テーブル43に複数のデータが格納されている場合には、テーブル番号「1」のデータから順に一致率が低くなるようにデータの並べ替えを行う。その後、ST38の処理に進む。
ST38では、音声メニューファイル32に他のメニュー商品のデータが存在するか否かを判断する。そして、他のメニュー商品のデータが存在する場合にはST33の処理に戻り、音声メニューファイル32から他のメニュー商品の品目名音声データを読み込んで対比音声データメモリ42に上書きする。そして以後、ST33〜ST38の各処理を再度実行する。
ここに、CPU111は、ST31〜ST35,ST38の各処理により、認識された音声パターンデータで記憶手段(音声メニューファイル32)に記憶されている対象毎の対象名音声データ(品目名音声データ)を検索して、類似する複数の対象名音声データを抽出する類似名検索手段を構成する。また、ST36の処理により、抽出された複数の対象名音声データにそれぞれ対応する対象コード(品コード)及び対象名(品目名)を記憶手段(音声メニューファイル32)から取得する類似データ取得手段を構成する。
ST38にて音声メニューファイル32に他のメニュー商品のデータが存在しないことを確認した場合には、CPU111は、ST39としてオーダ候補テーブル43に記憶されているデータ数が2以上か否かを判断する。すなわち、入力音声データと音声パターンの一致率がP%を超える品目名音声データが2つ以上抽出されたか否かを判断する。ここで、データ数が1以下であった場合には、CPU111は、ST40として予め設定されたしきい値Pに1未満の係数(例えば0.9)を乗算して、しきい値Pを下げる。しかる後、ST32に戻り、オーダ候補テーブル43を初期化した後、ST33以降の処理を再度実行する。
ST39にてオーダ候補テーブル43に記憶されているデータ数が2以上の場合には、CPU111は、ST41としてオーダ候補テーブル43に記憶されている2以上の品目名データを、音声オーダ入力画面60の候補メニューキー62に順番に表示させる。以上で、このメニュー候補検索処理を終了する。
ここに、CPU111とタッチパネル付のディスプレイユニット12は、類似データ取得手段により得られた複数の品目名を選択可能に出力する出力手段を構成する。
上記メニュー候補検索処理を終了すると、CPU111は、ST19として音声オーダ入力画面60の取消キー65がタッチ操作されるか、ST20として候補メニュー商品の1つが選択操作されるのを待機する。ここで、タッチパネルセンサ122からの信号により、取消キー65がタッチ操作されたことを検知した場合には、CPU111は、ST12の処理に戻る。すなわち、音声オーダ入力画面60の各候補メニューキー62に表示されている品目名を消去する。そして、ST13以降の処理を再度実行する。
一方、タッチパネルセンサ122からの信号により、品目名が表示されているいずれかの候補メニューキー62がタッチ操作されたことを検知した場合には、CPU111は、ST21としてその品目名データに対応するメニュー品コードをオーダ候補テーブル43から読み出す。そして、このメニュー品コードとオーダ点数nをRAM113のオーダメモリに登録する。また、当該メニュー商品の品目名とオーダ点数nをオーダメニュー欄68に表示させる。なお、オーダ点数nは初期値を「1」とし、テンキー61と乗算キー63によって乗数が入力された場合にはその乗数とする。その後、CPU111は、ST12の処理に戻り、音声オーダ入力画面60の各候補メニューキー62から品目名を消去する。そして、ST13以降の処理を再度実行する。
ここに、CPU111は、ST21の処理により、出力された複数の対象名(品目名)の中から任意の対象名が選択されると、その対象名とともに記憶手段(音声メニューファイル32)から読み出した対象コード(品コード)を入力データとして処理する音声入力データ処理手段を構成する。
ST13にて音声認識終了キー66がタッチ操作されたことを検知した場合には、CPU111は、ST3の処理に戻り、ディスプレイ121の画面をオーダ入力画面50に切換える。
このように構成された本実施の形態のオーダ入力装置1を利用する飲食店においては、客のオーダ内容を従来どおりタッチキーの操作により入力するだけでなく、音声により入力することも可能となる。
音声によるオーダデータ入力を利用する場合、オペレータは、図7に示すオーダ入力画面50において、音声認識キー57をタッチ操作する。そうすると、図8に示す音声オーダ入力画面60に切り換わるので、オペレータは、発話キー67をタッチ操作しながらオーダするメニュー商品の品目名を発話する。このとき、品目名を一音ずつ正確にかつ丁寧に発話する必要はなく、品目名の一部を発話するだけでもよい。なお、オペレータは、店員でもよいし客自身でもよい。
例えば今、メニュー商品「アイスクリーム」をオーダするために、発話キー67をタッチ操作しながら「アイス」と発話したとする。そうすると、発話キー67に指が触れたときから指が離れるまでの間にマイクロホン13から取り込まれ認識された入力音声データと、音声メニューファイル32に予め登録されている各種メニュー商品の品目名音声データとが個々に比較され、各々について一致率が算出される。そして、一致率が所定のしきい値Pを超える複数のメニュー商品が抽出され、それらの品目名が音声オーダ入力画面60の複数の候補メニューキー62にそれぞれ表示される。
今、発話した内容「アイス」に対して、一致率がしきい値Pを超えるメニュー商品が、一致率の高い順に「ライス」,「ライチ」,「半ライス」,「梅酒」,「アイスクリーム」,「アップルパイ」の6品目であったとする。この場合、音声オーダ入力画面60の各候補メニューキー62には、図9に示すように、上記6品目の品目名がそれぞれ表示される。
そこでオペレータは、オーダするメニュー商品「アイスクリーム」の品目名が表示された候補メニューキー62をタッチ操作する。そうすると、このメニュー商品「アイスクリーム」のメニュー品コードとオーダ点数とがオーダメモリに登録される。また、図10に示すように、音声オーダ入力画面60のオーダメニュー欄68に品目名,オーダ点数及び金額が表示される。
このように、オペレータは音声を利用してオーダ内容を入力することができる。なお、音声を入力したが所望する品目名が候補メニューキー62に表示されない場合には、取消キー65をタッチ操作した後、音声を入力しなおせばよい。
こうして、音声によるオーダデータ入力を終了したならば、オペレータは音声認識終了キー66をタッチ操作する。そうすると、画面がオーダ入力画面50に戻るので、確認キー55をタッチ操作する。そうすると、画面がオーダ確認画面に切り替わるので、オペレータはオーダ内容を確認し、間違いが無ければ確定キーをタッチ操作する。かくして、今回のオーダデータがネットワークを介して伝送され、ステーションで処理される。
このように本実施の形態によれば、タッチパネル形式のディスプレイ121上に表示される音声オーダ入力画面60に発話キー67を配置し、この発話キー67がタッチ操作されている期間中だけマイクロホン13から入力される音声データを取り込んで認識するようにしている。したがって、当該オーダ入力装置1の周囲で別の会話がされていたり、周囲の騒音が大きかったりしても、発話キー67に指が触れる直前までの音や指が離れた直後の音を認識対象の音声データから排除できるので、認識率を高めることができる。また、例えば「ン」や「ッ」のような促音や撥音を含む品目名を発話する場合でも、促音や撥音の手前で音声が終わったと認識されることがないので、促音や撥音を含む音声の認識率も高めることができる。
それに加え、本実施の形態では、上記の如く高い認識率で認識された入力音声データについて、音声メニューファイル32に予め登録されている各種メニュー商品の品目名音声データとの一致率を求め、所定のしきい値Pを超える全てのメニュー商品を候補メニュー商品として抽出するようにしている。しかも、一致率がしきい値Pを超えるメニュー商品が1品も抽出できない場合、若しくは1品しか抽出できない場合には、しきい値Pを低く設定し直して再検索し、少なくとも2品以上の候補メニュー商品を抽出するようにしている。そして、抽出された複数の候補メニュー商品の各品目名をそれぞれ音声オーダ入力画面60の複数の候補メニューキー62に表示させて選択可能とし、当該候補メニューキー62のタッチ操作により選択された品目名のメニュー商品に対するメニュー品コードをオーダ入力データとして処理するようにしている。
したがって、品目名の一部を発話するだけでも高い確率でオーダするメニュー商品の品目名を候補メニューキー62に表示させることができるので、メニュー商品の品目名を1音ずつ正確にかつ丁寧に発話する必要がなく、音声入力を容易に活用することができる。また、音声入力後は、候補メニューキー62に表示された品目名の中からオーダするメニュー商品の品目名が表示された候補メニューキー62をタッチ操作するだけで当該メニュー商品のオーダ入力を行うことができるので、メニュー商品数が多い飲食店でも所望するオーダ商品のタッチキーを容易に見つけ出して入力することができ、能率的である。
なお、この発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
例えば前記実施の形態では、飲食店において客が注文するメニュー商品のオーダデータ入力を処理するデータ入力装置に本発明を適用したが、オーダデータ以外の音声データ入力にも本発明を適用することができる。例えば鉄道等の乗車券を販売する券売機に対して行先データを音声で入力する場合や、コンサート,映画等のチケットやゲームソフト等のコンテンツを販売する情報端末機に対してオーダデータを音声で入力する場合等にも適用できる。すなわち、対象名及び対象コードは、前記実施の形態の品目名及び品コードに限定されるものではない。
また、前記実施の形態では装置内部のROM112に発明を実施する機能プログラムが予め記録されている場合で説明をしたが、これに限らず同様の機能プログラムをネットワークから装置にダウンロードしても良いし、同様の機能プログラムを記録媒体に記憶させたものを装置にインストールしてもよい。記録媒体としては、CD−ROM等プログラムを記憶でき、かつ装置が読み取り可能な記録媒体であれば、その形態は何れの形態であっても良い。またこのように予めインストールやダウンロードにより得る機能は装置内部のOS(オペレーティング・システム)等と協働してその機能を実現させるものであってもよい。
この他、前記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を組合わせてもよい。
本発明の一実施の形態であるオーダ入力装置の外観斜視図。 同オーダ入力装置の要部構成を示すブロック図。 同オーダ入力装置のHDDに保存される主要なデータファイルを示す模式図。 同オーダ入力装置のRAMに形成される主要なメモリエリアを示す模式図。 同オーダ入力装置のCPUが実行する本発明に係るプログラム処理手順の要部を示す流れ図。 図5におけるメニュー候補検索処理の手順を具体的に示す流れ図。 同オーダ入力装置のディスプレイに表示されるオーダ入力画面の一例を示す模式図。 同オーダ入力装置のディスプレイに表示される音声オーダ入力画面の一例を示す模式図。 同音声オーダ入力画面の音声認識後の画面例を示す模式図。 同音声オーダ入力画面のオーダ入力後の画面例を示す模式図。
符号の説明
1…オーダ入力装置、11…装置本体、12…ディスプレイユニット、13…マイクロホン、31…メニューマスタファイル、32…音声メニューファイル、33…音響辞書ファイル、41…入力音声メモリ、42…対比音声メモリ、43…オーダ候補テーブル、111…CPU、119…音声認識エンジン、121…ディスプレイ、122…タッチパネルセンサ。

Claims (9)

  1. 複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと前記対象名の音声データとを記憶する記憶手段と、
    音声を入力する音声入力手段と、
    音声入力の開始と終了を検知する入力区間検知手段と、
    この入力区間検知手段により検知された音声入力開始から終了までの区間内に前記音声入力手段を介して入力された音声パターンを認識する音声認識手段と、
    この音声認識手段により認識された音声パターンデータで前記記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出する類似名検索手段と、
    この類似名検索手段により抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を前記記憶手段から取得する類似データ取得手段と、
    この類似データ取得手段により得られた複数の対象名を選択可能に出力する出力手段と、
    この出力手段により出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに前記記憶手段から読み出した対象コードを入力データとして処理する音声入力データ処理手段と、
    を具備したことを特徴とするデータ入力装置。
  2. タッチパネル付のディスプレイを備え、
    前記出力手段は、前記類似データ取得手段により得られた複数の対象名がそれぞれ割当てられた複数のタッチキー画面を前記ディスプレイに表示出力する手段であることを特徴とする請求項1記載のデータ入力装置。
  3. 前記ディスプレイに音声入力指示用のタッチキーイメージを表示させる画面制御手段をさらに具備し、
    前記入力区間検知手段は、前記音声入力指示用のタッチキーイメージに指が触れたときを音声入力の開始と検知し、指が離れたときを音声入力の終了と検知することを特徴とする請求項2記載のデータ入力装置。
  4. 前記類似名検索手段は、前記音声認識手段により認識された音声パターンデータを前記記憶手段に記憶されている対象毎の対象名音声データと個々に比較して一致率を求め、この一致率が予め設定されたしきい値以上の対象名音声データを抽出する手段であり、複数の対象名音声データを抽出できないときには前記しきい値を下げて再検索することを特徴とする請求項1記載のデータ入力装置。
  5. 複数の注文対象品をそれぞれ識別する品目名及びこの品目名に対応して設定された品コードと前記品目名の音声データとを記憶する記憶手段と、
    音声を入力する音声入力手段と、
    音声入力の開始と終了を検知する入力区間検知手段と、
    この入力区間検知手段により検知された音声入力開始から終了までの区間内に前記音声入力手段を介して入力された音声パターンを認識する音声認識手段と、
    この音声認識手段により認識された音声パターンデータで前記記憶手段に記憶されている注文対象品毎の品目名音声データを検索して類似する複数の品目名音声データを抽出する類似名検索手段と、
    この類似名検索手段により抽出された複数の品目名音声データにそれぞれ対応する品コード及び品目名を前記記憶手段から取得する類似データ取得手段と、
    この類似データ取得手段により得られた複数の品目名を選択可能に出力する出力手段と、
    この出力手段により出力された複数の品目名の中から任意の品目名が選択されると、その品目名とともに前記記憶手段から読み出した品コードをオーダ入力データとして処理する音声入力データ処理手段と、
    を具備したことを特徴とするデータ入力装置。
  6. 複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと前記対象名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段と、この音声入力手段を介して入力された音声を認識する音声認識手段とを備えたコンピュータのデータ入力方法であって、
    前記コンピュータは、音声入力の開始と終了を検知し、その検出された音声入力開始から終了までの区間内に入力された音声パターンを認識し、認識された音声パターンデータで前記記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出し、抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を前記記憶手段から取得し、得られた複数の対象名を出力し、出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに前記記憶手段から読み出した対象コードを入力データとして処理することを特徴とするデータ入力方法。
  7. 複数の注文対象品をそれぞれ識別する品目名及びこの品目名に対応して設定された品コードと前記品目名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段と、この音声入力手段を介して入力された音声を認識する音声認識手段とを備えたコンピュータのデータ入力方法であって、
    前記コンピュータは、音声入力の開始と終了を検知し、その検出された音声入力開始から終了までの区間内に入力された音声パターンを認識し、認識された音声パターンデータで前記記憶手段に記憶されている注文対象品毎の品目名音声データを検索して類似する複数の品目名音声データを抽出し、抽出された複数の品目名音声データにそれぞれ対応する品コード及び品目名を前記記憶手段から取得し、得られた複数の品目名を出力し、出力された複数の品目名の中から任意の品目名が選択されると、その品目名とともに前記記憶手段から読み出した品コードをオーダ入力データとして処理することを特徴とするデータ入力方法。
  8. 複数の対象をそれぞれ識別する対象名及びこの対象名に対応して設定された対象コードと前記対象名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段とを備えたコンピュータに、
    音声入力の開始と終了を検知する入力区間検出機能と、
    検出された音声入力開始から終了までの区間内に前記音声入力手段を介して入力された音声パターンを認識する音声認識機能と、
    認識された音声パターンデータで前記記憶手段に記憶されている対象毎の対象名音声データを検索して類似する複数の対象名音声データを抽出する類似名検索機能と、
    抽出された複数の対象名音声データにそれぞれ対応する対象コード及び対象名を前記記憶手段から取得する類似データ取得機能と、
    得られた複数の対象名を選択可能に出力する出力機能と、
    出力された複数の対象名の中から任意の対象名が選択されると、その対象名とともに前記記憶手段から読み出した対象コードを入力データとして処理する音声入力データ処理機能と、
    を実現させるためのプログラム。
  9. 複数の注文対象品をそれぞれ識別する品目名及びこの品目名に対応して設定された品コードと前記品目名の音声データとを記憶する記憶手段と、音声を入力する音声入力手段とを備えたコンピュータに、
    音声入力の開始と終了を検知する入力区間検出機能と、
    検出された音声入力開始から終了までの区間内に前記音声入力手段を介して入力された音声パターンを認識する音声認識機能と、
    認識された音声パターンデータで前記記憶手段に記憶されている注文対象品毎の品目名音声データを検索して類似する複数の品目名音声データを抽出する類似名検索機能と、
    抽出された複数の品目名音声データにそれぞれ対応する品コード及び品目名を前記記憶手段から取得する類似データ取得機能と、
    得られた複数の品目名を選択可能に出力する出力機能と、
    出力された複数の品目名の中から任意の品目名が選択されると、その品目名とともに前記記憶手段から読み出した品コードをオーダ入力データとして処理する音声入力データ処理機能と、
    を実現させるためのプログラム。
JP2006045522A 2006-02-22 2006-02-22 データ入力装置及び方法並びにプログラム Expired - Fee Related JP4755918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006045522A JP4755918B2 (ja) 2006-02-22 2006-02-22 データ入力装置及び方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006045522A JP4755918B2 (ja) 2006-02-22 2006-02-22 データ入力装置及び方法並びにプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011005206A Division JP5079893B2 (ja) 2011-01-13 2011-01-13 データ入力装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2007225793A true JP2007225793A (ja) 2007-09-06
JP4755918B2 JP4755918B2 (ja) 2011-08-24

Family

ID=38547690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006045522A Expired - Fee Related JP4755918B2 (ja) 2006-02-22 2006-02-22 データ入力装置及び方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4755918B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163528A (ja) * 2008-01-08 2009-07-23 Toshiba Tec Corp 商品販売データ処理装置及びそのプログラム並びに商品データ入力装置及びそのプログラム
JP2009252238A (ja) * 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法
JP2013054442A (ja) * 2011-09-01 2013-03-21 Toshiba Tec Corp オーダ端末およびオーダ端末のプログラム
JP2014109874A (ja) * 2012-11-30 2014-06-12 Toshiba Tec Corp 注文入力装置およびプログラム
WO2016098228A1 (ja) * 2014-12-18 2016-06-23 三菱電機株式会社 音声認識装置および音声認識方法
JP2017107333A (ja) * 2015-12-08 2017-06-15 キヤノン株式会社 通信機器及び通信機器の制御方法
CN109920407A (zh) * 2017-12-12 2019-06-21 上海博泰悦臻网络技术服务有限公司 智能终端及其饮食搜寻方法、及无人驾驶车辆
JP2020035492A (ja) * 2016-03-29 2020-03-05 株式会社ぐるなび メニュー情報提供システム、メニュー情報提供制御プログラム及びその方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312451A (ja) * 2001-04-12 2002-10-25 Seiko Instruments Inc オーダ入力装置
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
JP2004326513A (ja) * 2003-04-25 2004-11-18 Sharp Corp オーダー入力装置
JP2004354722A (ja) * 2003-05-29 2004-12-16 Nissan Motor Co Ltd 音声認識装置
JP2005055782A (ja) * 2003-08-07 2005-03-03 Sharp Corp データ入力装置、ハンディターミナル、データ入力方法、プログラム及び記録媒体
JP2005174251A (ja) * 2003-12-15 2005-06-30 Sharp Corp オーダー処理装置、オーダー処理方法、オーダー処理プログラム、オーダー処理プログラム記録媒体及びオーダー処理システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312451A (ja) * 2001-04-12 2002-10-25 Seiko Instruments Inc オーダ入力装置
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
JP2004326513A (ja) * 2003-04-25 2004-11-18 Sharp Corp オーダー入力装置
JP2004354722A (ja) * 2003-05-29 2004-12-16 Nissan Motor Co Ltd 音声認識装置
JP2005055782A (ja) * 2003-08-07 2005-03-03 Sharp Corp データ入力装置、ハンディターミナル、データ入力方法、プログラム及び記録媒体
JP2005174251A (ja) * 2003-12-15 2005-06-30 Sharp Corp オーダー処理装置、オーダー処理方法、オーダー処理プログラム、オーダー処理プログラム記録媒体及びオーダー処理システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163528A (ja) * 2008-01-08 2009-07-23 Toshiba Tec Corp 商品販売データ処理装置及びそのプログラム並びに商品データ入力装置及びそのプログラム
JP2009252238A (ja) * 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法
US8560324B2 (en) 2008-04-08 2013-10-15 Lg Electronics Inc. Mobile terminal and menu control method thereof
JP2013054442A (ja) * 2011-09-01 2013-03-21 Toshiba Tec Corp オーダ端末およびオーダ端末のプログラム
JP2014109874A (ja) * 2012-11-30 2014-06-12 Toshiba Tec Corp 注文入力装置およびプログラム
WO2016098228A1 (ja) * 2014-12-18 2016-06-23 三菱電機株式会社 音声認識装置および音声認識方法
JP2017107333A (ja) * 2015-12-08 2017-06-15 キヤノン株式会社 通信機器及び通信機器の制御方法
JP2020035492A (ja) * 2016-03-29 2020-03-05 株式会社ぐるなび メニュー情報提供システム、メニュー情報提供制御プログラム及びその方法
CN109920407A (zh) * 2017-12-12 2019-06-21 上海博泰悦臻网络技术服务有限公司 智能终端及其饮食搜寻方法、及无人驾驶车辆

Also Published As

Publication number Publication date
JP4755918B2 (ja) 2011-08-24

Similar Documents

Publication Publication Date Title
JP4755918B2 (ja) データ入力装置及び方法並びにプログラム
JP6570651B2 (ja) 音声対話装置および音声対話方法
JP6966979B2 (ja) 対話システムの制御方法、対話システム及びプログラム
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JP6125138B2 (ja) 情報提供システム
JP4846734B2 (ja) 音声認識装置
JP2016521383A (ja) 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体
JP2005043461A (ja) 音声認識方法及び音声認識装置
JP3842497B2 (ja) 音声処理装置
US8170874B2 (en) Apparatus and method for recognizing speech based on feature parameters of modified speech and playing back the modified speech
US10216732B2 (en) Information presentation method, non-transitory recording medium storing thereon computer program, and information presentation system
JP5015806B2 (ja) 商品販売データ処理装置及びそのプログラム並びに商品データ入力装置及びそのプログラム
JP6697270B2 (ja) コミュニケーション支援システム、コミュニケーション支援方法、およびプログラム
JP2010231433A (ja) 検索装置
JP5079893B2 (ja) データ入力装置及び方法並びにプログラム
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP5591428B2 (ja) 自動記録装置
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPWO2020017151A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2019132979A (ja) カラオケ装置
JP2011027979A (ja) 音声翻訳装置及び音声翻訳方法
WO2019142447A1 (ja) 情報処理装置および情報処理方法
JP4550688B2 (ja) 音声化装置、キャッシュレジスタ、音声化方法、音声化プログラム、および音声化プログラムを記録したコンピュータ読取り可能な記録媒体
JP5576817B2 (ja) 自動取引装置、音声読み上げ方法及び音声読み上げプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees