JP6191919B2 - 注文入力システム及び注文入力方法 - Google Patents

注文入力システム及び注文入力方法 Download PDF

Info

Publication number
JP6191919B2
JP6191919B2 JP2014145374A JP2014145374A JP6191919B2 JP 6191919 B2 JP6191919 B2 JP 6191919B2 JP 2014145374 A JP2014145374 A JP 2014145374A JP 2014145374 A JP2014145374 A JP 2014145374A JP 6191919 B2 JP6191919 B2 JP 6191919B2
Authority
JP
Japan
Prior art keywords
order
voice
speaker
recognition result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014145374A
Other languages
English (en)
Other versions
JP2016021196A (ja
Inventor
信一 重永
信一 重永
亮太 藤井
亮太 藤井
久裕 田中
久裕 田中
広志 田中
広志 田中
昭年 泉
昭年 泉
正成 宮本
正成 宮本
伸一 高山
伸一 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014145374A priority Critical patent/JP6191919B2/ja
Priority to US14/798,731 priority patent/US9665904B2/en
Publication of JP2016021196A publication Critical patent/JP2016021196A/ja
Application granted granted Critical
Publication of JP6191919B2 publication Critical patent/JP6191919B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Cash Registers Or Receiving Machines (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、注文客及び店員の発話音声を音声認識し、注文客からの注文内容の入力を支援する注文入力システム及び注文入力方法に関する。
従来、ファストフード店やカフェ等の店舗におけるドライブスルーでは、ヘッドセットを装着した店舗内の店員が車両(例えば自動車)で来店した話者(例えば注文者)との間で注文内容の通話を行うために、車両の停車位置付近にマイク及びスピーカが設置されている(例えば図15参照)。
図15は、従来の注文入力システム600のシステム構成の一例を示すブロック図である。図15に示す注文入力システム600は、注文客用マイクMc1と、注文客用スピーカSp1と、店員用マイクMc2と、店員用スピーカSp2と、通話システム510と、入力装置530と、ディスプレイ装置540と、メモリ550と、POS(Point Of Sales)システム520とを含む構成である。POSシステム520は、注文表生成部528を有し、入力装置530,ディスプレイ装置540,メモリ550がPOSシステム520に接続されている。店員用マイクMc2と店員用スピーカSp2とは、例えば店員が店舗内で装着するヘッドセットHdsとして構成される。
図15に示す注文入力システム600では、ヘッドセットHdsを装着した店員は、注文客用スピーカSp1から出力された店員の音声に従って注文客が注文客用マイクMc1に向かって発した注文内容の音声を、通話システム510及び店員用スピーカSp2を介して聞き取る。店員は、注文客が注文した商品等の注文内容を復唱又はメモ等によって覚え、入力装置530を用いた操作を介して、POSシステム520に注文内容を入力する。注文表生成部528は、店員の操作によって入力された注文内容を含む注文表の画面データを生成してメモリ550に記憶し、更に、注文表の画面データをディスプレイ装置540に表示させる。
図15に示す注文入力システム600ではPOSシステム520と通話システム510とが非接続であるため、店員の聞き違いや覚え間違い等によって、注文表生成部528により生成された注文表の画面データの内容が間違えることがあり、注文内容の入力が効率的でなく、注文客に対する利便性を低下させてしまう。
ここで、ファストフード店等において、顧客の注文を口頭で受け応えし、注文内容が各担当者(接客担当者、調理担当者)に伝達されて注文の処理が実行される先行技術として、特許文献1に示すオーダリングシステムが提案されている。
特許文献1に示すオーダリングシステムは、店舗内のカウンタ部の顧客担当者が顧客の料理の注文を復唱してヘッドセットにおいて収音した音声を情報処理端末に出力し、情報処理端末ではヘッドセットからの音声の信号と雑音マイクが収音した雑音の信号との差分をとってから音声認識を行い、音声認識結果をヘッドセットから音声出力して接客担当者に確認させる。確認された注文はディスプレイに表示され、調理担当者がディスプレイを見て調理する。料理が出来上がると接客担当者が料理を顧客のところに運ぶと共にタッチパネルディスプレイで該当する料理が処理されたことが入力される。
また、店舗内の注文内容の入力にかかる手間を削減する先行技術として、例えば特許文献2に示す注文データ管理装置が知られている。
特許文献2に示す注文データ管理装置は、収音装置において収音された顧客の注文に関する音声情報を受信して音声認識を行い、音声情報に含まれる、注文対象となる品名と品名に対する数量とを注文した顧客を識別する顧客識別情報とを抽出して注文データを生成して記憶する。注文データ管理装置は、品名と品名に対する単価とを対応付けて記憶しており、精算対象となる顧客を特定する顧客識別情報を受信すると、顧客識別情報に対応する注文データを読み出し、注文データに含まれる品名と数量と品名に対する単価とに基づいて、精算金額を算出する。
特開2004−326612号公報 特開2008−197826号公報
しかし、特許文献1では、顧客の料理の注文の際に発した音声を音声認識せずに、1系統の音声(即ち、ヘッドセットを装着した店員が顧客の料理の注文内容を復唱した音声)が音声認識されるため、顧客の料理の注文の際に発した音声を注文内容のデータ生成に利用することが考慮されていない。このため、例えばファストフード店等の店舗のドライブスルーにおいて特許文献1の構成を適用しようとすると、店舗の屋外は騒がしい環境であることが多いため、顧客の注文の際に発した音声が誤認識されてしまうと、注文内容のデータが間違って生成されてしまい、注文内容の入力が効率的でない場合がある。
また、特許文献2では、顧客の注文に関する音声情報を音声認識することは考慮されているが、特許文献1のように店員が顧客の注文に関する音声を復唱した音声を音声認識することは考慮されておらず、同様に1系統の音声(即ち、顧客の注文時に発した音声)しか注文内容のデータ生成に利用されていない。このため、同様にファストフード店等の店舗のドライブスルーにおいて特許文献2の構成を適用しようとすると、店舗の屋外は騒がしい環境であることが多いため、顧客の注文の際に発した音声が誤認識されてしまうと、注文内容のデータが間違って生成されてしまい、注文内容の入力が効率的でない場合がある。
本発明は、上述した従来の課題を解決するために、ドライブスルー等の騒がしい環境下における注文において、注文客の注文時に発した音声と店員の注文客が注文時に発した音声を復唱した音声との2系統の音声を用いて、注文内容の入力を効率化させる注文入力システム及び注文入力方法を提供することを目的とする。
本発明は、屋外に設置され、第1の話者の音声を収音する第1収音部と、屋内に設置され、前記第1収音部により収音された前記第1の話者の音声を出力する音声出力部と、前記屋内に設置され、第2の話者の音声を収音する第2収音部と、前記第1収音部により収音された前記第1の話者の音声と、前記第2収音部により収音された前記第2の話者の音声とを音声認識する音声認識部と、前記第1収音部により収音された前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記音声出力部による音声出力に基づいて前記第2の話者により発話され、かつ前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を、前記屋内に設置された表示部に表示させる注文データ出力部と、を備える、注文入力システムである。
また、本発明は、第1収音部と第2収音部とを含む注文入力システムにおける注文入力方法であって、屋外に設置された前記第1収音部において、第1の話者の音声を収音するステップと、屋内に設置された音声出力部において、前記第1収音部により収音された前記第1の話者の音声を出力するステップと、前記屋内に設置され、前記第2収音部において、第2の話者の音声を収音するステップと、前記第1収音部により収音された前記第1の話者の音声と、前記第2収音部により収音された前記第2の話者の音声とを音声認識するステップと、前記第1収音部により収音された前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記音声出力部による音声出力に基づいて前記第2の話者により発話され、かつ前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を、前記屋内に設置された表示部に表示させるステップと、を有する、注文入力方法である。
本発明によれば、ドライブスルー等の騒がしい環境下における注文において、注文客の注文時に発した音声と店員の注文客が注文時に発した音声を復唱した音声との2系統の音声を用いて、注文内容の入力を効率化させることができる。
本実施形態の注文入力システムのシステム構成の一例を示すブロック図 POSシステムにより生成される注文入力画面の一例を示す図 本実施形態の注文入力システムのメイン処理の動作手順の一例を説明するフローチャート 本実施形態の注文入力システムの初期化処理の動作手順の一例を説明するフローチャート 音声認識用辞書に格納される用語と各用語のタグとの関係の一例を示す説明図 本実施形態の注文入力システムの注文表変換処理の動作手順の一例を説明するフローチャート 注文客注文表リスト又は店員注文表リストの生成手順の一例を示す説明図 (A)〜(C)注文客注文表リスト又は店員注文表リストの項目毎の注文内容の修正の一例を示す説明図 本実施形態の注文入力システムの注文表修正処理の動作手順の一例を説明するフローチャート 注文客音声履歴の選択操作に応じた注文客の注文に関する音声の音声認識結果の他の候補の表示例を示す説明図 本実施形態の注文入力システムの音声認識結果表示処理の動作手順の一例を説明するフローチャート 注文客音声認識モード、店員音声認識モードのオン、オフの切り替えを示す説明図 本実施形態の注文入力システムの注文客音声認識モード、店員音声認識モードのオン、オフの切り替えを説明するフローチャート 注文客注文リストと店員注文リストとの間に不整合があった項目を強調表示する例を示す説明図 従来の注文入力システムのシステム構成の一例を示すブロック図
以下、本発明に係る注文入力システム及び注文入力方法の実施形態(以下、「本実施形態」という)について、図面を参照して説明する。本実施形態の注文入力システムは、例えばファストフード店やカフェ等の店舗におけるドライブスルーにおいて使用されるとして説明するが、ドライブスルーに適用した例に限定されない。
なお、本発明は、注文入力システムを構成する各装置(例えば後述するPOSシステム20)、又は注文入力システムを構成する各装置(例えば後述するPOSシステム20)が行う各動作(ステップ)を含む方法として表現することも可能である。
図1は、本実施形態の注文入力システム100のシステム構成の一例を示すブロック図である。図1に示す注文入力システム100は、注文客用マイクMc1と、注文客用スピーカSp1と、店員用マイクMc2と、店員用スピーカSp2と、通話システム10と、POSシステム20と、入力装置30と、ディスプレイ装置40と、メモリ50とを含む構成である。
POSシステム20は、通信部22と、音声注文入力処理部24と、音声認識用辞書26と、注文表生成部28とを含む構成であり、入力装置30,ディスプレイ装置40,メモリ50がPOSシステム20に接続されている。店員用マイクMc2と店員用スピーカSp2とは、例えばドライブスルーの店員が店舗内で装着するヘッドセットHdsとして構成される。
図1に示す注文入力システム100では、ヘッドセットHdsを装着した店員(第2の話者。以下同様。)は、注文客用スピーカSp1から出力された店員の音声(例えば「いらっしゃいませ。ご注文をお願いします。」)に従って注文客(第1の話者。以下同様。)が注文客用マイクMc1に向かって発した注文内容の音声を、通話システム10及び店員用スピーカSp2を介して聞き取り、注文客の注文内容の音声を復唱する。店員が復唱した音声はヘッドセットHdsの店員用マイクMc2において収音される。注文客の発した音声と店員の復唱した音声との2系統の音声が、通話システム10からPOSシステム20に送信されて音声認識される。POSシステム20は、2系統の音声の音声認識結果を用いた所定の処理(後述参照)により、注文者の発した注文内容を含む注文データの表示画面(注文表表示画面)をディスプレイ装置40に表示させる。
本実施形態では、注文客用マイクMc1及び注文客用スピーカSp1は、例えばドライブスルーの店舗の屋外における車両の停車位置付近に設置されるオーダーポスト(不図示)に設けられる。オーダーポストは、ドライブスルーの注文対象の商品を写真等によって掲示し、店員と注文者との間での通話を行うための注文客用マイクMc1及び注文客用スピーカSp1を少なくとも含む屋外設置機器である。
第1収音部の一例としての注文客用マイクMc1は、注文客の発した音声(例えば注文内容に関する音声)を収音する。注文客用マイクMc1により収音された音声の音声データは、通話システム10を介して、ヘッドセットHdsを構成する店員用スピーカSp2から出力される。
第1音声出力部の一例としての注文客用スピーカ装置Sp1は、例えば店員の発した音声(例えば注文内容に関する音声)を出力する。店員の声(例えば「いらっしゃいませ。ご注文をお願いします。」)は、通話システム10を介して注文客用スピーカSp1から出力されて注文者によって聞き取られる。
第2収音部の一例としての店員用マイクMc2は、店員の発した音声(例えば注文客の発した注文内容を確認するため店員が復唱した注文内容に関する音声)を収音する。店員用マイクMc2により収音された音声の音声データは、通話システム10を介して、注文客用スピーカSp1から出力される。
なお、注文客用マイクMc1,店員用マイクMc2は、無指向性マイクロホンでも良いし、双指向性マイクロホン、単一指向性マイクロホン、鋭指向性マイクロホン、超指向性マイクロホン(例えばガンマイク)又はこれらの組み合わせが用いられても良い。
第2音声出力部の一例としての店員用スピーカSp2は、例えば注文客の発した音声(例えば注文客の発した注文内容を確認するため店員が復唱した注文内容に関する音声)を出力する。注文客の声(例えば注文内容に関する音声「One CheeseBurger medium fries please」等)は、通話システム10を介して店員用スピーカSp2から出力されて店員によって聞き取られる。
通話システム10は、注文客用マイクMc1と店員用スピーカSp2との間、及び店員用マイクMc2と注文客用スピーカSp1との間の音声信号の仲介を行う既存の通話制御機能を有し、更に、注文客用マイクMc1により収音された注文客の発した音声,店員用マイクMc2により収音された店員の発した音声をPOSシステム20に送信する。
通話システム10とPOSシステム20との間は、不図示のネットワークを介して相互に接続されている。ネットワークは、有線ネットワーク(例えばイントラネット、インターネット)でも良いし、無線ネットワーク(例えば無線LAN(Local Area Network))でも良い。
なお、図1では、入力装置30,ディスプレイ装置40,メモリ50は、それぞれPOSシステム20の内部には含まれていないが、POSシステム20の内部に含まれた構成でも良い。POSシステム20は、店舗内のバックヤード(例えば不図示の監視室)に設置される据置型のPC(Personal Computer)又はサーバ装置でも良いし、店員が携帯可能な携帯電話機、タブレット端末、スマートフォン等のデータ通信端末でも良い。
通信部22は、不図示のネットワークを介して、通話システム10から送信された音声信号を受信して音声注文入力処理部24に出力する。
音声注文入力処理部24は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)を用いて構成され、通信部22から出力された音声信号を用いて、注文客の発した音声から注文内容に関して所定の処理を行う。音声注文入力処理部24は、音声認識部24aと、注文表変換部24bとを含む構成である。
音声認識部24aは、音声認識用辞書26を用いて、通信部22から出力された注文客の発した音声(即ち、注文客用マイクMc1により収音された音声)、又は店員の発した音声(即ち、店員用マイクMc2により収音された音声)の音声認識処理を行う。
音声認識部24aは、音声認識結果としての注文客の発した音声の所定候補数の音声認識結果とこの音声認識結果に含まれる各単語に対する所定候補数の音声認識結果とを含むリスト(以下、「注文客音声認識結果リスト」という)と店員の発した音声の所定候補数の音声認識結果と音声認識結果に含まれる各単語に対する所定候補数の音声認識結果とを含むリスト(以下、「店員音声認識結果リスト」という)とをメモリ50に格納する。
注文表変換部24bは、音声認識部24aの出力(即ち、注文客音声認識結果リスト及び店員音声認識結果リスト)の各第1候補の音声認識結果(例えば音声認識率が最も高い音声認識結果)を抽出し、各第1候補の音声認識結果の各単語に対応付けられたタグの情報を基に、注文客注文表リスト及び店員注文表リストを生成してメモリ50に格納する(図7参照)。図7は、注文客注文表リスト又は店員注文表リストの生成手順の一例を示す説明図である。
図7に示すように、音声認識部24aにおける音声認識結果の第1候補が「One CheeseBurger medium fries」であった場合、注文表変換部24bは、「One」に対応するタグ「Qty」、「CheeseBurger」に対応するタグ「Menu」、「medium」に対応するタグ「Size」、「fries」に対応するタグ「Menu」を音声認識用辞書26から抽出し、図7に示す注文客注文表リスト又は店員注文表リストを生成してメモリ50に格納する。注文客注文表リストとは、注文客の発した音声の音声認識結果を基に生成され、項目(タグ)毎に対応付けられた注文内容の一覧を示す。同様に、店員注文表リストとは、店員の発した音声の音声認識結果を基に生成され、項目(タグ)毎に対応付けられた注文内容の一覧を示す。
なお、注文表変換部24bは、例えば「fries」に対応するタグ「Qty」が欠落していた場合又は音声認識できなかった場合には、所定のデフォルト値Df1(例えば「1」)を付与する。所定のデフォルト値は、項目(タグ)毎に予め決められている。
音声認識用辞書26は、音声認識部24aにおける音声認識処理の際に用いられる辞書データが格納されており、例えば音声認識処理の対象となる用語(単語)とドライブスルーの注文内容の項目であるタグ(例えば、メニュー(Menu)、サイズ(Size)、数量(Qty:Quantity)、価格(Price))とが予め対応付けられて格納されている(図5参照)。図5は、音声認識用辞書26に格納される用語と各用語のタグとの関係の一例を示す説明図である。
図5に示すように、例えばタグがメニュー(Menu)の用語には「CheeseBurger」、「Fries」、「HotCoffee」等の注文の対象となる飲食物の名称が対応付けられて格納され、タグが数量(Qty)の用語には「0」、「1」、「2」、「3」、…、「7」、「8」、「9」、「one」、「two」等の数量を示す用語が対応付けられて格納され、タグがサイズ(size)の用語には「S」、「R」、「M」、「L」等のサイズ(ボリューム)が対応付けられて格納される。
注文表生成部28は、メモリ50に格納されている注文客注文表リスト,店員注文表リストを用いて、注文客の発した注文内容に関する注文データの表示画面(以下、「注文入力画面」という)を生成してディスプレイ装置40に表示させる(図2参照)。図2は、POSシステム20により生成される注文入力画面WD1の一例を示す図である。図2に示すように、注文入力画面WD1には、注文表表示エリアWD2と、注文入力操作表示エリアWD3とが含まれる。
注文表表示エリアWD2には、注文客注文表リスト又は店員注文表リストに含まれる音声認識結果の単語に対応するタグ(例えば「Menu」、「Size」、「Qty」、「Price」)の表示エリアAR1と、注文客注文表リスト又は店員注文表リストのいずれかに対応した注文内容の表示エリアAR2とが含まれる。また、注文表表示エリアWD2には、注文内容の合計を示す精算額(例えば「$5.79」)を示す表示エリアと精算を指示するためのTotalボタンBt1と、注文客の発した音声の音声認識結果Rg1(注文客音声認識結果リストの第1候補)と店員の発した音声の音声認識結果Rg2(店員音声認識結果リストの第1候補)とを含む音声認識結果表示エリアAR3が含まれる。
一方、注文入力操作表示エリアWD3には、数字キー列ボタンKy1と、サイズ入力キーKy2と、オプションメニュー入力キーKy3と、メニュー一覧&入力キーKy4とが表示される。数字キー列ボタンKy1は、例えば押下された際にテンキーをソフトウェアキーボードとして表示させるボタンである。サイズ入力キーKy2は、例えば押下された際にメニューのサイズ(例えばSサイズ、Rサイズ、Mサイズ、Lサイズ)を選択可能なプルダウン形式のサイズの種類の一覧を表示させるボタンである。オプションメニュー入力キーKy3は、例えば押下された際にオプションメニューの一覧を表示させるためのボタンである。メニュー一覧&入力キーKy4は、例えば押下された際に全てのメニューの一覧を表示させるためのボタンである。
なお、音声認識結果表示エリアAR3の注文客音声履歴ボタンBt2及び店員音声履歴ボタンBt3の詳細については、図12及び図13を参照して後述する。
操作部の一例としての入力装置30は、店員の入力操作の内容をPOSシステム20に出力するためのユーザインターフェース(UI:User Interface)であり、例えばマウス、キーボード等のポインティングデバイスである。また、入力装置30は、例えばディスプレイ装置40の画面に対応して配置され、店員の指又はスタイラスペンによって操作が可能なタッチパネル又はタッチパッドを用いて構成されても良い。
表示部としてのディスプレイ装置40は、例えばLCD(Liquid Crystal Display)又は有機EL(Electroluminescence)を用いて構成され、POSシステム20の制御の下で、注文表生成部28により生成された注文入力画面WD1を表示する。
記憶部としてのメモリ38は、例えばRAM(Random Access Memory)を用いて構成され、POSシステム20の各部の動作時のワークメモリとして機能し、更に、POSシステム20の各部の動作時に必要なデータを記憶する。
次に、本実施形態の注文入力システム100のメイン処理の動作手順について、図3を参照して説明する。図3は、本実施形態の注文入力システム100のメイン処理の動作手順の一例を説明するフローチャートである。
図3において、注文入力システム100では、先ず初期化処理が行われる(S1)。ステップS1の初期化処理の詳細については、図4を参照して後述する。ステップS1の後、図2に示すTotalボタンBt2が店員の操作によってオフされない場合(即ち、TotalボタンBt2が押下された場合)には(S2、NO)、図3に示す注文入力システム100の処理は終了する。
一方、図2に示すTotalボタンBt2が店員の操作によってオフされた場合(即ち、TotalボタンBt2が押下されない場合)には(S2、YES)、音声注文入力処理部24は、注文客音声認識モードがオンであるか否かを判定する(S3)。注文客音声認識モードとは、音声注文入力処理部24が注文客の発した音声に対して音声認識処理を行うか否かを示すモードであり、注文客音声認識モードを示す情報は例えばメモリ50に一時的に格納されている。注文客音声認識モードがオンであると判定されなかった場合には(S3、NO)、図3に示す注文入力システム100の処理はステップS6に進む。
一方、注文客音声認識モードがオンであると判定された場合には(S3、YES)、通信部22は、注文客の発した音声(注文客発話音声)のデータを通話システム10から受信して音声認識部24aに出力する(S4)。音声認識部24aは、注文客発話音声のデータを音声認識処理し、注文客発話音声のデータに対する所定候補数(例えば3つ)の音声認識結果と各音声認識結果の単語に対する所定候補数(例えば3つ)の音声認識結果とを、注文客音声認識結果リストとしてメモリ50に格納する(S5)。
ステップS5の後、音声注文入力処理部24は、店員音声認識モードがオンであるか否かを判定する(S6)。店員音声認識モードとは、音声注文入力処理部24が店員の発した音声に対して音声認識処理を行うか否かを示すモードであり、店員音声認識モードを示す情報は例えばメモリ50に一時的に格納されている。店員音声認識モードがオンであると判定されなかった場合には(S6、NO)、図3に示す注文入力システム100の処理はステップS9に進む。
一方、店員音声認識モードがオンであると判定された場合には(S6、YES)、通信部22は、店員の発した音声(店員発話音声)のデータを通話システム10から受信して音声認識部24aに出力する(S7)。音声認識部24aは、店員発話音声のデータを音声認識処理し、店員発話音声のデータに対する所定候補数(例えば3つ)の音声認識結果と各音声認識結果の単語に対する所定候補数(例えば3つ)の音声認識結果とを、店員音声認識結果リストとしてメモリ50に格納する(S8)。
ステップS8の後又はステップS6において店員音声認識モードがオンであると判定されなかった場合、音声注文入力処理部24は、注文表変換処理を行う(S9)。ステップS9の注文表変換処理の詳細については、図6を参照して後述する。
ステップS9の後、音声注文入力処理部24は、注文表修正処理を行う(S10)。ステップS10の注文表修正処理の詳細については、図9を参照して後述する。
ステップS10の後、音声注文入力処理部24は、音声認識結果表示処理を行う(S11)。ステップS11の音声認識結果表示処理の詳細については、図11を参照して後述する。ステップS11の後、図3に示す注文入力システム100の処理はステップS2に戻る。
次に、本実施形態の注文入力システム100における初期化処理の詳細について、図4を参照して説明する。図4は、本実施形態の注文入力システム100の初期化処理の動作手順の一例を説明するフローチャートである。
図4において、店舗のメニュー表の内容の変更があると(S1−1、YES)、音声注文入力処理部24は、例えば店員の入力装置30を用いた操作によって入力された変更後のメニュー表の内容を項目毎に音声認識用辞書26に反映して登録する(S1−2)。また、音声注文入力処理部24は、例えば店員の入力装置30を用いた操作によって、ステップS1−2に示す操作によって追加又は修正の対象となった各単語に新たなタグの情報を付与する(S1−3、図5参照)。ステップS1−3の後又はステップS1−1においてメニュー表の内容に変更がない場合には、図4に示す初期化処理は終了する。
次に、本実施形態の注文入力システム100における注文表変換処理の詳細について、図6を参照して説明する。図6は、本実施形態の注文入力システム100の注文表変換処理の動作手順の一例を説明するフローチャートである。
図6において、注文表変換部24bは、メモリ50に格納された注文客音声認識モードを示す情報を参照することで、注文客音声認識モードがオンであるか否かを判定する(S9−1)。注文表変換部24bは、注文客音声認識モードがオンであると判定した場合には(S9−1、YES)、注文客音声認識結果リストから注文客発話音声に対する音声認識結果の第1候補を取り出し、第1候補に含まれる各単語のタグの情報を基に、注文客注文表リストを生成する(S9−2、図7参照)。
一方、注文客音声認識モードがオンではないと判定された場合には(S9−1、NO)、図6に示す注文表変換処理はステップS9−3に進む。
ステップS9−2の後、注文表変換部24bは、メモリ50に格納された店員音声認識モードを示す情報を参照することで、店員音声認識モードがオンであるか否かを判定する(S9−3)。注文表変換部24bは、店員音声認識モードがオンであると判定した場合には(S9−3、YES)、店員音声認識結果リストから店員発話音声に対する音声認識結果の第1候補を取り出し、第1候補に含まれる各単語のタグの情報を基に、店員注文表リストを生成する(S9−4、図7参照)。
一方、店員音声認識モードがオンではないと判定された場合には(S9−3、NO)、図6に示す注文表変換処理はステップS9−7に進む。
ステップS9−4の後、注文表変換部24bは、ステップS9−2において注文客注文表リストが生成されている場合であって、注文客注文表リストとステップS9−4において生成された店員注文表リストとを照合した結果、不整合箇所がある場合には、不整合箇所を強調して表示する(S9−5、図14参照)。なお、不整合箇所が無い場合又はステップS9−1において注文客音声認識モードがオンではないと判定された場合には、注文表変換部24bは、ステップS9−5の処理を省略する。
図14は、注文客注文リストと店員注文リストとの間に不整合があった項目を強調表示する例を示す説明図である。図14では注文客発話音声に対する音声認識結果の第1候補が「Burger medium fries and HotCoffee please」であって、店員発話音声に対する音声認識結果の第1候補が「CheeseBurger medium fries and HotCoffee please」であり、ステップS9−6において説明するように、注文客発話音声に対する音声認識結果の第1候補よりも店員発話音声に対する音声認識結果の第1候補が優先されて店員注文表リストの内容が注文内容の表示エリアAR2に表示される。
注文表変換部24bは、図14に示すように、注文客注文表リストと店員注文表リストとの間に不整合箇所がある場合には、不整合箇所Erp1を強調して表示する。例えば、注文表変換部24bは、不整合箇所Erp1を所定色で塗ったように表示したり、ブリンク(点滅)して表示させたりしても良い。
ステップS9−5の後、注文表変換部24bは、ステップS9−4において生成された店員注文表リストの内容を、注文入力画面WD1の注文表表示エリアWD2の注文内容の表示エリアAR2に表示させる(S9−6)。特に、注文表変換部24bは、ステップS9−2において注文客注文表リストが生成されていた場合でも、注文客注文表リストよりも店員注文表リストを優先して、店員注文表リストの内容を注文内容の表示エリアAR2に表示させる。
一方、店員音声認識モードがオンではないと判定された場合には(S9−3、NO)、注文表変換部24bは、ステップS9−2において注文客注文表リストが生成されていれば、注文客注文表リストの内容を、注文入力画面WD1の注文表表示エリアWD2の注文内容の表示エリアAR2に表示させる(S9−7)。なお、ステップS9−2において注文客注文表リストが生成されていない場合には、注文表変換部24bは、注文客注文表リスト及び店員注文表リストのデータが欠如した空の内容を、注文入力画面WD1の注文表表示エリアWD2の注文内容の表示エリアAR2に表示させる(S9−7)。
ステップS9−6又はステップS9−7の後、図9に示す注文表変換処理は終了する。
次に、本実施形態の注文入力システム100における注文表修正処理の詳細について、図8(A)〜(C)及び図9を参照して説明する。図8(A)〜(C)は、注文客注文表リスト又は店員注文表リストの項目毎の注文内容の修正の一例を示す説明図である。図9は、本実施形態の注文入力システム100の注文表修正処理の動作手順の一例を説明するフローチャートである。
図9において、注文表変換部24bは、店員の入力装置30を用いた操作によって、注文表表示エリアWD2の注文内容の表示エリアAR2のいずれかの項目の音声認識結果がタッチ(クリックでも可。以下同様。)されたか否かを判定する(S10−1)。注文表変換部24bは、注文表表示エリアWD2の注文内容の表示エリアAR2のいずれかの項目の音声認識結果がタッチされたと判定した場合には(S10−1、YES)、クリックによって選択された音声認識結果に対応する複数の選択候補を、選択された音声認識結果の周囲にリストのように表示させる(S10−2、図8(A)〜(C)参照)。
例えば図8(A)に示すように、注文内容の表示エリアAR2の単語「CheeseBurger」が店員の指FGによりタッチされた場合には、注文表変換部24bは、タグの情報が「Menu」である単語「CheeseBurger」に対応する複数の選択候補として、タグの情報が「Menu」である単語「CheeseBurger」、単語「Hamburger」、単語「Cheese」を、タッチされた単語「CheeseBurger」の周囲にリストのように表示させる。
また、例えば図8(B)に示すように、注文内容の表示エリアAR2の単語「?」が店員の指FGによりタッチされた場合には、注文表変換部24bは、タグの情報が「Qty」である単語「?」に対応する複数の選択候補として、タグの情報が「Qty」である単語「1」、単語「2」、単語「3」、単語「4」、単語「5」を、タッチされた単語「?」の周囲にリストのように表示させる。
また、例えば図8(C)に示すように、注文内容の表示エリアAR2の単語「M」が店員の指FGによりタッチされた場合には、注文表変換部24bは、タグの情報が「Size」である単語「M」に対応する複数の選択候補として、タグの情報が「Size」である単語「S」、単語「R」、単語「M」、単語「L」を、タッチされた単語「M」の周囲にリストのように表示させる。
ステップS10−2の後、注文表変換部24bは、ステップS10−2においてプルダウン形式で表示された複数の選択候補の中からいずれかの単語が指定された場合に、ステップS10−1で選択された単語を、プルダウン形式で表示された選択候補の中で指定された単語に置き換える(S10−3)。
次に、本実施形態の注文入力システム100における音声認識結果表示処理について、図10及び図11を参照して説明する。図10は、注文客音声履歴の選択操作に応じた注文客の注文に関する音声の音声認識結果の他の候補の表示例を示す説明図である。図11は、本実施形態の注文入力システム100の音声認識結果表示処理の動作手順の一例を説明するフローチャートである。図11の説明の前提として、注文客音声認識結果リストの第1候補(音声認識結果Rg1)が注文客音声履歴に表示され、店員音声認識結果リストの第1候補(音声認識結果Rg2)が店員音声履歴に表示されているとする。
図11において、注文客音声履歴の音声認識結果Rg1の表示行がクリックされた場合には(S11−1、YES)、注文表変換部24bは、音声認識結果Rg1の他の所定候補数(例えば複数)の音声認識結果Rg1aを、クリックされた音声認識結果Rg1の周囲にプルダウン形式で表示させる(S11−2、図10参照)。
例えば図10では、注文表変換部24bは、「CheeseBurger medium fries and Hot Coffee please」に対する所定候補数の他の音声認識結果Rg1aとして、「CheeseBurger medium fries HotCoffee please」と「Hamberger medium fries and HotCoffee」とを、クリックされた「CheeseBurger medium fries and HotCoffee please」の周囲に表示させる。
ステップS11−2の後、店員音声履歴の音声認識結果Rg2の表示行がクリックされた場合には(S11−3、YES)、注文表変換部24bは、音声認識結果Rg2の他の所定候補数(例えば複数)の音声認識結果を、クリックされた音声認識結果Rg2の周囲にプルダウン形式で表示させる(S11−4)。
ステップS11−1において注文客音声履歴の音声認識結果Rg1の表示行、ステップS11−3において店員音声履歴の音声認識結果Rg2の表示行がクリックされない場合、又はステップS11−4の後、図11に示す音声認識結果表示処理は終了する。
次に、本実施形態の注文入力システム100における注文客音声認識モード、店員音声認識モードのオン、オフの切り替えについて、図12及び図13を参照して説明する。図12は、注文客音声認識モード、店員音声認識モードのオン、オフの切り替えを示す説明図である。図13は、本実施形態の注文入力システム100の注文客音声認識モード、店員音声認識モードのオン、オフの切り替えを説明するフローチャートである。
図13において、図12に示す注文客音声履歴ボタンBt2が1回クリック(タッチも可。以下同様。)された場合には(S12−1、YES)、音声注文入力処理部24は、注文客音声認識モードがオンであればオフに切り替え、注文客音声認識モードがオフであればオンに切り替える(S12−2)。
ステップS12−2の後、図12に示す店員音声履歴ボタンBt3が1回クリックされた場合には(S12−3、YES)、音声注文入力処理部24は、店員音声認識モードがオンであればオフに切り替え、店員音声認識モードがオフであればオンに切り替える(S12−4)。
言い換えると、図12に示すように、例えば店員の指FGにより注文客音声履歴ボタンBt2又は店員音声履歴ボタンBt3が押下される度に、トグルスイッチのように、注文客音声認識モード又は店員音声認識モードがオンとオフとを交互に切り替えられる。
なお、注文表表示画面WD2に、注文客音声認識モード又は店員音声認識モードの停止、再開のボタンを表示させ、音声注文入力処理部24は、各ボタンの押下回数に応じてオンオフ(例えば奇数回ならオン、偶数回ならオフ)を切り替えても良い。また、注文表表示画面WD2への操作ではなく、店員が装着するヘッドセットHdsに、注文客音声認識モード又は店員音声認識モードの停止、再開のボタンを設けて、店員に簡易に切り替えさせても良い。
以上により、本実施形態の注文入力システム100は、注文客の注文内容に関する音声と、注文客の注文内容を確認するための店員の注文内容に関する音声(復唱音声)とを音声認識し、注文客の注文内容に関する音声の音声認識結果Rg1と、店員の注文内容に関する音声の音声認識結果Rg2とを含む、注文客の注文内容に関する注文入力画面WD1(注文データの表示画面)をディスプレイ装置40に表示させる。
これにより、注文入力システム100は、ドライブスルー等の騒がしい環境下における注文客の注文において、注文客が注文時に発した音声と店員が注文客の注文時に発した音声を復唱した音声との2系統の音声を用いて注文者の注文内容に関する注文入力画面WD1をディスプレイ装置40において表示させるので、注文データの内容が間違える頻度を軽減することができ、更に、店員における注文内容の入力を効率化させることができ、業務に不慣れな店員であっても簡易に注文内容の入力を確認させることができる。
また、注文入力システム100は、注文客の音声認識結果Rg1と店員の音声認識結果Rg2とのうち注文客の音声認識結果Rg1より店員の音声認識結果Rg2を優先して注文客の注文内容に関する注文入力画面WD1を生成するので、注文客の発した音声の内容を店員が復唱した音声の方が注文客の発した音声よりも音声認識結果の確度が高い点を考慮して、注文入力画面WD1の内容が間違える頻度を軽減することができる。
また、注文入力システム100は、ディスプレイ装置40に表示された注文入力画面WD1に対する所定の選択操作に応じて、注文客又は店員の注文内容に関する音声の音声認識処理を停止又は再開するので、注文客又は店員の注文内容に関する音声の音声認識処理の停止又は再開を簡易に切り替えることができるので、例えば店員が復唱する際に注文内容以外の音声を音声認識させないように店員の発する音声の音声認識を適切に止めたり再開したりすることができる。
また、注文入力システム100は、注文客の音声認識結果Rg1と店員の音声認識結果Rg2とが整合しない場合に、注文客の注文内容に関する注文入力画面WD1において不整合の箇所を強調して表示するので、注文客の注文内容に関する注文入力画面WD1の不整合箇所を店員に対して分かり易く示すことができ、店員に対して正しい注文内容に修正させることができる。
また、注文入力システム100は、ディスプレイ装置40に表示された注文入力画面WD1に対する所定の選択操作に応じて、注文客の音声認識結果Rg1又は店員の音声認識結果Rg2の他の複数の音声認識結果の候補を、注文客の音声認識結果Rg1又は店員の音声認識結果Rg2の周囲に表示させるので、注文客の音声認識結果Rg1又は店員の音声認識結果Rg2が間違っていた場合でも、注文客の音声認識結果Rg1又は店員の音声認識結果Rg2を簡易に修正することができ、早口な注文客が注文内容を発した場合でも多くの注文内容が言われた場合でも、店員にとっては例えばメモ代わりや誤認識され易い用語(単語)の確認等に適宜参照することができるので店員の業務における利便性を向上することができる。
また、注文入力システム100は、ディスプレイ装置40に表示された注文入力画面WD1における所定の項目毎の注文内容に対する所定の選択操作に応じて、項目毎の注文内容の注文客の音声認識結果(例えば単語。以下同様。)又は店員の音声認識結果(例えば単語。以下同様。)の他の複数の選択候補を、注文客の音声認識結果又は店員の音声認識結果の周囲に表示させるので、注文入力画面WD1における項目毎の注文内容の注文客の音声認識結果又は店員の音声認識結果を他の複数の選択候補の中から簡易に選択して修正することができる。
最後に、本発明に係る注文入力システム及び注文入力方法の構成、作用、効果について説明する。
本発明の一実施形態は、第1の話者の注文内容に関する音声を収音する第1収音部と、前記第1収音部により収音された前記第1の話者の注文内容を確認するための第2の話者の前記注文内容に関する音声を収音する第2収音部と、前記第1収音部により収音された前記第1の話者の注文内容に関する音声と、前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声とを音声認識する音声認識部と、前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を表示部に表示させる注文データ出力部と、を備える、注文入力システムである。
この構成によれば、注文入力システムは、第1の話者の注文内容に関する音声と、第1の話者の注文内容を確認するための第2の話者の注文内容に関する音声とを音声認識し、第1の話者の注文内容に関する音声の第1音声認識結果と、第2の話者の注文内容に関する音声の第2音声認識結果とを含む、第1の話者の注文内容に関する注文データの表示画面を表示部に表示させる。
これにより、注文入力システムは、ドライブスルー等の騒がしい環境下における注文客の注文において、注文客が注文時に発した音声と店員が注文客の注文時に発した音声を復唱した音声との2系統の音声を用いて注文者の注文内容に関する注文データの表示画面を表示部(例えばディスプレイ装置)において表示させるので、注文データの内容が間違える頻度を軽減することができ、更に、店員における注文内容の入力を効率化させることができ、業務に不慣れな店員であっても簡易に注文内容の入力を確認させることができる。
また、本発明の一実施形態は、前記注文データ出力部は、前記第1音声認識結果と前記第2音声認識結果とのうち、前記第1音声認識結果より前記第2音声認識結果を優先して、前記第1の話者の注文内容に関する注文データを生成する、注文入力システムである。
この構成によれば、注文入力システムは、第1音声認識結果と第2音声認識結果とのうち第1音声認識結果より第2音声認識結果を優先して第1の話者の注文内容に関する注文データを生成するので、注文客の発した音声の内容を店員が復唱した音声の方が注文客の発した音声よりも音声認識結果の確度が高い点を考慮して、注文データの内容が間違える頻度を軽減することができる。
また、本発明の一実施形態は、前記音声認識部は、前記表示部に表示された前記注文データの表示画面に対する所定の選択操作に応じて、前記第1の話者又は前記第2の話者の注文内容に関する音声の音声認識処理を停止又は再開する、注文入力システムである。
この構成によれば、注文入力システムは、表示部に表示された注文データの表示画面に対する所定の選択操作に応じて、第1の話者又は第2の話者の注文内容に関する音声の音声認識処理を停止又は再開するので、第1の話者又は第2の話者の注文内容に関する音声の音声認識処理の停止又は再開を簡易に切り替えることができるので、例えば店員が復唱する際に注文内容以外の音声を音声認識させないように店員の発する音声の音声認識を適切に止めたり再開したりすることができる。
また、本発明の一実施形態は、前記注文データ出力部は、前記第1音声認識結果と前記第2音声認識結果とが整合しない場合に、前記第1の話者の注文内容に関する注文データの表示画面において不整合箇所を強調表示する、注文入力システムである。
この構成によれば、注文入力システムは、第1音声認識結果と第2音声認識結果とが整合しない場合に、第1の話者の注文内容に関する注文データの表示画面において不整合の箇所を強調して表示するので、第1の話者の注文内容に関する注文データの表示画面の不整合箇所を店員に対して分かり易く示すことができ、店員に対して正しい注文内容に修正させることができる。
また、本発明の一実施形態は、前記注文データ出力部は、前記表示部に表示された前記注文データの表示画面に対する所定の選択操作に応じて、前記第1音声認識結果又は前記第2音声認識結果の他の複数の音声認識結果候補を、前記第1音声認識結果又は前記第2音声認識結果の周囲に表示させる、注文入力システムである。
この構成によれば、注文入力システムは、表示部に表示された注文データの表示画面に対する所定の選択操作に応じて、第1音声認識結果又は第2音声認識結果の他の複数の音声認識結果候補を、第1音声認識結果又は第2音声認識結果の周囲に表示させるので、第1音声認識結果又は第2音声認識結果が間違っていた場合でも、第1音声認識結果又は第2音声認識結果を簡易に修正することができ、早口な注文客が注文内容を発した場合でも多くの注文内容が言われた場合でも、店員にとっては例えばメモ代わりや誤認識され易い用語(単語)の確認等に適宜参照することができるので店員の業務における利便性を向上することができる。
また、本発明の一実施形態は、前記注文データ出力部は、前記表示部に表示された前記注文データの表示画面における所定の項目毎の注文内容に対する所定の選択操作に応じて、前記項目毎の注文内容の前記第1音声認識結果又は前記第2音声認識結果の他の複数の選択候補を、前記第1音声認識結果又は前記第2音声認識結果の周囲に表示させる、注文入力システムである。
この構成によれば、注文入力システムは、表示部に表示された注文データの表示画面における所定の項目毎の注文内容に対する所定の選択操作に応じて、項目毎の注文内容の第1音声認識結果又は第2音声認識結果の他の複数の選択候補を、第1音声認識結果又は第2音声認識結果の周囲に表示させるので、注文データの表示画面における項目毎の注文内容の第1音声認識結果又は第2音声認識結果を他の複数の選択候補の中から簡易に選択して修正することができる。
また、本発明の一実施形態は、第1収音部と第2収音部とを含む注文入力システムにおける注文入力方法であって、前記第1収音部において、第1の話者の注文内容に関する音声を収音するステップと、前記第2収音部において、前記第1収音部により収音された前記第1の話者の注文内容を確認するための第2の話者の前記注文内容に関する音声を収音するステップと、前記第1収音部により収音された前記第1の話者の注文内容に関する音声と、前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声とを音声認識するステップと、前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を表示部に表示させるステップと、を有する、注文入力方法である。
この方法によれば、注文入力システムは、第1の話者の注文内容に関する音声と、第1の話者の注文内容を確認するための第2の話者の注文内容に関する音声とを音声認識し、第1の話者の注文内容に関する音声の第1音声認識結果と、第2の話者の注文内容に関する音声の第2音声認識結果とを含む、第1の話者の注文内容に関する注文データの表示画面を表示部に表示させる。
これにより、注文入力システムは、ドライブスルー等の騒がしい環境下における注文客の注文において、注文客が注文時に発した音声と店員が注文客の注文時に発した音声を復唱した音声との2系統の音声を用いて注文者の注文内容に関する注文データの表示画面を表示部(例えばディスプレイ装置)において表示させるので、注文データの内容が間違える頻度を軽減することができ、更に、店員における注文内容の入力を効率化させることができる。
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
本発明は、ドライブスルー等の騒がしい環境下における注文において、注文客の注文時に発した音声と店員の注文客が注文時に発した音声を復唱した音声との2系統の音声を用いて、注文内容の入力を効率化させる注文入力システム及び注文入力方法として有用である。
10、510 通話システム
20、520 POSシステム
22 通信部
24 音声注文入力処理部
24a 音声認識部
24b 注文表変換部
26 音声認識用辞書
28、528 注文表生成部
30、530 入力装置
40、540 ディスプレイ装置
50、550 メモリ
Mc1 注文客用マイク
Mc2 店員用マイク
Sp1 注文客用スピーカ
Sp2 店員用スピーカ

Claims (7)

  1. 屋外に設置され、第1の話者の音声を収音する第1収音部と、
    屋内に設置され、前記第1収音部により収音された前記第1の話者の音声を出力する音声出力部と、
    前記屋内に設置され、第2の話者の音声を収音する第2収音部と、
    前記第1収音部により収音された前記第1の話者の音声と、前記第2収音部により収音された前記第2の話者の音声とを音声認識する音声認識部と、
    前記第1収音部により収音された前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記音声出力部による音声出力に基づいて前記第2の話者により発話され、かつ前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を、前記屋内に設置された表示部に表示させる注文データ出力部と、を備える、
    注文入力システム。
  2. 請求項1に記載の注文入力システムであって、
    前記注文データ出力部は、
    前記第1音声認識結果と前記第2音声認識結果とのうち、前記第1音声認識結果より前記第2音声認識結果を優先して、前記第1の話者の注文内容に関する注文データを生成する、
    注文入力システム。
  3. 請求項1に記載の注文入力システムであって、
    前記音声認識部は、
    前記表示部に表示された前記注文データの表示画面に対する所定の選択操作に応じて、前記第1の話者又は前記第2の話者の注文内容に関する音声の音声認識処理を停止又は再開する、
    注文入力システム。
  4. 請求項1に記載の注文入力システムであって、
    前記注文データ出力部は、
    前記第1音声認識結果と前記第2音声認識結果とが整合しない場合に、前記第1の話者の注文内容に関する注文データの表示画面において不整合箇所を強調表示する、
    注文入力システム。
  5. 請求項1に記載の注文入力システムであって、
    前記注文データ出力部は、
    前記表示部に表示された前記注文データの表示画面に対する所定の選択操作に応じて、前記第1音声認識結果又は前記第2音声認識結果の他の複数の音声認識結果候補を、前記第1音声認識結果又は前記第2音声認識結果の周囲に表示させる、
    注文入力システム。
  6. 請求項1から5のうちいずれか一項に記載の注文入力システムであって、
    前記注文データ出力部は、
    前記表示部に表示された前記注文データの表示画面における所定の項目毎の注文内容に対する所定の選択操作に応じて、前記項目毎の注文内容の前記第1音声認識結果又は前記第2音声認識結果の他の複数の選択候補を、前記第1音声認識結果又は前記第2音声認識結果の周囲に表示させる、
    注文入力システム。
  7. 第1収音部と第2収音部とを含む注文入力システムにおける注文入力方法であって、
    屋外に設置された前記第1収音部において、第1の話者の音声を収音するステップと、
    屋内に設置された音声出力部において、前記第1収音部により収音された前記第1の話者の音声を出力するステップと、
    前記屋内に設置され、前記第2収音部において、第2の話者の音声を収音するステップと、
    前記第1収音部により収音された前記第1の話者の音声と、前記第2収音部により収音された前記第2の話者の音声とを音声認識するステップと、
    前記第1収音部により収音された前記第1の話者の注文内容に関する音声の第1音声認識結果と、前記音声出力部による音声出力に基づいて前記第2の話者により発話され、かつ前記第2収音部により収音された前記第2の話者の前記注文内容に関する音声の第2音声認識結果とを含む、前記第1の話者の注文内容に関する注文データの表示画面を、前記屋内に設置された表示部に表示させるステップと、を有する、
    注文入力方法。
JP2014145374A 2014-07-15 2014-07-15 注文入力システム及び注文入力方法 Active JP6191919B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014145374A JP6191919B2 (ja) 2014-07-15 2014-07-15 注文入力システム及び注文入力方法
US14/798,731 US9665904B2 (en) 2014-07-15 2015-07-14 Order entry system and order entry method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014145374A JP6191919B2 (ja) 2014-07-15 2014-07-15 注文入力システム及び注文入力方法

Publications (2)

Publication Number Publication Date
JP2016021196A JP2016021196A (ja) 2016-02-04
JP6191919B2 true JP6191919B2 (ja) 2017-09-06

Family

ID=55075082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014145374A Active JP6191919B2 (ja) 2014-07-15 2014-07-15 注文入力システム及び注文入力方法

Country Status (2)

Country Link
US (1) US9665904B2 (ja)
JP (1) JP6191919B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2928057C (en) 2015-04-22 2022-05-24 Staples, Inc. Intelligent item tracking and expedited item reordering by stakeholders
US20170293905A1 (en) * 2016-04-08 2017-10-12 Restaurant Technology Inc. Voice recognized data analysis and corrective action systems and methods
JP2018010146A (ja) * 2016-07-13 2018-01-18 公益財団法人鉄道総合技術研究所 伝達情報即時照合装置、伝達情報即時照合システム、伝達情報即時照合方法及びプログラム
JP6709132B2 (ja) * 2016-09-05 2020-06-10 株式会社野村総合研究所 音声注文受付システム
CN108985971A (zh) * 2017-05-31 2018-12-11 贺州思通信息技术有限公司 一种帮助残疾人就餐的餐厅系统
US11315174B2 (en) 2018-05-29 2022-04-26 Staples, Inc. Restocking hub with interchangeable buttons mapped to item identifiers
JP7236669B2 (ja) * 2018-07-23 2023-03-10 パナソニックIpマネジメント株式会社 音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03104295U (ja) * 1990-02-07 1991-10-29
US5758322A (en) * 1994-12-09 1998-05-26 International Voice Register, Inc. Method and apparatus for conducting point-of-sale transactions using voice recognition
US6003015A (en) * 1996-02-28 1999-12-14 Hm Electronics, Inc. Order confirmation system and method of using same
US20030018531A1 (en) * 2000-09-08 2003-01-23 Mahaffy Kevin E. Point-of-sale commercial transaction processing system using artificial intelligence assisted by human intervention
JP4202640B2 (ja) * 2001-12-25 2008-12-24 株式会社東芝 短距離無線通信用ヘッドセット、これを用いたコミュニケーションシステム、および短距離無線通信における音響処理方法
US6996460B1 (en) * 2002-10-03 2006-02-07 Advanced Interfaces, Inc. Method and apparatus for providing virtual touch interaction in the drive-thru
EP1471502A1 (en) * 2003-04-25 2004-10-27 Sony International (Europe) GmbH Method for correcting a text produced by speech recognition
JP3945447B2 (ja) * 2003-04-25 2007-07-18 日本電気株式会社 オーダリングシステム
US20080255837A1 (en) * 2004-11-30 2008-10-16 Jonathan Kahn Method for locating an audio segment within an audio file
JP2008197826A (ja) 2007-02-09 2008-08-28 Shinden Engineering Co Ltd 注文データ管理装置、注文データ管理方法
JP2011113442A (ja) * 2009-11-30 2011-06-09 Seiko Epson Corp 会計処理判定装置、会計処理判定装置の制御方法およびプログラム
US8472727B2 (en) * 2011-01-07 2013-06-25 Yuval Gronau Document comparison and analysis for improved OCR

Also Published As

Publication number Publication date
US20160019888A1 (en) 2016-01-21
JP2016021196A (ja) 2016-02-04
US9665904B2 (en) 2017-05-30

Similar Documents

Publication Publication Date Title
JP6191919B2 (ja) 注文入力システム及び注文入力方法
US10635751B1 (en) Training systems for pseudo labeling natural language
US20190222540A1 (en) Automated chat assistant systems for providing interactive data using natural language processing
US10775964B2 (en) Selection and organization based on selection of X-Y position
KR102511094B1 (ko) 디지털 이미지 캡처 세션 및 메타데이터 연관
US20160292801A1 (en) System and Method for Creating, Managing, and Searching Real Estate Listings
US10832666B2 (en) Advanced user interface for voice search and results display
JP4928592B2 (ja) 画像処理装置及びプログラム
EP2955678A1 (en) Dynamically providing guidance during customer interactions
JP6587576B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2011081737A (ja) 調理補助端末及びプログラム
US11308432B2 (en) Augmented reality virtual order assistant
JP2017117115A (ja) コンテンツ制御プログラム、コンテンツ制御方法、コンテンツ制御装置、及びコンテンツ表示装置
JP2011048440A (ja) 調理補助端末及びプログラム
US20190108601A1 (en) Systems, methods, and devices for rapid reordering
WO2016024622A1 (ja) 情報処理装置、情報処理方法及びプログラム
KR20140128514A (ko) 어플리케이션을 이용한 상품 주문 방법 및 장치
US11042834B2 (en) Voice-enabled substitutions with customer notification
CN113168354B (zh) 用于从一个或多个计算机应用中选择并提供可用动作给用户的系统和方法
US20230186247A1 (en) Method and system for facilitating convergence
JP6862331B2 (ja) 思考・議論支援システムおよび思考・議論支援装置
KR101852761B1 (ko) 임대료 정보 디스플레이 방법 및 그 장치
KR20160075152A (ko) 쇼핑 서비스 제공 시스템 및 쇼핑 서비스 제공 방법
US10169554B2 (en) Work support system, work support method and computer-readable recording medium
KR20180040540A (ko) 주문 결재가 가능한 진동벨

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170727

R151 Written notification of patent or utility model registration

Ref document number: 6191919

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151