JP3964724B2 - Voice input device and method, and voice input program - Google Patents
Voice input device and method, and voice input program Download PDFInfo
- Publication number
- JP3964724B2 JP3964724B2 JP2002119409A JP2002119409A JP3964724B2 JP 3964724 B2 JP3964724 B2 JP 3964724B2 JP 2002119409 A JP2002119409 A JP 2002119409A JP 2002119409 A JP2002119409 A JP 2002119409A JP 3964724 B2 JP3964724 B2 JP 3964724B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- item
- word
- voice
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、注文内容を受付けて処理する情報処理装置、例えばガソリンスタンド給油システムの伝票発行装置、航空券,乗車券などの券発行装置、レストラン,ファーストフード店でのオーダ登録装置等に対する注文内容の入力デバイスとして用いられる音声入力装置及びその方法並びに音声入力プログラムに関する。
【0002】
【従来の技術】
例えばガソリンスタンドにおいて、店員は、客が来店すると、先ず給油するガソリンの種類(レギュラーガソリン,ハイオクガソリン,軽油等)と、給油量(量単位又は金額単位)と、決済方法(現金払い,クレジット払い等)を客に尋ねる。これに対して、例えば客が「レギュラーを満タン、現金で。」と答えた場合には、店員は、給油するガソリンの種類が「レギュラーガソリン」であること、給油量は「満タン」であること、決済方法は「現金払い」であることをそれぞれ伝票発行装置に入力した後、給油を開始する。こうすることにより、給油が終了すると、伝票発行装置から自動的に実給油量に応じた決済伝票が印字発行されるので、店員は、決済伝票にしたがって客から給油代金の支払いを受けることになる。
【0003】
このようなガソリンスタンドの給油システムにおいて、従来、客の注文内容を伝票発行装置に入力する方法としては、キーボードやタッチパネル等の入力デバイスを用いた方法が一般的であった。しかし、この方法では、店員が客から聞いた内容を手入力しなければならなかったので、二度手間であった上、入力ミスも発生し易かった。また、客は店員が近づいて来るまで注文内容を告げるのを待たなければならず、また、注文を聞いた店員は、伝票発行装置が置かれている場所に行って客の注文内容を入力した後、車が停車している場所に戻って給油を始めなければならず、作業効率が悪かった。
【0004】
そこで近年、音声入力装置を入力デバイスとして伝票発行装置に接続し、給油に来た客が車内から直接音声で伝票発行装置に注文内容を入力することが考えられていた。こうすることにより、店員の手間を軽減でき、入力ミスもなくなる上、店員が車と伝票発行装置との間を往復して客の注文内容を手入力する無駄を省略できるので、作業効率の向上が期待できる。
【0005】
ところが従来の音声入力装置は、マイクロホンを通じて入力された音声データから認識された語句を1つずつ入力順に取り込み、その順番でコンピュータ等の情報処理装置に転送する形式であった。一方、注文内容を受付けて処理する伝票発行装置等の情報処理装置は、注文内容項目の受付け順序が予め決まっており、転送されてきた語句をその順番に該当項目の注文内容を示すデータとして処理することになる。
【0006】
このため、例えば、前記給油システムの伝票発行装置が、最初にガソリンの種類を受付け、次に給油量を受付け、最後に決済方法を受付けるようにプログラムされていたとした場合、伝票発行装置は、音声入力装置から最初に転送されてきた語句をガソリンの種類を示すデータとして処理し、次に転送されてきた語句を給油量を示すデータとして処理し、最後に転送されてきたデータを決済方法を示すデータとして処理することになる。したがって、音声入力を行なう者は、先ずガソリンの種類を注文し、次に給油量を注文し、最後に決済方法を注文するというように、予め決められた順番に注文内容を発声する必要があった。
【0007】
【発明が解決しようとする課題】
このように、注文内容の入力デバイスとして音声入力装置を用いた場合、従来は注文内容を入力する順番が固定化されていたので、例えばガソリンスタンドにおいて、客自身が音声入力装置を利用して給油の注文内容を伝票発行装置に入力するようにした給油システムを構築しても、不特定多数の客が利用するガソリンスタンドで全ての客に注文内容を告げる順番を徹底させるのは困難であり、伝票発行装置が注文内容を正しく認識できず、正常に機能しないおそれが高かった。
【0008】
本発明はこのような事情に基づいてなされたもので、その目的とするところは、音声入力する順番に捕われずに注文内容を正しく入力処理できる音声入力装置及びその方法並びに音声入力プログラムを提供しようとするものである。
【0009】
【課題を解決するための手段】
本発明の音声入力装置は、音声入力された注文内容から予め登録されている語句を一つずつ抽出する語句抽出手段と、この語句抽出手段により抽出された語句毎にその語句の意味が含まれる項目を判定する語句項目判定手段と、この語句項目判定手段により項目が判定された各語句を項目別に記憶する語句記憶手段と、この語句記憶手段により記憶された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する確定条件判断手段と、この確定条件判断手段により各語句の項目組合せパターンが注文確定条件を満足するパターンであると判断されると、語句記憶手段により記憶された各語句を音声入力注文データとして確定させる注文確定手段と、この注文確定手段により確定された音声入力注文データを、決済伝票を発行する伝票発行装置に転送する手段と、を備えたものである。
【0010】
したがって、音声入力された注文内容から抽出された各語句の意味がそれぞれ含まれる項目の組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンと一致したときには、その各語句が音声入力注文データとして確定されるので、注文内容を構成する語句の順番が異なっていてもよい。
【0011】
【発明の実施の形態】
以下、本発明の一実施の形態を図面を用いて説明する。
なお、この実施の形態は、ガソリンスタンド給油システムの伝票発行装置に対する注文内容入力デバイスとして用いられる音声入力装置に、本発明を適用した場合である。
【0012】
図1は本実施の形態における音声入力装置1の構成を示すブロック図である。この音声入力装置1は、音声入力部としてのマイクロホン11と、音声出力部としてのスピーカ12と、音声エンジン部13と、音声入力確定部14と、音声入力スイッチ15とから構成されている。音声入力確定部14には、注文内容を受付けて処理する情報処理装置、つまりこの実施の形態では、ガソリンスタンド給油システムの伝票発行装置2が接続されている。
【0013】
音声入力スイッチ15は、ユーザがマイクロホン11から音声入力する際にオンするスイッチで、その近傍にマイクロホン11とスピーカ12が設けられている。この実施の形態では、ガソリンスタンドの給油場所に停車した客が車内から操作できる位置に音声入力スイッチ15とマイクロホン11とスピーカ12が設けられている。
【0014】
音声エンジン部13は、マイクロホン11から入力されたアナログ音声信号をディジタル音声信号に変換するA/D(アナログ/ディジタル)コンバータ16、該ディジタル音声信号から1音節ずつ音声を認識して音声データを作成する音声認識部17、音声入力確定部14から供給されるガイダンスデータからディジタル音声信号を生成する音声生成部18、該ディジタル音声データをアナログ音声データに変換してスピーカ12に出力するD/A(ディジタル/アナログ)コンバータ19によって構成されている。
【0015】
音声入力確定部14は、音声入力スイッチ15がオンされている期間中、前記音声認識部17にて生成される音声データを取込み、この音声データから伝票発行装置2で処理すべき音声入力データを確定して伝票発行装置2に転送する機能を有するものである。
【0016】
なお、この実施の形態において、伝票発行装置2は、ガソリンの種類と給油量と決済方法の注文をこの順番に受付け、これらの注文内容が入力された後、給油が終了すると、実給油量に応じた決済伝票を印字発行するように構成されている。したがって、音声入力確定部14は、音声データからガソリンの種類を表わす語句と、給油量を表わす語句と、決済方法を表わす語句とがそれぞれ得られると、これらの語句から音声入力データを確定して、伝票発行装置2に転送する。これに対し、いずれかの注文内容を表わす語句が不足しているときには、その注文内容を表わす語句の音声再入力を促すガイダンスデータを音声生成部18に出力して、そのガイダンスを音声出力させる。また、語句の中に、例えば物の総称を表わすために注文内容を確定できない語句が含まれるときには、その語句を確定させる音声の再入力を促すガイダンスデータを音声生成部18に出力して、そのガイダンスを音声出力させる。
【0017】
以下、音声入力確定部14の具体的構成について説明する。
【0018】
図2は前記音声入力確定部14の構成を示すブロック図である。この音声入力装置1は、マイクロプロセッサとしてのCPU(Central Processing Unit)141、このCPU141が実行するプログラム等の固定的データが予め格納されたROM(Read Only Memory)142、このCPU141がデータの一時格納領域として使用する各種のメモリエリアが形成されるRAM(Random Access Memory)143、前記音声エンジン部13の音声認識部17から音声データが入力される一方、音声生成部18に対してガイダンスデータが出力されるI/O(Input/Output)ポート144、種々のデータファイル等を保存するHDD(Hard Disk Drive)装置145、前記伝票発行装置2に接続され、音声入力データを転送する通信インタフェース146、前記音声入力スイッチ15からの信号が入力される入力ポート147等で構成され、CPU141と、ROM142,RAM143,I/Oポート144,HDD装置145,通信インタフェース146,入力ポート147等とは、システムバス148で接続されている。ここに、音声入力確定部14は、CPU141,ROM142及びRAM143からなるマイクロコンピュータを主体に構成されている。
【0019】
前記HDD装置145には、特に図3に示すように、語彙ファイル31、辞書ファイル32、ガイダンスファイル33及び確定条件テーブル34が保存されている。
【0020】
前記語彙ファイル31は、図4(a)に示すように、所定の語句を発生したときの音声の特徴量を数値化した語句音声データと、その語句に対して予め設定された語句毎に異なる語句コードとからなるレコードを記憶するもので、特に、伝票発行装置2に注文内容を音声で入力するときに使用されると考えられる多数の語句が選出され、各語句のレコードがそれぞれ記憶されている。例えば、ガソリンの種類を注文するときに使用される語句として「レギュラー」,「レギュラーガソリン」,「ハイオク」,「ハイオクガソリン」,「軽油」,「ガソリン」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。また、給油量を注文するときに使用される語句として「満タン」,「10リットル」,「20リットル」,「1000円」,「2000円」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。また、決済方法を注文するときに使用される語句として「現金」,「現金払い」,「カード」,「クレジット」,「デビット」,「クレジットカード」,「デビットカード」等が選出され、これらの語句の語句音声データと語句コードとが語彙ファイル31に記憶されている。
【0021】
前記辞書ファイル32は、図4(b)に示すように、語句コード,項目コード,不確定フラグ,ガイダンス番号及び複数のリンク語句コードからなるレコードを記憶するもので、前記語彙ファイル31に記憶されている各語句の語句コードにそれぞれリンクする複数のレコードが記憶されている。
【0022】
この辞書ファイル32のレコード項目において、項目コードは、各種語句の意味別に設定された項目を識別するコードであり、この実施の形態では、ガソリンの種類を表わす意味の項目「アイテム」(項目コード=1)と、給油量を表わす意味の項目「数量」(項目コード=2)と、給油量相当の金額を表わす意味の項目「金額」(項目コード=3)と、決済方法を表わす意味の項目「決済方法」(項目コード=4)とを設定している。
【0023】
また、不確定フラグは、対応する語句が注文内容を確定できる語句か否かを識別するフラグであって、確定できる語句に対しては“0”がセットされ、物の総称などのように不確定な語句に対しては“1”がセットされる。そして、不確定語句に対してのみ、ガイダンス番号とリンク語句コードとが設定される。ガイダンス番号は、その不確定語句を確定させる音声の再入力を促すガイダンスデータに対して設定された番号である。リンク語句コードは、その不確定語句が分類された項目に含まれる語句で注文内容を確定できる一部又は全ての語句の語句コードである。
【0024】
例えば、ガソリンの種類を注文する際に音声入力される語句として、「レギュラー」,「ハイオク」,「ガソリン」等があり、前の2つはガソリンの種類を特定できるが、「ガソリン」だけではレギュラーガソリンなのかハイオクガソリンなのかを特定できない。そこで、語句「ガソリン」の語句コードに対して不確定フラグを“1”とし、ガイダンス番号としてガソリンの種類を確定させる音声再入力を促すガイダンスデータ(例えば「ガソリンは……ですか……ですか」)の番号とし、リンク語句コードとして語句「レギュラー」及び「ハイオク」の語句コードをそれぞれ設定する。同様に、決済方法を注文する際に音声入力される語句として、「クレジット」,「デビット」,「カード」等があり、前の2つは決済方法を特定できるが、「カード」だけではクレジットカード決済なのかデビットカード決済なのかを特定できない。そこで、語句「カード」の語句コードに対して不確定フラグを“1”とし、ガイダンス番号としてカードの種類を確定させる音声再入力を促すガイダンスデータ(例えば「カードは……ですか……ですか」)の番号とし、リンク語句コードとして語句「クレジット」及び「デビット」の語句コードをそれぞれ設定する。
【0025】
ガイダンスファイル33は、図4(c)に示すように、ガイダンス番号とガイダンスデータとからなるレコードを記憶するもので、音声入力データを確定するまでの間に音声出力が必要となる各種のガイダンスデータがそれぞれ異なるガイダンス番号とともに記憶されている。
【0026】
確定条件テーブル34は、図5に示すように、各種語句の意味別に設定された項目(この実施の形態では「アイテム」,「数量」,「金額」,「決済方法」の4種)の組合せパターンを識別する条件ナンバー別に、当該項目組合せパターンが対応する項目を含むパターンか否かを示すデータ(1:含む、0:含まない)と、当該項目組合せパターンが確定条件を満足するパターンでないとき、確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスデータのガイダンス番号とを記憶するものである。
【0027】
つまり、条件ナンバーP1で識別される項目組合せパターンは、データ“1”の項目「アイテム」,「数量」及び「決済方法」を含むパターンであり、条件ナンバーP2で識別される項目組合せパターンは、データ“1”の項目「アイテム」,「金額」及び「決済方法」を含むパターンであって、いずれも伝票発行装置2に対する音声入力データとしての確定条件を満足するので、ガイダンス番号は未設定(=0)となっている。
【0028】
一方、条件ナンバーP3〜P12でそれぞれ識別される項目組合せパターンは、いずれも伝票発行装置2に対する音声入力データとしての確定条件を満足しないので、それぞれ該当するガイダンスデータのガイダンス番号が設定されている。例えば、条件ナンバーP3及びP4で識別されるパターンは、いずれも項目「決済方法」の意味を有する語句が未入力であるため、決済方法の音声再入力を促すガイダンスデータ(例えば「決済方法は何ですか」)のガイダンス番号[100]が設定されている。また、条件ナンバーP5で識別されるパターンは、項目「数量」または「金額」の意味を有する語句が未入力であるため、給油量の音声再入力を促すガイダンスデータのガイダンス番号[101]が設定されている。以下、同様に、条件ナンバーP6及びP7で識別されるパターンは、項目「アイテム」の意味を有する語句が未入力であるため、ガソリン種類の音声再入力を促すガイダンスデータのガイダンス番号[102]が設定され、条件ナンバーP8で識別されるパターンは、項目「数量」または「金額」と「決済方法」の意味をそれぞれ有する語句がいずれも未入力であるため、給油量と決済方法の音声再入力を促すガイダンスデータのガイダンス番号[103]が設定され、条件ナンバーP9及びP10で識別されるパターンは、項目「アイテム」と「決済方法」の意味をそれぞれ有する語句がいずれも未入力であるため、ガソリン種類と決済方法の音声再入力を促すガイダンスデータのガイダンス番号[104]が設定され、条件ナンバーP11で識別されるパターンは、項目「アイテム」と「数量」または「金額」の意味をそれぞれ有する語句がいずれも未入力であるため、ガソリン種類と給油量の音声再入力を促すガイダンスデータのガイダンス番号[105]が設定されている。
【0029】
さて、CPU141は、ROM142に格納された音声入力プログラムにより、RAM143に図6に示すメモリエリア61,62を形成し、図7の流れ図に示す処理を繰返し実行するようになっている。
【0030】
メモリエリア61は、語彙ファイル31から抽出した語句音声データと語句コードとを、抽出順に記憶する領域で、以後、語句メモリ61と称する。メモリエリア62は、各種語句の意味別に設定された項目(この実施の形態では「アイテム」,「数量」,「金額」,「決済方法」の4種)別に、その項目の意味を有する語句の語句音声データ,語句コード及び不確定フラグを1つずつ記憶する領域(語句記憶手段)で、以後、項目別メモリ62と称する。
【0031】
RAM143に語句メモリ61及び項目別メモリ62を形成した状態で、CPU141は、ST(ステップ)1として音声入力スイッチ15がオン操作されるのを待機している。なお、初期状態として、語句メモリ61の語句音声データエリア及び語句コードエリアと、項目別メモリ62の語句音声データエリア,語句コードエリア及び不確定フラグエリアはいずれもクリアされている。
【0032】
入力ポート147に入力される信号により、音声入力スイッチ15がオン操作されたと判断すると、CPU141は、ST2として音声認識部17にて認識された音声データを取り込む。音声データは、ST3として音声入力スイッチ15がオフ操作されるまで継続して取り込む。
【0033】
入力ポート147に入力される信号により、音声入力スイッチ15がオフ操作されたと判断すると、CPU141は、ST4として語句抽出処理を実行する。すなわち、音声認識部17から取り込んだ音声データを入力順に語彙ファイル31に登録されている各種語句の語句音声データと比較照合して、当該語彙ファイル31に登録されている語句音声データと一致する語句を1つずつ抽出する。そして語句を抽出する毎に、その語句の語句音声データと対応する語句コードとを、語句メモリ61に抽出順に格納する(語句抽出手段)。なお、音声データから語句音声データと一致する語句を1つも抽出できないときにはエラーとし、音声入力スイッチ15が再度オン操作されるのを待機する。
【0034】
音声データから語句音声データを抽出し終えると、CPU141は、語句項目判定処理を実行する。すなわち、語句メモリ61に格納された語句音声データとその語句コードとをメモリナンバーの小さい順、つまり音声データから抽出された語句の順番に読み出す。そして、語句コードで辞書ファイル32を検索して、対応する項目コード及び不確定フラグを取得し、項目別メモリ62の該当項目エリアに、当該語句音声データ及び語句コードと不確定フラグとを格納する。このとき、該当項目エリアに既にデータが格納されていた場合には、その既存のデータに上書きして格納する。したがって、語句メモリ61の中に同一項目の意味を有する語句の語句音声データ及び語句コードが複数格納されていた場合には、最も後から抽出された語句,つまり最も後から音声入力された語句を有効とし、その語句の語句音声データ,語句コード及び不確定フラグを項目別メモリ62で記憶する(語句項目判定手段)。
【0035】
語句メモリ61に格納された各語句音声データの項目を判定し終えると、CPU141は、ST6として不確定語句の有無を判断する。すなわち、項目別メモリ62に格納された不確定フラグをチェックし、不確定フラグ“1”が格納されているか否かを判断する。そして、不確定フラグ“1”が格納されている場合には不確定語句有りと判断し、不確定フラグ“1”が格納されていない場合には不確定語句無しと判断する。
【0036】
不確定語句有りと判断した場合には、CPU141は、ST7としてこの不確定フラグ“1”に対応する語句コードで辞書ファイル32を再度検索し、対応するガイダンス番号とリンク語句コードとを読み出す。また、ガイダンス番号に対応するガイダンスデータをガイダンスファイル33から読み出すとともに、各リンク語句コードにそれぞれ対応する語句音声データを語彙ファイル31から読み出す。そして、ガイダンスデータと各語句音声データとから、不確定語句を確定させる音声の再入力を促すガイダンスデータ,いわゆる確定語句問合せガイダンスデータを作成する。しかる後、ST8としてこの確定語句問合せガイダンスデータを音声生成部18に出力して、スピーカ12より音声出力させる(確定語句催促手段)。その後、CPU141は、ST1に戻って、音声入力スイッチ15が再度オン操作されるのを待機する。
【0037】
不確定語句無しと判定した場合には、CPU141は、ST9として確定条件判断処理を実行する。すなわち、項目別メモリ62をチェックして語句音声データ,語句コード及び不確定フラグ“0”の各データが格納されている項目と格納されていない項目とを区別する。そして、各データが格納されている項目の組合せパターン,つまり音声データから抽出された各語句の項目組合せパターンで確定条件テーブル34を検索して、同一パターンのガイダンス番号を取得する。
【0038】
ここで、同一パターンのガイダンス番号が“0”以外の場合、つまりガイダンス番号が設定されている場合には、CPU141は、ST10として音声データから抽出された各語句の項目組合せパターンが確定条件を満足するパターンでないので、入力を確定させない。これに対し、同一パターンのガイダンス番号が“0”の場合には、音声データから抽出された各語句の項目組合せパターンが確定条件を満足するパターンであるので、入力を確定させる(確定条件判断手段)。
【0039】
入力を確定させない場合には、ST11としてそのガイダンス番号に対応するガイダンスデータをガイダンスファイル33から読み出し、確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスデータ、いわゆる不足項目語句問合せガイダンスデータを作成する。そして、ST12としてこの不足項目語句問合せガイダンスデータを音声生成部18に出力して、スピーカ12より音声出力させる(不足語句催促手段)。その後、ST1に戻って、音声入力スイッチ15が再度オン操作されるのを待機する。
【0040】
入力を確定させる場合には、ST13として項目別メモリ62に格納されている各項目の語句コードを、項目「アイテム」,「数量」又は「金額」,「決済方法」の順に読み出す。そして、これらの語句コードを順に組み合わせて音声入力確定データを作成したならば、この音声入力確定データを伝票発行装置2にインタフェース146を介して転送する(入力確定手段)。
【0041】
その後、CPU141は、ST14として語句メモリ61及び項目別メモリ62をクリアして初期状態に戻したならば、今回の処理を終了する。そして、音声入力スイッチ15が次にオン操作されるのを待機し、オン操作されたならば、ST1からの処理を繰り返すものとなっている。
【0042】
このように本実施の形態においては、ガソリン給油システムの伝票発行装置2に対する注文内容の入力デバイスとして、音声入力装置1が使用されている。そして、ガソリンの給油に来た客は、所定位置に停車後、車内から音声入力スイッチ15をオンし、マイクロホン11に向かって注文内容、つまりガソリンの種類と給油量と決済方法を発声する。このとき、注文内容を告げる順番は特に制限されない。
【0043】
今、例えば客が注文内容を「ガソリンを現金で2000円分」と発声したとする。そうすると、図8(a)に示すように、「ガソリンを現金で2000円分」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。
【0044】
音声入力確定部14では、この音声データ「ガソリンを現金で2000円分」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「ガソリン」と、支払方法を表わす語句「現金」と、給油量相当の金額を表わす語句「2000円」が抽出される。そして、図8(b)に示すように、語句メモリ61に各語句の語句音声データと語句コードとが抽出された順に格納される。
【0045】
次に、音声入力確定部14では、語句項目判定処理が実行される。これにより、項目別メモリ62には、図8(c)に示すように、項目「アイテム」に対して語句「ガソリン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「金額」に対して語句「2000円」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「決済方法」に対して語句「現金」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。
【0046】
この場合、語句「ガソリン」は不確定語句(不確定フラグ=1)なので、ガソリンの種類を確定させる音声の再入力を促すガイダンスデータ「ガソリンは……ですか……ですか」と、語句「ガソリン」のリンク語句コードに対応する語句「レギュラー」,「ハイオク」とから、図8(d)に示す確定語句問合せガイダンスデータ「ガソリンはレギュラーですかハイオクですか」が作成される。そして、この確定語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0047】
このガイダンスを聞いた客が、同様にして例えば「レギュラー」と発声したとする。そうすると、図8(e)に示すように、「レギュラー」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「レギュラー」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「レギュラー」が抽出される。そして、図8(f)に示すように、語句「レギュラー」の語句音声データと語句コードとが語句メモリ61に追加される。
【0048】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図8(g)に示すように、項目「アイテム」に対して語句「レギュラー」の語句音声データ,語句コード及び不確定フラグがそれぞれ上書きされる。
【0049】
その結果、不確定語句は存在しなくなったので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」,「金額」及び「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP2に一致するパターンであると認識される。このパターンは、ガイダンス番号が未設定、つまり確定条件を満足するパターンなので、語句「レギュラー」,「2000円」,「現金」の各語句コードから音声入力確定データが作成され、伝票発行装置2に転送される。
【0050】
伝票発行装置2においては、音声入力確定データの最初の語句コードをガソリンの種類を示すデータとして認識し、次の語句コードを給油量を示すデータとして認識し、最後の語句コードを決済方法を示すデータとして認識して処理する。したがって、正常に伝票発行が処理される。
【0051】
また、例えば別の客が注文内容を「レギュラーガソリンをカードで」と発声したとする。そうすると、図9(a)に示すように、「レギュラーガソリンをカードで」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。
【0052】
音声入力確定部14では、この音声データ「レギュラーガソリンをカードで」に対して、語句抽出処理が実行される。その結果、この音声データからガソリンの種類を表わす語句「レギュラーガソリン」と、支払方法を表わす語句「カード」が抽出される。そして、図9(b)に示すように、語句メモリ61に各語句の語句音声データと語句コードとが抽出された順に格納される。
【0053】
次に、音声入力確定部14では、語句項目判定処理が実行される。これにより、項目別メモリ62には、図9(c)に示すように、項目「アイテム」に対して語句「レギュラーガソリン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納され、項目「決済方法」に対して語句「カード」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。
【0054】
この場合、語句「カード」は不確定語句(不確定フラグ=1)なので、カードの種類を確定させる音声の再入力を促すガイダンスデータ「カードは……ですか……ですか」と、語句「カード」のリンク語句コードに対応する語句「クレジット」,「デビット」とから、図9(d)に示す確定語句問合せガイダンスデータ「カードはクレジットですかデビットですか」が作成される。そして、この確定語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0055】
このガイダンスを聞いた客が、同様にして例えば「クレジットカードです」と発声したとする。そうすると、図9(e)に示すように、「クレジットカードです」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「クレジットカードです」に対して、語句抽出処理が実行される。その結果、この音声データから決済方法を表わす語句「クレジットカード」が抽出される。そして、図9(f)に示すように、語句「クレジットカード」の語句音声データと語句コードとが語句メモリ61に追加される。
【0056】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図9(g)に示すように、項目「決済方法」に対して語句「クレジットカード」の語句音声データ,語句コード及び不確定フラグがそれぞれ上書きされる。
【0057】
その結果、不確定語句は存在しなくなったので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」と「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP5に一致するパターンであると認識される。このパターンは、ガイダンス番号[101]が設定されているパターン、つまり確定条件を満足しないパターンなので、図9(h)に示すガイダンス番号[101]のガイダンスデータ、つまり給油量の音声再入力を促す不足項目語句問合せガイダンスデータ「給油予定量または予定金額を入力してください」が作成される。そして、この不足項目語句問合せガイダンスデータが音声生成部18に出力され、音声に変換されて、スピーカ12から出力される。
【0058】
このガイダンスを聞いた客が、同様にして例えば「満タン」と発声したとする。そうすると、図9(i)に示すように、「満タン」という音声データが音声認識部17で認識され、音声入力確定部14に入力される。音声入力確定部14では、この音声データ「満タン」に対して、語句抽出処理が実行される。その結果、この音声データから給油量を表わす語句「満タン」が抽出される。そして、図9(j)に示すように、語句「満タン」の語句音声データと語句コードとが語句メモリ61に追加される。
【0059】
次いで、音声入力確定部14では、語句項目判定処理が再度実行される。これにより、項目別メモリ62には、図9(k)に示すように、項目「数量」に対して語句「満タン」の語句音声データ,語句コード及び不確定フラグがそれぞれ格納される。次いで、不確定語句は存在しないので、音声入力確定部14では、確定条件判断処理が実行される。この場合、項目別メモリ62には、項目「アイテム」,「数量」及び「決済方法」にそれぞれ属する語句のデータが格納されているので、条件ナンバーP1に一致するパターンであると認識される。このパターンは、ガイダンス番号が未設定、つまり確定条件を満足するので、語句「レギュラーガソリン」,「満タン」,「クレジットカード」の各語句コードから音声入力確定データが作成され、順次伝票発行装置2に転送される。
【0060】
この場合も、伝票発行装置においては、音声入力確定データの最初の語句コードをガソリンの種類を示すデータとして認識し、次の語句コードを給油量を示すデータとして認識し、最後の語句コードを決済方法を示すデータとして認識して処理するので、正常に伝票発行が処理される。
【0061】
このように本実施の形態によれば、伝票発行装置2に対して給油の注文内容を音声入力する際の入力項目の順番が制限されないので、使い勝手がよく、不特定多数の客が自身で注文内容を伝票発行装置2に音声入力できるようになる。その結果、店員の手間を軽減でき、入力ミスもなくなる上、店員が車と伝票発行装置との間を往復して客の注文内容を手入力する無駄を省略できるので、作業効率を向上できる。
【0062】
また、本実施の形態では、最初に音声入力された語句だけでは、注文内容の確定条件が満足されないときには、当該確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すガイダンスを自動的に生成し、ユーザに対して音声出力する。そして、その後に音声入力された語句から確定条件が満足されたならば、音声入力データを確定させるようにしている。したがって、注文内容を音声入力する際に入力漏れの項目があっても、その項目の注文内容のみを入力し直せばよいので、注文内容を誰もが容易にかつ正しく音声で入力できる効果を奏する。
【0063】
また、音声入力された語句の中に注文内容を確定できない不確定語句が含まれる場合には、その語句を確定させる音声の再入力を促すガイダンスを自動的に生成し、ユーザに対して音声出力する。そして、その後に音声入力された語句から不確定語句が確定されたならば、その後から入力された語句を有効にして音声入力データを確定させるようにしている。したがって、客が例えばガソリンの種類に関して「ガソリン」としか発声しなかったためにガソリンがレギュラーガソリンかハイオクガソリンかを特定できなかった場合でも、その後の音声入力によってガソリンの種類を確定できるので、やはり、注文内容を誰もが容易にかつ正しく音声で入力することができる。
【0064】
ところで、この実施の形態では、音声データから抽出されて語句メモリ61に格納された語句の中に同一項目の意味を有する語句が複数ある場合には、最も後から音声入力された語句を有効にして、項目別メモリ62に記憶するようにしている。したがって、例えばガソリンの種類を言い間違えて後から訂正した場合には、後から訂正した種類の語句が有効になるので、この点からも使い勝手のよいものである。
【0065】
なお、この実施の形態では、ガソリンスタンド給油システムの伝票発行装置に対する注文内容入力デバイスとして本発明を適用したが、本発明を適用できる情報処理装置はこれに限定されるものではなく、航空券,乗車券などの券発行装置や、レストラン,ファーストフード店でのオーダ登録装置等に対する注文内容入力デバイスとしても用いることができる。例えば航空券の券発行装置に対する入力デバイスとして用いた場合には、語句の意味が含まれる項目として出発日時,出発地,行先,航空会社,座席(禁煙席,窓側,通路側など)等が設定される。
【0066】
また、ファーストフード店でのオーダ登録装置に対する入力デバイスとして用いた場合には、語句の意味が含まれる項目として品名,数量,決済方法等が設定される。
【0067】
また、この実施の形態では、確定語句問合せガイダンスデータや不足項目語句問合せガイダンスデータを音声出力したが、音声入力確定部14に表示部を接続して、ガイダンスデータを画面に表示出力するように構成しても、同様な作用効果を奏し得る。
【0068】
また、この実施の形態では、ROM142に格納された音声入力プログラムをCPU141が実行することにより、音声入力装置としての機能を実現させたが、インタフェース146を介して外部機器からHDD装置145に音声入力プログラムをダウンロードし、このプログラムをCPU141が実行することによって、音声入力装置としての機能を実現させてもよい。
【0069】
【発明の効果】
以上詳述したように本発明の音声入力装置及び音声入力方法並びに音声入力プログラムであれば、音声入力する順番に捕われずに注文内容を正しく入力処理することができるので、音声入力装置の使い勝手を向上できる上、注文内容を誰もが容易にかつ正しく音声で入力できるようになる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態である音声入力装置の構成を示すブロック図。
【図2】 図1における音声入力確定部の構成を示すブロック図。
【図3】 同音声入力確定部のHDD装置に記憶される主要なデータファイル及びデータテーブルを示す図。
【図4】 図3に示す各データファイルのレコード構成を示す図。
【図5】 図3に示すデータテーブルのデータ構成を示す図。
【図6】 同音声入力確定部のRAMに形成される主要なメモリエリアを示す図。
【図7】 同音声入力確定部のCPUが実行する主要なプログラム処理の手順を示す流れ図。
【図8】 同音声入力確定部の動作の一例におけるデータ例を示す図。
【図9】 同音声入力確定部の動作の他の例におけるデータ例を示す図。
【符号の説明】
1…音声入力装置
2…伝票発行装置
11…マイクロホン
12…スピーカ
13…音声エンジン部
14…音声入力確定部
15…音声入力スイッチ
31…語彙ファイル
32…辞書ファイル
33…ガイダンスファイル
34…確定条件テーブル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information processing device that accepts and processes an order content, such as a slip issuing device of a gas station refueling system, a ticket issuing device such as an airline ticket or a boarding ticket, an order registration device at a restaurant, a fast food restaurant, or the like. The present invention relates to a voice input device used as an input device, a method thereof, and a voice input program.
[0002]
[Prior art]
For example, at a gas station, when a customer visits a store, the customer first enters the type of gasoline to be refilled (regular gasoline, high-octane gasoline, light oil, etc.), the amount of refueling (quantity unit or monetary unit), and the settlement method (cash payment, credit payment). Etc.) On the other hand, for example, if the customer replied, “Regular full, with cash.”, The clerk said that the type of gasoline to be refilled was “regular gasoline” and the amount of fuel was “full”. After having input to the slip issuing device that the payment method is “cash payment”, refueling is started. By doing so, when the refueling is completed, a payment slip corresponding to the actual refueling amount is automatically printed and issued from the slip issuing device, so that the store clerk receives payment of the refueling price from the customer according to the payment slip. .
[0003]
In such a gas station refueling system, conventionally, a method using an input device such as a keyboard or a touch panel is generally used as a method for inputting customer order contents into a slip issuing device. However, with this method, since the store clerk had to manually input the contents heard from the customer, it was troublesome twice and input errors were likely to occur. Also, the customer must wait for the store clerk to approach the order details, and the store clerk who heard the order went to the place where the slip issuing device is located and entered the customer order details. Later, he had to return to the place where the car stopped and start refueling, which was inefficient.
[0004]
Therefore, in recent years, it has been considered that a voice input device is connected to a slip issuing device as an input device, and a customer who has refueled inputs the order contents to the slip issuing device directly from inside the vehicle. In this way, the labor of the clerk can be reduced, input errors are eliminated, and the clerk can eliminate the waste of manually entering the customer's order contents by going back and forth between the car and the slip issuing device, improving work efficiency. Can be expected.
[0005]
However, the conventional voice input device has a format in which words recognized from voice data inputted through a microphone are taken one by one in the order of input and transferred to an information processing device such as a computer in that order. On the other hand, an information processing device such as a slip issuing device that accepts and processes order contents has a predetermined order for receiving order contents items, and processes the transferred words as data indicating the order contents of the corresponding items in that order. Will do.
[0006]
For this reason, for example, if the slip issuing device of the refueling system is programmed to accept the gasoline type first, then the fueling amount, and finally the settlement method, the slip issuing device The word transferred first from the input device is processed as data indicating the type of gasoline, the word transferred next is processed as data indicating the amount of fuel supply, and the data transferred last indicates the settlement method. It will be processed as data. Therefore, the person who performs voice input needs to speak the order details in a predetermined order, such as first ordering the type of gasoline, then ordering the amount of refueling, and finally ordering the settlement method. It was.
[0007]
[Problems to be solved by the invention]
As described above, when a voice input device is used as an input device for order details, the order of inputting the order details has been fixed in the past. For example, at a gas station, the customer himself refuels using the voice input device. Even if you build a refueling system that inputs the details of orders to the slip issuing device, it is difficult to ensure the order of telling the details of orders to all customers at a gas station used by an unspecified number of customers, There was a high possibility that the slip issuing device could not recognize the order details correctly and would not function properly.
[0008]
The present invention has been made based on such circumstances, and an object of the present invention is to provide a voice input device, a method thereof, and a voice input program capable of correctly inputting order contents without being caught in the order of voice input. It is what.
[0009]
[Means for Solving the Problems]
The speech input device of the present invention includes a phrase extraction unit that extracts one phrase registered in advance from the contents of an order input by speech, and the meaning of each phrase extracted by the phrase extraction unit. A phrase item determination unit for determining an item, a phrase storage unit for storing each phrase determined by the phrase item determination unit for each item, and an item combination pattern for each phrase stored by the phrase storage unit It consists of items of order type, quantity and payment method. Determination condition determining means for determining whether the pattern satisfies the order confirmation condition, and if the item combination pattern of each word is determined to satisfy the order confirmation condition by the confirmation condition determination means, the word storage means Order confirming means for confirming each word / phrase stored as voice input order data; Means for transferring the voice input order data confirmed by the order confirmation means to a slip issuing device for issuing a settlement slip; , With.
[0010]
Therefore, there is a combination pattern of items each containing the meaning of each word extracted from the order contents inputted by voice. It consists of items of order type, quantity and payment method. When matching with the pattern satisfying the order confirmation condition, each word / phrase is confirmed as voice input order data, so the order of the words / phrases constituting the order content may be different.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
In this embodiment, the present invention is applied to a voice input device used as an order content input device for a slip issuing device of a gas station refueling system.
[0012]
FIG. 1 is a block diagram showing a configuration of a
[0013]
The
[0014]
The
[0015]
The voice
[0016]
In this embodiment, the
[0017]
Hereinafter, a specific configuration of the voice
[0018]
FIG. 2 is a block diagram showing the configuration of the voice
[0019]
As shown in FIG. 3 in particular, the
[0020]
As shown in FIG. 4A, the
[0021]
As shown in FIG. 4B, the
[0022]
In the record item of the
[0023]
The indeterminate flag is a flag for identifying whether or not the corresponding word / phrase is a word / phrase that can confirm the contents of the order. “1” is set for a definite word. A guidance number and a link word / phrase code are set only for the uncertain word / phrase. The guidance number is a number that is set for guidance data that prompts re-input of voice for confirming the uncertain word / phrase. The link phrase code is a phrase code of a part or all of the phrases that can confirm the order contents with the phrases included in the item in which the uncertain phrase is classified.
[0024]
For example, when ordering a gasoline type, the words that are input by voice are "regular", "high-octane", "gasoline", etc. The previous two can specify the type of gasoline, but only "gasoline" It cannot be determined whether it is regular gasoline or high-octane gasoline. Therefore, for the phrase code "gasoline", the indeterminate flag is set to "1", and guidance data prompting voice re-entry to confirm the type of gasoline as the guidance number (for example, "gasoline is ...? ...?" )), And the phrase codes “regular” and “high-octane” are set as link phrase codes. Similarly, the words input by voice when ordering a payment method include “credit”, “debit”, “card”, etc. The previous two can specify the payment method, but only “card” can be credited. It is not possible to specify whether the payment is card payment or debit card payment. Therefore, guidance data that prompts voice re-entry to confirm the card type as the guidance number with the indeterminate flag set to “1” for the phrase code of the phrase “card” (for example, “Is the card? )), And the phrase codes of “credit” and “debit” are set as link phrase codes.
[0025]
As shown in FIG. 4C, the
[0026]
As shown in FIG. 5, the fixed condition table 34 is a combination of items set according to the meaning of various words (in this embodiment, “item”, “quantity”, “amount”, and “settlement method”). For each condition number for identifying a pattern, data indicating whether the item combination pattern is a pattern including a corresponding item (1: included, 0: not included), and when the item combination pattern is not a pattern that satisfies a definite condition And the guidance number of guidance data that prompts the user to re-input the words having the meanings of the items that are insufficient to satisfy the definite condition.
[0027]
That is, the item combination pattern identified by the condition number P1 is a pattern including the items “item”, “quantity”, and “settlement method” of the data “1”, and the item combination pattern identified by the condition number P2 is The pattern includes the items “item”, “amount”, and “settlement method” of the data “1”, and all satisfy the confirmation condition as voice input data for the
[0028]
On the other hand, since the item combination patterns identified by the condition numbers P3 to P12 do not satisfy the confirmation condition as the voice input data for the
[0029]
The
[0030]
The
[0031]
With the word /
[0032]
When determining that the
[0033]
If it is determined that the
[0034]
When extracting the phrase voice data from the voice data, the
[0035]
When the determination of the items of each phrase sound data stored in the
[0036]
If it is determined that there is an indefinite word / phrase, the
[0037]
When it is determined that there is no uncertain word / phrase, the
[0038]
Here, when the guidance number of the same pattern is other than “0”, that is, when the guidance number is set, the
[0039]
When the input is not confirmed, guidance data corresponding to the guidance number is read from the
[0040]
When confirming the input, the phrase code of each item stored in the item-
[0041]
Thereafter, when the
[0042]
As described above, in the present embodiment, the
[0043]
Now, for example, it is assumed that a customer utters the content of an order as “2000 yen for gasoline in cash”. Then, as shown in FIG. 8A, voice data “gasoline for 2000 yen in cash” is recognized by the
[0044]
In the voice
[0045]
Next, the phrase
[0046]
In this case, the phrase “gasoline” is an indeterminate phrase (indeterminate flag = 1), so the guidance data “prompt gasoline… is it? From the phrases “regular” and “high-octane” corresponding to the link phrase code of “gasoline”, the definite-phrase query guidance data “Is gasoline regular or high-octane” shown in FIG. 8D is created. Then, this fixed phrase query guidance data is output to the
[0047]
It is assumed that the customer who heard this guidance uttered “regular”, for example. Then, as shown in FIG. 8 (e), the voice data “regular” is recognized by the
[0048]
Next, the speech
[0049]
As a result, since the indeterminate word no longer exists, the speech
[0050]
In the
[0051]
Further, for example, it is assumed that another customer utters the content of the order as “Regular gasoline with a card”. Then, as shown in FIG. 9A, the voice data “Regular gasoline with a card” is recognized by the
[0052]
In the voice
[0053]
Next, the phrase
[0054]
In this case, the word “card” is an indeterminate word (indeterminate flag = 1), so the guidance data “card is ...? ...?” From the phrases “credit” and “debit” corresponding to the link phrase code of “card”, the fixed phrase query guidance data “card is credit or debit” shown in FIG. 9D is created. Then, this fixed phrase query guidance data is output to the
[0055]
Assume that a customer who has heard this guidance utters, for example, “It is a credit card”. Then, as shown in FIG. 9 (e), voice data “It is a credit card” is recognized by the
[0056]
Next, the speech
[0057]
As a result, since the indeterminate word does not exist, the speech
[0058]
It is assumed that the customer who heard this guidance similarly uttered, for example, “full tank”. Then, as shown in FIG. 9 (i), the voice data “full” is recognized by the
[0059]
Next, the speech
[0060]
Also in this case, the slip issuing device recognizes the first phrase code of the voice input confirmation data as data indicating the type of gasoline, recognizes the next phrase code as data indicating the amount of fuel, and settles the last phrase code. Since the data representing the method is recognized and processed, the slip issuance is processed normally.
[0061]
As described above, according to the present embodiment, the order of input items when inputting the order details of refueling to the
[0062]
In the present embodiment, when the final input condition is not satisfied by only the first input phrase, the voice re-input of the phrase having the meaning of the item that is insufficient to satisfy the final condition Guidance prompting the user to be automatically generated and output to the user by voice. Then, if the confirmation condition is satisfied from the words that are subsequently input by speech, the speech input data is confirmed. Therefore, even if there is an input omission item when inputting the order contents by voice, it is only necessary to re-enter the order contents of the item, so that it is possible for anyone to input the order contents easily and correctly by voice. .
[0063]
In addition, if there are uncertain words that cannot be confirmed in the order, the guidance that prompts the user to re-input the voice that confirms the words is automatically generated and the voice is output to the user. To do. Then, if an indeterminate phrase is determined from a phrase that is subsequently input by voice, the input phrase is subsequently validated to determine the voice input data. Therefore, even if the customer could not specify whether the gasoline is regular gasoline or high-octane gasoline because the customer only spoke `` gasoline '' with respect to the type of gasoline, for example, the type of gasoline can be confirmed by subsequent voice input, Anyone can easily and correctly input the order contents by voice.
[0064]
By the way, in this embodiment, when there are a plurality of phrases having the meaning of the same item in the phrases extracted from the voice data and stored in the
[0065]
In this embodiment, although the present invention is applied as an order content input device for a slip issuing device of a gas station refueling system, an information processing apparatus to which the present invention can be applied is not limited to this, and an air ticket, It can also be used as an order content input device for a ticket issuing device such as a boarding ticket, an order registration device in a restaurant or a fast food restaurant. For example, when used as an input device for an air ticket issuing device, items such as departure date, departure place, destination, airline, seat (non-smoking seat, window side, aisle side, etc.) are set as items that include the meaning of the phrase. Is done.
[0066]
In addition, when used as an input device for an order registration apparatus at a fast food restaurant, the item name, quantity, settlement method, and the like are set as items including the meaning of the phrase.
[0067]
In this embodiment, the fixed phrase query guidance data and the missing item phrase query guidance data are output as voices. However, the display unit is connected to the voice
[0068]
In this embodiment, the voice input program stored in the
[0069]
【The invention's effect】
As described above in detail, the voice input device, the voice input method, and the voice input program of the present invention can correctly input and process the order contents without being caught in the order of voice input. In addition to being able to improve, anyone can easily and correctly input the contents of the order.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a voice input device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a voice input confirmation unit in FIG.
FIG. 3 is a view showing main data files and a data table stored in the HDD device of the voice input confirmation unit.
4 is a view showing a record configuration of each data file shown in FIG. 3;
FIG. 5 is a diagram showing a data configuration of a data table shown in FIG. 3;
FIG. 6 is a view showing main memory areas formed in the RAM of the voice input confirmation unit.
FIG. 7 is a flowchart showing a procedure of main program processing executed by the CPU of the voice input confirmation unit.
FIG. 8 is a diagram showing an example of data in an example of the operation of the voice input confirmation unit.
FIG. 9 is a diagram showing an example of data in another example of the operation of the voice input confirmation unit.
[Explanation of symbols]
1 ... Voice input device
2 ... slip issuing device
11 ... Microphone
12 ... Speaker
13 ... Speech engine
14 ... Voice input confirmation section
15 ... Voice input switch
31 ... Vocabulary file
32 ... Dictionary file
33 ... Guidance file
34 ... Confirmation condition table
Claims (13)
この語句抽出手段により抽出された語句毎にその語句の意味が含まれる項目を判定する語句項目判定手段と、
この語句項目判定手段により項目が判定された各語句を項目別に記憶する語句記憶手段と、
この語句記憶手段により記憶された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する確定条件判断手段と、
この確定条件判断手段により各語句の項目組合せパターンが前記注文確定条件を満足するパターンであると判断されると、前記語句記憶手段により記憶された各語句を音声入力注文データとして確定させる注文確定手段と、
この注文確定手段により確定された音声入力注文データを、決済伝票を発行する伝票発行装置に転送する手段と、
を具備したことを特徴とする音声入力装置。Word / phrase extracting means for extracting one word / phrase registered in advance from the contents of the order inputted by voice;
A phrase item determination unit that determines an item including the meaning of the phrase for each phrase extracted by the phrase extraction unit;
A phrase storage means for storing each phrase determined by the phrase item determination means for each item;
A confirmation condition judging means for judging whether or not the item combination pattern of each word stored by the word storage means is a pattern satisfying an order confirmation condition consisting of items of the type, quantity and settlement method of the order item ;
When the confirmation condition determining means determines that the item combination pattern of each word is a pattern satisfying the order confirmation condition, the order confirmation means for confirming each word stored by the word storage means as voice input order data When,
Means for transferring the voice input order data confirmed by the order confirmation means to a slip issuing device for issuing a settlement slip ;
A voice input device comprising:
前記注文確定手段は、前記不足語句催促手段により音声再入力を促した後に前記語句抽出手段により抽出された語句の意味が含まれる項目が前記注文確定条件を満足するのに不足していた項目であるとき、この語句と前記語句記憶手段により記憶された語句とを音声入力注文データとして確定させることを特徴とする請求項1または2記載の音声入力装置。When it is determined by the confirmation condition judging means that the item combination pattern of each word is not a pattern that satisfies the order confirmation condition, the voice of words having meanings of items that are insufficient to satisfy the order confirmation condition are reproduced. It further comprises a missing word prompting means for prompting input,
The order confirmation means is an item in which an item including the meaning of the phrase extracted by the phrase extraction means after prompting voice re-input by the missing word prompting means is insufficient to satisfy the order confirmation condition. 3. The voice input device according to claim 1, wherein the phrase and the phrase stored by the phrase storage means are determined as voice input order data.
前記語句記憶手段は、前記確定語句催促手段により音声再入力を促した後に前記語句抽出手段により抽出された語句を前記不確定な語句に代えて記憶することを特徴とする請求項1乃至3のいずれかに記載の音声入力装置。When an uncertain phrase is included in the phrase extracted by the phrase extracting means, further comprising a confirmed phrase prompting means for prompting re-input of a voice for confirming the phrase;
The phrase storage unit stores the phrase extracted by the phrase extraction unit after prompting voice re-input by the fixed phrase prompting unit in place of the indefinite phrase. The voice input device according to any one of the above.
前記判断するステップは、前記抽出された各語句の項目に基づいて予め設定された複数の項目組合せパターンの中から適合するパターンを抽出し、この抽出したパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断することを特徴とする音声入力方法。The voice input method according to claim 6.
In the determining step, a matching pattern is extracted from a plurality of preset item combination patterns based on the extracted item of each word, and the extracted pattern is the type, quantity and settlement method of the order item. A voice input method for determining whether or not the pattern satisfies an order confirmation condition consisting of the items .
前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンでないと判断されたとき、当該注文確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促すステップを付加したことを特徴とする音声入力方法。The voice input method according to claim 6 or 7,
When it is determined that the extracted item combination pattern of each word is not a pattern that satisfies the order confirmation condition, speech re-input of a word having meaning of an item that is insufficient to satisfy the order confirmation condition is performed. A voice input method characterized by adding a prompting step.
前記抽出された語句の中に不確定な語句が含まれるとき、その語句を確定させる音声の再入力を促すステップを付加したことを特徴とする音声入力方法。The voice input method according to any one of claims 6 to 8,
A speech input method comprising a step of prompting re-input of speech for confirming a phrase when an uncertain phrase is included in the extracted phrase.
音声入力された注文内容から予め登録されている語句を一つずつ抽出する機能と、抽出された語句毎にその語句の意味が含まれる項目を判定する機能と、前記抽出された各語句の項目組合せパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する機能と、前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンであると判断されると前記各語句を音声入力データとして確定させる機能と、前記確定された音声入力注文データを前記伝票発行装置へ転送する機能と、を実現させる音声入力プログラム。To have a voice input function, which is connected to the slip issuing device for issuing a settlement documents computer,
A function of extracting one word or phrase registered in advance from the contents of the order input by voice; a function of determining an item including the meaning of the word for each extracted word; and an item of each extracted word or phrase combination pattern types of orders, and a function to determine a pattern or not to satisfy the order decision condition consisting of items of amount and payment, item combination pattern of each word is the extracted satisfies the order decision condition A speech input program that realizes a function of confirming each word / phrase as speech input data when determined to be a pattern and a function of transferring the confirmed speech input order data to the slip issuing device .
前記判断する機能は、前記抽出された各語句の項目に基づいて予め設定された複数の項目組合せパターンの中から適合するパターンを抽出し、この抽出したパターンが注文品の種類,量および決済方法の項目からなる注文確定条件を満足するパターンか否かを判断する機能であることを特徴とする音声入力プログラム。The voice input program according to claim 10,
The determining function extracts a matching pattern from a plurality of preset item combination patterns based on the extracted item of each word, and the extracted pattern is the type, quantity and settlement method of the order item. A voice input program, which is a function for determining whether or not the pattern satisfies the order confirmation condition consisting of the items .
前記抽出された各語句の項目組合せパターンが前記注文確定条件を満足するパターンでないと判断されたとき、当該注文確定条件を満足するのに不足している項目の意味を有する語句の音声再入力を促す機能をさらに実現させる音声入力プログラム。The voice input program according to claim 10 or 11, wherein the computer includes:
When it is determined that the extracted item combination pattern of each word is not a pattern that satisfies the order confirmation condition, speech re-input of a word having meaning of an item that is insufficient to satisfy the order confirmation condition is performed. A voice input program that further realizes the prompting function.
前記抽出された語句の中に不確定な語句が含まれるとき、その語句を確定させる音声の再入力を促す機能をさらに実現させる音声入力プログラム。The voice input program according to any one of claims 10 to 12, wherein the computer includes:
A speech input program that further realizes a function of prompting re-input of speech for confirming a phrase when an uncertain phrase is included in the extracted phrase.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119409A JP3964724B2 (en) | 2002-04-22 | 2002-04-22 | Voice input device and method, and voice input program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119409A JP3964724B2 (en) | 2002-04-22 | 2002-04-22 | Voice input device and method, and voice input program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003316388A JP2003316388A (en) | 2003-11-07 |
JP3964724B2 true JP3964724B2 (en) | 2007-08-22 |
Family
ID=29535979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002119409A Expired - Lifetime JP3964724B2 (en) | 2002-04-22 | 2002-04-22 | Voice input device and method, and voice input program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3964724B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4584615B2 (en) * | 2004-04-21 | 2010-11-24 | 東芝テック株式会社 | Voice recognition result printing device |
JP5452407B2 (en) * | 2010-07-30 | 2014-03-26 | 株式会社日立製作所 | Operator input support method and apparatus |
JP6712940B2 (en) * | 2016-10-27 | 2020-06-24 | トッパン・フォームズ株式会社 | Voice input device, voice input method |
JP7334420B2 (en) * | 2019-02-21 | 2023-08-29 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05197389A (en) * | 1991-08-13 | 1993-08-06 | Toshiba Corp | Voice recognition device |
JPH05216618A (en) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | Voice interactive system |
JPH07234694A (en) * | 1994-02-21 | 1995-09-05 | N T T Data Tsushin Kk | Automatic reception device |
JP3061343B2 (en) * | 1994-03-07 | 2000-07-10 | 株式会社日立製作所 | Automatic trading system |
JPH11338494A (en) * | 1998-05-22 | 1999-12-10 | Toshiba Corp | Voice recognition system and method |
-
2002
- 2002-04-22 JP JP2002119409A patent/JP3964724B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003316388A (en) | 2003-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7860795B2 (en) | Systems and methods for processing check identifiers using replacement symbols | |
US5859416A (en) | Fuel pump system with automated transaction processing | |
US10572852B2 (en) | Software application for the automated drop-off and pick-up of a service item at a service facility | |
US20030105714A1 (en) | System and method for currency selectable stored value instrument | |
US20030172030A1 (en) | Payee match positive pay banking | |
KR100848998B1 (en) | Transaction cooperation method in shop system | |
JP3964724B2 (en) | Voice input device and method, and voice input program | |
JP3915464B2 (en) | Ticket processing apparatus and program | |
US20040133303A1 (en) | Method for object delivery | |
CN109191128A (en) | Interior method of payment and cloud server based on Application on Voiceprint Recognition and static password | |
US10885904B2 (en) | Electronic speech to text conversion systems and methods with natural language capture of proper name spelling | |
JP3945187B2 (en) | Dialog management device | |
CN113935802A (en) | Information processing method, device, equipment and storage medium | |
KR20230098424A (en) | Method of processing ic cash settlement for ic card | |
WO2021000633A1 (en) | Road rescue data processing method, apparatus, computer device, and storage medium | |
CN112508547A (en) | Cash withdrawal execution method, system, computer device and storage medium | |
JPH11120269A (en) | Voice input accounting system and medium voice input accounting program is stored | |
JP2010266936A (en) | Petty cash settlement device and method, and computer program | |
JP2021128692A (en) | Information processing program, device, and method | |
JP4516376B2 (en) | Form processing system | |
JPS6084665A (en) | Credit transaction processor using card | |
JP2024046095A (en) | Automatic ticket vending system | |
JP2008204351A (en) | Screen display control method in ticket vendor, ticket vendor, and ticket selling system | |
JP3195133B2 (en) | Election reception device | |
JPH0757123A (en) | Automatic ticket vending machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050107 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050113 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070524 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3964724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100601 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110601 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |