JP6141483B1 - Speech translation device, speech translation method, and speech translation program - Google Patents
Speech translation device, speech translation method, and speech translation program Download PDFInfo
- Publication number
- JP6141483B1 JP6141483B1 JP2016066157A JP2016066157A JP6141483B1 JP 6141483 B1 JP6141483 B1 JP 6141483B1 JP 2016066157 A JP2016066157 A JP 2016066157A JP 2016066157 A JP2016066157 A JP 2016066157A JP 6141483 B1 JP6141483 B1 JP 6141483B1
- Authority
- JP
- Japan
- Prior art keywords
- order
- content
- speech
- input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims description 28
- 238000003860 storage Methods 0.000 claims abstract description 47
- 230000006870 function Effects 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 abstract description 25
- 230000014616 translation Effects 0.000 description 83
- 238000012545 processing Methods 0.000 description 25
- 235000013405 beer Nutrition 0.000 description 24
- 230000008569 process Effects 0.000 description 16
- 238000010079 rubber tapping Methods 0.000 description 14
- 238000012790 confirmation Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】接客において、円滑なコミュニケーションを図りつつ、対話の内容を分析することにより、注文情報を簡易かつ有効に取得する。【解決手段】本発明の一態様による音声翻訳装置は、ユーザ等の音声を入力するための入力部、入力音声の内容を異なる言語の内容に翻訳する翻訳部、入力音声の翻訳内容を音声等で出力する出力部、ユーザ等が選択可能なように定型フレーズを表示する表示部、ユーザからの注文の問い合わせに対する対話者による注文が確定したか否かを判定する判定部、注文が確定したと判定されたときに、その注文の確定内容を記憶する記憶部を備える。そして、判定部は、例えば、入力音声の内容、又は、選定された定型フレーズの内容に、商品名、注文数量、及びクロージングが含まれている場合に、注文が完了したと判定する。【選択図】図2Order information can be acquired easily and effectively by analyzing the contents of a dialogue while facilitating smooth communication. A speech translation apparatus according to an aspect of the present invention includes an input unit for inputting speech of a user or the like, a translation unit for translating the content of the input speech into content of a different language, the translation content of the input speech as speech, etc. The output unit, the display unit that displays a fixed phrase so that the user can select it, the determination unit that determines whether or not the order by the interrogator for the order inquiry from the user is confirmed, and the order is confirmed When the determination is made, a storage unit is provided for storing the confirmed contents of the order. The determination unit determines that the order has been completed when, for example, the content of the input voice or the content of the selected fixed phrase includes the product name, the order quantity, and the closing. [Selection] Figure 2
Description
本発明は、音声翻訳装置、音声翻訳方法、及び音声翻訳プログラムに関する。 The present invention relates to a speech translation device, a speech translation method, and a speech translation program.
従来、チェーンや独立した小売店舗等において、販売時点情報管理(Point of Sale;POS)機能を有するキャッシュレジスタ(以下「POSレジスタ」という)を用い、店舗や商品毎の注文情報や会計情報を取得する技術が知られている(例えば特許文献1、及び特許文献1に記載された各特許文献)。また、近時、飲食店をはじめとして、従業員が移動端末装置を操作し、客から注文(オーダー)された飲食メニューと数量を入力することにより、注文情報を取得するオーダーエントリーシステム(以下「OES」という)も導入されている(例えば特許文献2)。こうして取得された注文情報や会計情報は、店舗や商品毎の売上分析や在庫管理等に供され得る。
Conventionally, in a chain or an independent retail store, etc., using a cash register (hereinafter referred to as “POS register”) having a point-of-sale information management (POS) function, order information and accounting information for each store and product are obtained. The technique which performs is known (for example, each patent document described in
一方、例えば店舗の店員と外国人客との会話を行うための音声翻訳アプリケーション(例えば非特許文献1)や、ユーザが会話を行いたいシチュエーション(レストラン、ショッピング等)を選択することにより、目的別の会話パターンがリスト表示される翻訳アプリケーション(例えば非特許文献2)も知られている。 On the other hand, for example, by selecting a speech translation application (for example, Non-Patent Document 1) for carrying out a conversation between a store clerk and a foreign customer, or a situation (restaurant, shopping, etc.) that the user wants to carry out a conversation, A translation application (for example, Non-Patent Document 2) that displays a list of conversation patterns is also known.
ところで、上記従来の技術を組み合わせることにより、例えば翻訳アプリケーションを使用して外国人客の注文を聞き、その注文内容をOESやPOSレジスタに入力し、こうして取得した注文情報を、店舗や商品毎の売上分析や在庫管理のために用いることが想起される。しかし、かかる手法では、翻訳アプリケーションを実行する端末装置とOESやPOSレジスタの端末装置が必要であり、それらを操作して注文情報を取得する作業が煩雑となってしまう。また、OESやPOSレジスタ機能を有するアプリケーションを、翻訳アプリケーションと同じ端末装置上で動作させることも考えられるが、この場合でも、複数のアプリケーションを操作する必要があり、依然として作業は煩雑なものとなってしまう。 By the way, by combining the above conventional techniques, for example, using a translation application, a foreign customer's order is heard, the contents of the order are entered into the OES or POS register, and the order information thus obtained is stored for each store or product. It is recalled for use in sales analysis and inventory management. However, such a technique requires a terminal device that executes a translation application and a terminal device such as an OES or POS register, and the operation of operating them to acquire order information becomes complicated. In addition, it may be possible to operate an application having an OES or POS register function on the same terminal device as the translation application. However, even in this case, it is necessary to operate a plurality of applications, and the work is still complicated. End up.
また、店舗や商品毎の売上分析により、例えば、その時点で人気の商品や飲食メニューを抽出し、それらを推奨商品や推奨飲食メニューとして客に勧めるといった営業も可能である。しかし、外国人客に対しては、そういった推奨商品や推奨飲食メニューの分析結果を一旦取得した上で、上述した翻訳アプリケーションを用いて客に勧める必要があるため、この場合の作業も煩雑となり、それに起因して、外国人客との円滑なコミュニケーションを行うことが困難となり、接客の質が低下してしまうおそれがある。 In addition, by sales analysis for each store or product, for example, it is possible to extract popular products and food and drink menus at that time and recommend them to customers as recommended products and recommended food and drink menus. However, for foreign customers, it is necessary to obtain the analysis results of such recommended products and recommended food and drink menus, and then recommend them to customers using the translation application described above. As a result, smooth communication with foreign customers becomes difficult, and the quality of customer service may be reduced.
そこで、本発明は、かかる事情に鑑みてなされたものであり、ユーザによる対話者(外国人客)への接客において、円滑なコミュニケーションを図りつつ、対話の内容を分析することにより注文情報を簡易かつ有効に取得し、これにより、接客の最適化、並びに、ユーザ店舗の売上及び利益の向上に寄与することができる音声翻訳装置、音声翻訳方法、及び音声翻訳プログラムを提供することを目的とする。 Therefore, the present invention has been made in view of such circumstances, and it is possible to simplify the order information by analyzing the contents of the dialogue while facilitating smooth communication when the user interacts with the conversation person (foreign customer). An object of the present invention is to provide a speech translation device, a speech translation method, and a speech translation program that can be acquired effectively and thereby contribute to the optimization of customer service and the improvement of sales and profits of user stores. .
上記課題を解決するため、本発明の一態様による音声翻訳装置は、ユーザ及び/又は対話者の音声を入力するための入力部と、入力音声の内容を異なる言語の内容に翻訳する翻訳部と、入力音声の翻訳内容を音声及び/又はテキストで出力する出力部と、ユーザ及び/又は対話者が選択可能なように定型フレーズを表示する表示部と、ユーザからの注文の問い合わせに対する対話者による注文が確定したか否かを判定する判定部と、注文が確定したと判定されたときに、その注文の確定内容を記憶する記憶部を備える。そして、判定部が、(1)入力音声の内容、又は、選定された定型フレーズの内容に、商品名、注文数量、及びクロージングが含まれている場合、又は、(2)入力音声の内容、又は、選定された定型フレーズの内容に、商品名が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。 In order to solve the above problems, a speech translation apparatus according to an aspect of the present invention includes an input unit for inputting a voice of a user and / or a dialoguer, and a translation unit for translating the content of the input speech into content of a different language An output unit that outputs the translated content of the input speech as a voice and / or text, a display unit that displays a fixed phrase so that the user and / or the dialogue can be selected, and a dialogue by the user regarding an order inquiry from the user A determination unit that determines whether or not the order has been confirmed, and a storage unit that stores the confirmed content of the order when it is determined that the order has been confirmed. And when the determination unit includes (1) the content of the input voice or the content of the selected fixed phrase includes the product name, the order quantity, and the closing, or (2) the content of the input voice, Alternatively, when the product name is included in the content of the selected fixed phrase and there is an operation indicating the end of the conversation, it is determined that the order is confirmed.
なお、「定型フレーズ」には、文、節、句、語、及び数字が含まれ、また、それらに付随して画像又は記号が含まれていてもよい。また、「クロージング」とは、会話の終了を意味するフレーズ(例えば、注文の問い合わせに対する注文を受け付けて確認した旨を表す又は含意するフレーズ)を含む。さらに、「会話の終了を示す操作」とは、会話を終了する意思表示(例えば、当該音声翻訳装置上で動作する本発明による音声翻訳アプリケーションを終了したり、当該音声翻訳アプリケーションにおける所定の処理を終了したりする操作及び動作)を含む。 The “standard phrase” includes sentences, clauses, phrases, words, and numbers, and may include images or symbols accompanying them. “Closing” includes a phrase meaning the end of the conversation (for example, a phrase indicating or implying that the order has been accepted and confirmed). Further, the “operation indicating the end of the conversation” means an intention to end the conversation (for example, the termination of the speech translation application according to the present invention operating on the speech translation device, or a predetermined process in the speech translation application). Operation and operation).
さらに、表示部が、商品名のリストを表示し、かつ、記憶部に記憶された注文数量の総数がより多い商品名をリストにおいてより高い順位に表示するように構成しても好適である。 Further, the display unit may be configured to display a list of product names and display product names having a larger total number of order quantities stored in the storage unit in a higher order in the list.
またさらに、記憶部が、商品名毎の会計数量を記憶し、表示部が、記憶部に記憶された商品名のリストを表示し、かつ、会計数量の総数がより多い商品名を前記リストにおいてより高い順位に表示するように構成しても好適である。 Still further, the storage unit stores the accounting quantity for each product name, the display unit displays a list of product names stored in the storage unit, and the product name having a larger total number of accounting quantities in the list. It is also preferable to display the images in a higher order.
さらにまた、記憶部が、商品名毎の利益率を記憶し、表示部が、商品名のリストを表示し、かつ、利益率がより高い商品名をリストにおいてより高い順位に表示するように構成しても好適である。 Furthermore, the storage unit stores the profit rate for each product name, the display unit displays a list of product names, and the product name having a higher profit rate is displayed in a higher order in the list. Even it is suitable.
また、定型フレーズは、ユーザが属する業種毎又はユーザの店舗毎に、自動又は手動で予め設定されたものであってもよい。 Further, the fixed phrase may be set automatically or manually in advance for each type of business to which the user belongs or for each store of the user.
さらに、表示部が、各定型フレーズの異なる言語による訳文を表示し、又は、出力部が、各定型フレーズの異なる言語による訳文を音声で出力してもよい。 Further, the display unit may display a translation of each fixed phrase in a different language, or the output unit may output a translation of each fixed phrase in a different language by voice.
また、本発明の一態様による音声翻訳方法は、入力部、翻訳部、出力部、表示部、判定部、及び記憶部を備える音声翻訳装置を用いる方法である。すなわち、当該方法は、入力部が、ユーザ及び/又は対話者の音声を入力するステップと、翻訳部が、入力音声の内容を異なる言語の内容に翻訳するステップと、出力部が、入力音声の翻訳内容を音声及び/又はテキストで出力するステップと、表示部が、ユーザ及び/又は対話者が選択可能なように定型フレーズを表示するステップと、判定部が、ユーザからの注文の問い合わせに対する対話者による注文が確定したか否かを判定するステップと、記憶部が、注文が確定したと判定されたときに、その注文の確定内容を記憶するステップを含む。そして、判定するステップにおいては、(1)入力音声の内容、又は、選定された定型フレーズの内容に、商品名、注文数量、及びクロージングが含まれている場合、又は、(2)入力音声の内容、又は、選定された定型フレーズの内容に、商品名が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。 A speech translation method according to an aspect of the present invention is a method using a speech translation apparatus including an input unit, a translation unit, an output unit, a display unit, a determination unit, and a storage unit. That is, in the method, the input unit inputs the voice of the user and / or the conversation person, the translation unit translates the content of the input voice into different language content, and the output unit The step of outputting the translation contents by voice and / or text, the step of displaying a fixed phrase so that the display unit can be selected by the user and / or the dialog, and the determination unit interacting with the inquiry about the order from the user A step of determining whether or not the order by the person has been confirmed, and a step of storing the confirmed content of the order when the storage unit determines that the order has been confirmed. In the determining step, (1) the content of the input voice or the content of the selected fixed phrase includes the product name, the order quantity, and the closing, or (2) the input voice When the product name is included in the content or the content of the selected fixed phrase and there is an operation indicating the end of the conversation, it is determined that the order is confirmed.
また、本発明の一態様による音声翻訳プログラムは、コンピュータ(単数又は単一種に限られず、複数又は複数種でもよい;以下同様)を、ユーザ及び/又は対話者の音声を入力するための入力部と、入力音声の内容を異なる言語の内容に翻訳する翻訳部と、入力音声の翻訳内容を音声及び/又はテキストで出力する出力部と、ユーザ及び/又は対話者が選択可能なように定型フレーズを表示する表示部と、ユーザからの注文の問い合わせに対する対話者による注文が確定したか否かを判定する判定部と、注文が確定したと判定されたときに、その注文の確定内容を記憶する記憶部として機能させる。そして、判定部が、(1)入力音声の内容、又は、選定された定型フレーズの内容に、商品名、注文数量、及びクロージングが含まれている場合、又は、(2)入力音声の内容、又は、選定された定型フレーズの内容に、商品名が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。 In addition, the speech translation program according to one aspect of the present invention is a computer (not limited to a single type or a single type, but may be a plurality or a plurality of types; the same shall apply hereinafter), and an input unit for inputting a voice of a user and / or a conversation person A translation unit that translates the content of the input speech into a different language content, an output unit that outputs the translation content of the input speech as speech and / or text, and a fixed phrase that can be selected by the user and / or the interlocutor , A determination unit for determining whether or not the order by the interrogator for the order inquiry from the user is confirmed, and when the order is determined to be determined, the determined content of the order is stored It functions as a storage unit. And when the determination unit includes (1) the content of the input voice or the content of the selected fixed phrase includes the product name, the order quantity, and the closing, or (2) the content of the input voice, Alternatively, when the product name is included in the content of the selected fixed phrase and there is an operation indicating the end of the conversation, it is determined that the order is confirmed.
本発明によれば、ユーザによる対話者(外国人客)への接客時の会話において、ユーザからの注文の問い合わせに対する対話者による注文が確定したか否かを判定し、その確定内容を記憶することができる。特に、(1)発話された入力音声の内容、又は、選定された定型フレーズの内容に、商品名、注文数量、及びクロージングが含まれている場合、又は、(2)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、商品名が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。すなわち、本発明によれば、ユーザによる対話者(外国人客)への接客において、会話を通じて円滑なコミュニケーションを図りつつ、対話の内容を分析することにより注文情報を簡易かつ有効に取得することができる。また、これにより、接客の最適化、並びに、ユーザ店舗の売上及び利益の向上に寄与することが可能となる。 According to the present invention, it is determined whether or not an order by a conversation person in response to an order inquiry from a user is confirmed in a conversation when the user interacts with a conversation person (foreigner customer), and the confirmed content is stored. be able to. In particular, (1) when the content of the spoken input speech or the content of the selected fixed phrase includes a product name, order quantity, and closing, or (2) the content of the input speech, Alternatively, when the product name is included in the content of the selected fixed phrase and there is an operation indicating the end of the conversation, it is determined that the order has been confirmed. That is, according to the present invention, order information can be acquired easily and effectively by analyzing the contents of a dialog while conducting smooth communication through a conversation when a user interacts with a dialog person (foreign customer). it can. In addition, this makes it possible to contribute to optimizing customer service and improving sales and profits of user stores.
以下、本発明の実施の形態について詳細に説明する。なお、以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施の形態を採用することが可能であり、かかる実施の形態も本発明の範囲に含まれる。またさらに、必要に応じて示す上下左右等の位置関係は、特に断らない限り、図示の表示に基づくものとする。さらにまた、図面における各種の寸法比率は、その図示の比率に限定されるものではない。 Hereinafter, embodiments of the present invention will be described in detail. The following embodiments are examples for explaining the present invention, and are not intended to limit the present invention only to the embodiments. The present invention can be variously modified without departing from the gist thereof. Furthermore, those skilled in the art can employ embodiments in which the elements described below are replaced with equivalent ones, and such embodiments are also included in the scope of the present invention. Furthermore, positional relationships such as up, down, left, and right shown as needed are based on the display shown unless otherwise specified. Furthermore, various dimensional ratios in the drawings are not limited to the illustrated ratios.
(装置構成)
図1は、本発明による音声翻訳装置に係るネットワーク構成等の好適な一実施形態を概略的に示すシステムブロック図である。この例において、音声翻訳装置100は、ユーザが使用する情報端末10(ユーザ装置)にネットワークNを介して電子的に接続されるサーバ20を備える(但し、これに限定されない)。
(Device configuration)
FIG. 1 is a system block diagram schematically showing a preferred embodiment such as a network configuration related to a speech translation apparatus according to the present invention. In this example, the
情報端末10は、例えば、タッチパネル等のユーザインターフェイス及び視認性が高いディスプレイを採用する。また、ここでの情報端末10は、ネットワークNとの通信機能を有するスマートフォンに代表される携帯電話を含む可搬型のタブレット型端末装置である。さらに、情報端末10は、プロセッサ11、記憶資源12、音声入出力デバイス13、通信インターフェイス14、入力デバイス15、表示デバイス16、及びカメラ17を備えている。また、情報端末10は、インストールされた音声翻訳アプリケーションソフト(本発明の一実施形態による音声翻訳プログラムの少なくとも一部)が動作することにより、本発明の一実施形態による音声翻訳装置の一部又は全部として機能するものである。
The
プロセッサ11は、算術論理演算ユニット及び各種レジスタ(プログラムカウンタ、データレジスタ、命令レジスタ、汎用レジスタ等)から構成される。また、プロセッサ11は、記憶資源12に格納されているプログラムP10である音声翻訳アプリケーションソフトを解釈及び実行し、各種処理を行う。このプログラムP10としての音声翻訳アプリケーションソフトは、例えばサーバ20からネットワークNを通じて配信可能なものであり、手動で又は自動でインストール及びアップデートされてもよい。
The
なお、ネットワークNは、例えば、有線ネットワーク(近距離通信網(LAN)、広域通信網(WAN)、又は付加価値通信網(VAN)等)と無線ネットワーク(移動通信網、衛星通信網、ブルートゥース(Bluetooth(登録商標))、WiFi(Wireless Fidelity)、HSDPA(High Speed Downlink Packet Access)等)が混在して構成される通信網である。 The network N includes, for example, a wired network (a short-range communication network (LAN), a wide-area communication network (WAN), a value-added communication network (VAN), etc.) and a wireless network (mobile communication network, satellite communication network, Bluetooth ( Bluetooth (registered trademark)), WiFi (Wireless Fidelity), HSDPA (High Speed Downlink Packet Access), etc.).
記憶資源12は、物理デバイス(例えば、半導体メモリ等のコンピュータ読み取り可能な記録媒体)の記憶領域が提供する論理デバイスであり、情報端末10の処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、各種データ等を格納する。ドライバプログラムとしては、例えば、音声入出力デバイス13を制御するための入出力デバイスドライバプログラム、入力デバイス15を制御するための入力デバイスドライバプログラム、表示デバイス16を制御するための表示デバイスドライバプログラム等が挙げられる。さらに、音声入出力デバイス13は、例えば、一般的なマイクロフォン、及びサウンドデータを再生可能なサウンドプレイヤである。
The storage resource 12 is a logical device provided by a storage area of a physical device (for example, a computer-readable recording medium such as a semiconductor memory), and an operating system program, a driver program, various data, etc. used for processing of the
通信インターフェイス14は、例えばサーバ20との接続インターフェイスを提供するものであり、無線通信インターフェイス及び/又は有線通信インターフェイスから構成される。また、入力デバイス15は、例えば、表示デバイス16に表示されるアイコン、ボタン、仮想キーボード、テキスト等のタップ動作による入力操作を受け付けるインターフェイスを提供するものであり、タッチパネルの他、情報端末10に外付けされる各種入力装置を例示することができる。
The
表示デバイス16は、画像表示インターフェイスとして各種の情報をユーザや対話者(会話の相手方)に提供するものであり、例えば、有機ELディスプレイ、液晶ディスプレイ、CRTディスプレイ等が挙げられる。また、カメラ17は、種々の被写体の静止画や動画を撮像するためのものである。
The
サーバ20は、例えば、演算処理能力の高いホストコンピュータによって構成され、そのホストコンピュータにおいて所定のサーバ用プログラムが動作することにより、サーバ機能を発現するものであり、例えば、音声認識サーバ、翻訳サーバ、及び音声合成サーバとして機能する単数又は複数のホストコンピュータから構成される(図示においては単数で示すが、これに限定されない)。そして、各サーバ20は、プロセッサ21、通信インターフェイス22、及び記憶資源23を備える。
The
プロセッサ21は、算術演算、論理演算、ビット演算等を処理する算術論理演算ユニット及び各種レジスタ(プログラムカウンタ、データレジスタ、命令レジスタ、汎用レジスタ等)から構成され、記憶資源23に格納されているプログラムP20を解釈及び実行し、所定の演算処理結果を出力する。また、通信インターフェイス22は、ネットワークNを介して情報端末10に接続するためのハードウェアモジュールであり、例えば、ISDNモデム、ADSLモデム、ケーブルモデム、光モデム、ソフトモデム等の変調復調装置である。
The
記憶資源23は、例えば、物理デバイス(ディスクドライブ又は半導体メモリ等のコンピュータ読み取り可能な記録媒体等)の記憶領域が提供する論理デバイスであり、それぞれ単数又は複数のプログラムP20、各種モジュールL20、各種データベースD20、及び各種モデルM20が格納されている。また、記憶資源23には、ユーザが対話者へ話しかけるために予め用意された複数の質問定型文、入力音声の履歴データ、各種設定用のデータ、後述する商品(メニュー)の注文確定内容等も記憶されている。
The
プログラムP20は、サーバ20のメインプログラムである上述したサーバ用プログラム等である。また、各種モジュールL20は、情報端末10から送信されてくる要求及び情報に係る一連の情報処理を行うため、プログラムP10の動作中に適宜呼び出されて実行されるソフトウェアモジュール(モジュール化されたサブプログラム)である。かかるモジュールL20としては、音声認識モジュール、翻訳モジュール、音声合成モジュール等が挙げられる。
The program P20 is the above-described server program that is the main program of the
また、各種データベースD20としては、音声翻訳処理のために必要な各種コーパス(例えば、日本語と英語の音声翻訳の場合、日本語音声コーパス、英語音声コーパス、日本語文字(語彙)コーパス、英語文字(語彙)コーパス、日本語辞書、英語辞書、日英対訳辞書、日英対訳コーパス等)、音声データベース、ユーザに関する情報を管理するための管理用データベース、後述する注文履歴データベース等が挙げられる。また、各種モデルM20としては、音声認識に使用する音響モデルや言語モデル等が挙げられる。 The various databases D20 include various corpora required for speech translation processing (for example, in the case of Japanese and English speech translation, a Japanese speech corpus, an English speech corpus, a Japanese character (vocabulary) corpus, an English character) (Vocabulary) Corpus, Japanese dictionary, English dictionary, Japanese-English bilingual dictionary, Japanese-English bilingual corpus, etc.), speech database, management database for managing information related to users, order history database to be described later, and the like. Examples of the various models M20 include acoustic models and language models used for speech recognition.
(第1実施形態)
以上のとおり構成された音声翻訳装置100における音声翻訳処理の操作及び動作の一例(第1実施形態)について、以下に更に説明する。図2は、第1乃至第3実施形態の音声翻訳装置100における処理の流れ(の一部)の一例を示すフローチャートである。また、図4(A)乃至(C)は、情報端末における表示画面の遷移の一例を示す平面図である。なお、ここでは、情報端末10のユーザが日本語を話す飲食店等の店員であり、対話者(会話の相手)が英語を話す外国人客である場合の会話を想定する(但し、言語やシチュエーションはこれに限定されない)。
(First embodiment)
An example (first embodiment) of speech translation processing operations and operations in the
まず、ユーザ(店員)が当該アプリケーションを起動する(ステップSU1)と、情報端末10の表示デバイス16に、図4(A)に示す対話者の言語選択画面が表示される(ステップSJ1)。この言語選択画面には、対話者に言語を尋ねることをユーザに促すための日本語のテキストT1、対話者に言語を尋ねる旨の英語のテキストT2、及び、想定される複数の代表的な言語(ここでは、英語、中国語(例えば書体により2種類)、ハングル語)を示す言語ボタン41が表示される。さらにその下方には、言語選択画面を閉じて当該アプリケーションを終了するためのキャンセルボタンB1も表示される。
First, when the user (clerk) activates the application (step SU1), the language selection screen for the conversation person shown in FIG. 4A is displayed on the
このとき、図4(A)に示す如く、日本語のテキストT1及び英語のテキストT2は、プロセッサ11及び表示デバイス16により、情報端末10の表示デバイス16の画面において、異なる領域によって区分けされ、且つ、互いに逆向き(互いに異なる向き;図示において上下逆向き)に表示される。これにより、ユーザと対話者が対面している状態で会話を行う場合、ユーザは日本語のテキストT1を確認し易い一方、対話者は、英語のテキストT2を確認し易くなる。また、日本語のテキストT1と英語のテキストT2が区分けして表示されるので、両者を明別して更に視認し易くなる利点がある。
At this time, as shown in FIG. 4A, the Japanese text T1 and the English text T2 are divided by the
ユーザがその言語選択画面における英語のテキストT2の表示を対話者に提示し、対話者に例えば英語(English)のボタンをタップしてもらうことにより、又は、ユーザが自ら、対話者の言語を選択することができる。こうして対話者の言語が選択されると、サーバ20のプロセッサ21及び情報端末10のプロセッサ11により、ホーム画面として、日本語と英語の音声入力待機画面が表示デバイス16に表示される(図4(B);ステップSJ2)。この音声入力待機画面には、ユーザと対話者の言語の何れを発話するかを問う日本語のテキストT3、並びに、日本語の音声入力を行うための入力ボタン42a及び英語の音声入力を行うための入力ボタン42bが表示される。
The user presents the display of the English text T2 on the language selection screen to the conversation person, and the conversation person taps the English button, for example, or the user himself selects the conversation person's language. can do. When the language of the conversation person is selected in this way, the
また、この音声入力待機画面には、予め設定されている複数の質問定型文のリスト表示を選択するためのお声がけボタン43、図4(A)の言語選択画面に戻って対話者の言語を切り替える(言語選択をやり直す)ための言語選択ボタン44、それまでになされた音声入力内容の履歴表示を選択するための履歴ボタン45、予め用意された複数の定型フレーズ(推奨フレーズ)群のなかから所望の定型フレーズを選択して会話を進めることができるサジェスト機能を実行するためのサジェストボタン46、及び当該アプリケーションソフトの各種設定を行うための設定ボタン47も表示される。
Also, on this voice input standby screen, a
ここで、ユーザと対話者の会話及び/又は会話準備における通常の音声翻訳処理の主要手順(図2におけるステップSJ3)の概要について説明する。まず、図4(B)に示す音声入力待機画面において、ユーザが日本語の入力ボタン42aをタップして日本語の音声入力を選択すると、ユーザの日本語による発話内容を受け付ける音声入力画面となる(図4(C))。この音声入力画面が表示されると、音声入出力デバイス13からの音声入力が可能な状態となる。また、この音声入力画面には、ユーザの音声入力を促すテキストT4、音声入力状態にあることを示すマイク図案48、及びテキスト入力へ切り替えるための入力切替ボタン50が表示される。さらに、この音声入力画面にも、キャンセルボタンB1が表示され、これをタップすることにより、会話を終了するか、音声入力待機画面(図4(B))へ戻って音声入力をやり直すことができる。
Here, an outline of a main procedure of normal speech translation processing (step SJ3 in FIG. 2) in the conversation between the user and the conversation person and / or the conversation preparation will be described. First, on the voice input standby screen shown in FIG. 4 (B), when the user taps the
この状態で、ユーザが対話者への伝達事項等を発話する(ステップSU2)と、テキストT4とともに、その声量の大小を模式的に且つ動的に表す多重円形図案49が表示され、音声入力レベルが発話者であるユーザへ視覚的にフィードバックされる。それから、発話が終了し、ユーザがマイク図案48をタップすると、プロセッサ11は、ユーザによる発話内容の受け付けを終了する。情報端末10のプロセッサ11は、その音声入力に基づいて音声信号を生成し、その音声信号を通信インターフェイス14及びネットワークNを通してサーバ20へ送信する。このとおり、情報端末10自体、又はプロセッサ11及び音声入出力デバイス13が「入力部」として機能する。
In this state, when the user utters an item to be communicated to the talker (step SU2), a
次に、サーバ20のプロセッサ21は、通信インターフェイス22を通してその音声信号を受信し、音声認識処理を行う。このとき、プロセッサ21は、記憶資源23から、必要なモジュールL20、データベースD20、及びモデルM20(音声認識モジュール、日本語音声コーパス、音響モデル、言語モデル等)を呼び出し、入力音声の「音」を「読み」(文字)へ変換する。このとおり、プロセッサ21、又は、サーバ20が全体として「音声認識サーバ」として機能する。また、プロセッサ21は、認識された内容を、音声入力の履歴データとして、記憶資源23に(必要に応じて適宜のデータベースに)記憶する。
Next, the
次いで、プロセッサ21は、その入力音声の認識結果を、情報端末10に送信し、プロセッサ11は、それを日本語のテキストとして画面表示する(図示省略)。このとき、入力音声の認識結果をそのまま表示してもよいし、予め記憶資源23に記憶されている日本語の会話コーパスのなかから、実際の入力音声の内容に対応するものを呼び出して表示してもよい。
Next, the
続いて、プロセッサ21は、認識された音声の「読み」(文字)を他の言語に翻訳する多言語翻訳処理へ移行する。このとき、プロセッサ21は、記憶資源23から、必要なモジュールL20及びデータベースD20(翻訳モジュール、日本語文字コーパス、日本語辞書、英語辞書、日英対訳辞書、日英対訳コーパス等)を呼び出し、認識結果である入力音声の「読み」(文字列)を適切に並び替えて日本語の句、節、文等へ変換し、その変換結果に対応する英語を抽出し、それらを英文法に従って並び替えて自然な英語の句、節、文等へと変換する。このとおり、プロセッサ21は、「翻訳部」としても機能し、サーバ20は、全体として「翻訳サーバ」としても機能する。なお、入力音声が正確に認識されなかった場合には、音声の再入力を行うことができる(図示省略)。なお、プロセッサ21は、それらの日本語及び英語の句、節、文等を、記憶資源23に記憶しておくこともできる。
Subsequently, the
それから、プロセッサ21は、音声合成処理へ移行する。このとき、プロセッサ21は、記憶資源23から、必要なモジュールL20、データベースD20、及びモデルM20(音声合成モジュール、英語音声コーパス、音響モデル、言語モデル等)を呼び出し、翻訳結果である英語の句、節、文等を自然な音声に変換する。このとおり、プロセッサ21は、「音声合成部」としても機能し、サーバ20は、全体として「音声合成サーバ」としても機能する。
Then, the
そして、プロセッサ21は、合成された音声に基づいて音声出力用の音声信号を生成し、通信インターフェイス22及びネットワークNを通して、情報端末10へ送信する。情報端末10のプロセッサ11は、通信インターフェイス14を通してその音声信号を受信し、音声入出力デバイス13を用いて、音声出力処理を行う(ここまでステップSJ3)。このとおり、プロセッサ11及び音声入出力デバイス13が、「出力部」として機能する。なお、音声出力に先立って、ユーザの音声認識結果とその翻訳結果を、情報端末10に一旦表示し、ユーザによる確認後に、音声出力を行うようにしてもよい(図示省略)。
Then, the
次に、本実施形態におけるより具体的な処理の流れとして、ユーザが対話者の注文をとる際の会話における処理の一例について、更に説明する。まず、ユーザが、音声入力画面(図4(C))に向かって、注文の問い合わせ(例えば「ご注文をお聞きしてもよろしいでしょうか?」というフレーズ)を発話し、その音声を情報端末10に入力する(ステップSU2)。 Next, as a more specific processing flow in the present embodiment, an example of processing in conversation when the user places an order for a conversation person will be further described. First, the user speaks an order inquiry (for example, the phrase “Are you sure you want to hear your order?”) Toward the voice input screen (FIG. 4C), and the voice is sent to the information terminal. 10 (step SU2).
その音声信号を受信したサーバ20のプロセッサ21は、音声認識、多言語翻訳(例えば「ご注文をお聞きしてもよろしいでしょうか?」の対訳である「May I have your order, please?」を訳出する)、及びその音声及び/又はテキスト出力までの処理を行う(ステップSJ3)。それから、プロセッサ21は、ユーザの注文の問い合わせに対する対話者の注文が確定(完了)したか否かの判定を行う(ステップSJ4)。具体的には、(1)それまでの会話(入力音声)の内容に、商品名(メニュー名)、注文数量、及びクロージングが含まれている場合、又は、(2)それまでの会話の内容に、商品名が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。
The
本第1実施形態は、上記(1)の場合に該当し、より具体的には、例えば、以下のとおりである。まず、プロセッサ21が、音声認識した入力音声の内容について形態素解析を行って形態素を取得し、さらに必要に応じて、多言語翻訳処理において記憶資源23に記憶した入力音声の句、節、文等を呼び出す。そして、それらの形態素、句、節、文等が、予め設定しておいた商品名(メニュー名)、注文数量、及び、クロージングに合致するか否かを判定する。すなわち、それまでの会話内容に、商品名、注文数量、及び、クロージングのそれぞれに合致する項目が全てあった場合には、注文が確定したと判定する(ステップSJ4においてYes)。また、(2)の場合、より具体的には、それまでの会話内容に、商品名に合致する項目があり、かつ、キャンセルボタンB1のタップといった会話の終了を示す操作があった場合に、注文が確定したと判定する(ステップSJ4においてYes)。一方、上記(1)及び(2)の何れにも該当しない場合には、注文が確定していないと判定する(ステップSJ4においてNo)。
The first embodiment corresponds to the case of (1) above, and more specifically, for example, as follows. First, the
ここでは、注文の問い合わせ(「ご注文をお聞きしてもよろしいでしょうか?」)が発話されたばかりの段階であって、会話の内容には、商品名、注文数量、及び、クロージングの何れも含まれておらず((1)及び(2)の何れにも非該当)、プロセッサ21は、注文が確定していないと判定(ステップSJ4においてNo)し、対話者の発話(ステップSU2)へ移行する。
Here, the order inquiry ("Are you sure you want to ask me?") Has just been uttered, and the content of the conversation includes product name, order quantity, and closing. It is not included (not applicable to either (1) or (2)), the
次に、対話者が問い合わせへの回答として、メニュー名と数量(例えば「生ビールを2つお願いします。」に対応する「Two draft beer, please.」)を発話して、注文を行う(ステップSU2)。プロセッサ21は、その発話内容について、音声認識、多言語翻訳、及びその音声及び/又はテキスト出力までの処理(ステップSJ3)を行い、続いて、注文の確定判定を行う(ステップSJ4)。
Next, as an answer to the inquiry, the dialog person utters the menu name and quantity (for example, “Two draft beer, please.” Corresponding to “Two draft beer please.”) And places an order (step SU2). The
ここでは、注文内容(「生ビールを2つお願いします。」)が発話された段階であって、それまでの会話の内容には、商品名(「生ビール」)及び注文数量(「2つ」)が含まれているものの、未だクロージングは含まれておらず、また、キャンセルボタンB1のタップといった会話の終了を示す操作もないため、プロセッサ21は、注文が確定していないと判定(ステップSJ4においてNo)し、再度、ユーザによる発話(ステップSU2)へ移行する。
Here, the order details (“Two draft beers please.”) Are spoken, and the content of the conversation so far includes the product name (“draft beer”) and the order quantity (“two”). ) Is included, but the closing is not yet included, and there is no operation indicating the end of the conversation such as tapping the cancel button B1, so the
次に、対話者の注文に対して、ユーザがクロージング(例えば「ありがとうございます。」、「只今お持ちします。」等)のフレーズを発話する(ステップSU2)。プロセッサ21は、その発話内容について、音声認識、多言語翻訳、及びその音声及び/又はテキスト出力までの処理(ステップSJ3)を行い、続いて、注文の確定判定を行う(ステップSJ4)。
Next, the user utters a closing phrase (for example, “Thank you”, “I have it now”) in response to the order of the conversation person (step SU2). The
この段階で、クロージング(「ありがとうございます。」、「只今お持ちします。」等)が発話されているので、それまでの会話の内容には、商品名(「生ビール」)、注文数量(「2つ」)、及びクロージングが全て含まれる。よって、プロセッサ21は、注文が確定したと判定する(ステップSJ4においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」とその数量である「2つ」を記憶資源23における適宜のデータベースに記憶する(ステップSJ5)。この場合、プロセッサ21は、その注文履歴データを、データベースD20のひとつとしての例えば注文履歴データベース内に保持してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, closing ("Thank you", "I'll have it now", etc.) is spoken, so the content of the conversation so far includes the product name ("Draft beer"), the order quantity ( “Two”) and closing are all included. Therefore, the
(第2実施形態)
次に、音声翻訳装置100における音声翻訳処理の操作及び動作の他の一例(第2実施形態)について説明する。この第2実施形態においては、ユーザの注文の問い合わせに対して対話者が注文(メニュー名及び数量)を行ったあとに、ユーザがクロージングのフレーズを発話しないで、図4(C)に示す音声入力画面において、キャンセルボタンB1を押して会話を終了すること以外は、第1実施形態と同様の処理を実行する。本第2実施形態は、上記(2)の場合に該当する。
(Second Embodiment)
Next, another example (second embodiment) of operations and operations of speech translation processing in the
すなわち、例えば、対話者が注文内容(「生ビールを2つお願いします。」)を発話した後、ユーザが、クロージングのフレーズを入力せずに、適宜の挨拶(例えば「かしこまりました。」や「ありがとうございます。」を示す英語等)を口頭やそれに代わる動作で対話者に伝えることによって注文の問い合わせを終了し(これはなくてもよい)、キャンセルボタンB1をタップして当該音声翻訳アプリケーションによる会話を終了する(会話の終了を示す操作)。そうすると、プロセッサ21は、キャンセルボタンB1のタップによる会話を終了する操作がなされたので、入力音声に関する処理であるステップSJ3をスキップし、注文の確定判定を行う(ステップSJ4)。
That is, for example, after a dialoguer utters the contents of an order (“Thank you for two draft beers.”), The user does not enter a closing phrase, and an appropriate greeting (for example, End the inquiry about the order by verbally or telling the interlocutor (in English indicating “Thank you.”) (Although this is not necessary), and tap the cancel button B1 to apply the speech translation application. End the conversation by (operation indicating the end of the conversation). Then, since the operation for ending the conversation by tapping the cancel button B1 has been performed, the
この段階で、それまでの会話の内容には、商品名(「生ビール」)が含まれており、かつ、キャンセルボタンB1のタップといった会話の終了を示す操作があったため、プロセッサ21は、注文が確定したと判定する(ステップSJ4においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」とその数量である「2つ」を記憶資源23に記憶する(ステップSJ5)。この場合も、プロセッサ21は、その注文履歴データを、データベースD20のひとつとしての例えば注文履歴データベース内に保持してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, since the content of the conversation so far includes the product name (“draft beer”) and there is an operation indicating the end of the conversation such as tapping the cancel button B1, the
(第3実施形態)
次に、音声翻訳装置100における音声翻訳処理の操作及び動作の他の一例(第3実施形態)について説明する。この第3実施形態においては、ユーザの注文の問い合わせに対して対話者が注文(メニュー名のみ)を行ったあとに、ユーザがクロージングのフレーズを発話しないで、図4(C)に示す音声入力画面において、キャンセルボタンB1を押して会話を終了すること以外は、第2実施形態と同様の処理を実行する。本第3実施形態も、上記(2)の場合に該当する。
(Third embodiment)
Next, another example (third embodiment) of speech translation processing operations and operations in the
すなわち、例えば一人で来店した対話者が注文内容(「生ビール」)を発話した後、ユーザが、クロージングのフレーズを入力せずに、適宜の挨拶(例えば「かしこまりました。」や「ありがとうございます。」を示す英語等)を口頭やそれに代わる動作で対話者に伝えることによって注文の問い合わせを終了し(これはなくてもよい)、キャンセルボタンB1をタップして当該音声翻訳アプリケーションによる会話を終了する(会話の終了を示す操作)。そうすると、プロセッサ21は、キャンセルボタンB1のタップによる会話を終了する操作がなされたので、入力音声に関する処理であるステップSJ3をスキップし、注文の確定判定を行う(ステップSJ4)。
That is, for example, after a dialog person who visited the store alone uttered the contents of the order ("draft beer"), the user did not enter a closing phrase, but an appropriate greeting (for example, "I was clever". (English, etc.) "is sent to the dialogue person verbally or in an alternative action, and the inquiry for the order is terminated (this is not necessary), and the conversation by the speech translation application is terminated by tapping the cancel button B1. (Operation indicating end of conversation). Then, since the operation for ending the conversation by tapping the cancel button B1 has been performed, the
この段階で、それまでの会話の内容には、商品名(「生ビール」)が含まれており、かつ、キャンセルボタンB1のタップといった会話の終了を示す操作があったため、プロセッサ21は、注文が確定したと判定する(ステップSJ4においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」を記憶資源23に記憶する(ステップSJ5)。このとき、注文数量を記憶しなくてもよいし、注文数量のデフォルト値を予め「1つ」と設定しておき、そのデフォルト値をその会話における注文数量として記憶してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, since the content of the conversation so far includes the product name (“draft beer”) and there is an operation indicating the end of the conversation such as tapping the cancel button B1, the
(第4実施形態)
続いて、音声翻訳装置100における音声翻訳処理の操作及び動作の他の一例(第4実施形態)について、以下に更に説明する。図3は、第4乃至第6実施形態の音声翻訳装置100における処理の流れ(の一部)の一例を示すフローチャートである。また、図5(A)乃至(D)は、情報端末における表示画面の遷移の一例を示す平面図である。この第4実施形態においては、ステップSJ2の後にステップSU4,SJ6を実行し、ステップSU2に代えてステップSU5を実行し、ステップSJ3に代えてステップSJ7を実行すること以外は、第1実施形態と同様の処理を実行する。なお、ステップSJ3に代わるステップSJ7は、ステップSJ4の後に実行する。
(Fourth embodiment)
Subsequently, another example (fourth embodiment) of the operation and operation of the speech translation process in the
すなわち、ユーザが、図4(B)に示す音声入力待機画面において、サジェストボタン46をタップする(ステップSU4)と、情報端末10のプロセッサ11は、ユーザが属する業種の店舗での接客において多用される定型フレーズ群を表示するための指令信号をサーバ20へ送信する。その指令信号を受信したサーバ20のプロセッサ21は、記憶資源23に記憶されたデータベースD20に含まれる例えばフレーズデータベースにアクセスし、該当する定型フレーズ群を呼び出し、それらのリストの表示画像データを作成して情報端末10のプロセッサ11へ送信する。プロセッサ11は、その表示画像データに基づいて、例えば図5(A)に示す初期フレーズ群画面を表示デバイス16に表示する(ステップSJ8)。
That is, when the user taps the suggest
この図5(A)の初期フレーズ群画面には、複数の日本語のフレーズテキストとそれらの英語による訳文を示す英語のフレーズテキストが、定型フレーズ毎に併記された状態でフレーズリストP1として表示される。図5(A)に示すとおり、このフレーズリストP1には、例えば、客が席に着いたタイミングでよく発話される定型フレーズが含まれている。また、この初期フレーズ群画面において、フレーズリストP1の上方及び下方には、それぞれ、図4(A)の言語選択画面において対話者の言語として選択された言語(つまり対訳言語)が英語であることを示す日本語のテキストT4、及び、閉じるボタンB2も表示される(以下同様)。この閉じるボタンB2をタップすることにより、会話を終了するか、フレーズ群画面を閉じて図4(B)の音声入力待機画面へ戻ることができる。 On the initial phrase group screen of FIG. 5 (A), a plurality of Japanese phrase texts and English phrase texts indicating their translations in English are displayed as a phrase list P1 in a state where they are written together for each fixed phrase. The As shown in FIG. 5A, the phrase list P1 includes, for example, fixed phrases that are often uttered at the timing when the customer arrives at the seat. In the initial phrase group screen, the language selected as the language of the conversation person (that is, the parallel language) on the language selection screen of FIG. 4A is English above and below the phrase list P1, respectively. A Japanese text T4 indicating “” and a close button B2 are also displayed (the same applies hereinafter). By tapping this close button B2, it is possible to end the conversation or close the phrase group screen and return to the voice input standby screen of FIG.
次いで、ユーザは、フレーズリストP1のなかから例えば飲み物の注文を問い合わせる旨のフレーズ(例えば「お飲み物はいかがなさいますか?」)のテキストT5をタップして選択する(ステップSU5)と、情報端末10のプロセッサ11は、その選択指令信号をサーバ20のプロセッサ21へ送信する。それを受信したプロセッサ21は、テキストT5の英語による訳文の音声出力データをプロセッサ11へ返信し、プロセッサ11は、その音声を音声入出力デバイス13から出力する。さらに、プロセッサ21は、ユーザの注文の問い合わせに対する対話者の注文が確定(完了)したか否かの判定を行う(ステップSJ4)。
Next, the user taps and selects the text T5 of a phrase (for example, “Would you like a drink?”) From the phrase list P1 to inquire about an order for a drink, for example (step SU5). The ten
具体的には、(1)それまでに選定された定型フレーズの内容に、商品名(メニュー名)、注文数量、及びクロージングが含まれている場合、又は、(2)それまでに選定された定型フレーズの内容に、商品名(メニュー名)が含まれており、かつ、会話の終了を示す操作があった場合に、注文が確定したと判定する。本第4実施形態は、上記(1)の場合に該当する。 Specifically, (1) If the content of the standard phrase selected so far includes the product name (menu name), order quantity, and closing, or (2) selected so far When the content of the standard phrase includes a product name (menu name) and there is an operation indicating the end of the conversation, it is determined that the order has been confirmed. The fourth embodiment corresponds to the case of (1) above.
ここでは、注文の問い合わせ(「お飲み物はいかがなさいますか?」)が選択されたばかりの段階であって、それまでに選定された定型フレーズの内容には、商品名(メニュー名)、注文数量、及び、クロージングの何れも含まれておらず、プロセッサ21は、注文が確定していないと判定(ステップSJ4においてNo)し、対話者が選択可能なフレーズ群画面の表示(ステップSJ7)へ移行する。
Here, the order inquiry ("Would you like a drink?") Has just been selected, and the contents of the fixed phrase selected so far include the product name (menu name), order quantity Neither closing nor closing is included, and the
次に、プロセッサ21は、再びフレーズデータベースにアクセスして、テキストT5の定型フレーズに関連付けられた他の複数の定型フレーズを呼び出し、それらの定型フレーズのリストの表示画像データを作成して情報端末10のプロセッサ11へ送信する。プロセッサ11は、その表示画像データに基づいて、例えば図5(B)に示すフレーズ群画面を表示デバイス16に表示する(ステップSJ7)。
Next, the
この図5(B)のフレーズ群画面には、図5(A)に示すフレーズリストP1と同様の形態で複数のフレーズテキストを含むフレーズリストP2が表示される。図5(B)に示すとおり、フレーズリストP2には、複数の商品名(飲み物のメニュー名)が含まれており、また、対話者がユーザに対してメニューを要求する旨のテキストT6も含まれている。ユーザがこのフレーズ群画面を対話者に提示し、対話者が所望の飲み物のメニュー名をタップすることにより、注文をとることができる。或いは、対話者の所望の飲み物のメニュー名がフレーズリストP2にない場合、対話者は、テキストT6の部分をタップすることにより、店員であるユーザに対してメニューの閲覧を求めることができる。 On the phrase group screen of FIG. 5B, a phrase list P2 including a plurality of phrase texts is displayed in the same manner as the phrase list P1 shown in FIG. As shown in FIG. 5B, the phrase list P2 includes a plurality of product names (drink menu names), and also includes text T6 indicating that the interrogator requests a menu from the user. It is. The user can present an order by presenting the phrase group screen to the interlocutor, and the interrogator taps the menu name of the desired drink. Alternatively, if the menu name of the drink desired by the dialogue person is not in the phrase list P2, the dialogue person can request the user who is a store clerk to browse the menu by tapping the text T6 portion.
このようにして、対話者が、フレーズリストP2のなかから所望のメニュー名(例えば「生ビール」)を表すフレーズのテキストをタップして選択する(ステップSU5)と、情報端末10のプロセッサ11は、その選択指令信号をサーバ20のプロセッサ21へ送信する。それを受信したプロセッサ21は、そのテキストの日本語の音声出力データをプロセッサ11へ返信し、プロセッサ11は、その音声を音声入出力デバイス13から出力する。さらに、プロセッサ21は、ユーザの注文の問い合わせに対する対話者の注文が確定(完了)したか否かの判定を行う(ステップSJ4)。
Thus, when the dialog person taps and selects the text of a phrase representing a desired menu name (for example, “draft beer”) from the phrase list P2 (step SU5), the
ここでは、メニュー名(「生ビール」)が選択された段階であって、それまでに選定された定型フレーズの内容には、注文数量、及び、クロージングの何れも含まれておらず、また、閉じるボタンB2のタップによる会話を終了する操作もないので、プロセッサ21は、注文が確定していないと判定する(ステップSJ4においてNo)。
Here, at the stage where the menu name (“Draft beer”) is selected, the contents of the fixed phrase selected so far include neither the order quantity nor the closing, and close. Since there is no operation for ending the conversation by tapping the button B2, the
次に、プロセッサ21は、再びフレーズデータベースにアクセスして、メニュー名が選択された場合に、その数量を対話者に入力して貰うための、数量入力画面の表示画像データを呼び出すか又は作成して情報端末10のプロセッサ11へ送信する。プロセッサ11は、その表示画像データに基づいて、例えば図5(C)に示す注文数量入力画面を表示デバイス16に表示する(ステップSJ7)。この図5(C)の数量入力画面には、数を入力するための数字キー51が表示され、ユーザがこの数量入力画面を対話者に提示し、対話者が画面をタップして注文数量(ここでは例えば2つ)を入力する(ステップSU5)と、その数字がカラム52に表示される。次いで、プロセッサ21は、ユーザの注文の問い合わせに対する対話者の注文が確定(完了)したか否かの判定を行う(ステップSJ4)。
Next, the
ここでは、メニュー名(「生ビール」)の注文数量(「2つ」)が入力された段階であって、それまでに選定された定型フレーズの内容には、クロージングが含まれておらず、また、閉じるボタンB2のタップによる会話を終了する操作もないので、プロセッサ21は、注文が確定していないと判定する(ステップSJ4においてNo)。
Here, the order quantity (“2”) of the menu name (“Draft beer”) is entered, and the content of the fixed phrase selected so far does not include closing, Since there is no operation for ending the conversation by tapping the close button B2, the
次に、プロセッサ21は、再びフレーズデータベースにアクセスして、数量の入力に関連付けられた他の複数の定型フレーズを呼び出し、それらの定型フレーズのリストの表示画像データを作成して情報端末10のプロセッサ11へ送信する。プロセッサ11は、その表示画像データに基づいて、例えば図5(D)に示すフレーズ群画面を表示デバイス16に表示する(ステップSJ7)。
Next, the
この図5(D)のフレーズ群画面にも、図5(A)に示すフレーズリストP1と同様の形態で複数のフレーズテキストを含むフレーズリストP3が表示される。図5(D)に示すとおり、フレーズリストP3には、客からの注文や依頼を受けた場合によく発話されるクロージングのフレーズが含まれている。そして、ユーザが、フレーズリストP3のなかから所望のフレーズのテキスト部分をタップして選択する(ステップSU5)と、これまでの処理と同様にして、そのフレーズの英語による訳文の音声出力が行われる。さらに、プロセッサ21は、ユーザの注文の問い合わせに対する対話者の注文が確定(完了)したか否かの判定を行う(ステップSJ4)。
Also on the phrase group screen of FIG. 5D, a phrase list P3 including a plurality of phrase texts is displayed in the same manner as the phrase list P1 shown in FIG. As shown in FIG. 5D, the phrase list P3 includes closing phrases that are often spoken when orders or requests from customers are received. Then, when the user taps and selects the text portion of the desired phrase from the phrase list P3 (step SU5), the English translation of the phrase is output in the same manner as the processing so far. . Further, the
この段階で、クロージング(「かしこまりました。」、「すぐお持ちします。」等)のフレーズが選択されているので、それまでに選定された定型フレーズの内容には、商品名(「生ビール」)、注文数量(「2つ」)、及びクロージングが全て含まれる。よって、プロセッサ21は、注文が確定したと判定する(ステップSJ4においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」とその数量である「2つ」を記憶資源23に記憶する(ステップSJ5)。この場合、プロセッサ21は、その注文履歴データを、データベースD20のひとつとしての例えば注文履歴データベース内に保持してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, closing phrases (such as “I've got it right”, “I will bring you right now”) are selected, so the content of the standard phrase selected so far includes the product name (“Draft beer” "), Order quantity (" 2 "), and closing. Therefore, the
(第5実施形態)
次に、音声翻訳装置100における音声翻訳処理の操作及び動作の他の一例(第5実施形態)について説明する。この第5実施形態においては、ユーザの注文の問い合わせに対して対話者が注文(メニュー名及び数量)を行ったあとに、ユーザがクロージングのフレーズを発話しないで、図5(C)又は図5(D)に示すフレーズ群表示画面において、閉じるボタンB2を押して会話を終了すること以外は、第4実施形態と同様の処理を実行する。本第5実施形態は、上記(2)の場合に該当する。
(Fifth embodiment)
Next, another example (fifth embodiment) of speech translation processing operations and operations in the
すなわち、例えば、対話者が注文内容(「生ビールを2つお願いします。」)を発話した後、ユーザが、クロージングのフレーズを入力せずに、適宜の挨拶(例えば「かしこまりました。」や「ありがとうございます。」を示す英語等)を口頭やそれに代わる動作で対話者に伝えることによって注文の問い合わせを終了し(これはなくてもよい)、閉じるボタンB2をタップして当該音声翻訳アプリケーションによる会話を終了する(会話の終了を示す操作)。そして、プロセッサ21は、注文の確定判定を行う(ステップSJ7)。
That is, for example, after a dialoguer utters the contents of an order (“Thank you for two draft beers.”), The user does not enter a closing phrase, and an appropriate greeting (for example, End the inquiries about the order by telling the interlocutor verbal or alternative actions (such as English indicating “Thank you.”), And tap the close button B2 to tap the speech translation application. End the conversation by (operation indicating the end of the conversation). Then, the
この段階で、それまでに選定された定型フレーズの内容には、商品名(「生ビール」)が含まれており、かつ、閉じるボタンB2のタップといった会話の終了を示す操作があったため、プロセッサ21は、注文が確定したと判定する(ステップSJ7においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」とその数量である「2つ」を記憶資源23に記憶する(ステップSJ5)。この場合も、プロセッサ21は、その注文履歴データを、データベースD20のひとつとしての例えば注文履歴データベース内に保持してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, the contents of the fixed phrase selected so far include the product name (“draft beer”), and there has been an operation indicating the end of the conversation, such as tapping the close button B2, so the
(第6実施形態)
次に、音声翻訳装置100における音声翻訳処理の操作及び動作の他の一例(第6実施形態)について説明する。この第6実施形態においては、ユーザの注文の問い合わせに対して対話者が注文(メニュー名のみ)を行ったあとに、ユーザがクロージングのフレーズを発話しないで、図5(B)又は図5(C)に示すフレーズ群表示画面において、閉じるボタンB2を押して会話を終了すること以外は、第5実施形態と同様の処理を実行する。本第6実施形態も、上記(2)の場合に該当する。
(Sixth embodiment)
Next, another example (sixth embodiment) of operations and operations of speech translation processing in the
すなわち、例えば一人で来店した対話者が注文内容(「生ビール」)を発話した後、ユーザが対話者へ数量の入力を依頼せず、適宜の挨拶(例えば「かしこまりました。」や「ありがとうございます。」を示す英語等)を口頭やそれに代わる動作で対話者に伝えることによって注文の問い合わせを終了し(これはなくてもよい)、閉じるボタンB2をタップして当該音声翻訳アプリケーションによる会話を終了する(会話の終了を示す操作)。そして、プロセッサ21は、注文の確定判定を行う(ステップSJ7)。
That is, for example, after a talker who visited the store alone uttered the order details ("draft beer"), the user did not ask the talker to input the quantity, and an appropriate greeting (for example, "I'm sorry") (In English, etc.) indicating verbal or alternative actions to the dialogue person, the order inquiry is terminated (this may not be necessary), and the close button B2 is tapped to conduct the conversation by the speech translation application. End (operation indicating the end of the conversation). Then, the
この段階で、それまでに選定された定型フレーズの内容には、商品名(「生ビール」)が含まれており、かつ、閉じるボタンB2のタップといった会話の終了を示す操作があったため、プロセッサ21は、注文が確定したと判定する(ステップSJ4においてYes)。それから、プロセッサ21は、その会話で取得された注文内容の履歴(注文履歴)として、メニュー名の「生ビール」を記憶資源23に記憶する(ステップSJ5)。このとき、注文数量を記憶しなくてもよいし、注文数量のデフォルト値を予め「1つ」と設定しておき、そのデフォルト値をその会話における注文数量として記憶してもよい。そして、ユーザは、当該アプリケーションを適宜終了することができる(ステップSU3)。
At this stage, the contents of the fixed phrase selected so far include the product name (“draft beer”), and there has been an operation indicating the end of the conversation, such as tapping the close button B2, so the
以上のように構成された音声翻訳装置100及びそれを用いた音声翻訳方法並びに音声翻訳プログラムによれば、(1)ユーザによる対話者(外国人客)への接客時の会話内容、又は、選定された定型フレーズの内容に、商品名(メニュー名:例えば「生ビール」)、注文数量(例えば「2つ」)、及び、クロージングのそれぞれに合致する項目が全てあった場合、注文が確定したと判定する。また、その会話内容、又は、選定された定型フレーズの内容に、商品名が含まれており、かつ、会話の終了を示す操作(例えばキャンセルボタンB1や閉じるボタンB2のタップ)があった場合にも、注文が確定したと判定する。このように、本発明によれば、ユーザによる対話者(外国人客)への接客において、会話を通じて円滑なコミュニケーションを図りつつ、両者の対話の内容に所定の要素が含まれるか否かを分析することにより、注文情報を簡易かつ有効に取得することができる。その結果、接客の最適化、並びに、ユーザ店舗の売上及び利益の向上に寄与することが可能となる。
According to the
また、図5(A)乃至(D)に示す如く、前に選定された定型フレーズに関連付けられた定型フレーズが、順次、別画面として表示デバイス16に表示されるので、会話の進行に応じた所望のフレーズを簡易かつ的確に選択し易くなり、ユーザと対話者との会話を自然かつ円滑に行うことができる。またさらに、フレーズリストP1〜P3のそれぞれに設定された複数のフレーズが、ユーザが属する業種毎に予め設定されたものであれば、その業種における接客に特化した会話を、より円滑にかつより適切に実施することができる。また、かかる定型フレーズを、ユーザの店舗毎に予め設定しておくこともでき、この場合、店舗毎の特徴や店舗の状況を反映したよりきめ細かい接客が可能となる。
In addition, as shown in FIGS. 5A to 5D, the fixed phrases associated with the fixed phrases selected previously are sequentially displayed on the
ここで、定型フレーズの設定は、自動で行っても手動で行ってもよい。自動で設定する例としては、まず、当該翻訳アプリケーションの利用に際し、ユーザ情報の1つとしてユーザの業種を登録しておき、サーバ20のプロセッサ21が、その業種の会話で頻出する定型フレーズのコーパスや履歴のなかから特に多用される定型フレーズを選定してフレーズリストとして設定する形態が挙げられる。或いは、同業種の複数のユーザが発話した定型フレーズを、その発話頻度とともに適宜のデータベースに記憶し、サーバ20のプロセッサ21が、それらの定型フレーズのなかから特に多用されているものを選定してフレーズリストとして設定してもよい。一方、手動で設定する例としては、ユーザが所望の定型フレーズを選定し、フレーズリストとしてカスタマイズする形態が挙げられる。
Here, the fixed phrase may be set automatically or manually. As an example of automatic setting, first, when using the translation application, the user's business type is registered as one of the user information, and the
その際、例えばフレーズリストP1〜P3に含まれる定型フレーズを、初期の設定のまま維持(フレーズリストの固定)してもよく、或いは、それらに含まれる定型フレーズを、必要に応じて適宜変更してもよい。特に、後者の場合、例えば、各定型フレーズが選択された回数を記憶資源23に記憶しておき、サーバ20のプロセッサ21が、選択回数のより多いフレーズをフレーズリストP1〜P3の表示画面においてより高い順位に表示(例えば画面の上方に表示したり強調や拡大して表示したり)するようにしてもよい。これにより、ユーザの業種や店舗の実情に即した定型フレーズを表示し易くなり、かつ、選択し易くなる利点があり、また、ユーザと対話者のコミュニケーションを更に高速化することができる。
At that time, for example, the fixed phrases included in the phrase lists P1 to P3 may be maintained at the initial settings (fixed phrase list), or the fixed phrases included in them may be appropriately changed as necessary. May be. In particular, in the latter case, for example, the number of times each fixed phrase is selected is stored in the
また、注文された各商品(メニュー)について過去の所定期間に選択された回数(当該音声翻訳アプリケーションによる注文数量、当該ユーザの店舗における会計数量、当該ユーザの店舗を含む複数の店舗における注文数量や会計数量)、又は、各商品(メニュー)の利益率を、記憶資源23に記憶しておき、サーバ20のプロセッサ21が、その選択回数がより多い商品、又は、利益率がより高い商品を、例えば図5(B)に示すフレーズリストP2の表示画面においてより高い順位に表示してもよい。これにより、対話者(外国人客)に対し、人気が高い商品や客単価が高い商品を積極的に推奨することができ、その結果、ユーザの店舗の売上及び利益の向上を更に図ることができる。
In addition, the number of times each selected product (menu) is selected in the past predetermined period (order quantity by the speech translation application, accounting quantity at the user's store, order quantity at a plurality of stores including the user's store, (Accounting quantity) or the profit rate of each product (menu) is stored in the
またさらに、フレーズリストP1〜P3の表示画面において、定型フレーズ毎の日本語のフレーズテキストと英語による訳文を示す英語のフレーズテキストが併記され、また、各定型フレーズの異なる言語(例えば英語)による訳文が音声で出力される。よって、ユーザ及び対話者は、画面の視認に加えて、又は、画面を視認しなくとも、相手の発話内容をより確実に確認することができる。 Furthermore, on the display screen of the phrase lists P1 to P3, the Japanese phrase text for each fixed phrase and the English phrase text indicating the translated sentence in English are written together, and each fixed phrase is translated in a different language (for example, English). Is output by voice. Therefore, the user and the conversation person can confirm the content of the other party's utterance more reliably in addition to viewing the screen or without viewing the screen.
なお、上述したとおり、上記の各実施形態は、本発明を説明するための一例であり、本発明をその実施形態に限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、様々な変形が可能である。例えば、当業者であれば、実施形態で述べたリソース(ハードウェア資源又はソフトウェア資源)を均等物に置換することが可能であり、そのような置換も本発明の範囲に含まれる。 Note that, as described above, each of the above embodiments is an example for explaining the present invention, and is not intended to limit the present invention to the embodiment. The present invention can be variously modified without departing from the gist thereof. For example, those skilled in the art can replace the resources (hardware resources or software resources) described in the embodiments with equivalents, and such replacements are also included in the scope of the present invention.
また、図5(A)、(B)及び(D)において、日本語のフレーズテキストと英語のフレーズテキストを、図4(A)のテキストT1,T2のように、互いに逆向き(互いに異なる向き;図示において上下逆向き)に表示してもよい。さらに、これらの日本語のフレーズテキストと英語のフレーズテキストを併記せず、何れか一方のみ表示するようにしてもよい。またさらに、図5(C)に示す数量入力を、音声入力で行うことができるように構成してもよい。さらにまた、ユーザの業種に拘わらず、その他の業種用に設定されたフレーズリストの表示を選択可能にしてもよい。また、図5(B)に示す商品名(メニュー名)のフレーズリストには、その時点における在庫が多い材料を使用したメニュー名やユーザ又はユーザの店舗が独自に推奨するメニュー名を表示することもできる。 5 (A), (B) and (D), the Japanese phrase text and the English phrase text are opposite to each other (in different directions, like the texts T1 and T2 in FIG. 4 (A)). ; May be displayed in the reverse direction in the figure). Furthermore, these Japanese phrase text and English phrase text may not be written together, and only one of them may be displayed. Furthermore, it may be configured such that the quantity input shown in FIG. 5C can be performed by voice input. Furthermore, it may be possible to select the display of the phrase list set for other industries regardless of the user's industry. In addition, in the phrase list of the product name (menu name) shown in FIG. 5B, a menu name using a material with a large stock at that time or a menu name uniquely recommended by the user or the user's store is displayed. You can also.
また、音声認識、翻訳、音声合成等の各処理をサーバ20によって実行する例について記載したが、これらの処理を情報端末10において実行するように構成してもよい。この場合、それらの処理に用いるモジュールL20は、情報端末10の記憶資源12に保存されていてもよいし、サーバ20の記憶資源23に保存されていてもよい。さらに、音声データベースであるデータベースD20、及び/又は、音響モデル等のモデルM20も、情報端末10の記憶資源12に保存されていてもよいし、サーバ20の記憶資源23に保存されていてもよい。このとおり、音声翻訳装置は、ネットワークN及びサーバ20を備えなくてもよい。
Moreover, although the example which performs each process, such as speech recognition, translation, speech synthesis, by
また、情報端末10とネットワークNとの間には、両者間の通信プロトコルを変換するゲートウェイサーバ等が介在してももちろんよい。また、情報端末10は、携帯型装置に限らず、例えば、デスクトップ型パソコン、ノート型パソコン、タブレット型パソコン、ラップトップ型パソコン等でもよい。
Of course, a gateway server for converting a communication protocol between the
本発明によれば、ユーザによる対話者(外国人客)への接客において、対話の内容を分析することにより注文情報を簡易かつ有効に取得することができるので、例えば、互いの言語を理解できない人同士の会話に関するサービスの提供分野における、プログラム、装置、システム、及び方法の設計、製造、提供、販売等の活動に広く利用することができる。 According to the present invention, order information can be acquired easily and effectively by analyzing the contents of a dialogue when a user interacts with a conversation person (foreigner), so that, for example, the languages of each other cannot be understood. The present invention can be widely used for activities such as design, manufacture, provision, and sales of programs, devices, systems, and methods in the field of providing services related to conversation between people.
10 情報端末
11 プロセッサ
12 記憶資源
13 音声入出力デバイス
14 通信インターフェイス
15 入力デバイス
16 表示デバイス
17 カメラ
20 サーバ
21 プロセッサ
22 通信インターフェイス
23 記憶資源
41 言語ボタン
42a 日本語の入力ボタン
42b 英語の入力ボタン
43 お声がけボタン
44 言語選択ボタン
45 履歴ボタン
46 サジェストボタン
47 設定ボタン
48 マイク図案
49 多重円形図案
50 入力切替ボタン
51 数字キー
52 カラム
100 音声翻訳装置
B1 キャンセルボタン
B2 閉じるボタン
D20 データベース
L20 モジュール
M20 モデル
N ネットワーク
P1〜P3 フレーズリスト
P10 プログラム
P20 プログラム
T1〜T6 テキスト
10
Claims (8)
前記入力音声の内容を異なる言語の内容に翻訳する翻訳部と、
前記入力音声の翻訳内容を音声及び/又はテキストで出力する出力部と、
前記店員及び/又は前記外国人客が選択可能なように、商品名のみを含む定型フレーズ及び商品名を含まない定型フレーズをリスト表示する表示部と、
前記店員からの注文の問い合わせに対する前記外国人客による注文が確定したか否かを判定する判定部と、
前記注文が確定したと判定されたときに、該注文の確定内容を記憶する記憶部と、
を備え、
前記判定部は、(1)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、商品名、注文数量、及び前記店員によるクロージングが含まれている場合、又は、(2)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、少なくとも商品名が含まれており、かつ、前記クロージング以外の会話の終了を示す前記店員による操作があった場合に、前記注文が確定したと判定する、
音声翻訳装置。 An input unit for inputting the voices of the clerk who makes an order inquiry and the foreign customer who makes the order;
A translation unit that translates the content of the input speech into content of a different language;
An output unit that outputs the translated content of the input speech as speech and / or text;
A display unit that displays a list of fixed phrases that include only product names and fixed phrases that do not include product names so that the store clerk and / or the foreign customers can select,
A determination unit for determining whether or not an order by the foreign customer in response to an order inquiry from the store clerk is confirmed;
When it is determined that the order is confirmed, a storage unit that stores the confirmed content of the order;
With
The determination unit is (1) the content of the input voice or the content of the selected fixed phrase includes a product name, an order quantity, and a closing by the store clerk , or (2) the If the content of the input voice or the content of the selected fixed phrase includes at least a product name and there is an operation by the store clerk indicating the end of the conversation other than the closing, the order is Judge that it is confirmed,
Speech translation device.
請求項1記載の音声翻訳装置。 The display unit, said in a case where the by foreigners trade name is selected, displays the quantity input screen that does not include the quotient product name for the foreign visitors to enter the order quantity,
The speech translation apparatus according to claim 1.
請求項1又は2記載の音声翻訳装置。 The display unit displays a list of the product names, and displays the product names having a larger total number of the order quantities stored in the storage unit in a higher rank in the list.
The speech translation apparatus according to claim 1 or 2.
前記表示部は、前記商品名のリストを表示し、かつ、前記記憶部に記憶された前記会計数量の総数がより多い前記商品名、及び/又は、前記利益率がより高い前記商品名を前記リストにおいてより高い順位に表示する、
請求項1乃至3の何れか記載の音声翻訳装置。 The storage unit stores an accounting quantity for each product name and / or a profit rate for each product name,
The display unit displays a list of the product names, and the product names having a larger total number of the accounting quantities stored in the storage unit and / or the product names having a higher profit rate are displayed. Display higher in the list,
The speech translation apparatus according to any one of claims 1 to 3.
請求項1乃至4の何れか記載の音声翻訳装置。 The fixed phrase for each shop industries or per the clerk the clerk belongs, in which preset automatically or manually,
The speech translation apparatus according to claim 1.
請求項1乃至5の何れか記載の音声翻訳装置。 The display unit displays a translation of each fixed phrase in a different language, or the output unit outputs a translation of each fixed phrase in a different language by voice.
The speech translation apparatus according to claim 1.
前記入力部が、注文の問い合わせを行う店員及び/又は注文を行う外国人客の音声を入力するステップと、
前記翻訳部が、入力音声の内容を異なる言語の内容に翻訳するステップと、
前記出力部が、前記入力音声の翻訳内容を音声及び/又はテキストで出力するステップと、
前記表示部が、前記店員及び/又は前記外国人客が選択可能なように、商品名のみを含む定型フレーズ及び商品名を含まない定型フレーズをリスト表示するステップと、
前記判定部が、前記店員からの注文の問い合わせに対する前記外国人客による注文が確定したか否かを判定するステップと、
前記記憶部が、前記注文が確定したと判定されたときに、該注文の確定内容を記憶するステップと、
を含み、
前記判定するステップにおいては、(1)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、商品名、注文数量、及び前記店員によるクロージングが含まれている場合、又は、(2)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、少なくとも商品名が含まれており、かつ、前記クロージング以外の会話の終了を示す前記店員による操作があった場合に、前記注文が確定したと判定する、
音声翻訳方法。 Using a speech translation device including an input unit, a translation unit, an output unit, a display unit, a determination unit, and a storage unit,
The input unit inputs a voice of a clerk who makes an order inquiry and / or a foreign customer who makes an order;
The translation unit translating the content of the input speech into content of a different language;
The output unit outputting the content of translation of the input speech as speech and / or text;
A step of displaying a list of standard phrases including only product names and standard phrases not including product names so that the display unit can be selected by the store clerk and / or the foreign customer ;
The step of determining whether or not the order by the foreign customer for the inquiry of the order from the store clerk is confirmed by the determination unit;
Storing the confirmed content of the order when the storage unit determines that the order has been confirmed;
Including
In the determining step, (1) if the content of the input voice or the content of the selected fixed phrase includes a product name, order quantity, and closing by the store clerk , or (2 ) When the content of the input voice or the content of the selected fixed phrase includes at least a product name and there is an operation by the store clerk indicating the end of the conversation other than the closing, Determine that the order has been confirmed,
Speech translation method.
注文の問い合わせを行う店員及び/又は注文を行う外国人客の音声を入力するための入力部と、
入力音声の内容を異なる言語の内容に翻訳する翻訳部と、
前記入力音声の翻訳内容を音声及び/又はテキストで出力する出力部と、
前記店員及び/又は前記外国人客が選択可能なように、商品名のみを含む定型フレーズ及び商品名を含まない定型フレーズをリスト表示する表示部と、
前記店員からの注文の問い合わせに対する前記外国人客による注文が確定したか否かを判定する判定部と、
前記注文が確定したと判定されたときに、該注文の確定内容を記憶する記憶部と、
して機能させ、
前記判定部は、(1)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、商品名、注文数量、及び前記店員によるクロージングが含まれている場合、又は、(2)前記入力音声の内容、又は、選定された前記定型フレーズの内容に、少なくとも商品名が含まれており、かつ、前記クロージング以外の会話の終了を示す前記店員による操作があった場合に、前記注文が確定したと判定する、
音声翻訳プログラム。 Computer
An input unit for inputting the voice of a clerk who makes an order inquiry and / or a foreign customer who makes an order;
A translation unit that translates the content of the input speech into a different language
An output unit that outputs the translated content of the input speech as speech and / or text;
A display unit that displays a list of fixed phrases that include only product names and fixed phrases that do not include product names so that the store clerk and / or the foreign customers can select,
A determination unit for determining whether or not an order by the foreign customer in response to an order inquiry from the store clerk is confirmed;
When it is determined that the order is confirmed, a storage unit that stores the confirmed content of the order;
To function,
The determination unit is (1) the content of the input voice or the content of the selected fixed phrase includes a product name, an order quantity, and a closing by the store clerk , or (2) the If the content of the input voice or the content of the selected fixed phrase includes at least a product name and there is an operation by the store clerk indicating the end of the conversation other than the closing, the order is Judge that it is confirmed,
Speech translation program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016066157A JP6141483B1 (en) | 2016-03-29 | 2016-03-29 | Speech translation device, speech translation method, and speech translation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016066157A JP6141483B1 (en) | 2016-03-29 | 2016-03-29 | Speech translation device, speech translation method, and speech translation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6141483B1 true JP6141483B1 (en) | 2017-06-07 |
JP2017182310A JP2017182310A (en) | 2017-10-05 |
Family
ID=59012032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016066157A Expired - Fee Related JP6141483B1 (en) | 2016-03-29 | 2016-03-29 | Speech translation device, speech translation method, and speech translation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6141483B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237806A1 (en) * | 2018-06-12 | 2019-12-19 | 深圳市合言信息科技有限公司 | Speech recognition and translation method and translation apparatus |
CN111754224A (en) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | Error-proofing money-brushing payment method, device and system |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7068976B2 (en) * | 2018-09-11 | 2022-05-17 | 株式会社メルカリ | Methods and programs in online commerce support systems |
JP7265254B2 (en) * | 2019-05-21 | 2023-04-26 | 株式会社ケアコム | Nurse call system and nurse call device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002279042A (en) * | 2001-03-19 | 2002-09-27 | Fujitsu General Ltd | Order entry terminal and pos order system |
JP2011123764A (en) * | 2009-12-11 | 2011-06-23 | Sharp Corp | Portable communication device, order system, and control method of the portable communication device |
WO2015132829A1 (en) * | 2014-03-07 | 2015-09-11 | パナソニックIpマネジメント株式会社 | Speech interaction device, speech interaction system, and speech interaction method |
-
2016
- 2016-03-29 JP JP2016066157A patent/JP6141483B1/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002279042A (en) * | 2001-03-19 | 2002-09-27 | Fujitsu General Ltd | Order entry terminal and pos order system |
JP2011123764A (en) * | 2009-12-11 | 2011-06-23 | Sharp Corp | Portable communication device, order system, and control method of the portable communication device |
WO2015132829A1 (en) * | 2014-03-07 | 2015-09-11 | パナソニックIpマネジメント株式会社 | Speech interaction device, speech interaction system, and speech interaction method |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237806A1 (en) * | 2018-06-12 | 2019-12-19 | 深圳市合言信息科技有限公司 | Speech recognition and translation method and translation apparatus |
CN111754224A (en) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | Error-proofing money-brushing payment method, device and system |
CN111754224B (en) * | 2020-06-28 | 2023-08-22 | 中国银行股份有限公司 | Anti-misplug payment method, device and system |
Also Published As
Publication number | Publication date |
---|---|
JP2017182310A (en) | 2017-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6182272B2 (en) | Natural expression processing method, processing and response method, apparatus, and system | |
US7184539B2 (en) | Automated call center transcription services | |
JP6141483B1 (en) | Speech translation device, speech translation method, and speech translation program | |
JP2007525750A (en) | Method and apparatus for conducting transactions between trading parties without using verbal communication | |
JP2015153108A (en) | Voice conversion support device, voice conversion support method, and program | |
JP2017152948A (en) | Information provision method, information provision program, and information provision system | |
US20080195375A1 (en) | Echo translator | |
US20240176957A1 (en) | Systems and methods for inserting dialogue into a query response | |
JP6290479B1 (en) | Speech translation device, speech translation method, and speech translation program | |
WO2017135214A1 (en) | Speech translation system, speech translation method, and speech translation program | |
JP6353860B2 (en) | Speech translation device, speech translation method, and speech translation program | |
JP6250209B1 (en) | Speech translation device, speech translation method, and speech translation program | |
JP6383748B2 (en) | Speech translation device, speech translation method, and speech translation program | |
JP2022020149A (en) | Information processing apparatus and program | |
JP6310950B2 (en) | Speech translation device, speech translation method, and speech translation program | |
JP6174746B1 (en) | Speech translation device, speech translation method, and speech translation program | |
WO2017122657A1 (en) | Speech translation device, speech translation method, and speech translation program | |
US20070244687A1 (en) | Dialog supporting device | |
WO2017086434A1 (en) | Speech translation program, speech translation device, and control method for same | |
JP6110539B1 (en) | Speech translation device, speech translation method, and speech translation program | |
JP6334589B2 (en) | Fixed phrase creation device and program, and conversation support device and program | |
JP6198879B1 (en) | Speech translation device, speech translation method, and speech translation program | |
US20040078189A1 (en) | Phonetic identification assisted Chinese input system and method thereof | |
Pyae | A usability evaluation of the Google Home with non-native English speakers using the system usability scale | |
JP2018014065A (en) | Method and program for supporting cross-language conversation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170206 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6141483 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |