JP2021117452A - 音声文字変換システム、商品呼出システム及び商品処理装置 - Google Patents
音声文字変換システム、商品呼出システム及び商品処理装置 Download PDFInfo
- Publication number
- JP2021117452A JP2021117452A JP2020012777A JP2020012777A JP2021117452A JP 2021117452 A JP2021117452 A JP 2021117452A JP 2020012777 A JP2020012777 A JP 2020012777A JP 2020012777 A JP2020012777 A JP 2020012777A JP 2021117452 A JP2021117452 A JP 2021117452A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- product
- unit
- name
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Cash Registers Or Receiving Machines (AREA)
Abstract
【課題】音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置を提供する。【解決手段】音声文字変換システムは、入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、音声信号を文字情報に変換する音声認識部と、種別毎に異なる複数の目録を記憶する記憶部と、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、文字情報を含む名称、及び/又は文字情報の類似文字情報を含む名称を抽出する制御部と、を備える。【選択図】図1
Description
本発明は、音声文字変換システム、商品呼出システム及び商品処理装置に関する。
例えば生鮮食料品等の商品を計量して値付けする場合、作業者は、当該商品に応じた呼出番号を入力することによって、もしくは、PLUキー(PLU:Price Look Up)を操作することによって、所望の商品情報を読み出す必要がある。前者の方法では、作業者が呼出番号等を覚える必要がある。後者の方法では、PLUキー操作が煩雑である。このため、上述した方法を実施する場合、作業者の訓練が必要になる。
計量した商品の値付けにおいては、音声認識技術の利用が図られる。この場合、キー操作を介さずに、発話した商品の情報(商品情報)を直接読み出せるからである。例えば下記特許文献1には、オペレータが発する音声に含まれる商品名を音声認識された商品名として出力する音声認識手段が開示されている。
例えば、商品の製造現場、商品の販売現場等の雑音が発生する環境にて、上述したような音声認識技術を利用した場合、音声の誤認識が発生しやすくなる。したがって、例えば上記環境等においても高い精度の音声認識を実現可能なシステムが望まれている。
本発明の一側面の目的は、音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置の提供である。
本発明の一側面に係る音声文字変換システムは、入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、音声信号を文字情報に変換する音声認識部と、種別毎に異なる複数の目録を記憶する記憶部と、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、文字情報を含む名称、及び/又は文字情報の類似文字情報を含む名称を抽出する制御部と、を備える。
この音声文字変換システムによれば、記憶部は、種別毎に異なる複数の目録を記憶しており、制御部は、入力された種別に応じた目録の中から、音声信号から変換された文字情報を含む名称、及び/又は当該文字情報の類似文字情報を含む名称を抽出する。これにより、例えばユーザから発せられた音声から生成される文字情報、及び/又は当該文字情報の類似文字情報を含む名称が記憶部に複数記憶されている場合であっても、入力された種別に応じた目録を用いることによって、音声の誤認識が発生しにくくなる。よって、例えば雑音が発声する環境等においても、ユーザの目的に合致する名称が抽出されやすくなる。したがって本発明の一側面によれば、音声認識精度を向上可能な音声文字変換システムを提供できる。
音声認識部によって変換される文字情報は、複数の変換候補文字を含み、制御部は、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、複数の変換候補文字のうち少なくとも一部を含む名称を抽出してもよい。この場合、例えばユーザから発せられた音声に加えて周囲の雑音等が受信部に受信されたとしても、ユーザの目的に合致する名称が抽出されやすくなる。したがって、音声文字変換システムによる音声認識精度をより向上可能である。
音声認識部は、外部のクラウドコンピューティングであり、インターフェイス部は、クラウドコンピューティングと通信する通信機能を備えたタブレット端末でもよい。この場合、ユーザは、クラウドコンピューティングと通信できる環境さえ整っていれば、特定の位置に限定されずに音声文字変換システムを利用可能である。加えて、外部のクラウドコンピューティングを利用するため、音声認識部をインターフェイス部内に組み込んだ場合のバージョンアップに要する作業等を低減できる。
本発明の別の一側面に係る商品呼出システムは、上記音声文字変換システムと、目録に含まれる名称毎に登録される商品情報を記憶する商品マスタと、を備え、インターフェイス部は、抽出された名称を商品マスタに出力し、商品マスタは、入力された名称に応じた商品情報を読み出してインターフェイス部に出力する。この場合、商品情報の出力精度を向上可能である。
本発明のまた別の一側面に係る商品処理装置は、上記商品呼出システムと通信する商品処理装置であって、インターフェイス部は、商品処理装置と通信する通信手段を備え、商品処理装置は、インターフェイス部から送信された商品情報を、処理すべき商品の商品情報として設定する。また、商品処理装置は、商品情報に基づいて商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、X線検査装置のいずれかでもよい。
本発明の一側面によれば、音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置を提供できる。
以下、図面を参照して、本発明の好適な一実施形態について詳細に説明する。なお、図面の説明において、同一要素には同一符号を付し、重複する説明を省略する。
(第1実施形態)
図1は、第1実施形態に係る音声文字変換システムの機能構成を示すブロック図である。図1に示される音声文字変換システム1は、入力された音声を目視可能な名称に変換するシステムである。第1実施形態における音声文字変換システム1は、インターフェイス部2と、クラウドサーバ3と、アプリケーションサーバ4とを備える。音声文字変換システム1は、まず、インターフェイス部2にて得られる音声信号をクラウドサーバ3にて文字情報に変換する。続いて、音声文字変換システム1は、アプリケーションサーバ4にて当該文字情報を含む名称を抽出する。そして、音声文字変換システム1は、抽出された名称をインターフェイス部2に目視可能に表示する。
図1は、第1実施形態に係る音声文字変換システムの機能構成を示すブロック図である。図1に示される音声文字変換システム1は、入力された音声を目視可能な名称に変換するシステムである。第1実施形態における音声文字変換システム1は、インターフェイス部2と、クラウドサーバ3と、アプリケーションサーバ4とを備える。音声文字変換システム1は、まず、インターフェイス部2にて得られる音声信号をクラウドサーバ3にて文字情報に変換する。続いて、音声文字変換システム1は、アプリケーションサーバ4にて当該文字情報を含む名称を抽出する。そして、音声文字変換システム1は、抽出された名称をインターフェイス部2に目視可能に表示する。
図2は、インターフェイス部の概略図である。図1及び図2に示されるインターフェイス部2は、音声文字変換システム1の端末装置であり、ユーザからの手動入力操作及び音声入力操作を受け付ける。手動入力操作は、直接入力にて実施されてもよいし、遠隔操作による間接入力にて実施されてもよい。第1実施形態のインターフェイス部2は、クラウドサーバ3及びアプリケーションサーバ4と通信する通信機能を備えたタブレット端末である。インターフェイス部2は、表示部11、手動入力部12、音声入力部13、音声処理部14、通信部15及び制御部16を有する。
表示部11は、音声文字変換システム1の実行結果を表示する部分であり、例えば液晶ディスプレイ等である。表示部11は、例えば、アプリケーションサーバ4から送信される名称の抽出結果等を表示する。第1実施形態では、表示部11は、ユーザによる手動入力操作の実施に用いる各種画像も表示する。当該各種画像は、例えば、テンキー画像、キーボード画像等である。手動入力部12は、インターフェイス部2に各種情報(信号)を手動入力する部分である。第1実施形態では、手動入力部12は、表示部11に重なるタッチパネルであり、表示部11に表示される各種画像に連動する。
音声入力部13は、外部から音声が入力される部分であり、例えばマイクロフォンである。音声処理部14は、入力された音声を音声信号とする部分である。音声に含まれる雑音除去の観点から、音声処理部14は、入力された音声をフィルタリングしてもよい。第1実施形態では、音声処理部14のフィルタリングは、制御部16に含まれるが、これに限られない。音声信号は、例えばデジタル信号である。
通信部15は、クラウドサーバ3とアプリケーションサーバ4とのそれぞれに対して、有線又は無線による通信を可能とする部分(通信手段)である。第1実施形態では、通信部15と、クラウドサーバ3と、アプリケーションサーバ4とのそれぞれは、無線により通信される。通信部15は、クラウドサーバ3と、アプリケーションサーバ4とのそれぞれから信号を受信する。通信部15は、クラウドサーバ3に音声信号を送信し、アプリケーションサーバ4に後述する文字情報等を送信する。通信部15は、クラウドサーバ3及びアプリケーションサーバ4とは異なる外部装置と通信可能である。例えば、外部装置が端末装置であって、その端末装置からインターフェイス部2が遠隔操作される場合、通信部15は、遠隔先の端末装置と有線又は無線により通信する。
制御部16は、クラウドサーバ3、アプリケーションサーバ4等の外部装置との各種信号の入出力、表示部11の画像出力、手動入力部12及び音声入力部13の入力、音声処理部14の処理、並びに通信部15の信号通信などを制御する部分である。制御部16は、例えば、ROM(Read Only Memory)及びRAM(Random Access Memory)等の記憶媒体、CPU(Central Processing Unit)、及び通信回路などを有する。ROMには、インターフェイス部2における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部16における各種処理は、CPU及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部16における各種処理は、CPUの制御のもと実施される。
クラウドサーバ3は、音声文字変換システム1における音声認識部であり、入力された音声信号を文字情報に変換する。第1実施形態のクラウドサーバ3は、インターフェイス部2とは異なる装置(外部装置)であるクラウドコンピューティングである。クラウドサーバ3は、音声変換部21と、通信部22と、制御部23とを有する。
音声変換部21は、インターフェイス部2から送信された音声信号を文字情報に変換する部分である。文字情報は、配列された文字列を含み、アプリケーションサーバ4にて特定の名称を抽出するためのキーワードである。文字列が複数の文字から構成される場合、音声変換部21は、当該文字列から単語、熟語、短文等を構成してもよい。文字情報は、予め設定された言語(日本語、英語等)で生成される。言語には、方言等が含まれてもよい。第1実施形態では、言語は日本語に設定されており、音声変換部21にて生成される文字情報は、漢字を含むがこれに限られない。音声変換部21にて生成される文字列は、音節文字にて構成されてもよい。文字情報は、文字列の代わりに、もしくは文字列に加えて、発音記号等を含んでもよい。すなわち、音声変換部21によって生成される文字情報は、音声信号から生成される発音記号等を含み得る。
通信部22は、インターフェイス部2とアプリケーションサーバ4とのそれぞれに対して、有線又は無線による通信を可能とする部分であり、例えばウェブサーバである。第1実施形態では、通信部22と、インターフェイス部2と、アプリケーションサーバ4とのそれぞれは、無線により通信される。通信部22は、インターフェイス部2から音声信号を受信し、インターフェイス部2に文字情報を送信する。通信部22は、例えば音声変換部21の処理に用いられるコンピュータソフトウェア等をアップデートするため、当該コンピュータソフトウェア等を保存するサーバ、外部記憶媒体等と通信可能である。
制御部23は、インターフェイス部2、アプリケーションサーバ4等の外部装置との各種信号の入出力、音声変換部21の処理、並びに通信部22の信号通信などを制御する部分である。制御部23は、例えば、ROM及びRAM等の記憶媒体、CPU、及び通信回路などを有する。ROMには、クラウドサーバ3における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部23における各種処理は、CPU及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部23における各種処理は、CPUの制御のもと実施される。
アプリケーションサーバ4は、音声文字変換システム1における名称抽出部であり、入力された文字情報を含む名称を抽出する。第1実施形態のアプリケーションサーバ4は、インターフェイス部2とは異なる装置(外部装置)である。アプリケーションサーバ4は、記憶部31と、通信部32と、制御部33とを有する。
図3は、記憶部の機能構成を示すブロック図である。図3に示される記憶部31は、例えばハードディスク(HD)、ソリッドステートドライブ(SSD)などの記憶媒体であり、名称データベース34と、目録登録部35とを有する。名称データベース34は、各種名称を記憶する部分である。各種名称は、例えば、図4に示される商品名、文献名、生物名、人物名、地名、無機物名、有機物名等の文字列である。名称データベース34は、名称の文字列に加えて、当該名称の音節文字、発音記号等を記憶してもよい。名称データベース34に記憶される名称の追加、修正、削除等は、例えばインターフェイス部2等を介して実施できる。
目録登録部35は、複数の目録(第1目録35a〜第X目録35x)を記憶する部分である。目録は、特定の種別(種類)として例えば、スーパーマーケットの食品売場では、精肉、鮮魚、総菜等の部門名が設定されると共に、当該種別に属する個々の商品の名称が登録されるリストである。種別に属する個々の商品の名称は、当該種別という観点からまとめられた商品の名称である。第1実施形態では、第1目録35aと、第2目録35bと、第X目録35xとには、互いに異なる種別が設定される。このため、記憶部31は、種別毎に異なる複数の目録を記憶する部分と言える。第1実施形態では、インターフェイス部2から送信される信号に応じて、利用される目録が設定される。
各目録に登録される名称のそれぞれは、一又は複数のキーワードを含む。キーワードは、名称の文字列、音節文字、発音記号等である。すなわち、キーワードは、文字情報に相当する。名称自体がキーワードの一つでもよい。キーワードは、名称の一部の文字列、音節文字、発音記号等でもよい。この場合、名称の一部は、例えば当該名称の特徴的な部分であり、自動もしくは手動にて設定される。名称データベース34に記憶される全ての名称のうち一部の名称は、複数の目録(例えばスーパーマーケットであれば部門別)に登録されてもよい。換言すると、互いに異なる目録には、同一の名称が含まれてもよい。この場合、当該同一の名称に含まれるキーワードは、目録毎に異なってもよい。目録登録部35に登録される目録の追加、修正、削除等は、例えばインターフェイス部2等を介して実施できる。目録に含まれる名称に関連付けられるキーワードの追加、修正、削除等もまた、例えばインターフェイス部2等を介して実施できる。
図4(a)は、第1目録の抜粋例を示す図であり、図4(b)は、第2目録の抜粋例を示す図である。図4(a),(b)のそれぞれにおいて、紙面左側には目録に登録される名称、例えば商品名が示され、紙面右側にはその名称を抽出するためのキーワードが示される。図4(a),(b)に示されるように、各目録における所定の名称は、複数のキーワードを含み得る。例えば、種別を「海産物」と設定された第1目録35aに属する商品の名称である「鰤」のキーワードとして、「鰤」に一致する文字列である「鰤」と、「鰤」に一致する音節文字である「ぶり」とが含まれる。例えば、種別を「肉」と設定された第2目録35bに属する商品の名称である「牛肉」のキーワードとして、「牛肉」に一致する文字列である「牛肉」と、「牛肉」に一致する音節文字である「ぎゅうにく」とが含まれる。また、第2目録35bに登録される名称である「国産牛肉」のキーワードとして、当該名称の一部である「牛肉」に一致する文字列である「牛肉」等が含まれ得る。
通信部32は、インターフェイス部2とクラウドサーバ3とのそれぞれに対して、有線又は無線による通信を可能とする部分であり、例えばウェブサーバである。第1実施形態では、通信部32と、インターフェイス部2と、クラウドサーバ3とのそれぞれは、無線により通信される。通信部32は、インターフェイス部2から入力された種別、文字情報等を受信し、インターフェイス部2に対して、種別と文字情報とから抽出される名称の抽出結果を送信する。通信部32は、例えば記憶部31に記憶される情報をアップデートするため、当該情報を保存するサーバ、外部記憶媒体等と通信可能である。
制御部33は、インターフェイス部2、クラウドサーバ3等の外部装置との各種信号の入出力、記憶部31から入力された文字情報を含む名称の抽出、並びに通信部32の信号通信などを制御する部分である。制御部33は、例えば、ROM及びRAM等の記憶媒体、CPU、及び通信回路などを有する。ROMには、アプリケーションサーバ4における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部33における各種処理は、CPU及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部33における各種処理は、CPUの制御のもと実施される。
制御部33は、インターフェイス部2から入力された種別と、クラウドサーバ3にて生成されインターフェイス部2を介して入力された文字情報とから、その文字情報を含む名称を抽出する。第1実施形態では、制御部33は、選択された目録に属する名称のうち、入力された文字情報に一致するキーワードを含む名称を抽出する。制御部33は、抽出した名称の一覧を音声文字変換システム1の実行結果として、通信部32を介してインターフェイス部2に送信する。
次に、図5〜図8を参照しながら第1実施形態に係る音声文字変換システム1における音声文字変換処理を説明する。図5は、音声文字変換処理のフローチャートである。図6〜8は、音声文字変換処理中におけるインターフェイス部2の表示画面を示す。
まず図5に示されるように、音声文字変換処理を実行しようとする検索対象の種別をインターフェイス部2に入力する(ステップS1)。ステップS1では、例えばユーザは、インターフェイス部2の表示部11及び手動入力部12を用いて、所望の種別を入力する。種別の入力結果は、通信部15を介してアプリケーションサーバ4に送信される。
次に、インターフェイス部2は、外部から音声を受信する(ステップS2)。ステップS2では、まず図6に示されるように、インターフェイス部2を音声認識状態に設定する。続いて、ユーザがインターフェイス部2に対して所望の名称の全てもしくは一部を発声することにより、音声入力部13が音声を受信する。
次に、インターフェイス部2は、音声信号の生成及び送信を実施する(ステップS3)。ステップS3では、音声処理部14が、音声入力部13が受信した音声を音声信号に変換する。音声信号は、通信部15を介してクラウドサーバ3の通信部22に送信される。例えばステップS3の開始と同時に、インターフェイス部2の音声認識状態は、解除若しくは一時停止される。これにより、音声文字変換処理の途中で、音声入力部13による不要な音声の受信を防止できる。
次に、クラウドサーバ3は、音声信号を文字情報に変換する(ステップS4)。ステップS4では、音声変換部21が、受信した音声信号を文字情報に変換する。文字情報は、通信部22を介してインターフェイス部2に送信される。表示部11は、例えば図7に示されるように、受信した文字情報の文字列である「国産牛」と、当該文字情報の音節文字である「こくさんぎゅう」とを、「検索ワード」の欄に表示する。これにより、ユーザは、変換された文字情報が目的に沿ったものか否かを容易に判断できる。なお、当該文字情報が目的に沿ったものではない場合、インターフェイス部2の操作によってステップS2〜S4を再実行できる。
次に、インターフェイス部2は、文字情報を含む名称の検索要求を実施する(ステップS5)。ステップS5では、文字情報と、当該文字情報を含む名称の検索指示信号とが、通信部15を介してアプリケーションサーバ4の通信部32に送信される。
次に、アプリケーションサーバ4は、入力された種別に応じた目録から名称を抽出する(ステップS6)。ステップS6では、制御部33は、ステップS1にて入力された種別に属する目録に登録される名称のうち、入力された文字情報に一致するキーワード(文字情報)を含む名称を抽出する。続いて、制御部33は、通信部32を介して抽出された名称の一覧をインターフェイス部2に送信する。
そして、インターフェイス部2は、抽出された名称を表示部11に表示する(ステップS7)。表示部11は、例えば図8に示されるように、受信した名称の一覧を検索結果の欄に表示する。以上により、音声文字変換処理が終了する。音声文字変換処理の終了後、ユーザは、手動入力部12を介して受信した名称の中から所望の名称を選択できる。ユーザは、選択した名称を用いて、音声文字変換処理とは異なる処理を実施できる。
以上に説明した第1実施形態に係る音声文字変換システム1によれば、記憶部31は、種別毎に異なる複数の目録を記憶しており、制御部33は、入力された種別に属する目録の中から、音声信号から変換された文字情報を含む名称を抽出する。これにより、例えばユーザから発せられた音声から生成される文字情報を含む名称が記憶部31に複数記憶されている場合であっても、入力された種別に属する目録を用いることによって、音声の誤認識が発生しにくくなる。よって、例えば雑音が発声する環境等においても、ユーザの目的に合致する名称が抽出されやすくなる。すなわち、ユーザの目的に合致しない名称が抽出されにくくなる。したがって第1実施形態では、音声認識精度を向上可能な音声文字変換システム1を提供できる。
加えて、第1実施形態によれば、上述した通り、入力された種別に属する目録の中から、名称が抽出される。すなわち、所定の目録に含まれる名称のみが検索対象になる。このため、名称データベース34に含まれる全名称を検索対象とする場合よりも、通信量、検索負荷等を低減できる。
第1実施形態では、音声認識部であるクラウドサーバ3は、外部のクラウドコンピューティングであり、インターフェイス部2は、クラウドコンピューティングと通信する通信機能を備えたタブレット端末である。この場合、ユーザは、クラウドコンピューティングと通信できる環境さえ整っていれば、特定の位置に限定されずに音声文字変換システム1を利用可能である。加えて、外部のクラウドコンピューティングを利用するため、音声認識部をインターフェイス部内に組み込んだ場合のバージョンアップに要する作業等を低減できる。
以下では、第1実施形態の各変形例について説明する。各変形例の説明において、第1実施形態と重複する記載については省略し、第1実施形態と異なる箇所を説明する。
(第1変形例)
第1実施形態の第1変形例では、アプリケーションサーバ4は、入力された文字情報を変換し得る。例えば、入力された文字情報が、記憶部31に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれにも一致しない場合、アプリケーションサーバ4は、入力された文字情報に類似する文字情報(類似文字情報)に変換する。類似文字情報は、記憶部31に記憶される名称及び/又はそのキーワードの文字列、音節文字、発音記号等の少なくとも一つに一致している情報(キーワード)である。第1変形例では、類似文字情報は音節文字であるが、これに限られない。また、入力された文字情報が、記憶部31に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれかに一致した場合であっても、アプリケーションサーバ4は、入力された文字情報に近似する文字情報に変換してもよい。
第1実施形態の第1変形例では、アプリケーションサーバ4は、入力された文字情報を変換し得る。例えば、入力された文字情報が、記憶部31に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれにも一致しない場合、アプリケーションサーバ4は、入力された文字情報に類似する文字情報(類似文字情報)に変換する。類似文字情報は、記憶部31に記憶される名称及び/又はそのキーワードの文字列、音節文字、発音記号等の少なくとも一つに一致している情報(キーワード)である。第1変形例では、類似文字情報は音節文字であるが、これに限られない。また、入力された文字情報が、記憶部31に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれかに一致した場合であっても、アプリケーションサーバ4は、入力された文字情報に近似する文字情報に変換してもよい。
アプリケーションサーバ4による文字情報の変換は、例えば予め生成される変換表に基づいて実施される。変換表は、目録毎に登録されてもよい。この場合、類似文字情報が、目録内に登録されるキーワードに合致しやすくなる。図9は、入力される文字情報と類似文字情報との変換表の抜粋例を示す図である。図9において、紙面左側には入力される文字情報が示され、紙面右側には当該文字情報の類似文字情報が示される。図9に示されるように、例えば第1目録35aには、入力される文字情報である「むり」及び「ふり」と、これらの類似文字情報である「ぶり」とが示される変換表が含まれる。このような変換表を用いることによって、アプリケーションサーバ4は、入力された文字情報を、当該文字情報に関連付けられる類似文字情報として抽出し、それを例えばインターフェイス部2に出力する。
変換表は、例えばユーザ等によって任意に作成されてもよいし、自動で作成されてもよい。前者の場合、例えばユーザ等の経験に基づき、変換表が作成されてもよい。後者の場合、例えば文字列同士の類似度を利用することによって、変換表が生成される。この場合、例えば、最小編集距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離等が利用される。例えば、類似文字情報と、入力される文字情報の文字列との距離が2以下もしくは1である。もしくは、文字情報同士の類似度は、文字情報の発音を文字化したものを用いてもよい。この場合、例えば英語のように、互いの発音が類似している一方で互いの綴り字(スペリング)が非類似である2つの文字情報を、互いに類似していると自動で判断できる。
第1変形例では、アプリケーションサーバ4の制御部33は、音声信号及び種別がインターフェイス部2に入力されると、入力された種別に属する目録の中から、文字情報を含む名称、及び/又は当該文字情報の類似文字情報を含む名称を抽出する。例えば、第1実施形態におけるステップS6の前において、制御部33は、入力された文字情報を変換して、類似文字情報を生成する。ここでは、制御部33は、入力された種別に属する目録に登録される変換表を利用することによって、入力された文字情報を、当該文字情報に関連付けられる類似文字情報に変換する。続いて、制御部33は、上記ステップS6の代わりに、入力された種別に属する目録に登録される名称のうち、入力された文字情報、及び/又は当該文字情報の類似文字情報に一致するキーワードを含む名称を抽出する。ここでは、類似文字情報が生成された場合、制御部33は、入力された文字情報に一致するキーワードを含む名称だけでなく、類似文字情報に一致するキーワードを含む名称を抽出する。そして、第1実施形態におけるステップS7が実施される。
以上に説明した第1変形例においても、第1実施形態と同様の作用効果が奏される。加えて第1変形例では、例えばユーザから発せられた音声に加えて周囲の雑音等が音声入力部13に受信されたとしても、ユーザの目的に合致する名称がより抽出されやすくなる。したがって、音声文字変換システムによる音声認識精度をより向上可能である。
(第2変形例)
第1実施形態の第2変形例では、音声変換部21は、音声信号から一つの文字列だけでなく、複数の文字列、複数の音節文字、及び/又は複数の発音記号等を作成する。すなわち、音声変換部21によって生成される文字情報は、複数の変換候補文字(ヒントワード)を含み得る。複数の変換候補文字のそれぞれは、例えば互いに子音が異なってもよいし、母音が異なってもよいし、子音及び母音の両方が異なってもよい。互いに異なる変換候補文字同士においては、子音が1つ又は複数異なってもよい。もしくは、互いに異なる変換候補文字同士においては、母音が1つまたは2つ異なってもよい。音声変換部21は、複数の変換候補文字のそれぞれから単語、熟語、短文等を構成してもよい。この場合、複数の変換候補文字のそれぞれには、優先度(スコア)が付されてもよい。優先度は、例えば、単語、熟語、短文等が構成される変換候補文字ほど高い。また、優先度は、予め設定された単語(頻出単語)、熟語、短文等が構成される変換候補文字ほど高くてもよい。複数の変換候補文字のうち最も優先度が高いものを、第1候補文字としてもよい。この場合、複数の変換候補文字のそれぞれは、第1候補文字に対して類似してもよい。
第1実施形態の第2変形例では、音声変換部21は、音声信号から一つの文字列だけでなく、複数の文字列、複数の音節文字、及び/又は複数の発音記号等を作成する。すなわち、音声変換部21によって生成される文字情報は、複数の変換候補文字(ヒントワード)を含み得る。複数の変換候補文字のそれぞれは、例えば互いに子音が異なってもよいし、母音が異なってもよいし、子音及び母音の両方が異なってもよい。互いに異なる変換候補文字同士においては、子音が1つ又は複数異なってもよい。もしくは、互いに異なる変換候補文字同士においては、母音が1つまたは2つ異なってもよい。音声変換部21は、複数の変換候補文字のそれぞれから単語、熟語、短文等を構成してもよい。この場合、複数の変換候補文字のそれぞれには、優先度(スコア)が付されてもよい。優先度は、例えば、単語、熟語、短文等が構成される変換候補文字ほど高い。また、優先度は、予め設定された単語(頻出単語)、熟語、短文等が構成される変換候補文字ほど高くてもよい。複数の変換候補文字のうち最も優先度が高いものを、第1候補文字としてもよい。この場合、複数の変換候補文字のそれぞれは、第1候補文字に対して類似してもよい。
第2変形例では、アプリケーションサーバ4の制御部33は、音声信号及び種別がインターフェイス部2に入力されると、入力された種別に属する目録の中から、複数の変換候補文字のうち少なくとも一部を含む名称を抽出する。このとき、制御部33は、複数の変換候補文字のうち所定の優先度未満の変換候補文字を予め排除し、残った変換候補文字のうち少なくとも一部を含む名称を抽出してもよい。この場合、ユーザの目的に合致しない名称が抽出されにくくなる傾向にある。
以上に説明した第2変形例においても、第1実施形態と同様の作用効果が奏される。加えて第2変形例では、例えば入力された音声の質が不十分である場合等においても、所望の名称が抽出されやすくなる。
(第2実施形態)
以下では、第2実施形態に係る商品呼出システムについて説明する。第2実施形態の説明において第1実施形態と重複する記載は省略し、第1実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第2実施形態に第1実施形態の記載を適宜用いてもよい。
以下では、第2実施形態に係る商品呼出システムについて説明する。第2実施形態の説明において第1実施形態と重複する記載は省略し、第1実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第2実施形態に第1実施形態の記載を適宜用いてもよい。
第2実施形態に係る商品呼出システムは、第1実施形態に係る音声文字変換システム1と、後述する図10に示される商品マスタ41とを備えるシステムであり、例えば抽出された名称に応じた商品情報をインターフェイス部2の表示部11に表示させるシステムである。以下では、商品マスタ41の機能と、商品呼出システムにおける商品呼出処理とを説明する。
図10は、第2実施形態に係る商品呼出システムに含まれるアプリケーションサーバの機能構成を示すブロック図である。図10に示されるように、アプリケーションサーバ4Aは、記憶部31、通信部32及び制御部33に加えて、商品マスタ41を有する。商品マスタ41は、入力された名称に応じた商品情報を読み出してインターフェイス部2に出力する部分である。商品マスタ41に入力される名称は、例えばインターフェイス部2から出力されるが、これに限られない。商品情報は、名称毎に設定される商品名、加工年月日、賞味期限、単価、内容量、価格、バーコード、QRコード(登録商標)等であり、例えば記憶部31に記憶される。商品情報は、目録に含まれる名称毎に登録されるが、これに限られない。
商品呼出システムにおける商品呼出処理では、例えばまず、上記第1実施形態におけるステップS1〜S7が実施される。続いてステップS7後、ユーザ等は、所望の名称をインターフェイス部2の手動入力部12を介して選択する。続いて、インターフェイス部2は、選択された名称(選択名称)を通信部15を介してアプリケーションサーバ4Aに送信する。続いて、商品マスタ41は、入力された選択名称に応じた商品情報を読み出し、通信部32を介してインターフェイス部2に出力する。そして、インターフェイス部2は、入力された商品情報を表示部11に表示する。
以上に説明した第2実施形態に係る商品呼出システムは、上記第1実施形態に係る音声文字変換システム1を備える。このため、上記第1実施形態と同様の作用効果が奏されるので、商品情報の出力精度を向上可能である。
(第3実施形態)
以下では、第3実施形態に係る商品処理装置について説明する。第3実施形態の説明において第1実施形態及び第2実施形態と重複する記載は省略し、第1実施形態及び第2実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第3実施形態に第1実施形態及び第2実施形態の記載を適宜用いてもよい。
以下では、第3実施形態に係る商品処理装置について説明する。第3実施形態の説明において第1実施形態及び第2実施形態と重複する記載は省略し、第1実施形態及び第2実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第3実施形態に第1実施形態及び第2実施形態の記載を適宜用いてもよい。
第3実施形態に係る商品処理装置は、第2実施形態に係る商品呼出システムと通信する装置であり、インターフェイス部2から送信された商品情報を、処理すべき商品の商品情報として設定する。このため、例えば第3実施形態にて用いられる商品呼出システムに含まれるインターフェイス部2は、商品処理装置と通信可能である。商品処理装置は、例えば、設定された商品情報に基づいて商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、X線検査装置のいずれかである。以下では、商品処理装置の一例として、計量包装値付装置の構成の概要を説明する。
図11は、計量包装値付装置の外観斜視図である。図11に示されるように、計量包装値付装置51は、計量装置52と、フィルムロール支持機構53と、フィルム送出機構54と、フィルム搬送機構55と、折込機構56と、シール機構57と、値付機58と、制御装置59とを備える。
計量装置52は、計量包装値付装置51の正面中央部に設けられている装置である。計量装置52上に商品が載置されると、商品の重量が計量装置52により計量される。計量された商品は、フィルムロール支持機構53と、フィルム送出機構54と、フィルム搬送機構55と、折込機構56とを用いて、フィルムロール支持機構53に保持されるフィルムロールによって包装される。また、シール機構57は、折込機構56により商品の底面側に折り込まれたフィルムに対して、熱シールを施す。値付機58は、商品呼出システムから出力される商品情報が印字された商品ラベルを発行すると共に、当該商品ラベルを商品の包装に貼付する。制御装置59は、計量装置52と、フィルムロール支持機構53と、フィルム送出機構54と、フィルム搬送機構55と、折込機構56と、シール機構57と、値付機58との動作等を制御する。また、制御装置59は、商品呼出システムから出力される商品情報を受信する。
以上に説明した第3実施形態に係る商品処理装置は、上記第1実施形態に係る音声文字変換システム1を備える商品呼出システムと通信する装置である。このため、上記第1実施形態と同様の作用効果が奏される。
以上、本発明に係る各実施形態及び変形例について説明したが、本発明は、上記実施形態等に限定されない。上記実施形態及び上記変形例は、適宜組みあわせてもよい。例えば、第2実施形態に係る商品呼出システムは、第1実施形態の第1変形例に係る音声文字変換システムを備えてもよい。また、上記第1変形例及び上記第2変形例を組みあわせてもよい。
上記実施形態及び上記変形例では、クラウドサーバから送信された文字情報がインターフェイス部に表示されるが、これに限られない。例えば、インターフェイス部は、音声入力後、文字情報が表示されることなく、抽出された名称の一覧が表示されてもよい。また、ステップS5の前にステップS2〜S4が複数回実施されてもよい。これにより、複数の文字情報の全てを含む名称を抽出できるので、ユーザの目的に合致する名称がより抽出されやすくなる。
上記実施形態及び上記変形例では、名称に含まれるキーワードは、名称の文字列等に部分一致もしくは完全一致したものであるが、これに限られない。例えば、名称に含まれるキーワードは、名称の文字列等に完全一致したものだけでなく、当該文字列等に類似したものでもよい。換言すると、所定の名称は、当該名称に完全一致している文字列、音節文字、発音記号等をキーワードとして含むだけでなく、当該名称に類似している文字列、音節文字、発音記号等をキーワード(類似キーワード)として含み得る。所定の名称における類似キーワードは、当該名称に完全一致しているキーワードに類似したものだけでなく、当該名称の一部に完全一致しているキーワードに類似したものも含み得る。所定の名称における類似キーワードは、例えばユーザ等によって任意に登録されてもよいし、自動で登録されてもよい。この場合、例えば入力される文字情報の文字列等に一致する名称が記憶部に記憶されていなくとも、当該文字情報を含む名称を抽出可能になる。
上記実施形態及び上記変形例では、音声文字変換システムは、インターフェイス部、クラウドサーバ、及びアプリケーションサーバを備えるが、これに限られない。例えば、インターフェイス部は、クラウドサーバに相当する音声認識部を有してもよい。もしくは、音声文字変換システムにおける音声認識部として機能する部分は、クラウドコンピューティングとは異なるサーバ等でもよい。インターフェイス部は、アプリケーションサーバに相当する名称抽出部を有してもよい。インターフェイス部が名称抽出部を備える場合、インターフェイス部は、例えば、上記アプリケーションサーバに含まれる記憶部を有してもよいし、インターフェイス部の制御部は、音声信号から変換された文字情報を含む名称の抽出を実施してもよい。
第2実施形態では、商品マスタはアプリケーションサーバに含まれるが、これに限られない。商品マスタは、インターフェイス部に含まれてもよいし、インターフェイス部及びアプリケーションサーバとは異なる装置に含まれてもよい。
1…音声文字変換システム、2…インターフェイス部、3…クラウドサーバ、4,4A…アプリケーションサーバ、11…表示部、12…手動入力部、13…音声入力部、14…音声処理部、15…通信部、16…制御部、21…音声変換部、22…通信部、23…制御部、31…記憶部、32…通信部、33…制御部、34…名称データベース、35…目録登録部、35a…第1目録、35b…第2目録、41…商品マスタ、51…計量包装値付装置。
Claims (6)
- 入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、
前記音声信号を文字情報に変換する音声認識部と、
種別毎に異なる複数の目録を記憶する記憶部と、
前記音声信号及び前記種別が前記インターフェイス部に入力されると、入力された前記種別に応じた前記目録の中から、前記文字情報を含む名称、及び/又は前記文字情報の類似文字情報を含む名称を抽出する制御部と、
を備える音声文字変換システム。 - 前記音声認識部によって変換される前記文字情報は、複数の変換候補文字を含み、
前記制御部は、前記音声信号及び前記種別が前記インターフェイス部に入力されると、入力された前記種別に応じた前記目録の中から、前記複数の変換候補文字のうち少なくとも一部を含む名称を抽出する、請求項1に記載の音声文字変換システム。 - 前記音声認識部は、外部のクラウドコンピューティングであり、
前記インターフェイス部は、前記クラウドコンピューティングと通信する通信機能を備えたタブレット端末である、請求項1または2に記載の音声文字変換システム。 - 請求項1〜3のいずれか一項に記載の音声文字変換システムと、
前記目録に含まれる名称毎に登録される商品情報を記憶する商品マスタと、
を備え、
前記インターフェイス部は、抽出された前記名称を前記商品マスタに出力し、
前記商品マスタは、入力された前記名称に応じた前記商品情報を読み出して前記インターフェイス部に出力する、
商品呼出システム。 - 請求項4に記載の商品呼出システムと通信する商品処理装置であって、
前記インターフェイス部は、前記商品処理装置と通信する通信手段を備え、
前記商品処理装置は、前記インターフェイス部から送信された前記商品情報を、処理すべき商品の商品情報として設定する、
商品処理装置。 - 前記商品処理装置は、前記商品情報に基づいて前記商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、X線検査装置のいずれかである、請求項5に記載の商品処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020012777A JP2021117452A (ja) | 2020-01-29 | 2020-01-29 | 音声文字変換システム、商品呼出システム及び商品処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020012777A JP2021117452A (ja) | 2020-01-29 | 2020-01-29 | 音声文字変換システム、商品呼出システム及び商品処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021117452A true JP2021117452A (ja) | 2021-08-10 |
Family
ID=77174785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020012777A Pending JP2021117452A (ja) | 2020-01-29 | 2020-01-29 | 音声文字変換システム、商品呼出システム及び商品処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021117452A (ja) |
-
2020
- 2020-01-29 JP JP2020012777A patent/JP2021117452A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110678859B (zh) | 显示装置 | |
US8055495B2 (en) | Apparatus and method for translating input speech sentences in accordance with information obtained from a pointing device | |
EP0370774B1 (en) | Machine translation system | |
US10089975B2 (en) | Transliteration work support device, transliteration work support method, and computer program product | |
JP2006236315A5 (ja) | ||
JP2008186376A (ja) | 音声出力装置及び音声出力プログラム | |
JP5611270B2 (ja) | 単語分割装置、及び単語分割方法 | |
JP2021117452A (ja) | 音声文字変換システム、商品呼出システム及び商品処理装置 | |
JPWO2008018287A1 (ja) | 検索装置及び検索データベース生成装置 | |
JPS60235271A (ja) | かな漢字変換装置 | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
JP2016143099A (ja) | 出力データ作成装置及びプログラム | |
JP6244993B2 (ja) | 拗促音判定装置、拗促音判定方法及び拗促音判定用コンピュータプログラム | |
JPH1166061A (ja) | 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3935374B2 (ja) | 辞書構築支援方法、装置及びプログラム | |
JPH0630052B2 (ja) | 音声認識表示装置 | |
JP2006338124A (ja) | 漢字検索方法,そのシステム,そのサーバ | |
JP2015191431A (ja) | 外国語のカタカナ表現作成装置、外国語のカタカナ表現作成方法及び外国語のカタカナ表現作成プログラム | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JPH032963A (ja) | 文書処理装置 | |
JPS6365517A (ja) | 文字処理装置 | |
JPS6310266A (ja) | 翻訳装置 | |
JP2020042658A (ja) | 情報処理装置及びプログラム | |
JP2020042657A (ja) | 情報処理装置及びプログラム | |
JPH09153033A (ja) | 文書作成装置及び文書作成方法 |