JP2021117452A

JP2021117452A - 音声文字変換システム、商品呼出システム及び商品処理装置

Info

Publication number: JP2021117452A
Application number: JP2020012777A
Authority: JP
Inventors: 佑磨大矢; Yuma Oya; 元弘近藤; Motohiro Kondo
Original assignee: Ishida Co Ltd
Current assignee: Ishida Co Ltd
Priority date: 2020-01-29
Filing date: 2020-01-29
Publication date: 2021-08-10

Abstract

【課題】音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置を提供する。【解決手段】音声文字変換システムは、入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、音声信号を文字情報に変換する音声認識部と、種別毎に異なる複数の目録を記憶する記憶部と、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、文字情報を含む名称、及び／又は文字情報の類似文字情報を含む名称を抽出する制御部と、を備える。【選択図】図１

Description

本発明は、音声文字変換システム、商品呼出システム及び商品処理装置に関する。

例えば生鮮食料品等の商品を計量して値付けする場合、作業者は、当該商品に応じた呼出番号を入力することによって、もしくは、ＰＬＵキー（ＰＬＵ：Price Look Up）を操作することによって、所望の商品情報を読み出す必要がある。前者の方法では、作業者が呼出番号等を覚える必要がある。後者の方法では、ＰＬＵキー操作が煩雑である。このため、上述した方法を実施する場合、作業者の訓練が必要になる。

計量した商品の値付けにおいては、音声認識技術の利用が図られる。この場合、キー操作を介さずに、発話した商品の情報（商品情報）を直接読み出せるからである。例えば下記特許文献１には、オペレータが発する音声に含まれる商品名を音声認識された商品名として出力する音声認識手段が開示されている。

特許第６００４５０２号公報

例えば、商品の製造現場、商品の販売現場等の雑音が発生する環境にて、上述したような音声認識技術を利用した場合、音声の誤認識が発生しやすくなる。したがって、例えば上記環境等においても高い精度の音声認識を実現可能なシステムが望まれている。

本発明の一側面の目的は、音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置の提供である。

本発明の一側面に係る音声文字変換システムは、入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、音声信号を文字情報に変換する音声認識部と、種別毎に異なる複数の目録を記憶する記憶部と、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、文字情報を含む名称、及び／又は文字情報の類似文字情報を含む名称を抽出する制御部と、を備える。

この音声文字変換システムによれば、記憶部は、種別毎に異なる複数の目録を記憶しており、制御部は、入力された種別に応じた目録の中から、音声信号から変換された文字情報を含む名称、及び／又は当該文字情報の類似文字情報を含む名称を抽出する。これにより、例えばユーザから発せられた音声から生成される文字情報、及び／又は当該文字情報の類似文字情報を含む名称が記憶部に複数記憶されている場合であっても、入力された種別に応じた目録を用いることによって、音声の誤認識が発生しにくくなる。よって、例えば雑音が発声する環境等においても、ユーザの目的に合致する名称が抽出されやすくなる。したがって本発明の一側面によれば、音声認識精度を向上可能な音声文字変換システムを提供できる。

音声認識部によって変換される文字情報は、複数の変換候補文字を含み、制御部は、音声信号及び種別がインターフェイス部に入力されると、入力された種別に応じた目録の中から、複数の変換候補文字のうち少なくとも一部を含む名称を抽出してもよい。この場合、例えばユーザから発せられた音声に加えて周囲の雑音等が受信部に受信されたとしても、ユーザの目的に合致する名称が抽出されやすくなる。したがって、音声文字変換システムによる音声認識精度をより向上可能である。

音声認識部は、外部のクラウドコンピューティングであり、インターフェイス部は、クラウドコンピューティングと通信する通信機能を備えたタブレット端末でもよい。この場合、ユーザは、クラウドコンピューティングと通信できる環境さえ整っていれば、特定の位置に限定されずに音声文字変換システムを利用可能である。加えて、外部のクラウドコンピューティングを利用するため、音声認識部をインターフェイス部内に組み込んだ場合のバージョンアップに要する作業等を低減できる。

本発明の別の一側面に係る商品呼出システムは、上記音声文字変換システムと、目録に含まれる名称毎に登録される商品情報を記憶する商品マスタと、を備え、インターフェイス部は、抽出された名称を商品マスタに出力し、商品マスタは、入力された名称に応じた商品情報を読み出してインターフェイス部に出力する。この場合、商品情報の出力精度を向上可能である。

本発明のまた別の一側面に係る商品処理装置は、上記商品呼出システムと通信する商品処理装置であって、インターフェイス部は、商品処理装置と通信する通信手段を備え、商品処理装置は、インターフェイス部から送信された商品情報を、処理すべき商品の商品情報として設定する。また、商品処理装置は、商品情報に基づいて商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、Ｘ線検査装置のいずれかでもよい。

本発明の一側面によれば、音声認識精度を向上可能な音声文字変換システム、並びに当該音声文字変換システムを利用した商品呼出システム及び商品処理装置を提供できる。

図１は、第１実施形態に係る音声文字変換システムの機能構成を示すブロック図である。図２は、インターフェイス部の概略図である。図３は、記憶部の機能構成を示すブロック図である。図４（ａ）は、第１目録の抜粋例を示す図であり、図４（ｂ）は、第２目録の抜粋例を示す図である。図５は、音声文字変換処理のフローチャートである。図６は、音声文字変換処理中におけるインターフェイス部の表示画面を示す。図７は、音声文字変換処理中におけるインターフェイス部の表示画面を示す。図８は、音声文字変換処理中におけるインターフェイス部の表示画面を示す。図９は、入力される文字情報と類似文字情報との変換表の抜粋例を示す図である。図１０は、第２実施形態に係る商品呼出システムに含まれるアプリケーションサーバの機能構成を示すブロック図である。図１１は、計量包装値付装置の外観斜視図である。

以下、図面を参照して、本発明の好適な一実施形態について詳細に説明する。なお、図面の説明において、同一要素には同一符号を付し、重複する説明を省略する。

（第１実施形態）
図１は、第１実施形態に係る音声文字変換システムの機能構成を示すブロック図である。図１に示される音声文字変換システム１は、入力された音声を目視可能な名称に変換するシステムである。第１実施形態における音声文字変換システム１は、インターフェイス部２と、クラウドサーバ３と、アプリケーションサーバ４とを備える。音声文字変換システム１は、まず、インターフェイス部２にて得られる音声信号をクラウドサーバ３にて文字情報に変換する。続いて、音声文字変換システム１は、アプリケーションサーバ４にて当該文字情報を含む名称を抽出する。そして、音声文字変換システム１は、抽出された名称をインターフェイス部２に目視可能に表示する。

図２は、インターフェイス部の概略図である。図１及び図２に示されるインターフェイス部２は、音声文字変換システム１の端末装置であり、ユーザからの手動入力操作及び音声入力操作を受け付ける。手動入力操作は、直接入力にて実施されてもよいし、遠隔操作による間接入力にて実施されてもよい。第１実施形態のインターフェイス部２は、クラウドサーバ３及びアプリケーションサーバ４と通信する通信機能を備えたタブレット端末である。インターフェイス部２は、表示部１１、手動入力部１２、音声入力部１３、音声処理部１４、通信部１５及び制御部１６を有する。

表示部１１は、音声文字変換システム１の実行結果を表示する部分であり、例えば液晶ディスプレイ等である。表示部１１は、例えば、アプリケーションサーバ４から送信される名称の抽出結果等を表示する。第１実施形態では、表示部１１は、ユーザによる手動入力操作の実施に用いる各種画像も表示する。当該各種画像は、例えば、テンキー画像、キーボード画像等である。手動入力部１２は、インターフェイス部２に各種情報（信号）を手動入力する部分である。第１実施形態では、手動入力部１２は、表示部１１に重なるタッチパネルであり、表示部１１に表示される各種画像に連動する。

音声入力部１３は、外部から音声が入力される部分であり、例えばマイクロフォンである。音声処理部１４は、入力された音声を音声信号とする部分である。音声に含まれる雑音除去の観点から、音声処理部１４は、入力された音声をフィルタリングしてもよい。第１実施形態では、音声処理部１４のフィルタリングは、制御部１６に含まれるが、これに限られない。音声信号は、例えばデジタル信号である。

通信部１５は、クラウドサーバ３とアプリケーションサーバ４とのそれぞれに対して、有線又は無線による通信を可能とする部分（通信手段）である。第１実施形態では、通信部１５と、クラウドサーバ３と、アプリケーションサーバ４とのそれぞれは、無線により通信される。通信部１５は、クラウドサーバ３と、アプリケーションサーバ４とのそれぞれから信号を受信する。通信部１５は、クラウドサーバ３に音声信号を送信し、アプリケーションサーバ４に後述する文字情報等を送信する。通信部１５は、クラウドサーバ３及びアプリケーションサーバ４とは異なる外部装置と通信可能である。例えば、外部装置が端末装置であって、その端末装置からインターフェイス部２が遠隔操作される場合、通信部１５は、遠隔先の端末装置と有線又は無線により通信する。

制御部１６は、クラウドサーバ３、アプリケーションサーバ４等の外部装置との各種信号の入出力、表示部１１の画像出力、手動入力部１２及び音声入力部１３の入力、音声処理部１４の処理、並びに通信部１５の信号通信などを制御する部分である。制御部１６は、例えば、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等の記憶媒体、ＣＰＵ（Central Processing Unit）、及び通信回路などを有する。ＲＯＭには、インターフェイス部２における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部１６における各種処理は、ＣＰＵ及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部１６における各種処理は、ＣＰＵの制御のもと実施される。

クラウドサーバ３は、音声文字変換システム１における音声認識部であり、入力された音声信号を文字情報に変換する。第１実施形態のクラウドサーバ３は、インターフェイス部２とは異なる装置（外部装置）であるクラウドコンピューティングである。クラウドサーバ３は、音声変換部２１と、通信部２２と、制御部２３とを有する。

音声変換部２１は、インターフェイス部２から送信された音声信号を文字情報に変換する部分である。文字情報は、配列された文字列を含み、アプリケーションサーバ４にて特定の名称を抽出するためのキーワードである。文字列が複数の文字から構成される場合、音声変換部２１は、当該文字列から単語、熟語、短文等を構成してもよい。文字情報は、予め設定された言語（日本語、英語等）で生成される。言語には、方言等が含まれてもよい。第１実施形態では、言語は日本語に設定されており、音声変換部２１にて生成される文字情報は、漢字を含むがこれに限られない。音声変換部２１にて生成される文字列は、音節文字にて構成されてもよい。文字情報は、文字列の代わりに、もしくは文字列に加えて、発音記号等を含んでもよい。すなわち、音声変換部２１によって生成される文字情報は、音声信号から生成される発音記号等を含み得る。

通信部２２は、インターフェイス部２とアプリケーションサーバ４とのそれぞれに対して、有線又は無線による通信を可能とする部分であり、例えばウェブサーバである。第１実施形態では、通信部２２と、インターフェイス部２と、アプリケーションサーバ４とのそれぞれは、無線により通信される。通信部２２は、インターフェイス部２から音声信号を受信し、インターフェイス部２に文字情報を送信する。通信部２２は、例えば音声変換部２１の処理に用いられるコンピュータソフトウェア等をアップデートするため、当該コンピュータソフトウェア等を保存するサーバ、外部記憶媒体等と通信可能である。

制御部２３は、インターフェイス部２、アプリケーションサーバ４等の外部装置との各種信号の入出力、音声変換部２１の処理、並びに通信部２２の信号通信などを制御する部分である。制御部２３は、例えば、ＲＯＭ及びＲＡＭ等の記憶媒体、ＣＰＵ、及び通信回路などを有する。ＲＯＭには、クラウドサーバ３における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部２３における各種処理は、ＣＰＵ及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部２３における各種処理は、ＣＰＵの制御のもと実施される。

アプリケーションサーバ４は、音声文字変換システム１における名称抽出部であり、入力された文字情報を含む名称を抽出する。第１実施形態のアプリケーションサーバ４は、インターフェイス部２とは異なる装置（外部装置）である。アプリケーションサーバ４は、記憶部３１と、通信部３２と、制御部３３とを有する。

図３は、記憶部の機能構成を示すブロック図である。図３に示される記憶部３１は、例えばハードディスク（ＨＤ）、ソリッドステートドライブ（ＳＳＤ）などの記憶媒体であり、名称データベース３４と、目録登録部３５とを有する。名称データベース３４は、各種名称を記憶する部分である。各種名称は、例えば、図４に示される商品名、文献名、生物名、人物名、地名、無機物名、有機物名等の文字列である。名称データベース３４は、名称の文字列に加えて、当該名称の音節文字、発音記号等を記憶してもよい。名称データベース３４に記憶される名称の追加、修正、削除等は、例えばインターフェイス部２等を介して実施できる。

目録登録部３５は、複数の目録（第１目録３５ａ〜第Ｘ目録３５ｘ）を記憶する部分である。目録は、特定の種別（種類）として例えば、スーパーマーケットの食品売場では、精肉、鮮魚、総菜等の部門名が設定されると共に、当該種別に属する個々の商品の名称が登録されるリストである。種別に属する個々の商品の名称は、当該種別という観点からまとめられた商品の名称である。第１実施形態では、第１目録３５ａと、第２目録３５ｂと、第Ｘ目録３５ｘとには、互いに異なる種別が設定される。このため、記憶部３１は、種別毎に異なる複数の目録を記憶する部分と言える。第１実施形態では、インターフェイス部２から送信される信号に応じて、利用される目録が設定される。

各目録に登録される名称のそれぞれは、一又は複数のキーワードを含む。キーワードは、名称の文字列、音節文字、発音記号等である。すなわち、キーワードは、文字情報に相当する。名称自体がキーワードの一つでもよい。キーワードは、名称の一部の文字列、音節文字、発音記号等でもよい。この場合、名称の一部は、例えば当該名称の特徴的な部分であり、自動もしくは手動にて設定される。名称データベース３４に記憶される全ての名称のうち一部の名称は、複数の目録（例えばスーパーマーケットであれば部門別）に登録されてもよい。換言すると、互いに異なる目録には、同一の名称が含まれてもよい。この場合、当該同一の名称に含まれるキーワードは、目録毎に異なってもよい。目録登録部３５に登録される目録の追加、修正、削除等は、例えばインターフェイス部２等を介して実施できる。目録に含まれる名称に関連付けられるキーワードの追加、修正、削除等もまた、例えばインターフェイス部２等を介して実施できる。

図４（ａ）は、第１目録の抜粋例を示す図であり、図４（ｂ）は、第２目録の抜粋例を示す図である。図４（ａ），（ｂ）のそれぞれにおいて、紙面左側には目録に登録される名称、例えば商品名が示され、紙面右側にはその名称を抽出するためのキーワードが示される。図４（ａ），（ｂ）に示されるように、各目録における所定の名称は、複数のキーワードを含み得る。例えば、種別を「海産物」と設定された第１目録３５ａに属する商品の名称である「鰤」のキーワードとして、「鰤」に一致する文字列である「鰤」と、「鰤」に一致する音節文字である「ぶり」とが含まれる。例えば、種別を「肉」と設定された第２目録３５ｂに属する商品の名称である「牛肉」のキーワードとして、「牛肉」に一致する文字列である「牛肉」と、「牛肉」に一致する音節文字である「ぎゅうにく」とが含まれる。また、第２目録３５ｂに登録される名称である「国産牛肉」のキーワードとして、当該名称の一部である「牛肉」に一致する文字列である「牛肉」等が含まれ得る。

通信部３２は、インターフェイス部２とクラウドサーバ３とのそれぞれに対して、有線又は無線による通信を可能とする部分であり、例えばウェブサーバである。第１実施形態では、通信部３２と、インターフェイス部２と、クラウドサーバ３とのそれぞれは、無線により通信される。通信部３２は、インターフェイス部２から入力された種別、文字情報等を受信し、インターフェイス部２に対して、種別と文字情報とから抽出される名称の抽出結果を送信する。通信部３２は、例えば記憶部３１に記憶される情報をアップデートするため、当該情報を保存するサーバ、外部記憶媒体等と通信可能である。

制御部３３は、インターフェイス部２、クラウドサーバ３等の外部装置との各種信号の入出力、記憶部３１から入力された文字情報を含む名称の抽出、並びに通信部３２の信号通信などを制御する部分である。制御部３３は、例えば、ＲＯＭ及びＲＡＭ等の記憶媒体、ＣＰＵ、及び通信回路などを有する。ＲＯＭには、アプリケーションサーバ４における各種処理を実施するためのプログラム、各種情報等が記憶される。制御部３３における各種処理は、ＣＰＵ及び主記憶部等のハードウェア上に所定のコンピュータソフトウェアを読み込ませて実行することにより、実施される。すなわち、制御部３３における各種処理は、ＣＰＵの制御のもと実施される。

制御部３３は、インターフェイス部２から入力された種別と、クラウドサーバ３にて生成されインターフェイス部２を介して入力された文字情報とから、その文字情報を含む名称を抽出する。第１実施形態では、制御部３３は、選択された目録に属する名称のうち、入力された文字情報に一致するキーワードを含む名称を抽出する。制御部３３は、抽出した名称の一覧を音声文字変換システム１の実行結果として、通信部３２を介してインターフェイス部２に送信する。

次に、図５〜図８を参照しながら第１実施形態に係る音声文字変換システム１における音声文字変換処理を説明する。図５は、音声文字変換処理のフローチャートである。図６〜８は、音声文字変換処理中におけるインターフェイス部２の表示画面を示す。

まず図５に示されるように、音声文字変換処理を実行しようとする検索対象の種別をインターフェイス部２に入力する（ステップＳ１）。ステップＳ１では、例えばユーザは、インターフェイス部２の表示部１１及び手動入力部１２を用いて、所望の種別を入力する。種別の入力結果は、通信部１５を介してアプリケーションサーバ４に送信される。

次に、インターフェイス部２は、外部から音声を受信する（ステップＳ２）。ステップＳ２では、まず図６に示されるように、インターフェイス部２を音声認識状態に設定する。続いて、ユーザがインターフェイス部２に対して所望の名称の全てもしくは一部を発声することにより、音声入力部１３が音声を受信する。

次に、インターフェイス部２は、音声信号の生成及び送信を実施する（ステップＳ３）。ステップＳ３では、音声処理部１４が、音声入力部１３が受信した音声を音声信号に変換する。音声信号は、通信部１５を介してクラウドサーバ３の通信部２２に送信される。例えばステップＳ３の開始と同時に、インターフェイス部２の音声認識状態は、解除若しくは一時停止される。これにより、音声文字変換処理の途中で、音声入力部１３による不要な音声の受信を防止できる。

次に、クラウドサーバ３は、音声信号を文字情報に変換する（ステップＳ４）。ステップＳ４では、音声変換部２１が、受信した音声信号を文字情報に変換する。文字情報は、通信部２２を介してインターフェイス部２に送信される。表示部１１は、例えば図７に示されるように、受信した文字情報の文字列である「国産牛」と、当該文字情報の音節文字である「こくさんぎゅう」とを、「検索ワード」の欄に表示する。これにより、ユーザは、変換された文字情報が目的に沿ったものか否かを容易に判断できる。なお、当該文字情報が目的に沿ったものではない場合、インターフェイス部２の操作によってステップＳ２〜Ｓ４を再実行できる。

次に、インターフェイス部２は、文字情報を含む名称の検索要求を実施する（ステップＳ５）。ステップＳ５では、文字情報と、当該文字情報を含む名称の検索指示信号とが、通信部１５を介してアプリケーションサーバ４の通信部３２に送信される。

次に、アプリケーションサーバ４は、入力された種別に応じた目録から名称を抽出する（ステップＳ６）。ステップＳ６では、制御部３３は、ステップＳ１にて入力された種別に属する目録に登録される名称のうち、入力された文字情報に一致するキーワード（文字情報）を含む名称を抽出する。続いて、制御部３３は、通信部３２を介して抽出された名称の一覧をインターフェイス部２に送信する。

そして、インターフェイス部２は、抽出された名称を表示部１１に表示する（ステップＳ７）。表示部１１は、例えば図８に示されるように、受信した名称の一覧を検索結果の欄に表示する。以上により、音声文字変換処理が終了する。音声文字変換処理の終了後、ユーザは、手動入力部１２を介して受信した名称の中から所望の名称を選択できる。ユーザは、選択した名称を用いて、音声文字変換処理とは異なる処理を実施できる。

以上に説明した第１実施形態に係る音声文字変換システム１によれば、記憶部３１は、種別毎に異なる複数の目録を記憶しており、制御部３３は、入力された種別に属する目録の中から、音声信号から変換された文字情報を含む名称を抽出する。これにより、例えばユーザから発せられた音声から生成される文字情報を含む名称が記憶部３１に複数記憶されている場合であっても、入力された種別に属する目録を用いることによって、音声の誤認識が発生しにくくなる。よって、例えば雑音が発声する環境等においても、ユーザの目的に合致する名称が抽出されやすくなる。すなわち、ユーザの目的に合致しない名称が抽出されにくくなる。したがって第１実施形態では、音声認識精度を向上可能な音声文字変換システム１を提供できる。

加えて、第１実施形態によれば、上述した通り、入力された種別に属する目録の中から、名称が抽出される。すなわち、所定の目録に含まれる名称のみが検索対象になる。このため、名称データベース３４に含まれる全名称を検索対象とする場合よりも、通信量、検索負荷等を低減できる。

第１実施形態では、音声認識部であるクラウドサーバ３は、外部のクラウドコンピューティングであり、インターフェイス部２は、クラウドコンピューティングと通信する通信機能を備えたタブレット端末である。この場合、ユーザは、クラウドコンピューティングと通信できる環境さえ整っていれば、特定の位置に限定されずに音声文字変換システム１を利用可能である。加えて、外部のクラウドコンピューティングを利用するため、音声認識部をインターフェイス部内に組み込んだ場合のバージョンアップに要する作業等を低減できる。

以下では、第１実施形態の各変形例について説明する。各変形例の説明において、第１実施形態と重複する記載については省略し、第１実施形態と異なる箇所を説明する。

（第１変形例）
第１実施形態の第１変形例では、アプリケーションサーバ４は、入力された文字情報を変換し得る。例えば、入力された文字情報が、記憶部３１に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれにも一致しない場合、アプリケーションサーバ４は、入力された文字情報に類似する文字情報（類似文字情報）に変換する。類似文字情報は、記憶部３１に記憶される名称及び／又はそのキーワードの文字列、音節文字、発音記号等の少なくとも一つに一致している情報（キーワード）である。第１変形例では、類似文字情報は音節文字であるが、これに限られない。また、入力された文字情報が、記憶部３１に含まれるキーワード、もしくは設定された目録に登録されるキーワードのいずれかに一致した場合であっても、アプリケーションサーバ４は、入力された文字情報に近似する文字情報に変換してもよい。

アプリケーションサーバ４による文字情報の変換は、例えば予め生成される変換表に基づいて実施される。変換表は、目録毎に登録されてもよい。この場合、類似文字情報が、目録内に登録されるキーワードに合致しやすくなる。図９は、入力される文字情報と類似文字情報との変換表の抜粋例を示す図である。図９において、紙面左側には入力される文字情報が示され、紙面右側には当該文字情報の類似文字情報が示される。図９に示されるように、例えば第１目録３５ａには、入力される文字情報である「むり」及び「ふり」と、これらの類似文字情報である「ぶり」とが示される変換表が含まれる。このような変換表を用いることによって、アプリケーションサーバ４は、入力された文字情報を、当該文字情報に関連付けられる類似文字情報として抽出し、それを例えばインターフェイス部２に出力する。

変換表は、例えばユーザ等によって任意に作成されてもよいし、自動で作成されてもよい。前者の場合、例えばユーザ等の経験に基づき、変換表が作成されてもよい。後者の場合、例えば文字列同士の類似度を利用することによって、変換表が生成される。この場合、例えば、最小編集距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離等が利用される。例えば、類似文字情報と、入力される文字情報の文字列との距離が２以下もしくは１である。もしくは、文字情報同士の類似度は、文字情報の発音を文字化したものを用いてもよい。この場合、例えば英語のように、互いの発音が類似している一方で互いの綴り字（スペリング）が非類似である２つの文字情報を、互いに類似していると自動で判断できる。

第１変形例では、アプリケーションサーバ４の制御部３３は、音声信号及び種別がインターフェイス部２に入力されると、入力された種別に属する目録の中から、文字情報を含む名称、及び／又は当該文字情報の類似文字情報を含む名称を抽出する。例えば、第１実施形態におけるステップＳ６の前において、制御部３３は、入力された文字情報を変換して、類似文字情報を生成する。ここでは、制御部３３は、入力された種別に属する目録に登録される変換表を利用することによって、入力された文字情報を、当該文字情報に関連付けられる類似文字情報に変換する。続いて、制御部３３は、上記ステップＳ６の代わりに、入力された種別に属する目録に登録される名称のうち、入力された文字情報、及び／又は当該文字情報の類似文字情報に一致するキーワードを含む名称を抽出する。ここでは、類似文字情報が生成された場合、制御部３３は、入力された文字情報に一致するキーワードを含む名称だけでなく、類似文字情報に一致するキーワードを含む名称を抽出する。そして、第１実施形態におけるステップＳ７が実施される。

以上に説明した第１変形例においても、第１実施形態と同様の作用効果が奏される。加えて第１変形例では、例えばユーザから発せられた音声に加えて周囲の雑音等が音声入力部１３に受信されたとしても、ユーザの目的に合致する名称がより抽出されやすくなる。したがって、音声文字変換システムによる音声認識精度をより向上可能である。

（第２変形例）
第１実施形態の第２変形例では、音声変換部２１は、音声信号から一つの文字列だけでなく、複数の文字列、複数の音節文字、及び／又は複数の発音記号等を作成する。すなわち、音声変換部２１によって生成される文字情報は、複数の変換候補文字（ヒントワード）を含み得る。複数の変換候補文字のそれぞれは、例えば互いに子音が異なってもよいし、母音が異なってもよいし、子音及び母音の両方が異なってもよい。互いに異なる変換候補文字同士においては、子音が１つ又は複数異なってもよい。もしくは、互いに異なる変換候補文字同士においては、母音が１つまたは２つ異なってもよい。音声変換部２１は、複数の変換候補文字のそれぞれから単語、熟語、短文等を構成してもよい。この場合、複数の変換候補文字のそれぞれには、優先度（スコア）が付されてもよい。優先度は、例えば、単語、熟語、短文等が構成される変換候補文字ほど高い。また、優先度は、予め設定された単語（頻出単語）、熟語、短文等が構成される変換候補文字ほど高くてもよい。複数の変換候補文字のうち最も優先度が高いものを、第１候補文字としてもよい。この場合、複数の変換候補文字のそれぞれは、第１候補文字に対して類似してもよい。

第２変形例では、アプリケーションサーバ４の制御部３３は、音声信号及び種別がインターフェイス部２に入力されると、入力された種別に属する目録の中から、複数の変換候補文字のうち少なくとも一部を含む名称を抽出する。このとき、制御部３３は、複数の変換候補文字のうち所定の優先度未満の変換候補文字を予め排除し、残った変換候補文字のうち少なくとも一部を含む名称を抽出してもよい。この場合、ユーザの目的に合致しない名称が抽出されにくくなる傾向にある。

以上に説明した第２変形例においても、第１実施形態と同様の作用効果が奏される。加えて第２変形例では、例えば入力された音声の質が不十分である場合等においても、所望の名称が抽出されやすくなる。

（第２実施形態）
以下では、第２実施形態に係る商品呼出システムについて説明する。第２実施形態の説明において第１実施形態と重複する記載は省略し、第１実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第２実施形態に第１実施形態の記載を適宜用いてもよい。

第２実施形態に係る商品呼出システムは、第１実施形態に係る音声文字変換システム１と、後述する図１０に示される商品マスタ４１とを備えるシステムであり、例えば抽出された名称に応じた商品情報をインターフェイス部２の表示部１１に表示させるシステムである。以下では、商品マスタ４１の機能と、商品呼出システムにおける商品呼出処理とを説明する。

図１０は、第２実施形態に係る商品呼出システムに含まれるアプリケーションサーバの機能構成を示すブロック図である。図１０に示されるように、アプリケーションサーバ４Ａは、記憶部３１、通信部３２及び制御部３３に加えて、商品マスタ４１を有する。商品マスタ４１は、入力された名称に応じた商品情報を読み出してインターフェイス部２に出力する部分である。商品マスタ４１に入力される名称は、例えばインターフェイス部２から出力されるが、これに限られない。商品情報は、名称毎に設定される商品名、加工年月日、賞味期限、単価、内容量、価格、バーコード、ＱＲコード（登録商標）等であり、例えば記憶部３１に記憶される。商品情報は、目録に含まれる名称毎に登録されるが、これに限られない。

商品呼出システムにおける商品呼出処理では、例えばまず、上記第１実施形態におけるステップＳ１〜Ｓ７が実施される。続いてステップＳ７後、ユーザ等は、所望の名称をインターフェイス部２の手動入力部１２を介して選択する。続いて、インターフェイス部２は、選択された名称（選択名称）を通信部１５を介してアプリケーションサーバ４Ａに送信する。続いて、商品マスタ４１は、入力された選択名称に応じた商品情報を読み出し、通信部３２を介してインターフェイス部２に出力する。そして、インターフェイス部２は、入力された商品情報を表示部１１に表示する。

以上に説明した第２実施形態に係る商品呼出システムは、上記第１実施形態に係る音声文字変換システム１を備える。このため、上記第１実施形態と同様の作用効果が奏されるので、商品情報の出力精度を向上可能である。

（第３実施形態）
以下では、第３実施形態に係る商品処理装置について説明する。第３実施形態の説明において第１実施形態及び第２実施形態と重複する記載は省略し、第１実施形態及び第２実施形態と異なる部分を記載する。つまり、技術的に可能な範囲において、第３実施形態に第１実施形態及び第２実施形態の記載を適宜用いてもよい。

第３実施形態に係る商品処理装置は、第２実施形態に係る商品呼出システムと通信する装置であり、インターフェイス部２から送信された商品情報を、処理すべき商品の商品情報として設定する。このため、例えば第３実施形態にて用いられる商品呼出システムに含まれるインターフェイス部２は、商品処理装置と通信可能である。商品処理装置は、例えば、設定された商品情報に基づいて商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、Ｘ線検査装置のいずれかである。以下では、商品処理装置の一例として、計量包装値付装置の構成の概要を説明する。

図１１は、計量包装値付装置の外観斜視図である。図１１に示されるように、計量包装値付装置５１は、計量装置５２と、フィルムロール支持機構５３と、フィルム送出機構５４と、フィルム搬送機構５５と、折込機構５６と、シール機構５７と、値付機５８と、制御装置５９とを備える。

計量装置５２は、計量包装値付装置５１の正面中央部に設けられている装置である。計量装置５２上に商品が載置されると、商品の重量が計量装置５２により計量される。計量された商品は、フィルムロール支持機構５３と、フィルム送出機構５４と、フィルム搬送機構５５と、折込機構５６とを用いて、フィルムロール支持機構５３に保持されるフィルムロールによって包装される。また、シール機構５７は、折込機構５６により商品の底面側に折り込まれたフィルムに対して、熱シールを施す。値付機５８は、商品呼出システムから出力される商品情報が印字された商品ラベルを発行すると共に、当該商品ラベルを商品の包装に貼付する。制御装置５９は、計量装置５２と、フィルムロール支持機構５３と、フィルム送出機構５４と、フィルム搬送機構５５と、折込機構５６と、シール機構５７と、値付機５８との動作等を制御する。また、制御装置５９は、商品呼出システムから出力される商品情報を受信する。

以上に説明した第３実施形態に係る商品処理装置は、上記第１実施形態に係る音声文字変換システム１を備える商品呼出システムと通信する装置である。このため、上記第１実施形態と同様の作用効果が奏される。

以上、本発明に係る各実施形態及び変形例について説明したが、本発明は、上記実施形態等に限定されない。上記実施形態及び上記変形例は、適宜組みあわせてもよい。例えば、第２実施形態に係る商品呼出システムは、第１実施形態の第１変形例に係る音声文字変換システムを備えてもよい。また、上記第１変形例及び上記第２変形例を組みあわせてもよい。

上記実施形態及び上記変形例では、クラウドサーバから送信された文字情報がインターフェイス部に表示されるが、これに限られない。例えば、インターフェイス部は、音声入力後、文字情報が表示されることなく、抽出された名称の一覧が表示されてもよい。また、ステップＳ５の前にステップＳ２〜Ｓ４が複数回実施されてもよい。これにより、複数の文字情報の全てを含む名称を抽出できるので、ユーザの目的に合致する名称がより抽出されやすくなる。

上記実施形態及び上記変形例では、名称に含まれるキーワードは、名称の文字列等に部分一致もしくは完全一致したものであるが、これに限られない。例えば、名称に含まれるキーワードは、名称の文字列等に完全一致したものだけでなく、当該文字列等に類似したものでもよい。換言すると、所定の名称は、当該名称に完全一致している文字列、音節文字、発音記号等をキーワードとして含むだけでなく、当該名称に類似している文字列、音節文字、発音記号等をキーワード（類似キーワード）として含み得る。所定の名称における類似キーワードは、当該名称に完全一致しているキーワードに類似したものだけでなく、当該名称の一部に完全一致しているキーワードに類似したものも含み得る。所定の名称における類似キーワードは、例えばユーザ等によって任意に登録されてもよいし、自動で登録されてもよい。この場合、例えば入力される文字情報の文字列等に一致する名称が記憶部に記憶されていなくとも、当該文字情報を含む名称を抽出可能になる。

上記実施形態及び上記変形例では、音声文字変換システムは、インターフェイス部、クラウドサーバ、及びアプリケーションサーバを備えるが、これに限られない。例えば、インターフェイス部は、クラウドサーバに相当する音声認識部を有してもよい。もしくは、音声文字変換システムにおける音声認識部として機能する部分は、クラウドコンピューティングとは異なるサーバ等でもよい。インターフェイス部は、アプリケーションサーバに相当する名称抽出部を有してもよい。インターフェイス部が名称抽出部を備える場合、インターフェイス部は、例えば、上記アプリケーションサーバに含まれる記憶部を有してもよいし、インターフェイス部の制御部は、音声信号から変換された文字情報を含む名称の抽出を実施してもよい。

第２実施形態では、商品マスタはアプリケーションサーバに含まれるが、これに限られない。商品マスタは、インターフェイス部に含まれてもよいし、インターフェイス部及びアプリケーションサーバとは異なる装置に含まれてもよい。

１…音声文字変換システム、２…インターフェイス部、３…クラウドサーバ、４，４Ａ…アプリケーションサーバ、１１…表示部、１２…手動入力部、１３…音声入力部、１４…音声処理部、１５…通信部、１６…制御部、２１…音声変換部、２２…通信部、２３…制御部、３１…記憶部、３２…通信部、３３…制御部、３４…名称データベース、３５…目録登録部、３５ａ…第１目録、３５ｂ…第２目録、４１…商品マスタ、５１…計量包装値付装置。

Claims

入力された音声を音声信号とする音声処理部を有し、入力操作を受け付けるインターフェイス部と、
前記音声信号を文字情報に変換する音声認識部と、
種別毎に異なる複数の目録を記憶する記憶部と、
前記音声信号及び前記種別が前記インターフェイス部に入力されると、入力された前記種別に応じた前記目録の中から、前記文字情報を含む名称、及び／又は前記文字情報の類似文字情報を含む名称を抽出する制御部と、
を備える音声文字変換システム。
前記音声認識部によって変換される前記文字情報は、複数の変換候補文字を含み、
前記制御部は、前記音声信号及び前記種別が前記インターフェイス部に入力されると、入力された前記種別に応じた前記目録の中から、前記複数の変換候補文字のうち少なくとも一部を含む名称を抽出する、請求項１に記載の音声文字変換システム。
前記音声認識部は、外部のクラウドコンピューティングであり、
前記インターフェイス部は、前記クラウドコンピューティングと通信する通信機能を備えたタブレット端末である、請求項１または２に記載の音声文字変換システム。
請求項１〜３のいずれか一項に記載の音声文字変換システムと、
前記目録に含まれる名称毎に登録される商品情報を記憶する商品マスタと、
を備え、
前記インターフェイス部は、抽出された前記名称を前記商品マスタに出力し、
前記商品マスタは、入力された前記名称に応じた前記商品情報を読み出して前記インターフェイス部に出力する、
商品呼出システム。
請求項４に記載の商品呼出システムと通信する商品処理装置であって、
前記インターフェイス部は、前記商品処理装置と通信する通信手段を備え、
前記商品処理装置は、前記インターフェイス部から送信された前記商品情報を、処理すべき商品の商品情報として設定する、
商品処理装置。
前記商品処理装置は、前記商品情報に基づいて前記商品を処理する計量装置、計量値付装置、計量包装装置、計量包装値付装置、ラベルプリンタ、重量検査装置、Ｘ線検査装置のいずれかである、請求項５に記載の商品処理装置。