JP6483433B2 - システム及び電子機器 - Google Patents

システム及び電子機器 Download PDF

Info

Publication number
JP6483433B2
JP6483433B2 JP2014262321A JP2014262321A JP6483433B2 JP 6483433 B2 JP6483433 B2 JP 6483433B2 JP 2014262321 A JP2014262321 A JP 2014262321A JP 2014262321 A JP2014262321 A JP 2014262321A JP 6483433 B2 JP6483433 B2 JP 6483433B2
Authority
JP
Japan
Prior art keywords
notation
vocabulary
list
alias
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014262321A
Other languages
English (en)
Other versions
JP2016122344A (ja
JP2016122344A5 (ja
Inventor
桃崎 浩平
浩平 桃崎
畠山 哲夫
哲夫 畠山
厚 松野
厚 松野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dynabook Inc
Original Assignee
Dynabook Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dynabook Inc filed Critical Dynabook Inc
Priority to JP2014262321A priority Critical patent/JP6483433B2/ja
Priority to US14/858,870 priority patent/US20160188706A1/en
Publication of JP2016122344A publication Critical patent/JP2016122344A/ja
Publication of JP2016122344A5 publication Critical patent/JP2016122344A5/ja
Application granted granted Critical
Publication of JP6483433B2 publication Critical patent/JP6483433B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、システム及び電子機器に関する。
近年、ネットショッピングが普及してきている。これに伴い、コンピュータにあまり詳しくないユーザにネットショッピングを利用してもらうために、音声認識技術を用いて商品を検索することが提案されている。
特開平10−49187号公報
しかしながら、従来の音声認識技術では、音声認識の結果として、1つの語彙に関して、発音及び意味が同等で表記の異なる語彙(同音語)や、意味が同等で発音が類似した語彙(類語)など、必要性の低い語彙までが商品検索時に利用する検索ワードとして提示されてしまうという不都合がある。
本発明の一形態の目的は、商品検索時に利用する検索ワードとして、必要性の低い語彙が提示される可能性を低減し得るシステム、サーバ装置及び電子機器を提供することである。
実施形態に係るシステムは、表示装置と、マイクと、記憶デバイスと、音声認識部とを有する電子機器と、商品名および前記商品名の単価が関連付けられた商品情報を格納する商品データベースと、代表表記および前記代表表記の別名表記が関連付けられた別名リストとを有し、前記商品データベースおよび前記別名リストを前記電子機器に配信する第1のサーバ装置と、前記代表表記および前記代表表記の発音を関連付けて格納する認識語彙リストを有し、前記認識語彙リストを前記電子機器に配信する第2のサーバ装置と、を具備する。前記電子機器は、配信された前記商品データベース、前記別名リスト、および前記認識語彙リストを前記記憶デバイスに格納し、ユーザから前記マイクを用いて入力された音声データを受信すると、前記音声認識部を用いて前記音声データの音声認識を実行し、前記記憶デバイスに格納される前記認識語彙リストを参照して前記音声認識された発音に関連付けられた代表表記を検索し、その検索した1つ以上の代表表記を検索ワードとして前記表示装置に表示し、前記表示装置に表示された前記検索ワードと前記記憶デバイスに格納される前記別名リストとに基づいて前記商品データベースを検索して、該当する前記商品情報を取得して前記表示装置に表示する。
図1は、実施形態に係るネットショッピングシステムの構成を示す図である。 図2は、実施形態に係る商品データベースのデータ構造を示す図である。 図3は、実施形態に係る別名リストのデータ構造を示す図である。 図4は、実施形態に係る認識語彙リストのデータ構造を示す図である。 図5は、実施形態に係る電子機器の構成を示す図である。 図6は、実施形態に係るネットショッピングアプリケーションの機能構成を示す図である。 図7は、実施形態に係るネットショッピングアプリケーションによるネットショッピング時の処理手順を示すフローチャートである。 図8は、初期画面の一例を示す図である。 図9は、音声入力画面の一例を示す図である。 図10は、検索ワード表示画面の一例を示す図である。 図11は、検索結果画面の一例を示す図である。 図12は、実施形態に係る別の別名リストのデータ構造を示す図である。 図13は、実施形態に係る別の認識語彙リストのデータ構造を示す図である。 図14は、実施形態に係る別名リスト生成処理の手順を示すフローチャートである。
以下、実施の形態について図面を参照して説明する。
<第1の実施形態>
図1は、各実施形態に係るネットショッピングシステムの構成を示す図である。
ネットショッピングシステムは、図1に示すように、ネットショッピングサーバ10、認識語彙リスト配布サーバ20、電子機器30及び表示装置40などを備えている。
ネットショッピングサーバ10は、商品の一覧を示す商品データベースと、商品検索処理時に参照される別名リストを保持し、これらを電子機器30に配布する機能を有したサーバ装置である。
認識語彙リスト配布サーバ20は、音声認識処理時に参照される認識語彙リストを保持し、当該認識語彙リストを電子機器30に配布する機能を有したサーバ装置である。
電子機器30は、図1に示したように、箱形の筐体を有したネットショッピング専用の端末である。なお、電子機器30は、上記した専用の端末ではなく、当該専用の端末に搭載された機能をもつアプリケーションがインストールされたタブレットコンピュータ、ノートブック型パーソナルコンピュータ、スマートフォンなどによって実現されても良い。以下では、電子機器30を単にコンピュータ30と称して説明する。
表示装置40は、例えばテレビやディスプレイモニタであり、コンピュータ30から出力される各種情報を画面上に表示する装置である。
ここで、図2を参照して、商品データベースについて説明する。図2は、商品データベースのデータ構造の一例を示す図である。商品データベースは、図2に示すように、商品名、単価、通貨及び小売単位が関連付けられた商品情報を格納している。商品名は、商品検索処理の結果として得られる商品の名称を示す。単価は、関連付けられた商品名により示される商品1つの値段を示す。通貨は、関連付けられた商品名により示される商品を購入するにあたって使用する通貨の単位を示す。小売単位は、関連付けられた商品名により示される商品の小売単位を示す。例えば、図2に示す商品情報Aによれば、商品の名称が「お手軽ぎょうざ」であり、この「お手軽ぎょうざ」の「1袋」当たりの単価が「X円」であることが示されている。なお、ここでは、商品情報Aを例にとって説明したが、その他の商品情報A,Aにおいても同様であるため、ここではその詳しい説明は省略する。また、ここでは、商品データベースに格納される商品情報が図2に示すデータ構造である場合について説明したが、例えば、商品情報は、商品情報を識別するための商品識別番号などをさらに含んでいても良い。
次に、図3を参照して、別名リストについて説明する。図3は、別名リストのデータ構造の一例を示す図である。別名リストは、図3に示すように、代表表記と別名表記とを関連付けて格納している。代表表記とは、所定の語彙に関し、検索ワードとして表示装置40に表示される表記を示す。別名表記とは、関連付けられた代表表記とは表記は異なるが、当該代表表記により表記された語彙と発音及び意味が同等の語彙の表記または当該代表表記により表記された語彙と意味が同等で発音が類似した語彙の表記を示す。例えば、図3に示すB,Bによれば、代表表記が「餃子」の別名表記として「ぎょうざ」や「ギョーザ」があることが示されている。なお、「ぎょうざ」や「ギョーザ」は、関連付けられた代表表記「餃子」と発音及び意味が同等の語彙の表記に相当する。また、図3に示すB,Bによれば、代表表記が「スパゲッティ」の別名表記として「スパゲティ」や「スパゲティー」があることが示されている。なお、「スパゲティ」や「スパゲティー」は、関連付けられた代表表記「スパゲッティ」と意味が同等で発音が類似した語彙の表記に相当する。なお、図3に示すBについても同様であるため、ここではその詳しい説明は省略する。
上記した別名リストが商品検索処理時に参照されることで、表示装置40に検索ワードとして表示された代表表記の他に、当該代表表記に関連付けられた別名表記についても一度の商品検索処理で検索することができる。例えば、代表表記「餃子」によって「スープ餃子」が検索されるほかに、当該代表表記に関連づけられた別名表記「ぎょうざ」及び「ギョーザ」によって「お手軽ぎょうざ」及び「うまいギョーザ」が検索される。
続いて、図4を参照して、認識語彙リストについて説明する。図4は、認識語彙リストのデータ構造の一例を示す図である。認識語彙リストは、ネットショッピングサーバ10に保持される商品データベース及び別名リストを参照して生成されるリストであり、図4に示すように、代表表記と発音とを関連付けて格納している。なお、代表表記については、上述したため、ここではその詳しい説明は省略する。ここでの発音とは、音声認識処理において入力音声との照合対象として登録される発音であり、音声認識処理の結果として得られると推定される発音を示す。例えば、図4に示すCによれば、音声認識処理の結果として「ぎょうざ」という発音が得られた場合、検索ワード(代表表記)として「餃子」が表示装置40に表示されることが示されている。同様に、図4に示すCによれば、音声認識処理の結果として「みょうが」という発音が得られた場合、検索ワード(代表表記)として「みょうが」が表示装置40に表示されることが示されている。また、図4に示すC〜Cによれば、音声認識処理の結果として「すぱげってぃ」、「すぱげてぃー」、「すぱげてぃ」のいずれかの発音が得られた場合、検索ワード(代表表記)として「スパゲッティ」が表示装置40に表示されることが示されている。なお、ここでは、図4に示すC,C,C〜Cを例にとって説明したが、Cについても同様であるため、ここではその詳しい説明は省略する。
上記した認識語彙リストによれば、音声認識処理の結果として、ユーザに対する無駄な検索ワードの提示を減らすことができる。例えば、音声認識処理の結果として「ぎょうざ」という発音が得られた場合、検索ワードとして「ぎょうざ」や「ギョーザ」という無駄な語彙を提示せずに、「餃子」という語彙(代表表記)だけを提示することができる。
図5は、一実施形態におけるコンピュータ30のシステム構成を示す図である。
コンピュータ30は、図5に示すように、プロセッサ100、記録デバイス111、無線通信部112、電源管理IC113、HDMI(登録商標)インタフェース部114などを備えている。
記録デバイス111は、不揮発性メモリ、フラッシュメモリ、磁気抵抗メモリ、ハードディスクドライブ等を有する記録装置である。
無線通信部112は、ネットワークに接続されたネットショッピングサーバ10や認識語彙リスト配布サーバ20と通信を行う。
電源管理IC113は、電源管理のためのワンチップマイクロコンピュータである。また、電源管理IC113は、ACアダプタ120から供給される電力を用いて、各コンポーネントに供給すべき動作電力を生成する。
HDMIインタフェース部114は、後述するLVDSに対応する信号をHDMI(High-Definition Multimedia Interface)に対応する信号に変換する。
プロセッサ100は、メインプロセッサ101、メインメモリ102、グラフィックスプロセッサ103、LVDSインタフェース部及び受信部105などを備えている。
メインプロセッサ101は、コンピュータ30内の各種モジュールの動作を制御する。コンピュータ30は、記録デバイス111からメインメモリ102にロードされる各種プログラムを実行する。プロセッサにより実行されるプログラムには、オペレーティングシステム(OS)201や、ネットショッピングアプリケーション202等の各種アプリケーションプログラムが含まれている。ネットショッピングアプリケーション202は、ネットショッピングを行うためのプログラムである。
グラフィクスプロセッサ103は、ディスプレイモニタとして使用される表示装置40を制御する表示コントローラである。グラフィクスプロセッサ103は、表示装置40に映像を表示するための映像データを生成する。LVDSインタフェース部104は、映像データをLVDS(Low voltage differential signaling)に対応する信号に変換する。
受信部105は、コントローラ130に設けられたマイク131により入力された音声データを受信し、これをメインプロセッサ101に出力する機能を有している。また、受信部105は、コントローラ130に設けられた複数の入力キー132により入力された所定の入力キーに対応する入力信号を受信し、これをメインプロセッサ101に出力する機能を有している。
図6は、図5に示すネットショッピングアプリケーション202の機能構成を示すブロック図である。
ネットショッピングアプリケーション202は、図6に示すように、制御部301、商品データベース取得部302、別名リスト取得部303、認識語彙リスト取得更新部304、音声認識処理部305及び商品名検索処理部306などを備えている。
制御部301は、ネットショッピングアプリケーション202の動作を制御する。
商品データベース取得部302は、無線通信部112を用いて、ネットショッピングサーバ10から、図2に示したように、ネットショッピングサーバ10において取り扱っている商品の一覧を示す商品データベースを取得する処理を実行する。なお、商品データベース取得部302によって取得された商品データベースは、制御部301により記録デバイス111に適宜格納される。
別名リスト取得部303は、無線通信部112を用いて、ネットショッピングサーバ10から、図3に示したような別名リストを取得する処理を実行する。なお、別名リスト取得部303によって取得された別名リストは、制御部301により記録デバイス111に適宜格納される。
認識語彙リスト取得更新部304は、無線通信部112を用いて、認識語彙リスト配布サーバ20から、図4に示したような認識語彙リストを取得し、記録デバイス111に既に認識語彙リストが格納されている場合、取得された認識語彙リストを用いて、この格納された認識語彙リストを更新する処理を実行する。なお、認識語彙リスト配布サーバ20から認識語彙リストが取得されたときに、記録デバイス111に認識語彙リストが格納されていない場合、この取得された認識語彙リストは、制御部301により記録デバイス111に適宜格納される。
音声認識処理部305は、コントローラ130に設けられたマイク131を用いて入力され、受信部105によって受信された音声データに対して音声認識処理を実行する。具体的には、音声認識処理部305は音声データを解析して、音声データのテキスト化を行う。また、音声認識処理部305は、記録デバイス111に格納された認識語彙リストを参照して、音声データをテキスト化することにより得られた語彙(発音)の代表表記を検索ワードとして表示装置40に表示させる処理を実行する。
商品名検索処理部306は、表示装置40に表示された1以上の検索ワードから、1つの検索ワードがユーザによって選択されると、この選択された検索ワードと、記録デバイス111に格納された別名リストとに基づいて、記録デバイス111に格納された商品データベースから商品情報を検索する商品検索処理を実行する。この検索の結果として得られた商品情報は表示装置40に表示される。
次に、以上のように構成されたネットショッピングアプリケーション202のネットショッピング時の処理手順について、図7のフローチャートと、図8〜図11の画面例とを参照して説明する。但し、ここでは、記録デバイス111には、図2〜図4に示した各種情報が既に格納されている場合を想定する。
始めに、ネットショッピングアプリケーション202は、ユーザの操作に応じて起動すると、図8に示す初期画面G1を表示装置40に表示させる(ブロック1001)。
続いて、ネットショッピングアプリケーション202は、コントローラ130に設けられた複数の入力キー132のうち、「1」の入力キーに対応した入力信号の入力を受け付けると、図9に示す音声入力画面G2を表示装置40に表示させる(ブロック1002)。なお、図示はしないが、「2」の入力キーに対応した入力信号の入力を受け付けた場合、ネットショッピングアプリケーション202は、「写真を楽しむ」に対応した画面を表示装置40に表示させるし、「3」の入力キーに対応した入力信号の入力を受け付けた場合、ネットショッピングアプリケーション202は、「お知らせを見る」に対応した画面を表示装置40に表示させる。
次に、ネットショッピングアプリケーション202は、コントローラ130に設けられたマイク131を用いて入力された音声データの入力を受け付けると、当該音声データに対して音声認識処理を実行する(ブロック1003)。ここでは、ユーザが「ぎょうざ」と喋った場合を想定する。すなわち、ネットショッピングアプリケーション202は、上記した音声認識処理のテキスト化の結果として、「ぎょうざ」という語彙(発音)を得たものとする。
続いて、ネットショッピングアプリケーション202は、記録デバイス111に格納された図4の認識語彙リストから、ブロック1003の処理により得られた「ぎょうざ」という語彙(発音)に関連付けられた代表表記として「餃子」という語彙を少なくとも読み出し、これを検索ワードとして表示装置40に表示させる。なお、ここでは、「ぎょうざ」という語彙(発音)に類似した発音の代表表記として「みょうが」や「ようかん」もあわせて認識語彙リストから読み出され、これらが検索ワードとして表示装置40に表示された場合を想定する。すなわち、ネットショッピングアプリケーション202は、図10に示す検索ワード表示画面G3を表示装置40に表示させる(ブロック1004)。
次に、ネットショッピングアプリケーション202は、コントローラ130に設けられた複数の入力キー132のうち、「2」の入力キーに対応した入力信号の入力を受け付けると、「餃子」という語彙を検索ワードとした商品検索処理を実行する(ブロック1005)。具体的には、まず、ネットショッピングアプリケーション202は、記録デバイス111に格納された図3の別名リストから、「餃子」という語彙(代表表記)に関連付けられた別名表記として「ぎょうざ」及び「ギョーザ」という語彙を読み出す。そして、ネットショッピングアプリケーション202は、記録デバイス111に格納された図2の商品データベースから、「餃子」、「ぎょうざ」、「ギョーザ」という語彙のうちの少なくとも1つの語彙を商品名に含む商品情報を読み出す。この場合、ネットショッピングアプリケーション202は、商品検索処理の結果として、商品情報A〜Aを得る。
なお、検索ワード表示画面G3において、ユーザによって「1」の入力キーに対応した入力信号が入力された場合(換言すると、ユーザにとって望ましい検索ワードが検索ワード表示画面G3に表示されていなかった場合)、ブロック1002の処理に戻り、音声入力画面G2が表示装置40に再度表示される。
しかる後、ネットショッピングアプリケーション202は、ブロック1005の処理により得られた商品情報A〜Aを商品検索処理の結果として、表示装置40に表示させる。すなわち、ネットショッピングアプリケーション202は、図11に示す検索結果画面G4を表示装置40に表示させる(ブロック1006)。
以降の処理としては、ユーザによって所望の商品情報が選択されると、当該商品情報を購入するための決済画面を表示装置40に表示させ、この決済画面での決済が完了することにより、ネットショッピングアプリケーション202によるネットショッピング時の一連の処理は終了となる。
以上説明した第1の実施形態によれば、認識語彙リストを用いた音声認識処理を実行する構成を備えているので、音声データをテキスト化することにより得られた語彙(発音)の代表表記だけをユーザに対して提示することができる。また、認識語彙リストと別名リストとに関連性をもたせることにより、検索ワードとして所定の語彙(発音)の代表表記だけがユーザに対して提示されたとしても、商品検索処理時には、代表表記だけでなく、代表表記に関連付けられた別名表記についても包括的に検索を行うことができる。
なお、本実施形態では、コンピュータ30において商品検索処理が実行されるとしたが、商品検索処理はネットショッピングサーバ10で実行されても良い。この場合、コンピュータ30は、音声認識処理の結果として得られた語彙(発音)に関連付けられた代表表記を示す情報をネットショッピングサーバ10に出力する必要はあるが、商品検索処理を実行する必要がないため、コンピュータ30にかかる処理負荷を減らすことができる。また、商品検索処理をネットショッピングサーバ10で実行する場合、コンピュータ30の記録デバイス111には認識語彙リストが少なくとも格納されていれば良く、商品データベースや別名リストは記録デバイス111に格納されていなくても構わない。
また、本実施形態では、音声認識処理部305は認識語彙リストを参照して音声データのテキスト化を行い、テキスト化することにより得られた語彙(発音)の代表表記を出力するとしたが、音声認識処理部305は認識語彙リストに発音を登録することにより、音声データとの照合を行って、登録された語彙の発音及び代表表記を出力するものであっても良い。
また、本実施形態では、コンピュータ30において音声認識処理が実行されるとしたが、音声認識処理はネットショッピングサーバ10又は図示しないサーバで実行されても良い。この場合、コンピュータ30は、音声データをサーバに送り、音声認識結果をサーバから取得する必要はあるが、音声認識処理を実行する必要がないため、コンピュータ30にかかる処理負荷を減らすことができる。また、音声認識処理をサーバで実行する場合、認識語彙リストはサーバにあれば良く、認識語彙リスト配布サーバ20からコンピュータ30に配布されなくても構わない。すなわち、コンピュータ30の記録デバイス111に格納されていなくても構わない。
また、本実施形態では、商品名検索処理部306は、表示装置40に表示された中から1つの検索ワードがユーザによって選択されると、商品検索処理を実行することになっているが、表示装置40に検索ワードを1つのみ表示し、ユーザによる選択なしに、商品検索処理を実行するようにしても構わない。
また、本実施形態では、商品データベース、別名リスト及び認識語彙リストが日本語により構成されている場合について説明したが、例えば英語により構成されていても良い。以下に、英語で構成されている場合の別名リストと認識語彙リストのデータ構造の一例について説明する。
図12は、図3とは異なる別名リストのデータ構造の一例を示す図である。図12に示すB’,B’によれば、代表表記が「watermelon」の別名表記として「watermelons」(複数形)や「water melon」(スペースを含む表記)があることが示されている。また、B’によれば、代表表記が「flavor」の別名表記として、発音及び意味が同等で綴りの異なる「flavour」があり、B’によれば、代表表記「airplane」の別名表記として、意味が同等で発音が類似の「aeroplane」があることが示されている。なお、ここでは、B’,B’,B’,B’を例にとって説明したが、B’,B’についても同様であるため、ここではその詳しい説明は省略する。
Figure 0006483433
以上説明したように、別名リストや認識語彙リストが英語で構成されていたとしても、上記した効果と同様な効果を得ることができる。
<第2の実施形態>
以下、第2の実施形態について説明する。本実施形態では、ネットショッピングサーバ10において別名リストが保持されていない場合、或いは、ネットショッピングサーバ10から別名リストを取得できない場合の処理について説明する。この場合、認識語彙リスト配布サーバ20において、認識語彙リストを生成することができず、ひいては、上記した第1の実施形態に示したネットショッピング時の処理が実行できないという不都合が生じる。このため、認識語彙リスト配布サーバ20において、別名リストを生成する別名リスト生成処理が実行される。以下では、図14のフローチャートを参照して、上記した別名リスト生成処理の手順について、具体的に説明する。
始めに、認識語彙リスト配布サーバ20は、ネットショッピングサーバ10から商品データベースを取得する(ブロック2001)。続いて。認識語彙リスト配布サーバ20は、予め用意された検索ワードリストを参照して、上記した商品検索処理を実行する(ブロック2002)。検索ワードリストとは、検索ワードになり得る多数の語彙を集めたリストである。また、以下では一例として、「餃子」という語彙を検索ワードとして、上記したブロック2002の処理が実行された場合を想定する。
次に、認識語彙リスト配布サーバ20は、商品検索処理の結果として得られた1以上の商品情報に「餃子」という語彙が商品名に含まれていない商品情報が有るかどうかを判定する(ブロック2003)。なお、ブロック2003の判定の結果、「餃子」という語彙が商品名に含まれていない商品情報が無い場合(ブロック2003のNO)、認識語彙リスト配布サーバ20は、「餃子」という語彙が代表表記である可能性は低いと判断して、ブロック2002の処理に戻り、「餃子」という語彙と同音の語彙又は発音が類似した語彙を検索ワードリストから抽出して、これを検索ワードとして再度商品検索処理を実行する。いずれの検索ワードにおいても、商品検索処理の結果として得られた1以上の商品情報に検索ワードが商品名に含まれていない商品情報がない場合には、検索ワードそれぞれを代表表記として認識語彙リストに登録する。
一方で、ブロック2003の判定の結果、「餃子」という語彙が商品名に含まれていない商品情報が有る場合(ブロック2003のYES)、認識語彙リスト配布サーバ20は、当該商品情報の商品名から、「餃子」と同音の語彙又は発音が類似した語彙を抽出する(ブロック2004)。例えば、ブロック2002の商品検索処理の結果として、図2に示した商品情報A〜Aが得られている場合、認識語彙リスト配布サーバ20は、商品情報A,Aの商品名から、「餃子」と同音の語彙として「ぎょうざ」及び「ギョーザ」という語彙を抽出する。
続いて、認識語彙リスト配布サーバ20は、ブロック2004の処理により抽出された「ぎょうざ」及び「ギョーザ」という語彙をそれぞれ検索ワードとして商品検索処理を実行し、当該商品検索処理の結果として得られた商品情報の商品名に検索ワードが含まれていない商品情報が有るかどうかを判定する。すなわち、「ぎょうざ」を検索ワードとして商品検索処理が実行された場合、「ぎょうざ」という語彙が商品名に含まれていない商品情報が有るかどうか、また、「ギョーザ」を検索ワードとして商品検索処理が実行された場合、「ギョーザ」という語彙が商品名に含まれていない商品情報が有るかどうかを判定する(ブロック2005)。
ブロック2005の判定の結果、商品名に検索ワードが含まれていない商品情報が無いと判定された場合(ブロック2005のNO)、認識語彙リスト配布サーバ20は、ブロック2002の処理時に検索ワードとして設定された語彙を代表表記として、また、ブロック2004の処理時に抽出された語彙を当該代表表記に関連付けられる別名表記として登録することにより別名リストを生成する(ブロック2006)。具体的には、認識語彙リスト配布サーバ20は、「餃子」という語彙を検索ワードとして商品検索処理を実行した場合には「ぎょうざ」や「ギョーザ」という語彙を商品名に含む商品情報が商品検索処理の結果として得られているにも関わらず、「ぎょうざ」や「ギョーザ」という語彙を検索ワードとして商品検索処理を実行した場合には当該検索ワードを商品名に含まない商品情報(例えば、「餃子」という語彙を商品名に含む商品情報)が商品検索処理の結果として得られていないので、「餃子」という語彙を代表表記として、その他の「ぎょうざ」や「ギョーザ」という語彙を別名表記として登録することにより別名リストを生成する。
一方で、ブロック2005の判定の結果、商品名に検索ワードが含まれていない商品情報が有ると判定された場合(ブロック2005のYES)、認識語彙リスト配布サーバ20は、ブロック2002で実行された商品検索処理と、ブロック2004で実行された商品検索処理との結果として得られた商品情報の数を比較し、最も多くの商品情報を商品検索処理の結果として得た検索ワードを代表表記として、その他の検索ワードを別名表記として登録することにより別名リストを生成する(ブロック2007)。具体的には、認識語彙リスト配布サーバ20は、「餃子」、「ぎょうざ」、「ギョーザ」という語彙をそれぞれ検索ワードとして実行した商品検索処理の結果として得られた商品情報の数を比較し、最も多くの商品情報を得られた検索ワードを代表表記として、その他の検索ワードを別名表記として登録することにより別名リストを生成する。
以上説明した第2の実施形態によれば、ネットショッピングサーバ10において別名リストが保持されていない場合、或いは、ネットショッピングサーバ10から別名リストを取得できない場合であっても、別名リストを生成する構成を備えているので、認識語彙リストを生成することができ、ひいては、上記した第1の実施形態と同様な効果を得ることができる。
なお、本実施形態の処理は、コンピュータプログラムによって実現することができるので、このコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体を通じてこのコンピュータプログラムをコンピュータにインストールして実行するだけで、本実施形態と同様の効果を容易に実現することができる。
なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10…ネットショッピングサーバ、20…認識語彙リスト配布サーバ、30…コンピュータ、40…表示装置、202…ネットショッピングアプリケーション、301…制御部、302…商品データベース取得部、303…別名リスト取得部、304…認識語彙リスト取得更新部、305…音声認識処理部、306…商品名検索処理部

Claims (6)

  1. 表示装置と、マイクと、記憶デバイスと、音声認識部とを有する電子機器と、
    商品名および前記商品名の単価が関連付けられた商品情報を格納する商品データベースと、代表表記および前記代表表記の別名表記が関連付けられた別名リストとを有し、前記商品データベースおよび前記別名リストを前記電子機器に配信する第1のサーバ装置と、
    前記代表表記および前記代表表記の発音を関連付けて格納する認識語彙リストを有し、前記認識語彙リストを前記電子機器に配信する第2のサーバ装置と、
    を具備し
    前記電子機器は、
    配信された前記商品データベース、前記別名リスト、および前記認識語彙リストを前記記憶デバイスに格納し、
    ユーザから前記マイクを用いて入力された音声データを受信すると、前記音声認識部を用いて前記音声データの音声認識を実行し、前記記憶デバイスに格納される前記認識語彙リストを参照して前記音声認識された発音に関連付けられた代表表記を検索し、その検索した1つ以上の代表表記を検索ワードとして前記表示装置に表示し、
    前記表示装置に表示された前記検索ワードと前記記憶デバイスに格納される前記別名リストとに基づいて前記商品データベースを検索して、該当する商品情報を取得して前記表示装置に表示するシステム。
  2. 前記商品データベースの検索は、
    前記別名リストから前記検索ワードの前記代表表記に関連付けられた前記別名表記を読み出し、前記検索ワードと前記別名表記とを用いて検索する請求項1に記載のシステム。
  3. 前記別名リストは、
    前記代表表記と、前記代表表記とは表記は異なるが、前記代表表記により示される語彙と発音及び意味が同等の語彙の前記別名表記、又は前記代表表記により示される語彙と意味が同等で発音が類似した語彙の表記である前記別名表記とが関連付けられている請求項1に記載のシステム。
  4. 表示装置と、マイクと、記憶デバイスと、音声認識部とを有し、
    前記記憶デバイスには、商品名および前記商品名の単価が関連付けられた商品情報を格納する商品データベースと、代表表記および前記代表表記の別名表記が関連付けられた別名リストと、前記代表表記および前記代表表記の発音を関連づけて格納する認識語彙リストとが格納され、
    ユーザから前記マイクを用いて入力された音声データを受信すると、前記音声認識部を用いて前記音声データの音声認識を実行し、前記記憶デバイスに格納される前記認識語彙リストを参照して前記音声認識された発音に関連付けられた代表表記を検索し、その検索した1つ以上の代表表記を検索ワードとして前記表示装置に表示し、
    前記表示装置に表示された前記検索ワードと前記記憶デバイスに格納される前記別名リストとに基づいて前記商品データベースを検索して、該当する前記商品情報を取得して前記表示装置に表示する電子機器。
  5. 前記商品データベースの検索は、
    前記別名リストから前記検索ワードの前記代表表記に関連付けられた前記別名表記を読み出し、前記検索ワードと前記別名表記とを用いて検索する請求項に記載の電子機器。
  6. 前記別名リストは、
    前記代表表記と、前記代表表記とは表記は異なるが、前記代表表記により示される語彙と発音及び意味が同等の語彙の前記別名表記、又は前記代表表記により示される語彙と意味が同等で発音が類似した語彙の表記である前記別名表記とが関連付けられている請求項に記載の電子機器。
JP2014262321A 2014-12-25 2014-12-25 システム及び電子機器 Active JP6483433B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014262321A JP6483433B2 (ja) 2014-12-25 2014-12-25 システム及び電子機器
US14/858,870 US20160188706A1 (en) 2014-12-25 2015-09-18 System, server, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014262321A JP6483433B2 (ja) 2014-12-25 2014-12-25 システム及び電子機器

Publications (3)

Publication Number Publication Date
JP2016122344A JP2016122344A (ja) 2016-07-07
JP2016122344A5 JP2016122344A5 (ja) 2017-08-24
JP6483433B2 true JP6483433B2 (ja) 2019-03-13

Family

ID=56164431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014262321A Active JP6483433B2 (ja) 2014-12-25 2014-12-25 システム及び電子機器

Country Status (2)

Country Link
US (1) US20160188706A1 (ja)
JP (1) JP6483433B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767501B1 (en) * 2013-11-07 2017-09-19 Amazon Technologies, Inc. Voice-assisted scanning
US10296608B2 (en) 2015-10-02 2019-05-21 Google Llc Single table multi-schema data store in a key value store
CN108140099B (zh) 2015-10-02 2019-11-19 谷歌有限责任公司 在二进制数据同步协议中交换的更新的签名
WO2017059290A1 (en) 2015-10-02 2017-04-06 Google Inc. Peer-to-peer syncable storage system
US10304454B2 (en) * 2017-09-18 2019-05-28 GM Global Technology Operations LLC Persistent training and pronunciation improvements through radio broadcast
JP2019135609A (ja) * 2018-02-05 2019-08-15 東京瓦斯株式会社 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
JP2019159333A (ja) * 2019-05-14 2019-09-19 東京瓦斯株式会社 文字入力支援システム、文字入力支援プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11154160A (ja) * 1997-11-21 1999-06-08 Hitachi Ltd データ検索システム
US7974875B1 (en) * 2000-03-21 2011-07-05 Aol Inc. System and method for using voice over a telephone to access, process, and carry out transactions over the internet
US6922670B2 (en) * 2000-10-24 2005-07-26 Sanyo Electric Co., Ltd. User support apparatus and system using agents
US7062482B1 (en) * 2001-02-22 2006-06-13 Drugstore. Com Techniques for phonetic searching
US7716112B1 (en) * 2002-09-30 2010-05-11 Trading Technologies International, Inc. System and method for price-based annotations in an electronic trading environment
JP2005267574A (ja) * 2004-03-22 2005-09-29 Fujitsu Ltd 音声検索システム
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
JP5207642B2 (ja) * 2007-03-06 2013-06-12 ニュアンス コミュニケーションズ,インコーポレイテッド 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム
JP2009080576A (ja) * 2007-09-25 2009-04-16 Toshiba Corp 検索装置、方法及びプログラム
JP5015806B2 (ja) * 2008-01-08 2012-08-29 東芝テック株式会社 商品販売データ処理装置及びそのプログラム並びに商品データ入力装置及びそのプログラム
US20150262120A1 (en) * 2008-06-05 2015-09-17 Aisle411, Inc. Systems and Methods for Displaying the Location of a Product in a Retail Location
US9147212B2 (en) * 2008-06-05 2015-09-29 Aisle411, Inc. Locating products in stores using voice search from a communication device
US8364487B2 (en) * 2008-10-21 2013-01-29 Microsoft Corporation Speech recognition system with display information
WO2010067118A1 (en) * 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
JP2012043000A (ja) * 2010-08-12 2012-03-01 Sony Corp 検索装置、検索方法、及び、プログラム
US8849791B1 (en) * 2011-06-29 2014-09-30 Amazon Technologies, Inc. Assisted shopping
JP2013196019A (ja) * 2012-03-15 2013-09-30 Nikon Corp 検索制御装置、出力装置、及びプログラム

Also Published As

Publication number Publication date
JP2016122344A (ja) 2016-07-07
US20160188706A1 (en) 2016-06-30

Similar Documents

Publication Publication Date Title
JP6483433B2 (ja) システム及び電子機器
US9984215B2 (en) Obtaining password data
US10747798B2 (en) Control method, processing apparatus, and recording medium
US10564795B2 (en) Control method, processing apparatus, and non-transitory computer-readable recording medium
JP6570226B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US20180247647A1 (en) Voice control
US9196253B2 (en) Information processing apparatus for associating speaker identification information to speech data
US20140350936A1 (en) Electronic device
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US20160371340A1 (en) Modifying search results based on context characteristics
JP2016122344A5 (ja)
WO2016078408A1 (zh) 候选字排序方法、装置和文字输入方法、设备
JP6373243B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
US11170039B2 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium
JP5707346B2 (ja) 情報提供装置とそのプログラムおよび情報提供システム
US20210165540A1 (en) Information processing device, information processing method, and program
WO2020143411A1 (zh) 一种针对视障群体的保险推荐方法和装置
JP2016528594A (ja) 電子文書の作成および検索方法と非一時的コンピュータ可読記録媒体
US9632747B2 (en) Tracking recitation of text
JP2015018301A (ja) 販売支援端末、プログラム、及び情報処理方法
US10123060B2 (en) Method and apparatus for providing contents
JP2018055270A (ja) プレゼンテーション資料生成装置、プレゼンテーション資料生成システム、コンピュータプログラム及びプレゼンテーション資料生成方法
CN111753107A (zh) 资源展示方法、装置、设备及存储介质
JPWO2019098036A1 (ja) 情報処理装置、情報処理端末、および情報処理方法
JP6246271B1 (ja) 属性評価装置、販売システム、属性評価方法、および属性評価プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170713

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181105

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20181206

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20181207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190214

R150 Certificate of patent or registration of utility model

Ref document number: 6483433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150