JP2016095727A

JP2016095727A - 表示装置、サーバ、コミュニケーション支援システム、コミュニケーション支援方法、及び制御プログラム

Info

Publication number: JP2016095727A
Application number: JP2014232154A
Authority: JP
Inventors: 浩章奥本; Hiroaki Okumoto; 慶子蛭川; Keiko Hirukawa; 門脇　幹宏; Mikihiro Kadowaki; 幹宏門脇; 佳成澤田; Yoshinari Sawada; 紋中川; Aya Nakagawa; 直山口; Sunao Yamaguchi
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2014-11-14
Filing date: 2014-11-14
Publication date: 2016-05-26

Abstract

【課題】表示装置の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる技術を提供する。【解決手段】店員向け画像及び客向け画像を表示する表示装置（２００）であって、表示情報を取得する表示情報取得部（２３１）と、表示装置が店員向けであるか客向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部（２３２）と、表示画像を表示する表示部（２５０）とを備える表示装置。【選択図】図１

Description

本発明はサービス提供者及びサービス利用者のコミュニケーションを支援するために用いられる表示装置、サーバ、コミュニケーション支援システム、コミュニケーション支援方法、当該表示装置の制御プログラム、及び当該サーバの制御プログラムに関する。

経済や文化のグローバル化が進む現在、異なる言語を母語とする人同士がコミュニケーションを図る機会が増えている。そのため、このようなコミュニケーションを支援することを目的とする翻訳装置が開発されている。例えば特許文献１には、日本語を母語とするユーザ（ユーザＪ）向けに日本語を表示するディスプレイと、英語を母語とするユーザ（ユーザＥ）向けに英語を表示するディスプレイとを備えた翻訳装置が記載されている。

特許文献２には、異なる母語の利用者同士の音声によるコミュニケーションを支援する音声翻訳装置が記載されている。この音声翻訳装置は、入力された音声信号の認識結果及び当該認識結果に対応する翻訳結果を表示することに加えて、上記認識結果に関連するキーワードを検索するとともに当該キーワードの翻訳結果を表示することによってコミュニケーションを支援する。

また、特許文献３には、（１）入力された音声の認識結果である文字列と、ｗｅｂページに含まれている画像情報を解析することによって得られたキーワードとを比較し、（２）上記文字列と上記キーワードとが一致する場合には、上記文字列を文字画像に変換し、認識された音声に対応する映像と上記文字画像とを合成することによって新たな画像情報を生成する画像処理装置が記載されている。このようにして生成された上記新たな画像情報は、商品を販売するためのホームページやチラシとして利用することができる。

国際公開第２０１１／０３６７６９号公報（２０１１年３月３１日公開）特開２００９−２０５５７９号公報（２００９年９月１０日公開）特開２００７−２２５９５２号公報（２００７年９月６日公開）

特許文献２に記載の音声翻訳装置を利用する場合、異なる母語の利用者同士は、入力された音声信号の認識結果（特許文献２の図５に示された表示エリアＡ）と、当該認識結果に対応する翻訳結果（同図に示された表示エリアＢ）と、キーワード（同図に示された表示エリアＣ）と、翻訳されたキーワード（同図に示された表示エリアＤ）とが表示された表示部を参照しながらコミュニケーションを図る。換言すれば、異なる言語を用いる各利用者は、表示部にそれぞれの母語で表示された情報であって、同一の内容からなる情報を参照しながらコミュニケーションを図る。

上記音声翻訳装置においては、各表示エリアに表示される上記認識結果、上記翻訳結果、上記キーワード、及び上記翻訳されたキーワードは、軽重のない一様なテキストとして表示される。また、上記音声翻訳装置においては、入力された発話の認識結果が表示エリアＡに表示されるため、（１）利用者が発話する言語が日本語である場合には表示エリアＡに日本語の認識結果が表示され、表示エリアＢに英語の翻訳結果が表示され、（２）利用者が発話する言語が英語である場合には表示エリアＡに英語の認識結果が表示され、表示エリアＢに日本語の翻訳結果が表示される。換言すれば、上記音声翻訳装置において、利用者の母語を用いて認識結果または翻訳結果を表示する表示エリアは、発話する利用者が代わるたびに表示エリアＡから表示エリアＢへ、また、表示エリアＢから表示エリアＡへと変更される。

このような上記音声翻訳装置を利用する利用者同士は、軽重のない一様なテキストであって、発話する利用者が代わるたびに異なる表示エリアに表示される上記認識結果及び上記翻訳結果を絶えず注視しながらコミュニケーションを図られることを強いられる。換言すれば、上記音声翻訳装置は、上記表示部に表示された情報のうち注目すべき情報がどれであるのかが利用者にとって分かりにくく、利用者の使い勝手において改善の余地を残している。

また、複数の利用者同士が共通する情報を参照しながらコミュニケーションを図るという状況は、異なる言語を母語とする人同士がコミュニケーションを図る場合に限定されるものではない。例えば、家電製品を販売する量販店において、ユーザ及び店員（利用者）が、量販店が用意している表示装置を参照しながら商談を進める場合においても同様の状況が生じ得る。表示装置の表示部に多くの情報が表示されることは、多くの情報をユーザと店員との間で共有できるというメリットを有する。その反面、それら多くの情報に軽重が付けられていないために、それら多くの情報のうち注目すべき情報がどれであるのかがユーザ及び店員にとって分かりにくいというデメリットを有する。すなわち、このような表示装置は、利用者の使い勝手において改善の余地を残している。

本発明は、上記の課題を鑑みてなされたものであり、その目的は、表示装置の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる技術を提供することである。

上記の課題を解決するために、本発明の一態様に係る表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、表示すべき情報を含む表示情報を取得する取得部と、上記取得部が取得した表示情報の示す表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、上記表示画像生成部が生成した表示画像を表示する表示部と、を備えている。

上記の課題を解決するために、本発明の一態様に係る表示装置は、サービス提供者向け画像を表示する第１の表示領域と、サービス利用者向け画像を表示する第２の表示領域とを有する表示装置であって、表示すべき情報を含む表示情報を取得する取得部と、上記取得部が取得した表示情報の示す表示画像であって、上記第１の表示領域に表示する表示画像であって、サービス提供者向けの表示態様である第１の表示態様を有する表示画像である第１の表示画像と、上記第２の表示領域に表示する表示画像であって、上記第１の表示態様とは異なる第２の表示態様を有する表示画像である第２の表示画像とを生成する表示画像生成部と、上記表示画像生成部が生成した第１の表示画像を上記第１の表示領域に表示し、上記表示画像生成部が生成した第２の表示画像を上記第２の表示領域に表示する表示部と、を備えている。

上記の課題を解決するために、本発明の一態様に係るサーバは、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、上記発話内容情報取得部が取得した発話内容情報を表示装置に出力する発話内容情報出力部と、上記発話内容情報が示す発話内容を出力する発話内容出力部と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、を備えている。

上記の課題を解決するために、本発明の一態様に係るコミュニケーション支援システムは、サーバと表示装置とを備えるコミュニケーション支援システムであって、上記サーバは、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、上記発話内容情報取得部が取得した発話内容情報を上記表示装置に出力する発話内容情報出力部と、上記発話内容情報が示す発話内容を出力する発話内容出力部と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、を備え、上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部と、上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、上記表示画像生成部が生成した表示画像を表示する表示部と、を備えている。

上記の課題を解決するために、本発明の一態様に係るコミュニケーション支援システムは、サーバと表示装置とを備えるコミュニケーション支援システムであって、上記サーバは、発話した音声を示す音声情報を取得する音声情報取得部と、上記音声情報取得部が取得した音声情報を参照し、当該音声情報が示す内容を発話内容として認識し、発話内容情報を生成する発話内容情報生成部と、上記発話内容情報生成部が生成した発話内容情報を上記表示装置に出力する発話内容情報出力部と、上記発話内容を翻訳した翻訳内容を示す翻訳内容情報を生成する翻訳内容情報生成部と、上記翻訳内容情報生成部が生成した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、を備え、上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部と、上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、上記表示画像生成部が生成した表示画像を表示する表示部と、を備えている。

上記の課題を解決するために、本発明の一態様に係るコミュニケーション支援方法は、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得工程と、上記発話内容情報取得工程において取得された発話内容情報を表示装置に出力する発話内容情報出力工程と、上記発話内容情報が示す発話内容を出力する発話内容出力工程と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得工程と、上記翻訳内容情報取得工程において取得された翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力工程と、を含む。

上記の課題を解決するために、本発明の一態様に係る制御プログラムは、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置としてコンピュータを機能させるための制御プログラムであって、表示すべき情報を含む表示情報を取得する取得部と、上記取得部が取得した表示情報の示す表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、としてコンピュータを機能させる。

上記の課題を解決するために、本発明の一態様に係る制御プログラムは、サーバとしてコンピュータを機能させるための制御プログラムであって、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、上記発話内容情報取得部が取得した発話内容情報を表示装置に出力する発話内容情報出力部と、上記発話内容情報が示す発話内容を出力する発話内容出力部と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、としてコンピュータを機能させる。

本発明の一態様によれば、表示装置の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる。

本発明の実施形態１に係るコミュニケーション支援システムを模式的に示す図である。本発明の実施形態１におけるサーバの要部構成を示すブロック図である。本発明の実施形態１における表示装置の要部構成を示すブロック図である。本発明の実施形態１に係るコミュニケーション支援システムにおいて、客の発話内容の翻訳が表示されるまでの処理の流れを示すシークエンス図である。本発明の実施形態１における表示情報の構造を示す図である。本発明の実施形態１における表示装置が表示する画像を示す図である。本発明の実施形態１に係るコミュニケーション支援システムにおいて、店員の発話内容の翻訳が表示されるまでの処理の流れを示すシークエンス図である。本発明の実施形態１における表示装置が表示する画像を示す図である。本発明の実施形態２におけるサーバの要部構成を示すブロック図である。本発明の実施形態２におけるキーフレーズ情報が格納されたキーフレーズテーブルである。本発明の実施形態２に係るコミュニケーション支援システムにおける処理の流れを示すシークエンス図である。本発明の実施形態２における表示装置が表示する表示画像を示す図である。本発明の実施形態２における表示装置が表示する他の表示画像を示す図である。本発明の実施形態３におけるサーバの要部構成を示すブロック図である。本発明の実施形態３における表示装置の要部構成を示すブロック図である。本発明の実施形態３におけるキーフレーズ情報が格納されたキーフレーズテーブルである。本発明の実施形態３における表示装置が表示する表示画像を示す図である。本発明の実施形態３に係るコミュニケーション支援システムにおける処理の流れを示すシークエンス図である。本発明の実施形態３における表示装置が表示する他の表示画像を示す図である。本発明の実施形態３における表示装置が表示する更に他の表示画像を示す図である。本発明の実施形態４における表示装置の要部構成を示すブロック図である。本発明の実施形態５におけるサーバの要部構成を示すブロック図である。サーバ及び表示装置として利用可能なコンピュータの構成を例示したブロック図である。

〔実施形態１〕
以下、本発明の一実施形態について、図１〜図８を用いて詳細に説明する。以下の特定の実施形態で説明する構成以外の構成については、必要に応じて説明を省略する場合があるが、他の実施形態で説明されている場合は、その構成と同じである。また、説明の便宜上、各実施形態に示した部材と同一の機能を有する部材については、同一の符号を付し、適宜その説明を省略する。

（コミュニケーション支援システム１）
図１は、本発明の実施形態１に係るコミュニケーション支援システム１を模式的に示す図である。コミュニケーション支援システム１は、図１に示すように、サーバ１００、表示装置２００ａ、及び表示装置２００ｂによって構成されている。

コミュニケーション支援システム１は、サービス提供者及びサービス利用者がコミュニケーションを円滑にすることができるシステムである。本明細書では、サービス提供者が店員、サービス利用者が客である場合について説明するが、コミュニケーション支援システム１は、タクシー運転手と客、受付と来訪者等にも利用可能である。

コミュニケーション支援システム１では、クラウド上に設置されたサーバ１００と、店舗に設置された表示装置２００ａ及び表示装置２００ｂとがそれぞれ通信可能に接続されている。本実施形態では、店員が日本語を話し、客が英語を話し、客が店頭のおでんを購入する場合を例に挙げて説明する。なお、コミュニケーション支援システム１は、店のキャッシュレジスターと連携する構成であってもよい。

また、コミュニケーション支援システム１では、表示装置２００ａ及び表示装置２００ｂにはそれぞれ店員向けまたは客向けの設定がされている。本明細書では、表示装置２００ａには店員向けの設定がされており、表示装置２００ｂには客向けの設定がされているとして説明する。なお、表示装置２００ａ及び表示装置２００ｂは、店員向けまたは客向けの設定がされているという点において区別される。そのため、表示装置２００ａ及び表示装置２００ｂは同じ機能を有し、以下において、表示装置２００ａ及び表示装置２００ｂを表示装置２００と総称する。

（サーバ１００）
図２は、本発明の実施形態１におけるサーバ１００の要部構成を示すブロック図である。サーバ１００について、図２を用いて説明する。

サーバ１００は、図２に示すように、サーバ通信部１１０及びサーバ制御部１２０を備えている。

サーバ通信部１１０は、外部の機器と情報を送受信することができる。

サーバ制御部１２０は、サーバ１００の各構成を統括的に制御するものである。サーバ制御部１２０の詳細について、以下に説明する。

（サーバ制御部１２０）
サーバ制御部１２０は、図２に示すように、音声情報取得部１３１、音声抽出部１３２、音声認識部（発話内容情報生成部）１３３、表示情報生成部１３４、翻訳部（翻訳内容情報生成部）１３５、及び表示情報出力部（発話内容情報出力部、翻訳内容情報出力部）１３６としても機能する。

音声情報取得部１３１は、サーバ通信部１１０を制御し、表示装置２００から出力された音声情報を取得する。

音声抽出部１３２は、音声情報取得部１３１が取得した音声情報に含まれている音声から、客または店員が発話した音声を抽出し、抽出した音声を示す抽出音声情報を出力する。

音声認識部１３３は、音声抽出部１３２が出力した抽出音声情報が示す音声を認識し、認識した音声内容を示す発話内容情報を出力する。

表示情報生成部１３４は、表示装置２００に表示させるべき情報を含む表示情報を生成する。表示情報生成部１３４が生成する表示情報の詳細については、後述する。

翻訳部１３５は、発話内容を取得し、当該発話内容を翻訳した翻訳内容を示す翻訳発話内容情報を生成して出力する。

表示情報出力部１３６は、表示情報生成部１３４が生成した表示情報を、サーバ通信部１１０を制御して表示装置２００に出力する。

（表示装置２００）
図３は、本発明の実施形態１における表示装置２００の要部構成を示すブロック図である。表示装置２００について、図３を用いて説明する。

表示装置２００は、図３に示すように、表示装置通信部２１０、表示装置制御部２２０、表示部２５０、及び音声受付部２６０を備えている。

表示装置通信部２１０は、外部の機器と情報を送受信することができる。

表示装置制御部２２０は、表示装置２００の各構成を統括的に制御するものである。表示装置制御部２２０の詳細については、後述する。

表示部２５０は、表示装置制御部２２０から出力される画像信号が示す画像を表示する。

音声受付部２６０は、表示装置２００の周辺の音声を取得し、取得した音声を示す音声情報を出力する。

（表示装置制御部２２０）
表示装置制御部２２０は、図３に示すように、表示情報取得部（取得部）２３１、表示画像生成部２３２、及び音声情報取得部２３３としても機能する。

表示情報取得部２３１は、表示装置通信部２１０を制御し、サーバ１００から出力された表示情報を取得する。

表示画像生成部２３２は、表示情報が示す表示画像であって、表示装置２００が店員向けであるか客向けであるのかに応じた表示態様を有する表示画像を生成する。ここで、店員向けであるか客向けであるのかに応じた表示態様を有する表示画像とは、店員向けであるか客向けであるのかに応じた文字の設定によって表されるテキストを含む表示画像である。店員向けであるか客向けであるのかに応じた文字の設定の例として、文字の書体、文字の色、文字の大きさ、文字の飾り（傍点、下線、取り消し線、二重取り消し線、影付き、網掛け、背景色、上付き文字、下付き文字、中抜き、浮きだし、浮彫など）の設定が挙げられる。表示画像生成部２３２が表示画像を生成する処理の詳細は、後述する。

音声情報取得部２３３は、音声受付部２６０を介して音声情報を取得する。

（コミュニケーション支援システム１の処理１）
図４は、本発明の実施形態１に係るコミュニケーション支援システム１において、客の発話内容の翻訳が表示されるまでの処理の流れ（コミュニケーション支援方法）を示すシークエンス図である。また、図５は、本発明の実施形態１における表示情報の構造を示す図である。また、図６は、本発明の実施形態１における表示装置２００が表示する画像を示す図である。コミュニケーション支援システム１において、客の発話内容の翻訳が表示されるまでの処理の流れについて、図４〜図６を用いて説明する。

図６の（ａ）は、表示装置２００ａの初期画像を示す図であり、図６の（ｂ）は、表示装置２００ｂの初期画像を示す図である。図６の（ａ）及び図６の（ｂ）に示すように、表示装置２００ａの表示部２５０ａ及び表示装置２００ｂの表示部２５０ｂに表示される初期画像にはそれぞれ、発話を促すテキスト８００ａ及び８００ｂを含む画像が表示されている。

なお、図６の（ａ）及び（ｂ）に示す初期画像を表示している期間において、表示装置２００ａ及び表示装置２００ｂが取得した音声の言語を判定し、後述する翻訳の処理において、当該言語に翻訳する構成であってもよい。例えば、表示装置２００ａが日本語の音声を取得し、表示装置２００ｂが英語の音声を取得した場合、後述する翻訳処理（ステップＳ２７）では、サーバ１００は、表示装置２００ａから取得した音声に含まれる発話内容を英語に翻訳し、表示装置２００ｂから取得した音声に含まれる発話内容を日本語に翻訳する構成であってもよい。なお、本明細書では、店員が日本語を話し、客が英語を話す場合について、説明する。

（ステップＳ１）
まず、表示装置２００ｂの音声情報取得部２３３ｂは、音声受付部２６０ｂを介して客が発話した音声を含む音声情報を取得する。例えば、客が店員におでんを購入する方法を尋ねるため、「How can I buy it?」と発話すると、音声情報取得部２３３ｂは、「How can I buy it?」を含む音声情報を取得する。

（ステップＳ３）
音声情報取得部２３３ｂは、取得した上記音声情報を、表示装置通信部２１０ｂを介してサーバ１００に出力する。

（ステップＳ５）
サーバ１００の音声情報取得部１３１は、サーバ通信部１１０を介して上記音声情報を取得する。そして、音声情報取得部１３１は、上記音声情報を、音声抽出部１３２に出力する。

（ステップＳ７）
音声抽出部１３２は、取得した上記音声情報に含まれている音声から客が発話した音声を抽出する。そして、抽出した音声を示す抽出音声情報を音声認識部１３３に出力する。

（ステップＳ９）
音声認識部１３３は、取得した上記抽出音声情報が示す音声を認識し、認識した発話内容を示す発話内容情報を表示情報生成部１３４に出力する。

（ステップＳ１１、発話内容情報取得工程）
表示情報生成部１３４は、取得した上記発話内容情報含む表示情報を生成する。ここで、表示情報生成部１３４が生成する表示情報について、図５の（ａ）を用いて説明する。図５の（ａ）は、発話内容を表示するための表示情報の一例を示す図である。

図５の（ａ）に示すように、発話内容を表示するための表示情報を「communication」と称する。「communication」は、図５の（ａ）に示すように、項目「cid」、項目「type」、項目「kind」、項目「state」、及び項目「data」によって構成されている。

項目「cid」には、当該「communication」を他の「communication」と識別するための識別情報が格納される。より具体的には、通し番号の数字が格納される。

項目「type」には、後述する項目「data」に格納されている発話内容を発話した人を示す情報が格納される。より具体的には、客が発話したことを示す「customer」または店員が発話したことを示す「staff」が格納される。

項目「kind」には、後述する項目「data」の種類を示す情報が格納される。より具体的には、発話内容を示す「speech」または発話内容の翻訳である翻訳発話内容を示す「trans」が格納される。

項目「state」には、後述する吹き出しを新たに生成するか、または既に生成されている吹き出しを更新するか、を示す情報が格納される。より具体的には、吹き出しを新たに生成することを示す「new」または既に生成されている吹き出しを更新することを示す「update」が格納される。

項目「data」には、発話内容または翻訳発話内容が格納される。

例えば、ステップＳ３において、音声情報取得部２３３ｂが「How can I buy it?」を含む音声情報を取得すると、ステップＳ１１において表示情報生成部１３４は、図５の（ａ）に示すように、項目「cid」に「1」を格納し、項目「type」に「customer」を格納し、項目「kind」に「speech」を格納し、項目「state」に「new」を格納し、項目「data」に「How can I buy it?」を格納した「communication」を生成する。そして、表示情報生成部１３４は、生成した上記表示情報を表示情報出力部１３６に出力する。

（ステップＳ１３、発話内容情報出力工程）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２００ａ及び表示装置２００ｂに出力する。

（ステップＳ１５）
表示装置２００ｂの表示情報取得部２３１ｂは、表示装置通信部２１０ｂを介して上記表示情報を取得する。そして、表示情報取得部２３１ｂは、上記表示情報を表示画像生成部２３２ｂに出力する。

（ステップＳ１７）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報を参照し、項目「state」に「new」が格納されているため、項目「cid」に格納されている「1」に関連付けた吹き出しの画像を生成する。続いて、項目「type」に「customer」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、客が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「How can I buy it?」の文字を大きくした画像を生成する。なお、この場合の文字の大きさは、店員が発話した発話内容を示すテキスト及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きいことを指している。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ１９）
表示部２５０ｂは、取得した上記表示画像を表示する。

（ステップＳ２１）
ステップＳ１３においてサーバ１００が表示情報を出力すると、表示装置２００ａの表示情報取得部２３１ａは、表示装置通信部２１０ａを介して上記表示情報を取得する。そして、表示情報取得部２３１ａは、上記表示情報を表示画像生成部２３２ａに出力する。

（ステップＳ２３）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示情報を参照し、項目「state」に「new」が格納されているため、項目「cid」に格納されている「1」に関連付けた吹き出しの画像を生成する。続いて、項目「type」に「customer」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、客が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「How can I buy it?」の文字を小さくした画像を生成する。なお、この場合の文字の大きさは、店員が発話した発話内容を示すテキスト及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字より小さいことを指している。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

（ステップＳ２５）
表示部２５０ａは、取得した上記表示画像を表示する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、客の発話内容を含む画像について、図６の（ｃ）及び（ｄ）を用いて説明する。図６の（ｃ）は、店員向けの表示装置２００ａが表示する画像の例であり、図６の（ｄ）は、客向けの表示装置２００ｂが表示する画像の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれる発話内容は、客が発話した発話内容であると認識することができる。そのため、店員向けの表示装置２００ａの表示部２５０ａは、新しく生成した吹き出し３００ａの中に発話内容を示すテキストの文字を小さくしたテキスト４００ａを含ませ、表示する。一方、客向けの表示装置２００ｂの表示部２５０ｂは、新しく生成した吹き出し３００ｂの中に発話内容を示すテキストの文字を大きくしたテキスト４００ｂを含ませ、表示する。なお、表示部２５０ａ及び２５０ｂがそれぞれ、上述した図６の（ｃ）及び（ｄ）に示す表示画像を表示するまでの期間、例えば、（１）「音声認識処理中」のテキストを含むポップアップウィンドウを表示する、（２）音声認識処理中を示すアイコンを表示する、といった、音声認識処理を実行中であることを客または店員に提示する構成であってもよい。

（ステップＳ２７、発話内容出力工程）
ステップＳ１３の処理が終わると、サーバ１００の表示情報生成部１３４は、ステップＳ１１において取得した発話内容情報を翻訳部１３５に出力する。翻訳部１３５は、取得した上記発話内容情報が示す発話内容の翻訳である翻訳発話内容を示す翻訳発話内容情報を生成する。そして、上記翻訳発話内容情報を表示情報生成部１３４に出力する。例えば、ステップＳ１１において、表示情報生成部１３４が「How can I buy it?」を示す発話内容情報を取得している場合、翻訳部１３５は、「それはどのように購入できますか？」を示す翻訳発話内容情報を表示情報生成部１３４に出力する。

（ステップＳ２９、翻訳内容情報取得工程）
表示情報生成部１３４は、取得した上記翻訳発話内容情報を表示するための「communication」を生成する。より具体的には、表示情報生成部１３４は、項目「cid」に「1」を格納し、項目「type」に「customer」を格納し、項目「kind」に「trans」を格納し、項目「state」に「update」を格納し、項目「data」に「それはどのように購入できますか？」を格納した「communication」を生成する。そして、表示情報生成部１３４は、生成した上記表示情報を、表示情報出力部１３６に出力する。

（ステップＳ３１、翻訳内容情報出力工程）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２００ａ及び表示装置２００ｂに出力する。

（ステップＳ３３）
表示装置２００ｂの表示情報取得部２３１ｂは、表示装置通信部２１０ｂを介して上記表示情報を取得する。そして、表示情報取得部２３１ｂは、上記表示情報を表示画像生成部２３２ｂに出力する。

（ステップＳ３５）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「1」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「customer」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、客が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「それはどのように購入できますか？」の文字を小さくした画像を生成する。なお、この場合の文字の大きさは、客が発話した発話内容を示すテキスト及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字より小さいことを指している。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ３７）
表示部２５０ｂは、取得した上記表示画像を表示する。

（ステップＳ３９）
ステップＳ３１においてサーバ１００が表示情報を出力すると、表示装置２００ａの表示情報取得部２３１ａは、表示装置通信部２１０ａを介して上記表示情報を取得する。そして、表示情報取得部２３１ａは、上記表示情報を表示画像生成部２３２ａに出力する。

（ステップＳ４１）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示画像を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「1」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「customer」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、客が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「それはどのように購入できますか？」の文字を大きくした画像を生成する。なお、この場合の文字の大きさは、客が発話した発話内容を示すテキスト及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きいことを指している。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

（ステップＳ４３）
表示部２５０ａは、取得した上記表示画像を表示する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、客の翻訳発話内容を含む画像について、図６の（ｅ）及び（ｆ）を用いて説明する。図６の（ｅ）は、店員向けの表示装置２００ａが表示する画像の他の例であり、図６の（ｆ）は、客向けの表示装置２００ｂが表示する画像の他の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれる発話内容は、客が発話した発話内容の翻訳であると認識することができる。そのため、店員向けの表示装置２００ａの表示部２５０ａは、既に生成していた吹き出し３００ａの中に翻訳発話内容を示すテキストの文字を大きくしたテキスト４０２ａを含ませ、表示する。換言すると、表示画像生成部２３２ａは、発話内容と当該発話内容の翻訳発話内容とがグループ化された表示画像を生成する。一方、客向けの表示装置２００ｂの表示部２５０ｂは、既に生成していた吹き出し３００ｂの中に翻訳発話内容を示すテキストの文字を小さくしたテキスト４０２ｂを含ませ、表示する（更新する）。

なお、表示部２５０ａ及び２５０ｂがそれぞれ、上述した図６の（ｃ）及び（ｄ）に示す表示画像を表示した後、図６の（ｅ）及び（ｆ）に示す表示画像を表示するまでの期間、例えば、（１）「翻訳処理中」のテキストを含むポップアップウィンドウを表示する、（２）翻訳処理中を示すアイコンを表示する、といった、翻訳処理を実行中であることを客または店員に提示する構成であってもよい。

（コミュニケーション支援システム１の処理２）
図７は、本発明の実施形態１に係るコミュニケーション支援システム１において、店員の発話内容の翻訳が表示されるまでの処理の流れを示すシークエンス図である。また、図８は、本発明の実施形態１における表示装置２００が表示する画像を示す図である。コミュニケーション支援システム１において、店員の発話内容の翻訳が表示されるまでの処理の流れについて、図７及び図８を用いて説明する。

（ステップＳ５１）
上述したステップＳ４３において、表示装置２００ａの表示部２５０ａが客の発話内容の翻訳を含む表示画像を表示すると、音声情報取得部２３３ａは、音声受付部２６０ａを介して店員が発話した音声を含む音声情報を取得する。例えば、店員が客におでんを購入する方法を教えるため、「おでんですか。欲しいものを注文して下さい」と発話すると、音声情報取得部２３３ａは、「おでんですか。欲しいものを注文して下さい」を含む音声情報を取得する。

（ステップＳ５３）
音声情報取得部２３３ａは、取得した上記音声情報を、表示装置通信部２１０ａを介してサーバ１００に出力する。

サーバ１００の音声情報取得部１３１が音声情報を取得し、音声認識部１３３が発話内容を表示情報生成部１３４に出力する処理については、上述したステップＳ５〜ステップＳ９と同じであるため、説明は省略する。

（ステップＳ１１）
表示情報生成部１３４は、取得した上記発話内容情報含む表示情報を生成する。例えば、ステップＳ５３において、音声情報取得部２３３ａが「おでんですか。欲しいものを注文して下さい」を含む音声情報を取得すると、表示情報生成部１３４は、項目「cid」に「2」を格納し、項目「type」に「staff」を格納し、項目「kind」に「speech」を格納し、項目「state」に「new」を格納し、項目「data」に「おでんですか。欲しいものを注文して下さい」を格納した「communication」を生成する。そして、表示情報生成部１３４は、上記表示情報を表示情報出力部１３６に出力する。

（ステップＳ１３）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２００ａ及び表示装置２００ｂに出力する。

（ステップＳ１７）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報を参照し、項目「state」に「new」が格納されているため、項目「cid」に格納されている「2」に関連付けた吹き出しの画像を生成する。続いて、項目「type」に「staff」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、店員が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「おでんですか。欲しいものを注文して下さい」の文字を小さくした画像を生成する。なお、この場合の文字の大きさは、客が発話した発話内容を示すテキスト及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字より小さいことを指している。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ２３）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示情報を参照し、項目「state」に「new」が格納されているため、項目「cid」に格納されている「2」に関連付けた吹き出しの画像を生成する。続いて、項目「type」に「staff」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、店員が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「おでんですか。欲しいものを注文して下さい」の文字を大きくした画像を生成する。なお、この場合の文字の大きさは、客が発話した発話内容を示すテキスト及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きいことを指している。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、店員の発話内容を含む画像について、図８の（ａ）及び（ｂ）を用いて説明する。図８の（ａ）は、店員向けの表示装置２００ａが表示する画像の他の例であり、図８の（ｂ）は、客向けの表示装置２００ｂが表示する画像の他の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれる発話内容は、店員が発話した発話内容であると認識することができる。そのため、店員向けの表示装置２００ａの表示部２５０ａは、新しく生成した吹き出し３０２ａの中に発話内容を示すテキストの文字を大きくしたテキスト４０４ａを含ませ、表示する。一方、客向けの表示装置２００ｂの表示部２５０ｂは、新しく生成した吹き出し３０２ｂの中に発話内容を示すテキストの文字を小さくしたテキスト４０４ｂを含ませ、表示する。

（ステップＳ２７）
ステップＳ１３の処理が終わると、サーバ１００の表示情報生成部１３４は、ステップＳ１１において取得した発話内容情報を翻訳部１３５に出力する。翻訳部１３５は、取得した上記発話内容情報の翻訳である翻訳内容を示す翻訳発話内容情報を生成する。そして、上記翻訳発話内容情報を表示情報生成部１３４に出力する。例えば、ステップＳ１１において、表示情報生成部１３４が「おでんですか。欲しいものを注文して下さい」を示す発話内容情報を取得している場合、翻訳部１３５は、「Oden? You order what you want.」を示す翻訳発話内容情報を表示情報生成部１３４に出力する。

（ステップＳ２９）
表示情報生成部１３４は、取得した上記翻訳発話内容を表示するための「communication」を生成する。より具体的には、表示情報生成部１３４は、項目「cid」に「2」を格納し、項目「type」に「staff」を格納し、項目「kind」に「trans」を格納し、項目「state」に「update」を格納し、項目「data」に「Oden? You order what you want.」を格納した「communication」を生成する。そして、表示情報生成部１３４は、上記表示情報を、表示情報出力部１３６に出力する。

（ステップＳ３１）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２００ａ及び表示装置２００ｂに出力する。

（ステップＳ３５）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、店員が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「Oden? You order what you want.」の文字を大きくした画像を生成する。なお、この場合の文字の大きさは、店員が発話した発話内容を示すテキスト及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きいことを指している。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ４１）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示情報を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、店員が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しの中に、項目「data」に格納されている発話内容を示すテキスト「Oden? You order what you want.」の文字を小さくした画像を生成する。なお、この場合の文字の大きさは、店員が発話した発話内容を示すテキスト及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字より小さいことを指している。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、店員の翻訳発話内容を含む画像について、図８の（ｃ）及び（ｄ）を用いて説明する。図８の（ｃ）は、店員向けの表示装置２００ａが表示する画像の他の例であり、図８の（ｄ）は、客向けの表示装置２００ｂが表示する画像の他の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれる発話内容は、店員が発話した発話内容の翻訳であると認識することができる。そのため、店員向けの表示装置２００ａの表示部２５０ａは、既に生成していた吹き出し３０２ａの中に翻訳発話内容を示すテキストの文字を小さくしたテキスト４０６ａを含ませ、表示する。一方、客向けの表示装置２００ｂの表示部２５０ｂは、既に生成していた吹き出し３０２ｂの中に翻訳発話内容を示すテキストの文字を大きくしたテキスト４０６ｂを含ませ、表示する。

このように、本実施形態に係るコミュニケーション支援システム１では、店員向け画像及び客向け画像の少なくとも何れかを表示する表示装置２００は、表示すべき情報を含む表示情報（communication）を含む表示情報を取得し、表示情報の示す表示画像であって、表示装置２００が店員向けであるか客向けであるのかに応じた表示態様を有する表示画像を生成し、当該表示画像を表示する。そのため、店員向けの表示装置２００ａは、店員が見たいテキストの文字を大きく表示し、店員が見なくてもいいテキストの文字を小さく表示する。一方、客向けの表示装置２００ｂは、客が見たいテキストの文字を大きく表示し、客が見なくてもいいテキストの文字を小さく表示する。

また、コミュニケーション支援システム１では、表示装置２００ａ及び表示装置２００ｂがそれぞれ表示する画像は、表示態様は異なるが情報量は同じである。そのため、店員と客とは、例えば、自らが発した発話内容が翻訳されていること、相手が自らの発した発話内容の翻訳を待っていること、などといった情報を互いに共有することができる。

そのため、コミュニケーション支援システム１では、表示装置２００の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる。

なお、本実施形態では、店員向けの表示装置２００ａにおいて、表示画像生成部２３２ａは、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字及び客の発話内容を示すテキストの文字より大きい表示画像を生成したが、この構成に限定されない。表示画像生成部２３２は、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字及び客の発話内容を示すテキストの文字より目立つ表示画像を生成する構成であればよい。

ここで、「店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字及び客の発話内容を示すテキストの文字より目立つ」とは、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字及び客の発話内容を示すテキストの文字より大きい、太い、色が濃い等が挙げられる。

また、表示画像生成部２３２ａは、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字を大きくする、太くする、色を濃くする構成であってもよいし、店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字及び客の発話内容を示すテキストの文字を小さくする、細くする、色を薄くする構成であってもよい。

また、上記構成は客向けの表示装置２００ｂでも同様であり、表示画像生成部２３２ｂは、客の発話内容を示すテキストの文字及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字より目立つ表示画像を生成する構成であれば良い。また、表示画像生成部２３２ｂは、客の発話内容を示すテキストの文字及び店員の発話内容を翻訳した翻訳発話内容を示すテキストの文字を大きくする、太くする、色を濃くする構成であってもよいし、店員の発話内容を示すテキストの文字及び客の発話内容を翻訳した翻訳発話内容を示すテキストの文字を小さくする、細くする、色を薄くする構成であってもよい。

〔実施形態２〕
本発明の他の実施形態に係るコミュニケーション支援システム２について、図９〜図１３に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

（コミュニケーション支援システム２）
コミュニケーション支援システム２は、サーバ１０１及び表示装置２０１によって構成され、サーバ１０１及び表示装置２０１は、上述した実施形態におけるコミュニケーション支援システム１におけるサーバ１００及び表示装置２００が備えている各機能に加えて、サーバ１０１はキーフレーズを検索し、表示装置２０１は、キーフレーズを強調表示し、さらにキーフレーズに関連した図を表示する。本実施形態におけるサーバ１０１について、図９を用いて説明する。なお、表示装置２０１の構成は、実施形態１における表示装置２００と同じであるため、説明を省略する。

（サーバ１０１）
図９は、本発明の実施形態２におけるサーバ１０１の要部構成を示すブロック図である。サーバ１０１は、図９に示すように、実施形態１におけるサーバ１００が備えているサーバ制御部１２０に替えてサーバ制御部１２１を備え、キーフレーズデータベース１５０を更に備えている。

（サーバ制御部１２１）
サーバ制御部１２１は、サーバ１０１の各部を統括的に制御するものであり、図９に示すように、サーバ制御部１２０の機能に加えて、キーフレーズ検索部（フレーズ判定部）１３７としても機能する。

キーフレーズ検索部１３７は、後述するキーフレーズデータベース１５０を参照し、取得した発話内容情報及び翻訳発話内容情報の中のキーフレーズを検索する。そして、キーフレーズ検索部１３７は、キーフレーズを検出した場合、当該キーフレーズに関連付けられたキーフレーズ情報を、キーフレーズデータベース１５０から取得する。

（キーフレーズデータベース１５０）
キーフレーズデータベース１５０には、キーフレーズに関する情報であるキーフレーズ情報が、キーフレーズに関連付けられたキーフレーズテーブルとして格納されている。キーフレーズデータベース１５０に格納されているキーフレーズテーブルについて、図１０を用いて説明する。図１０は、本発明の実施形態２におけるキーフレーズ情報が格納されたキーフレーズテーブルである。

キーフレーズテーブルは、図１０に示すように、項目「ＩＤ」、項目「キーフレーズ（日本語）」、項目「キーフレーズ（英語）」、項目「置換文字列」、及び項目「画像Ｎｏ．」を含んでいる。

項目「ＩＤ」には、キーフレーズを他のキーフレーズと識別するための識別情報が格納される。より具体的には、通し番号の数字が格納される。

項目「キーフレーズ（日本語）」には、キーフレーズを日本語で表記したテキストが格納される。

項目「キーフレーズ（英語）」には、キーフレーズを英語で表示したテキストが格納される。

項目「置換文字列」は、キーフレーズに置き換えられるテキストが格納される。より具体的には、キーフレーズを強調表示する指示を含むテキストが格納される。

項目「画像Ｎｏ．」は、キーフレーズに関連した画像の番号が格納される。

（コミュニケーション支援システム２の処理）
図１１は、本発明の実施形態２に係るコミュニケーション支援システム２における処理の流れを示すシークエンス図である。また、図１２は、本発明の実施形態２における表示装置２０１が表示する表示画像を示す図である。また、図１３は、本発明の実施形態２における表示装置２０１が表示する他の表示画像を示す図である。本発明の実施形態２に係るコミュニケーション支援システム２の処理について、図１１〜図１３を用いて説明する。

まず、表示装置２０１が客または店員の発話した音声情報を取得し、発話テキスト及び翻訳テキストを表示する処理は、上述した実施形態１における処理と同じであるため、説明を省略する。

（ステップＳ１０１）
表示情報生成部１３４は、発話内容を表示するための表示情報を表示情報出力部１３６に出力すると、当該発話内容を示す発話内容情報をキーフレーズ検索部１３７に出力する。キーフレーズ検索部１３７は、キーフレーズデータベース１５０に格納されているキーフレーズテーブルを参照し、取得した上記発話内容情報が示す発話内容の中のキーフレーズを検索する。

（ステップＳ１０３）
キーフレーズ検索部１３７は、上記発話テキスト内にキーフレーズが検出されたか否かを判定する。

（ステップＳ１０５）
ステップＳ１０３において、「キーフレーズが検出された」と判定された場合（ステップＳ１０５：ＹＥＳ）、該当するキーレフレーズに関連付けられたキーフレーズ情報を、キーフレーズデータベース１５０から取得する。例えば、ステップＳ１０１において、キーフレーズ検索部１３７が「おでんですか。欲しいものを注文して下さい」を示す発話内容情報を取得した場合、図１０に記載のキーフレーズテーブルを参照し、キーフレーズ「おでん」を検出する。そして、取得したキーフレーズ情報のうち、項目「置換文字列」に格納されているキーフレーズ情報を参照し、キーフレーズ「おでん」を、「おでん」に置換し、置換後の発話内容情報を表示情報生成部１３４に出力する。また、キーフレーズ検索部１３７は、取得したキーフレーズ情報のうち、項目「画像Ｎｏ．」に格納されている「１」によって特定される画像を示す画像情報を表示情報生成部１３４に出力する。

（ステップＳ１０７）
表示情報生成部１３４は、置換後の発話内容情報が示す発話内容を表示するための表示情報を生成する。ここで、置換後の発話テキストには、画像の格納先を含んでいるため、上述した「communication」に加えて、画像を表示するための表示情報を生成する。画像を表示するための表示情報について、図５の（ｂ）を用いて説明する。

図５の（ｂ）は、画像を表示するための表示情報の一例を示す図である。図５の（ｂ）に示すように、画像を表示するための表示情報を「display」と称する。「display」は、図５の（ｂ）に示すように、項目「did」及び項目「data」によって構成されている。

項目「did」には、当該「display」を他の「display」と識別するための識別情報が格納される。より具体的には、通し番号の数字が格納される。

項目「data」には、画像を示す画像情報または格納先を示す格納先情報が格納される。

例えば、表示情報生成部１３４が取得した画像情報が「ODEN1.png」であった場合、ステップＳ１０７において表示情報生成部１３４が生成する「display」には、図５の（ｂ）に示すように、項目「did」に「1」が格納され、項目「data」に「ODEN1.png」が格納される。また、ステップＳ１０７において、表示情報生成部１３４は、項目「cid」に「2」を格納し、項目「type」に「staff」を格納し、項目「kind」に「speech」を格納し、項目「state」に「update」を格納し、項目「data」に「おでんですか。欲しいものを注文してください」を格納した「communication」を生成する。そして、表示情報生成部１３４は、生成した「display」及び「communication」を含む表示情報を、表示情報出力部１３６に出力する。

（ステップＳ１０９）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２０１ａ及び表示装置２０１ｂに出力する。

（ステップＳ１１１）
表示装置２０１ｂの表示情報取得部２３１ｂは、表示装置通信部２１０ｂを介して上記表示情報を取得する。そして、表示情報取得部２３１ｂは、上記表示情報を表示画像生成部２３２ｂに出力する。

（ステップＳ１１３）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報の「communication」を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、店員が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しに含まれるテキストのうち、店員が発話した発話内容を示すテキスト「おでんですか。欲しいものを注文して下さい」を、当該表示情報に含まれる発話内容を示すテキスト「おでんですか。欲しいものを注文してください」に更新した上で、当該テキストの文字を小さくした画像を生成する。

さらに、表示画像生成部２３２ｂは、取得した表示情報の「display」を参照し、項目「data」に格納されている「ODEN1.png」を更に含めた表示画像を生成する。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ１１５）
表示部２５０ｂは、取得した上記表示画像を表示する。

（ステップＳ１１７）
ステップＳ１０９においてサーバ１０１が表示情報を出力すると、表示装置２０１ａの表示情報取得部２３１ａは、表示装置通信部２１０ａを介して上記表示情報を取得する。そして、表示情報取得部２３１ａは、上記表示情報を表示画像生成部２３２ａに出力する。

（ステップＳ１１９）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示情報の「communication」を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストをさらに含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「speech」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、店員が発話した発話内容であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しに含まれるテキストのうち、店員が発話した発話内容を示す「おでんですか。欲しいものを注文して下さい」を、当該表示情報に含まれる発話内容を示すテキスト「おでんですか。欲しいものを注文してください」に更新した上で、当該テキストの文字を大きくした画像を生成する。

さらに表示画像生成部２３２ａは、取得した表示情報の「display」を参照し、項目「data」に格納されている「ODEN1.png」を更に含めた表示画像を生成する。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

（ステップＳ１２１）
表示部２５０ａは、取得した上記表示画像を表示する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、キーフレーズ及びキーフレーズに関連した画像を含む画像について、図１２の（ａ）及び（ｂ）を用いて説明する。図１２の（ａ）は、店員向けの表示装置２０１ａが表示する画像の例であり、図１２の（ｂ）は、客向けの表示装置２０１ｂが表示する画像の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれるキーフレーズ及び画像を含む表示画像を生成する。そのため、店員向けの表示装置２０１ａの表示部２５０ａは、吹き出し３０２ａに含まれるテキスト４０４ａに含まれるキーフレーズ（おでん）５００ａを太字に更新し、おでんの画像６００ａを含む表示画像を表示する。また、客向けの表示装置２０１ｂの表示部２５０ｂも同様に、吹き出し３０２ｂに含まれるテキスト４０４ｂに含まれるキーフレーズ（おでん）５００ｂを太字に更新し、おでんの画像６００ｂを含む表示画像を表示する。なお、強調表示の例として、太字以外にも、色を変える、背景色を変えるなども挙げられる。

続いて、コミュニケーション支援システム２では、翻訳テキストについても、上述したステップＳ１０１〜Ｓ１２１と同様の処理を実行する。翻訳テキストでは、検出されるキーフレーズは「Oden」であるため、ステップＳ１０５において、キーフレーズ検索部１３７が「Oden」を検出すると、キーフレーズ「Oden」を「Oden」に置換し、置換後の発話内容情報を表示情報生成部１３４に出力する。また、キーフレーズ検索部１３７は、取得したキーフレーズ情報のうち、項目「画像Ｎｏ．」に格納されている「１」によって特定される画像を示す画像情報を表示情報生成部１３４に出力する。

そして、ステップＳ１０７において表示情報生成部１３４が生成する「display」には、項目「did」に「1」が格納され、項目「data」に「ODEN1.png」が格納される。また、ステップＳ１０７において、表示情報生成部１３４は、「cid」に「2」を格納し、項目「type」に「staff」を格納し、項目「kind」に「trans」を格納し、項目「state」に「update」を格納し、項目「data」に「Oden? You order what you want.」を格納した「communication」を生成する。

続いて、表示装置２０１ｂの表示画像生成部２３２ｂは、ステップＳ１１３において、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ｂは、取得した表示情報の「communication」を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストを更に含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ｂは、当該表示情報に含まれる発話内容は、店員が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ｂは、上記吹き出しに含まれるテキストのうち、店員の翻訳発話内容を示すテキスト「Oden? You order what you want.」を、当該表示情報に含まれる発話内容を示すテキスト「Oden? You order what you want.」に更新した上で、当該テキストの文字を大きくした画像を生成する。

更に、表示画像生成部２３２ｂは、取得した表示情報の「display」を参照し、項目「data」に格納されている「ODEN1.png」を更に含めた表示画像を生成する。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

また、表示装置２０１ａの表示画像生成部２３２ａは、ステップＳ１１９において、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、まず、表示画像生成部２３２ａは、取得した表示情報の「communication」を参照し、項目「state」に「update」が格納されているため、項目「cid」に格納されている「2」に関連付けられた吹き出しに、当該表示情報に含まれる発話内容を示すテキストを更に含めた画像を生成する。ここで、項目「type」に「staff」が格納され、項目「kind」に「trans」が格納されているため、表示画像生成部２３２ａは、当該表示情報に含まれる発話内容は、店員が発話した発話内容の翻訳であると認識することができる。そのため、表示画像生成部２３２ａは、上記吹き出しに含まれるテキストのうち、店員の翻訳発話内容を示すテキスト「Oden? You order what you want.」を、当該表示情報に含まれる発話内容を示すテキスト「Oden? You order what you want.」に更新した上で、当該テキストの文字を小さくした画像を生成する。

更に、表示画像生成部２３２ａは、取得した表示情報の「display」を参照し、項目「data」に格納されている「ODEN1.png」を更に含めた表示画像を生成する。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、キーフレーズ及びキーフレーズに関連した画像を含む画像について、図１３の（ａ）及び（ｂ）を用いて説明する。図１３の（ａ）は、店員向けの表示装置２０１ａが表示する画像の他の例であり、図１３の（ｂ）は、客向けの表示装置２０１ｂが表示する画像の他の例である。

上述したように、表示画像生成部２３２ａ及び表示画像生成部２３２ｂは、取得した表示情報を参照し、当該表示情報に含まれるキーフレーズ及び画像を含む表示画像を生成する。そのため、店員向けの表示装置２０１ａの表示部２５０ａは、吹き出し３０２ａに含まれるテキスト４０６ａに含まれるキーフレーズ（Oden）５０２ａを太字に更新し、おでんの画像６００ａを含む表示画像を表示する。また、客向けの表示装置２０１ｂの表示部２５０ｂも同様に、吹き出し３０２ｂに含まれるテキスト４０６ｂに含まれるキーフレーズ（Oden）５０２ｂを太字に更新し、おでんの画像６００ｂを含む表示画像を表示する。

このように、本実施形態に係るコミュニケーション支援システム２では、サーバ１０１は、発話内容または翻訳内容に所定のフレーズが含まれているか否かを判定し、所定のフレーズが含まれている場合、所定のフレーズを強調表示するよう表示装置２０１に対して指示する。また、コミュニケーション支援システム２では、表示装置２０１は、所定のフレーズに関連した画像を表示する。そのため、コミュニケーション支援システム２では、例えば、所定のフレーズとして商品名を設定することにより、当該商品名を客または店員が発話すると表示装置２０１は商品の画像を表示するので、表示装置２０１の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる。

なお、本実施形態では、「display」の「data」に画像情報が格納されている場合について説明したが、上述したように、「display」の「data」には画像の格納先を示す格納先情報が格納されていてもよい。この場合、表示画像生成部２３２は、当該格納先情報が示す格納先から画像を取得し、当該画像を含む表示画像を生成する。

〔実施形態３〕
本発明の他の実施形態に係るコミュニケーション支援システム３について、図１４〜図２１に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

（コミュニケーション支援システム３）
コミュニケーション支援システム３はサーバ１０２及び表示装置２０２によって構成され、サーバ１０２及び表示装置２０２は、上述した実施形態におけるコミュニケーション支援システム２におけるサーバ１０１及び表示装置２０１が備えている各機能に加えて、客または店員による操作を示す操作情報を取得する。本実施形態におけるサーバ１０２及び表示装置２０２について、図１４及び図１５を用いて説明する。

（サーバ１０２）
図１４は、本発明の実施形態３におけるサーバ１０２の要部構成を示すブロック図である。サーバ１０２は、図１４に示すように、実施形態２におけるサーバ１０１が備えているサーバ制御部１２１及びキーフレーズデータベース１５０に替えて、サーバ制御部１２２及びキーフレーズデータベース１５２を備えている。

（サーバ制御部１２２）
サーバ制御部１２２は、サーバ１０２の各部を統括的に制御するものであり、図１４に示すように、サーバ制御部１２１の機能に加えて、操作情報取得部１３８としても機能する。

操作情報取得部１３８は、サーバ通信部１１０を制御し、表示装置２０２から出力された操作情報を取得する。

（キーフレーズデータベース１５２）
キーフレーズデータベース１５２に格納されているキーフレーズテーブルを、図１６に示す。図１６は、本発明の実施形態３におけるキーフレーズ情報が格納されたキーフレーズテーブルである。

キーフレーズテーブルは、図１６に示すように、実施形態２におけるキーフレーズデータベース１５０に格納されていたキーフレーズテーブルに加えて、項目「ポークフラグ」を含んでいる。

項目「ポークフラグ」には、関連付けられたキーフレーズがポークと関連しているか否かを示す情報が格納される。より具体的には、関連付けられたキーフレーズがポークと関連していることを示す「1」または関連付けられたキーフレーズがポークと関連していないことを示す「0」が格納される。

（表示装置２０２）
図１５は、本発明の実施形態３における表示装置２０２の要部構成を示すブロック図である。表示装置２０２は、図１５に示すように、実施形態２における表示装置２００が備えている表示装置制御部２２０に替えて表示装置制御部２２２を備え、操作受付部２７０を更に備えている。

操作受付部２７０は、ユーザの操作を受け付け、当該操作を示す操作情報を出力する。なお、操作受付部２７０は、表示部２５０と一体となったタッチパネル式表示部であってもよい。

（表示装置制御部２２２）
表示装置制御部２２２は、表示装置２０２の各部を統括的に制御するものであり、図１５に示すように、表示装置制御部２２０の機能に加えて、操作情報取得部２３４としても機能する。

操作情報取得部２３４は、操作受付部２７０から出力された操作情報を取得し、表示装置通信部２１０を制御し、取得した操作情報をサーバ１０２に出力する。

（コミュニケーション支援システム３の処理１）
図１７は、本発明の実施形態３における表示装置２０２が表示する表示画像を示す図である。コミュニケーション支援システム３の処理の内、キーフレーズに関連したオブジェクトであって、客または店員の操作を受け付けるオブジェクトを表示する処理について、上述した図４、図７、図１１を用いて説明する。

まず、上述した実施形態２において、図１３に示す表示画像を表示装置２０１が表示した後、おでんの画像に含まれる「つくね」に対して客が「What is this?」と発話し、それに対して店員が「つくねです」と発話した場合、コミュニケーション支援システム３は、上述した図４、図７に示した処理に従い、表示装置２０１が表示画像を表示する。

続いて、コミュニケーション支援システム３は図１１に示した処理に従い、サーバ１０２は、ステップＳ１０１においてキーフレーズを検索する。この場合、発話内容にキーフレーズ「つくね」が含まれているため、キーフレーズ検索部１３７は、ステップＳ１０５において、「つくね」に関連付けられたキーフレーズ情報をキーフレーズデータベース１５２から取得する。そして、キーフレーズ検索部１３７は、キーフレーズを置換した発話内容情報と画像情報とを表示情報生成部１３４に出力する。更に、キーフレーズ検索部１３７は、ステップＳ１０５において、項目「ポークフラグ」に「1」が格納されていることを示すフラグ情報を表示情報生成部１３４に出力する。

表示情報生成部１３４は、ステップＳ１０７において、置換後の発話内容情報が示す発話内容を表示するための表示情報を生成する。ここで、表示情報生成部１３４は、取得したフラグ情報を参照し、当該フラグ情報が項目「ポークフラグ」に「1」が格納されていることを示す場合、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを示すオブジェクト情報を含む表示情報を生成する。そして、ステップＳ１０９において、表示情報出力部１３６は当該表示情報を、サーバ通信部１１０を介して表示装置２０１ａ及び表示装置２０１ｂに出力する。

表示装置２０１ｂの表示画像生成部２３２ｂは、ステップＳ１１３において、上記表示情報が示す表示画像を生成する。ここで、上述したステップＳ１１３の処理に加えて、表示画像生成部２３２ｂは、表示情報に含まれているオブジェクト情報を参照する。なお、表示画像生成部２３２ｂは、参照したオブジェクト情報が、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを示す場合、追加の処理は実行しない。

続いて、表示装置２０１ａの表示画像生成部２３２ａは、ステップＳ１１９において、上記表示情報が示す表示画像を生成する。ここで、上述したステップＳ１１９の処理に加えて、表示画像生成部２３２ａは、表示情報に含まれているオブジェクト情報を参照する。そして、表示画像生成部２３２ａは、参照したオブジェクト情報が、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを示す場合、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを含む表示画像を生成する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像であって、操作を受け付けるオブジェクトを含む画像及び操作を受け付けるオブジェクトを含まない画像について、図１７の（ａ）を用いて説明する。図１７の（ａ）は、店員向けの表示装置２０２ａが表示する画像の例であり、（ｂ）は、客向けの表示装置２０２ｂが表示する画像の例である。

図１７の（ａ）に示すように、表示部２５０ａは、キーフレーズ（つくね）５１０ａ及びキーフレーズ（chicken meatball）５１２ａが強調表示され、キーフレーズに関連した画像６０２ａを含み、更に、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトである「Ｐｏｒｋｌｅｓｓ」ボタン６０４ａを含む表示画像を表示する。一方、図１７の（ｂ）に示すように、表示部２５０ｂは、キーフレーズ（つくね）５１０ｂ及びキーフレーズ（chicken meatball）５１２ｂが強調表示され、キーフレーズに関連した画像６０２ｂを含む画像を表示し、当該画像は操作を受け付けるオブジェクトは含まない。

なお、本実施形態では、客向けの表示装置２０２ｂは、参照したオブジェクト情報が、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを示す場合であっても、追加の処理は実行しないとしたが、上述した店員向け表示装置２０２ａと同様、「Ｐｏｒｋｌｅｓｓ」ボタン６０４ｂを表示する構成であってもよい。また、店員向け表示装置２０２ａも同様に、参照したオブジェクト情報が、豚肉が含まれる商品は含まない画像を表示する操作を受け付けるオブジェクトを示す場合、追加の処理は実行しない構成であってもよい。また、図１７の（ａ）に示すように、表示装置２０２ａは、初期画面に戻る操作を受け付けるオブジェクトである「ＴｏｐＰａｇｅ」ボタン６０５ａを含む表示画像を表示してもよい。

また、本実施形態では、キーフレーズテーブルが「ポーク」と関連しているかを示す項目を含む場合について説明したが、この構成に限定されない。例えば、関連付けられたキーフレーズが他の素材（例えば、「野菜」など）と関連しているかを示す項目、関連付けられたキーフレーズの調理（例えば、「生もの」）の状態を示す項目、関連付けられたキーフレーズの属性を示す項目（例えば、項目「○○円以下」など）を含む構成であってもよい。

（コミュニケーション支援システム３の処理２）
図１８は、本発明の実施形態３に係るコミュニケーション支援システム３における処理の流れを示すシークエンス図である。また、図１９は、本発明の実施形態３における表示装置２０２が表示する他の表示画像を示す図である。コミュニケーション支援システム３において、上述した図１７の表示画像を表示した後、客または店員の操作を受け付けた場合の処理について、図１８及び図１９を用いて説明する。

（ステップＳ２０１）
表示装置２０２ａの操作情報取得部２３４ａは、操作受付部２７０ａを介して、「Ｐｏｒｋｌｅｓｓ」ボタン６０４ａが押されたことを示す操作情報を取得する。

（ステップＳ２０３）
操作情報取得部２３４ａは、表示装置通信部２１０ａを介して、取得した操作情報をサーバ１０２に出力する。

（ステップＳ２０４）
サーバ１０２の操作情報取得部１３８は、サーバ通信部１１０を介して、上記操作情報を取得する。そして、操作情報取得部１３８は、取得した上記操作情報を、表示情報生成部１３４に出力する。

（ステップＳ２０５）
表示情報生成部１３４は、取得した上記操作情報を参照し、表示情報を生成する。ここで、上記操作情報は、「Ｐｏｒｋｌｅｓｓ」ボタン６０４ａが押されたことを示すので、豚肉が含まれる商品は含まない画像を表示するための表示情報を生成する。より具体的には、表示情報生成部１３４は、項目「did」に「3」を格納し、項目「data」に豚肉が含まれる商品は含まない画像である「ODEN4.png」を格納した「display」を生成する。そして、表示情報生成部１３４は、生成した「display」を含む表示情報を、表示情報出力部１３６に出力する。

（ステップＳ２０７）
表示情報出力部１３６は、取得した上記表示情報を、サーバ通信部１１０を介して表示装置２０２ａ及び表示装置２０２ｂに出力する。

（ステップＳ２０９）
表示装置２０２ｂの表示情報取得部２３１ｂは、表示装置通信部２１０ｂを介して上記表示情報を取得する。そして、表示情報取得部２３１ｂは、上記表示情報を表示画像生成部２３２ｂに出力する。

（ステップＳ２１１）
表示画像生成部２３２ｂは、上記表示情報が示す表示画像であって、客向けに応じた表示態様を有する表示画像を生成する。より具体的には、表示画像生成部２３２ｂは、取得した表示情報に含まれている「display」を参照し、表示画像に含まれる画像を項目「data」に格納されている「ODEN4.png」に更新した表示画像を生成する。そして、表示画像生成部２３２ｂは、生成した表示画像を表示部２５０ｂに出力する。

（ステップＳ２１３）
表示部２５０ｂは、取得した上記表示画像を表示する。

（ステップＳ２１５）
ステップＳ２０７においてサーバ１０２が表示情報を出力すると、表示装置２０２ａの表示情報取得部２３１ａは、表示装置通信部２１０ａを介して上記表示情報を取得する。そして、表示情報取得部２３１ａは、上記表示情報を表示画像生成部２３２ａに出力する。

（ステップＳ２１７）
表示画像生成部２３２ａは、上記表示情報が示す表示画像であって、店員向けに応じた表示態様を有する表示画像を生成する。より具体的には、表示画像生成部２３２ａは、取得した表示情報に含まれている「display」を参照し、表示画像に含まれる画像を項目「data」に格納されている「ODEN4.png」に更新した表示画像を生成する。そして、表示画像生成部２３２ａは、生成した表示画像を表示部２５０ａに出力する。

（ステップＳ２１９）
表示部２５０ａは、取得した上記表示画像を表示する。

ここで、表示部２５０ａ及び表示部２５０ｂがそれぞれ表示する画像について、図１９を用いて説明する。図１９の（ａ）は、店員向けの表示装置２０２ａが表示する他の表示画像の例であり、（ｂ）は、客向けの表示装置２０２ｂが表示する他の表示画像の例である。

図１９の（ａ）に示すように、表示部２５０ａは、豚肉が含まれる商品は含まない画像で６０６ａを含む表示画像を表示する。また、表示部２５０ｂも同様に、豚肉が含まれる商品は含まない画像で６０６ｂを含む表示画像を表示する。

また、操作を受け付けるオブジェクトは、テキストであってもよい。テキストを、操作を受け付けるオブジェクトとした場合について、図２０を用いて説明する。図２０は、本発明の実施形態３における表示装置２０２が表示する更に他の表示画像を示す図であり、（ａ）は、店員向けの表示装置２０２ａが表示する更に他の表示画像の例であり、（ｂ）は、客向けの表示装置２０２ｂが表示する更に他の表示画像の例である。

例えば、表示画像に含まれるテキスト「おでん」を、おでんの画像を表示する操作を受け付けるオブジェクトとした場合、表示装置２０２ａは、図１９の（ａ）に示す画像に含まれる「おでん」のテキスト５００ａまたは「Oden」のテキスト５０２ａが押されたことを示す操作情報を取得すると、当該操作情報をサーバ１０２に出力する。そして、表示装置２０２ａは、サーバ１０２から、項目「data」に「ODEN1.png」が格納された「display」を含む表示情報を取得する。この場合、表示装置２０２ａは、図２０の（ａ）に示すように、おでんの画像６００ａを含む表示画像を表示する。また、表示装置２０２ｂも同様に、サーバ１０２から、項目「data」に「ODEN1.png」が格納された「display」を含む表示情報を取得する。この場合、表示装置２０２ｂは、図２０の（ｂ）に示すように、おでんの画像６００ｂを含む表示画像を表示する。

また、表示装置２０２ｂにおいても、表示画像に含まれるテキスト「おでん」を、おでんの画像を表示する操作を受け付けるオブジェクトとした場合、図１９の（ｂ）に示す画像に含まれる「おでん」のテキスト５００ｂまたは「Oden」のテキスト５０２ｂが押されたことを示す操作情報を取得すると、当該操作情報をサーバ１０２に出力する。そして、表示装置２０２ｂは、サーバ１０２から、項目「data」に「ODEN1.png」が格納された「display」を含む表示情報を取得する。この場合、表示装置２０２ｂは、図２０の（ｂ）に示すように、おでんの画像６００ｂを含む表示画像を表示する。また、表示装置２０２ａも同様に、サーバ１０２から、項目「data」に「ODEN1.png」が格納された「display」を含む表示情報を取得する。この場合、表示装置２０２ａは、図２０の（ａ）に示すように、おでんの画像６００ａを含む表示画像を表示する。

このように、本実施形態に係るコミュニケーション支援システム３では、表示装置２０２は、キーフレーズに関連したオブジェクトであって、客または店員の操作を受け付けるオブジェクトを含む表示画像を生成する。そのため、コミュニケーション支援システム３では、表示装置２０２の使い勝手を向上させることができる。また、店員向けの表示装置２０２ａ及び客向けの表示装置２０２ｂの何れかにおいて操作を受け付けた場合であっても、店員向けの表示装置２０２ａ及び客向けの表示装置２０２ｂの表示画像が更新されるので、利用者同士のコミュニケーションを円滑にすることができる。

〔実施形態４〕
本発明の他の実施形態に係るコミュニケーション支援システム４について、図２１に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

（コミュニケーション支援システム４）
コミュニケーション支援システム４は、サーバ１０３及び表示装置２０３によって構成される。上述した実施形態では、表示装置は２台（表示装置２００ａ及び表示装置２００ｂなど）で構成されていたが、コミュニケーション支援システム４では、表示装置が１台（表示装置２０３）である場合について説明する。なお、サーバ１０３は、上述したサーバ１００と同様の機能を備えているため、説明は省略する。

（表示装置２０３）
図２１は、本発明の実施形態４における表示装置２０３の要部構成を示すブロック図である。表示装置２０３は、図２１に示すように、表示装置通信部２１０、表示装置制御部２２３、表示部２５１、及び音声受付部２６０を備えている。なお、表示装置通信部２１０及び音声受付部２６０は上述した機能と同様の機能を備えているため、説明は省略する。

表示部２５１は、上述した表示部２５０の機能に加えて、店員向け画像を表示する第１の表示領域と、客向け画像を表示する第２の表示領域を備えている。そして、表示部２５１は、表示装置制御部２２３が出力する表示画像のうち、店員向けの表示画像である第１の表示画像を上記第１の表示領域に表示し、客向けの表示画像である第２の表示画像を上記第２の表示領域に表示する。

（表示装置制御部２２３）
表示装置制御部２２３は、表示装置２０３の各部を統括的に制御するものであり、図２１に示すように、上述した表示装置制御部２２０における表示画像生成部２３２に替えて、表示画像生成部２４０として機能する。

表示画像生成部２４０は、店員向けの表示態様である第１の表示態様を有する表示画像である第１の表示画像と、上記第２の表示領域に表示する表示画像であって、上記第１の表示態様とは異なる第２の表示態様を有する表示画像である第２の表示画像とを生成し、表示部２５１に出力する。

このように、本実施形態に係るコミュニケーション支援システム４では、店員向けの表示態様である第１の表示態様を有する表示画像である第１の表示画像を、表示部２５１の第１の表示領域に表示し、客向けの表示態様である第２の表示態様を有する表示画像である第２の表示画像を、表示部２５１の第２の表示領域に表示する。そのため、上述の実施形態と同様、表示装置２０３の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる。

〔実施形態５〕
本発明の他の実施形態に係るコミュニケーション支援システム５について、図２２に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

（コミュニケーション支援システム５）
コミュニケーション支援システム５は、サーバ１０４、表示装置２０４、音声抽出サーバ７００、音声認識サーバ７２０、及び翻訳サーバ７４０によって構成される。上述の各実施形態におけるサーバ１００〜１０３が有する各機能が、サーバ１０４、音声抽出サーバ７００、音声認識サーバ７２０、及び翻訳サーバ７４０にて実現されている。サーバ１０４、音声抽出サーバ７００、音声認識サーバ７２０、及び翻訳サーバ７４０について、図２２を用いて説明する。図２２は、本発明の実施形態５におけるサーバの要部構成を示すブロック図である。なお、表示装置２０４は、上述した表示装置２００〜２０３と同様の構成を備えるため、説明を省略する。

（サーバ１０４）
サーバ１０４は、図２２に示すように、サーバ通信部１１０及びサーバ制御部１２４を備えている。

（サーバ制御部１２４）
サーバ制御部１２４は、サーバ１０４の各構成を統括的に制御するものであり、図２２に示すように、表示情報出力部１３６、音声情報取得部１４０、発話内容情報取得部（発話内容出力部）１４１、表示情報生成部（発話内容情報出力部、翻訳内容情報出力部）１４２、及び翻訳発話内容情報取得部（翻訳内容情報取得部）１４３としても機能する。

表示情報出力部１３６は、表示情報生成部１４２が生成した表示情報を、サーバ通信部１１０を制御して表示装置２０４に出力する。

音声情報取得部１４０は、サーバ通信部１１０を制御して、表示装置２０４から出力された音声情報を取得し、当該音声情報を音声抽出サーバ７００に出力する。また、音声情報取得部１４０は、音声抽出サーバ７００から出力された抽出音声情報を取得し、音声認識サーバ７２０に出力する。

発話内容情報取得部１４１は、サーバ通信部１１０を制御して、音声認識サーバ７２０から出力された発話内容情報を取得する。また、発話内容情報取得部１４１は、取得した発話内容情報が示す発話内容を、翻訳サーバ７４０に出力する。

表示情報生成部１４２は、発話内容情報取得部１４１が取得した発話内容情報と、翻訳発話内容情報取得部１４３が取得した翻訳発話内容情報とを関連付け、当該発話内容情報及び翻訳発話内容情報の少なくとも何れかを含む表示情報を表示情報出力部１３６に出力する。

翻訳発話内容情報取得部１４３は、サーバ通信部１１０を制御して、翻訳サーバ７４０から出力された翻訳内容を示す翻訳内容情報を取得する。

（音声抽出サーバ７００）
音声抽出サーバ７００は、図２２に示すように、音声抽出サーバ通信部７０１及び音声抽出部７０２を備えている。

音声抽出サーバ通信部７０１は、外部の機器と情報を送受信することができる。

音声抽出部７０２は、音声抽出サーバ通信部７０１を制御し、サーバ１０４から出力された音声情報に含まれている音声から、客または店員が発話した音声を抽出し、抽出した音声を示す抽出音声情報を、サーバ１０４に出力する。

（音声認識サーバ７２０）
音声認識サーバ７２０は、図２２に示すように、音声認識サーバ通信部７２１及び音声認識部７２２を備えている。

音声認識サーバ通信部７２１は、外部の機器と情報を送受信することができる。

音声認識部７２２は、音声認識サーバ通信部７２１を制御し、サーバ１０４から出力された抽出音声情報が示す音声を認識し、認識した音声内容を示す発話内容情報を、サーバ１０４に出力する。

（翻訳サーバ７４０）
翻訳サーバ７４０は、図２２に示すように、翻訳サーバ通信部７４１及び翻訳部７４２を備えている。

翻訳サーバ通信部７４１は、外部の機器と情報を送受信することができる。

翻訳部７４２は、翻訳サーバ通信部７４１を制御し、サーバ１０４から出力された発話内容を取得し、当該発話内容の翻訳内容を示す翻訳内容情報をサーバ１０４に出力する。

このように、本実施形態に係るコミュニケーション支援システム５では、上述の各実施形態におけるサーバ１００〜１０３を、サーバ１０４、音声抽出サーバ７００、音声認識サーバ７２０、翻訳サーバ７４０によって実現することができる。そのため、各サーバをそれぞれ適した場所（店舗内、クラウド上など）に設置することができる。

例えば、音声抽出サーバ７００を店舗内に設置することにより、各店舗の状況に応じた設定（例えば、ノイズのフィルタリングなど）をすることができる。そのため、音声抽出サーバ７００は、店舗内に設置することが好ましい。また、音声抽出サーバ７００は、店員の発話した音声を抽出する音声抽出サーバ７００ａと、客の発話した音声を抽出する音声抽出サーバ７００ｂとによって構成されてもよい。

また、サーバ１０４はクラウド上に設置することにより、各店舗での発話内容を取得し、各店舗で起こったことを共有することができる。

また、各サーバは、同じ事業者によって管理されていてもよいし、異なる事業者によって管理されていてもよい。

〔実施形態６〕
サーバ１００〜１０４及び表示装置２００〜２０４の各ブロックは、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェアによって実現してもよい。後者の場合、サーバ１００〜１０４及び表示装置２００〜２０４のそれぞれを、図２３に示すようなコンピュータ（電子計算機）を用いて構成することができる。

図２３は、サーバ１００〜１０４及び表示装置２００〜２０４として利用可能なコンピュータ９１０の構成を例示したブロック図である。コンピュータ９１０は、バス９１１を介して互いに接続された演算装置９１２と、主記憶装置９１３と、補助記憶装置９１４と、入出力インターフェース９１５と、通信インターフェース９１６とを備えている。演算装置９１２、主記憶装置９１３、及び補助記憶装置９１４は、それぞれ、例えばＣＰＵ、ＲＡＭ（random access memory）、ハードディスクドライブであってもよい。入出力インターフェース９１５には、ユーザがコンピュータ９１０に各種情報を入力するための入力装置９２０、及び、コンピュータ９１０がユーザに各種情報を出力するための出力装置９３０が接続される。入力装置９２０及び出力装置９３０は、コンピュータ９１０に内蔵されたものであってもよいし、コンピュータ９１０に接続された（外付けされた）ものであってもよい。例えば、入力装置９２０は、キーボード、マウス、タッチセンサなどであってもよく、出力装置９３０は、ディスプレイ、プリンタ、スピーカなどであってもよい。また、タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力装置９２０及び出力装置９３０の双方の機能を有する装置を適用してもよい。そして、通信インターフェース９１６は、コンピュータ９１０が外部の装置と通信するためのインターフェースである。

補助記憶装置９１４には、コンピュータ９１０をサーバ１００〜１０４及び表示装置２００〜２０４として動作させるための各種のプログラムが格納されている。そして、演算装置９１２は、補助記憶装置９１４に格納された上記プログラムを主記憶装置９１３上に展開して該プログラムに含まれる命令を実行することによって、コンピュータ９１０を、サーバ１００〜１０４及び表示装置２００〜２０４が備える各部として機能させる。なお、補助記憶装置９１４が備える、プログラム等の情報を記録する記録媒体は、コンピュータ読み取り可能な「一時的でない有形の媒体」であればよく、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブル論理回路などであってもよい。

また、上記プログラムは、コンピュータ９１０の外部から取得してもよく、この場合、任意の伝送媒体（通信ネットワークや放送波等）を介して取得してもよい。そして、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

〔変形例〕
上述の各実施形態では、コミュニケーション支援システム１〜５が翻訳を行う場合について説明したが、コミュニケーション支援システム１〜５はその構成に限定されない。

例えば、商品名をキーフレーズで登録し、当該商品に関連したおすすめ商品の画像を表示装置に表示させてもよい。この場合、商品の型番、管理番号、在庫数、商品のマニュアル、取説、及び接客マニュアルなどを、店員向け表示装置にのみ表示させる構成としてもよい。また、当該商品に関連した広告、ＣＭを客向け表示装置にのみ表示させる構成としてもよい。

また、登録したキーフレーズに関連したキーフレーズをＳＮＳ（Social Network Service）上にて検索し、登録したキーフレーズに関連したキーフレーズを含むコメントやコメント数を表示する構成であってもよい。

〔まとめ〕
本発明の態様１に係る表示装置（２００〜２０２）は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、表示すべき情報を含む表示情報を取得する取得部（表示情報取得部２３１）と、上記取得部が取得した表示情報の示す表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部（２３２）と、上記表示画像生成部が生成した表示画像を表示する表示部（２５０）と、を備えている。

上記の構成によれば、表示装置の使い勝手を向上させ利用者同士のコミュニケーションを円滑にすることができる。

本発明の態様２に係る表示装置は、上記態様１において、上記表示画像生成部は、上記表示情報の示すテキストであって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた文字の設定によって表されるテキストを含む表示画像を生成してもよい。

上記の構成によれば、サービス提供者及びサービス利用者がそれぞれ見たいテキストを見やすく表示することができる。

本発明の態様３に係る表示装置は、上記態様１または２において、上記表示情報は、サービス提供者またはサービス利用者が発話した内容である発話内容を示す発話内容情報を含み、上記表示画像生成部は、上記取得部が取得した発話内容情報を参照し、当該発話内容情報が示す発話内容を含む表示画像を生成してもよい。

上記の構成によれば、サービス提供者またはサービス利用者が発話した発話内容をサービス提供者及びサービス利用者に提示することができる。

本発明の態様４に係る表示装置は、上記態様３において、上記表示情報は、上記発話内容情報が示す発話内容の翻訳である翻訳発話内容を示す翻訳発話内容情報を含み、上記表示画像生成部は、上記取得部が取得した翻訳発話内容情報を参照し、当該翻訳発話内容情報が示す翻訳発話内容を更に含むよう上記表示画像を更新してもよい。

上記の構成によれば、発話内容の後に、当該発話内容の翻訳をサービス提供者及びサービス利用者に提示することができる。

本発明の態様５に係る表示装置は、上記態様４において、上記表示画像生成部は、ある発話内容と、当該ある発話内容の翻訳である翻訳発話内容とがグループ化された表示画像を生成してもよい。

上記の構成によれば、対応している発話内容と翻訳内容とをサービス提供者及びサービス利用者に提示することができる。

本発明の態様６に係る表示装置は、上記態様４または５において、上記表示画像生成部は、当該表示装置がサービス提供者向け画像を表示する場合、サービス提供者の発話内容を示すテキストの文字及びサービス利用者の発話内容を翻訳した翻訳発話内容を示すテキストの文字を、当該サービス利用者の発話内容を示すテキストの文字及び当該サービス提供者の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きくした表示画像を生成し、当該表示装置がサービス利用者向け画像を表示する場合、サービス利用者の発話内容を示すテキストの文字及びサービス提供者の発話内容を翻訳した翻訳発話内容を示すテキストの文字を、当該サービス提供者の発話内容を示すテキストの文字及び当該サービス利用者の発話内容を翻訳した翻訳発話内容を示すテキストの文字より大きくした表示画像を生成してもよい。

上記の構成によれば、サービス提供者及びサービス利用者に対して、それぞれの発言内容の文字を大きくして提示することができる。また、サービス提供者及びサービス利用者に対して、相手の発言内容の翻訳の文字を大きくして提示することができる。

本発明の態様７に係る表示装置は、上記態様１〜６の何れかにおいて、上記表示画像生成部は、上記表示画像に含まれるフレーズのうち、所定のフレーズを強調表示してもよい。

上記の構成によれば、所定のフレーズを強調してサービス提供者及びサービス利用者に提示することができる。

本発明の態様８に係る表示装置は、上記態様７において、上記表示情報は、上記所定のフレーズに関連した画像を示す画像情報または当該画像の格納先を示す格納先情報を含み、上記表示画像生成部は、上記画像情報または上記格納先情報を参照し、上記所定のフレーズに関連した画像を含む表示画像を生成してもよい。

上記の構成によれば、所定のフレーズに関連した画像をサービス提供者及びサービス利用者に提示することができる。

本発明の態様９に係る表示装置は、上記態様７または８において、上記表示情報は、上記所定のフレーズに関連したオブジェクトであって、サービス利用者またはサービス提供者の操作を受け付けるオブジェクトを示すオブジェクト情報を含み、上記表示画像生成部は、上記オブジェクト情報を参照し、上記オブジェクトを含む表示画像を生成してもよい。

上記の構成によれば、所定のフレーズに関連する情報の表示を受け付けることができる。

本発明の態様１０に係る表示装置（２０３）は、サービス提供者向け画像を表示する第１の表示領域と、サービス利用者向け画像を表示する第２の表示領域とを有する表示装置であって、表示すべき情報を含む表示情報を取得する取得部（表示情報取得部２３１）と、上記取得部が取得した表示情報の示す表示画像であって、上記第１の表示領域に表示する表示画像であって、サービス提供者向けの表示態様である第１の表示態様を有する表示画像である第１の表示画像と、上記第２の表示領域に表示する表示画像であって、上記第１の表示態様とは異なる第２の表示態様を有する表示画像である第２の表示画像とを生成する表示画像生成部（２４０）と、上記表示画像生成部が生成した第１の表示画像を上記第１の表示領域に表示し、上記表示画像生成部が生成した第２の表示画像を上記第２の表示領域に表示する表示部（２５１）と、を備えている。

上記の構成によれば、上記態様１における表示装置と同様の効果を奏する。

本発明の態様１１に係るサーバ（１０４）は、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部（１４１）と、上記発話内容情報取得部が取得した発話内容情報を表示装置に出力する発話内容情報出力部（表示情報生成部１４２、表示情報出力部１３６）と、上記発話内容情報が示す発話内容を出力する発話内容出力部（発話内容情報取得部１４１）と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部（翻訳発話内容情報取得部１４３）と、上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部（表示情報生成部１４２、表示情報出力部１３６）と、を備えている。

本発明の態様１２に係るサーバ（１０１、１０２）は、上記態様１１において、上記発話内容情報が示す発話内容または上記翻訳内容情報が示す翻訳内容に、所定のフレーズが含まれているか否かを判定するフレーズ判定部（キーフレーズ検索部１３７）と、上記フレーズ判定部が、上記発話内容に上記所定のフレーズが含まれていると判定した場合、上記発話内容情報出力部は更に、上記所定のフレーズを強調表示するよう上記表示装置に対して指示し、上記フレーズ判定部が、上記翻訳内容に上記所定のフレーズが含まれていると判定した場合、上記翻訳内容情報出力部は更に、上記所定のフレーズを強調表示するよう上記表示装置に対して指示してもよい。

本発明の態様１３に係るサーバは（１００）、上記態様１１または１２において、発話した音声を示す音声情報を取得する音声情報取得部（１３１）と、上記音声情報取得部が取得した音声情報を参照し、当該音声情報が示す内容を発話内容として認識し、上記発話内容情報を生成する発話内容情報生成部（音声認識部１３３）と、をさらに備え、上記発話内容情報出力部は、上記発話内容情報生成部が生成した発話内容情報を、上記表示装置に出力してもよい。

上記の構成によれば、サーバが発話内容を認識することができる。

本発明の態様１４に係るサーバは、上記態様１１〜１３の何れかにおいて、上記発話内容情報が示す発話内容を翻訳した翻訳内容を示す翻訳内容情報を生成する翻訳内容情報生成部（翻訳部１３５）をさらに備え、上記翻訳内容情報出力部は、上記翻訳内容情報生成部が生成した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力してもよい。

上記の構成によれば、サーバが発話内容を翻訳することができる。

本発明の態様１５に係るコミュニケーション支援システム（５）は、サーバ（１０４）と表示装置（２０４）とを備えるコミュニケーション支援システムであって、上記サーバは、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部（１４１）と、上記発話内容情報取得部が取得した発話内容情報を上記表示装置に出力する発話内容情報出力部（表示情報生成部１４２、表示情報出力部１３６）と、上記発話内容情報が示す発話内容を出力する発話内容出力部（発話内容情報取得部１４１）と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部（翻訳発話内容情報取得部１４３）と、上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部（表示情報生成部１４２、表示情報出力部１３６）と、を備え、上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部（表示情報取得部２３１）と、上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部（２３２）と、上記表示画像生成部が生成した表示画像を表示する表示部（２５０）と、を備えている。

本発明の態様１６に係るコミュニケーション支援システム（１〜３）は、サーバ（１００〜１０２）と表示装置（２００〜２０２）とを備えるコミュニケーション支援システムであって、上記サーバは、発話した音声を示す音声情報を取得する音声情報取得部（２３１）と、上記音声情報取得部が取得した音声情報を参照し、当該音声情報が示す内容を発話内容として認識し、発話内容情報を生成する発話内容情報生成部（音声認識部１３３）と、上記発話内容情報生成部が生成した発話内容情報を上記表示装置に出力する発話内容情報出力部（表示情報出力部１３６）と、上記発話内容を翻訳した翻訳内容を示す翻訳内容情報を生成する翻訳内容情報生成部（翻訳部１３５）と、上記翻訳内容情報生成部が生成した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部（表示情報生成部１３４、表示情報出力部１３６）と、を備え、上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部（表示情報取得部２３１）と、上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部（２３２）と、上記表示画像生成部が生成した表示画像を表示する表示部（２５０）と、を備えている。

本発明の態様１７に係るコミュニケーション支援方法は、発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得工程と、上記発話内容情報取得工程において取得された発話内容情報を表示装置に出力する発話内容情報出力工程と、上記発話内容情報が示す発話内容を出力する発話内容出力工程と、上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得工程と、上記翻訳内容情報取得工程において取得された翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力工程と、を含む。

本発明の各態様に係る表示装置及びサーバは、コンピュータによって実現してもよく、この場合には、コンピュータを上記表示装置及びサーバが備える各部（ソフトウェア要素に限る）として動作させることにより上記表示装置及びサーバをコンピュータにて実現させる表示装置及びサーバの制御プログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

本発明は、店舗において店員と客とのコミュニケーションを支援するシステムに利用することができる。

１、２、３、４、５コミュニケーション支援システム
１００、１０１、１０２、１０３、１０４サーバ
１１０サーバ通信部
１２０、１２１、１２２、１２４サーバ制御部
１３１、１４０音声情報取得部
１３２音声抽出部
１３３音声認識部（発話内容情報生成部）
１３４表示情報生成部
１３５翻訳部（翻訳内容情報生成部）
１３６表示情報出力部（発話内容情報出力部、翻訳内容情報出力部）
１３７キーフレーズ検索部（フレーズ判定部）
１３８操作情報取得部
１４１発話内容情報取得部（発話内容出力部）
１４２表示情報生成部（発話内容情報出力部、翻訳内容情報出力部）
１４３翻訳発話内容情報取得部（翻訳内容情報取得部）
１５０、１５２キーフレーズデータベース
２００、２０１、２０２、２０３、２０４表示装置
２１０表示装置通信部
２２０、２２２、２２３表示装置制御部
２３１表示情報取得部（取得部）
２３２、２４０表示画像生成部
２３３音声情報取得部
２３４操作情報取得部
２５０、２５１表示部
２６０音声受付部
２７０、２７０ａ操作受付部
３００ａ、３００ｂ、３０２ａ、３０２ｂ、３０４ａ、３０４ｂ吹き出し
４００ａ、４００ｂ、４０２ａ、４０２ｂ、４０４ａ、４０４ｂ、４０６ａ、４０６ｂ、４１０ａ、４１０ｂ、４１２ａ、４１２ｂ、４１４ａ、４１４ｂ、４１６ａ、４１６ｂ、５００ａ、５００ｂ、５０２ａ、５０２ｂ、５１０ａ、５１０ｂ、５１２ａ、５１２ｂテキスト
６００ａ、６００ｂ、６０２ａ、６０２ｂ、６０６ａ、６０６ｂ画像
６０４ａ、６０４ｂ、６０５ａボタン
７００、７００ａ、７００ｂ音声抽出サーバ
７０１音声抽出サーバ通信部
７０２音声抽出部
７２０音声認識サーバ
７２１音声認識サーバ通信部
７２２音声認識部
７４０翻訳サーバ
７４１翻訳サーバ通信部
７４２翻訳部
８００ａ、８００ｂテキスト
９１０コンピュータ
９１１バス
９１２演算装置
９１３主記憶装置
９１４補助記憶装置
９１５入出力インターフェース
９１６通信インターフェース
９２０入力装置
９３０出力装置

Claims

サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、
表示すべき情報を含む表示情報を取得する取得部と、
上記取得部が取得した表示情報の示す表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、
上記表示画像生成部が生成した表示画像を表示する表示部と、
を備えていることを特徴とする表示装置。
上記表示画像生成部は、上記表示情報の示すテキストであって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた文字の設定によって表されるテキストを含む表示画像を生成する、
ことを特徴とする請求項１に記載の表示装置。
上記表示情報は、サービス提供者またはサービス利用者が発話した内容である発話内容を示す発話内容情報を含み、
上記表示画像生成部は、上記取得部が取得した発話内容情報を参照し、当該発話内容情報が示す発話内容を含む表示画像を生成する、
ことを特徴とする請求項１または２に記載の表示装置。
上記表示情報は、上記発話内容情報が示す発話内容の翻訳である翻訳発話内容を示す翻訳発話内容情報を含み、
上記表示画像生成部は、上記取得部が取得した翻訳発話内容情報を参照し、当該翻訳発話内容情報が示す翻訳発話内容を更に含むよう上記表示画像を更新する、
ことを特徴とする請求項３に記載の表示装置。
上記表示画像生成部は、ある発話内容と、当該ある発話内容の翻訳である翻訳発話内容とがグループ化された表示画像を生成する、
ことを特徴とする請求項４に記載の表示装置。
上記表示画像生成部は、
当該表示装置がサービス提供者向け画像を表示する場合、サービス提供者の発話内容を示すテキストの文字及びサービス利用者の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、当該サービス利用者の発話内容を示すテキストの文字及び当該サービス提供者の発話内容を翻訳した翻訳発話内容を示すテキストの文字より目立つ表示画像を生成し、
当該表示装置がサービス利用者向け画像を表示する場合、サービス利用者の発話内容を示すテキストの文字及びサービス提供者の発話内容を翻訳した翻訳発話内容を示すテキストの文字が、当該サービス提供者の発話内容を示すテキストの文字及び当該サービス利用者の発話内容を翻訳した翻訳発話内容を示すテキストの文字より目立つ表示画像を生成する、
ことを特徴とする請求項４または５に記載の表示装置。
上記表示画像生成部は、上記表示画像に含まれるフレーズのうち、所定のフレーズを強調表示する、
ことを特徴とする請求項１〜６の何れか１項に記載の表示装置。
上記表示情報は、上記所定のフレーズに関連した画像を示す画像情報または当該画像の格納先を示す格納先情報を含み、
上記表示画像生成部は、上記画像情報または上記格納先情報を参照し、上記所定のフレーズに関連した画像を含む表示画像を生成する、
ことを特徴とする請求項７に記載の表示装置。
上記表示情報は、上記所定のフレーズに関連したオブジェクトであって、サービス利用者またはサービス提供者の操作を受け付けるオブジェクトを示すオブジェクト情報を含み、
上記表示画像生成部は、上記オブジェクト情報を参照し、上記オブジェクトを含む表示画像を生成する、
ことを特徴とする請求項７または８に記載の表示装置。
サービス提供者向け画像を表示する第１の表示領域と、サービス利用者向け画像を表示する第２の表示領域とを有する表示装置であって、
表示すべき情報を含む表示情報を取得する取得部と、
上記取得部が取得した表示情報の示す表示画像であって、上記第１の表示領域に表示する表示画像であって、サービス提供者向けの表示態様である第１の表示態様を有する表示画像である第１の表示画像と、上記第２の表示領域に表示する表示画像であって、上記第１の表示態様とは異なる第２の表示態様を有する表示画像である第２の表示画像とを生成する表示画像生成部と、
上記表示画像生成部が生成した第１の表示画像を上記第１の表示領域に表示し、上記表示画像生成部が生成した第２の表示画像を上記第２の表示領域に表示する表示部と、
を備えていることを特徴とする表示装置。
発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、
上記発話内容情報取得部が取得した発話内容情報を表示装置に出力する発話内容情報出力部と、
上記発話内容情報が示す発話内容を出力する発話内容出力部と、
上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、
上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、
を備えていることを特徴とするサーバ。
上記発話内容情報が示す発話内容または上記翻訳内容情報が示す翻訳内容に、所定のフレーズが含まれているか否かを判定するフレーズ判定部と、
上記フレーズ判定部が、上記発話内容に上記所定のフレーズが含まれていると判定した場合、上記発話内容情報出力部は更に、上記所定のフレーズを強調表示するよう上記表示装置に対して指示し、
上記フレーズ判定部が、上記翻訳内容に上記所定のフレーズが含まれていると判定した場合、上記翻訳内容情報出力部は更に、上記所定のフレーズを強調表示するよう上記表示装置に対して指示する、
ことを特徴とする請求項１１に記載のサーバ。
発話した音声を示す音声情報を取得する音声情報取得部と、
上記音声情報取得部が取得した音声情報を参照し、当該音声情報が示す内容を発話内容として認識し、上記発話内容情報を生成する発話内容情報生成部と、をさらに備え、
上記発話内容情報出力部は、上記発話内容情報生成部が生成した発話内容情報を、上記表示装置に出力する、
ことを特徴とする請求項１１または１２に記載のサーバ。
上記発話内容情報が示す発話内容を翻訳した翻訳内容を示す翻訳内容情報を生成する翻訳内容情報生成部をさらに備え、
上記翻訳内容情報出力部は、上記翻訳内容情報生成部が生成した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する、
ことを特徴とする請求項１１〜１３の何れか１項に記載のサーバ。
サーバと表示装置とを備えるコミュニケーション支援システムであって、
上記サーバは、
発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、
上記発話内容情報取得部が取得した発話内容情報を上記表示装置に出力する発話内容情報出力部と、
上記発話内容情報が示す発話内容を出力する発話内容出力部と、
上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、
上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、を備え、
上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、
上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部と、
上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、
上記表示画像生成部が生成した表示画像を表示する表示部と、
を備えていることを特徴とするコミュニケーション支援システム。
サーバと表示装置とを備えるコミュニケーション支援システムであって、
上記サーバは、
発話した音声を示す音声情報を取得する音声情報取得部と、
上記音声情報取得部が取得した音声情報を参照し、当該音声情報が示す内容を発話内容として認識し、発話内容情報を生成する発話内容情報生成部と、
上記発話内容情報生成部が生成した発話内容情報を上記表示装置に出力する発話内容情報出力部と、
上記発話内容を翻訳した翻訳内容を示す翻訳内容情報を生成する翻訳内容情報生成部と、
上記翻訳内容情報生成部が生成した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、を備え、
上記表示装置は、サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置であって、
上記サーバから、上記発話内容情報及び上記翻訳内容情報の少なくとも何れかを取得する取得部と、
上記取得部が取得した上記発話内容情報が示す発話内容及び上記翻訳内容情報が示す翻訳内容の少なくとも何れかを含む表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、
上記表示画像生成部が生成した表示画像を表示する表示部と、
を備えていることを特徴とするコミュニケーション支援システム。
発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得工程と、
上記発話内容情報取得工程において取得された発話内容情報を表示装置に出力する発話内容情報出力工程と、
上記発話内容情報が示す発話内容を出力する発話内容出力工程と、
上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得工程と、
上記翻訳内容情報取得工程において取得された翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力工程と、
を含むことを特徴とするコミュニケーション支援方法。
サービス提供者向け画像及びサービス利用者向け画像の少なくとも何れかを表示する表示装置としてコンピュータを機能させるための制御プログラムであって、
表示すべき情報を含む表示情報を取得する取得部と、
上記取得部が取得した表示情報の示す表示画像であって、当該表示装置がサービス提供者向けであるかサービス利用者向けであるのかに応じた表示態様を有する表示画像を生成する表示画像生成部と、
としてコンピュータを機能させるための制御プログラム。
サーバとしてコンピュータを機能させるための制御プログラムであって、
発話した内容である発話内容を示す発話内容情報を取得する発話内容情報取得部と、
上記発話内容情報取得部が取得した発話内容情報を表示装置に出力する発話内容情報出力部と、
上記発話内容情報が示す発話内容を出力する発話内容出力部と、
上記発話内容の翻訳内容を示す翻訳内容情報を取得する翻訳内容情報取得部と、
上記翻訳内容情報取得部が取得した翻訳内容情報を、上記発話内容情報と関連付けて上記表示装置に出力する翻訳内容情報出力部と、
としてコンピュータを機能させるための制御プログラム。