JP2014132465A

JP2014132465A - ディスプレイ装置及びその制御方法

Info

Publication number: JP2014132465A
Application number: JP2014000948A
Authority: JP
Inventors: Tae-Hwan Cha; 泰煥車; Jie-Chol Kim; 裁徹金; Tae-Je Park; 泰濟朴; Tensei Ri; 天成李
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-01-07
Filing date: 2014-01-07
Publication date: 2014-07-17
Also published as: KR20140089862A; TW201435856A; EP2752763A3; WO2014107102A1; CN103916687A; US20140195244A1; EP2752763A2

Abstract

【課題】ユーザの音声に含まれた発話意図がコンテンツ検索またはコンテンツおすすめに関連するか否かに応じて、互いに異なるシステム応答を出力すること。
【解決手段】ディスプレイ装置が開示される。本ディスプレイ装置は、出力部と、ユーザの音声を収集する音声収集部と、ユーザの音声を第１サーバに伝送し、第１サーバからユーザの音声に対応するテキスト情報を受信する第１通信部と、受信されたテキスト情報を第２サーバに伝送する第２通信部と、テキスト情報に対応する応答情報が第２サーバから受信されると、応答情報に基づいて、ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するように出力部を制御する制御部とを含み、発話意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。
【選択図】図２

Description

本発明は、ディスプレイ装置及びその制御方法に関し、より詳細には、ユーザの音声に応じて制御されるディスプレイ装置及びその制御方法に関する。

電子技術の発達により、多様な種類のディスプレイ装置が開発及び普及され、ユーザの要求に応じて次第に多様な機能を備えるようになった。特に、テレビの場合、最近では、インターネットと接続されてインターネットサービスまでサポートし、ユーザはテレビを通じて多くのデジタル放送チャネルまで視聴できるようになった。

一方、最近はディスプレイ装置をより便利かつ直観的に制御するために、音声認識を用いた技術が開発されている。特に、テレビの場合、ユーザの音声を認識し、音量調節またはチャネル変更のように、ユーザの音声に対応する機能を行うことができるようになった。

しかし、従来のユーザの音声を認識するディスプレイ装置は、認識された音声に対応する機能を提供するだけで、ユーザとの対話を通じてインタラクティブな情報を提供することができないことにおいて限界が存在していた。

米国特開第２０１１−００６０５９２号公報

そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、ユーザの音声に含まれた発話意図がコンテンツ検索またはコンテンツおすすめに関連するか否かに応じて、互いに異なるシステム応答を出力できるディスプレイ装置及びその制御方法を提供することにある。

以上のような目的を達成するための本発明の一実施形態に係るディスプレイ装置は、出力部と、ユーザの音声を収集する音声収集部と、前記ユーザの音声を第１サーバに伝送し、前記第１サーバから前記ユーザの音声に対応するテキスト情報を受信する第１通信部と、前記受信されたテキスト情報を第２サーバに伝送する第２通信部と、前記テキスト情報に対応する応答情報が前記第２サーバから受信されると、前記応答情報に基づいて、前記ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するように前記出力部を制御する制御部とを含み、前記発話意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。

ここで、第２サーバは、前記テキスト情報にコンテンツを検索しようとする意図を有するキーワード、または、前記テキスト情報にコンテンツのおすすめを受けようとする意図を有するキーワードが存在するか否かに応じて、互いに異なる応答情報を生成して前記ディスプレイ装置に伝送してよい。

なお、前記制御部は、前記発話意図が前記コンテンツの検索に関連する場合、前記発話意図に応じて検索されたコンテンツに対する検索リストを前記システム応答として出力してよい。

そして、前記制御部は、前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力してよい。

なお、前記制御部は、前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、ユーザの選好度情報を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力してよい。

一方、本発明の一実施形態に係るディスプレイ装置の制御方法は、ユーザの音声を収集するステップと、前記ユーザの音声を第１サーバに伝送し、前記第１サーバから前記ユーザの音声に対応するテキスト情報を受信するステップと、前記受信されたテキスト情報を第２サーバに伝送するステップと、前記テキスト情報に対応する応答情報が前記第２サーバから受信されると、前記応答情報に基づいて、前記ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するステップとを含み、前記発話意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。

なお、前記出力するステップは、前記発話意図が前記コンテンツの検索に関連する場合、前記発話意図に応じて検索されたコンテンツに対する検索リストを前記システム応答として出力してよい。

そして、前記出力するステップは、前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力してよい。

なお、前記出力するステップは、前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、ユーザの選好度情報を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力してよい。

以上説明したように、本発明によれば、ディスプレイ装置は発話意図により合致するシステム応答を出力することができ、ユーザの便宜性は増大し、ユーザは対話を通じてよりインタラクティブな情報の提供を受けることができるようになる。

本発明の一実施形態に係る対話型システムを説明するための図である。本発明の一実施形態に係るディスプレイ装置に対するブロック図である。図２に示すディスプレイ装置の細部構成を説明するためのブロック図である。図１に示す第１サーバに対するブロック図である。図１に示す第２サーバに対するブロック図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るＵＩ画面をディスプレイする方法を説明するための図である。本発明の一実施形態に係るディスプレイ装置の制御方法を説明するためのフローチャートである。

以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。

図１は、本発明の一実施形態に係る対話型システムを説明するための図である。図１に示すように、対話型システム１０００は、ディスプレイ装置１００と、第１サーバ２００及び第２サーバ３００を含む。

ディスプレイ装置１００は、ディスプレイ装置１００を制御するためのリモコン（図示せず）によって制御されてよい。具体的に、ディスプレイ装置１００は、リモコン（図示せず）から受信されたリモコン制御信号に対応する動作を行うことができる。例えば、ディスプレイ装置１００が、図１のようなテレビで実現された場合、ディスプレイ装置１００は、受信されたリモコン制御信号に応じて、電源オン／オフ、チャネル変更、音量変更等の動作を行うことができる。

なお、ディスプレイ装置１００は、ユーザの音声に応じて多様な動作を行うことができる。

具体的に、ディスプレイ装置１００は、ユーザの音声に対応する機能を行うか、ユーザの音声に対応するシステム応答を出力することができる。

そのために、ディスプレイ装置１００は、収集されたユーザの音声を第１サーバ２００に伝送する。第１サーバ２００は、ディスプレイ装置１００からユーザの音声が受信されると、受信されたユーザの音声をテキスト情報（または、テキスト）に変換し、テキスト情報をディスプレイ装置１００に伝送する。

そして、ディスプレイ装置１００は、第１サーバ２００から受信されたテキスト情報を第２サーバ３００に伝送する。第２サーバ３００は、ディスプレイ装置１００からテキスト情報が受信されると、受信されたテキスト情報に対応する応答情報を生成してディスプレイ装置１００に伝送する。

ディスプレイ装置１００は、第２サーバ３００から受信された応答情報に基づいて、多様な動作を行うことができる。

ここで、応答情報は、ディスプレイ装置１００が特定機能を行うための制御命令、ディスプレイ装置１００でシステム応答を出力するための制御命令、及び、ディスプレイ装置１００から出力されるシステム応答に関する多様な情報のうち、少なくとも一つを含んでよい。

具体的に、ディスプレイ装置１００は、ユーザの音声に対応する機能を行うことができる。すなわち、ディスプレイ装置１００は、ディスプレイ装置１００から提供可能な機能のうち、ユーザの音声に対応する機能を行うことができる。例えば、ディスプレイ装置１００は、“○番（チャネル番号）を点けて”というユーザの音声が入力されると、第２サーバ３００から受信された制御命令に基づいて、チャネルを○番に変更することができる。そのために、第２サーバ３００は、ディスプレイ装置１００のチャネルを○番に変更するための制御命令をディスプレイ装置１００に伝送することができる。

この場合、ディスプレイ装置１００は、当該機能に対応するシステム応答を同時に提供することもできる。すなわち、ディスプレイ装置１００は、ユーザの音声に応じて行われた機能に関する情報を音声及びＵＩ画面（テキストやイメージ等）のうち、少なくとも一方の形態で出力することができる。上述の例の場合、ディスプレイ装置１００は、変更されたチャネルに関する情報またはチャネル変更が完了していることを示すメッセージを、音声及びＵＩ画面のうち、少なくとも一方の形態で出力することができる。

なお、ディスプレイ装置１００は、ユーザの音声に対応するシステム応答を出力することができる。ここで、システム応答は、音声及びＵＩ画面のうち、少なくとも一方の形態で出力されてよい。例えば、ディスプレイ装置１００は、特定番組の放送時間を問い合わせるユーザの音声が入力されると、当該番組の放送時間を音声及びＵＩ画面のうち、少なくとも一方で出力することができる。

特に、ディスプレイ装置１００は、ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力することができる。ここで、ユーザの意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。

具体的に、ディスプレイ装置１００は、発話意図がコンテンツの検索に関連する場合、発話意図に応じて検索されたコンテンツに対する検索リストをシステム応答として出力することができる。例えば、“○○○（出演者の氏名）が出演する番組番組を検索して”というユーザの音声が収集された場合、ディスプレイ装置１００は、○○○（出演者の氏名）が出演する放送番組に対するリストをシステム応答として出力することができる。

一方、ディスプレイ装置１００は、発話意図がコンテンツのおすすめに関連する場合、発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。

例えば、“○○○（出演者の氏名）が出演する番組番組をおすすめして”というユーザの音声が収集された場合、ディスプレイ装置１００は、○○○（出演者の氏名）が出演する放送番組が視聴率の高い順に並べられたリストを出力することができる。

なお、ディスプレイ装置１００は、発話意図がコンテンツのおすすめに関連する場合、発話意図に応じて検索されたコンテンツのうち、ユーザ選好度情報を基に選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。

例えば、“○○○（出演者の氏名）が出演する番組番組をおすすめして”というユーザの音声が収集された場合、ディスプレイ装置１００は、○○○（出演者の氏名）が出演する放送番組のうち、ユーザが最近視聴したチャネルから提供される放送番組に対するリストを出力したり、○○○（出演者の氏名）が出演する放送番組のうち、ユーザが視聴した頻度数の高い放送番組と同一ジャンルの放送番組に対するリストを出力することができる。

そのために、第２サーバ３００は、ディスプレイ装置１００からシステム応答を出力するための制御命令及びディスプレイ装置１００から出力されるシステム応答に関する多様な情報のうち、少なくとも一つをディスプレイ装置１００に伝送することができる。

このように、ディスプレイ装置１００は、ユーザの音声に含まれた発話意図がコンテンツを検索するためのものか、または、コンテンツのおすすめを受けるためのものかに応じて、互いに異なる形態のシステム応答を出力することができる。それにより、ユーザは、自分の意図に合ったシステム応答の提供を受けることができるようになり、便宜性が向上する。

一方、図１において、ディスプレイ装置１００はテレビであるとして示しているが、それは一例に過ぎない。すなわち、ディスプレイ装置１００はテレビだけでなく、スマートフォンのような携帯電話、デスクトップパソコン、ノートパソコン、ナビゲーション等のような多様な電子装置で実現されてよい。

なお、図１において、第１サーバ２００及び第２サーバ３００が別途のサーバで実現されたものとして示しているが、それも一例に過ぎない。すなわち、第１サーバ２００と第２サーバ３００とを含む一つの対話型サーバで実現されてよい。

図２は、本発明の一実施形態に係るディスプレイ装置に対するブロック図である。図２に示すように、ディスプレイ装置１００は、出力部１１０と、音声収集部１２０と、第１通信部１３０と、第２通信部１４０及び制御部１５０を含む。

出力部１１０は、音声及び映像のうち少なくとも一方を出力する。具体的に、出力部１１０は、音声収集部１２０を介して収集されたユーザの音声に対応するシステム応答を音声及びグラフィックＵＩのうち、少なくとも一方を形態で出力してよい。

そのために、出力部１１０は、ディスプレイ部（図示せず）及びオーディオ出力部（図示せず）を備えてよい。

具体的に、ディスプレイ部（図示せず）は、液晶表示装置（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ：ＬＣＤ）、有機電気発光ダイオード（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｓｐｌａｙ：ＯＬＥＤ）またはプラズマ表示パネル（ＰｌａｓｍａＤｉｓｐｌａｙＰａｎｅｌ：ＰＤＰ）等で実現されてよい。ディスプレイ部（図示せず）は、ディスプレイ装置１００を介して提供可能な多様なディスプレイ画面を提供することができる。特に、ディスプレイ部（図示せず）は、ユーザの音声に対応するシステム応答を、テキスト、イメージ、アイコン、ＧＵＩのうち、少なくとも一つを含むＵＩ画面を構成してディスプレイすることができる。

一方、オーディオ出力部（図示せず）は、ジャック等のような出力ポートまたはスピーカ等で実現され、ユーザの音声に対応するシステム応答を音声形態で出力することができる。

なお、出力部１１０は、多様なコンテンツを出力することができる。ここで、コンテンツは、放送コンテンツ、ＶＯＤコンテンツ、ＤＶＤコンテンツ等を含んでよい。例えば、ディスプレイ部（図示せず）は、コンテンツを構成する映像を出力し、オーディオ出力部（図示せず）は、コンテンツを構成するオーディオを出力することができる。

音声収集部１２０は、ユーザの音声を収集する。例えば、音声収集部１２０は、ユーザの音声を収集するためのマイクで実現され、ディスプレイ装置１００に内蔵されて一体型をなすか、ディスプレイ装置１００と分離された形態で実現されてよい。分離された形態で実現される場合、音声収集部１２０は、ユーザが手で握る形態、または食卓やテーブルに置かれる形態で実現されてよく、ディスプレイ装置１００と有線または無線ネットワークを通じて接続され、収集されたユーザの音声をディスプレイ装置１００に伝送することができる。

一方、音声収集部１２０は、収集された音声がユーザの音声かを判断し、ユーザの音声からノイズ（例えば、エアコンの音や掃除機の音、音楽の音等）をフィルタリングすることもできる。

例えば、音声収集部１２０は、アナログ形態のユーザ音声が入力されると、それをサンプリングしてデジタル信号に変換する。そして、音声収集部１２０は、変換されたデジタル信号のエネルギーを計算し、デジタル信号のエネルギーが予め設定された値以上であるか否かを判断する。

デジタル信号のエネルギーが予め設定された値以上である場合、音声収集部１２０はデジタル信号からノイズ成分を除去し、第１通信部１３０に伝達する。このとき、ノイズ成分は、家庭環境で発生し得る突発性雑音として、エアコンの音や掃除機の音、音楽の音等が含まれてよい。一方、デジタル信号のエネルギーが予め設定された値未満である場合、音声収集部１２０はデジタル信号に特別な処理過程を施さずに、別の入力を待つ。

それにより、ユーザの音声ではない別の音によって全オーディオ処理過程が活性化しないため、不要な電力消耗を防止することができる。

第１通信部１３０は、第１サーバ（図１の２００）と通信を行う。具体的に、第１通信部１３０は、ユーザの音声を第１サーバ２００に伝送し、ユーザの音声に対応するテキスト情報を第１サーバ２００から受信してよい。

第２通信部１４０は、第２サーバ（図１の３００）と通信を行う。具体的に、第２通信部１４０は、受信されたテキスト情報を第２サーバ３００に伝送し、テキスト情報に対応する応答情報を第２サーバ３００から受信してよい。

そのために、第１通信部１３０及び第２通信部１４０は、多様な通信方式を用いて第１サーバ２００及び第２サーバ３００と通信を行うことができる。

例えば、第１通信部１３０及び第２通信部１４０は、有／無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ、イーサネット（登録商標）、ブルートゥース（Ｂｌｕｅｔｏｏｔｈ（登録商標））、Ｚｉｇｂｅｅ（登録商標）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、ＩＥＥＥ１３９４、Ｗｉ−Ｆｉ等を用いて、第１サーバ２００及び第２サーバ３００と通信を行うことができる。そのために、第１通信部１３０及び第２通信部１４０は、各通信方式に対応するチップまたは入力ポート等を具備することができる。例えば、有線ＬＡＮ方式で通信を行う場合、第１通信部１３０及び第２通信部１４０は、有線ＬＡＮカード（図示せず）及び入力ポート（図示せず）を備えてよい。

一方、上述の実施形態では、ディスプレイ装置１００が第１サーバ２００及び第２サーバ３００と通信を行うために、別途の通信部１３０、１４０を備えるものとして説明したが、それは一例に過ぎない。すなわち、ディスプレイ装置１００は、一つの通信モジュールを通じて第１サーバ２００及び第２サーバ３００と通信を行うことができることは言うまでもない。

なお、上述の実施形態においては、第１通信部１３０及び第２通信部１４０は、第１サーバ２００及び第２サーバ３００と通信を行うものとして説明したが、それは一例に過ぎない。すなわち、第１通信部１３０及び第２通信部１４０は、ウェブサーバ（図示せず）に接続されてウェブブラウジングを行うこともでき、ＶＯＤサービスを提供するコンテンツプロバイダーサーバに接続され、ＶＯＤコンテンツを検索することもできる。

制御部１５０は、ディスプレイ装置１００の動作全般を制御する。すなわち、制御部１５０は、出力部１１０と、音声収集部１２０と、第１通信部１３０及び第２通信部１４０の動作を制御することができる。制御部１５０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）及びディスプレイ装置１００を制御するためのモジュール及びデータを保存するＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）を含むことができおる。

具体的に、制御部１５０は、音声収集部１２０を介してユーザの音声を収集し、収集されたユーザの音声を第１サーバ２００に伝送するように第１通信部１３０を制御することができる。そして、制御部１５０は、ユーザの音声に対応するテキスト情報が第１サーバ２００から受信されると、受信されたテキスト情報を第２サーバ３００に伝送するように第２通信部１４０を制御することができる。

一方、制御部１５０は、テキスト情報に対応する応答情報が第２サーバ３００から受信されると、受信された応答情報に基づいて多様な動作を行うことができる。

具体的に、制御部１５０は、受信された応答情報に基づいて、ユーザの音声に対応する機能を行うことができる。

ここで、応答情報は、ディスプレイ装置１００の機能を制御するための制御命令を含んでよい。具体的に、制御命令は、ディスプレイ装置１００で実行可能な機能のうち、ユーザの音声に対応する機能を実行するための命令を含んでよい。それにより、制御部１５０は、第２サーバ３００から受信された制御命令に基づいて、ユーザの音声に対応する機能が実行されるように、ディスプレイ装置１００の各構成要素を制御することができる。

例えば、テレビで実現されたディスプレイ装置１００が“○番（チャネル番号）を点けて”というユーザの音声を収集すると、第２サーバ３００は、“○番（チャネル番号）を点けて”の発話意図は、○番（チャネル番号）にチャネル変更を要求したと判断し、判断された発話意図に応じて、○番（チャネル番号）にチャネル変更を行うための制御命令をディスプレイ装置１００に伝送することができる。それにより、制御部１５０は、受信された制御命令に基づいて○番（チャネル番号）をチャネルを変更し、変更されたチャネルを通じて提供されるコンテンツを出力するように制御することができる。

ただ、それは一例に過ぎず、制御部１５０は、収集されたユーザの音声に応じて、電源オン／オフ、音量調節等、多様な動作が行われるように、ディスプレイ装置１００の各構成要素を制御することができる。

なお、制御部１５０は、受信された応答情報に基づいて、ユーザの音声に対応するシステム応答を出力するように制御することができる。

そのために、応答情報は、ディスプレイ装置１００でユーザの音声に対応するシステム応答を出力するための多様な情報を含んでよい。この場合、応答情報は、ディスプレイ装置１００でユーザの音声に対応するシステム応答を出力するための制御命令を更に含んでよい。

例えば、第２サーバ３００は、ユーザの音声に対してディスプレイ装置１００から出力されるシステム応答をテキスト形式で表現し、ディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、ＴＴＳ（ＴｅｘｔｔｏＳｐｅｅｃｈ）エンジンを用いて、テキスト形態の情報を音声に変換して出力部１１０を介して出力することができる。ここで、ＴＴＳエンジンとは、テキストを音声に変換するためのモジュールとして、制御部１５０は、従来開示されている多様なＴＴＳアルゴリズムを用いてテキスト形態の情報を音声に変換することができる。

なお、制御部１５０は、テキストが含まれるように、ＵＩ画面を構成して出力部１１０を介して出力することもできる。

例えば、テレビで実現されたディスプレイ装置１００が“○○○（放送番組名）は何時から？”というユーザの音声を収集すると、第２サーバ３００は“○○○（放送番組名）は何時から？”の発話意図は○○○（放送番組名）に対する放送時間を問い合わせるものと判断し、判断された発話意図に基づいて“お問い合わせの○○○（放送番組名）の放送時間は○時からです”をテキスト形式で表現し、ディスプレイ装置１００に伝送することができる。

この場合、制御部１５０は、テキスト形式で表現された“お問い合わせの○○○（放送番組名）の放送時間は○時からです”を音声に変換して出力部１１０を介して出力したり、“お問い合わせの○○○（放送番組名）の放送時間は○時からです”というテキストが含まれるようにＵＩ画面を構成して出力部１１０を介して出力することができる。

なお、応答情報は、制御命令に応じて実行された機能に関連するシステム応答を出力するための多様な情報を含んでよい。この場合、制御部１５０は、ディスプレイ装置１００で実行可能な機能のうち、制御命令に対応する機能を実行し、システム応答を出力するための多様な情報を用いて実行された機能に関連するシステム応答を音声及びＵＩ画面のうち、少なくとも一方の形態で出力するように制御することができる。

例えば、テレビで実現されたディスプレイ装置１００が“○番（チャネル番号）を点けて”というユーザの音声を収集すると、第２サーバ３００はディスプレイ装置１００のチャネルを○番に変更するための制御命令をディスプレイ装置１００に伝送することができる。このとき、第２サーバ３００は、“○番（チャネル番号）にチャネルを変更しました”をテキスト形態で表現し、ディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、制御命令に基づいて、出力部１１０を介して出力される放送チャネルを○番に変更することができる。そして、制御部１５０は、“○番（チャネル番号）にチャネルを変更しました”をシステム応答として、音声及びＵＩ画面のうち、少なくとも一方の形態で出力することができる。

上述のように、制御部１５０は、ユーザの音声に対応する機能を実行したり、ユーザの音声に対応するシステム応答を出力するように制御することができる。

一方、ディスプレイ装置１００で別途の機能を実行することなく、ユーザの音声に対応するシステム応答を出力する場合は、ユーザの音声がディスプレイ装置１００で実行できない機能を実行させようとする場合を更に含んでよい。

例えば、ディスプレイ装置１００がテレビ電話機能をサポートしていないテレビで実現された場合を仮定する。この場合、ディスプレイ装置１００で“ＸＸＸに電話をかけて”というユーザの音声を収集すると、第２サーバ３００は、テレビ電話の実行のための制御命令をディスプレイ装置１００に伝送することができる。しかし、ディスプレイ装置１００においては、当該制御命令に対応する機能がサポートされていないことから、制御部１５０は、第２サーバ３００から受信された制御命令を認識することができなくなる。この場合、制御部１５０は、“サポートされていない機能です”というシステム応答を出力部１１０を介して、音声及びＵＩ画面のうち少なくとも一方の形態で出力することができる。

一方、上述の実施形態においては、第２サーバ３００は、ディスプレイ装置１００でシステム応答を出力するために、テキスト形態の情報をディスプレイ装置１００に伝送するものとして説明したが、それは一例に過ぎない。

すなわち、第２サーバ３００は、ディスプレイ装置１００から出力されるシステム応答を構成する音声データそのもの、または、当該システム応答を構成する音声データの一部をディスプレイ装置１００に伝送することができる。なお、第２サーバ３００は、ディスプレイ装置１００に予め保存されたデータを用いて、システム応答を出力するための制御命令をディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、第２サーバ３００から受信される応答情報の形態を考慮し、システム応答を出力するように制御することができる。

具体的に、制御部１５０は、システム応答を構成する音声データそのもの、または、音声データの一部が受信されると、当該データを出力部１１０から出力可能な形態に処理し、音声形態で出力することができる。

一方、制御部１５０は、システム応答を出力するための制御命令が受信される場合、ディスプレイ装置１００に予め保存されたデータのうち、制御命令にマッチングするデータを検索し、検索されたデータを音声またはＵＩ画面のうち、少なくとも一方の形態に処理し、出力部１１０を介して出力することができる。そのために、ディスプレイ装置１００は、システム応答を提供するための音声及びＵＩ画面に関連するデータを保存していることができる。

例えば、ディスプレイ装置１００は、“チャネル変更が完了しました”または“サポートされていない機能です”のように、完全な文章体のデータを保存していることができる。

または、ディスプレイ装置１００は、“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”、または、“＜チャネル番号＞にチャネルを変更しました”のように、システム応答を構成する一部データを保存していることができる。この場合、システム応答を完成させるための情報は、第２サーバ３００から受信されてよい。

例えば、受信部１５０は、第２サーバ３００から受信された放送番組名またはチャネル番号等を用いて当該文章を完成した後、完成した文章を音声及びＵＩ画面のうち、少なくとも一方の形態で出力することができる。

一方、制御部１５０は、テキスト情報に対応する応答情報が、第２サーバ３００から受信されると、応答情報に基づいてユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するように出力部１１０を制御することができる。ここで、ユーザの意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。

具体的に、制御部１５０は、ユーザの発話意図がコンテンツの検索に関連する場合、発話意図に応じて検索されたコンテンツに対する検索リストをシステム応答として出力することができる。

そのために、応答情報は、検索されたコンテンツに関する情報を含んでよい。

例えば、第２サーバ３００は、ユーザの発話意図がコンテンツの検索に関連すると判断された場合、発話意図に合致するコンテンツを検索することができる。すなわち、第２サーバ３００は、ＥＰＧ（ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）情報、ＶＯＤ（ＶｉｄｅｏｏｎＤｅｍａｎｄ）サービスで発話意図に合致するコンテンツを検索したり、ディスプレイ装置１００に接続された外部装置１００に保存されたコンテンツのうち、発話意図に合致するコンテンツを検索することができる。

そして、第２サーバ３００は、検索されたコンテンツに関する情報をディスプレイ装置１００に伝送することができる。ここで、検索されたコンテンツに関する情報は、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つを含んでよい。

この場合、第２サーバ３００は、検索されたコンテンツに関する情報を用いて、コンテンツに対する検索リストを出力するための制御命令をディスプレイ装置１００に追加して伝送することもできる。

それにより、制御部１５０は、受信されたコンテンツに関する情報を用いて、コンテンツに対する検索リストを生成し、コンテンツに対する検索リストをＵＩ画面で構成して出力することができる。

別の例として、応答情報は、特定コンテンツを検索し、検索されたコンテンツに対するリストを出力するための制御命令を含むことができる。

例えば、第２サーバ３００は、ユーザの発話意図がコンテンツの検索に関連すると判断された場合、発話意図に合致するコンテンツを検索することができる。この場合にも、第２サーバ３００は、ＥＰＧ（ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）情報、ＶＯＤ（ＶｉｄｅｏｏｎＤｅｍａｎｄ）サービスで発話意図に合致するコンテンツを検索したり、ディスプレイ装置１００に接続された外部装置１００に保存されたコンテンツのうち、発話意図に合致するコンテンツを検索することができる。

そして、第２サーバ３００は、検索されたコンテンツと同一のタイトルを有するか、検索されたコンテンツと同一のチャネルで同一の放送時間に放送されるコンテンツを検索して出力するための制御命令を生成してディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、ＥＰＧ情報から制御命令に対応するコンテンツを検索したり、ＶＯＤサービスで制御命令に対応するコンテンツを検索することができる。そのために、制御部１５０は、コンテンツプロバイダーサーバから提供するＶＯＤコンテンツに対するリスト及び各種情報（仮に、ＶＯＤコンテンツに対するタイトル、サムネール、ジャンル、出演者、制作者等）を受信することができる。なお、制御部１５０は、ディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、制御命令に対応するコンテンツを検索することができる。

そして、制御部１５０は、検索されたコンテンツに対する検索リストを生成し、検索リストをＵＩ画面で構成して出力することができる。

上記のような実施形態において、制御部１５０は、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つが含まれるように検索リストを構成することができる。なお、制御部１５０は、検索されたコンテンツが放送時間順に並べられるように検索リストを生成することもできる。

一方、制御部１５０は、発話意図がコンテンツのおすすめに関連する場合、発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。

そのために、応答情報は、発話意図に応じて検索されたコンテンツに関する情報及び検索されたコンテンツに関する視聴率情報を含んでよい。

例えば、第２サーバ３００は、ユーザの発話意図がコンテンツのおすすめに関連すると判断された場合、発話意図に合致するコンテンツを検索することができる。この場合にも、第２サーバ３００は、ＥＰＧ情報、ＶＯＤサービスで発話意図に合致するコンテンツを検索したり、ディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、発話意図に合致するコンテンツを検索することができる。そして、第２サーバ３００は、検索されたコンテンツい対する情報、仮に、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つをディスプレイ装置１００に伝送することができる。なお、第２サーバ３００は、検索されたコンテンツに関する視聴率情報をウェブ検索等を通じて獲得し、獲得した視聴率情報をディスプレイ装置１００に伝送することができる。

この場合、第２サーバ３００は、検索されたコンテンツに関する情報及び検索されたコンテンツに関する視聴率情報を用いて、おすすめリストを生成して出力するための制御命令をディスプレイ装置１００に追加して伝送することもできる。

それにより、制御部１５０は、受信されたコンテンツに関する情報及び視聴率情報を用いて、コンテンツに対するおすすめリストを生成し、コンテンツに対するおすすめリストをＵＩ画面で構成して出力することができる。

具体的に、制御部１５０は、視聴率情報に基づいて検索されてコンテンツのうち、視聴率の高い順にコンテンツを並べておすすめリストを生成することができる。なお、制御部１５０は、視聴率情報に基づいて検索されたコンテンツのうち、視聴率の高い順に予め設定された数のコンテンツを選別し、選別されたコンテンツのみが含まれるように、おすすめリストを生成することもできる。

この場合、制御部１５０は、検索されたコンテンツに関連する多様な情報をおすすめリストに付加することができる。例えば、制御部１５０は、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つが含まれるようにおすすめリストを構成することができる。

一方、上述の例において、第２サーバ３００が視聴率情報を検索してディスプレイ装置１００に伝送するものとして説明したが、それは一例に過ぎない。すなわち、第２サーバ３００は、視聴率情報をディスプレイ装置１００に伝送しなくてよい。

この場合、ディスプレイ装置１００は、視聴率情報を予め保存しているか、ウェブ検索を通じて視聴率情報を獲得することができる。

具体的に、制御部１５０は、第２サーバ３００から受信されたコンテンツに関する情報からキーワードを抽出し、抽出されたキーワードを用いて視聴率情報を獲得するためのウェブ検索を行うことができる。例えば、制御部１５０は、検索されたコンテンツのタイトル、放送時間、チャネル名等をキーワードとして抽出し、抽出されたキーワードをウェブサーバ（図示せず）に伝送し、コンテンツに関する視聴率情報をウェブサーバ（図示せず）から受信することができる。

一方、上述の例においては、第２サーバ３００が発話意図に応じて検索されたコンテンツに関する情報をディスプレイ装置１００に伝送するものとして説明したが、それは一例に過ぎない。すなわち、第２サーバ３００は、特定コンテンツを検索し、検索されたコンテンツを視聴率情報を基に出力するための制御命令をディスプレイ装置１００に伝送することもできる。

例えば、第２サーバ３００は、発話意図に応じて検索されたコンテンツのタイトルと同一のタイトルを有するコンテンツを検索し、検索されたコンテンツを視聴率の高い順に出力するための制御命令でディスプレイ装置１００に伝送することができる。この場合、制御部１５０は、ＥＰＧ情報等を通じてコンテンツを検索し、検索されたコンテンツが視聴率の高い順に並べられたおすすめリストを生成して出力することもできる。

なお、制御部１５０は、ユーザの発話意図がコンテンツのおすすめに関連する場合、ユーザの発話意図に応じて検索されたコンテンツのうち、ユーザの選好度情報を基に選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。ここで、ユーザ選好度情報は、ユーザがコンテンツを視聴した頻度数の高いコンテンツのジャンル及び最近視聴したチャネルに関する情報のうち、少なくとも一方を含んでよい。

そのために、応答情報は、発話意図に応じて検索されたコンテンツに関する情報及びユーザの選好度情報を含んでよい。

例えば、第２サーバ３００は、ユーザの発話意図がコンテンツのおすすめに関連すると判断された場合、発話意図に合致するコンテンツを検索することができる。この場合にも、第２サーバ３００は、ＥＰＧ情報またはＶＯＤサービスで発話意図に合致するコンテンツを検索したり、ディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、発話意図に合致するコンテンツを検索することができる。

そして、第２サーバ３００は、検索されたコンテンツに関する情報、例えば、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つをディスプレイ装置１００に伝送することができる。

なお、第２サーバ３００は、ユーザの選好度情報をディスプレイ装置１００に伝送することができる。具体的に、第２サーバ３００は、ユーザアカウント別にユーザが視聴したコンテンツに関する情報を保存し、ディスプレイ装置１００から受信されたユーザアカウント情報（仮に、ＩＤ及びパスワード）に対応するユーザ選好度情報をディスプレイ装置１００に伝送することができる。

そのために、制御部１５０は、ユーザアカウント情報及びユーザ選好情報を第２サーバ３００に伝送するように制御することができる。

例えば、制御部１５０は、予め設定されたイベントが発生すると、ユーザアカウント情報を受信するためのＵＩ画面を出力するように出力部１１０を制御し、ＵＩ画面を通じて入力されたユーザアカウント情報を第２サーバ３００に伝送するように第２通信部１４０を制御することができる。ここで、予め設定されたイベントは、電源オンまたはユーザアカウントを入力するための別途のユーザ命令が入力された場合を含んでよい。

そして、制御部１５０は、ユーザアカウント情報が入力された状態で、ユーザの視聴するコンテンツに関する多様な情報を第２サーバ３００に伝送するように第２通信部１４０を制御することができる。

例えば、制御部１５０は、電源オン及びチャネル変更命令が入力される度に、ＥＰＧ情報に基づいて選局されたチャネルから提供されるコンテンツを判断し、電源オン及びチャネル変更命令が入力された時間、判断されたコンテンツのタイトル、ジャンル、当該コンテンツを提供するチャネル番号、チャネル名、出演者、制作者のうち、少なくとも一つに関する情報を第２サーバ３００に伝送することができる。なお、制御部１５０は、入力端子変更命令が入力される度に、選択された入力端子から受信されるコンテンツを判断し、入力端子変更命令が入力される時間、判断されたコンテンツのタイトル、ジャンル、出演者、制作者のうち、少なくとも一つに関する情報を第２サーバ３００に伝送することができる。

それにより、第２サーバ３００は、ディスプレイ装置１００から受信された情報を用いて、ユーザアカウント情報別にユーザ選好度情報を保存することができる。特に、第２サーバ３００は、受信された情報を用いて、ユーザが予め設定された回数以上視聴したコンテンツを視聴頻度数の高いコンテンツと判断し、ユーザが予め設定された時間内に視聴したチャネルをユーザが最近視聴したチャネルと判断し、ユーザ選好度情報を保存することができる。そして、第２サーバ３００は、ディスプレイ装置１００からユーザアカウント情報が受信されると、ユーザアカウント情報に対応するユーザ選好度情報をディスプレイ装置１００に伝送することができる。

一方、第２サーバ３００は、検索されたコンテンツに関する情報及びユーザ選好度情報を用いて、おすすめリストを生成して出力するための制御命令をディスプレイ装置１００に追加して伝送することもできる。

それにより、制御部１５０は、受信されたコンテンツに関する情報及びユーザの選好度情報を用いてコンテンツに対するおすすめリストを生成し、コンテンツに対するおすすめリストをＵＩ画面で構成して出力することができる。

ここで、ユーザ選好度情報は、ユーザがコンテンツを視聴した頻度数の高いコンテンツのジャンル及び最近視聴したチャネルに関する情報を含んでよい。

それにより、制御部１５０は、検索されたコンテンツのうち、ユーザが視聴した頻度数の高いコンテンツと同一のジャンルを有するコンテンツが含まれるようにおすすめリストを生成することができる。なお、制御部１５０は、検索されたコンテンツのうち、ユーザが最近視聴したチャネルから提供されるコンテンツが含まれるように、おすすめリストを生成することができる。

一方、上述の例において、第２サーバ３００がユーザ選好度情報をディスプレイ装置１００に伝送するものとして説明したが、それは一例に過ぎない。すなわち、第２サーバ３００は、ユーザ選好度情報をディスプレイ装置１００に伝送しなくてよい。

この場合、ディスプレイ装置１００は、ユーザアカウント情報別にユーザ選好度情報を予め保存していてよい。

すなわち、制御部１５０は、ユーザアカウント情報が入力されると、入力されたアカウント情報に対応するユーザ選好度情報を判断し、判断されたユーザ選好度情報及び第２サーバ３００から受信されたコンテンツに関する情報を用いて、おすすめリストを生成することができる。

一方、上述の例においては、第２サーバ３００が発話意図に応じて検索されたコンテンツに関する情報をディスプレイ装置１００に伝送するものとして説明したが、しれは一例に過ぎない。すなわち、第２サーバ３００は、特定コンテンツを検索し、検索されたコンテンツをユーザ選好度情報を基に出力するための制御命令をディスプレイ装置１００に伝送することもできる。

例えば、第２サーバ３００は、発話意図に応じて検索されたコンテンツのタイトルと同一のタイトルを有するコンテンツを検索し、検索されたコンテンツをユーザ選好度情報を考慮して出力するための制御命令をディスプレイ装置１００に伝送することができる。この場合、制御部１５０は、ＥＰＧ情報等を通じてコンテンツを検索し、検索されたコンテンツのうち、視聴した頻度数の高いコンテンツと同一のジャンルを有するコンテンツまたはユーザが最近視聴したチャネルから提供されるコンテンツが含まれるようにおすすめリストを生成することもできる。

図３は、図２に示すディスプレイ装置の細部構成を説明するためのブロック図である。図３に示すように、ディスプレイ装置１００は、図２に示す構成要素の他に、保存部１６０と、受信部１７０と、信号処理部１８０と、リモコン信号受信部１９１、入力部１９３及びインターフェース部１９５を更に含んでよい。これらの構成要素は、制御部１５０によって制御されてよい。一方、図３に示す構成要素のうち、図２に示す構成要素と重複する構成要素は、その機能が同一であるため、詳細な説明は省略する。

保存部１６０は、ディスプレイ装置１００を動作させるために必要な各種プログラム等が保存される保存媒体として、メモリやＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等で実現可能である。例えば、保存部１６０は、制御部１５０の動作実行のためのプログラムを保存するためのＲＯＭ、制御部１５０の動作実行によるデータを一時的に保存するためのＲＡＭ等を備えてよい。なお、各種参照データを保存するためのＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅａｎｄＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）等を更に備えてよい。

特に、保存部１６０は、ユーザアカウント情報別にユーザ選好度情報を保存することができる。ここで、ユーザ選好度情報は、ユーザがコンテンツを視聴した頻度数の高いコンテンツのジャンル及び最近視聴したチャネルに関する情報を含んでよい。

例えば、制御部１５０は、電源オン及びチャネル変更命令が入力される度に、ＥＰＧ情報に基づいて受信部１７０を介して選局されたチャネルから提供されるコンテンツを判断し、電源オン及びチャネル変更命令が入力された時間、判断されたコンテンツのタイトル、ジャンル、当該コンテンツを提供するチャネル番号、チャネル名のうち、少なくとも一つに関する情報を保存部１６０に保存することができる。なお、制御部１５０は、入力端子変更命令が入力される度に、インターフェース部１９５を介して選択された入力端子から受信されるコンテンツを判断し、入力端子変更命令が入力される時間、判断されたコンテンツのタイトル、ジャンル、当該コンテンツを提供するチャネル番号、チャネル名のうち、少なくとも一つに関する情報を保存部１６０に保存することができる。

なお、保存部１６０は、視聴率情報を保存することができる。例えば、制御部１５０は、ウェブ検索を通じてコンテンツに関する視聴率情報を検索し、検索された視聴率情報を保存部１６０に保存することができる。

受信部１７０は、多様なコンテンツを受信する。具体的に、受信部１７０は、放送ネットワークを用いて放送番組を伝送する放送局またはインターネットを用いて、コンテンツファイルを伝送するウェブサーバからコンテンツを受信することができる。

放送局からコンテンツを受信する実施形態の場合には、受信部１７０は、チューナ（図示せず）、復調器（図示せず）、等化器（図示せず）等のような構成を含む形態で実現されてよい。一方、ウェブサーバのようなソースからコンテンツを受信する実施形態の場合には、受信部１７０は、ネットワークインターフェースカード（図示せず）で実現されてよい。

このように、受信部１７０は、実施形態に応じて多様な形態で実現されてよい。

信号処理部１８０は、受信部１７０またはインターフェース部１９５を介して受信されたコンテンツが、出力部１１０を介して出力できるようにコンテンツに対する信号処理を行う。

具体的に、信号処理部１８０は、コンテンツに含まれた映像に対してデコーディング、スケーリング及びフレームレート変換等の動作を行い、ディスプレイ部１１１から出力可能な形態に変換することができる。なお、信号処理部１８０は、コンテンツに含まれたオーディオ信号に対してデコーディング等の信号処理を行ってオーディオ出力部１１２から出力可能な形態に変換することができる。

リモコン信号受信部１９１は、外部のリモコンから入力されるリモコン制御信号を受信する。制御部１５０は、リモコン信号受信部１９１に入力されたリモコン制御信号に基づいて、多様な動作を実行することができる。例えば、制御部１５０は、リモコン信号受信部１９１から入力された制御信号に応じて、電源オン／オフ、チャネル変更、音量調節等の動作を実行することができる。

入力部１９３は、多様なユーザ操作を受信する。制御部１５０は、入力部１９３から入力されたユーザ命令に対応する動作を実行することができる。例えば、制御部１５０は、入力部１９３で入力されたユーザ命令に応じて、電源オン／オフ、チャネル変更、音量調節等の動作を実行することができる。

そのために、入力部１９３は、入力パネルで実現されてよい。入力パネルは、タッチパッド（ＴｏｕｃｈＰａｄ）或いは各種機能キーや数字キー、特殊キー、文字キー等を備えたキーパッド（ＫｅｙＰａｄ）またはタッチスクリーン（ＴｏｕｃｈＳｃｒｅｅｎ）方式で行われてよい。

インターフェース部１９５は、外部装置（図示せず）と通信を行う。ここで、外部機器（図示せず）は、多様な電子装置で実現され、ディスプレイ装置１００にコンテンツを伝送することができる。

仮に、ディスプレイ装置１００がテレビで実現された場合、外部装置（図示せず）は、セットトップボックス、音響機器、ゲーム機、ＤＶＤプレーヤ、ブルーレイディスクプレーヤ等のように、ディスプレイ装置１００に接続されて機能を実行できる多様な電子装置で実現されてよい。

例えば、インターフェース部１９５は、ＨＤＭＩ（登録商標）やＵＳＢ等の各種の有線通信方式、ブルートゥース、Ｚｉｇｂｅｅ等の無線通信方式によって外部機器（図示せず）と通信を行うことができる。そのために、インターフェース部１９５は、各通信方式に対応するチップまたは入力ポート等を備えてよい。例えば、ＨＤＭＩ（登録商標）通信方式によって外部機器（図示せず）と通信を行う場合、インターフェース部１９５はＨＤＭＩ（登録商標）ポートを備えてよい。

一方、制御部１５０は、インターフェース部１９５に外部装置（図示せず）が接続されたものと判断される場合、外部装置（図示せず）に保存されたコンテンツに対するリストの伝送を要求し、コンテンツに対するリスト及び各種情報を外部装置（図示せず）から受信するように制御することができる。この場合、制御部１５０は、コンテンツに対するリスト及び各種情報を第２サーバ３００に伝送するように第２通信部１４０を制御することができる。

図４は、図１に示す第１サーバに対するブロック図である。図４に示すように、第１サーバ２００は、通信部２１０及び制御部２２０を含む。

通信部２１０は、ディスプレイ装置１００と通信を行う。具体的に、通信部２１０は、ディスプレイ装置１００からユーザの音声を受信し、ユーザの音声に対応するテキスト情報をディスプレイ装置１００に伝送することができる。そのために、通信部２１０は、多様な通信モジュールを含んでよい。

制御部２２０は、第１サーバ２００の動作全般を制御する。特に、制御部２２０は、ディスプレイ装置１００からユーザの音声が受信されると、ユーザの音声に対応するテキスト情報を生成し、それをディスプレイ装置１００に伝送するように通信部２１０を制御する。

具体的に、制御部２２０は、ＳＴＴ（ＳｐｅｅｃｈＴｏＴｅｘｔ）エンジンを用いて、ユーザの音声に対応するテキスト情報を生成することができる。ここで、ＳＴＴエンジンとは、音声信号をテキストに変換するためのモジュールとして、従来開示されている多様なＳＴＴアルゴリズムを用いて音声信号をテキストに変換することができる。

例えば、制御部２２０は、受信されたユーザの音声内でユーザが発話した音声の開始と終了とを検出して音声区間を判断する。具体的に、制御部２２０は、受信された音声信号のエネルギーを計算し、計算されたエネルギーに応じて音声信号のエネルギーレベルを分類して、動的プログラミングを通じて音声区間を検出することができる。そして、制御部２２０は、検出された音声区間内において、音響モデル（ＡｃｏｕｓｔｉｃＭｏｄｅｌ）に基づいて、音声の最小単位である音素を検出して音素データを生成し、生成された音素データにＨＭＭ（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）確率モデルを適用して、ユーザの音声をテキストに変換することができる。

図５は、図１に示す第２サーバに対するブロック図である。図５に示すように、第２サーバ３００は、通信部３１０と、保存部３２０及び制御部３３０を含む。

通信部３１０は、ディスプレイ装置１００と通信を行う。具体的に、通信部３１０は、ディスプレイ装置１００からテキスト情報を受信し、テキスト情報に対応する応答情報をディスプレイ装置１００に伝送することができる。そのために、通信部３１０は、多様な通信モジュールを含んでよい。

なお、通信部３１０は、ウェブサーバ（図示せず）に接続され、ウェブブラウジングを行うこともできる。すなわち、制御部３３０は、多様なキーワードを通信部を３１０を介してウェブサーバ（図示せず）に伝送してウェブブラウジングを行い、ウェブ検索結果を受信することができる。

そのために、保存部３２０は、ウェブ検索に利用される多様なキーワードを予め保存しているか、制御部３３０は、ディスプレイ装置１００から受信されたテキスト情報からキーワードを抽出することもできる。

例えば、ディスプレイ装置１００から受信されたテキストが“○○○（出演者の氏名）が出演する放送番組をおすすめして”の場合を仮定する。この場合、制御部３３０は、当該テキストから“○○○（出演者の氏名）”及び“放送番組”をキーワードとして抽出し、抽出されたキーワードを通じてウェブ検索を行い、○○○（出演者の氏名）が出演する放送番組に関する視聴率情報をウェブサーバ（図示せず）から受信することができる。

保存部３２０は、ディスプレイ装置１００から受信されたテキスト情報に対応する応答情報を生成するための多様な情報を保存する。

具体的に、保存部３２０は、サービスドメイン別の対話パターンを保存する。ここで、サービスドメインは、ユーザの発話した音声が属するテーマに応じて、“放送”、“ＶＯＤ”、“アプリ管理”、“機器制御”、“情報（天気や株式、ニュース等）提供”等で区分されてよい。しかし、それは一例に過ぎず、サービスドメインは、上述のテーマの他にも、多様なテーマに応じて区分されることができることはいうまでもない。

より具体的に、保存部３２０は、各サービスドメイン別のコーパス（ｃｏｒｐｕｓ）データベースを備えてよい。ここで、コーパスデータベースとは、例文及びそれに対する回答を保存する形態で実現されてよい。

すなわち、保存部３２０は、各サービスドメイン別に複数の例文及び各例文に対する回答を保存することができる。なお、保存部３２０は、例文を解釈するための情報及び例文に対応する回答を各例文ごとにタグ付け（Ｔａｇｇｉｎｇ）して保存することができる。

例えば、放送サービスドメイン内に“○○○（放送番組名）は何時から？”という例文が保存された場合を仮定する。

この場合、保存部３２０は、“○○○（放送番組名）は何時から？”といった例文を解釈するための情報を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○○○（放送番組名）は何時から？”のような例文において、“○○○（放送番組名）”は放送番組を示し、“何時”は放送時間に関するお問い合わせを示し、“から？”は例文のタイプが疑問文であることを示す情報を当該例文にタグ付けして保存することができる。なお、保存部３２０は、“〜は何時から？”という形式を有する例文の冒頭には放送番組に関連する単語が配置されるという情報を当該例文にタグ付けして保存することができる。ここで、放送番組に関連する単語は、放送番組名、出演者、演出者等が含まれてよい。

なお、保存部３２０は、“○○○（放送番組名）は何時から？”に対する回答を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○○○（放送番組名）は何時から？”に対する回答として、“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”をタグ付けして保存することができる。

別の例として、放送サービスドメイン内に“○番（チャネル番号）を点けて”という例文が保存された場合を仮定する。

この場合、保存部３２０は、“○番（チャネル番号）を点けて”のような例文を解釈するための情報を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○番（チャネル番号）を点けて”のような例文において、“○番（チャネル番号）”はチャネル番号を示し、“点け”チャネル選局命令を示し、“て”とは例文のタイプが要求文であることを示す情報を当該例文にタグ付けして保存することができる。なお、保存部３２０は、“〜点けて”という形式を有する例文の冒頭には、放送番組に関連する単語が配置されるという情報を当該例文にタグ付けして保存することができる。ここで、放送番組に関連する単語は、チャネル番号、チャネル名、放送番組名、出演者、演出者等であってよい。

なお、保存部３２０は、“○番（チャネル番号）を点けて”に対する回答を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○番（チャネル番号）を点けて”に対する回答として、“＜チャネル番号＞にチャネルを変更しました”をタグ付けして保存することができる。

なお、保存部３２０は、ディスプレイ装置１００を制御するための制御命令を各例文にタグ付けして保存することができる。特に、保存部３２０は、ディスプレイ装置１００を制御するためのユーザの音声に対応する例文にディスプレイ装置１００を制御するための制御命令をタグ付けして保存することができる。例えば、保存部３２０は、“○番（チャネル番号）を点けて”のような例文にディスプレイ装置１００のチャネルを○番に変更するための制御命令をタグ付けして保存することができる。ここで、制御命令は、スクリプト形態のシステム命令であってよい。

このように、保存部３２０は、例文及びそれに対する回答を保存することができる。しかし、上述の例文及びそれに対する回答は一例に過ぎず、保存部３２０はサービスドメイン別に多様な例文及びそれに対する回答が保存できることは言うまでもない。

制御部３３０は、第２サーバ３００の動作全般を制御する。特に、ディスプレイ装置１００からユーザの音声に対応するテキスト情報が受信されると、制御部３３０は、受信されたテキスト情報に対応する応答情報を生成し、生成された応答情報を通信部３１０を介してディスプレイ装置１００に伝送するように制御することができる。

具体的に、制御部３３０は、テキスト情報を分析してユーザの音声に含まれた発話意図を判断し、判断された発話意図に対応する応答情報を生成してディスプレイ装置１００に伝送するように通信部３１０を制御することができる。

そのために、制御部３３０は、受信されたテキスト情報にマッチングする対話パターンが存在するコーパスデータベースを検出し、ユーザの音声が属するサービスドメインを判断することができる。

具体的に、制御部３３０は、受信されたテキスト情報を各サービスドメイン別に保存された例文と比較し、受信されたテキスト情報にマッチングする例文が属するサービスドメインをユーザの音声が属するサービスドメインとして判断することができる。

例えば、制御部３２０は、ディスプレイ装置１００から“○○○（放送番組名）は何時から？”または“○番（チャネル番号）を点けて”というテキストが受信されると、ディスプレイ装置１００で収集したユーザの音声が放送サービスドメインに属すると判断することができる。

一方、制御部３３０は、受信されたテキスト情報にマッチングする例文が存在しない場合、統計的にユーザの音声が属するドメインを判断することができる。

例えば、ディスプレイ装置１００が“○番（チャネル番号）を点けて”を収集し、収集されたユーザの音声に対するテキストを第２サーバ３００に伝送した場合を仮定する。この場合、制御部３３０は、ＨＭＭ（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）、ＣＲＦ（ＣｏｎｄｉｔｉｏｎＲａｎｄｏｍＦｉｅｌｄｓ）、ＳＶＭ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）等の分類モデルを使用してユーザの音声が“○番（チャネル番号）を点けて”と統計的に類似すると判断し、“○番（チャネル番号）を点けて”は機器制御サービスドメインに属すると判断することができる。

そして、制御部３３０は、予め保存された例文と統計的に類似すると判断されたテキスト情報を保存することもできる。この場合、制御部３３０は、テキスト情報を統計的に類似する例文が属するサービスドメインの更に別の例文として保存することができる。なお、制御部３３０は、予め保存された例文を参照して、新たに保存される例文を解釈するための情報及びそれに対応する回答を新たに保存される例文にタグ付けして保存することができる。

例えば、“○番（チャネル番号）を点けて下さい”を新たな例文として保存する場合を仮定する。

この場合、制御部３３０は、“○番（チャネル番号）を点けて”を参照して“○番（チャネル番号）を点けて下さい”のような例文を解釈するための情報を当該例文にタグ付けして保存することができる。具体的に、制御部３３０は、“○番（チャネル番号）を点けて下さい”のような例文において、“○番（チャネル番号）”はチャネル番号を示し、“点けて”とはチャネル選局命令を示し、“下さい”とは例文のタイプは要求文であることを示す情報を当該例文にタグ付けして保存することができる。なお、保存部３２０は、“〜に点けて下さい”という形式を有する例文の冒頭には、放送番組に関連する単語が配置されるという情報を当該例文にタグ付けして保存することができる。ここで、放送番組に関連する単語は、チャネル番号、チャネル名、放送番組名、出演者、演出者等であってよい。

なお、保存部３２０は、“○番（チャネル番号）を点けて下さい”に対する回答を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○番（チャネル番号）を点けて下さい”に対する回答として、“＜チャネル番号＞にチャネルを変更しました”をタグ付けして保存することができる。

なお、制御部３３０は、ディスプレイ装置１００から受信されたテキスト情報にマッチングする例文が複数個存在し、これらが互いに異なるサービスドメインに属する場合、統計的に分析してユーザの音声の属するサービスドメインとして判断することができる。

具体的に、制御部３３０は、ディスプレイ装置１００から受信されたテキスト情報を構成する単語（または、形態素）が各サービスドメイン内に存在する頻度数に基づいて各単語（または、形態素）に加重値を与えて、与えられた加重値を考慮してユーザの音声の属するサービスドメインとして判断することができる。

例えば、“○○○（放送番組名）を点けて”という例文が放送サービスドメイン及びＶＯＤサービスドメインにそれぞれ保存された状態で、“○○○（放送番組名）を点けて”のようなテキストがディスプレイ装置１００から受信された場合を仮定する。

この場合、制御部３３０は、“○○○（放送番組名）を点けて”にマッチングする例文が放送サービスドメイン及びＶＯＤサービスドメインに存在すると判断し、“○○○（放送番組名）を点けて”を構成する単語（または、形態素）である“点け”及び“て”が、各サービスドメイン内に存在する頻度数に基づいて、各サービスドメイン別に“点け”及び“て”に加重値を与えることができる。

例えば、制御部３３０は、放送サービスドメイン内に保存された全例文の中から、“点け”を含む例文の占める割合を放送サービスドメインから“点け”の加重値として算出し、放送サービスドメイン内に保存された全例文の中から“て”を含む例文の占める割合を放送サービスドメインから“て”の加重値を算出することができる。

このような方法で、制御部３３０は、ＶＯＤサービスドメイン内に保存された全例文の中から、“点け”を含む例文の占める割合をＶＯＤサービスドメインから“点け”の加重値として算出し、ＶＯＤサービスドメイン内に保存された全例文の中から“て”を含む例文の占める割合をＶＯＤサービスドメインから“て”の加重値として算出することができる。

その後、制御部３３０は、各単語に対して与えられた加重値を演算してユーザの音声の属するサービスドメインを判断することができる。上述の例において、制御部３３０は、放送サービスドメイン内において、“点け”と“て”のそれぞれに与えられた加重値を互いに乗じた結果と、ＶＯＤサービスドメイン内において、“点け”と“て”のそれぞれに与えられた加重値を互いに乗じた結果とを比較し、結果値の大きいサービスドメインにユーザの音声が属すると判断することができる。

すなわち、制御部３３０は、放送サービスドメイン内において与えられた加重値に基づいて算出された結果値が、ＶＯＤサービスドメイン内において与えられた加重値に基づいて算出された結果値より大きい場合、“○○○（放送番組名）を点けて”は、放送サービスドメインに属すると判断することができる。逆に、制御部３３０は、ＶＯＤサービスドメイン内において与えられた加重値に基づいて算出された結果値が、放送サービスドメイン内において与えられた加重値に基づいて算出された結果値より大きい場合、“○○○（放送番組名）を点けて”は、ＶＯＤサービスドメインに属すると判断することができる。

しかし、それは一例に過ぎず、制御部３３０は、多様な方式を通じて統計的にユーザの音声の属するサービスドメインを判断することができる。

一方、制御部３３０は、ユーザの音声の属するサービスドメインに基づいて、ユーザの音声から対話作用（ｄｉａｌｏｇｕｅａｃｔ）、主作用（ｍａｉｎａｃｔｉｏｎ）及び構成要素（ｃｏｍｐｏｎｅｎｔｓｌｏｔ）（または、個体名）を抽出する。

ここで、対話作用は、文章の形態に関連する分類基準として、当該文章が叙述部（Ｓｔａｔｅｍｅｎｔ）、要求文（Ｒｅｑｕｅｓｔ）または疑問文（Ｑｕｅｓｔｉｏｎ）であるかを示すものである。

主作用は、当該発話が特定ドメインで対話を通じて望む行為を示す意味的な情報である。例えば、放送サービスドメインで、主作用はテレビ電源オン／オフ、放送番組検索、放送番組時間検索、放送番組予約等を含んでよい。別の例として、機器制御ドメインで、主作用は機器電源オン／オフ、再生、一時停止等を含んでよい。

構成要素は、発話に示される特定ドメインに対する個体情報、すなわち、特定ドメインで意図する行動の意味を具体化するために与えられる情報である。例えば、放送サービスドメインにおいて、構成要素はジャンル、放送番組名、放送時間、チャネル番号、チャネル名、出演者、制作者等を含んでよく、機器制御サービスドメインにおいて構成要素は、外部機器名称、製造会社等を含んでよい。

そして、制御部３３０は、抽出された対話作用、主作用及び構成要素を用いてユーザの音声に含まれた発話意図を判断し、判断された発話意図に対応する応答情報を生成してディスプレイ装置１００に伝送することができる。

ここで、応答情報は、ディスプレイ装置１００から出力されるシステム応答がテキスト形式で表現されたものであってよい。それにより、ディスプレイ装置１００は、応答情報に基づいてユーザの音声に対応するシステム応答を出力することができる。

そのために、制御部３３０は、判断された発話意図に対する回答を保存部３２０から出力し、出力された回答をテキストに変換し、それをディスプレイ装置１００に伝送することができる。

なお、応答情報は、ユーザの音声に対応する機能を実行するための制御命令を含んでよい。ここで、制御命令は、ユーザの音声に対応する機能を行うように、ディスプレイ装置１００を制御するための制御命令を含んでよい。

そのために、制御部３３０は、判断されは発話意図に対応する制御命令を生成し、生成された制御命令をディスプレイ装置１００に伝送するように制御することができる。

以下では、制御部３３０がユーザの音声に対応する応答情報を生成するより具体的な方法を例えて説明する。

まず、制御部３３０は、ユーザの音声とマッチングする例文またはユーザの音声と統計的に類似すると判断された例文にタグ付けされた情報を用いて、ユーザの音声から対話作用、主作用及び構成要素を抽出し、ユーザの音声に対応する応答情報を生成してディスプレイ装置１００に伝送することができる。

例えば、ディスプレイ装置１００からテキスト“○○○（放送番組名）は何時から？”が受信された場合を仮定する。

この場合、制御部３３０は、受信されたテキストが放送サービスドメインに属すると判断し、放送サービスドメイン内で受信されたテキストとマッチングする例文である“○○○（放送番組名）は何時から？”にタグ付けされた情報を用いてユーザの音声から対話作用、主作用及び構成要素を抽出し、それに対する応答情報を生成することができる。

すなわち、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”には例文を解釈するための情報として、“○○○（放送番組名）”は放送番組を示し、“何時”は放送時間に関するお問い合わせを示し、“から？”は例文のタイプが疑問文であることを示す情報がタグ付けされている。

よって、制御部３３０は、これらの情報を参照してディスプレイ装置１００から受信されたテキスト“○○○（放送番組名）は何時から？”の対話作用は疑問文であり、主作用は放送時間に関するお問い合わせであり、構成要素は○○○（放送番組名）であると判断することができる。それにより、制御部３３０は、ユーザの発話意図は○○○に対する放送時間を問い合わせるものと判断することができる。

なお、制御部３３０は、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”にタグ付けされた回答を保存部３２０から検索し、タグ付けされた回答を用いてシステム応答情報を生成することができる。

すなわち、制御部３３０は、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”にタグ付けされた回答である“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”をユーザの音声に対応する回答として検索する。

この場合、制御部３３０は、検索された回答に含まれたブランクを完成し、完全なな形の文章を生成することができる。

例えば、制御部３３０は、“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”のような回答で、ブランク＜放送番組名＞は放送番組名である“○○○（放送番組名）”を載せることができる。そして、制御部３３０は、ＥＰＧ情報を通じて“○○○（放送番組名）”の放送時間を検索し、検索された放送時間を別のブランクである＜放送時間＞に載せることができる。それにより、制御部３３０は、“お問い合わせの○○○（放送番組名）の放送時間は土曜日の７時からです”という完全な形の文章をテキスト形式で表現して応答情報を生成し、生成された応答情報をディスプレイ装置１００に伝送することができる。

それにより、ディスプレイ装置１００は、第２サーバ３００から受信された応答情報に基づいて、“お問い合わせの○○○（放送番組名）の放送時間は土曜日の７時からです”を音声及びＵＩ画面のうち、少なくとも一方の形態で出力することができる。

別の例として、ディスプレイ装置１００からテキスト“○番（チャネル番号）を点けて”が受信された場合を仮定する。

この場合、制御部３３０は、受信されたテキストが放送サービスドメインに属すると判断し、放送サービスドメイン内で受信されたテキストとマッチングする例文である“○番（チャネル番号）を点けて”にタグ付けされた情報を用いて、ユーザの音声から対話作用、主作用及び構成要素を抽出し、それに対する応答情報を生成することができる。

すなわち、放送サービスドメインに保存された例文である“○番（チャネル番号）を点けて”には、例文を解釈するための情報として、“○番（チャネル番号）”はチャネル番号を示し、“点け”は放送選局命令を示し、“て”は例文のタイプが要求文であることを示す情報がタグ付けされている。よって、制御部３３０は、これらの情報を参照し、ディスプレイ装置１００から受信されたテキスト“○番（チャネル番号）を点けて”の対話作用は要求文であり、主作用は放送選局命令であり、構成要素は○番（チャネル番号）と判断することができる。それにより、制御部３３０は、ユーザの発話意図は、○番に対する放送選局を要求するものと判断することができる。

なお、制御部３３０は、放送サービスドメインに保存された例文である“○番（チャネル番号）を点けて”にタグ付けされた回答を保存部３２０から検索し、タグ付けされた回答を用いて応答情報を生成することができる。

すなわち、制御部３３０は、放送サービスドメインに保存された例文である“○番（チャネル番号）を点けて”にタグ付けされた回答である“＜チャネル番号＞にチャネルを変更しました”をユーザの音声に対応する回答として検索する。

この場合、制御部３３０は、検索された回答に含まれたブランクを完成し、完全な形の文章を生成することができる。

例えば、制御部３３０は、“＜チャネル番号＞にチャネルを変更しました”のような回答で、ブランク＜チャネル番号＞はチャネル番号である“○番（チャネル番号）”を載せることができる。それにより、制御部３３０は、“○番にチャネルを変更しました”という完全な形の文章をテキスト形式で表現して応答情報を生成し、生成された応答情報をディスプレイ装置１００に伝送することができる。

なお、制御部３３０は、放送サービスドメインに保存された例文である“○番（チャネル番号）を点けて”にタグ付けされた制御命令を保存部３２０から検索し、タグ付けされた制御命令をディスプレイ装置１００に伝送するように制御することができる。すなわち、制御部３３０は、ディスプレイ装置１００のチャネルを○番に変更するための制御命令をディスプレイ装置１００に伝送することができる。

それにより、ディスプレイ装置１００は、第２サーバ３００から受信された制御命令に基づいて○番にチャネルを変更し、“○番にチャネルを変更しました”というシステム応答を音声及びＵＩ画面のうち、少なくとも一方の形態で出力することができる。

一方、上述の例において、制御部３３０が例文にタグ付けされた制御命令に基づいてディスプレイ装置１００の機能を実行させるための制御命令を生成するものとして説明したが、それは一例に過ぎない。

すなわち、制御部３３０は、判断された発話意図に基づいて制御命令を生成し、それをディスプレイ装置１００に伝送することができる。例えば、制御部３３０は、ユーザの発話意図が○番に対する放送選局を要求したと判断された場合、○番にチャネルを変更するための制御命令を生成し、ディスプレイ装置１００に伝送することができる。

なお、上述の例において、制御部３３０は、ディスプレイ装置１００の機能を実行するための制御命令伝送時、システム応答を出力するための情報を同時に伝送するものとして説明したが、それは一例に過ぎない。すなわち、制御部３３０は、ユーザの発話意図に応じて、ディスプレイ装置１００の機能を実行するための制御命令のみをディスプレイ装置１００に伝送することもできる。

この場合、ディスプレイ装置１００は、別途のシステム応答を出力しないか、ディスプレイ装置１００内に予め保存されたデータを用いてシステム応答を出力することができる。

一方、制御部３３０は、ユーザの音声と統計的に類似するものとして、例文にタグ付けされた情報を用いて、ユーザの音声から対話作用、主作用及び構成要素を抽出し、それに対する応答情報を生成することができる。

例えば、ディスプレイ装置１００からテキスト“△△△（放送番組名）は何時から？”が受信された場合を仮定する。

この場合、制御部３３０は、テキスト“△△△（放送番組名）は何時から？”は、放送サービスドメイン内に保存された例文である“○○○（放送番組名）は何時から？”と統計的に類似すると判断することができる。それにより、制御部３３０は、放送サービスドメイン内に保存された例文である“○○○（放送番組名）は何時から？”にタグ付けされた情報を用いて、ユーザの音声から対話作用、主作用及び構成要素を抽出し、それに対する応答情報を生成することができる。

すなわち、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”には例文を解釈するための情報として、“〜は何時から？”の冒頭には、放送番組に関連する単語が配置されるという情報がタグ付けされている。よって、制御部３３０は、放送番組に関連する単語である放送番組名、出演者、演出者等のうち、“△△△（放送番組名）”がどのような意味を有する単語であるかを検索する。

そのために、保存部３２０は、各サービスドメイン別に構成要素に関する情報を保存する個体名辞書またはＴＩＭＥＸ辞書等を含んでよい。

すなわち、制御部３３０は、個体名辞書またはＴＩＭＥＸ辞書等を参照して、“△△△（放送番組名）”がどのような意味を有する単語であるかを検索し、“△△△（放送番組名）”が放送番組名を表す単語であると判断することができる。

ただ、それは一例に過ぎず、制御部３３０は、ＥＰＧ情報等を用いて、“△△△（放送番組名）”がどのような意味を有する単語であるかを検索することもでき、予め保存された例文とＣＲＦ（ＣｏｎｄｉｔｉｏｎａｌＲａｎｄｏｍＦｉｅｌｄ）を用いて、“△△△（放送番組名）”がどのような意味を有する単語であるかを検索することもできる。

それにより、制御部３３０は、ディスプレイ装置１００から受信されたテキスト“△△△（放送番組名）は何時から？”の対話作用は疑問文であり、主作用は放送時間に関するお問い合わせであり、構成要素は△△△（放送番組名）であると判断することができる。そして、制御部３３０は、ユーザの音声に含まれた発話意図は、“△△△”に対する“放送時間”を“問い合わせる”ことと判断することができる。

なお、制御部３３０は、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”にタグ付けされた回答を用いて、“△△△（放送番組名）は何時から？”に関するシステム応答情報を生成し、生成されたシステム応答情報をディスプレイ装置１００に伝送することができる。

すなわち、制御部３３０は、放送サービスドメインに保存された例文である“○○○（放送番組名）は何時から？”にタグ付けされた回答である“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”をユーザの音声に対応する回答として検索する。そして、制御部３３０は、“お問い合わせの△△△（放送番組名）の放送時間は水曜日の１１時からです”という完全な文章をテキスト形式で表現して応答情報を生成し、生成された応答情報をディスプレイ装置１００に伝送することができる。

一方、制御部３３０は、ディスプレイ装置１００からシステム応答を構成するデータを予め保存している場合、当該データをシステム応答として出力するための制御命令をディスプレイ装置１００に伝送することもできる。

なお、制御部３３０は、ディスプレイ装置１００でシステム応答を構成するデータの一部を予め保存している場合、完全なシステム応答を出力するための情報のみをディスプレイ装置１００に伝送することもできる。

例えば、ディスプレイ装置１００に“お問い合わせの＜放送番組名＞の放送時間は＜放送時間＞からです”のような回答が予め保存されている場合、制御部３３０は、ディスプレイ装置１００に保存された回答を完全な形の文章で構成するために、ユーザが問い合わせる放送番組名及びその放送時間に関する情報をディスプレイ装置１００に伝送するように制御することができる。この場合、制御部３３０は、ディスプレイ装置１００に予め保存された回答を出力するための別途の制御命令をディスプレイ装置１００に伝送することができる。

それにより、ディスプレイ装置１００は、第２サーバ３００から受信された情報を予め保存された回答に載せて“お問い合わせの○○○（放送番組名）の放送時間は土曜日の７時からです”を応答メッセージとして出力することができる。

一方、上述の実施形態において、制御部３３０は例文にタグ付けされた情報を用いて、対話作用、主作用及び構成要素を抽出するものとして説明してきたが、それは一例に過ぎない。すなわち、制御部３３０は、ユーザの音声からＭａｘＥｎｔ（ＭａｘｉｍｕｍＥｎｔｒｏｐｙＣｌａｓｓｆｉｅｒ）を用いて対話作用、主作用を抽出し、ＣＲＦ（ＣｏｎｄｉｔｉｏｎＲａｎｄｏｍＦｉｅｌｄｓ）を用いて構成要素を抽出することもできる。

しかし、これらの実施形態に限定されるわけではなく、制御部３３０は既に公知となった多様な方式を通じてユーザの音声から対話作用、主作用及び構成要素を抽出することもできる。

一方、制御部３３０は、現在受信されたユーザの音声に含まれたユーザの発話意図を判断することができない場合、以前に受信されたユーザの音声を参照して、現在受信されたユーザの音声に含まれたユーザの発話意図を判断することができる。

具体的に、制御部３３０は、以前に受信されたユーザの音声の属するサービスドメインに基づいて、現在受信されたユーザの音声に含まれたユーザの発話意図を判断することができない場合、以前に受信されたユーザの音声に参照し、現在受信されたユーザの音声に含まれたユーザの発話意図を判断することができる。

すなわち、制御部３３０は、現在受信されたユーザの音声をコーパスデータベースに保存された対話パターンと比較して、現在受信されたユーザの音声が対話パターンで、最初のユーザ発話に該当するか否かを判断し、最初のユーザ発話に該当しないと判断されると、以前に受信されたユーザの音声を参照して現在受信されたユーザの音声に含まれたユーザの発話意図を判断することができる。

そのために、保存部３２０は、各サービスドメインで各例文を階層的に保存することができる。すなわち、保存部３２０は、各サービスドメインでユーザが最初に発話することができるユーザの音声にマッチングする例文を最上位階層に保存し、ユーザが以後に発話することができるユーザの音声にマッチングする例文を階層的に保存することができる。

例えば、“○○○（放送番組名）は何時から？”というユーザの音声が入力された後、“何時から？”というユーザの音声が入力された場合を仮定する。この場合、制御部３３０は、“何時から？”というユーザの音声が放送サービスドメイン内で最初にユーザ発話に該当しないと判断されると、以前に受信された“○○○（放送番組名）は何時から？”というユーザ音声に基づいて、“何時から？”の発話意図を判断することができる。

すなわち、制御部３３０は、構成要素を抽出することができない“何時から？”というユーザ音声の発話意図を判断するために、以前に受信されたユーザ音声に含まれた“○○○（放送番組名）”を用いて、“何時から？”の発話意図を○○○に対する番組の開始時間を問い合わせるものとして判断することができる。

このように、第２サーバ３００は、ユーザの発話意図に対応する応答情報を生成してディスプレイ装置１００に伝送し、ディスプレイ装置１００は第２サーバ３００から受信された応答情報に基づいて、ユーザの音声に対応する機能を行うか、ユーザの音声に対応するシステム応答を出力することができる。

一方、ディスプレイ装置１００は、ユーザの音声にコンテンツを検索するための発話意図が含まれるか、または、ユーザの音声にコンテンツのおすすめを受けるための発話意図が含まれるかに応じて、互いに異なるシステム応答を出力することができる。

そのために、第２サーバ３００は、テキスト情報にコンテンツを検索しようとする意図を有するキーワード、またはコンテンツのおすすめを受けようとする意図を有するキーワードが存在するか否かに応じて、互いに異なる応答情報を生成してディスプレイ装置１００に伝送することができる。

すなわち、保存部３２０は、ユーザがコンテンツを検索しようとするものか、または、コンテンツのおすすめを受けようとするものかを判断するための情報を、例文を解釈するための情報として保存することができる。

例えば、放送サービスドメイン内に“○○○（出演者の氏名）が出演する放送番組を検索して”という例文が保存された場合を仮定する。

この場合、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文を解釈するための情報を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文において、“○○○（出演者の氏名）”は出演者の氏名を示し、“出演”、“放送番組検索”は＜出演者＞が出演する放送番組への問い合わせを示し、“検索”はユーザの発話意図がコンテンツ検索に該当し、“して”は例文のタイプが要求文であることを示す情報を当該例文にタグ付けして保存することができる。

上述の例においては、保存部３２０が“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文で“検索”は、ユーザの発話意図がコンテンツ検索に該当するという情報を保存するものとして説明したが、それは一例に過ぎない。すなわち、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組を探して”のような例文で“探し”はユーザの発話意図がコンテンツ検索に該当するという情報を保存することができ、“○○○（出演者の氏名）が出演する放送番組を教えて”のような例文では、“教え”はユーザの発話意図がコンテンツ検索に該当するという情報を保存することができる。

このように、保存部３２０は、例文にコンテンツ検索に関連する単語が存在する場合、各例文毎に当該情報をタグ付けして保存することができる。

別の例として、放送サービスドメイン内に“○○○（出演者の氏名）が出演する放送番組をおすすめして”という例文が保存された場合を仮定する。

この場合、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組をおすすめして”のような例文を解釈するための情報を当該例文にタグ付けして保存することができる。具体的に、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文において、“○○○（出演者の氏名）”は出演者の氏名を示し、“出演”、“放送番組のおすすめ”は＜出演者＞が出演する放送番組への問い合わせを示し、“おすすめ”はユーザの発話意図がコンテンツのおすすめに該当し、“して”は例文のタイプが要求文であることを示す情報を当該例文にタグ付けして保存することができる。

上述の例においては、保存部３２０が“○○○（出演者の氏名）が出演する放送番組をおすすめして”のような例文で“おすすめ”は、ユーザの発話意図がコンテンツのおすすめに該当するという情報を保存するものとして説明したが、それは一例に過ぎない。別の例として、保存部３２０は、“○○○（出演者の氏名）が出演する放送番組の中で見応えのある番組は？”のような例文で“見応えのある”はユーザの発話意図がコンテンツのおすすめに該当するという情報を保存することができる。

このように、保存部３２０は、例文にコンテンツのおすすめに関連する単語が存在する場合、各例文毎に当該情報をタグ付けして保存することができる。

一方、制御部３３０は、ユーザの音声にコンテンツ検索またはコンテンツのおすすめに関連する発話意図が含まれるか否かを判断し、判断された発話意図に対応する応答情報を生成し、ディスプレイ装置１００に伝送することができる。

具体的に、制御部３３０は、ユーザの音声とマッチングする例文またはユーザの音声と統計的に類似すると判断された例文にタグ付けされた情報を用いて、ユーザの音声から対話作用、主作用、構成要素、及びユーザの意図に関連する情報を抽出し、抽出された情報を用いてユーザの音声にコンテンツ検索またはコンテンツのおすすめに関連する発話意図が含まれるか否かを判断することができる。

そして、制御部３３０は、判断されたユーザの発話意図に対応する応答情報を生成し、生成された応答情報をディスプレイ装置１００に伝送することができる。

具体的に、制御部３３０は、ユーザの発話意図がコンテンツの検索に関連するものと判断された場合、発話意図に合致するコンテンツを検索する。

この場合、制御部３３０は、ＥＰＧ情報を用いたり、ＶＯＤサービスを提供するコンテンツプロバイダーサーバからユーザの発話意図に合致するコンテンツを検索することができる。

なお、制御部３３０は、ディスプレイ装置１００に接続された外部装置（図示せず）からユーザの発話意図に合致するコンテンツを検索することもできる。例えば、ディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツに関する情報がディスプレイ装置１００から受信されると、制御部３３０は、外部装置（図示せず）に保存されたコンテンツのうち、ユーザの発話意図に合致するコンテンツを検索することができる。

そして、制御部３３０は、検索されたコンテンツに関する情報をディスプレイ装置１００に伝送することができる。ここで、検索されたコンテンツに関する情報は、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つを含んでよい。

この場合、制御部３３０は、検索されたコンテンツに関する情報を用いて、コンテンツに対する検索リストを出力するための制御命令をディスプレイ装置１００に伝送することもできる。

なお、制御部３３０は、特定コンテンツを検索し、検索されたコンテンツに対するリストを出力するための制御命令をディスプレイ装置１００に伝送することができる。

具体的に、制御部３３０は、ＥＰＧ情報、ＶＯＤサービスでユーザの発話意図に合致するコンテンツを検索したり、ディスプレイ装置１００に接続された外部装置（図示せず）でユーザの発話意図に合致するコンテンツを検索することができる。

そして、制御部３３０は、検索されたコンテンツと同一のタイトルを有するか、検索されたコンテンツと同一のチャネルで同一の放送時間に放送されるコンテンツを検索して出力するための制御命令を生成し、ディスプレイ装置１００に伝送することができる。

一方、制御部３３は、ユーザの発話意図がコンテンツのおすすめに関連する場合、発話意図に合致するコンテンツを検索し、検索されたコンテンツに関する情報をディスプレイ装置１００に伝送することができる。ここで、検索されたコンテンツに関する情報は、コンテンツに対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つを含んでよい。

この場合にも、制御部３３０は、ＥＰＧ情報を用いたり、ＶＯＤサービスでユーザの発話意図に合致するコンテンツを検索することができる。なお、制御部３３０は、ディスプレイ装置１００に接続された外部装置（図示せず）からユーザの発話意図に合致するコンテンツを検索することもできる。

このとき、制御部３３０は、検索されたコンテンツに関する視聴率情報をディスプレイ装置１００に伝送することができる。

そのために、制御部３３０は、多様なキーワードを用いて、視聴率情報を獲得するためのウェブ検索を行うことができる。例えば、制御部３３０は、検索されたコンテンツのタイトル、放送時間等をキーワードとして抽出し、抽出されたキーワードをウェブサーバ（図示せず）に伝送し、検索されたコンテンツに関する視聴率情報をウェブサーバ（図示せず）から受信してよい。

または、制御部３３０は、ユーザ選好度情報をディスプレイ装置１００に伝送するように通信部３１０を制御することができる。そのために、保存部３２０は、ユーザアカウント別にユーザ選好度情報を予め保存していることができる。制御部３３０は、保存部３２０に保存されたユーザ選好度情報のうち、ディスプレイ装置１００から受信されたユーザアカウント情報にマッチングするユーザ選好度情報を判断し、判断されたユーザ選好度情報をディスプレイ装置１００に伝送することができる。

以下では、制御部３３０が、ユーザの発話意図がコンテンツ検索に関連するものか、または、コンテンツのおすすめに関連するものかに応じて行う動作を例に挙げて説明を進める。

まず、ディスプレイ装置１００から“○○○（出演者の氏名）が出演する放送番組を検索して”が受信された場合を仮定する。

この場合、制御部３３０は、受信されたテキストが放送サービスドメインに属すると判断し、放送サービスドメイン内で受信されたテキストとマッチングする例文である“○○○（出演者の氏名）が出演する放送番組を検索して”にタグ付けされた情報を用いて、ユーザの発話意図を判断し、それに対する応答情報を生成することができる。

すなわち、放送サービスドメインに保存された例文である“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文を解釈するための情報として、 “○○○（出演者の氏名）”は出演者の氏名を示し、“出演”、“放送番組検索”は＜出演者＞が出演する放送番組への問い合わせを示し、“検索”はユーザの発話意図がコンテンツ検索に該当し、“して”は例文のタイプが要求文であることを示す情報がタグ付けされている。

それにより、制御部３３０は、これらの情報を参照し、ディスプレイ装置１００から受信されたテキスト“○○○（出演者の氏名）が出演する放送番組を検索して”の対話作用は要求文であり、主作用は＜出演者＞が出演する放送番組への問い合わせであり、構成要素は○○○（出演者の氏名）であると判断することができる。このとき、制御部３３０は、例文を解釈するための情報に含まれたブランクを完成することができる。すなわち、制御部３３０は、＜出演者＞が出演する放送番組への問い合わせでブランク＜出演者＞は構成要素と判断された○○○（出演者の氏名）であると判断することができる。

それにより、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組を検索して”に含まれた発話意図は○○○（出演者の氏名）が出演する放送番組を要求するものと判断することができる。

なお、制御部３３０は、例文を解釈するための情報に基づいて、ユーザの発話意図がコンテンツの検索に関連するものか、または、コンテンツのおすすめに関連するものかを判断することができる。

上述の例において、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組を検索して”のような例文には、発話意図がコンテンツ検索に該当するという情報がタグ付けされていることから、“○○○（出演者の氏名）が出演する放送番組を検索して”のようなユーザの音声には、コンテンツを検索しようとする発話意図が含まれたものと判断することができる。

それにより、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組を検索して”のようなユーザの音声はコンテンツ検索に関連し、○○○（出演者の氏名）が出演する放送番組を要求する発話意図が含まれたと判断することができる。

その後、制御部３３０は、判断された発話意図に基づいて応答情報を生成する。上述の例において、制御部３３０は、ＥＰＧ情報を参照して○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報（仮に、放送番組に対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つ）を検索することができる。そして、制御部３３０は、検索された放送番組に関する情報を応答情報としてディスプレイ装置１００に伝送することができる。

別の例として、ディスプレイ装置１００から“○○○（出演者の氏名）が出演する放送番組をおすすめして”が受信された場合を仮定する。

この場合、制御部３３０は、受信されたテキストが放送サービスドメインに属すると判断し、放送サービスドメイン内で受信されたテキストとマッチングする例文である“○○○（出演者の氏名）が出演する放送番組をおすすめして”にタグ付けされた情報を用いて、ユーザの発話意図を判断し、それに対する応答情報を生成することができる。

すなわち、放送サービスドメインに保存された例文である“○○○（出演者の氏名）が出演する放送番組をおすすめして”には例文を解釈するための情報として、“○○○（出演者の氏名）”は出演者の氏名を示し、“出演”、“放送番組検索”は＜出演者＞が出演する放送番組への問い合わせを示し、“おすすめ”はユーザの発話意図がコンテンツのおすすめに該当し、“して”は例文のタイプが要求文であることを示す情報がタグ付けされている。

それにより、制御部３３０は、これらの情報を参照し、ディスプレイ装置１００から受信されたテキスト“○○○（出演者の氏名）が出演する放送番組をおすすめして”の対話作用は要求文であり、主作用は＜出演者＞が出演する放送番組への問い合わせであり、構成要素は○○○（出演者の氏名）であると判断することができる。このとき、制御部３３０は、例文を解釈するための情報に含まれたブランクを完成することができる。すなわち、制御部３３０は、＜出演者＞が出演する放送番組への問い合わせでブランク＜出演者＞は構成要素と判断された○○○（出演者の氏名）であると判断することができる。

それにより、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組をおすすめして”に含まれた発話意図は○○○（出演者の氏名）が出演する放送番組を要求するものと判断することができる。

上述の例において、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組をおすすめして”のような例文には、発話意図がコンテンツのおすすめに該当するという情報がタグ付けされていることから、“○○○（出演者の氏名）が出演する放送番組をおすすめして”のようなユーザの音声には、コンテンツをおすすめしようとする発話意図が含まれたものと判断することができる。

それにより、制御部３３０は、“○○○（出演者の氏名）が出演する放送番組をおすすめして”のようなユーザの音声はコンテンツ検索に関連し、○○○（出演者の氏名）が出演する放送番組を要求する発話意図が含まれたと判断することができる。

その後、制御部３３０は、判断された発話意図に基づいて応答情報を生成する。上述の例において、制御部３３０は、ＥＰＧ情報を参照して○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報（仮に、放送番組に対するタイトル、サムネール、放送時間、ジャンル、出演者、制作者、コンテンツが放送されるチャネル番号、チャネル名のうち、少なくとも一つ）を検索することができる。

そして、制御部３３０は、検索された放送番組の視聴率情報に対するウェブ検索を行うことができる。または、制御部３３０は、ユーザアカウント情報にマッチングするユーザ選好度情報を判断することができる。

それにより、制御部３３０は、検索された放送番組に関する情報及び検索された放送番組の視聴率情報を応答情報としてディスプレイ装置１００に伝送することができる。または、制御部３３０は、検索された放送番組に関する情報及びユーザ選好度情報を応答情報としてディスプレイ装置１００に伝送することができる。

それにより、ディスプレイ装置１００は、ユーザの音声に含まれた発話意図がコンテンツ検索に関連するか、または、コンテンツのおすすめに関連するかに応じて、互いに異なるシステム応答を出力することができるようになる。

以下では、図６ないし図１２を上述の図２及び図５とともに参照して、本発明の多様な実施形態について説明する。

例えば、図６の（ａ）のように、ユーザが“○○○（出演者の氏名）が出演する放送番組を検索して”と発話した場合を仮定する。

この場合、制御部３３０は、ＥＰＧ情報を参照し、○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報を応答情報としてディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、第２サーバ３００から受信された応答情報に基づいて、“○○○（出演者の氏名）が出演する放送番組を検索して”に対応するシステム応答を出力することができる。

具体的に、制御部１５０は、○○○（出演者の氏名）が出演する放送番組が放送時間順に並べられた検索リスト４１０をディスプレイすることができる。この場合、制御部１５０は、放送番組名、放送時間、放送番組を提供するチャネル名、チャネル番号、出演者、制作者等のうち、少なくとも一つを検索リスト４１０に付加することができる。

このとき、制御部１５０は、検索リスト上に予め設定された数のコンテンツが含まれるように制御することができる。それにより、制御部１５０は、検索リストを通じてディスプレイされるコンテンツの数より検索されたコンテンツの数が多い場合、検索リストに予め設定された数のコンテンツをディスプレイし、ユーザ命令に応じて、検索リストに対するページ切り替えを行い、残りのコンテンツをディスプレイすることができる。そのために、制御部１５０は、以前のページ及び次のページを選択されるためのＧＵＩをディスプレイすることができる。

一方、上述の実施形態においては、制御部３３０は、ＥＰＧ情報を参照し、○○○（出演者の氏名）が出演する放送番組を検索し、検索結果をディスプレイ装置１００に伝送するものとして説明したが、それは一例に過ぎない。

すなわち、制御部３３０は、ＥＰＧ情報のみではなく、ＶＯＤサービス及びディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、ユーザの発話意図に合致するコンテンツを検索し、検索結果をディスプレイ装置１００に伝送することもできる。

例えば、図７の（ａ）のように、ユーザが“○○○（出演者の氏名）が出演する放送番組を検索して”と発話した場合を仮定する。

この場合、制御部３３０はＥＰＧ情報だけでなく、ＶＯＤサービス及びディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、○○○（出演者の氏名）が出演する番組を検索し、検索結果をディスプレイ装置１００に伝送することもできる。

この場合、図７の（ｂ）のように、制御部１５０は、各サービス別に検索されたコンテンツを区分して検索リストをディスプレイすることができる。

例えば、○○○（出演者の氏名）が出演する放送番組がＥＰＧ情報及びディスプレイ装置１００に接続されたＤＶＤプレーヤから検索された場合を仮定する。この場合、制御部１５０は、ＥＰＧ情報から検索された放送番組を含む検索リスト５１０とＤＶＤプレーヤから検索されたＤＶＤコンテンツを含む検索リスト５２０とを一つの画面にディスプレイすることができる。

このように、制御部１５０は、各サービス別に検索されたコンテンツに対して別途のリストを生成してディスプレイすることができる。この場合、制御部１５０は、各検索リストに表示されるコンテンツの数より検索されたコンテンツの数が多い場合、各検索リストに予め設定された数のコンテンツをディスプレイし、ユーザ命令に応じて、各検索リストに対するページ切り替えを行い、残りのコンテンツをディスプレイすることができる。

このように、ページ切り替えに応じて、残りのコンテンツをディスプレイする過程で、一つのサービスから検索されたコンテンツのうち、未だディスプレイされていないコンテンツは存在するが、別のサービスから検索されたコンテンツが全てディスプレイされた場合、制御部１５０は、検索されたコンテンツが全てディスプレイされた検索リストを除去し、一つの検索リストを通じて未だディスプレイされていないコンテンツをディスプレイすることができる。

図７のような例において、ＥＰＧ情報から検索された放送番組は９件であり、ＤＶＤプレーヤから検索されたＤＶＤコンテンツは３件であり、各検索リストでページ毎に２件ずつのコンテンツがディスプレイされる場合を仮定する。

この場合、制御部１５０は、図７の（ａ）のように、各検索リストの一番目のページ５１０、５２０で放送番組及びＤＶＤコンテンツを２件ずつディスプレイすることができる。

その後、次のページをディスプレイするためのユーザ命令が入力されると、制御部１５０は、図８の（ａ）のように、各検索リストの二番目のページ５３０、５４０に一番目のページ５１０、５２０のディスプレイされていなかった２件の放送番組及び１件のＤＶＤコンテンツをディスプレイすることができる。

このとき、制御部１５０は、検索されたＶＯＤコンテンツは、全てディスプレイされたと判断することができる。

そして、次のページをディスプレイするためのユーザ命令が再度入力されると、ＤＶＤコンテンツは全てディスプレイされたことから、制御部１５０は、図８の（ｂ）のように、ＤＶＤコンテンツに対する検索リストを除去し、放送番組に対する検索リスト５５０のみをディスプレイすることができる。この場合、制御部１５０は、各検索リストを通じてディスプレイすることができた数だけコンテンツをディスプレイすることができる。すなわち、制御部１５０は、４件の放送番組を一つの放送番組に対する検索リスト５５０にディスプレイすることができる。

別の例として、図９の（ａ）のように、ユーザが“○○○（出演者の氏名）が出演する放送番組をおすすめして”と発話した場合を仮定する。

この場合、制御部３３０は、ＥＰＧ情報を参照し、○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報をディスプレイ装置１００に伝送することができる。このとき、制御部３３０は、○○○（出演者の氏名）が出演する放送番組に関する視聴率情報をディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、図９の（ｂ）のように、第２サーバ３００から受信された応答情報に基づいて、“○○○（出演者の氏名）が出演する放送番組をおすすめして”に対応するシステム応答を出力することができる。

具体的に、制御部１５０は、○○○（出演者の氏名）が出演する放送番組が視聴率順に並べられたおすすめリスト６１０をディスプレイすることができる。この場合、制御部１５０は、放送番組名、放送時間、放送番組を提供するチャネル名、チャネル番号、出演者、制作者等のうち、少なくとも一つをおすすめリスト６１０に付加することができる。

このとき、制御部１５０は、おすすめリスト上に予め設定された数のコンテンツが含まれるように制御することができる。それにより、制御部１５０は、おすすめリストを通じてディスプレイされるコンテンツの数より検索されたコンテンツの数が多い場合、おすすめリストに予め設定された数のコンテンツをディスプレイし、ユーザ命令に応じて、おすすめリストに対するページ切り替えを行い、残りのコンテンツをディスプレイすることができる。そのために、制御部１５０は、以前のページ及び次のページを選択されるためのＧＵＩをディスプレイすることができる。

別の例として、図１０の（ａ）のように、ユーザが“○○○（出演者の氏名）が出演する放送番組をおすすめして”と発話した場合を仮定する。

この場合、制御部３３０は、ＥＰＧ情報を参照し、○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報をディスプレイ装置１００に伝送することができる。このとき、制御部３３０は、ユーザ選好度情報をディスプレイ装置１００に伝送することができる。ここで、ユーザ選好度情報は、ユーザの視聴した頻度数の高い放送番組に対するジャンルを含むことができる。

それにより、制御部１５０は、図１０の（ｂ）のように、第２サーバ３００から受信された応答情報に基づいて、“○○○（出演者の氏名）が出演する放送番組をおすすめして”に対応するシステム応答を出力することができる。

具体的に、制御部１５０は、○○○（出演者の氏名）が出演する放送番組のうち、視聴者が視聴した頻度数の高い放送番組と同一のジャンルを有する放送番組が並べられたおすすめリスト７１０をディスプレイすることができる。

例えば、制御部１５０は、ユーザが視聴した頻度数の高い放送番組のジャンルが“ドラマ”なら、○○○（出演者の氏名）が出演する放送番組のうち、“ドラマ”ジャンルを有する放送番組が並べられたおすすめリスト７１０をディスプレイすることができる。このとき、制御部１５０は、ユーザが視聴した頻度数の高い放送番組と同一のジャンルを有する放送番組を含むおすすめリスト７１０をディスプレイすることができる。このとき、制御部１５０は、放送時間順に放送番組が並べられるように、おすすめリスト７１０を生成することもできる。

なお、制御部１５０は、放送番組名、放送時間、放送番組を提供するチャネル名、チャネル番号、出演者、制作者等のうち、少なくとも一つをおすすめリスト７１０に付加することができる。

別の例として、図１１の（ａ）のように、ユーザが“○○○（出演者の氏名）が出演する放送番組をおすすめして”と発話した場合を仮定する。

この場合、制御部３３０は、ＥＰＧ情報を参照し、○○○（出演者の氏名）が出演する放送番組を検索し、検索された放送番組に関する情報をディスプレイ装置１００に伝送することができる。このとき、制御部３３０は、ユーザ選好度情報をディスプレイ装置１００に伝送することができる。ここで、ユーザ選好度情報は、ユーザが最近視聴したチャネルに関する情報を含むことができる。

それにより、制御部１５０は、図１１の（ｂ）のように、第２サーバ３００から受信された応答情報に基づいて、“○○○（出演者の氏名）が出演する放送番組をおすすめして”に対応するシステム応答を出力することができる。

具体的に、制御部１５０は、○○○（出演者の氏名）が出演する放送番組のうち、ユーザが最近視聴したチャネルから提供する放送番組を含むおすすめリスト８１０をディスプレイすることができる。

例えば、ディスプレイ装置１００は、ユーザが最近視聴したチャネルが“１１番”であるとしたら、○○○（出演者の氏名）が出演する放送番組のうち、“１１番”から提供する放送番組を含むおすすめリスト８１０をディスプレイすることができる。このとき、制御部１５０は、放送時間順に放送番組が並べられるようにおすすめリスト８１０を生成することもできる。

なお、制御部１５０は、放送番組名、放送時間、放送番組を提供するチャネル名、チャネル番号、出演者、制作者等のうち、少なくとも一つをおすすめリスト８１０に付加することができる。

一方、上述の図９ないし図１１においては、制御部３３０は、ＥＰＧ情報を参照してコンテンツを検索するものとして説明したが、それは一例に過ぎない。すなわち、図７のように、ＥＰＧ情報だけでなく、ＶＯＤサービスを提供するコンテンツプロバイダーサーバ及びディスプレイ装置１００に接続された外部装置（図示せず）に保存されたコンテンツのうち、ユーザの発話意図に合致するコンテンツを検索し、検索結果をディスプレイ装置１００に伝送することもできる。

なお、上述の図１０及び図１１では、視聴率情報及びユーザ選好度情報のそれぞれを用いて、おすすめリストを生成するものとして説明したが、それは一例に過ぎない。

すなわち、制御部１５０は、視聴率情報に基づいておすすめリストを生成し、ユーザ選好度情報を基におすすめリストを生成し、各おすすめリストを一つの画面にディスプレイすることができる。なお、制御部１５０は、ユーザ選好度情報内の情報を基に生成されたそれぞれのおすすめリストを一つの画面にディスプレイすることができる。

例えば、ユーザが“○○○（出演者の氏名）が出演する放送番組をおすすめして”と発話した場合を仮定する。

この場合、制御部３３０は、ＥＰＧ情報を参照して○○○（出演者の氏名）が出演する放送番組を検索し、検索されは放送番組に関する情報をディスプレイ装置１００に伝送することができる。このとき、制御部３３０は、視聴率情報及びユーザ選好度情報をディスプレイ装置１００に伝送することができる。

それにより、制御部１５０は、第２サーバ３００から受信された応答情報に基づいて、“○○○（出演者の氏名）が出演する放送番組をおすすめして”に対応するシステム応答を出力することができる。

具体的に、制御部１５０は、図１２の（ａ）のように、○○○（出演者の氏名）が出演する放送番組が視聴率順に並べられたおすすめリスト９１０とユーザが視聴した頻度数の高い放送番組と同一のジャンルを有する放送番組を含むおすすめリスト９２０とを一つの画面にそれぞれディスプレイすることができる。

または、制御部１５０は、図１２の（ｂ）のように、○○○（出演者の氏名）が出演する放送番組が視聴率順に並べられたおすすめリスト９１０とユーザが最近視聴したチャネルから提供される放送番組を含むおすすめリスト９３０を一つの画面にそれぞれディスプレイすることができる。

または、制御部１５０は、図１２の（ｃ）のように、ユーザが視聴した頻度数の高い放送番組と同一のジャンルを有する放送番組を含むおすすめリスト９２０及びユーザが最近視聴したチャネルから提供される放送番組を含むおすすめリスト９３０を一つの画面にそれぞれディスプレイすることができる。

一方、ページ切り替えに応じて、残りのコンテンツをディスプレイする過程で、一つのおすすめリストから提供されるコンテンツのうち、未だディスプレイされていないコンテンツは存在するが、別のおすすめリストから提供されるコンテンツは全てディスプレイされた場合、制御部１５０は、全てディスプレイされたおすすめリストを除去し、残りのおすすめリストを通じて未だディスプレイされていないコンテンツをディスプレイすることができる。それについては、図８を参照して説明した方式がそのまま適用できることから、具体的な繰り返し説明は省略する。

図１３は、本発明の一実施形態に係るディスプレイ装置の制御方法を説明するためのフローチャートである。

まず、ユーザの音声を収集する（Ｓ１３１０）。

その後、ユーザの音声を第１サーバに伝送し、第１サーバからユーザの音声に対応するテキスト情報を受信する（Ｓ１３２０）。第１サーバは、ＳＴＴエンジンを用いて、ユーザの音声に対応するテキスト情報を生成してディスプレイ装置に伝送することができる。

そして、受信されたテキスト情報を第２サーバに伝送する（Ｓ１３３０）。この場合、第２サーバは、テキスト情報にコンテンツを検索しようとする意図を有するキーワードまたはテキスト情報にコンテンツのおすすめを受けようとする意図を有するキーワードが存在するか否かに応じて、互いに異なる応答情報を生成してディスプレイ装置に伝送することができる。

それにより、テキスト情報に対応する応答情報が第２サーバから受信されると、応答情報に基づいて、ユーザの音声に含まれた発話意図に応じて差別化されたシステム応答を出力する（Ｓ１０４０）。ここで、発話意図は、コンテンツの検索またはコンテンツのおすすめに関連してよい。

発話意図がコンテンツの検索に関連する場合、発話意図に応じて検索されたコンテンツに対する検索リストをシステム応答として出力することができる。

そのために、応答情報は、発話意図に応じて検索されたコンテンツに関する情報を含んでよく、ディスプレイ装置は受信されたコンテンツに関する情報に基づいてコンテンツに対する検索リストを生成し、生成された検索リストを出力することができる。このとき、ディスプレイ装置は、検索されたコンテンツが放送時間順に並べられるように検索リストを生成することができる。

なお、発話意図がコンテンツのおすすめに関連する場合、発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。

そのために、応答情報は、発話意図に応じて検索されたコンテンツに関する情報及び視聴率に関する情報を含んでよい。それにより、ディスプレイ装置は、受信された情報に基づいて、コンテンツに対するおすすめリストを生成し、生成されたおすすめリストを出力することができる。このとき、ディスプレイ装置は、視聴率情報に基づいて検索されたコンテンツが視聴率の高い順に並べられるようにおすすめリストを生成することもできる。

なお、発話意図が前記コンテンツのおすすめに関連する場合、発話意図に応じて検索されたコンテンツのうち、ユーザ選好度情報に基づいて選別されたコンテンツに対するおすすめリストをシステム応答として出力することができる。ここで、ユーザ選好度情報は、ユーザがコンテンツを視聴した頻度数の高いコンテンツのジャンル及び最近視聴したチャネルに関する情報を含んでよい。

そのために、応答情報は、ユーザの意図に応じて検索されたコンテンツに関する情報及びユーザ選好度情報を含んでよい。それにより、ディスプレイ装置は、受信された情報に基づいてコンテンツに対するおすすめリストを生成し、生成されたおすすめリストを出力することができる。具体的に、ディスプレイ装置は、検索されたコンテンツのうち、ユーザが視聴した頻度数の高いコンテンツと同一のジャンルを有するコンテンツが含まれるようにおすすめリストを生成することができる。なお、ディスプレイ装置は、検索されたコンテンツのうち、ユーザが最近視聴したチャネルから提供されるコンテンツが含まれるようにおすすめリストを生成することができる。

なお、本発明に係る制御方法を順次に行うプログラムが保存された非一時的な読み取り可能な媒体（Ｎｏｎ−ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉｕｍ）が提供されてよい。

非一時的な読み取り可能な媒体とは、レジスタやキャッシュ、メモリ等のように短い間だけデータを保存する媒体ではなく、半永久的にデータを保存し、機器によって読み取り（ｒｅａｄｉｎｇ）が可能な媒体を意味する。具体的には、上述の多様なアプリケーションまたはプログラムは、ＣＤやＤＶＤ、ハードディスク、ブルーレイディスク、ＵＳＢ、メモリカード、ＲＯＭ等のような非一時的な読み取り可能な媒体に保存されて提供されてよい。

なお、ディスプレイ装置及びサーバに対して示す上述のブロック図では、バス（ｂｕｓ）を示していないが、ディスプレイ装置及びサーバで各構成要素間の通信はバスを通じて行われてよい。なお、各デバイスには、上述の多様なステップを行うＣＰＵ、マイクロプロセッサ等のようなプロセッサが更に含まれてよい。

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明は以上の実施形態に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的趣旨の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

３３制御部
１００ディスプレイ装置
１１０出力部
１１１ディスプレイ部
１１２オーディオ出力部
１２０音声収集部
１３０第１通信部
１４０第２通信部
１５０制御部
１６０保存部
１７０受信部
１８０信号処理部
１９１リモコン信号受信部
１９３入力部
１９５インターフェース部
２００第１サーバ
２１０通信部
２２０制御部
３００第２サーバ
３１０通信部
３２０保存部
３３０制御部

Claims

ディスプレイ装置において、
出力部と、
ユーザの音声を収集する音声収集部と、
前記ユーザの音声を第１サーバに伝送し、前記第１サーバから前記ユーザの音声に対応するテキスト情報を受信する第１通信部と、
前記受信されたテキスト情報を第２サーバに伝送する第２通信部と、
前記テキスト情報に対応する応答情報が前記第２サーバから受信されると、前記応答情報に基づいて、前記ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するように前記出力部を制御する制御部と
を含み、
前記発話意図は、
コンテンツの検索またはコンテンツのおすすめに関連することを特徴とするディスプレイ装置。
第２サーバは、
前記テキスト情報にコンテンツを検索しようとする意図を有するキーワード、または、前記テキスト情報にコンテンツのおすすめを受けようとする意図を有するキーワードが存在するか否かに応じて、互いに異なる応答情報を生成して前記ディスプレイ装置に伝送することを特徴とする請求項１に記載のディスプレイ装置。
前記制御部は、
前記発話意図が前記コンテンツの検索に関連する場合、前記発話意図に応じて検索されたコンテンツに対する検索リストを前記システム応答として出力することを特徴とする請求項１に記載のディスプレイ装置。
前記制御部は、
前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力することを特徴とする請求項１に記載のディスプレイ装置。
前記制御部は、
前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、ユーザの選好度情報を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力することを特徴とする請求項１に記載のディスプレイ装置。
ディスプレイ装置の制御方法において、
ユーザの音声を収集するステップと、
前記ユーザの音声を第１サーバに伝送し、前記第１サーバから前記ユーザの音声に対応するテキスト情報を受信するステップと、
前記受信されたテキスト情報を第２サーバに伝送するステップと、
前記テキスト情報に対応する応答情報が前記第２サーバから受信されると、前記応答情報に基づいて、前記ユーザの音声に含まれた発話意図に応じて、差別化されたシステム応答を出力するステップと
を含み、
前記発話意図は、
コンテンツの検索またはコンテンツのおすすめに関連することを特徴とする制御方法。
第２サーバは、
前記テキスト情報にコンテンツを検索しようとする意図を有するキーワード、または、前記テキスト情報にコンテンツのおすすめを受けようとする意図を有するキーワードが存在するか否かに応じて、互いに異なる応答情報を生成して前記ディスプレイ装置に伝送することを特徴とする請求項６に記載の制御方法。
前記出力するステップは、
前記発話意図が前記コンテンツの検索に関連する場合、前記発話意図に応じて検索されたコンテンツに対する検索リストを前記システム応答として出力することを特徴とする請求項６に記載の制御方法。
前記出力するステップは、
前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、視聴率を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力することを特徴とする請求項６に記載の制御方法。
前記出力するステップは、
前記発話意図が前記コンテンツのおすすめに関連する場合、前記発話意図に応じて検索されたコンテンツのうち、ユーザの選好度情報を基に選別されたコンテンツに対するおすすめリストを前記システム応答として出力することを特徴とする請求項６に記載の制御方法。