(実施の形態1)
以下に添付図面を参照して、この発明にかかる音声配信装置、音声配信方法、音声配信プログラム、および記録媒体の好適な実施の形態1を詳細に説明する。まず、この発明にかかる実施の形態1の音声配信システムについて説明する。図1は、この発明にかかる実施の形態1の音声配信システムの機能的構成を示すブロック図である。図1に示すように、実施の形態1の音声配信システム100は、音声配信装置110と複数の通信端末装置120とを備えている。各通信端末装置120は、それぞれ音声配信装置110との間で通信可能に設けられている。
つぎに、音声配信装置110の機能的構成について図2を参照して説明する。図2は、音声配信装置110の機能的構成を示すブロック図である。図2に示すように、音声配信装置110は、音声情報受信部201と、記録部202と、視聴状況受信部203と、一覧情報送信部204と、選択情報受信部205と、送信部206と、を備えている。音声情報受信部201は、放送中の任意のコンテンツを視聴している視聴者の音声情報および当該任意のコンテンツに関する情報を視聴者の通信端末装置120から受信する。
ここで、音声情報とは、たとえば、放送中の任意のコンテンツを視聴している視聴者の声や拍手など、視聴者から発せられる音をあらわす情報である。音声情報は、たとえば、スポーツ観戦時の応援に用いる笛や太鼓など、視聴者がならした楽器から発せられる音などをあらわす情報であってもよい。これらの音声情報は、1人の視聴者から発せられる音であってもよいし、同じ場所にいる複数人の視聴者から発せられる音であってもよい。音声情報は、一般的な視聴者の音声情報に限らず、たとえば、有名人や解説者の声をあらわす情報であってもよい。コンテンツは、テレビ局から放映されるテレビ番組、ラジオ局から放送されるラジオ番組、インターネットを介して配信されるコンテンツなど各種のコンテンツが挙げられる。
また、任意のコンテンツに関する情報とは、任意のコンテンツを特定することが可能な情報である。具体的には、たとえば、任意のコンテンツがテレビ放映された番組である場合、任意のコンテンツに関する情報は、テレビ放映された番組の放映日時および放映チャンネルをあらわす情報である。また、任意のコンテンツに関する情報とは、任意のコンテンツの音声情報を特定することが可能な情報であってもよい。具体的には、たとえば、同じコンテンツの音声情報が複数ある場合には、いずれの音声情報かをあらわす情報である。以下、放映、放送、配信など、コンテンツの取得経路をあらわす用語を、「放送」に統一して説明する。
なお、コンテンツは、テレビ局やラジオ局などのような特定の企業によって提供されるものに限らない。たとえば、個人が撮影したビデオ映像や、個人が見ている映画(ただし、著作権に問題がない場合に限る)などのように、個人が所有するコンテンツであってもよい。この場合、コンテンツは、個人が作成したホームページなどを介して取得することができる。
任意のコンテンツに関する情報とは、コンテンツ自体であってもよい。コンテンツは、視聴用の映像情報(以下、「視聴映像情報」という)と、視聴用の音声情報(以下、「視聴音声情報」という)と、を含むコンテンツであってもよいし、視聴映像情報または視聴音声情報のみのコンテンツであってもよい。コンテンツにおける視聴音声情報は、コンテンツを構成する基本音声情報と、コンテンツの内容を効果的に伝えることを目的とした効果音声情報と、によって構成されている。
また、記録部202は、音声情報受信部201によって受信された音声情報と任意のコンテンツに関する情報とを関連付けて記録する。記録部202によって記録される音声情報および任意のコンテンツに関する情報は、同じ記録媒体に限らず、それぞれが異なる記録媒体に記録されてもよい。この場合、記録媒体は、音声情報そのものではなく、たとえば、音声情報のタイトルあるいは記録場所をあらわす情報と、任意のコンテンツに関する情報と、を関連付けて記録してもよい。記録部202は、音声情報を、コンテンツごとに分類して記録してもよい。
また、視聴状況受信部203は、上述した視聴者以外の他の視聴者の通信端末装置(以下、「他の通信端末装置」という)120から、任意のコンテンツの視聴状況に関する情報を受信する。ここで、任意のコンテンツの視聴状況に関する情報とは、音声情報の送信を前提とした任意のコンテンツを指定する情報である。たとえば、任意のコンテンツの音声情報が、上述した音声情報受信部201によって受信されているか否かを問い合わせる情報であってもよいし、任意のコンテンツの音声情報の送信を要求する情報であってもよい。
一覧情報送信部204は、視聴状況受信部203によって情報が受信された場合に、音声情報受信部201によって受信された音声情報のうち任意のコンテンツの音声情報の一覧に関する一覧情報を他の視聴者の通信端末装置へ送信する。ここで、一覧情報とは、上述した音声情報受信部201によって受信された音声情報の一覧をあらわすことが可能な情報である。具体的には、たとえば、提供可能な音声情報の数や各音声情報の属性などを、コンテンツごとにあらわす情報である。
音声情報の属性としては、たとえば、音声情報の提供者の名称・性別・年齢など音声情報を提供する視聴者に関する情報や、音声情報の人気度やお勧め程度などの情報である。たとえば、音声情報の人気度は、配信回数に基づいて、配信回数が多い音声情報ほど人気が高い音声情報であると判断することができる。人気度は、音声情報が配信された日時などを加味して判断してもよい。
また、選択情報受信部205は、一覧情報送信部204によって一覧情報が送信された結果、音声情報受信部201によって受信された音声情報のうち一の音声情報を選択する選択情報を、他の通信端末装置120から受信する。ここで、選択情報とは、他の通信端末装置120において、他の視聴者によって選択された一の音声情報をあらわす情報である。選択情報には、他の視聴者によって選択されたコンテンツや効果音声情報の送信を要求する情報が含まれていてもよい。
選択情報は、他の通信端末装置120において、他の視聴者によって一の音声情報が選択された場合に、他の通信端末装置120から送信される。選択情報によって選択される一の音声情報は、音声情報受信部201によって受信途中の音声情報であってもよいし、記録部202によって記録された音声情報であってもよい。
また、送信部206は、視聴状況受信部203によって受信された情報に基づいて、音声情報受信部201によって受信された音声情報を他の通信端末装置120へ送信する。送信部206は、視聴状況受信部203によって受信された情報に基づいて、記録部202によって記録された音声情報を他の通信端末装置120へ送信してもよい。具体的には、たとえば、視聴状況受信部203によって受信された情報に基づいて、指定された任意のコンテンツの音声情報を、他の通信端末装置120へ送信する。
選択情報受信部205によって選択情報が受信された場合、送信部206は、選択情報受信部205によって受信された選択情報に基づいて、一の音声情報を他の通信端末装置120へ送信する。具体的には、視聴状況受信部203によって受信された情報に基づいて、指定された任意のコンテンツの音声情報のうち、他の視聴者によって選択された一の音声情報のみを、他の通信端末装置120へ送信する。送信部206は、他の視聴者の任意のコンテンツの視聴にあわせて、音声情報を他の視聴者の通信端末装置120へ送信してもよい。
選択情報受信部205によって受信された選択情報に、コンテンツあるいは効果音声情報の送信を要求する情報が含まれている場合、送信部206は、コンテンツあるいは効果音声情報を、送信部206によって他の通信端末装置120へ送信する。なお、送信部206は、選択情報によって選択された音声情報が関連付けられているコンテンツあるいは効果音声情報のみを送信する。
つぎに、音声配信装置110の音声配信処理について図3を参照して説明する。図3は、音声配信装置110の音声配信処理を示すフローチャートである。図3に示すフローチャートにおいて、まず、他の通信端末装置120から送信された視聴状況に関する情報を、視聴状況受信部203によって受信するまで待って(ステップS301:No)、受信した場合(ステップS301:Yes)には、音声情報受信部201によって受信されている音声情報のうち、放送中のコンテンツに関する一覧情報を一覧情報送信部204によって他の通信端末装置120へ送信する(ステップS302)。
つぎに、ステップS302において一覧情報を送信してから所定時間内に、他の通信端末装置120から送信された選択情報を、選択情報受信部205によって受信するまで待って(ステップS303:No)、受信した場合(ステップS303:Yes)には、受信された選択情報に基づいて、一の音声情報を、送信部206によって他の通信端末装置120へ送信して(ステップS304)、一連の処理を終了する。ステップS304においては、コンテンツあるいは効果音声情報を、送信部206によって他の通信端末装置120へ送信してもよい。
なお、他の通信端末装置120から送信された選択情報を、ステップS302において一覧情報を送信してから所定時間内に受信しなかった場合には、他の通信端末装置120へエラー情報を送信して、一連の処理を終了するようにしてもよい。
また、図示を省略するが、ステップS304において送信部206によって送信された一の音声情報を受信した通信端末装置120は、受信された一の音声情報を出力する。ステップS304において、送信部206によってコンテンツが併せて送信された場合、通信端末装置120は、コンテンツの出力タイミングに併せて一の音声情報を出力する。ステップS304において、送信部206によって効果音声情報が併せて送信された場合、通信端末装置120は、一の音声情報および効果音声情報の出力タイミングをあわせて出力する。
上述したように、この実施の形態1の音声配信装置110によれば、視聴状況受信部203によって任意のコンテンツの視聴状況に関する情報を他の視聴者の通信端末装置120から受信した場合には、受信された情報に基づいて、音声情報受信部201によって視聴者の通信端末装置120から受信された視聴者の音声情報を他の視聴者の通信端末装置120へ送信することができる。
したがって、放送中の任意のコンテンツを視聴する視聴者の声などの音声を、同じコンテンツを異なる場所で視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、放送中の任意のコンテンツを、視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
また、この実施の形態1の音声配信装置110によれば、任意のコンテンツの一覧情報を一覧情報送信部204によって他の視聴者の通信端末装置120へ送信した結果、他の視聴者の通信端末装置120から選択情報受信部205によって受信した選択情報に基づいて、一の音声情報を他の視聴者の通信端末装置120へ送信することができる。
したがって、嗜好などに応じて選択された視聴者の音声を、同じコンテンツを異なる場所で視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、放送中の任意のコンテンツを、自分と嗜好が合致する視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
また、この実施の形態1の音声配信装置110によれば、送信部206は、他の視聴者の任意のコンテンツの視聴にあわせて、音声情報を他の視聴者の通信端末装置120へ送信することができる。したがって、違和感を感じさせることなく、視聴者の音声を、同じコンテンツを異なる場所で視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、違和感を感じることなく、放送中の任意のコンテンツを、視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
なお、図2中図示を省略するが、音声情報受信部201によって受信された音声情報のうち、送信部206によって送信する音声情報の受信が、任意のコンテンツの放送途中に中断された場合、送信部206は、視聴状況受信部203によって受信された情報に基づいて、音声情報受信部201によって受信された別の音声情報を他の視聴者の通信端末装置120へ送信するようにしてもよい。
したがって、コンテンツの放送途中に、音声情報を提供する視聴者が当該コンテンツの視聴を中断した場合にも、中断された時点以降は、中断されるまでに聞いていた視聴者の音声とは別の音声を他の視聴者が聞くことができる。これによって、他の視聴者は、音声情報を提供する視聴者を拘束することなく、放送中の任意のコンテンツを、視聴者あるいは別の視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
(実施の形態2)
つぎに、この発明にかかる音声配信装置、音声配信方法、音声配信プログラム、および記録媒体の好適な実施の形態2を詳細に説明する。実施の形態2は、音声配信装置と通信端末装置とを備える音声配信システムへ適用した例を示す。なお、実施の形態2における音声配信システム、音声配信装置および通信端末装置は、上述した実施の形態1と同様であるため、同一符号を用いて示し説明も省略する。
(音声配信装置の音声配信処理手順)
つぎに、実施の形態2の音声配信装置110の音声配信処理について図4を参照して説明する。図4は、音声配信装置110の音声配信処理を示すフローチャートである。図4に示すフローチャートにおいて、まず、視聴者の通信端末装置120から送信された任意のコンテンツの音声情報および当該任意のコンテンツに関する情報を、音声情報受信部201によって受信するまで待つ(ステップS401:No)。
ステップS401において、音声情報および当該任意のコンテンツに関する情報を受信した場合(ステップS401:Yes)には、受信された音声情報と任意のコンテンツに関する情報とを関連付けて、記録部202によって記録する(ステップS402)。
そして、他の通信端末装置120から送信された視聴状況に関する情報を、視聴状況受信部203によって受信するまで待って(ステップS403:No)、受信した場合(ステップS403:Yes)には、記録部202によって記録された音声情報の一覧情報を、一覧情報送信部204によって他の通信端末装置120へ送信する(ステップS404)。ステップS404においては、視聴状況受信部203によって受信された情報に基づいて指定されたコンテンツに関する一覧情報を送信してもよい。
その後、ステップS404において一覧情報を送信してから所定時間内に、他の通信端末装置120から送信された選択情報を、選択情報受信部205によって受信するまで待って(ステップS405:No)、受信した場合(ステップS405:Yes)には、受信された選択情報に基づいて、一の音声情報を、送信部206によって他の通信端末装置120へ送信して(ステップS406)、一連の処理を終了する。
ステップS406においては、コンテンツあるいは効果音声情報を、送信部206によって他の通信端末装置120へ送信してもよい。そして、図示を省略するが、通信端末装置120は、受信された情報に応じたタイミングで各情報を出力する。
ステップS406においては、音声情報を送信するタイミングを他の視聴者の任意のコンテンツの視聴にあわせて他の視聴者の通信端末装置120へ送信してもよいが、これに限るものではない。音声情報は、当該音声情報を受信する他の通信端末装置120において、タイミングをあわせて出力してもよい。この場合、たとえば、コンテンツの放送時刻に対する音声情報の受信時刻を相対的にあらわす情報を、音声情報に関連付けて記録しておくことで、他の通信端末装置120におけるタイミング調整を実現することができる。
上述したように、この実施の形態2の音声配信装置110によれば、視聴状況受信部203によって任意のコンテンツの視聴状況に関する情報を他の視聴者の通信端末装置120から受信した場合には、受信された情報に基づいて、音声情報受信部201によって視聴者の通信端末装置120から受信されて、記録部202によって記録された視聴者の音声情報を、他の視聴者の通信端末装置120へ送信することができる。
したがって、任意のコンテンツを視聴する視聴者の声などの音声を、同じコンテンツを視聴者よりも後から視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、任意のコンテンツを、視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
さらに、リアルタイムで視聴することができなかったコンテンツであっても、当該コンテンツの音声を他の視聴者が聞くことができる。これによって、他の視聴者は、たとえば、スポーツ中継やコンサートなどリアルタイムで視聴する方がより満足度が高いにも拘わらず、リアルタイムで視聴することができなかったコンテンツを視聴する場合にも、リアルタイムで視聴した場合の臨場感の疑似体験をすることができる。
さらに、任意のコンテンツを視聴するごとに、異なる視聴者の音声情報を受信することもできる。これによって、他の視聴者は、任意のコンテンツを視聴するたびに、異なる視聴者の音声を聞くことができ、様々な視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。すなわち、一つのコンテンツを幾通りもの楽しみ方で視聴することができる。
さらに、この実施の形態2の音声配信装置110によれば、記録部202によって記録された音声情報を、他の通信端末装置120に送信するため、他の視聴者自身の音声情報を受信することができる。したがって、過去に体感した臨場感を再現したり、過去の自分と疑似会話をしたりすることができる。
また、この実施の形態2の音声配信装置110によれば、記録部202によって記録された音声情報を、他の通信端末装置120に送信するため、他の視聴者が任意のコンテンツを視聴する任意のタイミングで、視聴者の音声を他の視聴者が聞くことができる。これによって、他の視聴者は、任意のコンテンツを、音声情報を受信するタイミングに制限されることなく、視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
以下に、上述した実施の形態1または2にかかる音声配信システムの実施例について説明する。この実施例は、上述した音声配信システムを、インターネットなどの通信回線網に接続されるサーバやパーソナル・コンピュータ(以下、「PC」という)などによって構成されるネットワークシステムに適用した例である。図示を省略するが、この実施例の音声配信システムは、上述した実施の形態1または2にかかる音声配信装置としてのサーバ(図5参照)と、同様に通信端末装置としてのPC(図6参照)とを備えている。サーバおよびPCは、インターネットなどの通信回線網を介して、相互に通信が可能である。
(サーバのハードウエア構成)
まず、サーバのハードウエア構成について図5を参照して説明する。図5は、この実施例のサーバのハードウエア構成を示すブロック図である。図5において、サーバ500は、CPU501と、ROM502と、RAM503と、磁気ディスクドライブ504と、磁気ディスク505と、光ディスクドライブ506と、光ディスク507と、通信インターフェース(以下、「I/F」という)508と、を備えている。また、各構成部501〜508は、バス509によってそれぞれ接続されている。
CPU501は、サーバ500全体の制御を司る。ROM502は、ブートプログラム、音声配信プログラムなどのプログラムを記録している。RAM503は、CPU501のワークエリアとして使用される。すなわち、CPU501は、RAM503をワークエリアとして使用しながら、ROM502に記録された各種プログラムを実行することによって、サーバ500の全体の制御を司る。
ここで、音声配信プログラムとは、CPU501によって実行されることにより、任意のコンテンツを視聴する視聴者の音声情報および当該任意のコンテンツに関する情報を視聴者のPCから受信させ、視聴者以外の他の視聴者のPCから、任意のコンテンツの視聴状況に関する情報を受信させ、受信された視聴状況に関する情報に基づいて、受信された音声情報を他の視聴者のPCへ送信させるプログラムである。
また、音声配信プログラムとは、送信される音声情報の受信が、任意のコンテンツの放送途中に中断された場合、受信された視聴状況に関する情報に基づいて、受信された別の音声情報を他の視聴者のPCへ送信させるプログラムである。
また、音声配信プログラムとは、任意のコンテンツを視聴する視聴者の音声情報および当該任意のコンテンツに関する情報を視聴者のPCから受信させ、受信された音声情報と任意のコンテンツに関する情報とを関連付けて記録させ、視聴者以外の他の視聴者のPCから、任意のコンテンツの視聴状況に関する情報を受信させ、受信された視聴状況に関する情報に基づいて、記録された音声情報を他の視聴者のPCへ送信させるプログラムである。
また、音声配信プログラムとは、視聴状況に関する情報が受信された場合、受信された音声情報のうち任意のコンテンツの音声情報の一覧に関する一覧情報を他の視聴者のPCへ送信させ、一覧情報が送信された結果、音声情報のうち一の音声情報を選択する選択情報を、他の視聴者のPCから受信させ、受信された選択情報に基づいて、一の音声情報を他の視聴者のPCへ送信させるプログラムである。さらに、音声配信プログラムとは、他の視聴者の任意のコンテンツの視聴にあわせて、音声情報を他の視聴者のPCへ送信させるプログラムである。
また、磁気ディスクドライブ504は、CPU501の制御にしたがって磁気ディスク505に対するデータの読み取り/書き込みを制御する。磁気ディスク505は、磁気ディスクドライブ504の制御で書き込まれたデータを記録する。磁気ディスク505としては、たとえば、HD(ハードディスク)を用いることができる。
磁気ディスク505には、上述した実施の形態1または2において説明した、任意のコンテンツを視聴する視聴者の音声情報が記録されている。ここで、視聴者が視聴するコンテンツは、テレビ番組、ラジオ番組、インターネットを介して配信されるコンテンツなど各種のコンテンツが挙げられる。また、視聴者が視聴するコンテンツは、放映/放送/ストリーミング配信中のコンテンツであってもよいし、過去に放映/放送/ストリーミング配信されたコンテンツであってもよい。
また、音声情報は、コンテンツを視聴する視聴者の音声情報に限らず、たとえば、専門家や著名人によるコンテンツに対するコメントや解説など、特定のコンテンツのために別途作成された音声情報であってもよい。音声情報には、音声情報に含まれる音声の位置を、コンテンツの開始位置などの基準位置に対する相対的な位置であらわす位置情報が含まれている。これにより、たとえば、あるシーンにおいて交わされた視聴者の会話を、当該シーンに対応付けることができる。
音声情報には、音声情報の名称や属性などを示す関連情報が関連付けられている。ここで、音声情報の属性としては、上述した実施の形態1または2において説明したように、音声情報を提供する視聴者の名称(ニックネームなどを含む)・性別・年齢など音声情報の提供者に関する情報がある。音声情報の提供者に関する情報として、視聴者の嗜好をあらわす情報などを加えてもよい。嗜好をあらわす情報は、たとえば、あらかじめ登録されていてもよいし、適宜テキスト情報を入力させるなどして視聴者が自由に入力できるようにしてもよい。
音声情報の属性として関連付ける人気度をあらわす情報は、各音声情報の配信回数に基づいて、サーバにおいて定期的に算出し更新するようにしてもよい。ここで、たとえば、一定期間内の配信回数が所定回数以上の音声情報を提供した視聴者に対しては、所定のサービスを提供するような運用形態とすることで、幅広い音声情報を収集することが期待できる。人気度が高い視聴者の音声情報の配信に際しては、別途課金を発生させるなどの運用形態としてもよい。専門家や著名人によって別途作成された音声情報の配信に際しても、別途課金を発生させるなどの運用形態としてもよい。
音声情報の属性として関連付ける音声情報のお勧め程度をあらわす情報は、現在(時刻あるいは日付など)から所定時間(時間あるいは日数など)遡った所定期間内における配信回数に基づいて、サーバにおいて定期的に算出し更新するようにしてもよい。すなわち、所定期間内における配信回数が多い音声情報は、流行っている旬の音声情報であると判断することが可能であるためである。
磁気ディスク505には、過去に放映/放送/ストリーミング配信されたコンテンツが記録されている。現在放映/放送/ストリーミング配信中のコンテンツを、磁気ディスク505に随時記録してもよい。各コンテンツは、上述した視聴映像情報と視聴音声情報とを含んでいる。このうち、視聴音声情報は、コンテンツを構成する基本音声情報と、コンテンツの内容を効果的に伝えることを目的とした効果音声情報と、によって構成されている。基本音声情報および効果音声情報には、いずれも位置情報が含まれている。
たとえば、コンテンツが野球の試合であれば、ピッチャー交代やバッターの打順などのアナウンスや、判定を告げる審判の声などが基本音声情報であり、観客の応援や判定内容に対する歓喜あるいは抗議の声などが効果音声情報である。たとえば、コンテンツがスタジオ収録されたバラエティ番組であれば、コンテンツの出演者の台詞や出演者の動作によって発せられる音声が基本音声情報であり、観客の笑い声やどよめきや拍手などが効果音声情報である。
効果音声情報は、効果音声を提供する位置をあらわす提供位置情報を含んでいる。具体的に、提供位置情報は、たとえば、コンテンツが野球の試合であれば、効果音声がスタンド席から提供されていることをあらわし、コンテンツがスタジオ収録されたバラエティ番組であれば、スタジオ内の観客席から提供されていることをあらわす。
提供位置情報には、メインとなるコンテンツに対してどの程度離れた位置から提供されたかをあらわす情報や、どのような場所から提供されたかをあらわす情報が含まれる。具体的には、たとえば、コンテンツが野球の試合であれば、マウンドと観客席との間の距離や、ドーム型球場のように天井の高い場所から提供されたことをあらわす情報である。
磁気ディスク505には、磁気ディスク505に記録された音声情報およびコンテンツの一覧をあらわす一覧情報が記録されている。一覧情報は、提供可能な音声情報やコンテンツの数、タイトル、各音声情報の属性をあらわす情報を、コンテンツごとに分類して一覧させることが可能な情報である。
また、光ディスクドライブ506は、CPU501の制御にしたがって光ディスク507に対するデータの読み取り/書き込みを制御する。光ディスク507は、光ディスクドライブ506の制御にしたがってデータの読み出される着脱自在な記録媒体である。光ディスク507は、書き込み可能な記録媒体を利用することもできる。また、この着脱可能な記録媒体として、光ディスク507のほか、MO、メモリカードなどであってもよい。
また、通信I/F508は、無線を介して通信回線網に接続され、通信回線網に接続されたPCとCPU501とのインターフェースとして機能する。通信回線網には、LAN、WAN、公衆回線網や携帯電話網等がある。サーバ500において、PC(図6参照)から送信された音声情報は、通信I/F508を介して受信される。
なお、図2に示した音声配信装置110における音声情報受信部201と、記録部202と、視聴状況受信部203と、一覧情報送信部204と、選択情報受信部205と、送信部206は、図5に示したサーバ500におけるROM502、RAM503、磁気ディスク505、光ディスク507などに記録されたプログラムやデータを用いて、CPU501が所定のプログラムを実行し、サーバ500における各部を制御することによってその機能を実現する。
すなわち、この実施例のサーバ500は、サーバ500における記録媒体に記録されている音声配信プログラムにより、図2に示した音声配信装置110が備える機能を、図3および図4に示した誘導処理手順で実行することができる。
(PCのハードウエア構成)
つぎに、この実施例のPCのハードウエア構成について説明する。図6は、この実施例のPCのハードウエア構成を示すブロック図である。図6において、PC600は、CPU601と、ROM602と、RAM603と、磁気ディスクドライブ604と、磁気ディスク605と、光ディスクドライブ606と、光ディスク607と、音声I/F(インターフェース)608と、マイク609と、スピーカ610と、入力デバイス611と、映像I/F612と、ディスプレイ613と、通信I/F(インターフェース)614と、を備えている。また、各構成部601〜614はバス615によってそれぞれ接続されている。
まず、CPU601は、PC600の全体の制御を司る。ROM602は、ブートプログラムなどのプログラムを記録している。RAM603は、CPU601のワークエリアとして使用される。磁気ディスクドライブ604は、CPU601の制御にしたがって磁気ディスク605に対するデータの読み取り/書き込みを制御する。磁気ディスク605は、磁気ディスクドライブ604の制御で書き込まれたデータを記録する。具体的には、磁気ディスクドライブ604は、たとえば、テレビ番組やラジオ番組などの各種のコンテンツを、磁気ディスク605に記録する。磁気ディスク605としては、たとえば、HD(ハードディスク)やFD(フレキシブルディスク)を用いることができる。
また、光ディスクドライブ606は、CPU601の制御にしたがって光ディスク607に対するデータの読み取り/書き込みを制御する。光ディスク607は、光ディスクドライブ606の制御にしたがってデータの読み出される着脱自在な記録媒体である。上述したテレビ番組やラジオ番組などの各種のコンテンツは、光ディスク607に記録されていてもよい。なお、光ディスク607には、書き込み可能な記録媒体を利用することもできる。着脱可能な記録媒体としては、光ディスク607のほか、メモリカードなどを用いてもよい。
また、音声I/F608は、音声入力用のマイク609および音声出力用のスピーカ610に接続される。マイク609に受音された音声は、音声I/F608内でA/D変換される。また、スピーカ610からは音声が出力される。また、入力デバイス611は、文字、数値、各種指示等の入力のための複数のキーを備えたリモコン、キーボード、マウス、タッチパネルなどが挙げられる。
また、映像I/F612は、ディスプレイ613と接続される。映像I/F612は、具体的には、たとえば、ディスプレイ613全体の制御をおこなうグラフィックコントローラと、即時表示可能な画像情報を一時的に記録するVRAM(Video RAM)などのバッファメモリと、グラフィックコントローラから出力される画像データに基づいて、ディスプレイ613を表示制御する制御ICなどによって構成される。ディスプレイ613には、アイコン、カーソル、メニュー、ウインドウ、あるいは文字や画像等の各種データが表示される。このディスプレイ613は、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
また、通信I/F614は、通信ケーブルあるいは無線を介してインターネットなどの通信網に接続され、この通信網とCPU601とのインターフェースとして機能する。インターネットを介して配信されるコンテンツは、通信I/F614を介してPC600に入力される。通信I/F614は、さらに、テレビチューナー、BSチューナー、FMチューナーなどを備えている。テレビ局から放映されるテレビ番組、ラジオ局から放送されるラジオ番組などのコンテンツは、通信I/F614を介してPC600に入力される。
(サーバの音声配信処理手順)
つぎに、上述した実施の形態1または2の実施例にかかるサーバ500の音声配信処理手順について説明する。上述した実施の形態1または2の実施例にかかるサーバ500は、PC600から送信された情報に応じて、処理手順(その1)または処理手順(その2)のいずれかをおこなう。この実施例における処理手順(その1)および(その2)によって、上述した実施の形態1または2における音声配信処理手順が実現される。
(サーバの処理手順(その1))
まず、サーバの処理手順(その1)について説明する。図7は、サーバの処理手順(その1)を示すフローチャートである。図7のフローチャートにおいて、まず、通信I/F508を介して、音声情報および関連情報を受信するまで待って(ステップS701:No)、受信した場合(ステップS701:Yes)には、受信された音声情報および関連情報を、磁気ディスクドライブ504によって磁気ディスク505に記録して(ステップS702)、一連の処理を終了する。
(サーバの処理手順(その2))
つぎに、サーバの処理手順(その2)について説明する。図8は、サーバの処理手順(その2)を示すフローチャートである。図8のフローチャートにおいて、まず、通信I/F508を介して、一覧要求情報を受信するまで待つ(ステップS801:No)。ここで、一覧要求情報とは、サーバ500が提供可能な音声情報の一覧情報を要求する情報である。
ステップS801において、一覧要求情報を受信した場合(ステップS801:Yes)には、一覧要求情報の送信元となるPC600に対して、通信I/F508を介して、磁気ディスク505に記録された一覧情報を送信する(ステップS802)。そして、一覧情報を送信してから所定時間内に、通信I/F508を介して、送信先となるPC600から送信された選択情報を受信するまで待つ(ステップS803:No)。
ここで、選択情報とは、上述した実施の形態1または2において一覧情報の送信先となるPC600が操作されることにより選択された一の音声情報をあらわす情報である。具体的には、選択情報は、一の音声情報を特定可能な情報や、当該音声情報がいずれのコンテンツの音声情報であるかをあらわす情報を含んでいる。選択情報には、コンテンツあるいは効果音声情報の送信を要求する情報が含まれていてもよい。
ステップS803において、選択情報を受信した場合(ステップS803:Yes)には、受信された選択情報に基づいて、選択された一の音声情報が関わるコンテンツが放送中のコンテンツであるか否かを判断する(ステップS804)。なお、図8の説明においては、放映、放送、配信など、コンテンツの取得経路をあらわす用語を、「放送」に統一して説明するが、コンテンツの種類を限定するものではない。
ステップS804において、選択された一の音声情報が関わるコンテンツが放送中のコンテンツである場合(ステップS804:Yes)には、ステップS806へ移行する。放送中のコンテンツではない場合(ステップS804:No)には、選択情報に含まれている情報を用いて、磁気ディスク505に記録された音声情報から、一の音声情報を抽出する(ステップS805)。
そして、選択情報に含まれている情報を用いて特定される一の音声情報を、通信I/F508を介して、選択情報の送信元となるPC600へ送信して(ステップS806)、一連の処理を終了する。ステップS806においては、ステップS804:Yesにおいて放送中であると判定されたコンテンツの音声情報、あるいは、ステップS805において抽出された音声情報を送信する。
なお、ステップS806においては、音声情報の送信先となるPC600におけるコンテンツの視聴状況をあらわす情報を取得可能であれば、コンテンツの視聴状況にあわせたタイミングで音声情報を出力してもよい。放送中のコンテンツに関しては、受信した音声情報をすぐに送信することで出力タイミングを調整する。過去に放送されたコンテンツに関しては、音声情報に含まれる位置情報を用いて、視聴位置に応じた音声情報を送信することで出力タイミングを調整する。また、コンテンツの開始位置に対する位置をあらわす情報を音声情報とともに送信してもよい。
ステップS806においては、ステップS803:Yesにおいて受信した選択情報に、コンテンツあるいは効果音声情報の送信を要求する情報が含まれている場合、要求されたコンテンツあるいは効果音声情報を併せて送信する。放送中のコンテンツに関しては、放送時刻にコンテンツを送信する。過去に放送されたコンテンツに関しては、コンテンツに含まれる位置情報を用いて、視聴位置に応じた音声情報を送信することで出力タイミングを調整する。また、コンテンツの開始位置に対する位置をあらわす情報を音声情報とともに送信してもよい。
図示を省略するが、PC600は、図8のステップS806において送信された音声情報を、通信I/F614を介して受信し、音声I/F608を介してスピーカ610から出力する。音声情報は、サーバ500から送信されるタイミングでそのまま出力してもよいし、PC600においてタイミングを調整して出力してもよい。この場合、受信した音声情報に含まれる位置情報を用いる。
また、図示を省略するが、PC600は、ステップS802において送信された一覧情報を、通信I/F614を介して受信し、受信した情報を用いて、サーバ500によって提供可能な音声情報をあらわす情報をディスプレイ613に表示させる。ここで、提供可能な音声情報が大量にある場合に、すべての音声情報の一覧が1つの画面内に表示されると、目的とする音声情報を探し出すことが煩わしくなってしまう。
このため、この実施例では、以下に説明するように、表示画面を段階的に細分化して、ディスプレイ613に表示させる。図9および図10は、表示画面の一例を示す平面図(その1)、(その2)である。図9に示す表示画面は、上述した図8のステップS802において送信された一覧情報を受信した場合に、ディスプレイ613に最初に表示される表示画面である。
図9において、表示画面900には、現在放送中のコンテンツをあらわす情報901と、過去に放送され、サーバ500に音声情報が記録されているコンテンツをあらわす情報902と、が表示されている。PC600の利用者は、入力デバイス611を用いて、いずれか1つのコンテンツを選択することが可能である。表示画面900には、選択したコンテンツを決定する「決定」キー903が表示されている。目的とするコンテンツが図9に示した表示画面900中にない場合には、入力デバイス611を用いて、「その他のコンテンツ」キー904を操作することによって、音声情報を提供可能なその他のコンテンツを表示させることが可能である。
図10に示す表示画面は、上述した図9の表示画面900において「決定」キー903が操作されることによって、コンテンツが決定された場合にディスプレイ613に表示される表示画面である。図10において、表示画面1000には、図9に示す表示画面900において選択されたコンテンツ(ここでは、「プロ野球ナイター中継」)の音声情報をあらわす情報1001が表示されている。
音声情報をあらわす情報1001は、具体的には、たとえば、性別・年齢・嗜好をあらわす情報などである。表示画面1000には、表示画面900と同様に「決定」キー903や「その他の音声情報」キー1002などが表示されている。「その他の音声情報」キー1002は、操作されることによって、サーバ500が提供可能なその他の音声情報を表示させることが可能である。なお、複数の音声情報の選択を可能としてもよい。上述した選択情報は、表示画面1000において音声情報が選択された状態で「決定」キー903が操作されることによって、PC600からサーバ500へ送信される。
表示画面1000をあらわす情報は、表示画面900をあらわす情報を受信するタイミングで、同時に受信してもよいが、これに限るものではない。たとえば、表示画面900において「決定」キー903が操作された場合に、サーバ500と通信をおこなうことによって、該当するコンテンツの音声情報の一覧情報を受信するようにしてもよい。
ここで、放送中のコンテンツに関しては、音声情報を提供する視聴者が、他の視聴者の音声情報を選択した場合、視聴者と他の視聴者との間で、互いの音声情報を共有することができる。なお、音声情報を提供する視聴者が、複数の音声情報を選択した場合、選択された各音声情報の音量を調整する調整キーをディスプレイに表示してもよい。これによって、たとえば、複数人の音声を聞きたい利用者が、一時的に特定の音声のみを聞きたい場合には、調整キーを操作して各音声情報の出力音量を調整することができる。
つぎに、この実施例のサーバ500およびサーバ500から配信される情報を受信可能なPC600によって構成されるネットワークシステムの利用形態の一例について説明する。図11は、ネットワークシステムの利用形態の一例を示す説明図である。図11において、サーバ500および複数のPC600は、ネットワーク1101を介して通信可能に接続されている。
複数のPC600は、それぞれ異なる家庭(場所)A〜Dに設置されている。各家庭A〜Dには、コンテンツにおける視聴映像情報を表示するディスプレイ1102(ディスプレイ613でも可)と、視聴者の周囲を取り囲むように配置された複数のスピーカ1103と、視聴者の音声を集音するマイク1104(マイク609でも可)と、が配置されている。なお、図11においては、家庭C、Dに配置された各設備1102〜1104は、図示が省略されている。
図11に示すような設備1102〜1104が配置された家庭A〜Dにおいては、コンテンツの視聴に際して、スピーカ1103ごとに異なる音声を出力させ、視聴者にサラウンド効果を体感させることができる。具体的には、たとえば、基本音声情報および効果音声情報に含まれる提供位置情報に基づいて、音声を出力するスピーカ1103を選択的に制御する。家庭A〜Dにいる視聴者は、基本音声情報に含まれる提供位置情報に基づいて出力される音声とともにコンテンツを視聴することができる。
サラウンド効果を得るための規格は、既存の5.1chシステムなど公知の各種のサラウンド技術を利用することができる。なお、サラウンド効果を得るための各スピーカ1103の制御方法については、公知の技術であえるため説明を省略する。
同様に説明を省略するが、各スピーカ1103が配置される部屋などの空間に関する情報を、PC600に予め設定しておき、サーバ500から受信した視聴映像情報、基本音声情報および効果音声情報に基づいてスピーカ1103を選択的に制御する場合には、空間に関する情報を加味するようにしてもよい。
ここで、空間に関する情報とは、たとえば、空間の広さ、形状、空間を形成する壁や天井などの材質をあらわす情報である。空間における音響効果(音の反響する角度や大きさなど)をあらわす情報を、空間に関する情報として予め設定しておいてもよい。空間に関する情報は、PC600が自動的に測定するようにしてもよい。
これにより、家庭A〜Dにいる視聴者は、部屋の広さや形状、壁や天井などを形成する材質に左右されることなく、各スピーカ1103から出力される音声を最適な状態で視聴することができる。すなわち、サーバ500から送信される視聴映像情報、基本音声情報および効果音声情報が、各家庭A〜Dにおいて同じであれば、各家庭A〜Dにおいて共通の臨場感を再現することが可能となる。
これにより、各家庭A〜Dにいる視聴者に対して、コンテンツが録画されている現場にいるような臨場感を疑似体験させることができる。具体的には、たとえば、各家庭A〜Dにいる視聴者が、野球の試合のコンテンツを視聴する場合、基本音声情報に含まれる提供位置情報を用いて、音声を出力するスピーカ1103を選択的に制御することにより、あたかも、スタンド席に座って観戦しているかのような臨場感を疑似体験しながらコンテンツを視聴することができる。
また、図11に示したように、各設備1102〜1104に接続された視聴者に関しては、音声情報を提供する視聴者を、視聴者の隣に座る観客として設定できるようにしてもよい。具体的には、たとえば、図10の表示画面1000における音声情報をあらわす情報1001に、『右』あるいは『左』を指定する情報を追加する。
そして、選択された音声情報に『右』あるいは『左』を指定する情報が含まれる場合には、上述した図8のステップS806において送信された音声情報を、音声情報の提供を受ける視聴者の右あるいは左側に位置するスピーカから出力する。これによって、音声情報の提供を受ける視聴者は、選択した音声情報の提供者が、あたかも自分の右あるいは左隣りに座っているような疑似体験をすることができる。
具体的には、図11における家庭Aの視聴者が、家庭Bの音声情報を『右』に、家庭Cの音声情報を『左』に座る観客として設定することで、それぞれ異なる場所にいる家庭Bおよび家庭Cの視聴者の音声情報を、右側あるいは左側からそれぞれ聞くことができる。これによって、家庭Aにいる視聴者は、たとえば、野球の試合のコンテンツを視聴する場合に、あたかも、スタンド席に複数人で並んで座って観戦しているかのごとくにコンテンツを視聴することができる。
選択した音声が出力される方向(隣に座る観客)を設定した場合、設定内容に関する情報をサーバ500あるいは各PC600に記憶し、同じコンテンツを次回視聴する際には、記憶された設定内容に関する情報に基づいて、同じ音声情報を同じ方向から出力するようにしてもよい。これによって、視聴者は、コンテンツを視聴した際の雰囲気を、簡単に、繰り返し疑似体験することができる。
これによって、図11に示すような設備1102〜1104が配置された家庭A〜Dにいる視聴者は、コンテンツ自体の臨場感(視聴映像情報により得られる第1の臨場感)およびコンテンツを取り巻く環境の臨場感(基本音声情報及び効果音声情報により得られる第2の臨場感)の2つの臨場感を疑似体験することができる。つまり、あたかも野球場やサッカー場のゲームを観戦しているような臨場感だけでなく、自分があたかも観客席に座っており自分の席の周囲の雰囲気を感じ取ることができ、観客席の臨場感も共有できるのである。
なお、サーバ500あるいは各PC600に記憶された設定内容に関する情報は、該当する音声情報を最後に視聴した日時から所定時間が経過するまでにした場合に再度利用されなかった場合、サーバ500あるいは各PC600から消去するようにしてもよい。これによって、選択したものの気に入らなかった音声情報などが繰り返し提供されることを防止することができる。
また、サーバ500あるいは各PC600に記憶された設定内容に関する情報は、選択された日時が古い情報から順に消去するなどして、選択された音声情報が一つのコンテンツに関して所定数以上とならないようにしてもよい。これによって、設定内容に関する情報が、音声情報を選択するごとに増加し、コンテンツの視聴回数が増えるにつれて過剰な数の音声情報が一度に出力されることを防止することができる。
上述したように、この実施例によれば、任意のコンテンツを視聴する視聴者の声などの音声を、同じコンテンツを異なる場所で視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、音声情報を提供する視聴者を含めた複数人でコンテンツを視聴しているかのような疑似体験をすることができる。
また、この実施例によれば、嗜好などに応じて選択された視聴者の音声を、同じコンテンツを異なる場所で視聴する他の視聴者が聞くことができる。これによって、他の視聴者は、自分と嗜好が合致する視聴者を含めた複数人でコンテンツを視聴しているかのような疑似体験をすることができる。
さらに、選択に際しては、表示画面900、1000を段階的に表示させることにより、目的とする音声情報を選択し易くすることができる。これによって、他の視聴者は、自分と嗜好が合致する視聴者を見つけ易くなり、嗜好がより合致する複数人でコンテンツを視聴しているかのような疑似体験をすることができる。
また、この実施例によれば、コンテンツの視聴にあわせてスピーカ610から音声を出力することができる。これによって、他の視聴者は、違和感を覚えることなく、音声情報を提供する視聴者を含めた複数人でコンテンツを視聴しているかのような疑似体験をすることができる。さらに、過去に放送されたコンテンツであれば、コンテンツの視聴を一時的に中断しても、当該コンテンツの視聴を再開した段階で、再度視聴者の音声を聞くことができる。
また、この実施例によれば、リアルタイムで視聴することができなかったコンテンツであっても、当該コンテンツの音声を他の視聴者が聞くことができる。これによって、他の視聴者は、たとえば、スポーツ中継やコンサートなどリアルタイムで視聴する方がより満足度が高いにも拘わらず、リアルタイムで視聴することができなかったコンテンツを視聴する場合に、リアルタイムで視聴した場合の臨場感の疑似体験をすることができる。
また、この実施例によれば、任意のコンテンツを視聴するごとに、異なる視聴者の音声情報を受信することもできる。これによって、他の視聴者は、任意のコンテンツを視聴するたびに、異なる視聴者の音声を聞くことができ、様々な視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。すなわち、一つのコンテンツを幾通りもの楽しみ方で視聴することができる。
また、この実施例によれば、複数のコンテンツを選択することで、複数人の声などの音声を他の視聴者が聞くことができる。これによって、他の視聴者は、たとえば、スポーツの応援などのように、大勢いた方がより臨場感が得られるコンテンツを視聴する場合に、より現実に近い臨場感を疑似体験することができる。
また、この実施例によれば、過去に放送されたコンテンツであれば、他の視聴者自身の音声を聞くことができる。したがって、過去に体感した臨場感を再現したり、過去の自分と疑似会話をしたりすることができる。
また、この実施例によれば、過去に放送されたコンテンツであれば、音声情報を受信する視聴者の任意のタイミングで、視聴者の音声を聞くことができる。これによって、他の視聴者は、任意のコンテンツを、音声情報を受信するタイミングに制限されることなく、視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
なお、図示を省略するが、放送中のコンテンツに関して、選択された音声情報の提供者が音声情報の提供を中断した場合、サーバ500は、別の視聴者の音声情報を送信するようにしてもよい。この場合、たとえば、中断されたことを示すメッセージとともに、音声情報を選択する表示画面1000をあらわす情報をPC600に送信し、再度音声情報を選択させるようにしてもよい。また、中断された音声情報に類似する属性を有する音声情報に自動的に切り替えて送信してもよい。
これによって、コンテンツの放送途中に、音声情報を提供する視聴者が当該コンテンツの視聴を中断した場合にも、中断された時点以降は、中断されるまでに聞いていた視聴者の音声とは別の音声を聞くことができる。これによって、他の視聴者は、音声情報を提供する視聴者を拘束することなく、放送中の任意のコンテンツを、視聴者あるいは別の視聴者を含めた複数人で視聴しているかのような疑似体験をすることができる。
また、この実施例によれば、基本音声情報に含まれる提供位置情報に基づいて、スピーカ1103を制御することにより、各家庭A〜Dにいる視聴者に、コンテンツ自体の臨場感を疑似体験させることができる。これによって、各家庭A〜Dにいる視聴者に、高いエンターテイメント性を提供することができる。また、この実施例によれば、効果音声情報に含まれる提供位置情報に基づいて、スピーカ1103を制御することにより、各家庭A〜Dにいる視聴者が、たとえば、野球場のスタンド席に複数人で並んで座って観戦しているかのごとくにコンテンツを視聴することができる。
すなわち、この実施例によれば、サラウンド効果を提供できる通常のシステム(複数のスピーカ1103など)を備えている環境であれば、たとえば、野球の試合およびスタンド席の臨場感という2つの臨場感を疑似体験することができる。
以上説明したように、この実施例によって実現されるこの発明の音声配信装置、音声配信方法、音声配信プログラム、および記録媒体によれば、コンテンツを1人で視聴する場合にも、複数人で視聴しているかのような疑似体験をすることができる。
なお、本実施の形態で説明した音声配信方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、DVD等のコンピュータで読み取り可能な記録媒体(媒体の種類は特定されない)に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。