WO2021111872A1

WO2021111872A1 - コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

Info

Publication number: WO2021111872A1
Application number: PCT/JP2020/042907
Authority: WO
Inventors: 丹下　明; 長坂　英夫
Original assignee: ソニーグループ株式会社
Priority date: 2019-12-02
Filing date: 2020-11-18
Publication date: 2021-06-10
Also published as: EP4071751A1; CN114556400A; JPWO2021111872A1; EP4071751A4; KR20220110735A; US20220391440A1

Abstract

本技術は、より簡単に、コンテンツとそのコメントを提供することができるようにするコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備えるコンテンツ提供システムが提供される。

Description

コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

　本技術は、コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関し、特に、より簡単に、コンテンツとそのコメントを提供することができるようにしたコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。

　近年、コンテンツを提供する方法の多様化に伴い、様々なサービスや機器が提供されている（例えば、特許文献１，２参照）。

　特許文献１には、ストリームの再生順序を制御するシーケンス情報に基づき、再生すべきストリームを自動的に選択してテレビモニタに出力する装置が開示されている。この装置では、シーケンス情報に従って、ストリームと出力すべき文字列とを組み合わせて出力している。

　特許文献２には、番組リストから取り出したアドレスを基にダウンロードしたハイパーテキストから要素を順次抽出してテキストがあるときには音声合成して音声を発生し、リンクがあればリンク先の素材を取り出して当該素材に対応した出力を行うことを順次繰り返すように機能させるプログラムについて開示されている。

国際公開第2004/073309号特開2002-342206号公報

　ところで、コンテンツとともにそのコンテンツ等に関するコメントを提供するに際しては、より簡単に、コンテンツとそのコメントを提供することが求められる。

　本技術はこのような状況に鑑みてなされたものであり、より簡単に、コンテンツとそのコメントを提供することができるようにするものである。

　本技術の一側面のコンテンツ提供システムは、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備えるコンテンツ提供システムである。

　本技術の一側面のコンテンツ提供方法は、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御するコンテンツ提供方法である。

　本技術の一側面の記憶媒体は、コンピュータを、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部として機能させるためのプログラムを記録した記憶媒体である。

　本技術の一側面のコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体においては、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行されてユーザに提供されるように制御されるとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントが読み出されてユーザに提供されるように制御される。

本技術の概要を示した代表図である。本技術を適用したコンテンツ提供システムの概要を示す図である。本技術を適用したコンテンツ提供システムによるコンテンツ再生の流れを示す図である。音楽を含む配信を行う場合の権利処理の例を示す図である。 VPC型配信を行う場合の権利処理の例を示す図である。本技術を適用したコンテンツ提供システムの全体の構成の例を示す図である。コンテンツ提供システムで用いられるスクリプトの例を示す図である。本技術を適用したコンテンツ提供システムの一実施の形態の構成の例を示す図である。クリエイタ端末装置の構成の例を示す図である。クリエイタ端末装置における制御部の機能的構成の例を示す図である。ユーザ端末装置の構成の例を示す図である。ユーザ端末装置における制御部の機能的構成の例を示す図である。配信サーバの構成の例を示す図である。配信サーバにおける制御部の機能的構成の例を示す図である。番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合の処理の流れを示したシーケンス図である。番組作成ツールのユーザインターフェースの第１の例を示す図である。番組作成ツールにより生成される番組のスクリプトの例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。番組作成ツールのユーザインターフェースの第２の例を示す図である。楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合の処理の流れを示したシーケンス図である。楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。第１の実施の形態における処理の全体像を説明するフローチャートである。第１の実施の形態における処理の全体像を説明するフローチャートである。スクリプトを他の音楽配信サービスに提供する場合の処理の流れを示したシーケンス図である。第２の実施の形態における処理の全体像を説明するフローチャートである。第２の実施の形態における処理の全体像を説明するフローチャートである。配信サーバにおける制御部の機能的構成の他の例を示す図である。文章チェックを行う場合の処理の流れを示したシーケンス図である。第３の実施の形態における処理の全体像を説明するフローチャートである。本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示す図である。番組に挿入される広告の例を示す図である。番組に広告を挿入する場合の処理の流れを示したシーケンス図である。第４の実施の形態における処理の全体像を説明するフローチャートである。本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示す図である。楽曲IDを管理して番組情報を共有化する場合の処理の流れを示したシーケンス図である。変形例における処理の全体像を説明するフローチャートである。変形例における処理の全体像を説明するフローチャートである。

　以下、図面を参照しながら本技術の実施の形態について説明する。説明は以下の順序で行うものとする。

１．第１の実施の形態：基本構成
２．第２の実施の形態：他のサービスとの連携機能
３．第３の実施の形態：最低限の利用許諾機能
４．第４の実施の形態：広告機能
５．変形例
６．コンピュータの構成

＜代表図＞

　図１は、本技術の概要を示した代表図である。

　本技術は、コンテンツを番組化するに際して、ユーザのサービスとの契約やテキスト音声合成を利用して、コンテンツとともにそのコンテンツ等に関するコメントを提供することで、より簡単に、コンテンツとそのコメントを提供するものである。

　図１において、DJは、自身が選曲した楽曲を楽曲配信サーバから配信するとともに、マイクを使ってその楽曲に関するコメントを発信している。一方で、ユーザは、楽曲配信サーバから配信される、DJが選曲した楽曲と発信しているコメントを聴いている。

　ここで、DJは、クリエイタにより作成された仮想的なものとされるが、DJが選曲した楽曲は、ユーザが既に契約している音楽配信サービスを利用してユーザに提供され、DJが発信するコメントは、テキスト音声合成によりユーザに提供されるものであるため、より簡単に、コンテンツとそのコメントを提供することができる。

＜１．第１の実施の形態＞

（バーチャルポッドキャストシステムの概要）
　図２は、本技術を適用したコンテンツ提供システムの概要を示している。図２の例では、本技術を適用したコンテンツ提供システムの一実施の形態として、バーチャルポッドキャストシステムを例示している。

　バーチャルポッドキャストシステムは、クリエイタが自身の端末装置を操作して、楽曲を選んで文章を書くだけで、ポッドキャストの番組を作成することが可能なシステムである。ポッドキャストは、インターネット上で音声や動画のデータファイルを公開する手法の１つであり、インターネットラジオやインターネットテレビの一種である。なお、文章は、テキストに限らず、音声ファイルとして提供されても構わない。

　クリエイタにより作成されたポッドキャストの番組は、配信サーバに登録される。これにより、ユーザは、自身の端末装置を操作して、配信サーバから配信されるポッドキャストの番組を再生することで、その番組を視聴することができる。

　ところで、ポッドキャストの番組を配信するクリエイタからすれば、自身が作成したポッドキャストの番組を効率的に配信して、より多くのユーザに視聴してほしいと思うはずである。

　また、ポッドキャストで、楽曲を配信する場合には、楽曲の著作権処理が配信を行うクリエイタに対して発生するため、クリエイタからすればそのような作業は手間である。そのため、楽曲の著作権処理を、他の者に代行してほしいと思うはずである。

　近年、動画配信サイトでは、クリエイタが自身の動画配信チャンネルを開設して、様々なテーマの動画コンテンツを通じて情報発信が行われており、クリエイタは、動画コンテンツをユーザに提供する対価として、動画の再生回数に応じた広告収入や、広告主とのタイアップ動画の制作による広告収入などの対価を得ている。

　ポッドキャストの番組を配信するクリエイタにとっても、自身の作成したポッドキャストの番組に対する対価は極めて重要な関心事であり、適切な対価が還元されることを望んでいるはずである。

　以上のような番組化と、配信著作権処理と、収益化は、ポッドキャストの番組を配信するクリエイタにとっては、避けては通れない事項であり、これらの事項を容易に解決するための仕組みが求められている。バーチャルポッドキャストシステムでは、クリエイタがポッドキャストの番組を作成して配信して、そのポッドキャストの番組をユーザが視聴できるようにしつつ、クリエイタによる番組化と、配信著作権処理と、収益化の要望にも応えるための仕組みを提供する。

　図３は、バーチャルポッドキャストシステムにより生成されたポッドキャストの番組の再生の流れを示している。

　図３においては、ポッドキャストの番組に含まれるトラック（Track）のうち、時間的に連続したＮ番目とＮ＋１番目のトラックを示している。

　各トラックは、前説（Warm-up）、楽曲（song）、及び後説（After-song）から構成される。

　前説は、楽曲を紹介する前説であって、テキスト（文章）からなる。この例では、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね！」であるテキストが記述されている。この前説に対応するテキストは、TTS(Text To Speech)により音声に変換して読み上げることが可能である。

　楽曲は、その楽曲を識別するための識別情報（id）と、その曲のタイトル（title）とアーティスト名（artist）に関する情報を含む。例えば、"1234567"である楽曲IDを用いることで、ユーザが契約している音楽配信サービスに対して、当該楽曲IDにより特定される楽曲のストリーミング配信を要求することができる。

　後説は、楽曲の視聴後の後説であって、テキスト（文章）からなる。この例では、後説として、「やっぱり最高でね。・・・」であるテキストが記述されている。この後説に対応するテキストは、TTSを用いて読み上げることができる。

　ここで、ポッドキャストの番組の配信を行うに際し、番組に楽曲を含めるための権利処理としては、以下の２つのケースが想定される。

　第１に、楽曲を含む番組の配信を行うケースである。このケースでは、図４に示すように、クリエイタによって、楽曲としゃべり（前説と後説）を含む完パケとなるポッドキャストの番組が作成され、当該ポッドキャストの番組が配信されるため、楽曲の著作権処理が、配信を行うクリエイタに対して発生する。

　第２に、VPC型配信を行うケースである。このケースでは、図５に示すように、音楽配信サービスを利用して楽曲が配信され、クリエイタは、しゃべり（前説と後説）を作成して配信するだけであるため、楽曲の著作権処理が、クリエイタに対して発生しない。

　すなわち、クリエイタが、ポッドキャストの番組を配信するに際して、当該番組の構成に関する構成データと前説と後説が配信されるようにする。これにより、番組における楽曲の部分は、音楽配信サービスにより配信されることになるため、楽曲の著作権処理が、クリエイタに対しては発生しないことになる。

　VPC型配信では、音楽配信サービスによりストリーミング配信される楽曲と、クリエイタにより配信されるしゃべり（前説と後説）とは、ユーザが使用するユーザ端末装置で合成されて番組化されるため、ユーザ端末装置側で番組化されたポッドキャストの番組における楽曲の部分の権利処理は、ユーザによって行われる。

　このように、VPC型配信では、ポッドキャストの配信時に、クリエイタは、完パケのポッドキャストの番組を作らずに、楽曲の識別情報（楽曲ID）を配信することで、ユーザが使用するユーザ端末装置側で、当該楽曲IDに基づき、音楽配信サービスによりストリーミング配信される楽曲が再生されるようにしている。

　つまり、ユーザ端末装置では、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を用いて楽曲が再生されるため、クリエイタに対して、楽曲の著作権処理は発生しない。一方で、ユーザにとっても、自身が契約している音楽配信サービスにおける通常の楽曲配信範囲内で楽曲を再生可能であるため、特に追加料金を支払ったりすることなく、クリエイタにより指示された楽曲IDにより特定される楽曲を再生することができる。バーチャルポッドキャストシステムでは、このVPC(Virtual Pod Cast)型配信によりポッドキャストの番組の配信が行われるようにする。

　なお、ユーザの音楽配信サービスとの契約は、有料のユーザ契約（プレミアムユーザ）は勿論、無料のユーザ契約（フリーユーザ）であっても、広告が挿入されるだけで、楽曲の再生を行うことができる場合には、その権利を利用することができる。

　図６は、バーチャルポッドキャストシステムの全体の構成の例を示している。

　図６に示すように、このバーチャルポッドキャストシステムにより提供される機能は、大別すると、クリエイタ端末装置により提供されるクリエイタ側の機能と、配信サーバにより提供される各種の配信サービス側の機能と、ユーザ端末装置により提供されるユーザ側の機能とに分けられる。

　クリエイタ端末装置では、クリエイタ（PodCaster）の操作に応じて、番組作成ツールと音声作成ツールが実行され、ポッドキャストの番組が生成される。

　例えば、番組作成ツールは、楽曲配信サービスから提供される選曲用の楽曲リスト（カタログ）から選択された楽曲の楽曲IDと、音声作成ツールにより音声合成時の音調整がなされた当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組を生成し、番組配信サービスに登録する。

　音声作成ツールは、音声配信サービスから提供される音声作成用のデータに基づき、TTSの音調整機能を提供する。クリエイタは、音声作成ツールを操作して、TTSの音調整機能を利用することで、ユーザ側で再生されるTTS音声を、自身の好みの音声とすることができる。

　番組配信サービスは、番組作成ツールにより登録されたポッドキャストの番組を、ユーザ端末装置に配信するサービスを提供する。

　楽曲配信サービスは、ユーザ端末装置を使用するユーザが契約（加入）している音楽配信サービスに相当する。楽曲配信サービスは、ユーザ端末装置からの要求に応じて、ポッドキャストの番組に設定された楽曲IDにより特定される楽曲を配信する。また、楽曲配信サービスは、選曲用の楽曲リストを、クリエイタ端末装置に提供する。

　音声配信サービスは、ポッドキャストの番組に設定された楽曲の前説と後説のテキストを音声合成して得られるTTS音声を、ユーザ端末装置に配信するサービスを提供する。また、音声配信サービスは、音声作成用のデータを、クリエイタ端末装置に提供する。

　ユーザ端末装置では、ユーザ（Listener）の操作に応じて、番組レンダラが実行され、ポッドキャストの番組が再生される。

　番組レンダラは、番組配信サービスにより公開されているポッドキャストの番組の中から所望の番組を再生するに際し、当該番組の構成に関する構成データ（再現データ）に基づき、楽曲配信サービスから配信される楽曲と、音声配信サービスから配信されるTTS音声のレンダリングを行う。

　これにより、ポッドキャストの番組が再生（再現）され、ユーザによって、視聴可能とされる。なお、ユーザ端末装置で実行される番組レンダラは、再生プレイヤであるとも言える。

　図７は、ポッドキャストの番組の構成を記述したスクリプトの例を示している。

　図７に示すように、バーチャルポッドキャストシステムでは、番組化される楽曲の楽曲IDと、その楽曲の前説と後説とがセットになって複数設定されることで、ポッドキャストの番組が構成されている。このポッドキャストの番組の構成は、図７に示したスクリプトにより記述される。

　図７において、スクリプトには、番組に関する情報として、冒頭に、番組のタイトルや所有者、公開日、楽曲の配信元となるサービス名などが記述される。

　スクリプトには、番組に関する情報に続いて、トラックに関する情報が記述される。図７では、Ｎ個のトラックのうち、１つ目のトラックの記述の例を示している。

　トラックには、対象のトラックの番号（Number）と、前説（Warm-up）と、楽曲（song）と、及び後説（After-song）に関する情報が記述される。

　楽曲（song）には、その楽曲を識別するための識別情報（id）と、その曲のタイトル（title）とアーティスト名（artist）に関する情報などが記述される。例えば、"1234567"である楽曲IDを記述することで、"serviceA"である音楽配信サービスに対し、当該楽曲IDにより特定される楽曲の配信を要求することができる。

　前説（Warm-up）と後説（After-song）には、その楽曲に関するコメントに対応するコメント情報が記述される。例えば、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね！」であるテキストを記述し、後説として、「やっぱり最高でね。・・・」であるテキストを記述することで、TTSサービスを利用して、これらのテキストを音声に変換して読み上げることができる。

　図７においては、１つ目のトラックのみを記述、すなわち、１曲目の楽曲に関する情報の記述例を示したが、２曲目以降の楽曲についても、１曲目の楽曲と同様に、楽曲ごとに、楽曲IDと前説と後説をセットにして記述されるようにする。

　このように、楽曲の楽曲IDと、その楽曲に関する前説と後説からなるスクリプトが、クリエイタが使用するクリエイタ端末装置により生成され、番組配信サービスに登録されることで、ユーザに公開される。

　一方で、当該ユーザが使用するユーザ端末装置では、番組配信サービスにより公開されているスクリプトに従い、楽曲IDが示す楽曲が、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を利用して、ストリーミング配信されるように制御するとともに、前説と後説のTTS音声が提供されるように制御する。

　換言すれば、スクリプトには、楽曲の楽曲IDと、前説と後説がテキストで記述されているだけで、ポッドキャストの番組で再生される楽曲や音声のデータそのものが含まれているわけではないが、ユーザ端末装置では、スクリプトに記述された楽曲IDと前説と後説が示す情報に基づき、楽曲や音声のデータが再生されることで、クリエイタが作成した番組が再現されている。

　また、既に存在するプレイリストの楽曲（の楽曲ID）に対し、前説と後説が付加されたスクリプトを生成することで、プレイリストを番組化することが可能であるため、ユーザは、楽曲の前説と後説を入力するだけで、簡単にプレイリストを番組化することができる。

（システムの構成）
　図８は、本技術を適用したコンテンツ提供システムの一実施の形態の構成の例として、バーチャルポッドキャストシステムの構成を示している。

　図８において、コンテンツ提供システム１は、クリエイタ端末装置１０、ユーザ端末装置２０、番組配信サーバ３０Ａ、楽曲配信サーバ３０Ｂ、及び音声配信サーバ３０Ｃから構成される。

　コンテンツ提供システム１において、クリエイタ端末装置１０と、ユーザ端末装置２０と、番組配信サーバ３０Ａ、楽曲配信サーバ３０Ｂ、及び音声配信サーバ３０Ｃとは、ネットワーク５０を介して相互に接続されている。

　クリエイタ端末装置１０は、スマートフォン、タブレット端末、パーソナルコンピュータなどの機器であり、クリエイタにより使用される。

　クリエイタ端末装置１０は、クリエイタの操作に応じて、ポッドキャストの番組のスクリプトを生成し、ネットワーク５０を介して番組配信サーバ３０Ａに送信（アップロード）する。

　ユーザ端末装置２０は、スマートフォン、タブレット端末、音楽プレイヤ、ゲーム機、パーソナルコンピュータなどの機器であり、ユーザにより使用される。

　ユーザ端末装置２０は、ユーザの操作に応じて、ネットワーク５０を介して番組配信サーバ３０Ａにアクセスして、ポッドキャストの番組のスクリプトを受信（ダウンロード）する。

　番組配信サーバ３０Ａは、番組配信サービスを提供する１又は複数のサーバから構成される。番組配信サービスは、ポッドキャストの番組を配信するサービスであり、番組配信事業者により提供される。

　番組配信サーバ３０Ａは、ネットワーク５０を介してクリエイタ端末装置１０から送信（アップロード）される番組のスクリプトを受信し、ユーザ端末装置２０を使用するユーザが閲覧可能に記憶媒体に登録する。

　番組配信サーバ３０Ａは、ネットワーク５０を介してユーザ端末装置２０から送信される番組の再生要求を受信した場合、当該番組のスクリプトを記憶媒体から読み出し、再生要求元のユーザ端末装置２０に配信する。

　楽曲配信サーバ３０Ｂは、音楽配信サービスを提供する１又は複数のサーバから構成される。音楽配信サービスは、インターネットを通じて楽曲を配信するサービスであり、音楽配信事業者により提供される。例えば、音楽配信サービスは、定額制のストリーミングの聴き放題の形式で提供される。

　楽曲配信サーバ３０Ｂは、ネットワーク５０を介してユーザ端末装置２０から送信される楽曲の配信要求を受信した場合、受信した配信要求に応じた楽曲を特定し、当該楽曲のストリーミングデータを、配信要求元のユーザ端末装置２０に配信する。

　音声配信サーバ３０Ｃは、音声配信サービスを提供する１又は複数のサーバから構成される。音声配信サービスは、インターネットを通じてTTS音声や生声等の音声を配信するサービスであり、音声配信事業者により提供される。

　音声配信サーバ３０Ｃは、ネットワーク５０を介してユーザ端末装置２０から送信される音声の配信要求を受信した場合、受信した配信要求に応じた音声を取得し、当該音声のデータを、配信要求元のユーザ端末装置２０に配信する。

　なお、以下の説明では、番組配信サーバ３０Ａと、楽曲配信サーバ３０Ｂと、音声配信サーバ３０Ｃを特に区別する必要がない場合、配信サーバ３０と称して説明する。また、番組配信事業者と、音楽配信事業者と、音声配信事業者は、同一の事業者であってもよいし、異なる事業者であってもよい。

　ネットワーク５０は、インターネット、イントラネット、又は携帯電話網などの通信網を含んで構成され、TCP/IP(Transmission Control Protocol / Internet Protocol)等の通信プロトコルを用いた機器間の相互接続を可能にしている。

（クリエイタ端末装置の構成）
　図９は、図８のクリエイタ端末装置１０の構成の例を示している。

　図９に示すように、クリエイタ端末装置１０において、CPU(Central Processing Unit)１０１、ROM(Read Only Memory)１０２、及びRAM(Random Access Memory)１０３は、バス１０４により相互に接続される。

　CPU１０１は、ROM１０２や記憶部１０７に記録されたプログラムを実行することで、クリエイタ端末装置１０の各部の動作を制御する。RAM１０３には、各種のデータが適宜記憶される。

　バス１０４にはまた、入出力I/F１１０が接続される。入出力I/F１１０には、入力部１０５、出力部１０６、記憶部１０７、通信部１０８、及び近距離無線通信部１０９が接続される。

　入力部１０５は、各種の入力データを、入出力I/F１１０を介してCPU１０１を含む各部に供給する。例えば、入力部１０５は、操作部１１１、カメラ部１１２、及びセンサ部１１３を有する。

　操作部１１１は、クリエイタによって操作され、その操作に対応する操作データをCPU１０１に供給する。操作部１１１は、物理的なボタンやタッチパネル等から構成される。

　カメラ部１１２は、そこに入射される被写体からの光を光電変換して、その結果得られる電気信号に対する信号処理を行うことで撮影画像データを生成し、出力する。カメラ部１１２は、イメージセンサや信号処理部等から構成される。

　センサ部１１３は、空間情報や時間情報等のセンシングを行い、そのセンシングの結果得られるセンサデータを出力する。

　センサ部１１３は、加速度センサやジャイロセンサなどを含む。加速度センサは、XYZ軸の３方向の加速度を測定する。ジャイロセンサは、XYZ軸の３軸の角速度を測定する。なお、慣性計測装置（IMU：Inertial Measurement Unit）を設けて、３方向の加速度計と３軸のジャイロスコープにより、３次元の加速度と角速度を測定してもよい。

　また、センサ部１１３には、クリエイタの声などの音を検出する音センサ（マイクロフォン）、生物の持つ心拍数、体温、又は姿勢といった情報を測定する生体センサ、近接するものを測定する近接センサ、磁場（磁界）の大きさや方向を測定する磁気センサなどの各種のセンサを含めることができる。

　出力部１０６は、入出力I/F１１０を介してCPU１０１からの制御に従い、各種の情報を出力する。例えば、出力部１０６は、表示部１２１、及び音出力部１２２を有する。

　表示部１２１は、CPU１０１からの制御に従い、画像データに応じた画像等を表示する。表示部１２１、液晶パネルやOLED(Organic Light Emitting Diode)パネル等のパネル部と信号処理部などから構成される。

　音出力部１２２は、CPU１０１からの制御に従い、音データに応じた音を出力する。音出力部１２２は、スピーカや出力端子に接続されるヘッドホンなどから構成される。

　記憶部１０７は、CPU１０１からの制御に従い、各種のデータやプログラムを記録する。CPU１０１は、記憶部１０７から各種のデータを読み出して処理したり、プログラムを実行したりする。

　記憶部１０７は、半導体メモリ等の補助記憶装置として構成される。記憶部１０７は、内部ストレージとして構成されてもよいし、メモリカード等の外部ストレージであってもよい。

　通信部１０８は、CPU１０１からの制御に従い、ネットワーク５０を介して他の機器と通信を行う。通信部１０８は、セルラー方式の通信（例えばLTE-Advancedや5G等）や、無線LAN(Local Area Network)などの無線通信、又は有線通信に対応した通信モジュールとして構成される。

　近距離無線通信部１０９は、Bluetooth（登録商標）やNFC(Near Field Communication)等の近距離無線通信規格による無線通信を行い、各種のデータをやりとりする。

　なお、図９に示したクリエイタ端末装置１０の構成は一例であって、例えば、入力部としてマイクロフォンを設けたり、GPU(Graphics Processing Unit)等の画像処理回路や、電源回路などを設けたりしても構わない。

　図１０は、クリエイタ端末装置１０における制御部１００の機能的構成の例を示している。制御部１００の機能は、CPU１０１によって、番組作成ツールや音声作成ツール等のプログラムが実行されることで実現される。

　図１０において、制御部１００は、入力受付部１５１、楽曲情報取得部１５２、番組生成部１５３、音声情報取得部１５４、音声生成部１５５、及び登録部１５６を有する。

　入力受付部１５１は、入力部１０５から供給される、クリエイタの操作に応じた操作データを受け付け、番組生成部１５３に供給する。

　楽曲情報取得部１５２は、楽曲配信サーバ３０Ｂと通信を行う通信部１０８から供給される、楽曲に関する楽曲情報を取得し、番組生成部１５３に供給する。楽曲情報は、楽曲配信サーバ３０Ｂから受信した楽曲リストや楽曲IDなどの情報を含む。

　番組生成部１５３は、入力受付部１５１から供給される操作データに基づいて、楽曲情報取得部１５２から供給される楽曲情報や、前説と後説に関するコメント情報を処理することで、ポッドキャストの番組のスクリプトを生成し、登録部１５６に供給する。

　音声情報取得部１５４は、音声配信サーバ３０Ｃと通信を行う通信部１０８から供給される、前説と後説の音声に関する音声情報を取得し、音声生成部１５５に供給する。音声情報は、音声配信サーバ３０Ｃから受信した音声合成時や音声作成時の音声に関する情報などの情報を含む。

　音声生成部１５５は、音声情報取得部１５４から供給される音声情報を処理することで、クリエイタが前説と後説を設定するための音声を生成し、番組生成部１５３に供給する。

　番組生成部１５３は、ポッドキャストの番組を生成するに際し、音声生成部１５５から供給される音声を用い、クリエイタに対し、前説と後説の設定に関する情報（音声合成時の音声等）を提供することで、当該番組のスクリプトを生成し、登録部１５６に供給する。

　登録部１５６は、通信部１０８を制御して、番組生成部１５３から供給される番組のスクリプトを、ネットワーク５０を介して番組配信サーバ３０Ａにアップロードすることで登録する。

（ユーザ端末装置の構成）
　図１１は、図８のユーザ端末装置２０の構成の例を示している。

　図１１において、ユーザ端末装置２０の構成は、図９に示したクリエイタ端末装置１０の構成と対応している。すなわち、CPU２０１乃至近距離無線通信部２０９は、上述したCPU１０１乃至近距離無線通信部１０９と同様の機能を有しているため、ここではその説明は省略する。

　図１２は、ユーザ端末装置２０における制御部２００の機能的構成の例を示している。制御部２００の機能は、CPU２０１によって、番組レンダラ等のプログラムが実行されることで実現される。

　図１２において、制御部２００は、番組取得部２５１、楽曲取得部２５２、音声取得部２５３、レンダラ部２５４、及び提示制御部２５５を有する。

　番組取得部２５１は、番組配信サーバ３０Ａと通信を行う通信部２０８から供給される、ユーザの操作に応じたポッドキャストの番組のスクリプトを取得し、レンダラ部２５４に供給する。

　楽曲取得部２５２は、楽曲配信サーバ３０Ｂと通信を行う通信部２０８から供給される、楽曲IDに応じた楽曲のストリーミングデータを取得し、レンダラ部２５４に供給する。

　音声取得部２５３は、音声配信サーバ３０Ｃと通信を行う通信部２０８から供給される、前説と後説に応じた音声データを取得し、レンダラ部２５４に供給する。

　レンダラ部２５４は、番組取得部２５１から供給される番組のスクリプトに基づいて、音声取得部２５３から供給される前説の音声データと、楽曲取得部２５２から供給される楽曲のストリーミングデータと、音声取得部２５３から供給される後説の音声データに対するレンダリング処理を行い、その結果得られるデータを、提示制御部２５５に供給する。

　提示制御部２５５は、レンダラ部２５４から供給されるデータを、出力部２０６に供給することで、ユーザに対して番組を提示する。

　例えば、提示制御部２５５は、前説の音声データと、楽曲のストリーミングデータと、後説の音声データを、音出力部２２２に供給することで、番組化された楽曲の音とともに、当該番組に設定された前説と後説の音を、当該楽曲の前後に出力して提示することができる。

（配信サーバの構成）
　図１３は、図８の配信サーバ３０の構成の例を示している。なお、配信サーバ３０は、図８に示した番組配信サーバ３０Ａ、楽曲配信サーバ３０Ｂ、及び音声配信サーバ３０Ｃのいずれかのサーバに相当するものである。

　配信サーバ３０において、CPU３０１、ROM３０２、RAM３０３は、バス３０４により相互に接続されている。バス３０４には、さらに、入出力I/F３１０が接続されている。入出力I/F３１０には、入力部３０５、出力部３０６、記憶部３０７、通信部３０８、及びドライブ３０９が接続されている。

　入力部３０５は、マイクロフォン、キーボード、マウスなどから構成される。出力部３０６は、スピーカ、ディスプレイなどから構成される。

　記憶部３０７は、HDD(Hard Disk Drive)や半導体メモリなどから構成される。通信部３０８は、無線LAN等の無線通信、又はイーサーネット（登録商標）等の有線通信に対応した通信モジュールとして構成される。

　ドライブ３０９は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体３１１を駆動する。

　図１４は、配信サーバ３０における制御部３００の機能的構成の例を示している。制御部３００の機能は、CPU３０１によって、各サービスのプログラムが実行されることで実現される。

　図１４において、制御部３００は、要求受付・応答部３５１、配信処理部３５２、及びデータベース３５３を有する。

　要求受付・応答部３５１は、クリエイタ端末装置１０又はユーザ端末装置２０と通信を行う通信部３０８から供給される各種の要求を受け付け、配信処理部３５２に供給する。

　配信処理部３５２は、要求受付・応答部３５１から供給される各種の要求に応じた配信処理を行う。

　データベース３５３は、HDDや半導体メモリ等の大容量のストレージからなる記憶部３０７に記録される。

　例えば、番組配信サーバ３０Ａのデータベース３５３には、ポッドキャストの番組のスクリプト等が格納される。また、楽曲配信サーバ３０Ｂのデータベース３５３には、音楽配信サービスにより提供される楽曲が楽曲IDに対応付けて格納される。さらに、音声配信サーバ３０Ｃのデータベース３５３には、音声合成時や音声作成時の音声に関する情報、前説や後説の音声データ等が格納される。

　配信処理部３５２は、配信処理を行うに際し、データベース３５３に格納された各種のデータを処理して、各種の要求に応じた応答を生成し、要求受付・応答部３５１に供給する。

　要求受付・応答部３５１は、通信部３０８を制御して、配信処理部３５２から供給される各種の要求に応じた応答を、ネットワーク５０を介して要求元のクリエイタ端末装置１０又はユーザ端末装置２０に送信する。

　次に、コンテンツ提供システム１の各装置で実行される処理の流れを説明する。

（第１の例）
　図１５は、番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合の処理の流れを示したシーケンス図である。

　図１５において、番組作成ツールは、クリエイタ端末装置１０により実行され、番組レンダラは、ユーザ端末装置２０により実行される。また、図１５において、番組配信サービスは、番組配信サーバ３０Ａにより提供され、音楽配信サービスは、楽曲配信サーバ３０Ｂにより提供され、TTSサービスは、音声配信サーバ３０Ｃにより提供される。

　クリエイタ端末装置１０では、制御部１００により番組作成ツールが実行され、ステップＳ１１乃至Ｓ１３の処理が実行される。

　番組作成ツールは、楽曲配信サーバ３０Ｂから送信されてくる楽曲リストを取得し、クリエイタに提示する（Ｓ１１）。

　番組作成ツールは、クリエイタにより楽曲リストから選択された楽曲の楽曲IDと、クリエイタにより入力された当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組のスクリプトを生成し（Ｓ１２）、番組配信サーバ３０Ａに登録する（Ｓ１３）。

　これにより、番組配信サーバ３０Ａでは、クリエイタにより作成されたポッドキャストの番組のスクリプトがデータベース３５３に格納され、ユーザ端末装置２０を使用するユーザによって閲覧可能とされる。

　ユーザ端末装置２０では、制御部２００により番組レンダラが実行されるとともに、当該番組レンダラが、各配信サーバ３０と協働して動作することで、ステップＳ１４乃至Ｓ２５の処理が実行される。

　番組レンダラでは、ユーザの操作によって、番組配信サーバ３０Ａ上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される（Ｓ１４，Ｓ１５）。

　番組レンダラは、受信したスクリプトの冒頭に設定される前説に基づき、音声配信サーバ３０Ｃに対し、当該前説のテキストの音声合成を要求する（Ｓ１６）。

　音声配信サーバ３０Ｃでは、番組レンダラからの要求に応じて、前説のテキストの音声合成が行われ（Ｓ１７）、その音声合成の結果が配信される（Ｓ１８）。

　これにより、番組レンダラでは、音声配信サーバ３０Ｃから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された前説の部分のTTS音声が再生される。

　次に、番組レンダラは、受信したスクリプトの前説の次に設定される楽曲IDに基づき、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ３０Ｂに、当該楽曲IDにより特定される楽曲の配信を要求する（Ｓ１９）。

　楽曲配信サーバ３０Ｂでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され（Ｓ２０）、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる（Ｓ２１）。

　これにより、番組レンダラでは、楽曲配信サーバ３０Ｂから配信される楽曲のストリーミングデータが受信され、レンダリング処理が行われることで、楽曲IDにより特定される楽曲が、番組化された楽曲として再生される。

　その後、ストリーミング配信される楽曲の再生が完了すると、番組レンダラが、受信したスクリプトの楽曲IDの次に設定される後説に基づき、音声配信サーバ３０Ｃに、当該後説のテキストの音声合成を要求する（Ｓ２２）。

　音声配信サーバ３０Ｃでは、番組レンダラからの要求に応じて、後説のテキストの音声合成が行われ（Ｓ２３）、その音声合成の結果が配信される（Ｓ２４）。

　これにより、番組レンダラでは、音声配信サーバ３０Ｃから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された後説の部分のTTS音声が再生される。

　また、ポッドキャストの番組のスクリプトには、複数の楽曲ごとの楽曲IDがその楽曲の前説と後説のテキストとともに番組化されているため、ステップＳ１６乃至Ｓ２４の処理が完了した後に、処理は、ステップＳ１６の処理に戻り（Ｓ２５）、楽曲IDの数に応じてステップＳ１６乃至Ｓ２５の処理が繰り返される。

　これにより、番組レンダラでは、スクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。

　以上、番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合において、各装置で実行される処理の流れを説明した。

（番組作成ツールのUIの例）
　図１６乃至図２３を参照して、クリエイタ端末装置１０で実行される番組作成ツールの詳細を説明する。

　図１６は、番組作成ツールのユーザインターフェース（UI：User Interface）の第１の例を示している。

　図１６において、番組作成画面４１０は、番組作成ツールの実行時に表示される画面であって、クリエイタの操作に応じて、ポッドキャストの番組を作成するためのUIである。

　番組作成画面４１０は、操作エリア４１１、タイトル設定エリア４１２、オープニングトーク設定エリア４１３、設定済み楽曲・前説後説エリア４１４、及び楽曲・前説後説設定エリア４１５を有する。

　操作エリア４１１は、番組に設定する楽曲を操作して聴くための領域である。操作エリア４１１は、楽曲の再生又は停止のためのボタン、前の楽曲と次の楽曲を選択するためのボタン、再生中の楽曲の位置を示すシークバーなどを含む。

　タイトル設定エリア４１２は、番組のタイトルを設定するための領域である。

　オープニングトーク設定エリア４１３は、オープニングトークを設定するための領域である。例えば、オープニングトーク設定エリア４１３では、オープニングトークの音声ファイルが設定されるが、オープニングトークが必要ない場合には必ずしも設定しなくても構わない。

　設定済み楽曲・前説後説エリア４１４は、設定済みの楽曲とその楽曲の前説と後説が表示される領域である。

　例えば、設定済み楽曲・前説後説エリア４１４－１では、"Song1"である楽曲に対し、"Speech File1"である前説と"Speech File2"である後説が設定されている。また、設定済み楽曲・前説後説エリア４１４－２では、"Song2"である楽曲に対し、"Speech File3"である前説と"Speech File4"である後説が設定されている。

　楽曲・前説後説設定エリア４１５は、楽曲とその楽曲の前説と後説を設定するための領域である。

　例えば、楽曲・前説後説設定エリア４１５は、楽曲のカタログから所望の楽曲のファイルを選択するための楽曲追加ボタン（"Add Music from Song Catalog"）、所望の前説を設定するための前説追加ボタン（"Add Speech File before"）、及び所望の後説を設定するための後説追加ボタン（"Add Speech File after"）などを含む。

　なお、前説と後説は、クリエイタの入力操作に応じたテキスト形式のファイルとして設定されるほか、例えば、クリエイタの音声入力などに応じて、音声形式のファイルとして設定されても構わない。

　クリエイタによって、この番組作成画面４１０が操作されることで、例えば、図１７に示した番組のスクリプトが作成される。

　図１７では、ポッドキャストの番組として、オープニングトーク（"Opening Talk File"）の次に、１曲目の前説（"Speech File1"）と、１曲目の楽曲（"Song1"）と、１曲目の後説（"Speech File2"）がその順に再生され、さらに、２曲目の前説（"Speech File3"）と、２曲目の楽曲（"Song2"）と、２曲目の後説（"Speech File4"）とがその順に再生されるように番組化されている。

　ところで、この番組作成ツールは、クリエイタが契約している音楽配信サービスで配信しているアプリケーション（以下、音楽配信アプリともいう）の機能として提供してもよい。図１８乃至図２３は、クリエイタ端末装置１０により実行される音楽配信アプリの機能として提供される番組作成ツールの例を示している。

　図１８において、楽曲再生画面５１０は、音楽配信アプリの機能として提供される画面であって、インターネット等のネットワーク５０を介して音楽配信サービスにより配信される楽曲を再生するためのUIである。楽曲再生画面５１０は、再生対象楽曲エリア５１１、及び楽曲操作エリア５１２を有する。

　再生対象楽曲エリア５１１は、再生対象の楽曲のタイトルやアーティスト名、ジャケットの画像などを表示するための領域である。

　楽曲操作エリア５１２は、楽曲を操作するための領域である。楽曲操作エリア５１２は、楽曲の再生又は停止のためのボタン、前の楽曲と次の楽曲を選択するためのボタン、再生中の楽曲の位置を示すシークバーなどを含む。

　楽曲再生画面５１０において、クリエイタにより所定の操作がなされた場合、図１９に示したプレイリスト選択画面５２０が表示される。

　図１９において、プレイリスト選択画面５２０は、音楽配信アプリの機能として提供される画面であって、所望のプレイリストを選択するためのUIである。プレイリスト選択画面５２０は、プレイリスト一覧エリア５２１を有する。

　プレイリスト一覧エリア５２１は、音楽配信サービスにより提供されるプレイリスト、又はクリエイタ自身若しくは他のユーザが作成したプレイリスト（公開されたプレイリスト）などの一覧を表示して、選択するための領域である。

　このプレイリスト一覧エリア５２１に表示されたプレイリストの中から、図中の枠Ｆ１で囲まれた"70 SOUL"のプレイリストが選択された場合、図２０に示したプレイリスト編集画面５３０が表示される。

　図２０において、プレイリスト編集画面５３０は、音楽配信アプリの機能として提供される画面であって、選択対象のプレイリストを編集するためのUIである。プレイリスト編集画面５３０は、楽曲一覧エリア５３１、及び楽曲追加ボタン５３２を有する。

　楽曲一覧エリア５３１は、選択対象のプレイリストに登録されている楽曲の一覧を表示して、選択するための領域である。楽曲追加ボタン５３２は、選択対象のプレイリストに、新たな楽曲を追加する際に操作されるボタンである。

　この楽曲一覧エリア５３１に表示された楽曲の中から、図中の枠Ｆ２で囲まれた所望の楽曲が選択され、選択対象の楽曲の編集ボタン５３３が操作された場合、図２１の楽曲・前説後説編集画面５４０Ａ又は図２２の楽曲・前説後説編集画面５４０Ｂが表示される。

　図２１において、楽曲・前説後説編集画面５４０Ａは、選択対象の楽曲の前説と後説を編集するためのUIである。楽曲・前説後説編集画面５４０Ａは、前説記述エリア５４１Ａ、及び後説記述エリア５４２Ａを有する。

　前説記述エリア５４１Ａは、選択対象の楽曲に対し、前説のテキストを記述するための領域である。

　例えば、クリエイタ端末装置１０が、タッチパネルを有するスマートフォン等の機器である場合、クリエイタは、タッチパネルが重畳された表示部１２１に表示されるソフトウェアキーボードをタップ操作して、所望の前説をテキスト入力することができる。あるいは、クリエイタ端末装置１０が、クラウド上の音声認識API(Application Programming Interface)のサービスを利用可能である場合には、当該音声認識サービスを利用して、クリエイタによる所望の前説の音声入力をテキストに変換しても構わない。

　あるいは、クリエイタ端末装置１０が、キーボードを有するパーソナルコンピュータ等の機器である場合には、クリエイタは、キーボードを操作して、所望の前説のコメントを入力すればよい。

　後説記述エリア５４２Ａは、選択対象の楽曲に対し、後説のテキストを記述するための領域である。後説記述エリア５４２Ａには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の後説のテキストが入力される。

　また、図２２において、楽曲・前説後説編集画面５４０Ｂは、選択対象の楽曲の前説と後説を編集するためのUIである。楽曲・前説後説編集画面５４０Ｂは、前説記述エリア５４１Ｂ、及び後説記述エリア５４２Ｂを有する。

　前説記述エリア５４１Ｂは、選択対象の楽曲に対し、前説のテキストを記述するための領域である。前説記述エリア５４１Ｂには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の前説のテキストが入力される。

　後説記述エリア５４２Ｂは、選択対象の楽曲に対し、後説のテキストを記述するための領域である。後説記述エリア５４２Ｂには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の後説のテキストが入力される。

　このようにして、クリエイタは、プレイリストの各楽曲に、前説と後説のテキストを追加することで、プレイリストを番組化することができる。なお、上述した楽曲・前説後説編集画面５４０Ａ，５４０Ｂは、楽曲に対して前説と後説を設定するためのUIの一例であって、他のUIにより前説と後説を設定しても構わない。

　図２０の説明に戻り、プレイリスト編集画面５３０において、クリエイタにより所定の操作がなされた場合、図２３に示したプレイリスト設定画面５５０が表示される。

　図２３において、プレイリスト設定画面５５０は、音楽配信アプリの機能として提供される画面であって、番組化されたプレイリストに関する各種の設定を行うためのUIである。プレイリスト設定画面５５０は、設定エリア５５１を有する。

　設定エリア５５１には、番組化されたプレイリストの名前の変更、番組化されたプレイリストの公開、番組化されたプレイリストの削除などを設定するための項目を含む。この設定エリアに表示された項目の中から、図中の枠Ｆ３で囲まれた「公開する」がタップ操作された場合、番組化されたプレイリストが他のユーザに公開される。

　これにより、番組化されたプレイリストのスクリプト、つまり、番組のスクリプトが、番組配信サーバ３０Ａのデータベース３５３に格納され、ユーザ端末装置２０を使用するユーザにより閲覧可能とされる。

　このように、音楽配信サービスが提供する音楽配信アプリの一機能として、番組のクリエイション機能を追加することができる。

　例えば、クリエイタは、音楽配信サービスのプレミアムユーザとしてプレイリストを番組化して各楽曲に前説と後説を設定し、番組化されたプレイリストのスクリプトを公開することができる。このとき、音楽配信アプリにより生成されたスクリプトに設定される楽曲IDは、クリエイタが契約している音楽配信サービスで管理される楽曲のIDとされる。

（第２の例）
　図２４は、楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。

　図２４において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図１５を参照して説明した第１の例と同様である。

　図２４のステップＳ３１乃至Ｓ３３においては、図１５のステップＳ１１乃至Ｓ１３と同様に、番組作成ツールによって、番組のスクリプトが生成され、番組配信サーバ３０Ａに登録されている。

　番組レンダラでは、ユーザの操作によって、番組配信サーバ３０Ａ上で閲覧可能に公開されている番組の再生が指示された場合、番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される（Ｓ３４，Ｓ３５）。ここでは、例えば、ユーザによって、番組を、プレイリストとして再生するように指示されているものとする。

　番組レンダラは、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ３０Ｂに対し、受信したスクリプトに設定される楽曲IDにより特定される楽曲の配信を要求する（Ｓ３６）。

　楽曲配信サーバ３０Ｂでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され（Ｓ３７）、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる（Ｓ３８）。

　これにより、番組レンダラでは、楽曲配信サーバ３０Ｂから配信される楽曲のストリーミングデータが受信され、レンダリングが行われることで、楽曲IDにより特定される楽曲が再生される。

　また、番組のスクリプトには、複数の楽曲の楽曲IDが再生順にリスト化されているため、ステップＳ３６乃至Ｓ３８の処理が完了した後に、処理は、ステップＳ３６に戻り（Ｓ３９）、楽曲IDの数に応じてステップＳ３６乃至Ｓ３９の処理が繰り返される。

　これにより、番組レンダラでは、スクリプトに設定された楽曲IDの順に、楽曲の再生が繰り返して行われ、ユーザによって、プレイリストとして再生される楽曲が視聴可能とされる。

　このように、ユーザによりプレイリスト再生の要求を受け付けたときには、当該ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前説と後説の読み出しは行わずに、そのスクリプトに含まれる楽曲IDが示す楽曲が読み出されてユーザに提供される。

　以上、楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合において、各装置で実行される処理の流れを説明した。

（第３の例）
　図２５は、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合の処理の流れを示したシーケンス図である。

　図２５において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスとが、各配信サーバによりそれぞれ提供されることは、図１５を参照して説明した第１の例と同様である。一方で、図２５の第３の例では、図１５に示した第１の例とは異なり、音声配信サーバ３０Ｃによって、TTSサービスの代わりに、生声配信サービスが提供される。

　図２５のステップＳ５１乃至Ｓ５３においては、図１５のステップＳ１１乃至Ｓ１３と同様に、番組作成ツールによって、ポッドキャストの番組のスクリプトが生成され、番組配信サーバ３０Ａに登録される。

　ただし、図２５のシーケンス図では、楽曲の前説と後説を、テキストとしてスクリプトに含めるのではなく、クリエイタの生の声で前説と後説を読み上げているため、その音声データ（のファイル）が音声配信サーバ３０Ｃに登録される（Ｓ５４）。

　すなわち、番組配信サーバ３０Ａに登録されるスクリプトには、楽曲を特定する楽曲IDとともに、前説と後説の生声の音声データへのリンク情報が設定される。

　図２５のステップＳ５５，Ｓ５６においては、図１５のステップＳ１４，Ｓ１５と同様に、番組レンダラでは、番組配信サーバ３０Ａ上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される。

　番組レンダラは、受信したスクリプトの冒頭に設定される前説のリンク情報に基づき、音声配信サーバ３０Ｃにアクセスし、当該前説の生声配信を要求する（Ｓ５７）。

　音声配信サーバ３０Ｃでは、番組レンダラからの要求に応じて、クリエイタにより登録された前説の生声の音声データが処理され（Ｓ５８）、その生声の音声データが配信される（Ｓ５９）。

　これにより、番組レンダラでは、音声配信サーバ３０Ｃから配信される前説の生声の音声データが受信され、レンダリングが行われることで、番組化された楽曲に設定された前説の部分の生声が再生される。

　図２５のステップＳ６０乃至Ｓ６２においては、図１５のステップＳ１９乃至Ｓ２１と同様に、番組レンダラでは、受信したスクリプトの前説の次に設定される楽曲IDに基づき、楽曲配信サーバ３０Ｂからストリーミング配信される楽曲の再生が行われる。

　その後、ストリーミング配信される楽曲の再生が終了すると、番組レンダラが、受信したスクリプトの楽曲IDの次に設定される後説のリンク情報に基づき、音声配信サーバ３０Ｃにアクセスし、当該後説の生声配信を要求する（Ｓ６３）。

　音声配信サーバ３０Ｃでは、番組レンダラからの要求に応じて、クリエイタにより登録された後説の生声の音声データが処理され（Ｓ６４）、その生声の音声データが配信される（Ｓ６５）。

　これにより、番組レンダラでは、音声配信サーバ３０Ｃから配信される後説の生声の音声データが受信され、レンダリングが行われることで、番組化された楽曲に設定された後説の部分の生声が再生される。

　また、ポッドキャストの番組のスクリプトには、複数の楽曲の楽曲IDがその曲の前説と後説の生声のリンク情報とともに番組化されているため、ステップＳ５７乃至Ｓ６５の処理が完了した後に、処理は、ステップＳ５７の処理に戻り（Ｓ６６）、ステップＳ５７乃至Ｓ６６の処理が繰り返される。

　以上、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合において、各装置で実行される処理の流れを説明した。

（第４の例）
　図２６は、楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。

　図２６において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、生声配信サービスが、各配信サーバによりそれぞれ提供されることは、図２５を参照して説明した第３の例と同様である。

　図２６のステップＳ７１乃至Ｓ７４においては、図２５のステップＳ５１乃至Ｓ５４と同様に、番組作成ツールによって、番組のスクリプトが番組配信サーバ３０Ａに登録されるとともに、クリエイタの生の声で読み上げられた前説と後説の音声データ（のファイル）が音声配信サーバ３０Ｃに登録されている。

　番組レンダラでは、ユーザの操作によって、番組配信サーバ３０Ａ上で閲覧可能に公開されている番組の再生が指示された場合、番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される（Ｓ７５，Ｓ７６）。ここでは、例えば、ユーザによって、番組を、プレイリストとして再生するように指示されているものとする。

　番組レンダラは、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ３０Ｂに、受信したスクリプトに設定される楽曲IDにより特定される楽曲の配信を要求する（Ｓ７７）。

　楽曲配信サーバ３０Ｂでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され（Ｓ７８）、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる（Ｓ７９）。

　また、番組のスクリプトには、複数の楽曲の楽曲IDが再生順にリスト化されているため、ステップＳ７７乃至Ｓ７９の処理が完了した後に、処理は、ステップＳ７７に戻り（Ｓ８０）、ステップＳ７７乃至８０の処理が繰り返される。

　以上、楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合において、各装置で実行される処理の流れを説明した。

（処理の全体像）
　図２７と図２８は、第１の実施の形態における処理の全体像を説明するフローチャートである。

　図２７と図２８に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置１０（の制御部１００）と、ユーザ端末装置２０（の制御部２００）と、配信サーバ３０（の制御部３００）とが協働して動作することで実現される。

　すなわち、この処理は、制御部１００、制御部２００、及び制御部３００のうち、少なくともいずれか１つの制御部により実行される。

　コンテンツ提供システム１では、図２７に示すように、クリエイタ端末装置１０を使用するクリエイタからの入力があった場合（Ｓ２１１の「Yes」）、その入力に基づき、コンテンツの識別情報と、そのコンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され（Ｓ２１２）、そのスクリプトが、ユーザ端末装置２０を使用するユーザに閲覧可能に所定の記憶媒体に格納される（Ｓ２１３）。

　ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。例えば、楽曲を番組化するに際して、楽曲単位で前説又は後説を挿入するほか、前説としてナレーション等を挿入してから、３曲連続で楽曲を再生したり、４曲連続で楽曲を再生した後に、後説として曲の感想等を挿入したりしてもよい。

　コメント情報は、コメントを表すテキスト、又はクリエイタの生声へのリンク情報などを含む。なお、コメント情報は、コンテンツに関するコメントに対応するものとして説明するが、必ずしもコンテンツに関連するものとは限らず、コンテンツに関係しないコメントに対応するものでも構わない。所定の記憶媒体は、例えば、番組配信サーバ３０Ａの記憶部３０７（のデータベース３５３）とすることができる。

　また、コンテンツ提供システム１では、図２８に示すように、ユーザ端末装置２０を使用するユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合（Ｓ２３１の「Yes」）、まず、スクリプトに含まれるコメント情報に従って前説が読み出され、当該ユーザに提供するように制御される（Ｓ２３２）。

　ここで、所定の記憶媒体は、例えば、番組配信サーバ３０Ａの記憶部３０７（のデータベース３５３）とすることができる。また、スクリプトのコメント情報に従って読み出される前説は、TTS音声又は生声などの音声を含む。

　続いて、コンテンツ提供システム１では、スクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行され、当該ユーザに提供するように制御される（Ｓ２３３）。

　ここで、コンテンツ識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、例えば、特定のサービスは、音楽配信サービスであり、ユーザが既に獲得している権利は、有料のプレミアムユーザや、無料のフリーユーザの権利などを含む。

　また、コンテンツ提供システム１では、当該コンテンツの提供の後には、スクリプトに含まれるコメント情報に従って後説が読み出され、当該ユーザに提供するように制御される（Ｓ２３４）。

　ここで、スクリプトのコメント情報に従って読み出される後説には、TTS音声又は生声などの音声を含む。なお、コメント情報が示すコメント（前説や後説等のテキスト）を外国語に変換（翻訳）して、ユーザに提供しても構わない。例えば、システム側でユーザのプロファイルを把握している場合に、当該ユーザの母国語が分かっているときには、コメントを母国語に変換してテキストでユーザに提供してもよいし、あるいは、テキストをTTSにより音声合成してその音声合成結果をユーザに提供してもよい。

　以上のように、コンテンツを番組化するに際して、ユーザのサービスとの契約やテキスト音声合成等を利用して、コンテンツとともにそのコンテンツ等に関するコメントを提供しているため、より簡単に、コンテンツとそのコメントを提供することができる。

＜２．第２の実施の形態＞

　番組化された楽曲を配信する事業者は、ポッドキャストの番組を配信する事業者と同一の事業者に限らず、異なる事業者であってもよい。例えば、ある音楽配信サービスにより提供される特定の音楽配信アプリ上で作成した番組のスクリプトを、他の音楽配信サービスに提供することができる。

　具体的には、作成された番組のスクリプトが、特定の音楽配信アプリを提供する音楽配信サービスだけでなく、他の音楽配信サービスからも参照可能に格納されるようにする。その際に、特定の音楽配信アプリが認識可能な楽曲IDなどの識別情報に加えて、楽曲を検索できるようなメタデータが併せて格納されるようにする。例えば、このメタデータとしては、曲名、作詞家、作曲家、アーティスト名などを含めることができる。

　そして、他の音楽配信サービスでは、当該他の音楽配信サービスと契約しているユーザが使用するユーザ端末装置２０からの再生要求に応じて、メタデータに含まれる曲名などの情報を用い、自己が管理しているデータベースから楽曲を特定し、特定した楽曲をストリーミング配信すればよい。

　なお、ユーザと、他の音楽配信サービスとの契約により、その楽曲再生に関わる著作権処理は解消済みとされる。また、このような、他の音楽配信サービスから配信された楽曲の再生に応じたレベニューの一部が、特定の音楽配信アプリを提供した音楽配信サービスに還元されたり、その一部がクリエイタに還元されたりしてもよい。

　なお、第２の実施の形態におけるコンテンツ提供システム１の構成は、第１の実施の形態の構成と同様であるため、その説明は省略する。以下、コンテンツ提供システム１の各装置で実行される処理の流れを説明する。

（配信事業者が異なる場合の処理の流れ）
　図２９は、ある音楽配信サービスを利用して作成したスクリプトを他の音楽配信サービスに提供する場合の処理の流れを説明するシーケンス図である。

　図２９の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、生声配信サービスが、各配信サーバによりそれぞれ提供されることは、図２５を参照して説明した第３の例などと同様である。

　また、図２９の例では、音楽配信サービスＡを提供するＡ社の楽曲配信サーバ３０Ｂ－１と、音楽配信サービスＢを提供するＢ社の楽曲配信サーバ３０Ｂ－２が設けられ、番組配信サーバ３０Ａは、Ａ社により提供されるものとする。また、ユーザ端末装置２０では、Ｂ社により提供される音楽配信アプリとしての番組レンダラが実行されているものとする。

　図２９のステップＳ９１乃至Ｓ９４においては、図２５のステップＳ５１乃至Ｓ５４と同様に、クリエイタ端末装置１０により実行される番組作成ツールによって、番組のスクリプトがＡ社の番組配信サーバ３０Ａに登録されるとともに、クリエイタの生の声で読み上げられた前説と後説の音声データ（のファイル）が音声配信サーバ３０Ｃに登録されている。

　ユーザ端末装置２０では、Ｂ社の番組レンダラが実行され、ユーザの操作によって、Ａ社の番組配信サーバ３０Ａ上で閲覧可能に公開されている番組の再生が指示された場合、Ａ社の番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される（Ｓ９５，Ｓ９６）。

　このスクリプトには、番組化された楽曲に関して、楽曲IDの他に、コンテンツを検索するためのメタデータが含まれる。

　例えば、メタデータとしては、曲名、作詞家、作曲家、アーティスト名などを含む。より具体的には、図７に示したスクリプトにおける"title"や"artist"等の項目に指定される情報を、メタデータとして用いることができる。

　次に、Ｂ社の番組レンダラは、受信したスクリプトに基づき、ユーザが契約している音楽配信サービスＢを提供するＢ社の楽曲配信サーバ３０Ｂ－２に、メタデータにより特定される楽曲の配信を要求する（Ｓ９７）。

　楽曲配信サーバ３０Ｂ－２では、Ｂ社の番組レンダラからの要求に応じて、ユーザによる音楽配信サービスＢとの契約により獲得している権利が確認され、当該ユーザが正当な権利を有すると判定された場合、メタデータを用いた楽曲の特定が行われる（Ｓ９８）。

　楽曲配信サーバ３０Ｂ－２では、音楽配信サービスＢで配信している楽曲を対象として、メタデータを用いた楽曲の検索が行われることで、メタデータにより楽曲が特定できた場合、ユーザ端末装置２０に対し、当該楽曲のストリーミング配信が行われる（Ｓ９９）。

　この場合、Ｂ社の番組レンダラでは、当該楽曲の提供の前に、スクリプトに設定される前説のリンク情報に基づき、音声配信サーバ３０Ｃにアクセスすることで、番組化された楽曲に設定された前説の部分の生声が再生される（Ｓ１０１乃至Ｓ１０２）。続いて、Ｂ社の番組レンダラでは、Ｂ社の楽曲配信サーバ３０Ｂ－２からストリーミング配信された楽曲の再生が行われる。

　その後、ストリーミング配信される楽曲の再生が終了すると、Ｂ社の番組レンダラでは、スクリプトに設定される後説のリンク情報に基づき、音声配信サーバ３０Ｃにアクセスすることで、番組化された楽曲に設定された後説の部分の生声が再生される（Ｓ１０３乃至Ｓ１０５）。

　なお、ステップＳ９７乃至Ｓ１０６の処理が繰り返されることで、Ｂ社の番組レンダラでは、スクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。

　一方で、ステップＳ９８の処理で、Ｂ社の楽曲配信サーバ３０Ｂ－２によって、Ｂ社の番組レンダラからの要求に含まれるメタデータにより楽曲を特定できなかった場合には、例えば、次のような処理が行われる。

　第１に、Ｂ社の楽曲配信サーバ３０Ｂ－２は、Ｂ社の番組レンダラに対してその旨を応答し、特定できなかった楽曲とその楽曲の前説と後説の再生がスキップされるようにする。これにより、ユーザ端末装置２０では、Ｂ社の番組レンダラによって、対象の楽曲がスキップされ、次の楽曲（又は次の楽曲の前説）の再生が開始される。

　第２に、Ｂ社の楽曲配信サーバ３０Ｂ－２は、Ａ社の楽曲配信サーバ３０Ｂ－１から、メタデータに応じた楽曲のサンプル曲が、ユーザ端末装置２０に配信されるようにする。これにより、ユーザ端末装置２０では、Ｂ社の番組レンダラによって、ユーザが未契約の音楽配信サービスＡから配信されるサンプル曲が再生される。

　なお、図２９の例では、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合を示したが、楽曲の前説と後説が音声合成を利用して提供されても構わない。

（処理の全体像）
　図３０と図３１は、第２の実施の形態における処理の全体像を説明するフローチャートである。

　図３０と図３１に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置１０（の制御部１００）と、ユーザ端末装置２０（の制御部２００）と、配信サーバ３０（の制御部３００）とが協働して動作することで実現される。

　コンテンツ提供システム１では、図３０に示すように、クリエイタ端末装置１０を使用するクリエイタからの入力があった場合（Ｓ３１１の「Yes」）、その入力に基づき、第１のサービスが認識可能なコンテンツの識別情報と、コンテンツを検索するためのメタデータと、コンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され（Ｓ３１２）、そのスクリプトが、ユーザ端末装置２０を使用するユーザに閲覧可能に所定の記憶媒体に格納される（Ｓ３１３）。

　ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。

　また、第１のサービスは、例えば、Ａ社が提供する音楽配信サービスＡである。また、メタデータには、曲名等が含まれる。所定の記憶媒体は、例えば、番組配信サーバ３０Ａのデータベース３５３とすることができる。

　また、コンテンツ提供システム１では、図３１に示すように、第２のサービスと契約しているユーザによって、所定の記憶媒体に記録されたスクリプトへの再生要求がなされた場合（Ｓ３３１の「Yes」）、コンテンツを検索するためのメタデータに基づき、第２のサービスが管理するコンテンツの中から、対応するコンテンツを特定する処理が行われ（Ｓ３３２）、対応するコンテンツが特定できたか否かが判定される（Ｓ３３３）。

　ここで、第２のサービスは、例えば、Ｂ社が提供する音楽配信サービスＢである。また、コンテンツは、音楽配信サービスで配信される楽曲などを含み、メタデータには、曲名等が含まれる。

　ステップＳ３３３の判定処理で、対応するコンテンツが特定できたと判定された場合には、ユーザが第２のサービスとの契約により既に獲得している権利を利用して、当該コンテンツの読み出しが実行され、当該ユーザに提供するように制御される（Ｓ３３４）。

　すなわち、ユーザが既に獲得している権利は、Ｂ社が提供する音楽配信サービスＢにおける有料のプレミアムユーザや、無料のフリーユーザの権利などを含み、ユーザ端末装置２０では、音楽配信サービスＢから配信される楽曲が再生される。

　一方で、ステップＳ３３３の判定処理で、対応するコンテンツが特定できなかったと判定された場合には、当該コンテンツ及び対応するコメントの読み出しがスキップされるように制御されるか、あるいは、第１のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しが実行され、ユーザに提供するように制御される（Ｓ３３５）。

　すなわち、ユーザ端末装置２０では、再生対象の楽曲とその楽曲の前説と後説がスキップされるか、あるいは、Ａ社が提供する音楽配信サービスＡから配信されるサンプル曲が再生される。

＜３．第３の実施の形態＞

　番組化された楽曲に設定される前説と後説に対して、例えば、誹謗中傷用語などの楽曲の前説や後説として相応しくないワードや文脈などを自動で特定し、そのようなワードや文脈などが特定された文章が存在する場合には、番組の作成段階で警告を表示したり、番組の登録段階で登録を不許可にしたりすることができる。

　また、番組が登録された後に、楽曲の著作権者等から、特定の前説や後説と楽曲との連続再生を許可しない旨の指摘があった場合には、例えば、その前説や後説のみ再生を禁止したり（楽曲の再生は可能）、その前説、楽曲、後説の順の再生を禁止したり、楽曲そのものの再生を禁止したりしてもよい。

　このように、ポッドキャストの番組の登録や提供を行うに際して、最低限の利用許諾機能を用いることができる。

（配信サーバの他の構成）
　図３２は、配信サーバ３０における制御部３００の機能的構成の他の例を示している。

　図３２においては、図１４と同様に、制御部３００が、要求受付・応答部３５１、配信処理部３５２、及びデータベース３５３を有しているが、文章チェック部１６１がさらに設けられている。

　番組配信サーバ３０Ａにおいて、配信処理部３５２は、番組作成ツールから番組のスクリプトの登録が要求されたとき、当該番組のスクリプトに含まれる前説と後説のテキストを、文章チェック部１６１に供給する。

　文章チェック部１６１は、配信処理部３５２から供給される前説と後説のテキストに対して、文章チェック処理を行い、その文章チェックの結果を、配信処理部３５２に供給する。

　この文章チェック処理では、例えば、形態素解析や構文解析を含む自然言語処理などが行われ、前説や後説のテキストの文章が解析されて、誹謗中傷用語などの単語や文脈（文意）などが含まれるかどうかがチェックされる。

　配信処理部３５２は、文章チェック部１６１から供給される文章チェックの結果が、前説と後説の文章として相応しいことを示している場合、番組作成ツールから登録を要求された番組のスクリプトを、データベース３５３に格納する。

　なお、文章チェック部１６１は、例えば、番組配信サーバ３０Ａの内部に設けることができるが、外部のサーバとして設けられるようにして、番組配信サーバ３０Ａからの要求に応じて、文章のチェックを行い、その文章チェックの結果を応答するようにしても構わない。

（文章チェックを行う場合の処理の流れ）
　図３３は、文章チェックを行う場合の処理の流れを示したシーケンス図である。

　図３３の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図１５を参照して説明した第１の例などと同様であるが、番組配信サーバ３０Ａでは、文章チェックに関する処理も実行される。

　クリエイタ端末装置１０では、番組作成ツールが実行され、各配信サーバ３０と協働して動作することで、ステップＳ１１１乃至１２４の処理が実行される。

　番組作成ツールは、楽曲配信サーバ３０Ｂから送信されてくる楽曲リストを取得し、クリエイタに提示する（Ｓ１１１）。

　番組作成ツールは、クリエイタにより楽曲リストから選択された楽曲の楽曲IDと、クリエイタにより入力された当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組のスクリプトを生成し（Ｓ１１２）、番組配信サーバ３０Ａに対して登録依頼を行う（Ｓ１１３）。

　このとき、番組配信サーバ３０Ａでは、番組作成ツールにより登録が要求された前説と後説のテキストを、文章チェック部３６１に送ることで、前説と後説の文章チェックを要求する（Ｓ１１４）。

　文章チェック部３６１では、文章チェックの要求に応じて、前説と後説のテキストの文章チェックが行われ（Ｓ１１５）、その文章チェックの結果を通知する（Ｓ１１６）。

　番組配信サーバ３０Ａでは、文章チェック部３６１からの応答に基づき、文章チェックの結果が、番組作成ツールに通知される（Ｓ１１７）。これにより、番組作成ツールでは、文章チェックの結果が表示される（Ｓ１１８）。

　例えば、文章チェック部３６１は、前説と後説の文章として相応しくないと判定した場合、不許可である旨を通知する。

　この不許可の通知に際しては、チェックされた文章における不許可になった箇所を通知してもよい。この不許可箇所を含む不許可通知は、番組作成ツールに通知され、クリエイタに対し、当該クリエイタにより入力された楽曲の前説と後説が不許可であることと、その不許可になった箇所の文章が提示される。

　クリエイタは、番組作成ツールにより提示された通知に基づき、番組化する楽曲の前説と後説の文章を修正することができる。

　番組作成ツールは、クリエイタにより修正された楽曲の前説と後説のテキストに基づき、ポッドキャストの番組を再生成し（Ｓ１１９）、番組配信サーバ３０Ａに対して再度の登録依頼を行う（Ｓ１２０）。

　このとき、番組配信サーバ３０Ａは、番組作成ツールにより登録が要求された前説と後説のテキストを、文章チェック部３６１に送ることで、前説と後説の文章チェックを要求する（Ｓ１２１）。

　文章チェック部３６１では、文章チェックの要求に応じて、前説と後説のテキストの文章チェックが行われ（Ｓ１２２）、その文章チェックの結果を通知する（Ｓ１２３）。

　例えば、文章チェック部３６１は、前説と後説の文章として相応しいと判定した場合、許可である旨を通知する。

　番組配信サーバ３０Ａでは、文章チェック部３６１からの許可通知に基づき、番組作成ツールから再登録が依頼された修正後の楽曲の前説と後説のテキストを含む番組のスクリプトがデータベース３５３に格納され、ユーザ端末装置２０を使用するユーザによって閲覧可能とされる（Ｓ１２４）。

（処理の全体像）
　図３４は、第３の実施の形態における処理の全体像を説明するフローチャートである。

　図３４に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置１０（の制御部１００）と、配信サーバ３０（の制御部３００）とが協働して動作することで実現される。

　コンテンツ提供システム１では、図３４に示すように、クリエイタ端末装置１０を使用するクリエイタからの入力に応じたスクリプトが生成された場合（Ｓ４１１の「Yes」）、そのスクリプトに含まれる、コンテンツの前説と後説に対応するコメント情報が示すコメントの内容が分析され（Ｓ４１２）、その分析結果に基づき、当該コメントの内容がコンテンツに関するコメントとして相応しいかどうかが判定される（Ｓ４１３）。

　ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。

　ステップＳ４１３の判定処理で、当該コメントの内容がコンテンツに関するコメントとして相応しいと判定された場合には、そのコメント情報を含むスクリプトが、ユーザ端末装置２０を使用するユーザに閲覧可能に所定の記憶媒体に格納される（Ｓ４１４）。

　すなわち、番組化する楽曲の前説や後説に、誹謗中傷用語などのワードや文脈などが含まれていない場合には、前説や後説に相応しいと判断され、その番組のスクリプトが、番組配信サーバ３０Ａのデータベース３５３に登録される。

　一方で、ステップＳ４１３の判定処理で、当該コメントの内容がコンテンツに関するコメントとして相応しくないと判定された場合には、その旨が、クリエイタが使用するクリエイタ端末装置１０に通知される。

　すなわち、番組化する楽曲の前説や後説に、誹謗中傷用語などのワードや文脈などが含まれる場合には、それらが自動で特定され、番組作成ツールによる番組の作成段階で警告を表示したり、番組の登録段階で登録を不許可にしたりする。

＜４．第４の実施の形態＞

　ポッドキャストの番組には、広告を挿入してもよい。例えば、番組化された楽曲に設定される前説又は後説の少なくともいずれか一方の内容を分析し、その分析結果に応じて、関連する広告を、前説の前、又は後説の後に挿入することができる。

　番組に挿入される広告は、例えば、スクリプトにテキストで記述することができ、前説と後説のテキストの音声合成と同じ音素に基づいて、音声合成を行うことができる。

　すなわち、ユーザ端末装置２０では、ユーザによって選択された番組のスクリプトに従い、そのスクリプトに含まれる前説と後説を特定の音声で音声合成してユーザに提供した場合に、広告のテキストも、当該特定の音声で音声合成してユーザに提供するようにする。

（システムの他の構成）
　図３５は、本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示している。

　図３５においては、図８と同様に、コンテンツ提供システム１が、クリエイタ端末装置１０、ユーザ端末装置２０、番組配信サーバ３０Ａ、楽曲配信サーバ３０Ｂ、及び音声配信サーバ３０Ｃを含んでいるが、広告配信サーバ３０Ｄがさらに設けられている。

　広告配信サーバ３０Ｄは、広告配信サービスを提供する１又は複数のサーバから構成される。広告配信サービスは、インターネットを通じて広告を配信するサービスであり、例えば、広告配信事業者により提供される。

　例えば、広告配信サーバ３０Ｄは、番組配信サーバ３０Ａからの要求に応じて、広告管理用や広告用のデータベース３５３で管理している広告を特定し、特定した広告（広告本文）を配信する。

　なお、広告配信サーバ３０Ｄは、図１３と図１４に示した配信サーバ３０の構成と制御部３００の機能的構成と同様の構成を有している。

（広告の例）
　図３６は、ポッドキャストの番組のスクリプトに挿入される広告の例を示している。

　上述したように、ポッドキャストの番組のスクリプトには、番組化される楽曲（song）と、その楽曲の前説（Warm-up）と後説（After-song）とがセットになって記述されるが、図３６では、後説の後に、広告のテキストが挿入されている。

　図３６の例では、前説に、「・・・、今でも夏に聞きたくなる、・・・」であるテキストが含まれ、後説に、「・・・暑い夏が本当に楽しくなる曲ですね！」であるテキストが含まれており、これらのテキストが分析される。

　番組のスクリプトでは、これらのテキストの分析結果に応じて、「夏」であるキーワードに関する広告として、「夏の暑い日には、やっぱりビール。のど越し爽やかＸ社のドライ！」であるテキストからなるビールの広告が挿入されている。また、ビールの広告のテキストとともに、Ｘ社のビールに関するウェブページのURL(Uniform Resource Locator)も記述されている。

　ここで、前説と後説のテキストを音声合成してTTS音声を読み上げる場合には、そのテキストに対する自然言語処理などにより、テキストの文章の分析を行うことができるため、生声配信に際して生声の分析を行う場合と比べて、より正確な分析を行うことができる。

　そのため、前説と後説のテキストを分析することで、より関連の深い広告を提示することができる。例えば、「この曲を聴きながら、ワインを飲みたいですね。」である前説や後説のナレーションがあった場合に、ワインの広告を提示することができる。

　また、挿入された広告のテキストを、音声合成してTTS音声を読み上げる際には、そのまま読み上げても構わないが、例えば、DJの口調に合わせて読み上げたり、方言で読み上げたりしてもよい。あるいは、広告のTTS音声の口調を、前説や後説のTTS音声の口調と合わせてもよい。

　なお、図３６の例では、後説の後に広告を挿入した場合を示したが、広告は、任意の場所に挿入することができ、特に、楽曲との関係から、広告を、前説の前、又は後説の後に挿入するのが好適である。

（番組に広告を挿入する場合の処理の流れ）
　図３７は、番組に広告を挿入する場合の処理の流れを示したシーケンス図である。

　図３７の例では、番組レンダラが、ユーザ端末装置２０で実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図１５を参照して説明した第１の例などと同様であるが、広告配信サービスと広告管理DBを提供する広告配信サーバ３０Ｄが設けられている。

　番組配信サーバ３０Ａでは、ユーザにより操作される番組レンダラによって、閲覧可能に公開しているポッドキャストの番組の再生が指示された場合、当該番組のスクリプトが分析される（Ｓ１３１，Ｓ１３２）。

　番組配信サーバ３０Ａでは、当該番組のスクリプトの分析結果に応じた要求を、広告配信サーバ３０Ｄに送信することで、広告管理データベース３５３から、ワード・広告リストが取得される（Ｓ１３３，Ｓ１３４）。

　例えば、スクリプトの分析に際しては、スクリプトに設定された前説と後説のテキストの文章が解析され、その文章に含まれる単語や文意が抽出され、さらに、番組における広告の挿入場所が決定される。また、広告管理データベース３５３には、単語や文意が広告IDと対応付けられているため、ワード・広告リストとして、前説と後説に応じた広告IDが取得される。

　また、番組配信サーバ３０Ａでは、広告IDを含む要求を、広告配信サーバ３０Ｄに送信することで、広告（広告本文）が取得される（Ｓ１３５，Ｓ１３６）。

　すなわち、広告配信サーバ３０Ｄでは、広告IDと広告本文とが対応付けられて広告データベース３５３により管理されているため、番組配信サーバ３０Ａは、前説と後説に応じた広告IDにより特定される広告本文を取得し、決定した挿入場所に差し込むことができる（Ｓ１３７）。広告が挿入された番組のスクリプトは、番組レンダラに送信される（Ｓ１３８）。

　ステップＳ１３９乃至Ｓ１４７においては、図１５のステップＳ１６乃至Ｓ２４と同様に、番組レンダラでは、番組のスクリプトに設定された前説、楽曲IDにより特定される楽曲、後説の順に再生が行われ、当該番組が視聴可能とされる。

　また、番組のスクリプトには、後説の後に、広告のテキストが挿入されているため、番組レンダラは、TTSサービスを提供する音声配信サーバ３０Ｃに、当該広告のテキストの音声合成を要求する（Ｓ１４８）。

　音声配信サーバ３０Ｃでは、番組レンダラからの要求に応じて、広告のテキストの音声合成が行われ（Ｓ１４９）、その音声合成の結果が配信される（Ｓ１５０）。

　これにより、番組レンダラでは、音声配信サーバ３０Ｃから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組に挿入された広告の部分のTTS音声が再生される。

　また、ポッドキャストの番組のスクリプトには、複数の曲の楽曲IDがその曲の前説と後説のテキストとともに番組化されているため、ステップＳ１３９乃至Ｓ１５０の処理が完了した後に、ステップＳ１３９の処理に戻り（Ｓ１５１）、楽曲IDの数に応じてステップＳ１３９乃至Ｓ１５１の処理が繰り返される。

　これにより、番組レンダラでは、番組のスクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。

　また、前説の前や後説の後ろなどに、前説や後説に関連した広告が挿入されている場合には、広告のTTS音声も再生されるため、ユーザに対して、前説や後説、楽曲と、広告とをリンクさせることができる。なお、広告は、音声出力に限らず、GUI(Graphical User Interface)として提示してもよく、例えば、音楽配信アプリの画面の所定の領域に広告を表示することができる。

　なお、例えば、前説や後説等のコメントの生声の音声データを配信する場合には、その生声の音声データを学習素材とすることにより、特定の音楽を作成し、その特定の音楽により音声合成を行うTTSを作成してもよい。このTTSによって、音声配信サーバ３０Ｃが広告のテキストを音声合成し、ユーザ端末装置２０に配信するようにしてもよい。これにより、ユーザが好きな生声に近い音声で広告が提供されるため、広告のコンバージョン率の向上などに繋がる可能性がある。

　また、図３７に示したシーケンス図では、説明を簡略化するため、番組配信サービスと番組分析に関する処理が共に、番組配信サーバ３０Ａにより実行されるとして説明したが、それらの処理は、別々のサーバにより実行されてもよい。また、広告配信サービスと広告管理DBに関する処理が共に、広告配信サーバ３０Ｄにより実行されるとして説明したが、それらの処理は、別々のサーバにより実行されてもよい。

（処理の全体像）
　図３８は、第４の実施の形態における処理の全体像を説明するフローチャートである。

　図３８に示した処理は、本技術を適用したコンテンツ提供システムにおけるユーザ端末装置２０（の制御部２００）と、配信サーバ３０（の制御部３００）とが協働して動作することで実現される。

　コンテンツ提供システム１では、図３８に示すように、ユーザ端末装置２０を使用するユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合（Ｓ５１１の「Yes」）、そのスクリプトに含まれるコメント情報が示すコメントの内容が分析される（Ｓ５１２）。

　ここで、コメントには、コンテンツとしての楽曲の前説と後説のうち、少なくともいずれか一方を含み、例えば、それらの前説と後説のテキストの文章が解析され、その文章に含まれる単語や文意が抽出されることで、前説と後説の内容が分析される。

　そして、コンテンツ提供システム１では、コメントの内容の分析結果に基づき、広告配信サーバ３０Ｄから広告データ（広告本文）が取得され（Ｓ５１３）、当該広告データが、提供されるコメントの前又は後に、ユーザに提供するように制御される（Ｓ５１４）。

＜５．変形例＞

　ポッドキャストの番組のスクリプトに記述される楽曲ID等のコンテンツ識別情報として、各レコード会社が保有するオリジナルのIDを用いるようにしてもよい。

（システムの他の構成）
　図３９は、本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示している。

　図３９においては、図８と同様に、コンテンツ提供システム１が、クリエイタ端末装置１０、ユーザ端末装置２０、番組配信サーバ３０Ａ、楽曲配信サーバ３０Ｂ、及び音声配信サーバ３０Ｃを含んでいるが、ID管理サーバ３１がさらに設けられている。

　ID管理サーバ３１は、管理データベースによって、音楽配信サービスごとに用いられる楽曲IDを紐付けて管理する。ID管理サーバ３１は、ユーザ端末装置２０等の機器からの要求に応じて、管理している楽曲IDに関する情報を提供する。

　なお、ID管理サーバ３１は、図１３に示した配信サーバ３０の構成と同様の構成を有している。

（番組情報を共有化する場合の処理の流れ）
　図４０は、楽曲IDを管理して番組情報を共有化する場合の処理の流れを示したシーケンス図である。

　図４０の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスが、各配信サーバによりそれぞれ提供されることは、図１５を参照して説明した第１の例などと同様である。

　また、図４０の例では、音楽配信サービスＡを提供するＡ社の楽曲配信サーバ３０Ｂ－１と、音楽配信サービスＢを提供するＢ社の楽曲配信サーバ３０Ｂ－２が設けられ、番組配信サーバ３０Ａは、Ａ社により提供されるものとする。

　また、番組IDの管理を行うID管理サーバ３１が設けられている。さらに、ユーザ端末装置２０では、Ｂ社により提供される音楽配信アプリとしての番組レンダラが実行されているものとする。

　ID管理サーバ３１には、Ａ社の楽曲配信サーバ３０Ｂ－１から送信されてくる、音楽配信サービスＡで用いられる楽曲IDと、Ｂ社の楽曲配信サーバ３０Ｂ－２から送信されてくる、音楽配信サービスＢで用いられる楽曲IDがそれぞれ受信される（Ｓ１７１，Ｓ１７２）。これらの楽曲IDは、Ａ社とＢ社のそれぞれが保有するオリジナルのIDとされる。

　ID管理サーバ３１では、楽曲マスタIDを用い、音楽配信サービスＡで用いられる楽曲IDと、音楽配信サービスＢで用いられる楽曲IDとが紐付けて管理される。

　ステップＳ１７３乃至Ｓ１７５においては、図１５のステップＳ１１乃至Ｓ１３と同様に、クリエイタ端末装置１０により実行される番組作成ツールによって、Ａ社の楽曲配信サーバ３０Ｂ－１から送信される楽曲リストなどに基づき、Ａ社の楽曲IDが付与された楽曲を含む番組のスクリプトが生成され、Ａ社の番組配信サーバ３０Ａに登録されている。

　このとき、ユーザ端末装置２０では、Ｂ社の番組レンダラが実行され、音楽配信サービスＢと契約しているユーザの操作によって、番組配信サーバ３０Ａ上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ３０Ａから配信される当該番組のスクリプトが受信される（Ｓ１７６，Ｓ１７７）。

　Ｂ社の番組レンダラは、受信したスクリプトに設定されたＡ社の楽曲IDのリストをID管理サーバ３１に送信して、楽曲IDの変換を要求する（Ｓ１７８）。

　ID管理サーバ３１では、番組レンダラからの要求に応じて、Ａ社の楽曲IDのリストを、Ｂ社の楽曲IDのリストに変換して、Ｂ社の番組レンダラに送信する（Ｓ１７９，Ｓ１８０）。

　すなわち、番組のスクリプトに設定された楽曲IDがＡ社のオリジナルのIDである一方で、ユーザは、Ｂ社の音楽配信サービスＢと契約しているため、このままでは、音楽配信サービスＢを利用して、当該楽曲IDにより特定される楽曲を再生することはできない。

　そこで、ID管理サーバ３１は、ID変換によって、Ａ社のオリジナルの楽曲IDを、Ｂ社のオリジナルの楽曲IDに変換することで、Ｂ社の音楽配信サービスＢを利用して、スクリプトに設定されたＡ社の楽曲IDにより特定される楽曲を再生可能にしている。

　番組レンダラは、音楽配信サービスＢを提供する楽曲配信サーバ３０Ｂ－２に対し、変換後の楽曲IDにより特定される楽曲の配信を要求する（Ｓ１８１）。

　Ｂ社の楽曲配信サーバ３０Ｂ－２では、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスＢとの契約により獲得している権利が確認され（Ｓ１８２）、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、Ｂ社の番組レンダラに対し、当該楽曲のストリーミング配信が行われる（Ｓ１８３）。

　これにより、Ｂ社の番組レンダラでは、Ｂ社の楽曲配信サーバ３０Ｂ－２から配信される楽曲のストリーミングデータが受信され、レンダリング処理が行われることで、楽曲IDにより特定される楽曲が再生される。

　なお、ここでは、説明を分かりやすくするために省略したが、ポッドキャストの番組のスクリプトにでは、楽曲IDが、前説と後説のテキストとともに番組化されているため、その楽曲IDにより特定される楽曲を紹介する前説の部分の音声が再生された後に、当該楽曲の再生が行われ、当該楽曲の再生後に後説の部分の音声が再生されることになる。

　また、ポッドキャストの番組のスクリプトには、複数の楽曲の楽曲IDが、その楽曲の前説と後説のテキストとともに番組化されているため、ステップＳ１８１乃至Ｓ１８３の処理が完了した後に、ステップＳ１８１に戻り（Ｓ１８４）、ステップＳ１８１乃至Ｓ１８４の処理が繰り返される。

　これにより、Ｂ社の番組レンダラでは、番組のスクリプトに設定されたＡ社の楽曲IDごとに、前説、楽曲（Ｂ社の音楽配信サービスＢにより配信される楽曲）、後説の順に再生が繰り返して行われる。

（処理の全体像）
　図４１と図４２は、変形例における処理の全体像を説明するフローチャートである。

　図４１と図４２に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置１０（の制御部１００）と、ユーザ端末装置２０（の制御部２００）と、配信サーバ３０（の制御部３００）と、ID管理サーバ３１（の制御部）が協働して動作することで実現される。

　コンテンツ提供システム１では、図４１に示すように、クリエイタ端末装置１０を使用するクリエイタからの入力があった場合（Ｓ６１１の「Yes」）、当該クリエイタからの入力に基づき、第１のサービスが認識可能な第１のコンテンツ識別情報と、そのコンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され（Ｓ６１２）、当該スクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納される（Ｓ６１３）。

　コメント情報は、コメントを表すテキスト、又は生声へのリンク情報などを含む。また、第１のサービスは、例えば、Ａ社が提供する音楽配信サービスＡである。所定の記憶媒体は、例えば、番組配信サーバ３０Ａのデータベース３５３とすることができる。

　また、コンテンツ提供システム１では、図４２に示すように、第２のサービスと契約しているユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合（Ｓ６３１の「Yes」）、第１のコンテンツ識別情報に対応する第２のサービスが認識可能な第２のコンテンツ識別情報が特定され（Ｓ６３２）、第２のサービスが管理するコンテンツより、第２のコンテンツ識別情報に対応するコンテンツが特定され（Ｓ６３３）、ユーザが第２のサービスとの契約により既に獲得している権利を利用して、当該コンテンツの読み出しが実行され、ユーザに提供するように制御される（Ｓ６３４）。

　ここで、第２のサービスは、例えば、Ｂ社が提供する音楽配信サービスＢであり、ユーザが既に獲得している権利は、有料のプレミアムユーザや、無料のフリーユーザの権利などを含む。

（その他の変形例）
　なお、ユーザ端末装置２０において、番組レンダラにより楽曲を再生する際には、キャラクタや画像を付加することで、ビデオジョッキー（VJ：Video Jockey）化も可能である。

＜６．コンピュータの構成＞

　上述したフローチャートの各ステップの処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体をドライブに装着することにより、入出力I/Fを介して、記憶部にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部で受信し、記憶部にインストールすることができる。その他、プログラムは、ROMや記憶部に、あらかじめインストールしておくことができる。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

　また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されてもよい。

　さらに、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　なお、本技術は、以下のような構成をとることができる。

（１）
　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備える
　コンテンツ提供システム。
（２）
　前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを音声合成してユーザに提供するように制御する
　前記（１）に記載のコンテンツ提供システム。
（３）
　前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としての音声データへのリンク情報にアクセスして音声データを読み出しユーザに提供するように制御する
　前記（１）に記載のコンテンツ提供システム。
（４）
　前記制御部は、前記ユーザによりプレイリスト再生の要求を受け付けたときには、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報に応じたコメントの読み出しは行わず、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツを読み出しユーザに提供するように制御する
　前記（１）乃至（３）のいずれかに記載のコンテンツ提供システム。
（５）
　前記制御部は、
　　クリエイタによって生成された、コンテンツの識別情報と、そのコンテンツを紹介する前説に対応する第１のコメント情報と、そのコンテンツの再生後の後説に対応する第２のコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記第１のコメント情報に従って前説を読み出してユーザに提供し、
　　前記第１のコメント情報に続くコンテンツ識別情報が示すコンテンツを読み出してユーザに提供し、
　　前記コンテンツ識別情報に続く前記第２のコメント情報に従って後説を読み出してユーザに提供する
　ように制御する
　前記（１）乃至（４）のいずれかに記載のコンテンツ提供システム。
（６）
　前記制御部は、
　　クリエイタによって生成された、特定のサービスが認識可能なコンテンツ識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが前記特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する
　前記（１）に記載のコンテンツ提供システム。
（７）
　前記制御部は、
　　クリエイタによって生成された、第１のサービスが認識可能なコンテンツ識別情報、コンテンツを検索するためのメタデータ、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　当該スクリプトが、前記第１のサービスとは異なる第２のサービスと契約を交わしているユーザによって選択されたときには、前記メタデータにより前記第２のサービスが管理するコンテンツにより、対応するコンテンツを特定し、当該ユーザが前記第２のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供するように制御する
　前記（６）に記載のコンテンツ提供システム。
（８）
　前記制御部は、前記スクリプトが、前記第２のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第２のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、当該コンテンツ、及び対応するコメントの読み出しもスキップするように制御する
　前記（７）に記載のコンテンツ提供システム。
（９）
　前記制御部は、前記スクリプトが、前記第２のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第２のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、前記第１のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しを実行しユーザに提供するように制御する
　前記（７）に記載のコンテンツ提供システム。
（１０）
　前記制御部は、
　　クリエイタによって生成された前記スクリプトが前記所定の記憶媒体に格納される前に、当該スクリプトに含まれる前記コメント情報が示すコメント内容を分析し、
　　その分析結果に基づいて、前記コンテンツに関するコメントとして相応しくないと判定した場合に、その旨を前記ユーザに通知するように制御する
　前記（１）乃至（９）のいずれかに記載のコンテンツ提供システム。
（１１）
　前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントの相応しくない箇所を前記ユーザに通知するように制御する
　前記（１０）に記載のコンテンツ提供システム。
（１２）
　前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントに対応する前記コメント情報を含んだスクリプトが、前記所定の記憶媒体に格納されないように制御する
　前記（１０）又は（１１）に記載のコンテンツ提供システム。
（１３）
　前記制御部は、
　　ユーザによって選択されたスクリプトに含まれる前記コメント情報が示すコメントの内容を分析し、
　　その分析結果に応じて、広告配信サーバから取得した広告データを、前記コンテンツのユーザへの提供の前に、提供されるコメントの前、又は前記コンテンツのユーザへの提供の後に、提供されるコメントの後に、ユーザに提供するように制御する
　前記（１）乃至（１２）のいずれかに記載のコンテンツ提供システム。
（１４）
　前記制御部は、
　　前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを特定の音素で音声合成してユーザに提供し、
　　前記広告データとしてのテキストも、前記特定の音素で音声合成してユーザに提供するように制御する
　前記（１３）に記載のコンテンツ提供システム。
（１５）
　前記制御部は、前記ユーザによって選択されたスクリプトに含まれる前記コメント情報としてのテキストの内容を分析する
　前記（１３）又は（１４）に記載のコンテンツ提供システム。
（１６）
　特定のコンテンツを識別するマスタ識別情報と、当該特定のコンテンツを各サービスがそれぞれ認識可能なコンテンツ識別情報とが、管理データベースにより対応付けて管理されており、
　前記制御部は、
　　クリエイタによって生成された、第１のサービスが認識可能な第１のコンテンツ識別情報、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　当該スクリプトが、前記第１のサービスとは異なる第２のサービスと契約を交わしているユーザによって選択されたときには、前記管理データベースに従って、前記第１のコンテンツ識別情報に対応する、第２のサービスが認識可能な第２のコンテンツ識別情報を特定し、
　　前記第２のサービスが管理するコンテンツにより、当該第２のコンテンツ識別情報に対応するコンテンツを特定し、
　　当該ユーザが前記第２のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供する
　前記（１）に記載のコンテンツ提供システム。
（１７）
　前記コンテンツは、楽曲を含み、
　前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
　前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
　前記（１）乃至（１６）のいずれかに記載のコンテンツ提供システム。
（１８）
　前記クリエイタにより使用される第１の端末装置と、
　前記ユーザにより使用される第２の端末装置と、
　前記スクリプトを格納した前記所定の記憶媒体を有する第１のサーバと、
　前記コンテンツを配信する第２のサーバと
　を含む前記（１）乃至（１７）のいずれかに記載のコンテンツ提供システム。
（１９）
　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
　コンテンツ提供方法。
（２０）
　コンピュータを、
　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
　制御部として機能させるためのプログラムを記録した記憶媒体。

　１　コンテンツ提供システム，　１０　クリエイタ端末装置，　２０　ユーザ端末装置，　３０　配信サーバ，　３０Ａ　番組配信サーバ，　３０Ｂ　楽曲配信サーバ，　３０Ｃ　音声配信サーバ，　３０Ｄ　広告配信サーバ，　３１　ID管理サーバ，　５０　ネットワーク，　１００　制御部，　１０１　CPU，　１０２　ROM，　１０３　RAM，　１０４　バス，　１０５　入力部，　１０６　出力部，　１０７　記憶部，　１０８　通信部，　１０９　近距離無線通信部，　１１０　入出力I/F，　１１１　操作部，　１１２　カメラ部，　１１３　センサ部，　１２１　表示部，　１２２　音出力部，　１５１　入力受付部，　１５２　楽曲情報取得部，　１５３　番組生成部，　１５４　音声情報取得部，　１５５　音声生成部，　１５６　登録部，　２００　制御部，　２０１　CPU，　２０２　ROM，　２０３　RAM，　２０４　バス，　２０５　入力部，　２０６　出力部，　２０７　記憶部，　２０８　通信部，　２０９　近距離無線通信部，　２１０　入出力I/F，　２１１　操作部，　２１２　カメラ部，　２１３　センサ部，　２２１　表示部，　２２２　音出力部，　２５１　番組取得部，　２５２　楽曲取得部，　２５３　音声取得部，　２５４　レンダラ部，　２５５　提示制御部，　３００　制御部，　３０１　CPU，　３０２　ROM，　３０３　RAM，　３０４　バス，　３０５　入力部，　３０６　出力部，　３０７　記憶部，　３０８　通信部，　３０９　ドライブ，　３１０　入出力I/F，　３５１　入力受付部，　３５２　配信処理部，　３５３　データベース，　３６１　文章チェック部

Claims

　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備える
　コンテンツ提供システム。
　前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを音声合成してユーザに提供するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としての音声データへのリンク情報にアクセスして音声データを読み出しユーザに提供するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、前記ユーザによりプレイリスト再生の要求を受け付けたときには、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報に応じたコメントの読み出しは行わず、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツを読み出しユーザに提供するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、
　　クリエイタによって生成された、コンテンツの識別情報と、そのコンテンツを紹介する前説に対応する第１のコメント情報と、そのコンテンツの再生後の後説に対応する第２のコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記第１のコメント情報に従って前説を読み出してユーザに提供し、
　　前記第１のコメント情報に続くコンテンツ識別情報が示すコンテンツを読み出してユーザに提供し、
　　前記コンテンツ識別情報に続く前記第２のコメント情報に従って後説を読み出してユーザに提供する
　ように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、
　　クリエイタによって生成された、特定のサービスが認識可能なコンテンツ識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが前記特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、
　　クリエイタによって生成された、第１のサービスが認識可能なコンテンツ識別情報、コンテンツを検索するためのメタデータ、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　当該スクリプトが、前記第１のサービスとは異なる第２のサービスと契約を交わしているユーザによって選択されたときには、前記メタデータにより前記第２のサービスが管理するコンテンツにより、対応するコンテンツを特定し、当該ユーザが前記第２のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供するように制御する
　請求項６に記載のコンテンツ提供システム。
　前記制御部は、前記スクリプトが、前記第２のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第２のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、当該コンテンツ、及び対応するコメントの読み出しもスキップするように制御する
　請求項７に記載のコンテンツ提供システム。
　前記制御部は、前記スクリプトが、前記第２のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第２のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、前記第１のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しを実行しユーザに提供するように制御する
　請求項７に記載のコンテンツ提供システム。
　前記制御部は、
　　クリエイタによって生成された前記スクリプトが前記所定の記憶媒体に格納される前に、当該スクリプトに含まれる前記コメント情報が示すコメント内容を分析し、
　　その分析結果に基づいて、前記コンテンツに関するコメントとして相応しくないと判定した場合に、その旨を前記ユーザに通知するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントの相応しくない箇所を前記ユーザに通知するように制御する
　請求項１０に記載のコンテンツ提供システム。
　前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントに対応する前記コメント情報を含んだスクリプトが、前記所定の記憶媒体に格納されないように制御する
　請求項１０に記載のコンテンツ提供システム。
　前記制御部は、
　　ユーザによって選択されたスクリプトに含まれる前記コメント情報が示すコメントの内容を分析し、
　　その分析結果に応じて、広告配信サーバから取得した広告データを、前記コンテンツのユーザへの提供の前に、提供されるコメントの前、又は前記コンテンツのユーザへの提供の後に、提供されるコメントの後に、ユーザに提供するように制御する
　請求項１に記載のコンテンツ提供システム。
　前記制御部は、
　　前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを特定の音素で音声合成してユーザに提供し、
　　前記広告データとしてのテキストも、前記特定の音素で音声合成してユーザに提供するように制御する
　請求項１３に記載のコンテンツ提供システム。
　前記制御部は、前記ユーザによって選択されたスクリプトに含まれる前記コメント情報としてのテキストの内容を分析する
　請求項１３に記載のコンテンツ提供システム。
　特定のコンテンツを識別するマスタ識別情報と、当該特定のコンテンツを各サービスがそれぞれ認識可能なコンテンツ識別情報とが、管理データベースにより対応付けて管理されており、
　前記制御部は、
　　クリエイタによって生成された、第１のサービスが認識可能な第１のコンテンツ識別情報、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　　当該スクリプトが、前記第１のサービスとは異なる第２のサービスと契約を交わしているユーザによって選択されたときには、前記管理データベースに従って、前記第１のコンテンツ識別情報に対応する、第２のサービスが認識可能な第２のコンテンツ識別情報を特定し、
　　前記第２のサービスが管理するコンテンツにより、当該第２のコンテンツ識別情報に対応するコンテンツを特定し、
　　当該ユーザが前記第２のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供する
　請求項１に記載のコンテンツ提供システム。
　前記コンテンツは、楽曲を含み、
　前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
　前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
　請求項１に記載のコンテンツ提供システム。
　前記クリエイタにより使用される第１の端末装置と、
　前記ユーザにより使用される第２の端末装置と、
　前記スクリプトを格納した前記所定の記憶媒体を有する第１のサーバと、
　前記コンテンツを配信する第２のサーバと
　を含む請求項１に記載のコンテンツ提供システム。
　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
　コンテンツ提供方法。
　コンピュータを、
　クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
　ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
　制御部として機能させるためのプログラムを記録した記憶媒体。