JP6602423B2

JP6602423B2 - コンテンツ提供サーバ、コンテンツ提供端末及びコンテンツ提供方法

Info

Publication number: JP6602423B2
Application number: JP2018108345A
Authority: JP
Inventors: チェー，ビョンギョ; ソ，チャンス; パク，ソンヒョン; イ，ソンヒョン
Original assignee: Naver Corp
Current assignee: Naver Corp
Priority date: 2017-06-07
Filing date: 2018-06-06
Publication date: 2019-11-06
Anticipated expiration: 2038-06-06
Also published as: JP6602423B6; KR101924634B1; US11128927B2; JP2018207492A; TW201904267A; US20180359537A1; CN109005444A; TWI686084B

Description

本発明は、コンテンツ提供サーバ、コンテンツ提供端末及びコンテンツ提供方法に関し、より具体的には、映像コンテンツから抽出された情報に対応して字幕ページを生成して提供するコンテンツ提供サーバ及びコンテンツ提供方法及びコンテンツ提供端末に関する。

通信技術と文化の発達によって多様な映像コンテンツが製作されて世界中に伝播されている。しかし、映像コンテンツは本と違って視聴者がコンテンツの進み具合を制御することができないので再生される映像に対する視聴者の内容への理解度にかかわらず映像を鑑賞しなければならない問題点がある。よって、このような問題点を解決するために、映像の再生時点を制御したり映像を探索するための多様な方法が提示されている。

映像の再生時点を制御するために代表的に提示されることができる方法として、スクロールバーを用いた制御を例示できる。これはユーザが映像の再生時間に対応して生成されるスクロール領域で任意の地点を選択した場合、該当時点へ映像の再生時点が移動するようになる方式である。

しかし、スクロール領域は映像の再生時間にかかわらず一定の長さを持つようになるので、映像の再生時間が長い場合はスクロール領域での僅かな移動でも映像の再生時点が大きく変更されるので再生時点の微細な制御が難しくなる。特にモバイル環境で映像を鑑賞する場合、ディスプレイのサイズが小さく、指でスクロールバーを制御しなければならない場合が多いので映像の再生時点を制御することがさらに難しくなる問題点がある。

また、映像の場合はユーザの理解を助けるために登場人物のセリフ又は再生される内容の説明のための字幕が添付されて提供される場合が多い。しかし、ユーザが映像から特定の内容の字幕を探すためにスクロール機能を用いた場合、上記した難点のため所望の場面とセリフに対する字幕を探すことが容易ではない。

また、ユーザの通信速度が制限される環境で映像の内容を把握しようとするとき、映像が大容量又は高画質の場合はサーバからコンテンツ提供端末へ映像が円滑に提供されることができず、映像の全ての場面をリアルタイムで鑑賞することが難しい場合がある。この場合、映像の重要な場面だけを選択的に鑑賞することでサーバのデータ伝送量を低減できるコンテンツ提供方法が要求される。

大韓民国公開公報第１０−２００８−００５０６５７号

本発明は、上記従来の問題点を解決するために創案されたものであって、字幕情報と映像コンテンツから抽出された代表イメージによって字幕ページを生成し、複数の字幕ページによって映像コンテンツの探索を容易にしてユーザが映像コンテンツをユーザの理解度合いに合わせて鑑賞できるようにすることを目的とする。

上記課題を解決するための本発明の一実施形態に係るコンテンツ提供サーバは、映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、前記映像コンテンツから前記字幕区間に対応する代表イメージを抽出するイメージ情報抽出部と、を含み、前記字幕ページ生成部は、前記映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成し、前記複数の字幕ページをコンテンツ提供端末に提供できる。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供方法は、コンテンツ提供サーバによるコンテンツ提供方法であって、映像コンテンツで字幕が表示される字幕区間の単位字幕を獲得するステップと、前記映像コンテンツのうち前記字幕区間に対応する代表イメージを抽出するステップと、前記映像コンテンツを区分する複数の字幕区間の順番に従って前記単位字幕及び前記代表イメージを含む複数の字幕ページを生成するステップと、コンテンツ提供端末に前記複数の字幕ページを提供するステップと、を含むことができる。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供端末は、ディスプレイと、少なくとも１つのプログラムが記憶されたメモリと、前記少なくとも１つのプログラムの制御に応じて動作するプロセッサと、を含み、前記プロセッサは、映像コンテンツの再生順番に従って前記映像コンテンツで字幕が表示される字幕区間に各々対応する複数の字幕ページのうち１つを前記ディスプレイに表示し、前記複数の字幕ページは、前記字幕区間に対応する単位字幕を表示するための第１表示領域及び前記字幕区間に対応する代表イメージを表示するための第２表示領域を含み、前記代表イメージは前記映像コンテンツの前記字幕区間から抽出されたものであってよい。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供端末は、ディスプレイと、映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、前記映像コンテンツから前記字幕区間に対応する前記代表イメージを抽出するイメージ情報抽出部と、を含み、前記字幕ページ生成部は、前記映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成し、前記複数の字幕ページを前記ディスプレイを介してユーザに表示できる。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供方法は、コンテンツ提供端末によるコンテンツ提供方法であって、映像コンテンツで字幕が表示される字幕区間の単位字幕を獲得するステップと、前記映像コンテンツから前記字幕区間に対応する代表イメージを抽出するステップと、前記映像コンテンツを区分する複数の字幕区間の順番に従って前記単位字幕及び前記代表イメージを含む複数の字幕ページを生成するステップと、前記複数の字幕ページをディスプレイを介してユーザに表示するステップと、を含むことができる。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供端末は、ディスプレイと、インターネットを介してサーバと接続される通信部と、映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記字幕区間に対応して前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、を含み、前記単位字幕及び前記代表イメージは、前記字幕ページ生成部のソース情報要求に対応して前記サーバで提供されるソース情報であって、前記字幕ページ生成部は、前記通信部を介して前記ソース情報を受信して、前記ソース情報を用いて映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成し、前記ディスプレイを介して前記複数の字幕ページをユーザに表示できる。

また、上記課題を解決するための本発明の一実施形態に係るコンテンツ提供方法は、コンテンツ提供端末によるコンテンツ提供方法であって、映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記字幕区間に対応して前記映像コンテンツから抽出された代表イメージを含むソース情報を要求するステップと、サーバから前記ソース情報を受信するステップと、前記ソース情報を用いて前記映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成してユーザに提供するステップと、を含むことができる。

本発明の一実施形態は、字幕情報と映像コンテンツから抽出された代表イメージによって字幕ページを生成し、複数の字幕ページによって映像コンテンツの探索を容易にしてユーザが映像コンテンツをユーザの理解度合いに合わせて鑑賞できるようにする効果がある。

ただし、本発明の一実施形態に係るコンテンツ提供サーバ、コンテンツ提供端末及びコンテンツ提供方法が達成できる効果は上述したものに限定されず、言及していない他の効果らは下記の記載から本発明の属する技術の分野における通常の知識を有する者に明確に理解されることができるであろう。

本発明に関する理解を助けるために詳細な説明の一部として含まれる添付の図面は、本発明に対する実施形態を提供し、詳細な説明と共に本発明の技術的思想を説明する。
本発明の一実施形態に係るコンテンツ提供サーバの構成を示すブロック図である。本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。図４の本発明の一実施形態で字幕区間を再設定する過程を説明するための図である。本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。本発明の一実施形態に係るコンテンツ提供端末の構成を示すブロック図である。本発明の一実施形態によって生成された字幕ページがコンテンツ提供端末で表示される画面を例示するための図である。本発明の一実施形態によって生成された字幕ページがコンテンツ提供端末で表示される画面を例示するための他の図である。本発明の一実施形態に係る複数の字幕ページに対する再生オプションを制御する過程を説明するためのフローチャートである。本発明の一実施形態に係るコンテンツ提供端末の構成を示すブロック図である本発明の一実施形態に係るコンテンツ提供端末及びコンテンツ提供サーバの構成を示すブロック図である。本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。

本発明は、多様な変換を加えることができ様々な実施形態を有することができるものであって、以下、特定の実施形態を添付の図面に基づいて詳細に説明する。

下記の実施形態は本明細書で述べられた方法、装置及び／又はシステムに対する包括的な理解を助けるために提供される。しかし、これは例示に過ぎず本発明はこれに制限されない。

本発明の実施形態を説明するに当たって、本発明と関連づけられた公知技術についての具体的な説明が本発明の要旨を不要に不明確にする場合があると判断された場合はその詳細な説明を省略する。そして、後述の用語らは本発明での機能を考慮して定義された用語であって、これはユーザ、運用者の意図又は慣例などによって異なる場合がある。したがって、その定義は本明細書全般にわたる内容に基づいて下されるべきである。詳細な説明で用いられる用語は単に本発明の実施形態を記述するためのものであって、決して制限的であってはならない。明確に異なる用いられ方でない限り、単数形の表現は複数形の意味を含む。本説明で、「含む」又は「具備」のような表現は、ある特性、数字、ステップ、動作、要素、それらの一部又は組み合わせを示すためのものであって、記述されたもの以外に１つ又はそれ以上の他の特性、数字、ステップ、動作、要素、それらの一部又は組み合わせの存在又は可能性を排除するように解釈されるべきではない。

また、第１、第２などの用語は多様な構成要素を説明するために用いられることができるが、上記の構成要素は上記の用語によって限定されるのではなく、上記用語は１つの構成要素を他の構成要素から区別する目的でのみ用いられる。

以下、本発明によるコンテンツ提供サーバ、コンテンツ提供方法及びコンテンツ提供端末を例示した実施形態が添付された図面を参照して詳細に説明する。

図１は、本発明の一実施形態に係るコンテンツ提供サーバの構成を示すブロック図である。

図１を参照すると、コンテンツ提供サーバ１００は、字幕ページ生成部１１０、イメージ情報抽出部１２０、オーディオ情報提供部１３０及び通信部１４０を含むことができる。

コンテンツ提供サーバ１００は、インターネット１０を介してコンテンツ提供端末２００とオンラインで接続されたサーバであってよい。インターネット１０は、コンテンツ提供サーバ１００とコンテンツ提供端末２００をオンラインで接続するための多様な通信方法が例示されることができる。そして、コンテンツ提供端末２００は、パーソナルコンピュータ、ノートパソコン、スマートフォン、タブレット、ウェアラブルコンピュータなどコンテンツ提供方法と関連づけられたウェブ／モバイルサイトの接続又はサービス専用アプリケーションの設置及び実行が可能な端末装置を意味することができる。本発明でコンテンツ提供端末２００はコンテンツ提供サーバ１００によって提供される字幕ページを探索するためのコンテンツ提供端末２００を意味できる。

このとき、コンテンツ提供端末２００は、コンテンツ提供サーバ１００から提供された字幕ページを再生するための端末であって、ウェブ／モバイルサイト又は専用アプリケーションの制御下にサービス画面構成、データ入力、データ送受信、データ保存などサービス全般の動作を行うことができる。

コンテンツ提供サーバ１００は、データベース１５０に保存された映像コンテンツから字幕情報、代表イメージ、オーディオ情報のうち少なくともいずれか１つ以上を用いて複数の字幕ページを生成し、通信部１４０を介してコンテンツ提供端末２００に複数の字幕ページを提供できる。

コンテンツ提供サーバ１００は、コンピュータシステムであってよい。コンテンツ提供サーバ１００は、プロセッサを含むことができる。プロセッサは、映像コンテンツ情報から他の情報を抽出して組み合わせるために要求される演算を処理できる。字幕ページ生成部１１０、イメージ情報抽出部１２０及びオーディオ情報提供部１３０はコンテンツ提供サーバ１００のプロセッサの一部であってよいし、プロセッサによって行われるモジュール、機能又はユニットなどであってよい。

ここで、映像コンテンツは、コンテンツ提供端末２００で出力されるコンテンツであって、オーディオとともに多数のフレームで連続的に構成されて再生可能な動画を意味できる。映像コンテンツは、コンテンツ提供端末２００によってファイル形式でダウンロードされるか、又はストリーミング方式で伝送されることができる。

また、字幕ページは、コンテンツ提供端末２００を介してユーザに見せられるページに関する情報を含むことができる。字幕ページは、単位字幕及び代表イメージだけをコンテンツ提供端末２００のディスプレイに表示するように構成されるか、又は単位字幕、代表イメージが表示されながらオーディオ情報が共に出力されるように構成されることができる。字幕ページは、字幕ページ生成部１１０によって生成されることができる。

字幕ページ生成部１１０は、字幕情報から映像コンテンツに１つ以上存在する字幕区間に対応する単位字幕をロード（又は獲得）できる。ここで、字幕情報は、映像コンテンツに登場する人物又は事物の会話内容、説明のために用いられるナレーションなど映像コンテンツで出力される多様なセリフをテキストで表現した字幕に関する情報を意味できる。字幕ページ生成部１１０は、字幕情報から字幕区間と単位字幕と関連づけられた情報を抽出できる。

字幕区間は、映像コンテンツの再生区間のうち字幕が表示される時間区間を意味できる。字幕区間は、字幕製作者又は編集者によって任意に設定されることができる。字幕区間は、映像コンテンツでセリフ又はナレーションが出力される区間に限られて設定されるものではない。したがって、字幕情報の製作者や編集者は映像コンテンツの任意の区間を字幕区間に設定することもできる。そして、各字幕区間で表示される１つ以上の単語で構成された字幕を単位字幕と見なすことができる。

字幕区間は、各単位字幕が表示され始める映像コンテンツの再生時点に対する字幕開始時点、各単位字幕の表示が終了する映像コンテンツの再生時点に対する字幕終了時点、字幕区間内で単位字幕の表示が維持される時間に対する字幕表示時間などを含むことができる。例えば、映像コンテンツの再生区間のうちＡの字幕が再生時点５分２０秒から５分２５秒まで表示される場合、５分２０秒から５分２５初の間の区間を字幕区間に設定し、該字幕区間の単位字幕をＡに設定できる。

字幕情報は、映像コンテンツと関連づけられた字幕に関する情報であって、映像コンテンツに含まれて提供されてよいし、映像コンテンツと区分されて提供されてもよい。字幕情報は字幕製作者によって製作されてデータベース１５０に保存されることができる。

ここで、字幕区間は、映像コンテンツの再生時点を基準として設定されることができ、単位字幕は字幕区間の数だけ少なくとも１つ以上存在し得る。上記１つ以上の単位字幕は字幕区間の再生順番による順番を有してよい。

イメージ情報抽出部１２０は、映像コンテンツから代表イメージを抽出できる。代表イメージは、映像コンテンツで字幕区間から抽出された情報であってよい。

代表イメージは、字幕区間内で再生される映像コンテンツの連続するフレームのうち１つであってよい。さらに詳しくは、代表イメージは字幕区間で任意に選択されるか、又は予め設定された規則によって選択（例えば、字幕区間のうち最初の順番のフレーム又は中間の順番のフレーム）されたフレームであってよい。各々の字幕区間に対応する各々の字幕ページは該字幕ページを代表する代表イメージを有することができる。具現例によれば、上記代表イメージは１つが抽出されてよいし、又は複数個が抽出されてもよい。

字幕ページ生成部１１０は、単位字幕及び代表イメージを用いて字幕ページを生成できる。

具現例によれば、字幕ページは、単位字幕及び代表イメージだけでなくオーディオ情報まで含んで生成されてよい。このとき、字幕ページの生成に用いられるオーディオ情報はオーディオ情報提供部１３０によって提供されることができる。

オーディオ情報提供部１３０は、映像コンテンツの字幕区間に対応してオーディオ情報を提供できる。オーディオ情報は各々の字幕区間の間出力されるオーディオを意味できる。さらに詳しくは、オーディオ情報提供部１３０は、映像コンテンツの全体区間の間出力されるオーディオのうち字幕区間に該当するオーディオを区分してオーディオ情報として字幕ページ生成部１１０に提供できる。

単位字幕、映像コンテンツ及びオーディオ情報の関係を例を挙げて説明すると次のとおりである。任意の映像コンテンツに対して映像コンテンツの再生時点を基準に２分３０秒から２分４５秒まで字幕が表示され、４分１０秒から４分２０秒まで字幕が表示される場合を仮定する。字幕ページ生成部１１０は、字幕情報から映像コンテンツの２分３０秒から２分４５秒を１つの字幕区間と認識して該字幕区間に対応する字幕ページ（第１字幕ページ）を生成し、映像コンテンツの４分１０秒から４分２０秒までを他の字幕区間と認識して該字幕区間に対応する字幕ページ（第２字幕ページ）を生成できる。

字幕ページ生成部１１０は、第１字幕ページの字幕区間（映像コンテンツの再生時点を基準に２分３０秒から２分４５秒までの区間）で表示される字幕を１つの単位字幕として認識でき、イメージ情報抽出部１２０は、該字幕区間で再生されるフレームのうち１つを代表イメージとして抽出できる。また、オーディオ情報提供部１３０は、第１字幕ページの字幕区間の間出力されるオーディオを該字幕区間のオーディオ情報と認識して提供できる。以降、字幕ページ生成部１１０は、単位字幕、代表イメージ、オーディオ情報を用いて第１字幕ページを生成できる。

以降、字幕ページ生成部１１０が第２字幕ページの字幕区間（映像コンテンツの再生時点を基準に４分１０秒から４分２０秒までの区間）に対応して単位字幕をロードし、イメージ情報抽出部１２０は代表イメージを抽出し、オーディオ情報提供部１３０はオーディオ情報を提供することによって第２字幕ページを生成できる。上述のように、字幕ページ生成部１１０が字幕ページを生成する過程は字幕区間の数に対応して複数回行われることができる。

オーディオ情報は、映像コンテンツから抽出されて別途の音声ファイルで存在できる。また、オーディオ情報は、コンテンツ提供端末２００が映像コンテンツを再生するとき、映像コンテンツの画面をユーザに表示せず再生時間によってオーディオのみが出力されるようにする形態で提供されてもよい。

通信部１４０は、コンテンツ提供端末２００に映像コンテンツ及び字幕ページのうち少なくとも１つを伝送できる。

データベース１５０は、ハードディスクドライブ（ＨａｒｄＤｉｓｋＤｒｉｖｅ；ＨＤＤ）、ソリッドステートドライブ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ；ＳＳＤ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ；ＲＡＭ）及びフラッシュ（ｆｌａｓｈ）メモリなどのような情報保存のためのハードウェアであってよい。データベース１５０は、コンテンツ提供サーバ１００に共に搭載されるか、又は別途の装置に実装されてコンテンツ提供サーバ１００とオンライン又はオフラインで接続されることができる。

下記の図面に用いられるコンテンツ提供サーバ１００の構成は上記図１に示す構成と引用符号を用いて説明する。

図２は、本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。図２を参照すると、映像コンテンツ提供方法は、単位字幕をロードするステップＳ１００、代表イメージを抽出するステップＳ２００、複数の字幕ページを生成するステップＳ３００、複数の字幕ページを提供するステップＳ４００を含むことができる。

単位字幕をロードするステップＳ１００は、字幕ページ生成部１１０が単位字幕をロードするステップであってよい。より具体的には、字幕ページ生成部１１０は、コンテンツ提供端末２００から映像コンテンツ及び字幕ページのうち少なくとも１つの提供を求める旨の要求を受信した場合、データベース１５０から映像コンテンツに対応する字幕情報をロードできる。一例として、前記字幕情報はｓｍｉのような拡張子を有する公知の字幕ファイルを含むことができる。字幕ページ生成部１１０によってロードされた字幕情報には上記の字幕区間と各字幕区間に対応する単位字幕に関する情報が含まれることができる。

代表イメージを抽出するステップＳ２００は、イメージ情報抽出部１２０が映像コンテンツから字幕区間に対応する代表イメージを抽出するステップであってよい。

複数の字幕ページを生成するステップＳ３００は、映像コンテンツが含む複数の字幕区間の順番に従って単位字幕及び代表イメージを各々の字幕ページに挿入する過程であってよい。

複数の字幕ページを構成する各々の字幕ページは隣接した順番の字幕ページ間の移動が可能に互いにリンクで接続されることができる。したがって、ユーザは任意の字幕ページを鑑賞した後、コンテンツ提供端末２００にページ移動を要求することで前の順番又は後の順番の字幕ページに移動できるようになる。ユーザは前記字幕区間の順番に従って配列された字幕ページの間を前後で探索することによって映像コンテンツを本のようにページ単位で鑑賞できるようになる。したがって、ユーザは映像コンテンツの内容を自らの理解度合いに合わせて鑑賞することができ、映像コンテンツの内容のうち字幕区間だけを鑑賞できるようになって速いスピードで映像コンテンツの内容を理解できるようになる。

複数の字幕ページを提供するステップＳ４００は、字幕ページ生成部１１０が生成した複数の字幕ページを通信部１４０を介してコンテンツ提供端末２００に提供するステップであってよい。

コンテンツ提供端末２００に提供された複数の字幕ページは、その後、コンテンツ提供端末２００の処理によって多様な機能を行うことができるが、これに関して後述する。

図３は、本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。図３を参照すると、図２とは違って代表イメージを抽出するステップＳ２００の後にオーディオ情報を提供するステップＳ２１０が含まれたことが分かる。図３の実施形態において上述の図２に説明されものと同じ構成や効果に対する記載は省略する。

先に説明されたように、字幕ページは単位字幕及び代表イメージを含むだけでなくオーディオ情報を共に含むことによって映像コンテンツに対するユーザの理解を助けることができる。

オーディオ情報を提供するステップＳ２１０は、オーディオ情報提供部１３０が映像コンテンツの字幕区間に対応するオーディオ情報を提供するステップであってよい。オーディオ情報提供部１３０は、字幕ページ生成部１１０の制御によってデータベース１５０に保存された映像コンテンツでオーディオ情報を提供できる。このとき、オーディオ情報提供部１３０は、字幕区間に対応する映像コンテンツのオーディオ区間の間出力されるオーディオ情報を提供できる。

図３ではオーディオ情報を提供するステップＳ２１０が代表イメージを抽出するステップＳ２００の後に行われると例示されたが、オーディオ情報を提供するステップＳ２１０は、代表イメージを抽出するステップＳ２００の前に行われてもよい。

図４は、本発明の一実施形態に係るコンテンツ提供方法を説明するためのフローチャートである。

一般に映像コンテンツの字幕区間は字幕製作者が任意に設定した場合が多い。先に説明したように、提供されるオーディオ情報は字幕区間に対応して行われるが、字幕区間は字幕製作者が任意に設定した区間なので実際に映像コンテンツで出力される登場人物のセリフや音とその表示時間が一致しない場合がある。したがって、字幕ページ単位で該当の映像コンテンツを探索するとき、字幕とオーディオがずれてユーザが違和感を感じる場合がある。

例えば、実際にセリフが出力される時間は１０秒であるが、字幕製作者が１０秒より短い時間の間字幕が表示されるように入力した場合、字幕ページは字幕製作者が任意に入力した字幕時間に合わせてページを切り替えるようになるので、字幕ページを切り替えるとき、セリフが全部出力される前にページが切り替えられたり切り替えられた字幕ページが字幕に該当する音声を全部出力できない現象が生じる場合がある。したがって、字幕製作者が任意に設定した字幕区間を実際にオーディオが出力される音声区間に合わせて再設定する必要性がある。

図４は、図３と違って字幕区間を再設定するステップＳ２２０が含まれたことが分かる。

字幕区間を再設定するステップＳ２２０は、字幕区間の再設定のためにオーディオ情報提供部１３０が映像コンテンツからオーディオを分析し、分析結果によって音声区間を設定し、音声区間に対応して字幕区間を再設定するステップであってよい。

より具体的には、オーディオ情報提供部１３０は、登場人物の音声が出力される領域の音量とスペクトルを分析することができる。また、オーディオ情報提供部１３０は、音量とスペクトルから派生する第１次音声特徴及び第１次音声特徴から派生する高次音声特徴を分析することができる。

オーディオ情報提供部１３０は、オーディオの音量、スペクトル、音声特徴によって実際に音声が出力される区間である音声区間を設定できる。オーディオ情報提供部１３０は、オーディオの音声特徴と実際の音声の音声特徴の類似度と関連して神経網（ニューラルネットワーク）等の学習された分類器を介して短いオーディオ区間を音声区間と非音性区間とに分類できる。そして、オーディオ情報提供部１３０は、上記した過程によって分類された複数の隣接した短い音声区間を併合して長い音声区間の開始時点及び終了時点を設定できる。

以降、字幕ページ生成部１１０は、設定された音声区間に合わせて字幕区間を再設定できる。より具体的には、字幕ページ生成部１１０は、設定された音声区間の音声開始時点を基準として字幕区間の開始時点を再設定し、再設定された音声終了時点を基準として字幕区間の終了時点を再設定できる。

例えば、映像コンテンツの再生区間のうち字幕区間が１０秒乃至１５秒に設定されたが、それに対応する音声区間が８秒乃至１７秒と識別された場合、字幕区間も８秒乃至１７秒に変更するものである。

字幕区間を再設定するステップＳ２２０の後、再設定された字幕区間に対応して代表イメージを抽出するステップＳ２００及びオーディオ情報を提供するステップＳ２１０が行われることができる。

図５は、図４の本発明の一実施形態で字幕区間を再設定する過程を説明するための図である。図５は、映像コンテンツの任意の区間に対するオーディオスペクトル分析結果を例示したものである。オーディオ情報提供部１３０は、該オーディオスペクトルを分析することによって音声区間を設定できる。第１乃至第３音声区間Ａ１０，Ａ２０，Ａ３０は、オーディオスペクトルを分析した結果、再設定されたオーディオ区間と見なすことができる。オーディオスペクトルによって第１音声区間Ａ１０と第２音声区間Ａ２０の間、第２音声区間Ａ２０と第３音声区間Ａ３０の間は人の音声が出力されない区間であることが分かる。

第１乃至第３字幕区間Ｓ１０，Ｓ２０，Ｓ３０は、再設定される前の字幕区間と見なすことができる。第４乃至第６字幕区間Ｓ１１，Ｓ２１，Ｓ３１は、第１乃至第３字幕区間Ｓ１０，Ｓ２０，Ｓ３０が第１乃至第３音声区間Ａ１０，Ａ２０，Ａ３０に合わせて再設定された字幕区間を意味する。

前記字幕区間の再設定によって字幕ページの字幕区間が実際にオーディオが出力されるオーディオ区間に合わせられるので字幕ページの探索過程で字幕とオーディオの間の不一致によって感じられる違和感を緩和することができる。

図６は、本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。図６を参照すると、コンテンツ提供方法は、単位字幕をロードするステップＳ１００、代表イメージを抽出するステップＳ２００、通信速度を感知するステップＳ２３０、複数の字幕ページを生成するステップＳ３００及び複数の字幕ページを提供するステップＳ４００を含むことができる。図６の実施形態において先に説明された実施形態と重なる構成及び効果に対する説明は省略する。

コンテンツ提供端末２００とコンテンツ提供サーバ１００の間の通信はインターネット１０の状態や距離通信環境に多くの影響を受けることができる。特に、通信速度が制限される地域のコンテンツ提供端末２００がコンテンツ提供サーバ１００と通信する場合、コンテンツ提供サーバ１００が映像コンテンツをコンテンツ提供端末２００に円滑に提供することが難しく、コンテンツ提供端末２００のユーザも該映像コンテンツの内容を把握することが難しくなる。この場合、代表イメージ及び単位字幕だけで構成された字幕ページを提供することによってコンテンツ提供サーバ１００とコンテンツ提供端末２００との通信速度が低くてもコンテンツ提供端末２００のユーザが字幕ページによって映像コンテンツの内容を探索できるようにすることができる。

通信速度を感知するステップＳ２３０は、字幕ページ生成部１１０がコンテンツ提供端末２００の通信速度を感知するステップであってよい。字幕ページ生成部１１０は、コンテンツ提供端末２００との通信速度を測定するために時間あたりのパケット伝送量、コンテンツ提供端末２００がコンテンツ提供サーバ１００への接続を試みる地域又は接続に用いられた通信環境などによってコンテンツ提供端末２００の通信速度を感知して判断できる。また、字幕ページ生成部１１０は、他の装置又はプロセッサで測定された通信速度を用いてコンテンツ提供端末２００の通信速度を判断することもできる。

通信速度を感知するステップＳ２３０は、複数の字幕ページを生成するステップＳ３００の前に行われてよいし、図６と違って代表イメージを抽出するステップＳ２００又は単位字幕をロードするステップＳ１００より前に行われてもよい。

複数の字幕ページを生成するステップＳ３００は、コンテンツ提供端末の通信速度が所定の値以下の場合、単位字幕及び代表イメージを用いて字幕ページに組み合わせるステップであってよい。

これと異なって、複数の字幕ページを生成するステップＳ３００でコンテンツ提供端末の通信速度が所定の値を超える場合は、図３の実施形態のように、オーディオ情報を提供するステップＳ２１０が行われることができ、字幕ページ生成部１１０は、単位字幕、代表イメージ及びオーディオ情報を全部用いて字幕ページを生成することもできる。

通信速度に対する所定の値は映像コンテンツの画質や容量によって異ならせて設定されることができる。そして、字幕ページ生成部１１０は、通信速度が所定値以下の場合、オーディオ情報を除いて字幕情報及び代表イメージのみを用いて字幕ページを生成できる。これによって生成された字幕ページはオーディオ情報が共に挿入された字幕ページに比べて低い容量を有することができる。そして、字幕ページ生成部１１０は、このような字幕ページをコンテンツ提供端末２００に提供することによって低速の通信環境でもコンテンツ提供端末２００に字幕ページを円滑に提供することが可能である。

具現例によれば、コンテンツ提供サーバ１００は、単位字幕及び代表イメージを含む第１種の字幕ページと、単位字幕、代表イメージ及びオーディオを全部含む第２種の字幕ページと、を生成した後、映像コンテンツを要求するコンテンツ提供端末２００との通信速度に応じて第１種の字幕ページ又は第２種の字幕ページをコンテンツ提供端末２００に提供することができる。具現例によれば、前記第１種の字幕ページは単位字幕及びオーディオのみを含むこともできる。

図７は、本発明の一実施形態に係るコンテンツ提供端末の構成を示すブロック図である。図７を参照すると、コンテンツ提供端末は、ディスプレイ２１０、メモリ２２０、プロセッサ２３０及び通信部２４０を含むことができる。

ディスプレイ２１０は、字幕ページや映像コンテンツをユーザに表示する。

メモリ２２０には少なくとも１つのプログラムが記憶される。メモリ２２０に記憶されたプログラムは字幕ページの再生のためのプログラムを含むことができる。

プロセッサ２３０は、少なくとも１つのプログラムの制御に応じて動作できる。

通信部２４０は、コンテンツ提供サーバ１００から映像コンテンツ及び複数の字幕ページのうち少なくとも１つを受信することができる。

コンテンツ提供サーバ１００から字幕ページを提供されたコンテンツ提供端末２００のディスプレイ２１０を介してユーザが字幕ページを探索し字幕ページによってサポートされた機能を活用する過程は図８を参照して説明する。

図８は、本発明の一実施形態によって生成された字幕ページがコンテンツ提供端末で表示される画面を例示するための図である。図８は、字幕ページを提供されるコンテンツ提供端末２００で任意の字幕ページを選択した場合、コンテンツ提供端末２００に表示される字幕ページ画面８００を例示した図面である。

図８を参照すると、字幕ページ画面８００は、機能メニュー領域８１０、字幕表示領域８２０、スクロール領域８３０、及びイメージ表示領域８４０を含んでコンテンツ提供端末２００に表示されることができる。図８の例において各領域は例示的に表現されたものであって、設計方式によってその位置や大きさが変更されることができる。

機能メニュー領域８１０は、字幕ページを鑑賞するとき、ユーザに役立つための機能を実行するためのメニューが配置される領域であってよい。字幕ページ生成部１１０によって生成されてコンテンツ提供端末２００に提供される複数の字幕ページはユーザの選択に対応して所定の機能を行うように設定されることができる。

機能メニュー領域８１０にはプロセッサ２３０がユーザから映像切り替え要求を受けるための第１機能メニュー８１１、プロセッサ２３０がユーザから再生オプションの制御を受けるための第２機能メニュー８１２、プロセッサ２３０が字幕ページで出力されるオーディオ情報の再生／停止要求を受けるための再生／停止機能メニュー８１３、プロセッサ２３０がユーザから画面分割要求を受けるための第３機能メニュー８１４、プロセッサ２３０がユーザから字幕検索又は翻訳要求を受けるための第４機能メニュー８１５を含むことができる。

各機能メニュー８１１乃至８１５の大きさと位置は設計方式によって様々に変更されることができる。

字幕表示領域８２０にはディスプレイに出力される字幕ページに含まれた字幕区間が表示され、スクロール領域８３０にはコンテンツ提供端末２００が出力できる複数の字幕ページの各々のサムネイルイメージ（例えば、代表イメージ）が表示されることができ、イメージ表示領域８４０にはディスプレイに出力される字幕ページの代表イメージが表示されることができる。サムネイルイメージはイメージ情報抽出部１２０が代表イメージを抽出することに対応して代表イメージより小さなサイズで表示されるように生成できる。

プロセッサ２３０は、ユーザのページ移動要求に対応してディスプレイ２１０に表示される字幕ページと隣接した順番の字幕区間を含む字幕ページに移動し、移動された字幕ページをディスプレイ２１０に表示できる。

より具体的には、プロセッサ２３０は、現在ディスプレイ２１０に表示されてオーディオ情報が出力される字幕ページのオーディオ出力が完了する前であっても、ユーザからページ移動要求が入ってくると、ディスプレイ２１０に字幕区間の順番が隣接した他の字幕ページを表示できる。

ページ移動要求は、ユーザがディスプレイ２１０の一部の領域を選択又はスクロールすることによって行われることができる。例えば、下記のイメージ表示領域８４０の右側の半分は次の字幕区間を有する字幕ページに移動するための領域で、イメージ表示領域８４０の左側の半分は前の字幕区間を有する字幕ページに移動するための領域であってよい。ユーザはイメージ表示領域８４０のいずれか１つの領域を選択することによって該当領域が示す字幕ページに移動して他の字幕ページを鑑賞できる。また、ページ移動要求は、実際の本のようにページをめくる感覚を与えるためにいずれか１つの地点から他の１地点へスクロールすることで行われることもできる。

プロセッサ２３０は、ユーザの映像切り替え要求に対応してディスプレイ２１０に表示される字幕ページの字幕区間に対応する時点から映像コンテンツを再生できる。

映像切り替え要求は字幕ページを鑑賞するとき、該字幕ページに対応する字幕区間から映像コンテンツを直接視聴しようとするときに用いられることができる機能である。

ユーザが第１機能メニュー８１１を選択すると、プロセッサ２３０は、ディスプレイ２１０に表示される字幕ページの字幕区間の開始時点から映像コンテンツを再生できる。

ページ切り替え要求と違って、映像コンテンツを再生するプロセッサ２３０は映像コンテンツの任意の再生時点でユーザから受信した字幕ページ切り替え要求に対応して前記任意の再生時点に対応する字幕ページをディスプレイ２１０に表示できる。

より具体的には、プロセッサ２３０は、ページ切り替え要求に対応して任意の再生時点又は前記任意の再生時点より前の再生時点を含む字幕区間に対応する字幕ページをディスプレイに表示できる。

例えば、映像コンテンツの再生の途中にユーザがページ切り替えを要求した場合、プロセッサ２３０は、該映像コンテンツの再生時点を字幕区間として含む字幕ページをユーザに表示できる。また、プロセッサ２３０は、該当映像コンテンツの再生時点を字幕区間として含む字幕ページがない場合、該当映像時点より前の再生時点を字幕区間として含む字幕ページのうち、最も遅い再生時点を含む字幕区間を含む字幕ページをユーザに表示できる。

そのために、プロセッサ２３０は映像コンテンツを再生する際、ユーザからページ切り替え要求を受信するための機能を有することができる。

ユーザは、映像切り替え要求及びページ切り替え要求を介して映像コンテンツの鑑賞と字幕ページの鑑賞を自由に切り替えることができる。したがって、切り替えの過程において現在鑑賞中のコンテンツの進み具合に合わせて対応する再生時点に切り替えられるのでユーザのコンテンツ内容への理解が容易になる効果がある。

プロセッサ２３０は、ユーザの再生オプション制御要求に対応してオーディオ情報の出力方法を制御できる。より具体的には、プロセッサ２３０は、再生オプション制御要求に対応してディスプレイ２１０に表示される字幕ページのオーディオ情報を繰り返し出力する第１再生モード、ディスプレイ２１０に表示される字幕ページのオーディオ情報が出力された後オーディオ情報の出力を停止する第２再生モード、ディスプレイ２１０に表示される字幕ページのオーディオ情報が出力された後、ディスプレイに表示される字幕ページの次の字幕区間順番を有する字幕ページに移動し、移動された字幕ページを表示する第３再生モードのうち１つの再生モードを行うことができる。

ユーザは、第２機能メニュー８１２を繰り返し選択することによって前記第１乃至第３再生モードを交互に選択できる。ユーザは、再生オプションを制御することによって該当字幕ページのオーディオ情報を理解度合いによって繰り返し聴取できるようになり語学学習の用途にも高い学習効果を持つことができる。

プロセッサ２３０は、ユーザが画面分割機能を要求すると、ディスプレイ２１０に出力されるメインページの数を２つ以上に増やすことができる。ユーザが第３機能メニュー８１４を繰り返し選択することによってディスプレイ２１０に出力されるメインページの数は２つ、３つ、４つなどに予め設定された数だけ変更されて出力されることができる。

プロセッサ２３０は、ユーザの再生／停止要求に対応して字幕ページで出力されるオーディオ情報を再生又は停止できる。

プロセッサ２３０は、ユーザの字幕検索要求に対応してユーザから入力された検索語を複数の字幕ページの単位字幕から検索して、検索結果をディスプレイ２１０に表示できる。

プロセッサ２３０は、コンテンツ提供端末２００から入力される検索語と一致する字幕を複数の字幕ページ全体の単位字幕で検索できる。字幕ページ生成部１１０は、検索された字幕と該字幕が位置する字幕ページをコンテンツ提供端末２００に知らせることができ、検索された字幕ページがあれば該字幕ページに即座に移動できるリンクを提供することができる。

プロセッサ２３０は、ユーザの字幕翻訳要求に対応してディスプレイ２１０に表示される字幕ページの単位字幕のうち選択された１つ以上の単語を翻訳し、翻訳結果をディスプレイ２１０に表示できる。

プロセッサ２３０は、字幕翻訳を要求された単語を連動された内部翻訳プログラム又は外部の翻訳プログラムにオンライン又はオフラインでアクセスして該当単語に対する翻訳を要求して翻訳された結果をディスプレイ２１０に提供できる。

図８で字幕検索／翻訳機能は第４機能メニュー８１５によって要求されることができるが、図８に示したものと違って字幕検索要求と字幕翻訳要求のための領域はそれぞれ分離されて表示されることもできる。

字幕表示領域８２０は、コンテンツ提供端末２００に表示される字幕ページの単位字幕が表示される領域である。字幕表示領域８２０は、イメージ表示領域８４０の内部又は一部と重なる領域に位置でき、よって、イメージ表示領域８４０を介して表示される代表イメージと重なって表示されることができる。また、字幕表示領域８２０は、イメージ表示領域８４０の外部に位置することによってイメージ表示領域８４０と字幕表示領域８２０とが互いに分離されて表示されることもできる。

スクロール領域６３０には複数の字幕ページの代表イメージがサムネイル形式で並べられることができる。字幕ページのサムネイルはスクロール領域６３０の大きさに合わせて代表イメージより小さなサイズで設定されることができる。ディスプレイ２１０に表示される現在字幕ページの代表イメージのサムネイルはスクロール領域８３０の中央部８３１に位置することができる。すなわち、スクロール領域８３０の中央部８３１には現在ユーザが鑑賞中の字幕ページが位置することができる。ユーザはスクロール領域８３０に位置した字幕ページのサムネイルイメージのうち１つを選択することによって該当字幕ページに即座に移動できるようにプロセッサ２３０に要求できる。スクロール領域８３０に位置するサムネイルイメージは、コンテンツ提供端末２００に表示される字幕ページと隣接した順番の字幕区間を有する字幕ページに対するサムネイルイメージであってよいし、スクロール領域８３０に含まれるサムネイルイメージの数は可変であってよい。

イメージ表示領域８４０は、ディスプレイ２１０に表示される字幕ページの代表イメージが表示される領域である。イメージ表示領域８４０は、字幕ページ画面８００の全体又は一部領域を含んで設定されることができる。

図９は、ディスプレイ２１０に４つの字幕ページが同時に表示される場合を例示した画面である。

図９は、図８で説明された画面分割機能が実行された場合を説明するための図である。図９で例示された画面９００は図８で例示される字幕ページ画面８００と違って４つの字幕ページ９１０乃至９４０が表示されることができる。図９で例示される画面９００は第１字幕ページ９１０、第２字幕ページ９２０、第３字幕ページ９３０及び第４字幕ページ９４０を含むことができる。第１乃至第４字幕ページ９１０乃至９４０は、字幕ページの順番に従って配置されることができる。画面分割機能が実行された場合、第１乃至第４字幕ページ９１０乃至９４０は、字幕区間の順番に従って順番にオーディオ情報を出力できる。図９は、画面分割機能を説明するための例示なので、画面分割機能が設計によって図９のように４つではなく多様な数の字幕ページが１つの画面に表示されることもできる。

図１０は、本発明による複数の字幕ページに対する再生オプションを制御する過程を説明するためのフローチャートである。

プロセッサ２３０は、ページ移動要求に対応して特定の字幕ページに移動できる（Ｓ１０００）。そして、プロセッサ２３０は、字幕ページのサムネイルをスクロール領域８３０に表示できる（Ｓ１０１０）。以降、プロセッサ２３０は、字幕ページの単位字幕及び代表イメージを表示し字幕ページのオーディオ情報を出力できる（Ｓ１０２０）。以降、プロセッサ２３０は、字幕ページの再生オプションを確認することができる（Ｓ１０３０）。プロセッサ２３０は、再生オプションによって、上記した第１再生モードによって字幕ページのオーディオ情報を繰り返し出力してよいし（Ｓ１０４０）、第２再生モードによってオーディオ情報の出力が終了した後、字幕ページの移動を終了してよいし（Ｓ１０５０）、第３再生モードによってディスプレイ２１０に表示された字幕ページの次の順番の字幕区間を含む字幕ページへ移動してもよい（Ｓ１０６０）。

一方、上述の本発明の実施形態は、コンピュータ実行可能なプログラムで作成可能で、コンピュータ読み取り可能な記録媒体を用いて上記のプログラムを動作させる汎用デジタルコンピュータで具現されることができる。

図１１は、本発明の一実施形態に係るコンテンツ提供端末の構成を示すブロック図である。

図１１を参照すると、コンテンツ提供端末２０１は、字幕ページ生成部２５０、イメージ情報抽出部２６０、オーディオ情報提供部２７０、ディスプレイ２８０及びデータベース２９０を含むことができる。

図１１に示すコンテンツ提供端末２０１は、上述の実施形態とは違ってコンテンツ提供端末２０１の内部に実装されるか、又はコンテンツ提供端末２０１とオフラインで接続されたデータベース２９０に保存された映像コンテンツから複数の字幕ページを生成してユーザに提供するための実施形態である。

コンテンツ提供端末２０１は、オンラインでサーバと接続しなくてもオフラインで接続されたデータベース２９０に予め保存された映像コンテンツにアクセスして複数の字幕ページを生成できる。この場合、サーバと接続されてデータを送受信する過程なしで複数の字幕ページをオフライン上で生成できるので、オンライン接続による遅延やデータのダウンロードによる費用の消耗なく映像コンテンツに対する複数の字幕ページ生成が可能である。

すなわち、図１１の実施形態に係るコンテンツ提供端末２０１は、図１のコンテンツ提供サーバ１００にあった字幕ページ生成部１１０、イメージ情報抽出部１２０、オーディオ情報提供部１３０がユーザ端末２００の内部に含まれる構成であると理解されることができる。よって、図１１の実施形態において、上述の実施形態とその機能や効果が同じ構成に対する説明は省略する。

字幕ページ生成部２５０は、映像コンテンツで字幕が表示される字幕区間の単位字幕及び映像コンテンツから抽出された代表イメージを含む字幕ページを生成できる。そして、字幕ページ生成部２５０は、映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成し、前記複数の字幕ページをディスプレイ２８０を介してユーザに表示できる。

字幕ページ生成部２５０は、上述の実施形態の字幕ページ生成部１１０と同様に単位字幕、代表イメージによって字幕ページを生成できる。また、字幕ページ生成部２５０は、下記のようにオーディオ情報をさらに含んで字幕ページを生成できる。字幕ページ生成部２５０が生成する字幕ページの数は映像コンテンツの字幕区間の数だけ繰り返し行われることによって複数の字幕ページを生成できる。

字幕ページ生成部２５０は、図１の字幕ページ生成部１１０とは違って生成された複数の字幕ページを別途のユーザ端末２００にインターネット１０を介して伝達せず、コンテンツ提供端末２０１に含まれたディスプレイ２８０に即座に表示できる。その他、字幕ページ生成部２５０が字幕ページを生成する過程に対する説明は上述したので省略する。

ディスプレイ２８０は、生成された字幕ページや映像コンテンツをユーザに表示する。

データベース２９０は、ハードディスクドライブ（ＨａｒｄＤｉｓｋＤｒｉｖｅ；ＨＤＤ）、ソリッドステートドライブ
（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ；ＳＳＤ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ；ＲＡＭ）及びフラッシュ（ｆｌａｓｈ）メモリなどのような情報保存のためのハードウェアであってよい。データベース２９０には映像コンテンツ及び字幕情報が保存されることができ、コンテンツ提供端末２０１に共に搭載されるか、又は別途のコンテンツ及び字幕情報が保存されることができ、コンテンツ提供端末２０１に共に搭載されるか、又は別途の装置に実装されてコンテンツ提供端末２０１とオフラインで接続されてよい。

図１２は、本発明の一実施形態に係るコンテンツ提供端末及びコンテンツ提供サーバの構成を示すブロック図である。

図１２による実施形態は、上述の実施形態とは違って字幕ページの生成に用いられるソース情報をコンテンツ提供サーバ１０１で生成してコンテンツ提供端末２０２に提供し、コンテンツ提供端末２０２は、ソース情報を用いて字幕ページを生成するための実施形態である。

すなわち、映像コンテンツ及び字幕情報は、コンテンツ提供サーバ１０１のデータベース１５０に保存され、コンテンツ提供サーバ１０１は、コンテンツ提供端末２０２のソース情報要求に対応してコンテンツ提供端末２０２が字幕ページを生成するために用いられるソース情報を提供できる。そして、コンテンツ提供端末２０２は、コンテンツ提供サーバ１０１から受信したソース情報を用いて字幕ページを生成し、生成された複数の字幕ページをディスプレイ２８１を介してユーザに表示できる。

コンテンツ提供端末２０２は、字幕ページの生成に必要なソース情報をコンテンツ提供サーバ１０１に要求できる。コンテンツ提供サーバ１０１は、コンテンツ提供端末２０２のソース情報要求に対応して該ソース情報をコンテンツ提供サーバ１０１のデータベース１５０に保存された映像コンテンツを用いて生成できる。ここで、ソース情報は、前記字幕情報と映像コンテンツから抽出された代表イメージ及びオーディオのうち少なくともいずれか１つ以上を含む情報であってよい。

イメージ情報抽出部１２０は、データベース１５０から字幕情報をロードして映像コンテンツの複数の字幕区間を確認し、各々の字幕区間に対応して代表イメージを抽出できる。

オーディオ情報提供部１３０は、データベース１５０から字幕情報をロードして映像コンテンツの複数の字幕区間を確認し、各々の字幕区間に対応するオーディオ情報を提供できる。

オーディオ情報提供部１３０は、映像コンテンツに含まれるか、又は映像コンテンツと区分される別途のファイル形式で存在するオーディオ情報のうち、ソース情報要求に含まれた字幕区間に対応する区間に該当するオーディオ情報を提供できる。

イメージ情報抽出部１２０が字幕区間に対応して映像コンテンツから代表イメージを抽出する方法、又はオーディオ情報提供部１３０が字幕区間に対応してオーディオ情報を提供する過程に対する説明は上述したので説明を省略する。

図１２を参照すると、コンテンツ提供端末２０２は、字幕ページ生成部２５１、ディスプレイ２８１及び通信部２９１を含むことができ、コンテンツ提供端末２０２とインターネット１０で接続されたコンテンツ提供サーバ１０１は、イメージ情報抽出部１２０、オーディオ情報提供部１３０及び通信部１４０を含むことができる。

字幕ページ生成部２５１は、インターネット１０に接続された通信部２９１を介してコンテンツ提供サーバ１０１に接続してソース情報要求をする。このとき、ソース情報要求はユーザがコンテンツ提供端末２０２を用いてコンテンツ提供サーバ１０１に接続して字幕ページを要求することに対応して行われることができる。

ソース情報要求には複数の字幕ページ全体に対する単位字幕、代表イメージ、オーディオ情報を要求することが含まれてもよいし、複数の字幕ページのうちユーザが選択した字幕ページに対する代表イメージ又はオーディオ情報を要求することが含まれてもよい。

ソース情報要求を受信したコンテンツ提供サーバ１０１は、データベース１５０に保存された字幕情報を通信部１４０を介してコンテンツ提供端末２０２に提供できる。また、ソース情報要求の内容によって、コンテンツ提供サーバ１０１は、代表イメージ及びオーディオ情報のうち少なくとも１つ以上の全て又は一部をコンテンツ提供端末２０２に提供できる。

イメージ情報抽出部１２０は、ソース情報要求に対応して字幕情報の字幕区間を確認し、字幕区間に対応する代表イメージを映像コンテンツから抽出してコンテンツ提供端末２０２に提供できる。

オーディオ情報提供部１３０は、ソース情報要求に対応して字幕情報の字幕区間を確認し、字幕区間に対応するオーディオ情報を確認して該オーディオ情報をコンテンツ提供端末２０２に提供できる。

字幕ページ生成部２５１は、字幕区間の順番に従って複数の字幕ページの順番を設定できる。

前記ソース情報要求によって、コンテンツ提供サーバ１０１がコンテンツ提供端末２０２に提供するソース情報が変わる場合がある。

まず、ソース情報要求が複数の字幕区間に対応する単位字幕と、複数の字幕区間に対応する代表イメージと、複数の字幕区間に対応するオーディオ情報と、をすべて要求する場合を例に上げることができる。

この場合、コンテンツ提供サーバ１０１は、コンテンツ提供端末２０２のソース情報要求に対応してコンテンツ提供端末２０２が字幕ページを生成する際に必要な全ての情報を提供できる。したがって、コンテンツ提供端末２０２は、複数の字幕区間に対応する全ての字幕ページを予め生成しておくことができる。これにより、ユーザが字幕ページを探索する過程で字幕ページ間を移動するとき、追加的なダウンロードなしで遅延を最小化することができる長所がある。

また、ソース情報要求が複数の字幕区間に対応する単位字幕と、複数の字幕区間のうちユーザに選択された字幕ページの字幕区間に対応する代表イメージと、ユーザに選択された字幕ページの字幕区間に対応するオーディオ情報と、を要求する場合を他の例として挙げることができる。

この場合、コンテンツ提供サーバ１０１は、コンテンツ提供端末２０２のソース情報要求に対応してコンテンツ提供端末２０２が字幕ページを生成する際に必要な一部の情報のみを提供できる。したがって、コンテンツ提供端末２０２は、ユーザが選択して鑑賞しようとする字幕ページに対する代表イメージ及びオーディオ情報のみをコンテンツ提供サーバ１０１からダウンロードすることができるようになる。これにより、ユーザはコンテンツ提供端末２０２が複数の字幕ページを構成するための全ての情報をダウンロードするまで待つ必要がなく、選択された字幕ページに関する情報のみをダウンロードするようになってデータ使用量が低減する長所がある。

また、ソース情報要求がユーザに選択された字幕ページの字幕区間及び選択された字幕ページと隣接した順番を持つ字幕ページの字幕区間に対応する代表イメージと、ユーザに選択された字幕ページの字幕区間及び選択された字幕ページと隣接した順番を持つ字幕ページの字幕区間に対応するオーディオ情報と、を要求する場合をさらに他の例として挙げることができる。

この場合、コンテンツ提供サーバ１０１は、コンテンツ提供端末のソース情報要求に対応してコンテンツ提供端末２０２が字幕ページを生成する際に必要な一部の情報のみを提供できる。しかし、上述の例示とは違って、コンテンツ提供端末２０２がユーザが選択した字幕ページと隣接した順番の字幕ページに関する情報まで予め確保するようになるので、ユーザが選択した字幕ページの直後の順番又は直前の順番の字幕ページに切り替えられる際の遅延を緩和することができる長所がある。

ソース情報要求は、複数の字幕ページのうちユーザに選択された字幕ページが前記ディスプレイに表示されるとき、選択された字幕ページ及び選択された字幕ページと隣接した順番の字幕ページのサムネイルイメージに対する要求を含むことができる。ここで、サムネイルイメージは図８によって説明したスクロール領域８３０に表示される各字幕ページの代表イメージに対応するイメージであってよい。イメージ情報抽出部１２０は、サムネイルイメージを含むソース情報要求を受信した場合、代表イメージを抽出することに対応して代表イメージより小さなサイズで表示されるサムネイルイメージを共に生成できる。

上記ソース情報要求は例示として挙げたものであって、その他にもコンテンツ提供端末２０２及びコンテンツ提供サーバ１０１の環境や管理者の設定によって他の形態のソース情報要求が提示されることができるであろう。

図１３は、本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。

図１３を参照すると、図１２の実施形態に係るコンテンツ提供端末２０２が字幕ページを生成する過程がわかる。図１３によるコンテンツ提供方法は、ソース情報を要求するステップＳ１３１０、ソース情報を受信するステップＳ１３２０及び複数の字幕ページを生成するステップＳ１３３０を含むことができる。

ソース情報を要求するステップＳ１３１０は、コンテンツ提供端末２０２が映像コンテンツで字幕が表示される字幕区間の単位字幕及び単位字幕区間に対応して映像コンテンツから抽出された代表イメージを含むソース情報を要求するステップであってよい。

ソース情報を受信するステップＳ１３２０は、コンテンツ提供端末２０２がコンテンツ提供サーバ１０１からソース情報を受信するステップであってよい。

複数の字幕ページを生成するステップＳ１３３０は、コンテンツ提供端末２０２がソース情報を用いて映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成してユーザに提供するステップであってよい。

図１４は、本発明の一実施形態に係るコンテンツ提供方法を説明するための図である。

図１４は、図１２の実施形態よるコンテンツ提供端末２０２が字幕ページを生成する際、通信速度を感知して感知された結果に対応してソース情報要求の内容を変更できる実施形態を表現する。図１４を参照すると、コンテンツ提供方法は、通信速度を感知するステップＳ１４１０と、ソース情報を要求するステップＳ１４２０と、ソース情報を受信するステップＳ１４３０と、複数の字幕ページを生成するステップＳ１４４０と、を含むことができる。

コンテンツ提供端末２０２とコンテンツ提供サーバ１０１の間の通信はインターネット１０の状態や距離通信環境に多くの影響を受けることができる。特に、通信速度が制限される地域のコンテンツ提供端末２０２がコンテンツ提供サーバ１０１と通信する場合、コンテンツ提供サーバ１０１が映像コンテンツをコンテンツ提供端末２０２に円滑に提供することが難しく、コンテンツ提供端末２０２のユーザも該映像コンテンツの内容を把握することが難しくなる。この場合、代表イメージと単位字幕だけで構成された字幕ページを提供することによってコンテンツ提供サーバ１０１とコンテンツ提供端末２０２との通信速度が低くてもコンテンツ提供端末２０２のユーザが字幕ページによって映像コンテンツの内容を探索できるようにすることができる。

通信速度を感知するステップＳ１４１０は、コンテンツ提供端末２０２がコンテンツ提供サーバ１０１との通信速度を感知し、感知された通信速度に対応してコンテンツ提供サーバ１０１にソース情報要求をするステップであってよい。より具体的には、コンテンツ提供端末２０２は、コンテンツ提供サーバ１０１との通信速度を測定するために時間あたりのパケット伝送量、コンテンツ提供端末２０２がコンテンツ提供サーバ１０１に接続を試みる地域又は接続に用いられた通信環境などによってコンテンツ提供端末２０２の通信速度を感知して判断できる。また、コンテンツ提供端末２０２は、他の装置又はプロセッサで測定された通信速度を用いてコンテンツ提供端末２０２の通信速度を判断することもできる。

コンテンツ提供端末２０２は、感知された通信速度が所定の速度以下の場合、単位字幕及び代表イメージに対するソース情報だけを要求するか、又は単位字幕及びオーディオ情報に対するソース情報だけを要求できる（Ｓ１４２０）。

通信速度の基準となる所定の値は映像コンテンツの画質や容量によって異ならせて設定されることができる。そして、コンテンツ提供端末２０２の字幕ページ生成部２５１は、上記のソース情報要求によって提供されたソース情報を受信し（Ｓ１４３０）、受信されたソース情報のみを用いて字幕ページを生成できる（Ｓ１４４０
）。これによって生成された字幕ページはオーディオ情報が共に挿入された字幕ページに比べて低い容量を有することができる。これにより低速の通信環境でもコンテンツ提供端末２００に字幕ページを円滑に提供することが可能である。

媒体はコンピュータ実行可能なプログラムを継続的に記憶したり、実行又はダウンロードのために一時記録するものであってもよい。また、媒体は単一又は複数のハードウェアが結合された形態の多様な記録手段又は保存手段であってよいが、あるコンピュータシステムに直接接続される媒体に限定されず、ネットワーク上に分散存在するものであってもよい。媒体の例示としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ及びＤＶＤのような光気録媒体、フロプティカルディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような磁気−光媒体、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどを含んでプログラム命令が保存されるように構成されたものであってよい。また、他の媒体の例示として、アプリケーションを流通するアップストア（ＡｐｐＳｔｏｒｅ）又はその他多様なソフトウェアを供給乃至流通するサイト、サーバなどで管理する記録媒体乃至記憶媒体を挙げることもできる。

以上の説明は、本発明の技術思想を例示的に説明したものに過ぎず、本発明の属する技術分野における通常の知識を有する者であれば本発明の本質的な特性から逸脱しない範囲で多様な修正及び変形が可能であろう。よって、本願明細書に記載の実施形態は本発明の技術思想を限定するためではなく説明するためのものであって、本発明はこのような実施形態に限定されるものではない。本発明の保護範囲は下記の請求範囲によって解釈されるべきであって、それと均等な範囲内にある全ての技術思想は本発明の権利範囲に含まれると解釈されるべきである。

また、本発明の実施形態は、以下の目的を有する。

本発明の実施形態は、データ通信に要求される伝送速度が制限される環境でもユーザが映像コンテンツの内容を鑑賞できるようにすることを目的とする。

また、本発明の実施形態は、以下の効果を達成する。

また、本発明の一実施形態は、データ通信に要求される伝送速度が制限される環境でもユーザが映像コンテンツの内容を鑑賞できるようにする効果がある。

１００コンテンツ提供サーバ
１１０字幕ページ生成部
１２０イメージ情報抽出部
１３０オーディオ情報提供部
１４０通信部
１５０データベース
２００コンテンツ提供端末
２１０ディスプレイ
２２０メモリ
２３０プロセッサ
２４０通信部

Claims

映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、
前記映像コンテンツから前記字幕区間に対応する代表イメージを抽出するイメージ情報抽出部と、
前記映像コンテンツのうち前記字幕区間に対応するオーディオ情報を提供するオーディオ情報提供部と、
を含み、
前記字幕ページ生成部は前記映像コンテンツを区分する複数の字幕区間に対応して、前記単位字幕、前記代表イメージ及び前記オーディオ情報を含む複数の字幕ページを生成し、前記複数の字幕ページをコンテンツ提供端末に提供することを特徴とするコンテンツ提供サーバ。
前記字幕ページ生成部は、前記字幕区間の順番に従って前記複数の字幕ページの順番を設定することを特徴とする請求項１に記載のコンテンツ提供サーバ。
前記オーディオ情報提供部は前記映像コンテンツの音声特徴を分析して前記映像コンテンツで音声が出力される音声区間を設定し、
前記字幕ページ生成部は前記音声区間に対応して前記字幕区間を再設定することを特徴とする請求項１に記載のコンテンツ提供サーバ。
前記字幕ページ生成部は、
前記コンテンツ提供端末の通信速度が所定の値以下の場合、前記単位字幕及び前記代表イメージを含む字幕ページを生成するか、又は前記単位字幕及び前記オーディオ情報を含む字幕ページを生成することを特徴とする請求項１又は３に記載のコンテンツ提供サーバ。
コンテンツ提供サーバによるコンテンツ提供方法であって、
映像コンテンツで字幕が表示される字幕区間の単位字幕を獲得するステップと、
前記映像コンテンツのうち前記字幕区間に対応する代表イメージを抽出するステップと、
前記映像コンテンツで前記字幕区間に対応するオーディオ情報を提供するステップと、
前記映像コンテンツを区分する複数の字幕区間の順番に従って前記単位字幕及び前記代表イメージを含む複数の字幕ページを生成するステップと、
コンテンツ提供端末に前記複数の字幕ページを提供するステップと、を含み、
前記複数の字幕区間に対応して前記複数の字幕ページを生成するステップは、
前記単位字幕、前記代表イメージ及び前記オーディオ情報を含む複数の字幕ページを生成するステップを含むことを特徴とするコンテンツ提供方法。
ディスプレイと、
少なくとも１つのプログラムが記憶されたメモリと、
前記少なくとも１つのプログラムの制御に応じて動作するプロセッサと、を含み、
前記プロセッサは、
映像コンテンツの再生順番に従って前記映像コンテンツで字幕が表示される字幕区間に各々対応する複数の字幕ページのうち１つを前記ディスプレイに表示し、
前記複数の字幕ページは、前記字幕区間に対応する単位字幕を表示するための第１表示領域及び前記字幕区間に対応する代表イメージを表示するための第２表示領域を含み、
前記代表イメージは前記映像コンテンツの前記字幕区間から抽出され、
前記複数の字幕ページは、前記字幕区間に対応するオーディオ情報を含み、前記オーディオ情報は前記映像コンテンツの前記字幕区間に対応して提供されることを特徴とするコンテンツ提供端末。
前記プロセッサは、
ユーザのページ移動要求に対応して前記ディスプレイに表示される字幕ページと隣接した順番の字幕区間を含む字幕ページに移動し、移動された前記字幕ページを前記ディスプレイに表示することを特徴とする請求項６に記載のコンテンツ提供端末。
前記プロセッサは、
ユーザの映像切り替え要求に対応して前記ディスプレイに表示される字幕ページの字幕区間に対応する時点から前記映像コンテンツを再生することを特徴とする請求項６又は７に記載のコンテンツ提供端末。
前記プロセッサは、
前記映像切り替え要求に対応して前記ディスプレイに表示される字幕ページの字幕区間開始時点から前記映像コンテンツを再生することを特徴とする請求項８に記載のコンテンツ提供端末。
前記複数の字幕ページは、
前記ユーザの前記映像切り替え要求を入力されるための第１機能メニューを含むことを特徴とする請求項８又は９に記載のコンテンツ提供端末。
前記プロセッサは、
前記映像コンテンツの任意の再生時点でユーザから受信した字幕ページ切り替え要求に対応して前記任意の再生時点に対応する字幕ページを前記ディスプレイに表示することを特徴とする請求項６〜８のうちいずれか一項に記載のコンテンツ提供端末。
前記プロセッサは、
前記字幕ページ切り替え要求に対応して前記任意の再生時点又は前記任意の再生時点より前の再生時点を含む字幕区間に対応する字幕ページを前記ディスプレイに表示することを特徴とする請求項１１に記載のコンテンツ提供端末。
前記プロセッサは、
ユーザの再生オプション制御要求に対応して前記オーディオ情報の出力方法を制御することを特徴とする請求項６に記載のコンテンツ提供端末。
前記複数の字幕ページは、
前記再生オプション制御要求を入力されるための第２機能メニューを含むことを特徴とする請求項１３に記載のコンテンツ提供端末。
前記プロセッサは、
前記再生オプション制御要求に対応して、
前記ディスプレイに表示される字幕ページのオーディオ情報を繰り返し出力する第１再生モードと、
前記ディスプレイに表示される字幕ページのオーディオ情報が出力された後、前記オーディオ情報の出力を停止する第２再生モードと、
前記ディスプレイに表示される字幕ページのオーディオ情報が出力された後、前記ディスプレイに表示される字幕ページの次の字幕ページに移動し、移動された字幕ページを表示する第３再生モードと、のうち１つの再生モードを行うことを特徴とする請求項１３又は１４に記載のコンテンツ提供端末。
前記プロセッサは、
ユーザの画面分割要求に対応して前記ディスプレイに表示される字幕ページの数を２つ以上に変更することを特徴とする請求項６〜８、１１のうちいずれか一項に記載のコンテンツ提供端末。
前記複数の字幕ページは、
前記画面分割要求を入力されるための第３機能メニューを含むことを特徴とする請求項１６に記載のコンテンツ提供端末。
前記プロセッサは、
前記画面分割要求に対応して前記ディスプレイに表示される２つ以上の字幕ページを前記字幕区間の順番に従って配置し、
前記２つ以上の字幕ページが含むオーディオ情報を前記字幕区間の順番に従って出力することを特徴とする請求項１６又は１７に記載のコンテンツ提供端末。
ディスプレイと、
少なくとも１つのプログラムが記憶されたメモリと、
前記少なくとも１つのプログラムの制御に応じて動作するプロセッサと、を含み、
前記プロセッサは、
映像コンテンツの再生順番に従って前記映像コンテンツで字幕が表示される字幕区間に各々対応する複数の字幕ページのうち１つを前記ディスプレイに表示し、
前記複数の字幕ページは、前記字幕区間に対応する単位字幕を表示するための第１表示領域及び前記字幕区間に対応する代表イメージを表示するための第２表示領域を含み、
前記代表イメージは前記映像コンテンツの前記字幕区間から抽出され、
前記複数の字幕ページは、前記字幕区間に対応するオーディオ情報を含み、前記オーディオ情報は前記映像コンテンツの前記字幕区間に対応して提供され、
前記プロセッサは、
ユーザの字幕検索要求に対応して前記ユーザから入力された検索語を前記複数の字幕ページの前記単位字幕から検索し、
検索結果を前記ディスプレイに表示することを特徴とするコンテンツ提供端末。
前記複数の字幕ページは、
前記字幕検索要求を入力されるための第４機能メニューを含むことを特徴とする請求項１９に記載のコンテンツ提供端末。
前記プロセッサは、
ユーザの字幕翻訳要求に対応して前記ディスプレイに表示される字幕ページの前記単位字幕のうち選択された１つ以上の単語を翻訳し、
翻訳結果を前記ディスプレイに表示することを特徴とする請求項１９に記載のコンテンツ提供端末。
前記複数の字幕ページは、
前記字幕翻訳要求を入力されるための第５機能メニューを含むことを特徴とする請求項２１に記載のコンテンツ提供端末。
ディスプレイと、
映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、
前記映像コンテンツから前記字幕区間に対応する前記代表イメージを抽出するイメージ情報抽出部と、
前記映像コンテンツで前記字幕区間に対応するオーディオ情報を提供するオーディオ情報提供部と、
を含み、
前記字幕ページ生成部は前記映像コンテンツを区分する複数の字幕区間に対応して、前記単位字幕、前記代表イメージ及び前記オーディオ情報を含む複数の字幕ページを生成し、前記複数の字幕ページを前記ディスプレイを介してユーザに表示することを特徴とするコンテンツ提供端末。
前記字幕ページ生成部は、
前記字幕区間の順番に従って前記複数の字幕ページの順番を設定することを特徴とする請求項２３に記載のコンテンツ提供端末。
前記オーディオ情報提供部は前記映像コンテンツの音声特徴を分析して前記映像コンテンツで音声が出力される音声区間を設定し、
前記字幕ページ生成部は前記音声区間に対応して前記字幕区間を再設定することを特徴とする請求項２３に記載のコンテンツ提供端末。
コンテンツ提供端末によるコンテンツ提供方法であって、
映像コンテンツで字幕が表示される字幕区間の単位字幕を獲得するステップと、
前記映像コンテンツから前記字幕区間に対応する代表イメージを抽出するステップと、
前記映像コンテンツで前記字幕区間に対応するオーディオ情報を提供するステップと、
前記映像コンテンツを区分する複数の字幕区間の順番に従って前記単位字幕及び前記代表イメージを含む複数の字幕ページを生成するステップと、
前記複数の字幕ページをディスプレイを介してユーザに表示するステップと、
を含み、
前記複数の字幕区間に対応して前記複数の字幕ページを生成するステップは、前記単位字幕、前記代表イメージ及び前記オーディオ情報を含む複数の字幕ページを生成するステップを含む、ことを特徴とするコンテンツ提供方法。
ディスプレイと、
インターネットを介してサーバと接続される通信部と、
映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記字幕区間に対応して前記映像コンテンツから抽出された代表イメージを含む字幕ページを生成する字幕ページ生成部と、を含み、
前記単位字幕及び前記代表イメージは前記字幕ページ生成部のソース情報要求に対応して前記サーバで提供されるソース情報であって、
前記字幕ページ生成部は前記通信部を介して前記ソース情報を受信し、前記ソース情報を用いて映像コンテンツを区分する複数の字幕区間に対応する、前記映像コンテンツから抽出されたオーディオ情報を含む複数の字幕ページを生成し、前記ディスプレイを介して前記複数の字幕ページをユーザに表示し、前記オーディオ情報は前記字幕ページ生成部の前記ソース情報要求に対応して前記サーバで提供されるソース情報であることを特徴とするコンテンツ提供端末。
前記字幕ページ生成部は、前記字幕区間の順番に従って前記複数の字幕ページの順番を設定することを特徴とする請求項２７に記載のコンテンツ提供端末。
前記ソース情報要求は前記複数の字幕区間に対応する単位字幕、前記複数の字幕区間に対応する代表イメージ及び前記複数の字幕区間に対応するオーディオ情報を要求することを特徴とする請求項２７に記載のコンテンツ提供端末。
前記ソース情報要求は前記複数の字幕区間に対応する単位字幕、前記複数の字幕区間のうち前記ユーザに選択された字幕ページの字幕区間に対応する代表イメージ及び前記選択された字幕ページの字幕区間に対応するオーディオ情報を要求することを特徴とする請求項２７又は２９に記載のコンテンツ提供端末。
前記ソース情報要求は、
前記ユーザに選択された字幕ページの字幕区間及び前記選択された字幕ページと隣接した順番を持つ字幕ページの字幕区間に対応する代表イメージと、前記ユーザに選択された字幕ページの字幕区間及び前記選択された字幕ページと隣接した順番を持つ字幕ページの字幕区間に対応するオーディオ情報と、を要求することを特徴とする請求項３０に記載のコンテンツ提供端末。
前記ソース情報要求は、
前記複数の字幕ページのうち前記ユーザに選択された字幕ページが前記ディスプレイに表示されるとき、前記選択された字幕ページ及び前記選択された字幕ページと隣接した順番の字幕ページのサムネイルイメージに対する要求を含むことを特徴とする請求項２７、２９、３０のいずれか一項に記載のコンテンツ提供端末。
前記字幕ページ生成部は、
前記コンテンツ提供端末と前記サーバの通信速度が所定の値以下の場合、前記単位字幕及び前記代表イメージを要求するソース情報要求を伝送するか、又は前記単位字幕及び前記オーディオ情報を要求するソース情報要求を伝送することを特徴とする請求項２７、２９、３０、３２のいずれか一項に記載のコンテンツ提供端末。
コンテンツ提供端末によるコンテンツ提供方法であって、
映像コンテンツで字幕が表示される字幕区間の単位字幕及び前記字幕区間に対応して前記映像コンテンツから抽出された代表イメージを含むソース情報を要求するステップと、
サーバから前記ソース情報を受信するステップと、
前記ソース情報を用いて前記映像コンテンツを区分する複数の字幕区間に対応して複数の字幕ページを生成してユーザに提供するステップと、を含み、
前記ソース情報を要求するステップは前記字幕区間に対応して前記映像コンテンツから抽出されたオーディオ情報をさらに含むソース情報を要求するステップである、コンテンツ提供方法。
ハードウェアと結合されて請求項５、２６、３４のいずれか一項に記載のコンテンツ提供方法を実行させるためのコンピュータプログラム。