JP4580885B2

JP4580885B2 - シーン情報抽出方法、シーン抽出方法および抽出装置

Info

Publication number: JP4580885B2
Application number: JP2006086035A
Authority: JP
Inventors: 智弘山崎; 秀樹筒井; 創吾坪井; 千加夫土谷
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2006-03-27
Filing date: 2006-03-27
Publication date: 2010-11-17
Anticipated expiration: 2026-03-27
Also published as: US8001562B2; US20070239447A1; JP2007264789A

Description

本発明は、時系列が定義されたコンテンツ、例えば、映像コンテンツの時系列に対して関連付けられたコメント情報のテキスト情報を利用して、映像コンテンツに含まれる意味的なひとまとまりとしての区間を抽出するシーン情報抽出方法、シーン抽出方法および抽出装置に関する。

ブロードバンドの普及などによって流通量が増大しつつあるデジタルコンテンツに対し、メタデータを付加してコンピュータで効率よく管理、処理しようということが考えられている。例えば映像コンテンツの場合、時系列に対して「誰が何をどうしているシーン」といったシーン情報のメタデータが付加されていればコンテンツの検索や要約が容易となる。

しかし、コンテンツ提供者がすべての適切なメタデータを付加するのではコンテンツ提供者の負担が大きくなってしまうため、コンテンツ自体の情報から自動的にメタデータとしてのシーン情報を抽出する方法として、以下のようなものが提案されている。

（１）映像の音声情報から、あるいは、映像の音声情報を認識して得られるテキスト情報と映像の台本に含まれるテキスト情報との対応付けによって、シーン情報を抽出する方法（例えば、特許文献１参照）。
（２）映像から抽出した字幕などのテキスト情報から、あるいは、映像から抽出した字幕などのテキスト情報と映像の台本に含まれるテキスト情報との対応付けによってシーン情報を抽出する方法（例えば、特許文献１参照）。
（３）映像から抽出したカット情報などの画像情報からシーン情報を抽出する方法。
特開２００５−１６７４５２公報

しかしながら、上記従来技術は以下の問題がある。
・音声情報を利用する場合、歓声の大きさなどから「盛り上がったシーン」のような抽象的なシーン情報を、あるいは、特徴的なキーワードから大まかなシーン情報を抽出することはできるが、現状の音声認識の精度はあまり高くないため細かなシーン情報を抽出することができない。また、無音区間のシーン情報を抽出することができない。
・テキスト情報を利用する場合、出現する単語の推移によって話題の推移を推測することでシーン情報を抽出することはできるが、字幕や台本などのテキスト情報がないコンテンツに対して適用することができない。また、字幕を付加するためにコンテンツ提供者の負担が大きくなってしまうのであれば初めからシーン情報もメタデータとして付加すればよい。
・カット情報を利用する場合、カット情報自体は非常にプリミティブな区間を表しているので意味的なひとまとまりとしては細かすぎる。また、クイズ番組やニュース番組のようにカット情報の典型的なシーケンスが存在する場合はそれらのシーケンスをシーン情報として抽出することができるが、すべての番組に対して適用することができない。

また、上記（１）、（２）、（３）のどれもコンテンツの静的な情報を利用しているため、シーン情報の動的な変化（例えば「かっこいい」と思われていたシーンが「おもしろい」と思われるようになるなど）に対応することができない。

この発明は、上述した事情を考慮してなされたものであり、シーン情報、シーンを的確に抽出することができるシーン情報抽出方法、シーン抽出方法および抽出装置を提供することを目的とする。

上述の課題を解決するため、本発明のシーン情報抽出装置は、コンテンツの時系列に対して関連付けられた複数のコメント情報であって、各コメント情報はコメント、該コメントの開始時刻および終了時刻を含む複数のコメント情報を取得するコメント取得手段と、前記コメントごとに形態素解析して該コメントを複数の単語に分割する分割手段と、前記単語ごとに、コンテンツのある区間に対応するシーンを抽出する際の重要度を示す、該単語の評価値を計算する単語評価値計算手段と、分割された全ての単語に対して、各単語が含まれているコメントの開始時刻からコメントの終了時刻までに、該単語に対応する、単語の評価値を加算して、単語ごとに評価値分布を取得する手段と、前記評価値分布に基づいて評価値が高いほどコンテンツの抽出区間に含まれるようにコンテンツから抽出すべきシーンに対応する抽出区間の開始時刻および終了時刻を抽出する抽出手段と、を具備することを特徴とする。

本発明のシーン抽出装置は、上記のシーン情報抽出装置を使用して前記シーンを抽出する抽出手段を具備することを特徴とする。

本発明のシーン情報抽出方法、シーン抽出方法および抽出装置によれば、シーン情報、シーンを的確に抽出することができる。

以下、図面を参照しながら本発明の実施形態に係るシーン情報抽出方法、シーン抽出方法および抽出装置について詳細に説明する。
まず、本発明の概要を説明する。
掲示板やチャットなどの機能を通じて映像コンテンツの時系列に対してコメント情報を付加することで、ユーザ同士がコミュニケーションを図ることが行なわれている。本発明では、それらのコンテンツの時系列に対して関連付けられたコメントに含まれる単語から意味的なひとまとまりとしての区間を抽出することでコンテンツのシーン情報を推測し、メタデータの付加を実現する。

コメント情報はユーザがコンテンツ閲覧時にどのようなことを感じたかを反映した情報であるため、意味的なひとまとまりとしての区間を抽出することが可能となる。コメント情報はコンテンツ提供者がコンテンツ提供時には意図していなかった話題の盛り上がりにも対応しているため、コンテンツを通じたユーザ同士のコミュニケーションが促進される。また、コメント情報はユーザの意識を反映して時々刻々と変化しうるため、例えばある時期には「かっこいい」というラベル付けがなされていた区間に対し「おもしろい」というコメントが増加した場合、「おもしろい」というラベル付けに変化させることができる。このように、本発明はユーザの意識の変化に伴うシーン情報の動的な変化にも追従することが可能となる。

次に、本発明の実施形態に係るシーン情報抽出装置について図１を参照して説明する。
シーン情報抽出装置はコンテンツの時系列に対して関連付けられたコメントから意味的なひとまとまりとしての区間を抽出する装置である。関連付けられたコメントに含まれる単語からコンテンツのシーン情報を推測し、メタデータの付加を実現する。

シーン情報抽出装置は、コメント情報データベース（ＤＢ）１０１、コメント情報取得部１０２、形態素解析部１０３、形態素データベース１０４、計算部１０５、ユーザデータベース１０６、単語評価値割当部１０７、シーン情報抽出部１０８、シーン情報データベース１０９を備えている。計算部１０５は、コメント文字列長計算部１１０、コメント単語数計算部１１１、返信判定部１１２、返信個数計算部１１３、単語評価値計算部１１４、ユーザ検索部１１５を含んでいる。また、シーン情報抽出部１０８は、評価値分布正規化部１１６、評価値分布変化率計算部１１７を含んでいる。

コメント情報データベース１０１は、コメント情報を格納している。コメント情報は、例えば、メタ情報とコメント本文とからなる。メタ情報は、例えば、コメント識別子、親コメント識別子、ユーザ識別子、コメント投稿時刻、コンテンツ識別子、開始時刻、終了時刻からなる。コメント情報については後に図４を参照して説明する。

コメント情報取得部１０２は、コメント情報データベース１０１からコメント情報を１つずつ取得する。コメント情報取得部１０２は、例えば、コメント識別子ごとにコメント情報を取得して、形態素解析部１０３に例えば、コメント識別子ごとにコメント情報を渡す。

形態素解析部１０３は、受け取ったコメントを形態素解析し、例えば、コメント識別子ごとにコメントから単語と、この単語の品詞とを得る。そして、形態素解析部１０３は、単語と、品詞と、この単語が出現するコメント本文のコメント識別子との対応表を出力する。形態素解析部１０３の出力例は図３である。また、形態素解析部１０３の動作については後に図４、図５を参照して説明する。

形態素データベース１０４は、単語自体の評価値を計算するためのものである。単語の評価値は、シーン情報を抽出する際に重要な単語を抽出するためのものであり、重要な単語ほど大きな評価値が付与されるべきものである。形態素データベース１０４は、例えば、単語ごとに、この単語の品詞、この単語が出現した累積出現頻度、単語で決まる評価値を格納している。形態素データベース１０４の具体例は後に図７を参照して説明する。

計算部１０５は、形態素解析部１０３が出力した上記の対応表を利用して単語の評価値を計算する。計算部１０５の具体的な計算方法については後に図６を参照して説明する。

ユーザデータベース１０６は、コメントを付けたユーザごとに、そのコメントがシーン情報抽出にとって重要であるかを評価する、ユーザの評価値を格納している。ユーザデータベース１０６は、例えば、ユーザ識別子、ユーザ名、発言数、ユーザの評価値を含んでいる。ユーザデータベース１０６の詳細については後に図８を参照して説明する。

単語評価値割当部１０７は、コメントからこのコメントが関連付けられているコンテンツならびにコンテンツの区間が取得されるたびに、計算部１０５で計算された単語の評価値をそれぞれのコンテンツの区間に割り当て、各単語の評価値分布であるヒストグラムを求める。さらに、単語評価値割当部１０７は、単語ごとに、この単語と、この単語が含まれるコメント識別子と、この単語のヒストグラムと、を対応付ける。この対応付けられた例は後に図１０を参照して説明する。単語評価値割当部１０７の詳細な動作については後に図９、図１１（ａ）、（ｂ）、（ｃ）を参照して説明する。

シーン情報抽出部１０８は、単語評価値割当部１０７によって単語ごとに作成された評価値分布をもとに、コンテンツの区間の抽出を行う。シーン情報抽出部１０８の詳細は後に図１２、図１３、図１４を参照して説明する。

シーン情報データベース１０９は、シーン情報抽出部１０８で抽出されたコンテンツのある区間に対応するシーンに関する情報を格納している。シーン情報データベース１０９は、例えば、このシーンを象徴する単語であるシーンラベル、コンテンツ識別子、このシーンの開始時刻と終了時刻を格納している。シーン情報データベース１０９の具体例については後に図１２を参照して説明する。

次に、図１のシーン情報抽出装置の動作について図２を参照して説明する。
まず、コメント情報取得部１０２が、１行が（単語、品詞、コメント識別子）からなる表を初期化する（ステップＳ２０１）。すなわち、例えば、図３がこの表であり、初期化とはこの表の項目を空にすることである。この表は後で単語の評価値を計算するための入力として用いられる。

次に、コメント情報取得部１０２がコメント情報データベース１０１からコメント情報を１つずつ取得する。形態素解析部１０３は、コメント情報取得部１０２から取得したコメント情報に形態素解析行われていないコメントがない場合はステップＳ２０５に進み、形態素解析が行われていないコメントがある場合にはステップＳ２０３に進む（ステップＳ２０２）。形態素解析部１０３がコメント情報をコメント情報取得部１０２から取得し、取得するたびにコメント本文の形態素解析を行い、未解析のコメントに形態素がない場合にはステップＳ２０２に戻り、ある場合にはステップＳ２０４に進む（ステップＳ２０３）。形態素解析部１０３は、新たに解析された形態素についての解析結果を上記表に付加して、表を更新する（ステップＳ２０４）。この表は、図示していないメモリ等に格納される。

すべてのコメント情報に対して本文の形態素解析が完了した後、計算部１０５は、形態素解析部１０３が算出した表を利用して単語の評価値を計算する。まず、例えば、単語評価値割当部１０７が、１行が（単語、コンテンツ識別子、評価値分布）からなる表を初期化する（ステップＳ２０５）。すなわち、例えば、図１０がこの表であり、初期化とはこの表のすべての項目を空にすることである。

計算部１０５が（単語、品詞、コメント識別子）の表から１行ずつ単語を取得する。この取得した単語がまだ評価されていない単語である場合にはステップＳ２０７に進み、（単語、品詞、コメント識別子）の表に含まれている全ての単語が評価済である場合にはステップＳ２１１に進む（ステップＳ２０６）。

計算部１０５に含まれる単語評価値計算部１１４は、単語自体の評価値を計算するために形態素データベース１０４を検索する。その後、計算部１０５は、単語が含まれるコメントごとに、その単語の評価値の補正度合いを、コメントの本文の長さ、コメントの属性、コメントを投稿したユーザの評価値によって計算する（ステップＳ２０７）。ユーザの評価値はユーザデータベース１０６を参照する。
計算部１０５は、コメント情報データベース１０１を参照して、（単語、品詞、コメント識別子）の表にあるコメントに関連付けられているコンテンツ、ならびにコンテンツの区間（すなわち、このコメントが付与されているコンテンツの開始時刻と終了時刻）を取得する（ステップＳ２０８）。

単語評価値割当部１０７は、コメントからコメントの関連付けられているコンテンツ、ならびにコンテンツの区間が取得されるたびに、計算部１０５で計算された単語の評価値をそれぞれのコンテンツの区間に割り当てる（ステップＳ２０９）。すなわち、単語評価値割当部１０７は、開始時刻と終了時刻とで決定される評価値分布に、ステップＳ２０７で決定される評価値を加算する。単語評価値割当部１０７は、（単語、コンテンツ識別子、評価値分布）からなる表を更新して、次の単語を取得するためにステップＳ２０６に戻る（ステップＳ２１０）。

ステップＳ２０６で未評価単語がない場合には、シーン情報抽出部１０８が、単語評価値割当部１０７によって単語ごとに作成された評価値分布をもとに、その単語をラベル付けすべきコンテンツの区間（シーン情報）の抽出を行なう（ステップＳ２１１）。

次に、コメント情報データベース１０１の内容例について図４を参照して説明する。図４はコメント情報データベースの構造の一例、ならびにコメント情報データベースに格納されているコメント情報の例である。

例えばコメント識別子１を有するコメント（以下、「コメント識別子？を有するコメント」を「コメント？」と省略する。？は任意の自然数を示す）は、ユーザＡが「この山はあの映画にも。」というコメント本文を、コンテンツ識別子Ｘを有するコンテンツ（以下、「コンテンツ識別子＊を有するコンテンツ」を「コンテンツ＊」と省略する。＊は任意のアルファベットを示す）の00:01:30から00:05:00の区間に対して関連付けたことを表している。コメントを関連付ける区間は、１０秒ごとや１分ごとのようなシステムの側で予め設定された間隔でコンテンツとは無関係に分割された区間、あるいは、カット情報のようにコンテンツの画像情報などを利用して分割された区間から、ユーザがコメントを投稿するときに任意に選択してもよいし、開始時刻と終了時刻をユーザがコメントを投稿するときに任意に指定してもよい。また、ユーザがコメントを投稿するときには開始時刻のみを指定するようにして、１０秒や１分のようなシステムの側で予め設定された区間の幅を持つようにシステムの側で終了時刻を設定してもよい。

また、図４に示されるコメント情報において親コメント識別子が「−」である場合は、親コメントを持たない、すなわち返信ではないことを表しており、親コメント識別子が「−」でない場合は、その識別子に対応するコメントへの返信であることを表している。例えば、コメント１は返信を持たないコメントであり、コメント３はコメント４という返信を持つコメントである。

次に、形態素解析部１０３について図４を参照して説明する。
形態素解析部１０３が、例えば図４のコメント１を受け取った場合、コメント本文は「この山はあの映画にも。」であるため、「この、連体詞」、「山、名詞」、「あの、連体詞」、「映画、名詞」、「に、助詞」、「も、助詞」のように分割する。形態素解析部１０３によって分割されたこれらの（単語、品詞）の組は、投入されたコメントの識別子とともに図３の表に追加されていく。図５は図４に示されるコメント情報を形態素解析部１０３によって形態素解析した結果の例である。本実施形態では形態素解析の結果得られた単語をそのまま図３の表に追加しているが、「山」と「阿蘇山」のように意味的に似ている、あるいは関連がある単語同士は、オントロジーのような単語間の類似度を計算する手段を用いて一つにまとめてしまってもよい。

次に、計算部１０５の動作について図６を参照して説明する。図６は本実施形態における計算部１０５の処理のフローを示す図である。
計算部１０５は、すべてのコメント情報に対して本文の形態素解析が完了した後、形態素解析部１０３によって計算された表を利用して単語の評価値を計算する。単語の評価値を計算する方法はいくつも考えることができるが、本実施例では単語自身の評価値をその単語が含まれるコメントの情報によって補正する計算方法について説明する。

まず、計算部１０５は、形態素解析部１０３によって計算された表から（単語、品詞、コメント識別子）の組を１つずつ取得する（ステップＳ６０１）。次に、単語評価値計算部１１４が、単語自体の評価値を計算するために形態素データベース１０４を検索して、単語自体の評価値を計算する（ステップＳ６０２）。図７は形態素データベース１０４の構造の一例、ならびに形態素データベース１０４に格納されている形態素情報の例である。図７の例では、「山」という単語は名詞で、累計出現頻度は１０、評価値は５であることを示している。
助詞や助動詞のように出現頻度が高く情報量が少ない単語よりも名詞や動詞のように出現頻度が低く情報量が多い単語のほうが評価値は高いと考えられるので、評価値は予め単語の品詞ごとに設定しておく。また、単語の意味や文字列長などに基づいて予め単語ごとに設定しておいてもよい。また、単語に設定された評価値をそのまま単語自体の評価値の計算結果とするのではなく、コメントにおける単語の出現頻度で割る（あるコメントに２回同じ単語が含まれていたら評価値を１／２にするなど）、累計出現頻度に基づいて単語の評価値を更新する（あまり使われない単語が埋もれないようによく使われる単語の評価値は下げるなど）のように、単語の出現頻度をもとに単語自体の評価値を計算してもよい。

次に、計算部１０５は、単語が含まれるコメントごとに、その単語の評価値の補正度合いを、コメントの本文の長さ、コメントの属性、コメントを投稿したユーザの評価値のいずれかによって計算する（ステップＳ６０３、Ｓ６０４、Ｓ６０５）。

コメントの本文の長さによる補正を行なうのは、「山だ！」のような短い感嘆コメントにおける「山」の評価値と、「この山は○○年に噴火し、××年に・・・」のような長い薀蓄コメントにおける「山」の評価値とを区別するためのものである。コメントの本文の長さの評価尺度としては本文の文字列長や本文に含まれる単語数などが考えられる。コメント文字列長計算部１１０はコメントの文字列長を測定し取得し、コメント単語数計算部１１１はコメントに含まれる単語数を測定し取得する（ステップＳ６０３）。文字列長をＬ、単語数をＮ１とするとコメントの本文の長さによる補正は適当な係数を用いてαＬ＋βＮ１のように表すことができる。計算部１０５がこの式に基づいて補正を行う。
コメントの属性による補正を行なうのは、返信では親コメントの内容を受けた内容が投稿されるため、および返信が多く付加されているコメントほど他のコメントに多くの影響を与えていると考えられるためである。コメントの属性の評価尺度としてはコメントが返信であるかどうか、返信の個数などが考えられる。返信判定部１１２はコメントが返信であるかどうかを判定し、返信個数計算部１１３は、返信の個数を計算する（ステップＳ６０４）。返信であるかどうかをＲ（返信であるとき１、返信でないとき０）、返信の個数をＮ２とするとコメントの属性による補正度合いは適当な係数を用いてγＲ＋δＮ２のように表すことができる。計算部１０５がこの式に基づいて補正を行う。ユーザがコメントを投稿するときに、コメントに対して本文の内容が「質問」「回答」「感嘆」「薀蓄」「ネタばれ」などのどういった種類のものであるかの情報を付加し、これらの種類に基づいてコメント属性による補正を行なってもよい。
ユーザの評価値による補正を行なうのは、新参で発言数も少ないユーザによるコメントにおける単語の評価値と古参で発言数も多いユーザによるコメントにおける単語の評価値を区別するためのものである。ユーザ検索部１１５は、ユーザ評価値による補正度合いを計算するためにユーザ情報データベースを検索する（ステップＳ６０５）。計算部１０５は、例えば、新参で発言数も少ないユーザのコメントでの単語の評価値を下げ、古参で発言数も多いユーザのコメントでの単語の評価値を上げる補正を行う。

そして、計算部１０５が、上記のいずれかの補正を単語に行い、補正された単語の評価値を計算する。

次に、上記のステップＳ６０５で参照されるユーザデータベース１０６について図８を参照して説明する。図８はユーザ情報データベースの構造の一例、ならびにユーザ情報データベースに格納されているユーザ情報の例である。
ユーザデータベース１０６は、ユーザの評価値を予めユーザの属するグループごとに設定しておいてもよいし、ユーザの発言頻度によって更新してもよい。また、ユーザデータベース１０６は、発言を読んだ別ユーザからの投票（同意・非同意、役に立った、役に立たないなど）によって更新してもよい。図８の例では、ユーザＡはグループＧに属し、発言数は１３、評価値は５であることを表している。

次に、本実施形態における単語評価値割当部１０７の処理について図９を参照して説明する。
まず、単語評価値割当部１０７は、図１０に示す（単語、コンテンツ識別子、評価値分布）からなる表を初期化する。初期化とはこの表のすべての項目を空にすることである。この表は後で単語区間を抽出するための入力として用いられる。次に、単語評価値割当部１０７は、（単語、品詞、コメント識別子）からなる表から（単語、品詞、コメント識別子）の組を１つずつ取得する。その後、取得した組に含まれる単語に対応するコメント（コメント識別子で一意に決定される）を取得する（ステップＳ９０１）。評価値分布を対応させていない単語がある場合にはステップＳ９０２に進み、全ての各単語に対して対応する評価値分布が決まっている場合には単語評価値割当部１０７は処理を終了する。

ステップＳ９０１で取得したコメントから、コメントの関連付けられているコンテンツ、ならびにコンテンツの区間を取得する（ステップＳ９０２）。例えば、図５の場合、「山」という単語に対応するコメントはコメント１、コメント２、コメント３なので、図４を参照して、それぞれコンテンツＸの00:01:30から00:05:00までの区間、コンテンツＸの00:03:00から00:04:30までの区間、コンテンツＸの00:02:00から00:04:00までの区間となる。同様に「雄大だ」という単語に対応するコメントはコメント２、コメント４なので、それぞれコンテンツＸの00:03:00から00:04:30までの区間、コンテンツＸの00:02:00から00:04:00までの区間となる。

単語評価値割当部１０７は、コメントからコメントの関連付けられているコンテンツ、ならびにコンテンツの区間が取得されるたびに、計算部１０５で計算された単語の評価値をそれぞれのコンテンツの区間に割り当て、（単語、コンテンツ識別子、評価値分布）からなる表を更新する（ステップＳ９０３）。説明を簡単にするために、すべての単語の評価値がすべてのコメントに対して等しく１であったとすると、図１１（ａ）、（ｂ）、（ｃ）に示すように、「山」という単語のコンテンツＸに対する評価値分布は、00:01:30から00:02:00まで１、00:02:00から00:03:30まで２、00:03:30から00:04:00まで３、00:04:00から00:04:30まで２、00:04:30から00:05:00まで１と作成され、「雄大だ」という単語のコンテンツＸに対する評価値分布は00:02:00から00:03:30まで１、00:03:30から00:04:00まで２、00:04:00から00:04:30まで１と作成される。

次に、シーン情報抽出部１０８について図１２、図１３、および、図１４を参照して説明する。
シーン情報抽出部１０８は、前記単語評価値割当部１０７によって単語ごとに作成された評価値分布をもとに、その単語をラベル付けすべきコンテンツの区間の抽出を行なう。すなわち、シーン情報抽出部１０８は、例えば、図１２に示す（コンテンツ識別子、開始時刻、終了時刻、シーンラベル）からなる表を作成する。したがって、図１２に示す表はシーン情報データベース１０９に格納される。シーン情報データベース１０９には、抽出されたシーン情報が格納されていることになる。

単語区間抽出の方法としては、予め設定された閾値を超える区間を抽出する方法（図１３）、評価値分布の変化率に注目して区間を抽出する方法（図１４）などが考えられる。以下ではこれらの方法を用いた単語区間抽出手段の例を説明する。

まず、予め設定された閾値を超える区間を抽出する単語区間抽出処理のフローチャートを図１３に示す。シーン情報抽出部１０８は、評価値分布を正規化した（ステップＳ１３０１）後で予め設定された閾値を超える区間を抽出すればよい（ステップＳ１３０２）。

次に、評価値分布の変化率に注目して区間を抽出する単語区間抽出処理のフローチャートを図１４に示す。シーン情報抽出部１０８は、評価値分布を正規化した（ステップＳ１３０１）後で評価値分布の二次導関数を計算する（ステップＳ１４０１）。その後、計算された二次導関数の値が負である、すなわち評価値分布が上に凸である区間を抽出すればよい（ステップＳ１４０２）。また、再生機等が、シーン情報データベース１０９を参照して、このシーン情報に対応するシーンをコンテンツから抽出する。シーン情報に対応するコンテンツ区間に対応するシーンを再生機が抽出することによって、再生機はこのシーンを再生することができる。

以上に示した実施形態によれば、意味的なひとまとまりとしての区間を抽出することでコンテンツのシーン情報を推測し、メタデータの付加を実現することができる。また、意味的なひとまとまりとしての区間を抽出することが可能となる。さらに、ユーザの意識の変化に伴うシーン情報の動的な変化にも追従することが可能となる。したがって、本実施形態によれば、シーン情報、シーンを的確に抽出することができる。

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

本発明の実施形態に係るシーン情報抽出装置のブロック図。図１のシーン情報抽出装置の動作を示すフローチャート。（単語、品詞、コメント識別子）からなる表の一例を示す図。コメント情報データベースの内容の一例を示す図。図１の形態素解析部が出力する表の一例を示す図。図１の計算部の処理を示すフローチャート。図１の形態素データベースの内容の一例を示す図。図１のユーザデータベース１０６の内容の一例を示す図。図１の単語評価値割当部の処理を示すフローチャート。（単語、コンテンツ識別子、評価値分布）からなる表の一例を示す図。（ａ）、（ｂ）、（ｃ）は、コンテンツＸに対する評価値分布の例を示す図。図１のシーン情報データベースに格納される内容の一例を示す図。図１のシーン情報抽出部、評価値分布正規化部が行う処理を示すフローチャート。図１のシーン情報抽出部、評価値分布正規化部、評価値分布変化率計算部が行う処理を示すフローチャート。

符号の説明

１０１…コメント情報データベース、１０２…コメント情報取得部、１０３…形態素解析部、１０４…形態素データベース、１０５…計算部、１０６…ユーザデータベース、１０７…単語評価値割当部、１０８…シーン情報抽出部、１０９…シーン情報データベース、１１０…コメント文字列長計算部、１１１…コメント単語数計算部、１１２…返信判定部、１１３…返信個数計算部、１１４…単語評価値計算部、１１５…ユーザ検索部、１１６…評価値分布正規化部、１１７…評価値分布変化率計算部。

Claims

コンテンツの時系列に対して関連付けられた複数のコメント情報であって、各コメント情報はコメント、該コメントの開始時刻および終了時刻を含む複数のコメント情報を取得するコメント取得手段と、
前記コメントごとに形態素解析して該コメントを複数の単語に分割する分割手段と、
前記単語ごとに、コンテンツのある区間に対応するシーンを抽出する際の重要度を示す、該単語の評価値を計算する単語評価値計算手段と、
分割された全ての単語に対して、各単語が含まれているコメントの開始時刻からコメントの終了時刻までに、該単語に対応する、単語の評価値を加算して、単語ごとに評価値分布を取得する手段と、
前記評価値分布に基づいて評価値が高いほどコンテンツの抽出区間に含まれるようにコンテンツから抽出すべきシーンに対応する抽出区間の開始時刻および終了時刻を抽出する抽出手段と、を具備することを特徴とするシーン情報抽出装置。
前記単語評価値計算手段は、前記単語の評価値を、単語の品詞、単語の出現頻度に基づいて計算することを特徴とする請求項１に記載のシーン情報抽出装置。
前記単語評価値計算手段は、前記単語の評価値を、前記単語が含まれるコメントの文字列長が長いほど、および、コメントに含まれる単語数が多いほど該評価値が高くなるように計算することを特徴とする請求項１に記載のシーン情報抽出装置。
前記単語評価値計算手段は、前記単語の評価値を、該単語が出現したコメントが返信であるほど、および、該コメントの保持する返信の個数が多いほど該評価値が高くなるように計算することを特徴とする請求項１に記載のシーン情報抽出装置。
コメントを付けたユーザごとに、そのコメントがシーン情報抽出にとって重要であるかを示すユーザの評価値を格納している格納手段と、
単語が出現したコメントを投稿したユーザの評価値を前記格納手段から検索する検索手段と、をさらに具備し、
前記単語評価値計算手段は、前記単語の評価値を、前記ユーザの評価値に基づいて該ユーザの評価値が高いほど該単語の評価値が高くなるように計算することを特徴とする請求項１に記載のシーン情報抽出装置。
前記抽出手段は、前記評価値分布から、予め設定された閾値を越える評価値分布の区間の開始時刻および終了時刻を抽出することを特徴とする請求項１から請求項５のいずれか１項に記載のシーン情報抽出装置。
前記抽出手段は、前記評価値分布から、評価値分布が上に凸である区間の開始時刻および終了時刻を抽出することを特徴とする請求項１から請求項５のいずれか１項に記載のシーン情報抽出装置。
請求項１に記載のシーン情報抽出装置を使用して前記シーンを抽出する抽出手段を具備することを特徴とするシーン抽出装置。
コメント取得手段が、コンテンツの時系列に対して関連付けられた複数のコメント情報であって、各コメント情報はコメント、該コメントの開始時刻および終了時刻を含む複数のコメント情報を取得し、
分割手段が、前記コメントごとに形態素解析して該コメントを複数の単語に分割し、
単語評価値計算手段が、前記単語ごとに、コンテンツのある区間に対応するシーンを抽出する際の重要度を示す、該単語の評価値を計算し、
取得手段が、分割された全ての単語に対して、各単語が含まれているコメントの開始時刻からコメントの終了時刻までに、該単語に対応する、単語の評価値を加算して、単語ごとに評価値分布を取得し、
抽出手段が、前記評価値分布に基づいて評価値が高いほどコンテンツの抽出区間に含まれるようにコンテンツから抽出すべきシーンに対応する抽出区間の開始時刻および終了時刻を抽出することを特徴とするシーン情報抽出方法。
請求項９に記載のシーン情報抽出方法を使用して前記シーンを抽出することを特徴とするシーン抽出方法。