JP2010218385A

JP2010218385A - コンテンツ検索装置及びコンピュータプログラム

Info

Publication number: JP2010218385A
Application number: JP2009066286A
Authority: JP
Inventors: Masaru Miyazaki; 勝宮崎; Atsushi Goto; 淳後藤; Masahiro Shibata; 正啓柴田; Kikuka Miura; 菊佳三浦; Hideki Sumiyoshi; 英樹住吉; Masato Fujii; 真人藤井; Nobuyuki Yagi; 伸行八木
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2009-03-18
Filing date: 2009-03-18
Publication date: 2010-09-30
Anticipated expiration: 2029-03-18
Also published as: JP5335500B2

Abstract

【課題】コンテンツ視聴時に、ユーザが視聴している場面に関連した有益な別コンテンツを効果的に検索、提示する。
【解決手段】インデックス言語検索部３は、現在ユーザが視聴しているコンテンツに付加された言語情報ＬＩ１から、視聴シーンに対応する部分を抽出して、シーン言語情報ＳＩを生成する。そして、別のコンテンツの言語情報ＬＩ２の中から、抽出したシーン言語情報ＳＩと関連性の高いものを抽出し、インデックス言語情報ＬＩ３とする。関連性の高さは、言語的な類似度及び時間的関連性から得られる。関連コンテンツ検索提示部５は、さらに別のコンテンツの言語情報ＬＩ４の中から、インデックス言語情報ＬＩ３と関連性の高いものを抽出し、抽出したコンテンツの言語情報ＬＩ４に対応したコンテンツを、視聴コンテンツに関連性が高いコンテンツとしてユーザ端末に表示させる。
【選択図】図１

Description

本発明は、関連するコンテンツを検索するコンテンツ検索装置及びコンピュータプログラムに関する。

近年、インターネット上に様々な動画提供サービスなどが登場し、ユーザが大量の動画コンテンツなどを視聴できる環境が整ってきた。このようなサービスでは、視聴しているコンテンツに関連した動画を自動的に表示するようなサービスを実現しているものも多い。例えば、このような動画視聴サイトには、視聴中のコンテンツのシリーズや、関連する動画のサムネイルなどを表示することにより、ユーザの連続的な視聴を促すものがある。

このように、現在視聴・閲覧中のコンテンツ（以下、「視聴コンテンツ」と記載）に関連した別のコンテンツ（以下、「関連コンテンツ」と記載）を提示する場合、それらの関連コンテンツは視聴コンテンツに関連があり、さらには視聴者の好奇心を刺激して知見を広めてくれるようなものであることが望ましい。そこで、例えば特許文献１では、視聴コンテンツに関連したキーワードを抽出して表示し、この表示されたキーワードに基づいてインターネット上のウェブページなどの所定の形態の関連コンテンツを検索、表示する技術を提案している。この特許文献１に記載の情報検索技術によれば、視聴コンテンツから抽出されたキーワードによって連想される別のキーワードを検索して表示し、その表示されたキーワードを関連コンテンツの検索用キーワードとすることによって、検索の幅を広げることができる。

特開２００５−１１５７９０号公報

しかし、特許文献１の技術は、番組全体について記述した「番組案内情報（デジタル放送における電子番組表（ＥＰＧ：Electronic Program Guide）のようなもの）」からユーザの嗜好に基づいてキーワードを抽出し、この抽出した中からユーザが選択したキーワードに基づいて他のキーワードを得て連想検索していく手法である。しかし、特許文献１には、ユーザが選択したキーワードからさらに連想される別のキーワードを検索する手法については触れられていない。このため、ユーザが期待するキーワードを必ずしも得ることができない可能性がある。加えて、単にキーワードが含まれるという条件だけでは、まったく関連のないコンテンツを検索してしまう可能性もあり、ユーザの関心を惹くような関連コンテンツを検索することは、網羅性の観点から難しい。

また、ユーザがテレビ番組などのコンテンツを視聴している際には、そのときにわからなかった用語についての説明や、そのときに視聴しているテーマに関してより深く掘り下げた知識が欲しい状況が考えられる。特許文献１の技術では、番組全体について記述した「番組案内情報」からキーワードを抽出することを前提としているが、実際にユーザが見ているシーンに関する関連コンテツを提供するものではない。

本発明は、このような事情を考慮してなされたもので、その目的は、コンテンツ視聴時に、ユーザが視聴している場面（シーン）に関連した有益な別コンテンツを効果的に検索し、提示することができるコンテンツ検索装置及びコンピュータプログラムを提供することにある。

［１］本発明の一態様は、コンテンツの内容に関する情報を記述した言語情報を記憶する言語情報記憶部と、検索対象とする関連コンテンツの内容に関する情報を記述した言語情報を記憶する関連コンテンツ情報記憶部と、視聴中のコンテンツである視聴コンテンツの内容に関する情報を記述した言語情報と、当該視聴コンテンツにおいてユーザが視聴している部分を特定するシーン特定情報とを取得し、当該視聴コンテンツの言語情報から前記シーン特定情報に対応した部分を抽出してシーン言語情報を得るシーン言語抽出部と、前記言語情報記憶部に記憶されている前記言語情報と、前記シーン言語情報との言語的類似度から関連度を算出するシーン言語関連性解析部と、前記シーン言語関連性解析部によって算出された前記関連度に基づき、前記言語情報記憶部から選択した前記言語情報をインデックス言語情報として出力するインデックス言語出力部と、前記関連コンテンツ情報記憶部に記憶されている前記言語情報と、前記インデックス言語情報との言語的類似度から関連度を算出するインデックス言語関連性解析部と、前記インデックス言語関連性解析部によって算出された前記関連度に基づき、前記関連コンテンツ情報記憶部に記憶されている前記言語情報を選択する関連コンテンツ選択部と、前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツの情報を出力する検索結果出力部と、を備えることを特徴とするコンテンツ検索装置である。
この発明によれば、コンテンツ検索装置は、ユーザが視聴している視聴コンテンツの言語情報から、現在視聴しているシーンに対応した部分を抽出してシーン言語情報とし、言語情報記憶部に記憶されている他のコンテンツの言語情報からシーン言語情報と言語的な類似性の高い言語情報を検索して、関連コンテンツを検索するためのインデックス言語情報とする。そして、関連コンテンツ情報記憶部に記憶されている関連コンテンツの言語情報からインデックス言語情報と言語的な類似性の高い関連コンテンツの言語情報を得ると、この得られた言語情報に対応する関連コンテンツの情報を検索結果として出力する。
これにより、ユーザが視聴しているシーンに対応した言語情報が少ない場合でも、その言語情報に基づいて得た類似する別コンテンツの言語情報を検索キーとして用い、関連コンテンツを検索することが可能となる。このとき、視聴コンテンツの言語情報には含まれない言語情報を、目的の関連コンテンツを検索するための検索キーとして利用できるため、ユーザが前提として持っている知識の範囲外に及ぶ内容を含んだ、より幅広い関連コンテンツの検索が可能となる。

［２］本発明の一態様は、上述するコンテンツ検索装置であって、前記視聴コンテンツの言語情報、及び、前記言語情報記憶部に記憶されている前記言語情報にはコンテンツの作成、配信または放送の時刻を示すコンテンツ時刻情報が含まれており、前記シーン言語関連性解析部は、前記言語情報記憶部に記憶されている前記言語情報と前記シーン言語情報との言語的類似度、及び、当該言語情報内のコンテンツ時刻情報が示す時刻と前記視聴コンテンツの言語情報内のコンテンツ時刻情報が示す時刻との乖離に基づいて関連度を算出する、ことを特徴とする。
この発明によれば、視聴コンテンツの言語情報から抽出したシーン言語情報に関連が深いインデックス言語情報を、言語的類似度及び時間的関連性に基づく関連度によって選択することが可能となる。
これにより、視聴しているシーンに関する内容が含まれている場合であっても、古い話題に関するコンテンツの言語情報であれば、関連コンテンツの検索には使用しないようにすることができる。よって、ユーザの興味を惹かない可能性が高い、古い話題に関する関連コンテンツをユーザに提示しないようにすることができる。

［３］本発明の一態様は、上述するコンテンツ検索装置であって、前記関連コンテンツの言語情報記憶部に記憶されている前記言語情報、及び、前記関連コンテンツ情報記憶部に記憶されている前記言語情報にはコンテンツの作成、配信または放送の時刻を示すコンテンツ時刻情報が含まれており、前記インデックス言語関連性解析部は、前記関連コンテンツ情報記憶部に記憶されている前記言語情報と前記インデックス言語情報との言語的類似度、及び、当該言語情報内のコンテンツ時刻情報が示す時刻と前記インデックス言語情報内のコンテンツ時刻情報が示す時刻との乖離に基づいて関連度を算出する、ことを特徴とする。
この発明によれば、インデックス言語情報に関連が深い関連コンテンツの言語情報を、言語的類似度及び時間的関連性に基づく関連度によって選択することが可能となる。
これにより、ユーザの興味を惹かない可能性が高い、古い関連コンテンツをユーザに提示しないようにすることができる。

［４］本発明の一態様は、上述するコンテンツ検索装置であって、前記シーン言語抽出部は、ウェブページにおいてユーザが選択した部分のテキストデータをシーン言語情報とする、ことを特徴とする。
この発明によれば、ウェブページを閲覧しているユーザが、ユーザ端末において指定した当該ウェブページの部分のテキストを、シーン言語情報として用いることができる。
これにより、ウェブページを閲覧しているユーザへ、当該ウェブページの所望部分に関する関連コンテンツを提供することが可能となる。

［５］本発明の一態様は、上述するコンテンツ検索装置であって、前記検索結果出力部は、前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツのデジタルデータから得られる画像情報を出力する、ことを特徴とする。
この発明によれば、コンテンツ検索装置は、検索結果として得られた関連コンテンツの画像を出力する。
これにより、関連コンテンツの情報を画像により確認することができるため、関連コンテンツへのユーザの興味を増進させることができ、また、見たい関連コンテンツを選択しやすくなる。

［６］本発明の一態様は、コンテンツ検索装置として用いられるコンピュータを、検索対象とする関連コンテンツの内容に関する情報を記述した言語情報を記憶する関連コンテンツ情報記憶部、視聴中のコンテンツである視聴コンテンツの内容に関する情報を記述した言語情報と、当該視聴コンテンツにおいてユーザが視聴している部分を特定するシーン特定情報とを取得し、当該視聴コンテンツの言語情報から前記シーン特定情報に対応した部分を抽出してシーン言語情報を得るシーン言語抽出部、前記言語情報記憶部に記憶されている前記言語情報と、前記シーン言語情報との言語的類似度を算出するシーン言語関連性解析部、前記シーン言語関連性解析部によって算出された前記言語的類似度に基づき、前記言語情報記憶部から選択した前記言語情報をインデックス言語情報として出力するインデックス言語出力部、前記関連コンテンツ情報記憶部に記憶されている前記言語情報と、前記インデックス言語情報との言語的類似度を算出するインデックス言語関連性解析部、前記インデックス言語関連性解析部によって算出された前記言語的類似度に基づき、前記関連コンテンツ情報記憶部に記憶されている前記言語情報を選択する関連コンテンツ選択部、前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツの情報を出力する検索結果出力部、として機能させることを特徴とするコンピュータプログラムである。
この発明によれば、コンテンツ検索装置は、ユーザが視聴している視聴コンテンツの言語情報から、現在視聴しているシーンに対応した部分を抽出してシーン言語情報とし、言語情報記憶部に記憶されている他のコンテンツの言語情報からシーン言語情報と言語的な類似性の高い言語情報を検索して、関連コンテンツを検索するためのインデックス言語情報とする。そして、関連コンテンツ情報記憶部に記憶されている関連コンテンツの言語情報からインデックス言語情報と言語的な類似性の高い関連コンテンツの言語情報を得ると、この得られた言語情報に対応する関連コンテンツの情報を検索結果として出力する。
これにより、ユーザが視聴しているシーンに対応した言語情報が少ない場合でも、その言語情報に基づいて得た類似する別コンテンツの言語情報を検索キーとして用い、関連コンテンツを検索することが可能となる。このとき、視聴コンテンツの言語情報には含まれない言語情報を、目的の関連コンテンツを検索するための検索キーとして利用できるため、ユーザが前提として持っている知識の範囲外に及ぶ内容を含んだ、より幅広い関連コンテンツの検索が可能となる。

本発明によれば、コンテンツ視聴時に、ユーザが視聴している場面（シーン）に関連した有益な別コンテンツを効果的に検索し、提示することができる。通常、コンテンツに含まれる各シーンには少ない言語情報しか付加されていないと想定されるが、本発明によれば、この少量の言語情報から時事性を満たし、かつユーザの関心を惹くような関連コンテンツを効率的に、かつ、リアルタイムに検索し、自動的に提示することが可能となる。このように、様々な関連するコンテンツを連想的に視聴可能とすることにより、ユーザの好奇心を満たす、あるいはユーザの知識を深めるための支援をすることができる。

本発明の一実施形態によるコンテンツ検索装置の機能ブロック図である。同実施形態による視聴コンテンツの言語情報の例を示す図である。同実施形態による言語情報記憶部に蓄積される言語情報の例を示す図である。同実施形態による関連コンテンツ情報記憶部内に記憶される情報の例を示す図である。同実施形態によるインデックス言語検索部のインデックス言語検索処理フローである。同実施形態による関連コンテンツ検索提示部の関連コンテンツ検索提示処理フローである。同実施形態によるコンテンツ検索装置を視聴番組の関連番組提示に適用した実施例を示す図である。図７において用いられる言語情報の例を示す図である。同実施形態によるコンテンツ検索装置を視聴動画の関連動画提示に適用した実施例を示す図である。同実施形態によるコンテンツ検索装置をウェブページの関連動画提示に適用した実施例を示す図である。

以下、図面を参照しながら本発明の実施形態を詳細に説明する。

［１．構成］
図１は、本発明の一実施形態によるコンテンツ検索装置１の構成を示す機能ブロック図であり、発明と関係する機能ブロックのみ抽出して示してある。同図において、コンテンツ検索装置１は、言語情報記憶部２、インデックス言語検索部３、関連コンテンツ情報記憶部４、及び、関連コンテンツ検索提示部５を備える。

言語情報記憶部２は、ハードディスク装置や半導体メモリなどで実現され、言語情報ＬＩ２を記憶する。言語情報ＬＩ２は、例えば、放送番組や動画などのコンテンツの字幕、音声認識結果、コンテンツの概要、メタデータ、コンテンツ作成時に使用された原稿などを示すデータである。また、言語情報ＬＩ２は、ウェブページや文書データなどのテキストコンテンツ自体や、これらのテキストコンテンツに付随した言語情報であってもよい。

インデックス言語検索部３は、例えばコンピュータ装置により実現され、シーン言語抽出部３１、シーン言語関連性解析部３２、及び、インデックス言語出力部３３を備える。
シーン言語抽出部３１は、ユーザが視聴・閲覧している番組や動画などのコンテンツ（以下、「視聴コンテンツ」と記載）の言語情報ＬＩ１から、ユーザが視聴している、あるいは、ユーザが選択したシーンに対応した部分を抽出してシーン言語情報ＳＩを生成する。言語情報ＬＩ１は、例えば、字幕、音声認識結果、コンテンツの概要、メタデータ、番組作成時に使用された原稿などを、シーンを特定する情報、例えば、時間情報に対応付けて記述した情報である。よって、生成されたシーン言語情報ＳＩは、ユーザが視聴している視聴コンテンツのシーンに関連した言語情報が含まれることになる。

シーン言語関連性解析部３２は、シーン言語抽出部３１によって生成されたシーン言語情報ＳＩと、言語情報記憶部２に記憶されている各言語情報ＬＩ２との関連性を示す指標である関連度を、言語的な類似度及び時間的関連性に基づいて算出する。インデックス言語出力部３３は、シーン言語関連性解析部３２により算出された関連度に基づいて、シーン言語情報ＳＩと関連性が高い言語情報ＬＩ２を選択し、インデックス言語情報ＬＩ３として関連コンテンツ検索提示部５へ出力する。

関連コンテンツ情報記憶部４は、ハードディスク装置や半導体メモリなどで実現され、関連コンテンツのデジタルデータである関連コンテンツデータと、当該関連コンテンツに関する言語情報である言語情報ＬＩ４とを対応付けて記憶する。関連コンテンツは、例えば、放送番組、動画などのコンテンツであり、視聴コンテンツや、言語情報ＬＩ２に対応したコンテンツとは異なるコンテンツである。

関連コンテンツ検索提示部５は、例えばコンピュータ装置により実現され、インデックス言語関連性解析部５１、関連コンテンツ選択部５２、及び、検索結果出力部５３を備える。インデックス言語関連性解析部５１は、インデックス言語検索部３から入力されたインデックス言語情報ＬＩ３と、関連コンテンツ情報記憶部４に記憶されている各言語情報ＬＩ４との関連度を、言語的な類似度及び時間的関連性に基づいて算出する。関連コンテンツ選択部５２は、インデックス言語関連性解析部５１により算出された関連度に基づいて、インデックス言語情報ＬＩ３と関連性が高い言語情報ＬＩ４を選択する。検索結果出力部５３は、関連コンテンツ選択部５２により選択された言語情報ＬＩ４や、当該言語情報ＬＩ４に対応した関連コンテンツデータに基づいて関連コンテンツの検索結果を生成し、出力する。この検索結果はコンテンツを視聴しているユーザ端末６に表示される。

なお、コンテンツ配信事業者がコンテンツ検索装置１を保有し、コンテンツ検索装置１とユーザ端末６とをネットワークを介して接続するようにしてもよく、言語情報記憶部２、インデックス言語検索部３、関連コンテンツ情報記憶部４、関連コンテンツ検索提示部５のうち任意の１以上の機能部を、ユーザ端末６に備えるようにしてもよい。例えば、テレビジョン受信機、パーソナルコンピュータ、携帯電話など、コンテンツを受信して再生するユーザ端末６にインデックス言語検索部３及び関連コンテンツ検索提示部５の機能を備え、言語情報記憶部２及び関連コンテンツ情報記憶部４をコンテンツ配信事業者側に設置し、インデックス言語検索部３、関連コンテンツ検索提示部５は、ネットワーク経由で言語情報記憶部２、関連コンテンツ情報記憶部４へアクセスするようにしてもよい。また、直接ユーザ端末６から視聴コンテンツに関する情報を取得するかわりに、ユーザ端末６へコンテンツを配信している外部のコンテンツ配信装置から視聴コンテンツに関する情報を取得するようにしてもよい。この場合、コンテンツ配信装置からユーザ端末６へ検索結果を送信する。

［２．言語情報］
図２は、視聴コンテンツの言語情報ＬＩ１の例を示す図である。
同図に示すように、視聴コンテンツの言語情報ＬＩ１は、コンテンツ時刻情報としての番組の放送開始時刻、シーン特定情報としてのタイムコード、及び、当該タイムコードに対応付けられたテキストの文章データを含んでいる。なお、コンテンツ時刻情報として、番組の放送開始時刻の代わりに、コンテンツの配信時刻、コンテンツまたは当該言語情報ＬＩ１の作成時刻の情報を用いてもよい。また、同図では、文章データとして音声認識結果が記述されているが、字幕、原稿、概要説明、メタデータなどであってもよい。また、シーン特定情報は、放送時刻を示す情報や、番組開始、あるいは、コンテツ再生開始からの経過時間などの時間情報とすることができる。

図３は、言語情報記憶部２に蓄積される言語情報ＬＩ２の例を示す図である。
図３（ａ）は、ニュース項目毎のニュース原稿を言語情報ＬＩ２として用いる例を示している。また、図３（ｂ）は、各番組のＥＰＧ（Electronic Program Guide）及び音声認識結果を言語情報ＬＩ２として用いる例を、図３（ｃ）は、ウェブページ自体を言語情報ＬＩ２として用いる例を示している。なお、言語情報ＬＩ２として、図２に示すような言語情報ＬＩ１と同じデータ形式の情報を用いることもできる。また、言語情報ＬＩ２には、番組の放送開始時刻、コンテンツの配信時刻、あるいは、コンテンツまたは当該言語情報ＬＩ２の作成時刻などのコンテンツ時刻情報が記述される。

図４は、関連コンテンツ情報記憶部４に蓄積される情報の例を示す図である。同図に示すように、関連コンテンツ情報記憶部４は、言語情報ＬＩ４と対応づけられた関連コンテンツデータを複数記憶している。なお、言語情報ＬＩ４は、視聴コンテンツの言語情報ＬＩ１と同様のデータ形式の言語情報を用いてもよく、例えば図３（ａ）、（ｂ）に示すような、映像コンテンツに付随しうる言語情報ＬＩ２と同様のデータ形式の言語情報を用いてもよい。

［３．処理フロー］
［３．１インデックス言語検索部３の処理フロー］
図５は、コンテンツ検索装置１のインデックス言語検索部３におけるインデックス言語検索処理の処理フローを示す。

同図において、インデックス言語検索部３のシーン言語抽出部３１は、ユーザがコンテンツの一部を視聴しているかを判断する（ステップＳ１０５）。例えば、インデックス言語検索部３がユーザ端末６に具備されている場合、当該ユーザ端末６のコンテンツ再生部においてコンテンツの一部が再生されていることを検出したときに、ユーザがコンテンツの一部を視聴していると判断する。シーン言語抽出部３１は、この再生されているコンテンツに併せて配信された当該コンテンツの言語情報ＬＩ１をユーザ端末６から読み出すとともに、現在再生中のシーンに対応する時間情報をコンテンツ再生部から取得する。なお、時間情報を受信せず、現在の時刻を時間情報としてもよい。

ユーザがコンテンツの一部を視聴していない場合（ステップＳ１０５：ＮＯ）、シーン言語抽出部３１は、ユーザが能動的に選択している部分コンテンツがあるかを判断する（ステップＳ１１０）。例えば、シーン言語抽出部３１は、ユーザが視聴や関連情報を要求する対象として選択したコンテンツ及びシーンの時間情報をユーザ端末６へ入力すると、当該ユーザ端末６から、この選択されたコンテンツの言語情報ＬＩ１と、時間情報とを受信する。このような場合、ユーザが能動的に選択している部分コンテンツがあると判断する。

ユーザがコンテンツの一部を視聴している場合（ステップＳ１０５：ＹＥＳ）、あるいは、ユーザが能動的に選択している部分コンテンツがある場合（ステップＳ１１０：ＹＥＳ）、シーン言語抽出部３１は、視聴コンテンツ、選択されたコンテンツの言語情報ＬＩ１から、時間情報に対応した部分を抽出し、シーン言語情報ＳＩとする（ステップＳ１１５）。例えば、言語情報ＬＩ１に記述されている内容から、時間情報で示される時刻または再生開始からの経過時間より一定の時間幅に含まれるテキストデータを抽出したり、時間情報で示される時刻または再生開始からの経過時間に対応したテキストデータから所定数の文を抽出したりすることにより、シーン言語情報ＳＩとすることができる。また、時間情報に対応したニュース項目やコーナーなど番組内の項目をシーンとしたり、当該項目の一部をシーンとしたりすることもでき、シーンの大きさは任意に設定可能である。例えば、視聴しているシーンを視聴コンテンツ全体とみなせば、視聴コンテンツに付加された言語情報全体をシーン言語情報ＳＩとすることができる。なお、視聴コンテンツの言語情報ＬＩ１には、時間情報に対応していない情報のみが記述されている場合もあり、この場合は、言語情報ＬＩ１全体をシーン言語情報ＳＩとする。

ユーザがコンテンツの一部を視聴しておらず（ステップＳ１０５：ＮＯ）、ユーザが能動的に選択している部分コンテンツもない場合（ステップＳ１１０：ＮＯ）、シーン言語抽出部３１は、関連コンテンツの検索対象となるコンテンツの言語情報ＬＩ１のみを受信する。シーン言語抽出部３１は、言語情報ＬＩ１全体を、インデックス言語情報ＬＩ３の検索キーとして使用するシーン言語情報ＳＩとする（ステップＳ１２０）。

シーン言語関連性解析部３２は、ステップＳ１１５あるいはステップＳ１２０においてこの取得したシーン言語情報ＳＩと、言語情報記憶部２に記憶されている全言語情報ＬＩ２それぞれとの関連度を算出する（ステップＳ１２５）。この関連度は、言語的類似度及び時間的関連性を用いた所定の算出方法によって算出することができる。

言語的類似度の算出には、例えば、単語間類似度やＴＦ／ＩＤＦ（単語重要度の評価手法）といった言語的特徴量を使用することが可能である。単語間類似度の場合、シーン言語情報ＳＩと言語情報ＬＩ２とに共通して含まれる単語の数を言語的特徴量とする。ＴＦ−ＩＤＦの場合、以下のように言語的特徴量を算出する。

出現頻度方式（ＴＦ）では、複数（ＤＮ個）の文書からなる文書群がある場合に、ある文書中にある単語ｗ（キーワード）が出現する数を示すＴＦ（ｗ）値と、文書群の中でその単語ｗが含まれている文書数を示すＤＦ（ｗ）値とを用いて、当該文書における単語ｗのＴＦ−ＩＤＦ値をＴＦ（ｗ）×ｌｏｇ（ＤＮ／ＤＦ（ｗ））により算出する。そして各文書の文章ベクトルは、各単語のＴＦ−ＩＤＦ値を要素として表される。
そこで、シーン言語関連性解析部３２は、各単語のＤＦ値と、シーン言語情報ＳＩに含まれる各単語のＴＦ値とから、当該シーン言語情報ＳＩについて各単語のＴＦ−ＩＤＦ値を算出し、算出した各キーワードのＴＦ−ＩＤＦ値を要素とした文章ベクトルを生成する。シーン言語情報ＳＩの文章ベクトルと、各言語情報ＬＩ２の文章ベクトルとを比較し、文章ベクトル同士のなす角が近いほど、それらの情報データが類似していることを表す。シーン言語関連性解析部３２は、シーン言語情報ＳＩの文章ベクトルと、言語情報記憶部２から読み出した各言語情報ＬＩ２の文章ベクトルとが成す角の余弦を言語的特徴量として算出するか、他の既存の一般的な類似度算出式を用いて言語的特徴量を算出する。

また、時間的関連性は、コンテンツや言語情報の作成時間などのコンテンツ時刻情報を用いて、作成された時刻が近いものを関連性が高い（時事性が高い）と見なして計算することなどが可能である。例えば、言語情報ＬＩ１に記述されているコンテンツ時刻情報と、各言語情報ＬＩ２に記述されているコンテンツ時刻情報との差分を算出し、差分が大きければ大きいほど、言語的類似度の重みを低くするような係数を与える。そして、言語情報ＬＩ２について得られた言語的類似度に、得られた係数を乗算した結果を関連度として算出することができる。係数は、例えば、１週間以内であれば係数ａ１、２週間以内であれば係数ａ２、…など時間の差分に応じて段階的に決定することでもよく（ａ１＞ａ２＞…）、１年以上など一定時間以上の差分があるコンテンツの言語情報ＬＩ２については係数を０として関連度を０にする、つまり、検索対象として除外したりするようにしてもよい。あるいは、現在時刻と、各言語情報ＬＩ２に記述されているコンテンツ時刻情報の差分を時間的関連性として見なし、言語的類似度の重みを与えるようにしてもよい。

インデックス言語出力部３３は、ステップＳ１２５において算出した、シーン言語情報ＳＩと各言語情報ＬＩ２との関連度に、所定の閾値より高い関連度のものがあるか否かを判断する（ステップＳ１３０）。所定の閾値より高い関連度のものが得られなかった場合（ステップＳ１３０：ＮＯ）、ステップＳ１０５の処理へ戻る。所定の閾値より高い関連度のものが得られた場合（ステップＳ１３０：ＮＯ）、インデックス言語出力部３３は、その所定の閾値より高い関連度が得られた言語情報ＬＩ２を、インデックス言語検索部３において用いられる関連コンテンツのテキストデータの検索キー、つまり、インデックス言語情報ＬＩ３として関連コンテンツ検索提示部５へ出力する（ステップＳ１３５）。このとき、関連度が最も高い言語情報ＬＩ２のみをインデックス言語情報ＬＩ３として出力することでもよく、関連度が高いものから所定数の言語情報ＬＩ２をインデックス言語情報ＬＩ３として出力してもよい。

なお、上記処理において、インデックス言語検索部３がネットワークを介してユーザ端末６と接続されている場合、シーン言語抽出部３１は、ユーザ端末６から視聴コンテンツの言語情報ＬＩ１と、シーンの時間情報とを受信する代わりに、ユーザへコンテンツを提供している事業者のコンテンツ提供装置から、ユーザ端末６へ配信しているコンテンツの言語情報ＬＩ１と、時間情報とを受信してもよい。
また、シーン言語抽出部３１は、視聴コンテンツの言語情報ＬＩ１を受信する代わりに、視聴コンテンツのコンテンツ識別情報を受信し、当該コンテンツ識別情報に対応した言語情報ＬＩ１を、言語情報記憶部２や、言語情報ＬＩ１を蓄積している図示しない他の装置から読み出すことでもよい。
また、視聴コンテンツが動画コンテンツでなく、ウェブページや文書データなどのコンテンツである場合、シーン言語抽出部３１は、ユーザ端末６によって現在ユーザが閲覧しているコンテンツにおいて選択した部分のテキスト情報を受信し、この受信したテキスト情報自体をシーン言語情報ＳＩとして、ステップＳ１２５からの処理を行なう。

また、上記処理においては、言語的類似度の算出に、単語間類似度やＴＦ−ＩＤＦを使用しているが、文書間の類似度を定量的に算出可能な情報であれば、任意の既存の言語的類似度の判定方法を用いることができる。
また、言語的類似度をそのまま関連度として用いてもよい。

［３．２関連コンテンツ検索提示部５の処理フロー］
図６は、コンテンツ検索装置１の関連コンテンツ検索提示部５における関連コンテンツ検索提示処理の処理フローを示す。
同図において、関連コンテンツ検索提示部５のインデックス言語関連性解析部５１は、インデックス言語検索部３から、関連コンテンツの検索キーとしてのインデックス言語情報ＬＩ３を受信すると、この受信したインデックス言語情報ＬＩ３と、関連コンテンツ情報記憶部４内に記憶されている全ての言語情報ＬＩ４それぞれとの関連度を、言語的類似度及び時間的関連性から算出する（ステップＳ２０５）。関連度は、図５のステップＳ１２５と同様の処理により算出できる。このとき、インデックス言語情報ＬＩ３が複数であれば、各インデックス言語情報ＬＩ３と言語情報ＬＩ４それぞれとの関連度を算出してもよく、受信した全てのインデックス言語情報ＬＩ３を併せて１つの検索キーとして使用してもよい。また、時間的関連性を、インデックス言語情報ＬＩ３内のコンテンツ時刻情報または現在時刻と、言語情報ＬＩ４内のコンテンツ時刻情報との差分とする代わりに、インデックス言語出力部３３から出力された言語情報ＬＩ１内のコンテンツ時刻情報と、言語情報ＬＩ４内のコンテンツ時刻情報との差分としてもよい。

関連コンテンツ選択部５２は、ステップＳ２０５において算出した、インデックス言語情報ＬＩ３と言語情報ＬＩ４それぞれとの関連度に、所定の閾値より高い関連度のものがあるか否かを判断する（ステップＳ２１０）。所定の閾値より高い関連度のものが得られなかった場合（ステップＳ２１０：ＮＯ）、ステップＳ２０５の処理へ戻る。所定の閾値より高い関連度のものが得られた場合（ステップＳ２１０：ＹＥＳ）、検索結果出力部５３は、その所定の閾値より高い関連度が得られた言語情報ＬＩ４に対応した関連コンテンツの情報を、関連度が高い順に関連コンテンツ検索結果としてユーザ端末６へ出力する。あるいは、関連コンテンツ検索結果をコンテンツ配信装置へ出力し、コンテンツ配信装置からユーザ端末６へ当該関連コンテンツ検索結果を送信してもよい。また、関連度が高いものから所定数の言語情報ＬＩ４に対応した関連コンテンツの情報を出力してもよい。
言語情報ＬＩ４に対応した関連コンテンツの情報は、言語情報ＬＩ４から読み出した番組のタイトル等の任意の情報や、言語情報ＬＩ４に対応した関連コンテンツのコンテンツデータから作成されたサムネイル等とすることができる。

上記により、ユーザが視聴しているシーンに対応した言語情報が少ない場合でも、その言語情報に基づいて検索した別のコンテンツの言語情報を検索キーとして用い、関連コンテンツを検索することが可能となる。このとき、視聴コンテンツの言語情報に含まれない言語情報を目的の関連コンテンツを検索するための検索キーとして利用できるため、より幅広い関連コンテンツの検索が可能となる。

放送局で制作される番組などのコンテンツは、あるテーマに基づいて制作されていることが多い。ニュースなどの番組に関しても、それぞれのニュース項目はある特定の事柄に関して事実を述べたものになっている。同様に、ウェブページなども特定のテーマについて記述されているものが多い。本実施形態では、単純なキーワード群をインデックスとして用いるのではなく、このような番組単位、項目単位の言語情報や、あるテーマについて記述されたウェブページ全体をインデックス言語情報として用いることにより、視聴コンテンツから最初に得られる少ない言語情報（キーワード）から検索キーを拡張して、幅広い検索を行うことを可能としたものである。

つまり、従来のように、視聴シーンに関連するキーワードが複数得られる場合であっても、その得られた複数のキーワード間に関連性がなければ、それぞれのキーワードを単体で用いるか、相互の関連性に幅がある複数のキーワードを用いて関連コンテンツを検索することになってしまい、精度のよい検索は困難である。一方、本実施の形態では、相互の関連性が高く、かつ、シーンに対応した言語情報には含まれていなかったキーワードも含めたキーワード群を効率よく得ることができ、このキーワード群を用いて関連コンテンツを検索することができるため、話題が発散しすぎず、また、ユーザが知り得なかった内容が含まれる関連コンテンツも検索することができる。

［４．実施例］
［４．１視聴番組の関連番組提示］
図７は、上述したコンテンツ検索装置１を、ユーザが視聴している番組の関連番組提示に適用した実施例を示す図である。本実施例では、ユーザがテレビジョン受信機などのユーザ端末６により放送番組（視聴コンテンツ）を視聴している際に、リモコンのボタンを押すなどの特定の入力動作を行なうことによって、ユーザ端末６において視聴中の番組についての関連番組（関連コンテンツ）の映像を画面上に表示させる。同図においては、番組Ａを視聴している際にボタンを押したことで（図５、ステップＳ１０５：ＮＯ、ステップＳ１１０：ＹＥＳ）、この番組Ａにおける視聴中のシーンに関連した番組Ｂ，Ｃ，Ｄが表示される場合を想定している。以下、処理の流れを示す。

ユーザが視聴している番組Ａには、言語情報ＬＩ１が付加されている。言語情報ＬＩ１は、あらかじめ番組に付加された字幕データ、メタデータ、あるいは番組を音声認識して得られた音声認識結果データ、番組原稿データ、電子番組表（ＥＰＧ）などの情報であり、当該情報がタイムコードとともに記述されている。言語情報ＬＩ１は番組全体に対して１個付加されていてもよいし、番組内の各項目それぞれについて１個が付加されていてもよい。

インデックス言語検索部３のシーン言語抽出部３１は、言語情報ＬＩ１内のタイムコードと、視聴シーンに対応する時間情報とを利用することにより、ユーザの視聴に併せて、言語情報ＬＩ１から一部の言語情報、つまり、シーン言語情報ＳＩを抽出する（図５、ステップＳ１１５）。具体的には、シーン言語抽出部３１は、言語情報ＬＩ１から、視聴している時刻を基準にした一定の時間幅に含まれるテキストデータを抽出する、視聴している時刻に対応した記述箇所から一定の数の文のテキストデータを抽出する、などの方法によりテキストデータを抽出して、シーン言語情報ＳＩを生成する。番組Ａに付加されている言語情報ＬＩ１は言語情報記憶部２に蓄積され、他の視聴コンテンツの関連コンテンツを検索する際には言語情報ＬＩ２として使用される。

次に、シーン言語関連性解析部３２は、言語解析及び時間情報を用い、言語情報ＬＩ１から抽出されたシーン言語情報ＳＩと、言語情報記憶部２内の各言語情報ＬＩ２との言語的類似度及び時間的関連性から関連度を計算する（図５、ステップＳ１２５）。計算の結果、関連性が高いと判断された言語情報ＬＩ２は、インデックス言語出力部３３により言語情報記憶部２から読み出され、インデックス言語情報ＬＩ３として関連コンテンツ検索提示部５に出力される（図５、ステップＳ１３０：ＹＥＳ、ステップＳ１３５）。なお、言語情報ＬＩ２は言語情報ＬＩ１と同程度のタイムコード付き各種情報でもよいし、タイムコードが付いていないテキスト情報のみでもよい。

続いて、関連コンテンツ検索提示部５のインデックス言語関連性解析部５１は、上記と同様に、言語的類似度及び時間的関連性を用いることによって、インデックス言語情報ＬＩ３と、関連コンテンツ情報記憶部４としての番組ＤＢ（ＤＢ：データベース）に蓄積された、番組それぞれに付加された言語情報ＬＩ４との関連度を計算する（図６、ステップＳ２０５）。言語情報ＬＩ４は言語情報ＬＩ１と同程度のタイムコード付き各種情報でもよいし、タイムコードが付いていないテキスト情報のみでもよい。

計算の結果、関連コンテンツ選択部５２は、インデックス言語情報ＬＩ３と高い関連性を持った言語情報ＬＩ４を選択し、選択した言語情報ＬＩ４に対応した番組を関連番組として抽出する（図６、ステップＳ２１０：ＹＥＳ、ステップＳ２１５）。同図においては、３つの関連番組Ｂ、Ｃ、Ｄが視聴コンテンツの関連番組として抽出されている。検索結果出力部５３は、抽出された関連番組Ｂ、Ｃ、Ｄを、テレビ画面に視聴番組と併せてサムネイル表示させる。

なお、視聴番組および関連番組は、番組に関連した言語情報が付加されている限り、その時点で放送されている番組でもよいし、事前にコンテンツ配信サーバなどに蓄積されている番組でもよい。ユーザはそれら検索結果として表示された関連番組をユーザ端末６において選択することにより、放送されている関連番組のコンテンツデータを表示させたり、番組ＤＢから関連番組のコンテンツデータを取得して表示させたりすることができる。

図７に示した実施例における番組検索について、図８を用いて説明する。
図８は、本実施例に用いられる言語情報の例を示す図である。ユーザがユーザ端末６によって視聴中のニュース番組である番組Ａには、あらかじめタイムコード付きの字幕データである言語情報ＬＩ１が付与されている。従って、ある時刻における番組Ａのアナウンサーの発話内容を特定することができる。コンテンツ検索装置１のシーン言語抽出部３１は、言語情報ＬＩ１内に記述されているタイムコードを利用し、ユーザの視聴に併せて、特定のサイズのウィンドウ枠によって、ある時刻でのシーン言語情報ＳＩを抽出する。ここでは、視聴されているシーンの時刻からある一定枠のウィンドウ（当該時刻より３０秒前まで、など）に含まれる字幕の文章をシーン言語情報ＳＩとして取り出すことができる。従って、時間が経過すると、シーン言語情報ＳＩとして抽出する対象となる部分は視聴に併せて移動する。

言語情報記憶部２には、各コンテンツの言語情報ＬＩ２が蓄積されている。抽出されたシーン言語情報ＳＩと、言語情報記憶部２に蓄積された多数の言語情報ＬＩ２それぞれとの関連度を計算し、関連度が上位にあったものをインデックス言語情報ＬＩ３とする。同図では、「アメリカ」、「メーカー」、「金融支援」といった単語が共通しているため、共通単語の数に基づき、別のニュース番組である番組Ｘの言語情報ＬＩ２をインデックス言語情報ＬＩ３として抽出した例を示している。

次に、得られたインデックス言語情報ＬＩ３と、番組ＤＢに多数蓄積されている番組それぞれに付加されている言語情報ＬＩ４との関連度を計算し、関連度が上位である言語情報ＬＩ４を検索結果として抽出し、抽出した言語情報ＬＩ４に対応した関連コンテンツを検索結果としてユーザ端末６の画面に出力する。これによって、元の言語情報ＬＩ１に含まれていない「自動車メーカー」「倒産」などの単語を含む番組を検索することができる。これにより、「どんなメーカーが実際どういった危機に陥っているのだろうか？」というユーザの疑問にさりげなく答えるような情報番組を検索し、ユーザに提示することが可能となる。

また、関連性の比較には、言語情報だけではなく、その言語情報に含まれるコンテンツ時刻情報も利用することができるため、インデックス言語情報ＬＩ３や言語情報ＬＩ４を検索する際に、視聴中の番組に付加されている言語情報ＬＩ１の作成時間と近いものを優先的に抽出し、時事性をも考慮した検索が可能となる。このように、本実施例では、視聴している番組とは別の番組の言語情報をインデックスとして用いることにより、検索語の拡張を行うことができ、より関連性の深い関連コンテンツを提供することを可能とする。

［５．２視聴動画の関連動画提示］
図９は、上述したコンテンツ検索装置１を、ユーザが視聴している動画の関連動画提示に適用した実施例を示す図である。本実施例では、ユーザがパーソナルコンピュータなどのユーザ端末６に備えられているブラウザ等によって、インターネット上の動画視聴サイトなどが提供する動画を視聴している際に、コンテンツ検索装置１によってユーザが視聴している動画に関連した動画コンテンツを、ユーザ端末６が表示している動画の脇に表示する。

ユーザが視聴している動画ａには、シーン毎に場面を説明するメタデータである言語情報ＬＩ１が付加されており、インデックス言語検索部３のシーン言語抽出部３１は、ユーザの視聴に合わせて、視聴している場面に対応したメタデータを、あるいは、全体をシーン言語情報ＳＩとして取り出す（図５、ステップＳ１０５：ＮＯ、ステップＳ１１０：ＹＥＳ、ステップＳ１１５）。言語情報ＬＩ１は、あらかじめ動画ａに付加された字幕データ、メタデータ、音声認識結果データ、番組原稿データ、ＥＰＧなどの情報である。

次に、インデックス言語検索部３のシーン言語関連性解析部３２は、言語的類似度及び時間的関連性を用い、言語情報ＬＩ１から抽出されたシーン言語情報ＳＩと、言語情報記憶部２内の各言語情報ＬＩ２との関連度を計算する（図５、ステップＳ１２５）。計算の結果、関連性が高いと判断された言語情報ＬＩ２は、インデックス言語出力部３３により言語情報記憶部２から読み出され、インデックス言語情報ＬＩ３として関連コンテンツ検索提示部５に出力される（図５、ステップＳ１３０：ＹＥＳ、ステップＳ１３５）。なお、言語情報ＬＩ２は特定の番組コンテンツに付加された言語情報でもよいし、特定のウェブページ上のテキストデータなどでもよい。

続いて、関連コンテンツ検索提示部５のインデックス言語関連性解析部５１は、上記と同様に言語的類似度及び時間的関連性を用いることによって、インデックス言語情報ＬＩ３と、関連コンテンツ情報記憶部４としての動画ＤＢに蓄積された、動画それぞれに付加された言語情報ＬＩ４との関連度を計算する（図６、ステップＳ２０５）。言語情報ＬＩ４は、動画に付加されたメタデータなどである。

計算の結果、関連コンテンツ選択部５２は、インデックス言語情報ＬＩ３と高い関連性を持った言語情報ＬＩ４を抽出し、抽出した言語情報ＬＩ４に対応した動画を関連動画として抽出する（図６、ステップＳ２１０：ＹＥＳ、ステップＳ２１５）。同図においては、関連動画ｂ，ｃ，ｄの３つが関連動画として抽出されている。検索結果出力部５３は、抽出された関連動画ｂ，ｃ，ｄを、ユーザ端末６のウェブブラウザ上に動画ａと併せてサムネイル表示させる。ユーザは、それら関連動画をユーザ端末６において選択することにより、関連動画を動画ＤＢから取得し、視聴することができる。

［４．３ウェブページの関連動画提示］
図１０は、上述したコンテンツ検索装置１をユーザが閲覧しているウェブページの関連動画提示に適用した実施例を示す図である。本実施例では、ユーザがユーザ端末６に備えられているブラウザ等のウェブページ表示によりインターネット上のウェブページαを閲覧している際に、コンテンツ検索装置１によって、ユーザが閲覧しているウェブページαに関連した、あるいは当該ウェブページα上においてマウスなどで選択したテキストに関連した動画コンテンツを、ユーザ端末６が表示しているウェブページαの脇に表示する。

コンテンツ検索装置１のインデックス言語検索部３がユーザ端末６に備えられている場合、インデックス言語検索部３のシーン言語抽出部３１は、ユーザがユーザ端末６のブラウザに表示されているウェブページα上で、マウス等によって手動により選択した部分のテキストデータをシーン言語情報ＳＩとして取得する。また、ユーザが閲覧している部分に関わらず、ウェブページα全体のテキストデータをシーン言語情報ＳＩとして以降の処理を行ってもよい。

次に、シーン言語関連性解析部３２は、言語的類似度及び時間的関連性を用い、シーン言語情報ＳＩと、言語情報記憶部２内の各言語情報ＬＩ２との関連度を計算する（図５、ステップＳ１２５）。計算の結果、関連性が高いと判断された言語情報ＬＩ２は、インデックス言語出力部３３により言語情報記憶部２から読み出され、インデックス言語情報ＬＩ３として関連コンテンツ検索提示部５に出力される（図５、ステップＳ１３０：ＹＥＳ、ステップＳ１３５）。

続いて、関連コンテンツ検索提示部５のインデックス言語関連性解析部５１は、上記のように言語的類似度及び時間的関連性によって、検索キーとして特定されたインデックス言語情報ＬＩ３と、関連コンテンツ情報記憶部４としての動画ＤＢに蓄積された、動画それぞれに付加された言語情報ＬＩ４との関連度を算出する（図６、ステップＳ２０５）。

計算の結果、関連コンテンツ選択部５２は、インデックス言語情報ＬＩ３と高い関連性を持った言語情報ＬＩ４を抽出し、抽出した言語情報ＬＩ４に対応した動画を関連動画として抽出する（図６、ステップＳ２１０：ＹＥＳ、ステップＳ２１５）。同図においては関連動画β，γ，δの３つが関連動画として抽出されている。検索結果出力部５３は、抽出された関連動画β，γ，δを、ユーザ端末６のウェブブラウザ上にウェブページαと合わせてサムネイル表示させる。ユーザは、それら関連動画をユーザ端末６において選択することにより、関連動画を動画ＤＢから取得し、視聴することができる。

上述したように、本実施形態によるコンテンツ検索装置１は、ユーザが視聴・閲覧しているコンテンツの言語情報を利用して、言語特徴的な類似度が高く、かつ、時間的関連の深い他のコンテンツの言語情報をインデックス言語情報として取得する。そして、さらに、その取得したインデックス言語情報の特徴から、言語特徴的な類似度が高く、かつ、時間的関連の深い関連コンテンツ言語情報を検索することにより、連想的にコンテンツを検索し、ユーザに提示する。これにより、コンテンツ検索装置１は、ユーザが視聴・閲覧しているコンテンツから、そのコンテンツに関連したコンテンツを、ユーザが前提として持っている知識の範囲外に及ぶ内容を含むものまで自動的に検索して提示することができる。よって、ユーザの好奇心を刺激する関連情報を提供することが可能となる。また、コンテンツ提供業者において従来必要であったキーワード抽出や関連付けなどの作業を行なったりする必要もない。

なお、上述のコンテンツ検索装置１のインデックス言語検索部３及び関連コンテンツ検索提示部５、ならびに、ユーザ端末６は、内部にコンピュータシステムを有している。そして、コンテンツ検索装置１のインデックス言語検索部３及び関連コンテンツ検索提示部５、ならびに、ユーザ端末６の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、ＣＰＵ及び各種メモリやＯＳ、周辺機器等のハードウェアを含むものである。

また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

１…コンテンツ検索装置
２…言語情報記憶部
３…インデックス言語検索部
３１…シーン言語抽出部
３２…シーン言語関連性解析部
３３…インデックス言語出力部
４…関連コンテンツ情報記憶部
５…関連コンテンツ検索提示部
５１…インデックス言語関連性解析部
５２…関連コンテンツ選択部
５３…検索結果出力部
６…ユーザ端末

Claims

コンテンツの内容に関する情報を記述した言語情報を記憶する言語情報記憶部と、
検索対象とする関連コンテンツの内容に関する情報を記述した言語情報を記憶する関連コンテンツ情報記憶部と、
視聴中のコンテンツである視聴コンテンツの内容に関する情報を記述した言語情報と、当該視聴コンテンツにおいてユーザが視聴している部分を特定するシーン特定情報とを取得し、当該視聴コンテンツの言語情報から前記シーン特定情報に対応した部分を抽出してシーン言語情報を得るシーン言語抽出部と、
前記言語情報記憶部に記憶されている前記言語情報と、前記シーン言語情報との言語的類似度から関連度を算出するシーン言語関連性解析部と、
前記シーン言語関連性解析部によって算出された前記関連度に基づき、前記言語情報記憶部から選択した前記言語情報をインデックス言語情報として出力するインデックス言語出力部と、
前記関連コンテンツ情報記憶部に記憶されている前記言語情報と、前記インデックス言語情報との言語的類似度から関連度を算出するインデックス言語関連性解析部と、
前記インデックス言語関連性解析部によって算出された前記関連度に基づき、前記関連コンテンツ情報記憶部に記憶されている前記言語情報を選択する関連コンテンツ選択部と、
前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツの情報を出力する検索結果出力部と、
を備えることを特徴とするコンテンツ検索装置。
前記視聴コンテンツの言語情報、及び、前記言語情報記憶部に記憶されている前記言語情報にはコンテンツの作成、配信または放送の時刻を示すコンテンツ時刻情報が含まれており、
前記シーン言語関連性解析部は、前記言語情報記憶部に記憶されている前記言語情報と前記シーン言語情報との言語的類似度、及び、当該言語情報内のコンテンツ時刻情報が示す時刻と前記視聴コンテンツの言語情報内のコンテンツ時刻情報が示す時刻との乖離に基づいて関連度を算出する、
ことを特徴とする請求項１に記載のコンテンツ検索装置。
前記関連コンテンツの言語情報記憶部に記憶されている前記言語情報、及び、前記関連コンテンツ情報記憶部に記憶されている前記言語情報にはコンテンツの作成、配信または放送の時刻を示すコンテンツ時刻情報が含まれており、
前記インデックス言語関連性解析部は、前記関連コンテンツ情報記憶部に記憶されている前記言語情報と前記インデックス言語情報との言語的類似度、及び、当該言語情報内のコンテンツ時刻情報が示す時刻と前記インデックス言語情報内のコンテンツ時刻情報が示す時刻との乖離に基づいて関連度を算出する、
ことを特徴とする請求項１または請求項２に記載のコンテンツ検索装置。
前記シーン言語抽出部は、ウェブページにおいてユーザが選択した部分のテキストデータをシーン言語情報とすることを特徴とする請求項１から請求項３のいずれかの項に記載のコンテンツ検索装置。
前記検索結果出力部は、前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツのデジタルデータから得られる画像情報を出力することを特徴とする請求項１から請求項４のいずれかの項に記載のコンテンツ検索装置。
コンテンツ検索装置として用いられるコンピュータを、
検索対象とする関連コンテンツの内容に関する情報を記述した言語情報を記憶する関連コンテンツ情報記憶部、
視聴中のコンテンツである視聴コンテンツの内容に関する情報を記述した言語情報と、当該視聴コンテンツにおいてユーザが視聴している部分を特定するシーン特定情報とを取得し、当該視聴コンテンツの言語情報から前記シーン特定情報に対応した部分を抽出してシーン言語情報を得るシーン言語抽出部、
前記言語情報記憶部に記憶されている前記言語情報と、前記シーン言語情報との言語的類似度を算出するシーン言語関連性解析部、
前記シーン言語関連性解析部によって算出された前記言語的類似度に基づき、前記言語情報記憶部から選択した前記言語情報をインデックス言語情報として出力するインデックス言語出力部、
前記関連コンテンツ情報記憶部に記憶されている前記言語情報と、前記インデックス言語情報との言語的類似度を算出するインデックス言語関連性解析部、
前記インデックス言語関連性解析部によって算出された前記言語的類似度に基づき、前記関連コンテンツ情報記憶部に記憶されている前記言語情報を選択する関連コンテンツ選択部、
前記関連コンテンツ選択部により選択された前記言語情報に対応した関連コンテンツの情報を出力する検索結果出力部、
として機能させることを特徴とするコンピュータプログラム。