JP5600498B2 - 情報選択装置、サーバ装置、情報選択方法、及びプログラム - Google Patents

情報選択装置、サーバ装置、情報選択方法、及びプログラム Download PDF

Info

Publication number
JP5600498B2
JP5600498B2 JP2010151038A JP2010151038A JP5600498B2 JP 5600498 B2 JP5600498 B2 JP 5600498B2 JP 2010151038 A JP2010151038 A JP 2010151038A JP 2010151038 A JP2010151038 A JP 2010151038A JP 5600498 B2 JP5600498 B2 JP 5600498B2
Authority
JP
Japan
Prior art keywords
content
information
search
word
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010151038A
Other languages
English (en)
Other versions
JP2012014504A (ja
Inventor
昌美 中澤
啓一郎 帆足
一則 松本
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010151038A priority Critical patent/JP5600498B2/ja
Publication of JP2012014504A publication Critical patent/JP2012014504A/ja
Application granted granted Critical
Publication of JP5600498B2 publication Critical patent/JP5600498B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、情報選択装置、サーバ装置、情報選択方法、及びプログラムに関する。
近年、テレビ放送と、Webコンテンツとを統合するために、テレビ放送により提供されている情報の構造である話題構造に基づく結合モデルの研究が進められている。
例えば、非特許文献1には、結合モデルに基づいて、テレビ放送により提供されている番組の内容を補完するWebページを検索するためのクエリ・フリー(Query-Free)検索機構が記載されている。この非特許文献1に記載された技術は、検索するWebページの種類に基づいて、4つのクエリを生成している。生成するクエリは、番組とともに送信されている字幕情報に含まれる主題語及び内容語を用いて生成され、SD(Subject-Deepening)、SB(Subject-Broadening)、CD(Content-Deepening)、及びCB(Content-Broadening)の4つのクエリである。
ここで、主題語とは、字幕情報において出現頻度が高く、かつ、その他の語との有向共起度の強いキーワードである。また、内容語とは、字幕情報において出現頻度が高く、かつ、主題語との無向共起度の強いキーワードである。
また、SDは、主題語がWebページの本文を示すテキスト情報に含まれているWebページを検索するためのクエリであり、SBは、内容語がWebページの本文に含まれているWebページを検索するためのクエリであり、CBは、主題語がWebページのタイトルに含まれているWebページを検索するためのクエリであり、CDは、内容語がWebページのタイトルに含まれているWebページを検索するためのクエリである。
上記の手法では、主題語及び内容語を用いた4つのクエリによるWebページの検索を行うことにより、番組の内容と単に類似するWebページを検索するのではなく、番組の内容をより詳しく、又は番組の内容を別の視点から示しているWebページを検索するようにしている。
図6は、非特許文献1の手法によるWebページ(コンテンツ)の検索の処理を示すフローチャートである。
同図に示すように、番組とともに送信されている字幕情報を受信し(ステップS901)、受信した字幕情報から主題語及び内容語を抽出する(ステップS902)。抽出した主題語及び内容語を用いて、CD、CB、SD及びSBのクエリを生成し(ステップS903)、生成した各クエリを検索サーバ(検索エンジン)に送信することにより、Webページの検索を行う(ステップS904)。検索したWebページを示す情報であるURLを受信する(ステップS905)。
この手法を用いると、字幕情報に含まれるすべての話題に対して、話題を掘り下げた詳細な情報と、当該話題を異なる視点からの情報とを示すWebページのURLが得られることになり、話題に関する情報を網羅的に検索することができる。
馬強、田中克己、「話題構造に基づく放送とWebコンテンツの統合のための検索機構」、情報処理学会論文誌:データベース、Vol.45 No.SIG10(TOD23)、pp.18−36、2004年
しかしながら、非特許文献1の手法により得られる番組の内容に関連したWebページを、当該番組を視聴している視聴者(ユーザ)に、番組とともにテレビ画面上に表示させようとすると、Webページの数が多いために、テレビ画面上にすべてを表示させることができないことがある。また、番組の内容に関連したWebページを網羅的に検索したために、当該番組の内容と関連の度合いが低いWebページが含まれてしまうことがあり、ユーザの求めていない情報を示すWebページが含まれてしまうことがある。
すなわち、番組に関連する情報を含むWebページ(コンテンツ)を網羅的に検索したために、検索結果の数が多くなるとともに、番組の内容との関連の度合いが低いコンテンツが含まれるようになり、番組に関連する適切なコンテンツをネットワーク上のコンテンツから選択することができないことがあるという問題がある。
本発明は、上記問題を解決すべくなされたもので、その目的は、放送されている番組に関連する情報を含む適切なコンテンツを選択することができる情報選択装置、情報選択方法、及びプログラム、並びにサーバ装置を提供することにある。
上記問題を解決するために、本発明は、番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得部と、前記字幕取得部が受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索部と、前記複数の検索条件ごとに、前記コンテンツ検索部が検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出部と、前記類似度算出部が選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力部とを備えることを特徴とする情報選択装置である。
また、本発明は、上記に記載の発明において、過去に放送された字幕情報から予め抽出された複数の単語それぞれの前記字幕情報における出現頻度に基づいて、前記字幕情報の特徴を示すベクトルである字幕特徴量を算出する字幕特徴量算出部と、前記複数の単語それぞれの前記テキスト情報における出現頻度に基づいて、前記テキスト情報の特徴を示すベクトルであるテキスト特徴量を算出するテキスト特徴量算出部とを更に備え、前記類似度算出部は、前記字幕特徴量と前記テキスト特徴量とから前記類似度を算出し、前記出力部は、前記複数の検索条件ごとに算出する前記類似度の平均値が最も高い検索条件を選択するか、又は前記複数の検索条件のうち前記類似度が最も高いコンテンツを検索した検索条件を選択し、選択した検索条件により検索された前記コンテンツに対応する位置情報を出力することを特徴とする。
また、本発明は、上記に記載の発明において、前記字幕特徴量算出部は、前記複数の単語を用いてtfidf(Term Frequency & Inverse Document Frequency)により重み付けをした前記字幕特徴量を算出し、前記テキスト特徴量算出部は、前記複数の単語を用いてtfidfにより重み付けをした前記テキスト特徴量を算出し、前記類似度算出部は、前記字幕特徴量と、前記テキスト特徴量とのコサイン相関値を前記類似度として算出することを特徴とする。
また、本発明は、上記に記載の発明において、コンテンツ検索部は、前記ネットワーク上に公開されているコンテンツのうち受信した条件を満たすコンテンツを検索して該コンテンツの前記位置情報を返信する検索サーバに、前記複数の検索条件を送信することにより、前記複数の検索条件を満たすコンテンツを検索し、前記テキスト特徴量算出部は、前記コンテンツ検索部が検索したコンテンツのうち、前記複数の検索条件ごとに、前記検索サーバが順位付けした上位n(n≧1)個のコンテンツに対して前記テキスト特徴量を算出することを特徴とする。
また、本発明は、上記に記載の発明において、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がテキスト情報に含まれ、前記内容語がタイトルに含まれていないコンテンツを検索する第1の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がタイトルに含まれ、前記主題語がテキスト情報に含まれていないコンテンツを検索する第2の検索条件と前記ネットワーク上に公開されているコンテンツのうち、前記内容語がテキスト情報に含まれ、前記主題語がタイトルに含まれていないコンテンツを検索する第3の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がタイトルに含まれ、前記内容語がテキスト情報に含まれていないコンテンツを検索する第4の検索条件と、を前記複数の検索条件として生成するクエリ生成部を更に備え、前記コンテンツ検索部は、クエリ生成部が生成した前記第1から第4の検索条件を前記検索サーバに送信することによりコンテンツの検索を行い、前記出力部は、前記第1から第4の検索条件のうちいずれか一つを選択し、選択した検索条件により検索された前記コンテンツを出力することを特徴とする。
また、本発明は、上記に記載の発明において、前記コンテンツ検索部は、前記第1から第4の検索条件を用いた検索において、得られたコンテンツの数がn個未満の場合、該検索条件を生成する際に用いた前記主題語又は前記内容語の語数を減らして検索条件を再度生成してコンテンツの検索をすることを特徴とする。
また、本発明は、上記に記載の発明における情報選択装置と、放送されている複数の番組それぞれの字幕情報を前記情報選択装置に入力し、前記情報選択装置が出力する位置情報を番組に対応付けて記憶する選択情報記憶部と、前記複数の番組のいずれかを示す要求情報を受信し、該要求情報が示す番組に対応する位置情報を前記選択情報記憶部から読み出し、読み出した位置情報を該要求情報の送信元に送信する要求処理部とを具備することを特徴とするサーバ装置である。
また、本発明は、番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得ステップと、前記字幕取得ステップにおいて受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索ステップと、前記複数の検索条件ごとに、前記コンテンツ検索ステップにおいて検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出ステップと、前記類似度算出ステップにおいて選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力ステップとを含むことを特徴とする情報選択方法である。
また、本発明は、情報選択装置に備えられているコンピュータに番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得ステップと、前記字幕取得ステップにおいて受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索ステップと、前記複数の検索条件ごとに、前記コンテンツ検索ステップにおいて検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出ステップと、前記類似度算出ステップにおいて選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力ステップとを実行させるためのプログラムである。
この発明によれば、番組の字幕情報に関連する情報を含むコンテンツを検索する複数の検索条件ごとに、当該検索条件により検索されたコンテンツと、字幕情報との類似度を算出し、算出した類似度に基づいて複数の検索条件からいずれか一つを選択することにより、複数の検索条件から最適な検索条件を選択することができる。
これにより、複数の検索条件を用いて検索された多数のコンテンツのうち、選択した検索条件である最適な検索条件により検索されたコンテンツを出力することにより、番組の内容に関連する最適なコンテンツをユーザに提示することができる。
第1の実施形態における情報選択装置1の利用形態を示す概略ブロック図である。 同実施形態における情報選択装置1の構成を示す概略ブロック図である。 同実施形態における字幕特徴量(ベクトル)の一例を示す図である。 同実施形態における情報選択装置1のコンテンツ選択処理を示すフローチャートである。 第2の実施形態における情報選択サーバ100の構成を示す概略ブロック図である。 Webページ(コンテンツ)の検索の処理を示すフローチャートである。
以下、図面を参照して、本発明の実施形態による情報選択装置、情報選択方法、及びプログラム、並びにサーバ装置を説明する。
(第1の実施形態)
図1は、第1の実施形態における情報選択装置1の利用形態を示す概略ブロック図である。
同図に示すように、情報選択装置1は、ネットワーク6を介して検索サーバ4及び複数のコンテンツサーバ5に接続されるとともに、セットトップボックス2に接続されている。
セットトップボックス2は、映像を表示する表示装置3に接続されている。また、セットトップボックス2は、放送番組の映像情報、音声情報及び字幕情報を含む放送信号を外部の送信局から受信し、受信した映像情報及び字幕情報を表示装置3が表示できる映像信号に変換し、音声情報を表示装置3が出力できる音声信号に変換し、映像信号及び音声信号を表示装置3に出力する。ここで、字幕情報は、例えば、クローズドキャプション(closed captioning)や、字幕放送などの文字による情報であり、放送されている番組のセリフや番組の内容を表す情報である。
また、セットトップボックス2は、ユーザから入力される操作情報に基づいて、ネットワーク6を介して、コンテンツサーバ5により配信されているコンテンツを受信して表示装置3に表示させる。また、セットトップボックス2は、受信した字幕情報を情報選択装置1に順に送信する。なお、セットトップボックス2は、光ファイバーケーブルや同軸ケーブルなどの有線回線を介して放送信号を受信してもよいし、無線回線を介して放送信号を受信してもよい。
情報選択装置1は、セットトップボックス2から受信した字幕情報に基づいて、字幕情報の内容と関連性のあるコンテンツを検索サーバ4を用いて検索し、検索したコンテンツが記憶されている領域を示す位置情報をセットトップボックス2に送信する。ここで、位置情報は、例えば、URL(Uniform Resource Locator;統一資源位置指定子)などのコンテンツサーバ5と、当該コンテンツサーバ5により配信されているコンテンツが記憶されている領域とを示す情報である。
表示装置3は、入力される映像信号をデコードし、当該映像信号に応じた映像を表示させる。表示装置3は、例えば、テレビ受像機や、液晶ディスプレイなどである。
検索サーバ4は、ネットワーク6を介して受信する検索条件に基づいて、ネットワーク6上で配信されているコンテンツのうち、受信する検索条件を満たすコンテンツを検索するとともに、当該検索条件に基づいて検索されたコンテンツに対して順位付けをしたリストを含む検索結果を、当該検索条件の送信元に返信する。コンテンツに対する順位付けは、例えば、コンテンツと検索条件と一致の度合いや、コンテンツの閲覧回数などに応じて行われる。このような検索サーバ4の例としては、Google(登録商標)や、Yahoo!(登録商標)などにより運営されているネットワーク上の検索サーバ(検索エンジン)がある。
コンテンツサーバ5は、文章により内容が表されたテキスト情報と、当該テキスト情報のタイトルとを含むWebページの情報を記憶し、記憶しているWebページを公開しているサーバ装置である。また、コンテンツサーバ5は、記憶しているWebページの閲覧の要求を受信すると、要求されたWebページの情報を要求元に送信する。ネットワーク6は、インターネットのような一般に公開されたネットワークでもよいし、イントラネットのような特定のユーザに限定されたネットワークでもよい。
図2は、本実施形態における情報選択装置1の構成を示す概略ブロック図である。
同図に示すように、情報選択装置1は、単語リスト記憶部11、字幕取得部12、URL取得部13、テキスト取得部14、テキスト特徴量算出部15、字幕特徴量算出部16、類似度算出部17、URL出力部18を備えている。
単語リスト記憶部11は、m(m≧1)個の単語を含むリスト情報を予め記憶している。リスト情報は、例えば、過去に放送された字幕情報から出現頻度が高い単語や、各字幕情報の特徴を示す重要な単語を抽出して予め生成された単語の集合である。また、リスト情報に含まれる単語は、名詞、又は形容詞である。
字幕取得部12は、外部の装置より字幕情報を受信し、受信した字幕情報をURL取得部13及び字幕特徴量算出部16に出力する。本実施形態において、字幕取得部12は、字幕情報をセットトップボックス2から受信する。
URL取得部13は、字幕取得部12から入力された字幕情報に対して形態素解析を行い、当該字幕情報を品詞に応じて単語に分け、字幕情報に含まれている単語から当該当該字幕情報の主題を表す主題語と、当該字幕情報の内容を表す内容語とを抽出する。そして、URL取得部13は、抽出した主題語及び内容語を組み合わせて生成された複数の検索条件を用いて、ネットワーク6上に公開されているコンテンツのうち字幕情報に関連するコンテンツを検索し、検索したコンテンツの位置情報をテキスト取得部14及びURL出力部18に出力する。以下、位置情報をURLとした場合について記載する。
また、URL取得部13は、キーワード抽出部131、クエリ生成部132、コンテンツ検索部133を有している。
キーワード抽出部131は、入力される字幕情報に対して形態素解析を行い、当該字幕情報を品詞に応じて単語に分け、当該字幕情報に含まれる単語から当該字幕情報の主題語及び内容語を抽出し、抽出した主題語及び内容語をクエリ生成部132に出力する。このとき、キーワード抽出部131は、例えば、主題語を2語選択し、内容語を3語選択する。キーワード抽出部131が選択する主題語及び内容語の語数は、字幕情報の長さなどに応じて変更するようにしてもよい。
また、主題語及び内容語を抽出する方法は、例えば、非特許文献1に記載されている手法を用いて行う。具体的には、字幕情報において、出現頻度が高く、かつ、他の単語との共起関係の強い単語を主題語とする。また、字幕情報において、主題語と共起関係の強い単語を内容語とする。
クエリ生成部132は、字幕情報に関連する周辺の情報が検索できるように、キーワード抽出部131が抽出した主題語及び内容語を組み合わせた前述の複数の検索条件として4つの検索条件を生成してコンテンツ検索部133に出力する。ここで、4つの検索条件の生成方法として、例えば、非特許文献1に記載されているクエリ(質問)の生成方法を用いる。
ここで、クエリ生成部132が生成する4つの検索条件は、(A)主題語に基づいて字幕情報の内容を詳細化することにより字幕情報の内容を掘り下げて検索するためのSD(Subject Deepening)検索条件と、(B)内容語に基づいて字幕情報の内容を詳細化することにより字幕情報の内容を掘り下げて検索するためのCD(Content Deepening)検索条件と、(C)主題語に基づいて字幕情報の内容を広げることにより字幕情報と異なる視点の情報を検索するためのSB(Subject Broadening)検索条件と、(D)内容語に基づいて字幕情報の内容を広げることにより字幕情報と異なる視点の情報を検索するためのCB(Content Broadening)検索条件とである。
具体的には、(A)SD検索条件(第1の検索条件)は、主題語がコンテンツの内容を文章により示すテキスト情報(本文)に含まれ、内容語がタイトル(見出し)に含まれていないコンテンツを検索する条件である。ここで、コンテンツのタイトルとは、例えば、タイトル(Title)のタグに記述された語である。
また、(B)CD検索条件(第2の検索条件)は、内容語がタイトルに含まれ、主題語が本文に含まれていないコンテンツを検索する条件である。
また、(C)SB検索条件(第3の検索条件)は、内容語が本文に含まれ、主題語がタイトルに含まれていないコンテンツを検索する条件である。
また、(D)CB検索条件(第4の検索条件)は、主題語がタイトルに含まれ、内容語が本文に含まれていないコンテンツを検索する条件である。
コンテンツ検索部133は、クエリ生成部132が生成した4つの検索条件それぞれを用いて各検索条件に一致するコンテンツを検索する。具体的には、コンテンツ検索部133は、ネットワーク6を介して、4つの検索条件それぞれを検索サーバ4に送信し、検索サーバ4から検索条件それぞれの検索結果を受信する。そして、コンテンツ検索部133は、各検索条件の検索結果のうち上位n(n≧1)個のコンテンツのURLを、検索条件に対応付けてテキスト取得部14に出力する。ここで、nは、予め定められた数値であり、例えば、放送されている番組の映像とともに表示装置3に表示できるコンテンツの数、又はコンテンツの概要を示す情報の数に基づいて予め定められる。
なお、コンテンツ検索部133は、クエリ生成部132が生成した検索条件により得られたURLがn個未満の場合、検索により得られるURLの個数が増えるように、検索条件に含まれる条件を減らして再度検索を行う。例えば、各検索条件の特徴を生かせるように検索条件に含まれる否定の条件を1つずつ減らすことにより検索条件を緩めて、再度検索を行う。また、否定の条件を削除しても得られるURLがn個以下のときは、肯定の条件を1つずつ減らして検索を繰り返してn個のURLが得られるようにする。
例えば、キーワード抽出部131が字幕情報から2語の主題語s1、s2と、3語の内容語c1、c2、c3とを抽出する場合におけるCD検索条件を緩めるとき、コンテンツ検索部133は、「内容語c1、c2、c3がタイトルに含まれ、主題語s1、s2が本文に含まれない」という条件を、「内容語c1、c2、c3がタイトルに含まれ、主題語s1が本文に含まれない」という条件に変更して再度検索をする。
テキスト取得部14は、コンテンツ検索部133が出力する各検索条件に対応するn個ずつのコンテンツのURLを用いて、ネットワーク6を介してコンテンツサーバ5から当該コンテンツに含まれているテキスト情報を受信する。そして、テキスト取得部14は、受信した各コンテンツのテキスト情報と、当該コンテンツに対応する検索条件とを対応付けてテキスト特徴量算出部15に出力する。
なお、コンテンツに含まれるテキスト情報は、例えば、HTMLにより記載されたコンテンツであれば、ボディ(body)タグにより示されている範囲の文章を選択することにより、コンテンツのデータから取り出される。また、MHTMLにより記載されたコンテンツであれば、テキスト情報は、元となるHTMLのファイルに含まれている文書を選択することにより、コンテンツのデータから取り出される。
テキスト特徴量算出部15は、単語リスト記憶部11に記憶されているリスト情報を読み出し、読み出したリスト情報に含まれる各単語を用いてtfidf(Term Frequency & inverse Document Frequency)により重み付けをした特徴量であるテキスト特徴量を、テキスト取得部14から入力されるコンテンツのテキスト情報ごとに算出する。
具体的には、テキスト特徴量算出部15は、コンテンツのテキスト情報ごとに、リスト情報に含まれるm個の単語ごとのtfidf値を算出し、算出したm個のtfidf値を要素とするm次元のベクトルをテキスト特徴量として算出する。
ここで、tfidfは、ある文書(コンテンツ)内における文字列αの出現頻度(Term Frequency;tf)と、文書集合全体(コンテンツの集合全体)のうち文字列αが出現する文書数の頻度を逆数(Inverse Document Frequency;idf)の積により算出し、算出した数値が大きいほど文字列αが重要であることを示す指標の一つである。
以下、テキスト特徴量の算出方法を詳細に説明する。
検索されたコンテンツのうち、j(1≦j≦4n)番目のコンテンツのテキスト情報における、リスト情報のi(1≦i≦m)番目の単語のtfidf値は、次式(1)により表される。
Figure 0005600498
ここで、tfi,jは、j番目のコンテンツのテキスト情報におけるi番目の単語の出現数である。また、Nは、テキスト特徴量を算出する対象のコンテンツに含まれるテキスト情報の総数(=n×4)である。また、dfは、テキスト特徴量を算出する対象のコンテンツに含まれるテキスト情報(本文)のうち、i番目の単語が含まれるコンテンツのテキスト情報の数である。
このように単語ごとに算出されたtfidf値を要素とする次式(2)により表されるベクトルtをj番目のコンテンツのテキスト情報に対するテキスト特徴量とする。
Figure 0005600498
字幕特徴量算出部16は、テキスト特徴量算出部15と同様に、単語リスト記憶部11に記憶されているリスト情報に含まれる各単語を用いてtfidfにより重み付けをした特徴量である字幕特徴量を字幕取得部12から入力される字幕情報に対して算出する。
例えば、次の字幕情報が入力された場合、字幕情報における単語「南極」のtfidf値は、「25.9」と算出され、単語「しらせ」のtfidf値は、「57.9」と算出される。
(字幕情報):「>>さて25年にわたり、南極観測で活躍し、去年退役した砕氷船しらせ。その後継として建造された新しいしらせが今日、南極へ向けて初めての航海に出発します。中継でお伝えします。>>こちらがその新しいしらせです。通称、南極観測船。正式には氷を砕くと書いて砕氷船といいます。・・・(略)」
図3は、本実施形態における字幕特徴量(ベクトル)の一例を示す図である。
図示する例では、字幕情報に出現しない「ヘッド」、「ひとたび手」、「5つ目」に対して「0」(ゼロ)が割り当てられ、字幕情報に出現する「出発」に対して算出されたtfidf値「7.530645」が割り当てられている。
このように、リスト情報に含まれる単語のうち、字幕情報に出現しない単語に対応する要素に対して「0」(ゼロ)が割り当てられ、字幕情報に出現する単語に対応する要素に対してtfidf値が割り当てられる。また、テキスト特徴量算出部15がコンテンツのテキスト情報ごとに算出するテキスト特徴量も、字幕特徴量と同様に数値が割り当てられる。
図2に戻って、類似度算出部17は、字幕特徴量算出部16が算出した字幕特徴量と、テキスト特徴量算出部15が算出した各テキスト特徴量とを用いて、字幕情報と、コンテンツのテキスト情報との相関を示す類似度を算出し、算出した類似度に基づいて、4つの検索条件から字幕情報に類似したテキスト情報を含むコンテンツを検索する最適な検索条件を選択する。
具体的には、類似度算出部17は、テキスト特徴量が算出したテキスト特徴量(ベクトルt(1≦j≦4×n))と、字幕特徴量tとを用いた次式(3)により表されるコサイン相関値cos(t、t)を類似度として算出する。
Figure 0005600498
また、類似度算出部17は、各テキスト特徴量と、字幕特徴量との類似度を算出するとともに、4つの検索条件それぞれにおける類似度の平均値を算出し、類似度の平均値が最も高い検索条件を最適な検索条件として選択し、選択した検索条件を示す情報をURL出力部18に出力する。
URL出力部18には、類似度算出部17から入力された検索条件を示す情報と、コンテンツ検索部133から4つの検索条件(SB、SD、CB、CD)それぞれに対応付けられたn個ずつURLとが入力される。また、URL出力部18は、コンテンツ検索部133から4つの検索条件それぞれに対応付けられたn個ずつURLから、類似度算出部17から入力された検索条件を示す情報に対応するn個のURLを選択して外部(セットトップボックス2)に出力する。
図4は、本実施形態における情報選択装置1のコンテンツ選択処理を示すフローチャートである。
情報選択装置1は、字幕取得部12がセットトップボックス2から字幕情報を受信すると(ステップS101)、字幕取得部12が、受信した字幕情報をキーワード抽出部131と、字幕特徴量算出部16とに出力する。
キーワード抽出部131は、字幕取得部12から入力された字幕情報における主題語及び内容語を抽出し、抽出した主題語及び内容語をクエリ生成部132に出力する(ステップS102)。
クエリ生成部132は、キーワード抽出部131から入力された主題語及び内容語を用いて、SD、SB、CD、CBそれぞれの検索条件を生成し、生成した検索条件をコンテンツ検索部133に出力する(ステップS103)。
コンテンツ検索部133は、ネットワーク6を介して接続されている検索サーバ4に、クエリ生成部132が生成した検索条件を含む検索を要求する情報を送信し、検索条件ごとの検索結果を受信する。そして、コンテンツ検索部133は、検索条件ごとに、検索結果のうち上位n個のコンテンツのURLを抽出し、各検索条件に対応付けた上位n個ずつのコンテンツのURLをテキスト取得部14に出力する(ステップS104)。
テキスト取得部14は、コンテンツ検索部133から入力されたURLを用いて、検索された各コンテンツのテキスト情報を取得し(ステップS105)、テキスト特徴量算出部15は、テキスト取得部14が取得した各コンテンツのテキスト情報と、単語リスト記憶部11に記憶されている単語リストとを用いて、各コンテンツのテキスト情報に対するテキスト特徴量を算出する(ステップS106)。
また字幕特徴量算出部16は、字幕取得部12から入力された字幕情報と、単語リスト記憶部11に記憶されている単語リストとを用いて、字幕情報に対する字幕特徴量を算出する(ステップS107)。
類似度算出部17は、テキスト特徴量算出部15が算出した各コンテンツのテキスト情報に対するテキスト特徴量と、字幕特徴量算出部16が算出した字幕情報に対する字幕特徴量との類似度を算出する(ステップS108)。
また、類似度算出部17は、4つの検索条件それぞれに対応する各コンテンツの類似度の平均値を算出し、最も平均値の高い検索条件を示す情報をURL出力部18に出力し、URL出力部18は、類似度算出部17から入力された情報に対応する検索条件により検索されたURLをセットトップボックス2に出力する(ステップS109)。
そして、セットトップボックス2は、放送されている番組の映像情報とともに、入力されたURLのコンテンツを示す情報を表示装置3に表示させる。
これにより、放送されている番組の内容に関連性の高いコンテンツを、番組とともに表示装置3に表示して、ユーザに提供する。
上述した処理により、情報選択装置1は、字幕情報に基づいて生成されたSB、SD、CB、及びCDそれぞれの検索条件により番組の内容をより詳しく記載したコンテンツ、又は番組の内容を異なる視点から記載したコンテンツを検索し、検索したコンテンツと字幕情報との類似度に基づいて、SB、SD、CB、及びCDの検索条件のうち、字幕情報と類似度の高いコンテンツを検索した検索条件により検索されたコンテンツを出力するようにした。
このように、複数の検索条件を用いて番組の内容に関連する周辺の情報を含むコンテンツを検索した上で、検索されコンテンツのうち番組の内容との類似度が高いコンテンツを検索した際に用いた検索条件を選択して検索されたコンテンツを絞り込むことにより、番組の内容との類似度がより高いコンテンツを選択することができる。その結果、番組の内容に関連する適切なコンテンツ、又はコンテンツのURLをユーザに提供することができる。
また、情報選択装置1は、テキスト特徴量、及び字幕特徴量の算出に、過去に放送された字幕情報から予め抽出されたm個の単語を用いるようにした。これにより、字幕情報に頻出する単語を用いて、検索したコンテンツのテキスト特徴量を算出するようにしたので、字幕情報との類似度を算出する際の精度を向上させることができる。
また、情報選択装置1は、検索されたコンテンツのうち、各検索条件の上位n個のコンテンツに対してテキスト特徴量を算出し、字幕情報との類似度を算出するようにした。これにより、テキスト特徴量、及び類似度の算出に要する処理時間を一定時間内に抑えるようにし、放送されている番組の内容とともに随時更新される字幕情報に関連する最適なコンテンツを、字幕情報の更新に応じて出力することができる。
なお、上述の第1の実施形態において、情報選択装置1は、選択したURLをセットトップボックス2に送信する構成について説明した。しかし、この構成に限ることなく、ネットワーク6などを介して、選択したURLを予め定められた装置に送信するようにしてもよい。これにより、放送されている番組を表示している表示装置3以外の装置、例えば、当該番組に関連するコンテンツを携帯情報端末などの装置に表示させることができるので、表示装置3においてコンテンツを表示させることができる領域に制限されることなく、コンテンツを表示させることができる。また、上述のコンテンツ選択処理を実行する処理能力を有していない携帯情報端末などにも、番組の内容に関連する適切なコンテンツを表示させることができる。
また、上述の第1の実施形態において、情報選択装置1、セットトップボックス2、及び表示装置3は、独立した装置である場合について説明した。しかし、これに限らず、セットトップボックス2が情報選択装置1を含む構成であってもよいし、表示装置3が情報処理装置1及びセットトップボックス2を含む構成であってもよい。
(第2の実施形態)
図5は、第2の実施形態における情報選択サーバ100の構成を示す概略ブロック図である。
同図に示すように、情報選択サーバ100は、情報選択装置1、放送受信部101、選択情報記憶部102、要求処理部103を具備している。本実施形態における情報選択装置1、検索サーバ4、コンテンツサーバ5、及びネットワーク6は、第1の実施形態における情報選択装置1、検索サーバ4、コンテンツサーバ5、及びネットワーク6と同じ構成を有しており、同じ符号を付して、その説明を省略する。
放送受信部101は、放送されている番組が含まれる複数の放送信号を受信し、各放送信号に含まれる番組の文字情報を順に情報選択装置1に出力し、各放送信号に含まれる番組に関連するURLを選択情報記憶部102に順次出力させる。また、放送受信部101は、情報選択装置1が当該文字情報に応じて出力するURLと、情報選択装置1に出力した文字情報に対応する放送信号を識別するチャンネル情報とを対応付けて選択情報記憶部102に記憶させる。
また、放送受信部101は、予め定められた期間ごとに、字幕情報を情報選択装置1に出力して、選択情報記憶部102に記憶されているチャンネル情報に対応付けられたURLを更新させる。
なお、放送信号受信部101は、光ファイバや同軸線などの有線回線を通じて放送信号を受信してもよし、無線回線を通じて放送信号を受信してもよい。
情報選択装置1は、放送信号受信部101から入力される字幕情報に基づいて、当該字幕情報に関連するn個のURLを選択情報記憶部102に出力する。
選択情報記憶部102には、放送受信部101が受信する複数の放送信号それぞれを示すチャンネル情報と、情報選択装置1が出力するURLとが対応付けて記憶されている。
要求処理部103は、ネットワーク9を介して、複数の端末装置8−1〜8−Nと接続されている。また、要求処理部103は、端末装置8−1〜8−Nから複数の放送信号のうちのいずれかを示すチャンネル情報を含む要求情報を受信すると、受信したチャネル情報に対応するURLを選択情報記憶部102から読み出し、読み出したURLを含む応答情報を当該要求情報の送信元に返信する。
ここで、端末装置8−1〜8−Nは、ネットワーク9を介して情報選択サーバ100と通信を行える装置であり、例えば、携帯型の情報端末装置、ノートパソコン、据え置き型のパソコン、セットトップボックスなどである。
上述のように、情報選択サーバ100が、複数の放送信号により放送されている番組それぞれの内容に関連するコンテンツのURLを、放送信号を識別するチャンネル情報に対応付けて記憶し、端末装置8−1〜8−Nの要求に応じて、放送されている番組の内容に関連するコンテンツのURLを端末装置8−1〜8−Nに送信する。
これにより、端末装置8−1〜8−Nの処理能力が低い場合でも、端末装置8−1〜8Nは、情報選択サーバ100を通じて、放送されている番組の内容に関連するコンテンツのURLを容易に受信することができる。また、ユーザは、例えば、端末装置8−1を操作して、受信したURLにより示されるコンテンツを閲覧することができ、番組の内容に関連するより詳細な情報を得ることができる。
なお、本実施形態において、検索サーバ4及びコンテンツサーバ5と、情報選択サーバ100とを接続するネットワーク6と、端末装置8−1〜8−Nと、情報選択サーバ100とを接続するネットワーク9とは、異なる場合について説明したが、同じネットワークを介して接続されていてもよい。
なお、上述の第1及び第2の実施形態において、情報選択装置1が外部の装置から字幕情報を受信する構成について説明したが、情報選択装置1が放送信号を受信し、受信した放送信号を復調及び復号して、字幕情報を得るようにしてもよい。
また、上述の第1及び第2の実施形態において、類似度算出部17は、算出した類似度の平均値が最も高い検索条件を選択する構成について説明したが、算出した類似度が最も高いコンテンツを検索した際に用いた検索条件を選択するようにしてもよい。
これにより、最も類似度の高いコンテンツを必ず出力することができる。特に、第1及び第2の実施形態において、ユーザに提示できるコンテンツが少ない場合、例えば、表示装置3におけるコンテンツを表示するスペースが狭く1件又は2件しか表示できない場合、適切なコンテンツをユーザに提示することができる。
上述の情報選択装置1は内部に、コンピュータシステムを有していてもよい。その場合、上述した字幕取得部12、URL取得部13、テキスト取得部14、テキスト特徴量算出部15、字幕特徴量算出部16、類似度算出部17、URL出力部18それぞれの動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、各機能部の動作が行われることになる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
1…情報選択装置
2…セットトップボックス
3…表示装置
4…検索サーバ
5…コンテンツサーバ
6,9…ネットワーク
8−1,8−2,8−N…端末装置
11…単語リスト記憶部
12…字幕取得部
13…URL取得部
14…テキスト取得部
15…テキスト特徴量算出部
16…字幕特徴量算出部
17…類似度算出部
18…URL出力部
100…情報選択サーバ
131…キーワード抽出部
132…クエリ生成部
133…コンテンツ検索部

Claims (7)

  1. 番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得部と、
    前記字幕取得部が受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索部と、
    前記複数の検索条件ごとに、前記コンテンツ検索部が検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出部と、
    前記類似度算出部が選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力部と
    前記ネットワーク上に公開されているコンテンツのうち、前記主題語がテキスト情報に含まれ、前記内容語がタイトルに含まれていないコンテンツを検索する第1の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がタイトルに含まれ、前記主題語がテキスト情報に含まれていないコンテンツを検索する第2の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がテキスト情報に含まれ、前記主題語がタイトルに含まれていないコンテンツを検索する第3の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がタイトルに含まれ、前記内容語がテキスト情報に含まれていないコンテンツを検索する第4の検索条件と、を前記複数の検索条件として生成するクエリ生成部と、
    を備え
    前記コンテンツ検索部は、前記クエリ生成部が生成した前記第1から第4の検索条件を用いてコンテンツの検索を行い、前記第1から第4の検索条件を用いた各検索において、得られたコンテンツの数がn個未満の場合、該検索条件を生成する際に用いた前記主題語又は前記内容語の語数を減らして検索条件を再度生成してコンテンツの検索をする
    ことを特徴とする情報選択装置。
  2. 過去に放送された字幕情報から予め抽出された複数の単語それぞれの前記字幕情報における出現頻度に基づいて、前記字幕情報の特徴を示すベクトルである字幕特徴量を算出する字幕特徴量算出部と、
    前記複数の単語それぞれの前記テキスト情報における出現頻度に基づいて、前記テキスト情報の特徴を示すベクトルであるテキスト特徴量を算出するテキスト特徴量算出部と、
    を更に備え、
    前記類似度算出部は、前記字幕特徴量と前記テキスト特徴量とから前記類似度を算出し、
    前記出力部は、前記複数の検索条件ごとに算出する前記類似度の平均値が最も高い検索条件を選択するか、又は前記複数の検索条件のうち前記類似度が最も高いコンテンツを検索した検索条件を選択し、選択した検索条件により検索された前記コンテンツに対応する位置情報を出力する
    ことを特徴とする請求項1に記載の情報選択装置。
  3. 前記字幕特徴量算出部は、前記複数の単語を用いてtfidf(Term Frequency & Inverse Document Frequency)により重み付けをした前記字幕特徴量を算出し、
    前記テキスト特徴量算出部は、前記複数の単語を用いてtfidfにより重み付けをした前記テキスト特徴量を算出し、
    前記類似度算出部は、前記字幕特徴量と、前記テキスト特徴量とのコサイン相関値を前記類似度として算出する
    ことを特徴とする請求項2に記載の情報選択装置。
  4. 前記コンテンツ検索部は、前記ネットワーク上に公開されているコンテンツのうち受信した条件を満たすコンテンツを検索して該コンテンツの前記位置情報を返信する検索サーバに、前記複数の検索条件を送信することにより、前記複数の検索条件を満たすコンテンツを検索し、
    前記テキスト特徴量算出部は、前記コンテンツ検索部が検索したコンテンツのうち、前記複数の検索条件ごとに、前記検索サーバが順位付けした上位n(n≧1)個のコンテンツに対して前記テキスト特徴量を算出する
    ことを特徴とする請求項2又は請求項3のいずれかに記載の情報選択装置。
  5. 請求項1から請求項のいずれか一項に記載の情報選択装置と、
    放送されている複数の番組それぞれの字幕情報を前記情報選択装置に入力し、前記情報選択装置が出力する位置情報を番組に対応付けて記憶する選択情報記憶部と、
    前記複数の番組のいずれかを示す要求情報を受信し、該要求情報が示す番組に対応する位置情報を前記選択情報記憶部から読み出し、読み出した位置情報を該要求情報の送信元に送信する要求処理部と
    を具備することを特徴とするサーバ装置。
  6. 字幕取得部とコンテンツ検索部と類似度算出部と出力部とクエリ生成部とを備える情報選択装置が行う情報選択方法であって、
    前記字幕取得部が、番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得ステップと、
    前記コンテンツ検索部が、前記字幕取得ステップにおいて前記字幕取得部が受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索ステップと、
    前記類似度算出部が、前記複数の検索条件ごとに、前記コンテンツ検索ステップにおいて前記コンテンツ検索部が検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出ステップと、
    前記出力部が、前記類似度算出ステップにおいて前記類似度算出部が選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力ステップと
    前記クエリ生成部が、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がテキスト情報に含まれ、前記内容語がタイトルに含まれていないコンテンツを検索する第1の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がタイトルに含まれ、前記主題語がテキスト情報に含まれていないコンテンツを検索する第2の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がテキスト情報に含まれ、前記主題語がタイトルに含まれていないコンテンツを検索する第3の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がタイトルに含まれ、前記内容語がテキスト情報に含まれていないコンテンツを検索する第4の検索条件と、を前記複数の検索条件として生成するクエリ生成ステップと、
    を含み、
    前記コンテンツ検索ステップでは、前記コンテンツ検索部が、前記クエリ生成部が生成した前記第1から第4の検索条件を用いてコンテンツの検索を行い、前記第1から第4の検索条件を用いた各検索において、得られたコンテンツの数がn個未満の場合、該検索条件を生成する際に用いた前記主題語又は前記内容語の語数を減らして検索条件を再度生成してコンテンツの検索をする
    ことを特徴とする情報選択方法。
  7. 情報選択装置に備えられているコンピュータに
    番組とともに放送されている該番組の内容を表す字幕情報を受信する字幕取得ステップと、
    前記字幕取得ステップにおいて受信した字幕情報に含まれる単語から該字幕情報の主題を表す主題語と、該字幕情報の内容を表す内容語とを抽出し、該主題語及び該内容語を組み合わせて生成された複数の検索条件を用いてネットワーク上に公開されているコンテンツのうち該字幕情報に関連するコンテンツを検索するコンテンツ検索ステップと、
    前記複数の検索条件ごとに、前記コンテンツ検索ステップにおいて検索したコンテンツに含まれ該コンテンツの内容を示すテキスト情報と、前記字幕情報との相関を示す類似度を算出し、算出した類似度に基づいて、前記複数の検索条件からいずれか一つの検索条件を選択する類似度算出ステップと、
    前記類似度算出ステップにおいて選択した検索条件を用いて検索された前記コンテンツが記憶されている領域を示す位置情報を出力する出力ステップと、
    前記ネットワーク上に公開されているコンテンツのうち、前記主題語がテキスト情報に含まれ、前記内容語がタイトルに含まれていないコンテンツを検索する第1の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がタイトルに含まれ、前記主題語がテキスト情報に含まれていないコンテンツを検索する第2の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記内容語がテキスト情報に含まれ、前記主題語がタイトルに含まれていないコンテンツを検索する第3の検索条件と、前記ネットワーク上に公開されているコンテンツのうち、前記主題語がタイトルに含まれ、前記内容語がテキスト情報に含まれていないコンテンツを検索する第4の検索条件と、を前記複数の検索条件として生成するクエリ生成ステップと
    を実行させ、
    前記コンテンツ検索ステップでは、前記クエリ生成ステップで生成した前記第1から第4の検索条件を用いてコンテンツの検索を行わせ、前記第1から第4の検索条件を用いた各検索において、得られたコンテンツの数がn個未満の場合、該検索条件を生成する際に用いた前記主題語又は前記内容語の語数を減らして検索条件を再度生成してコンテンツの検索をさせる
    ためのプログラム。
JP2010151038A 2010-07-01 2010-07-01 情報選択装置、サーバ装置、情報選択方法、及びプログラム Expired - Fee Related JP5600498B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010151038A JP5600498B2 (ja) 2010-07-01 2010-07-01 情報選択装置、サーバ装置、情報選択方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010151038A JP5600498B2 (ja) 2010-07-01 2010-07-01 情報選択装置、サーバ装置、情報選択方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2012014504A JP2012014504A (ja) 2012-01-19
JP5600498B2 true JP5600498B2 (ja) 2014-10-01

Family

ID=45600839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010151038A Expired - Fee Related JP5600498B2 (ja) 2010-07-01 2010-07-01 情報選択装置、サーバ装置、情報選択方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5600498B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6192224B2 (ja) * 2013-12-26 2017-09-06 日本放送協会 注目キーワード情報抽出装置およびそのプログラム
KR102267403B1 (ko) * 2019-12-13 2021-06-22 주식회사 코난테크놀로지 음성 및 영상 정보를 활용한 의미있는 구간을 검출하기 위한 방법 및 이를 위한 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003721A (ja) * 2006-06-20 2008-01-10 Canon Software Inc 情報検索システムおよび情報検索方法およびプログラムおよび記録媒体
JP4900158B2 (ja) * 2007-09-25 2012-03-21 富士通株式会社 検索システム、方法およびプログラム

Also Published As

Publication number Publication date
JP2012014504A (ja) 2012-01-19

Similar Documents

Publication Publication Date Title
US8661041B2 (en) Apparatus and method for semantic-based search and semantic metadata providing server and method of operating the same
KR101644789B1 (ko) 방송 프로그램 연관 정보 제공 장치 및 방법
US9355185B2 (en) Infinite browse
US10289737B1 (en) Media search broadening
JP2021535458A (ja) 機械学習抽出物とセマンティックグラフとを使用して構造化データを作成し、検索、推奨および発見を促進するための方法およびシステム
US8452760B2 (en) Relevancy presentation apparatus, method, and program
US8478759B2 (en) Information presentation apparatus and mobile terminal
JP5610634B2 (ja) 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法
US20120036139A1 (en) Content recommendation device, method of recommending content, and computer program product
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP6429382B2 (ja) コンテンツ推薦装置、及びプログラム
JP2012070036A (ja) 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
JP2009043156A (ja) 番組検索装置および番組検索方法
Chiny et al. Netflix recommendation system based on TF-IDF and cosine similarity algorithms
KR20130083829A (ko) 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천
CN102084645A (zh) 关联场景赋予装置以及关联场景赋予方法
JP2006319456A (ja) キーワード提供システム及びプログラム
JP5600498B2 (ja) 情報選択装置、サーバ装置、情報選択方法、及びプログラム
JP5335500B2 (ja) コンテンツ検索装置及びコンピュータプログラム
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP5545883B2 (ja) 推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラム
CN116521935A (zh) 一种信息推荐方法、装置及电子设备
JP2007295451A (ja) 番組情報提供装置及び番組情報提供方法
JP2019164438A (ja) レコメンド動画決定装置、レコメンド動画決定方法、およびプログラム
JP6440459B2 (ja) 検索装置、検索方法及び検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140310

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140805

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140818

R150 Certificate of patent or registration of utility model

Ref document number: 5600498

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees