JP2007188427A - 話題画像選出方法及び装置及プログラム - Google Patents

話題画像選出方法及び装置及プログラム Download PDF

Info

Publication number
JP2007188427A
JP2007188427A JP2006007715A JP2006007715A JP2007188427A JP 2007188427 A JP2007188427 A JP 2007188427A JP 2006007715 A JP2006007715 A JP 2006007715A JP 2006007715 A JP2006007715 A JP 2006007715A JP 2007188427 A JP2007188427 A JP 2007188427A
Authority
JP
Japan
Prior art keywords
image
cluster
document
images
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006007715A
Other languages
English (en)
Inventor
Harumi Kawashima
晴美 川島
Yoshihide Sato
吉秀 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006007715A priority Critical patent/JP2007188427A/ja
Publication of JP2007188427A publication Critical patent/JP2007188427A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】同じ話題毎にまとめられた文書集合から、話題を的確に表す代表画像を選出する。
【解決手段】本発明は、文書クラスタ中の各文書がリンクしている画像をクラスタリングすることで類似画像毎にまとめた画像クラスタを複数個生成し、複数の画像クラスタから、画像数が最大の画像クラスタを選択し、選択された画像クラスタに含まれる各画像の信頼度を算出し、画像数が最大の画像クラスタに含まれる信頼度が最大の画像を、文書クラスタを代表する画像として選択し、出力する。
【選択図】図1

Description

本発明は、話題画像選出方法及び装置及プログラムに係り、同一の話題毎にまとめられた、画像をリンクしている文書の集合(文書クラスタ)に対する代表画像を選定するための話題画像を選出する技術に関し、特に、文書クラスタ中の各文書がリンクしている画像を類似画像毎にまとめることで、話題を代表する画像を選出するための話題画像選出方法及び装置及プログラムに関する。
近年、インターネットなどのコンピュータネットワークの発達に伴い、大量の電子化された情報が発信され続けている。そのため、ある話題に関する情報を取得したいと思っても、複数の情報源から公開されているWebページを1つ1つ閲覧するという、大変な労力を必要とする。
従来、自然言語処理や情報検索技術分野において、電子化されたテキストをテキスト内で出現する単語のベクトルで表し、単語のベクトルが類似しているテキストを一まとめにする技術がある(例えば、特許文献1参照)。
上記の技術は、利用者に提示される情報が単語だけであり、単語の集合からどんな話題なのかを利用者が判断する。
特開平11−213000号公報
もっと容易に話題を把握できる情報として画像がある。画像を1枚見ただけでどんな話題か簡単に分かる場合がある。Webページは、HTMLで記述された文書であり、文書内に画像をリンクすることができる(HTMLのタグ要素として画像のURLを指定することで、Webブラウザ上に画像を表示することができる)。
しかし、1つの文書に複数の話題が記載されている場合もあり、類似した文書集合がリンクしている全ての画像が1つの話題を的確に表現しているとは限らない。
本発明は、上記の点に鑑みなされたもので、同じ話題毎にまとめられた文書集合から、話題を的確に表す代表画像を選出することが可能な話題画像選出方法及び装置及プログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、同一の話題毎にまとめられた、画像をリンクしている文書の集合(以下、文書クラスタと記す)に対する代表画像を選定する話題画像選出方法であって、
画像クラスタリング手段が、
記憶手段内の文書クラスタ中の各文書がリンクしている画像をクラスタリングすることで類似画像毎にまとめた画像クラスタを複数個生成し、記憶手段に格納する画像クラスタリングステップ(ステップ1)と、
画像信頼度付与手段が、
画像クラスタリングステップで生成され、記憶手段に格納された複数の画像クラスタから、画像数が最大の画像クラスタを選択し、選択された画像クラスタに含まれる各画像の信頼度を算出する画像信頼度算出ステップ(ステップ2)と、
集約データ生成手段が、
画像数が最大の画像クラスタに含まれる信頼度が最大の画像を、文書クラスタを代表する画像として選択し、出力する集約データ生成ステップ(ステップ3)と、を行う。
また、本発明(請求項2)は、画像信頼度付与ステップ(ステップ2)において、
任意の方法により、各画像の文書内で出現する画像出現順番と、画像サイズとを取得し、該画像出現順番が早く、画像サイズが大きいほど高い信頼度を付与するステップを含む。
図2は、本発明の原理構成図である。
本発明(請求項4)は、同一の話題毎にまとめられた、画像をリンクしている文書の集合(以下、文書クラスタと記す)に対する代表画像を選定する話題画像選出装置100であって、
文書クラスタ蓄積手段20の文書クラスタ中の各文書がリンクしている画像をクラスタリングすることで類似画像毎にまとめた画像クラスタを複数個生成し、記憶手段に格納する画像クラスタリング手段101と、
画像クラスタリング手段101で生成され、記憶手段に格納された複数の画像クラスタから、画像数が最大の画像クラスタを選択し、選択された画像クラスタに含まれる各画像の信頼度を算出する画像信頼度算出手段102と、
画像数が最大の画像クラスタに含まれる信頼度が最大の画像を、文書クラスタを代表する画像として選択し、出力する集約データ生成手段103と、を有する。
また、本発明(請求項4)は、画像信頼度付与手段102において、
任意の方法により、各画像の文書内で出現する画像出現順番と、画像サイズとを取得し、該画像出現順番が早く、画像サイズが大きいほど高い信頼度を付与する手段を含む。
本発明(請求項5)は、コンピュータを、請求項3または4記載の話題画像選出装置として機能させる話題画像選出プログラムである。
上記のように本発明によれば、話題毎にまとめた文書集合に対して、リンクしている画像を画像特徴量に基づいたクラスタリングをすることで、類似画像の多い画像の集合が話題を的確に表しているとして選出することができる。
また、類似画像の多い画像集合の各画像に対して信頼度を付与し、信頼度の高い画像を選出することで、話題を代表する画像を選出することができる。
また、文書内でリンクしている画像の出現順番が早く、画像サイズが大きい画像は、文書の書き手が自信をもって発信している画像であるとして高い信頼度を付与することにより、画像クラスタの中から信頼度の高い画像を代表画像として選出することができる。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態における話題画像選出システムの構成を示す。
話題画像選出システムは、Webページ収集部50、文書蓄積部21、文書クラスタリング部22、文書クラスタ蓄積部20、画像蓄積部30、インデックス蓄積部40、話題画像選出装置100、集約データ蓄積部60から構成される。同図のシステムにおいて、文書クラスタ蓄積部20、画像蓄積部30、インデックス蓄積部40、集約データ蓄積部60が話題画像選出装置100に接続されている。
Webページ収集部50は、内部に収集先リスト51を持ち、定期的に収集先リスト51に設定された収集先のURLから、当該URLが指すWebページと、該Webページ内でリンクしているWebページを収集し、テキスト情報を文書蓄積部21へ、画像を画像蓄積部30へ、テキスト情報と画像の対応付けをインデックス蓄積部40へ蓄積する。ここで、「Webページ」とは、HTTP経由で入手可能なデータを指し「Webページ内でリンクしている」とは、HTMLで記述されるタグの中で、Aタグ及びIMGタグ等の、他のWebページを指しているポインタのことを言う。また、画像は、Webページからリンクしている場合が殆どであり、画像を蓄積する際には、リンク元(画像をリンクしている)のWebページURLをインデックス蓄積部40に記録する。
図4にインデックス蓄積部40の蓄積例を示す。インデックス蓄積部40は、画像URL41,WebページURL42、画像出現順番43、画像サイズ44を格納する。画像URL41は、収集した画像URLを示し、WebページのURL42は、リンク元のWebページのURLを示す。画像出現順番43は、リンク元Webページにおいて、画像へのリンクが出現した順番を示し、画像サイズ44は、画像がWebページ内で表示される面積を示す。
図5にWebページの例を示す。同図(a)は、HTMLで記載されたWebページである。<>で囲まれたタグ要素が存在する。同図(b)は、タグ要素を除去した後のテキスト情報で、文書蓄積部21に蓄積されるデータ例になる。
また、同図(a)には、以下の2つの画像がIMGタグとして指定されている。
http://blog.aaa.jp/images/bb/cc/0001.jpg
http://blog.aaa.jp/images/bb/cc/0002.jpg
画像出現順番は、「http://blog.aaa.jp/images/bb/cc/0001.jpg」が1、「http://blog.aaa.jp/images/bb/cc/0002.jpg」が2であり、画像サイズは、両方とも120,000である。
図6に、Webページ収集部50の処理のフローチャートを示す。
Webページ収集部50は、まず、初めに、収集先リスト51を読み込み(ステップ11)、収集先リスト51から未処理のURLがあるか調べ(ステップ12)、ある場合は未処理のURLを1つ取り出す(ステップ13)。
続いて、URLの指すWebページのデータをHTTP経由でダウンロードして取得する(ステップ14)。取得したWebページに対して、HTMLの解析を行い、画像を取得するために必要なタグ要素(IMGタグ)を抽出する。タグは、<>で囲まれた文字列であり、“<img”で始まり、“>”までの文字列を取り出す(ステップ15)。タグが存在した場合は(ステップ16、No)、文字列が、「.JPG」、「.GIF」などの画像を示す文字を含む場合、画像が存在すると判定し(ステップ17、Yes)、画像を指し示すURL(画像URL)から画像を取得して画像蓄積部30に格納する(ステップ18)。この際、画像URLが相対パスの場合は、画像へのリンクが記載されたWebページのURLから、絶対パスに変換し、画像を取得する。また、画像サイズに閾値を定め、一定サイズ以下の画像については画像蓄積部30に蓄積しないようにする。ここで、画像URLは画像毎にユニークであるため、画像蓄積部30は、画像URLをキーとして画像を検索できる構成とする。
続いて、Webページ内での画像出現順番をカウントし、画像サイズを抽出する(ステップ19)。画像サイズは、IMGタグに属性として画像の高さ、幅が指定されている場合のみ抽出する。
次に、インデックス格納部40に、絶対パスの画像URL、画像へのリンクが記載されたWebページURL、画像出現順番、画像サイズを格納する(ステップ20)。
続いて、ステップ15に戻り、HTML解析を行う。ステップ17において画像が存在しない場合もステップ15に戻り、HTMLの解析を行う。
HTMLの解析が終了した場合(ステップ16、Yes)、文書蓄積部21にタグを除去したテキスト情報を格納し(ステップ21)、処理を終了する。
上記の処理をニュースサイトやブログサイトなどの本文以外の記述が多いWebページに適用する場合、ステップ14で収集したWebページから本文部分を抽出し、その後、本文部分に対してステップ15以降の処理を実施する。ここで、WebページURLは、文書毎にユニークであるため、文書蓄積部21はWebページURLをキーとしてテキスト情報を検索できる構成とする。
文書クラスタリング部22は、文書蓄積部21に蓄積された文書のうち、前回クラスタリング処理を行わなかった文書を選択して文書集合として取得する。今回取得した各文書には、クラスタリング処理済みのフラグをセットし、次回のクラスタリング処理を行わないようにする。
取得した文書集合をクラスタリングして、文書集合に含まれる文書を類似文書毎にまとめた文書クラスタを生成し、文書クラスタ蓄積部20に蓄積する。文書クラスタの情報は、文書クラスタ毎に含まれる文書を一意に特定できるように構成する。例えば、図7に示すように、文書クラスタを識別するID(文書クラスタID61)とそのクラスタに含まれる文書を一意に特定できる文書のWebページURL62を組としてテーブル化してもよい。
文書クラスタリングの仕組みについてはどのようなものを用いてもよく、例えば、「岩波書店、マルチメディア情報学「情報組織化」pp.192-193」に開示されているようなクラスタ分類手法を利用することができる。図7において文書クラスタ蓄積部20には、各文書クラスタID61に対応して複数のWebページURL62が格納されており、これらの複数Webページは内容が類似しており、同一の文書クラスタに属することを示している。同一の文書クラスタに属する文書の数が多ければ、同じ内容(話題)を扱っている文書数が多いということになり、話題性が高いと考えることができる。
本発明の要部である話題画像選出装置100は、画像クラスタリング部101、画像信頼度算出部102、集約データ生成部103から構成される。
画像クラスタリング部101は、文書クラスタ蓄積部20から全ての文書クラスタを取得し、文書クラスタ毎に、Webページに含まれる画像(図7のWebページURLに対応するHTML文書からリンクされている画像)を取得し、取得した画像群に対して画像特徴量に基づいたクラスタリングをすることで類似画像毎にまとめた画像クラスタを生成する。
図8は、本発明の一実施の形態における画像クラスタリング部の処理のフローチャートである。
画像クラスタリング部101は、まず、文書クラスタ蓄積部21から全ての文書クラスタを取得し(ステップ31)、未処理の文書クラスタがある場合に(ステップ32、Yes)、未処理の文書クラスタを取り出し(ステップ33)、取り出した文書クラスタに属するWebページURLを全て取得する(ステップ34)。
次に、インデックス蓄積部40から、取得したWebページURLをもつ画像URLを全て取得する(ステップ35)。そして、取得した画像URLをキーにして、画像蓄積部30を検索し、画像を全て取得する(ステップ36)。
続いて、画像集合をクラスタリングし(ステップ37)、図9に示すような画像クラスタリング結果をメモリ(図示せず)に格納する(ステップ38)。
未処理の文書クラスタがなくなるまでステップ33からステップ38の処理を行い、全ての文書クラスタを処理し終えたら(ステップ32、No)、メモリ(図示せず)に格納された画像クラスタリング結果を出力し(ステップ39)、処理を終了する。
ここで、利用する画像クラスタリングの仕組みについてはどのようなものを用いてもよく、例えば、特開2000−250943に開示されているような画像分類方法を利用することができる。
図9において、文書クラスタID81は、文書クラスタを識別するためのIDであり、図7の文書クラスタID61と共通である。画像クラスタID82は、画像クラスタを識別するためのIDであり、画像URL83は、画像を一意に特定するための情報である。メモリ(図示せず)には、各文書クラスタIDに対応して複数の画像クラスタIDが格納されており、これら複数の画像クラスタが1つの文書クラスタに属することを示している。また、1つの画像クラスタに複数の画像URLが格納されており、これらの複数画像が同一の画像クラスタに属することを示している。
同一の画像クラスタに属する画像は、画像特徴量が類似しており、クラスタに属する画像の数が多ければ、同じ場所やアングルで撮影した同じ話題についての画像である可能性が高く、話題を代表する画像であると考えることができる。
例えば、「ABCランドのクリスマスパレード」を話題にした文書クラスタがあった場合、文書クラスタに属する文書のいくつかには、クリスマスパレードに関する画像が存在し、それ以外のキャラクタの写真なども同時に存在している。これらの画像を画像特徴量に基づいてクラスタリングすることにより、クリスマスパレードの画像クラスタと、キャラクタの画像クラスタを分けることが可能となる。また、クリスマスパレードの画像数は多く、類似度も高いため、大きな画像クラスタが形成される。キャラクタの画像は、場所や色などから、いくつかの画像クラスタに分類される。
画像信頼度算出部102は、文書クラスタ毎に、文書クラスタに対応する画像クラスタリング部101で得られたメモリ(図示せず)の全画像クラスタから、画像数の多い画像クラスタを選び、選択された画像クラスタ中の各画像に信頼度を付与する。画像に付与する信頼度は、Webページ内での画像出現順番が早く(即ち、WebページURLに対応するHTML文書内で画像へのリンク情報が先に出現するほど)、画像サイズが大きいほど高い信頼度をとる。但し、画像に付与する信頼度は、画像クラスタ内の画像から代表画像を選択するために付与するものであるので、画像が信頼できるものであるほど高い値を与えるよう信頼度を求める方法を用いれば、どのような方法を用いてもよい。
図10は、本発明の一実施の形態における画像信頼度算出部の処理フローチャートである。
同図の例では、画像数の多い上位N件の画像クラスタに対して、画像クラスタ内の各画像に信頼度を付与している。
まず、画像信頼度算出部102は、画像クラスタリング部101においてメモリ(図示せず)に格納されている画像クラスタリング結果から、文書クラスタ毎に画像数の多い上位N件の画像クラスタを取得する(ステップ51)。
続いて、未処理の文書クラスタがある場合は(ステップ52、Yes)、文書クラスタを1つ取り出し(ステップ53)、該文書クラスタに属する画像クラスタの中で未処理の画像クラスタがある場合は(ステップ54、Yes)、メモリ(図示せず)から未処理の画像クラスタを1つ取り出す(ステップ55)。
続いて、取り出した画像クラスタに属する画像URLを全て抽出し(ステップ56)、インデックス蓄積部40から画像URLをキーとして各画像の画像出現順番、画像サイズを取得する(ステップ57)。画像サイズが取得できない場合は、画像蓄積部30から画像URLをキーとして画像を取得し、画像サイズを求めてもよい。
続いて、画像クラスタ内の各画像に対して信頼度を算出する(ステップ58)。信頼度は、以下の式(1)で算出され、画像出現順番が高く、画像サイズが大きいほど高い値を取る。
Figure 2007188427
ここでは、画像サイズの影響を小さくするため√した値を使用しているが、√せずに、式(2)のように画像サイズを利用してもよい。
Figure 2007188427
ステップ53で取り出した文書クラスタ内の画像クラスタ全てに対して、順次未処理の画像クラスタを取り出し(ステップ55)、ステップ58までの処理を行う。1つの文書クラスタに対する処理が終了すると(ステップ54、No)、順次、未処理の文書クラスタがあるか調べ(ステップ52)、未処理の文書クラスタがある場合、ステップ53以降の処理を行ない、全ての文書クラスタを処理し終えたら(ステップ52、No)、処理結果をメモリ(図示せず)に出力し(ステップ59)、終了する。
例えば、ステップ51において、画像数の最も多い画像クラスタ1つを選択して取得すると、処理結果は、メモリ(図示せず)に出力され、図11に示すように、文書クラスタ毎に1つの画像クラスタが存在し、画像クラスタに属する各画像に信頼度84が付与された状態となる(図9と図11では、同じデータ項目には同じIDを付与している)。
集約データ生成部103は、文書クラスタ蓄積部20に蓄積されている文書クラスタリングの結果と、画像信頼度算出部102で出力される図11に示すメモリ(図示せず)の処理結果とを読み込み、各文書クラスタに画像を対応付けた集約データを生成し、集約データ蓄積部60に蓄積する。
例えば、図12に、集約データ蓄積部60から読み出された集約データの表示例を示す。この例では、1つの文書クラスタに対して2つのWebページ、1つの画像を表示しており、クラスタAが、文書クラスタの最も大きい(文書数の最も大きい)クラスタを、クラスタBが2番目に大きい文書クラスタを、クラスタCが3番目に大きい文書クラスタに対応している。
表示するWebページの数及び画像の数は設定により変更可能とし、文書クラスタの大きさによって、表示するWebページ数や画像の数を変更するように構成してもよい。各文書クラスタから表示するWebページを選ぶ方法としては、文書クラスタ内で頻出する単語を多く含んでいるWebページを順に選択する方法や、信頼度の高い画像を含むWebページを順に選択する方法などがある。また、画像を複数表示する場合には、同じ画像クラスタから信頼度の高い順に複数画像を取り出してもよいし、異なる画像クラスタから信頼度の最も高い画像を1つずつ取り出すよう構成してもよい。
このように、集約データ生成部103は、文書クラスタ蓄積部20の情報と、画像信頼度算出部102の処理結果から、類似画像が多く信頼度の高い画像を文書クラスタ毎に提示することが可能となる。
上記の話題画像選出装置100の動作をプログラムとして構築し、話題画像選出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、電子化文書集合から話題を代表する画像を抽出する技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態における話題画像選出システムの構成図である。 本発明の一実施の形態におけるインデックス蓄積部のデータ構造の例である。 本発明の一実施の形態におけるWebページ収集部の処理を説明する図である。 本発明の一実施の形態におけるWebページ収集部の処理のフローチャートである。 本発明の一実施の形態における文書クラスタ蓄積部のデータ例である。 本発明の一実施の形態における画像クラスタリング部の処理のフローチャートである。 本発明の一実施の形態における画像クラスタリング部の処理結果の例である。 本発明の一実施の形態における画像信頼度算出部の処理のフローチャートである。 本発明の一実施の形態における画像信頼度算出部の処理結果の例である。 本発明の一実施の形態における集約データの表示例である。
符号の説明
20 文書クラスタ蓄積手段、文書クラスタ蓄積部
21 文書蓄積部
22 文書クラスタリング部
30 画像蓄積手段、画像蓄積部
40 インデックス蓄積部
41 画像URL
42 WebページURL
43 画像出現順番
44 画像サイズ
50 Webページ収集部
51 収集先リスト
60 集約データ蓄積部
61 文書クラスタID
62 WebページURL
81 文書クラスタID
82 画像クラスタID
83 画像URL
84 信頼度
100 話題画像選出装置
101 画像クラスタリング手段、画像クラスタリング部
102 画像信頼度算出手段、画像信頼度算出部
103 集約データ生成手段、集約データ生成部

Claims (5)

  1. 同一の話題毎にまとめられた、画像をリンクしている文書の集合(以下、文書クラスタと記す)に対する代表画像を選定する話題画像選出方法であって、
    画像クラスタリング手段が、
    記憶手段内の前記文書クラスタ中の各文書がリンクしている画像をクラスタリングすることで類似画像毎にまとめた画像クラスタを複数個生成し、記憶手段に格納する画像クラスタリングステップと、
    画像信頼度付与手段が、
    前記画像クラスタリングステップで生成され、前記記憶手段に格納された複数の画像クラスタから、画像数が最大の画像クラスタを選択し、選択された画像クラスタに含まれる各画像の信頼度を算出する画像信頼度算出ステップと、
    集約データ生成手段が、
    前記画像数が最大の画像クラスタに含まれる前記信頼度が最大の画像を、前記文書クラスタを代表する画像として選択し、出力する集約データ生成ステップと、
    を行うことを特徴とする話題画像選出方法。
  2. 前記画像信頼度付与ステップにおいて、
    任意の方法により、各画像の文書内で出現する画像出現順番と、画像サイズとを取得し、該画像出現順番が早く、画像サイズが大きいほど高い信頼度を付与するステップを含む請求項1記載の話題画像選出方法。
  3. 同一の話題毎にまとめられた、画像をリンクしている文書の集合(以下、文書クラスタと記す)に対する代表画像を選定する話題画像選出装置であって、
    記憶手段内の前記文書クラスタ中の各文書がリンクしている画像をクラスタリングすることで類似画像毎にまとめた画像クラスタを複数個生成し、記憶手段に格納する画像クラスタリング手段と、
    前記画像クラスタリング手段で生成され、前記記憶手段に格納された複数の画像クラスタから、画像数が最大の画像クラスタを選択し、選択された画像クラスタに含まれる各画像の信頼度を算出する画像信頼度算出手段と、
    前記画像数が最大の画像クラスタに含まれる前記信頼度が最大の画像を、前記文書クラスタを代表する画像として選択し、出力する集約データ生成手段と、
    を有することを特徴とする話題画像選出装置。
  4. 前記画像信頼度付与手段は、
    任意の方法により、各画像の文書内で出現する画像出現順番と、画像サイズとを取得し、該画像出現順番が早く、画像サイズが大きいほど高い信頼度を付与する手段を含む請求項3記載の話題画像選出装置。
  5. コンピュータを、
    請求項3または4記載の話題画像選出装置として機能させることを特徴とする話題画像選出プログラム。
JP2006007715A 2006-01-16 2006-01-16 話題画像選出方法及び装置及プログラム Pending JP2007188427A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006007715A JP2007188427A (ja) 2006-01-16 2006-01-16 話題画像選出方法及び装置及プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006007715A JP2007188427A (ja) 2006-01-16 2006-01-16 話題画像選出方法及び装置及プログラム

Publications (1)

Publication Number Publication Date
JP2007188427A true JP2007188427A (ja) 2007-07-26

Family

ID=38343537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006007715A Pending JP2007188427A (ja) 2006-01-16 2006-01-16 話題画像選出方法及び装置及プログラム

Country Status (1)

Country Link
JP (1) JP2007188427A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009060205A (ja) * 2007-08-30 2009-03-19 Sharp Corp 表示画質制御方法およびテレビ放送受信機
JP2011070408A (ja) * 2009-09-25 2011-04-07 Kddi Corp サンプル画像取得方法、サンプル画像取得装置及び画像分類装置
JP2011108242A (ja) * 2009-11-17 2011-06-02 Nhn Corp 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体
JP2012530287A (ja) * 2009-06-15 2012-11-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 代表的な画像を選択するための方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009060205A (ja) * 2007-08-30 2009-03-19 Sharp Corp 表示画質制御方法およびテレビ放送受信機
JP2012530287A (ja) * 2009-06-15 2012-11-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 代表的な画像を選択するための方法及び装置
JP2011070408A (ja) * 2009-09-25 2011-04-07 Kddi Corp サンプル画像取得方法、サンプル画像取得装置及び画像分類装置
JP2011108242A (ja) * 2009-11-17 2011-06-02 Nhn Corp 利用者の要求に応じて動的にもっとも適したイメージを抽出して提供するための方法、システム及びコンピューター判読可能な記録媒体

Similar Documents

Publication Publication Date Title
JP4337064B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR101450358B1 (ko) 구조형 지리적 데이터 검색
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
WO2015047920A1 (en) Title and body extraction from web page
JP4771915B2 (ja) Htmlテキストを変換する装置、方法、およびプログラム
JP2005063432A (ja) マルチメディアオブジェクト検索装置およびマルチメディアオブジェクト検索方法
WO2020101479A1 (en) System and method to detect and generate relevant content from uniform resource locator (url)
JP4769151B2 (ja) 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
CN109948154A (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
JP2007188427A (ja) 話題画像選出方法及び装置及プログラム
JP6868576B2 (ja) 事象提示システムおよび事象提示装置
CN114117242A (zh) 数据查询方法和装置、计算机设备、存储介质
KR101178208B1 (ko) 키워드 추출 장치 및 방법
JP4606349B2 (ja) 話題画像抽出方法及び装置及びプログラム
KR101105798B1 (ko) 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법
JP2004086845A (ja) 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP3683687B2 (ja) 情報フィルタリング装置および情報フィルタリング方法
JP5384315B2 (ja) 検索装置及び方法及びプログラム
CN113806667B (zh) 一种支持网页分类的方法和系统
US10606875B2 (en) Search support apparatus and method
KR100832859B1 (ko) 모바일 웹 콘텐츠 서비스 시스템 및 그 방법
CN109388665B (zh) 作者关系在线挖掘方法及系统
JP2018072873A (ja) 情報処理装置、情報処理方法、およびプログラム