JP2010039533A - Apparatus and method for image ranking, and program - Google Patents
Apparatus and method for image ranking, and program Download PDFInfo
- Publication number
- JP2010039533A JP2010039533A JP2008198328A JP2008198328A JP2010039533A JP 2010039533 A JP2010039533 A JP 2010039533A JP 2008198328 A JP2008198328 A JP 2008198328A JP 2008198328 A JP2008198328 A JP 2008198328A JP 2010039533 A JP2010039533 A JP 2010039533A
- Authority
- JP
- Japan
- Prior art keywords
- image
- ranking
- identification information
- information
- image information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は画像ランキング装置、画像ランキング方法及びプログラムに係り、特にインターネットに掲載された画像のランキングが可能な画像ランキング装置、画像ランキング方法及びプログラムに関する。 The present invention relates to an image ranking apparatus, an image ranking method, and a program, and more particularly to an image ranking apparatus, an image ranking method, and a program capable of ranking images posted on the Internet.
インターネット上にある情報に基づいて自動的にランキングを生成する発明として、以下のようなものが開示されている。 The following is disclosed as an invention for automatically generating a ranking based on information on the Internet.
特許文献1には、キーワードが入力されると、そのキーワードを含むウェブページを検索すると共に検索キーワードのログを作成し、検索キーワードログを検索キーワード毎に集計して検索キーワードの順位を決定するホットキーワード提示方法が開示されている。
In
特許文献2には、入力されたキーワードに基づいてブログ記事を取得し、キーワード毎にブログサイト、ブログ記事との関係を抽出し、この結果に基づいてブログサイトとキーワードのスコアを算出し、算出されたスコアに基づいてブログサイトとキーワードをランキングする情報画像ランキング装置が開示されている。
しかしながら、特許文献1、2に記載の発明では、キーワードのランキング、すなわち話題性のあるキーワードを知ることができるが、話題性のある画像に適用するには、次のような問題点がある。
However, in the inventions described in
例えば、キーワードを入力し、キーワードにタグ付けされている画像をランキングして、その結果を一覧表示する手法が考えられる。しかしながら、この場合には、検索条件はキーワード情報に依存しており、適切なキーワードを入力しなければならないという問題点がある。また、キーワードに基づいて検索を行うため、画像そのものの情報は利用していない。つまり、画像そのものの話題性に基づいて検索を行っているとは言い難い。 For example, a method of inputting a keyword, ranking images tagged with the keyword, and displaying a list of the results can be considered. However, in this case, the search condition depends on the keyword information, and there is a problem that an appropriate keyword must be input. Further, since the search is performed based on the keyword, information on the image itself is not used. That is, it is difficult to say that the search is performed based on the topicality of the image itself.
また、キーワードの代わりに画像を入力して、インターネット上に入力された画像と同一の画像が掲載されているページのURLや個数を検索する手法も考えられる。インターネット上の複数のページにまったく同じ画像が掲載されている場合、その画像は何らかの話題性、人気を持っていると考えられるし、掲載されている個数が多いほど、その画像はより話題性を持ったものであると考えられるからである。しかしながら、画像をキーとして入力しなければ同じ画像の個数を調べる事はできないため、話題性のある画像の検索には適さない。 Another possible method is to input an image instead of a keyword and search for the URL and the number of pages on which the same image as the image input on the Internet is posted. When the exact same image is posted on multiple pages on the Internet, it is considered that the image has some topicality and popularity, and the more the number is posted, the more topical the image. This is because it is thought to be possessed. However, since it is impossible to check the number of the same images without inputting the images as keys, it is not suitable for searching for topical images.
本発明はこのような事情に鑑みてなされたもので、キーワード等の入力をすることなく、話題性があると考えられる画像を自動でランキング表示することができる画像ランキング装置、画像ランキング方法及びプログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and an image ranking apparatus, an image ranking method, and a program capable of automatically ranking and displaying images considered to be topical without inputting keywords or the like The purpose is to provide.
請求項1に記載の画像ランキング装置は、インターネット上から画像を収集するクローリング手段と、前記クローリング手段により取得された画像のサムネイル画像を生成するサムネイル画像生成手段と、前記クローリング手段により収集された画像から該画像の識別情報を算出する識別情報算出手段と、前記クローリング手段により収集された各画像毎に前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する第1の画像情報登録手段と、前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する第2の画像情報テーブル作成手段と、前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するランキング表示画面出力手段と、を備えたことを特徴とする。
The image ranking apparatus according to
請求項1に記載の画像ランキング装置によれば、インターネット上から画像を収集し、その画像からサムネイル画像を生成し、またその画像の識別情報(ハッシュ値、特徴量など)を算出する。収集した各画像毎に、画像から生成されたサムネイル画像と、画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、登録された第1の画像情報に基づいて画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する。第2の画像情報テーブルから登録数の多い順番に識別情報を抽出するとともに、第1の画像情報テーブルから抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、登録数の多い画像の順番を示すランキング表示画面を出力する。これにより、インターネット上に多く掲載された画像、すなわち話題性があると考えられる画像を自動でランキング表示することができる。 According to the image ranking apparatus of the first aspect, an image is collected from the Internet, a thumbnail image is generated from the image, and identification information (hash value, feature amount, etc.) of the image is calculated. For each collected image, the first image information in which the thumbnail image generated from the image and the identification information calculated from the image are associated is registered in the first image information table, and the registered first image information is stored. Based on the image information, a second image information table is created in which the identification information of the image is associated with the number of registrations for each identification information. The identification information is extracted from the second image information table in descending order of the number of registrations, the thumbnail images of the images corresponding to the identification information extracted from the first image information table are extracted, and the ranking including the extracted thumbnail images is included. A ranking display screen showing the order of images with a large number of registrations is output. Accordingly, it is possible to automatically display rankings of images that are frequently posted on the Internet, that is, images that are considered to be topical.
請求項2に記載の画像ランキング装置は、請求項1に記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURL、ウェブページURL、及び画像URLのうちの少なくとも1つのURLを収集し、前記第1の画像情報登録手段は、前記画像に対応して収集されたURLと、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記ランキング表示画面出力手段は、前記第1の画像情報テーブルから前記登録数の多い画像のサムネイル画像及びURLを抽出し、前記抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力することを特徴とする。
The image ranking device according to
請求項2に記載の画像ランキング装置によれば、画像とともに、該画像が掲載されたサイトURL、ウェブページURL、及び画像URLのうちの少なくとも1つのURLを収集し、画像に対応して収集されたURLと、その画像から生成されたサムネイル画像と、その画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する。第1の画像情報テーブルから登録数の多い画像のサムネイル画像及びURLを抽出し、抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力する。これにより、ユーザは、検索を行うことなく、ランキングされた画像が掲載されたページを閲覧することができる。
According to the image ranking apparatus of
請求項3に記載の画像ランキング装置は、請求項1又は2に記載の画像ランキング装置において、前記識別情報算出手段により算出された識別情報が前記第1の画像情報に保存されているかどうかを判断する判断手段と、前記判断手段により前記識別情報が前記第1の画像情報に保存されていると判断された場合には、現在のカウント数に1を加えた数を新たなカウント数とし、前記判断手段により前記識別情報が前記第1の画像情報に保存されていないと判断された場合には、カウント数を1とするカウント数算出手段と、を備え、前記第2の画像情報テーブル作成手段は、前記カウント数算出手段により算出されたカウント数を前記登録数とすることを特徴とする。
The image ranking apparatus according to claim 3 determines whether or not the identification information calculated by the identification information calculation means is stored in the first image information in the image ranking apparatus according to
請求項3に記載の画像ランキング装置によれば、インターネット上から収集された画像から算出された識別情報が第1の画像情報テーブルに保存されているかどうかを判断し、保存されている場合には、現在のカウント数に1を加えた数を新たなカウント数とし、保存されていない場合にはカウント数を1とし、このカウント数を登録数として第2の画像情報を作成する。これにより、識別情報が第1の画像情報に含まれる数をカウント数として算出することができる。 According to the image ranking apparatus of the third aspect, it is determined whether or not the identification information calculated from the images collected from the Internet is stored in the first image information table. Then, the number obtained by adding 1 to the current count number is set as a new count number, and when not stored, the count number is set as 1, and the second image information is created by using the count number as the registered number. Accordingly, the number of identification information included in the first image information can be calculated as the count number.
請求項4に記載の画像ランキング装置は、請求項3に記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURLを収集し、前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が掲載されたサイトURLとが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記判断手段は、同一の識別情報に同一のサイトURLが関連付けられている組み合わせが前記第1の画像情報に複数保存されているか否かを判断し、前記カウント数算出手段は、前記判断手段により同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されていると判断された場合には、前記複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出することを特徴とする。 The image ranking device according to claim 4 is the image ranking device according to claim 3, wherein the crawling means collects a URL of a site where the image is posted together with the image, and registers the first image information. The means registers, in the first image information table, first image information in which a thumbnail image generated from the image, identification information calculated from the image, and a site URL on which the image is posted are associated with each other. The determination means determines whether or not a plurality of combinations in which the same site URL is associated with the same identification information is stored in the first image information, and the count number calculation means determines the determination If it is determined by the means that a plurality of combinations of the same identification information and the same site URL are stored in the first image information, the plurality of storages are stored. And calculates the count number a combination of the same site URL and the same identification information as one.
請求項4に記載の画像ランキング装置によれば、同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されている場合には、複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出する。これにより、巨大なサイトで同じ画像が使いまわされている場合や、ページの表記の違いで複数カウントされる事を防ぎ、正確なカウント数を算出することができる。したがって、正確なランキングを行うことができる。 According to the image ranking apparatus of claim 4, when a plurality of combinations of the same identification information and the same site URL are stored in the first image information, a plurality of the same identification information stored. The number of counts is calculated assuming that the combination with the same site URL is 1. As a result, it is possible to prevent the case where the same image is reused in a huge site, or to prevent multiple counting due to the difference in page notation, and to calculate an accurate count. Therefore, accurate ranking can be performed.
請求項5に記載の画像ランキング装置は、請求項1から4のいずれかに記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が収集された日時情報を取得し、前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記第2の画像情報テーブル作成手段は、前記日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して前記第2の画像情報テーブルを作成することを特徴とする。
The image ranking device according to
請求項5に記載の画像ランキング装置によれば、画像とともに該画像が収集された日時情報を取得し、画像から生成されたサムネイル画像と、画像から算出された識別情報と、画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する。この日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して第2の画像情報テーブルを作成する。これにより、所定の期間毎のランキングを自動で行うことができる。
According to the image ranking device of
請求項6に記載の画像ランキング装置は、請求項1から5のいずれかに記載の画像ランキング装置において、前記ランキング表示出力手段は、前記ランキング表示画面と共に、該ランキング表示画面へのリンクボタンと、前記ランキング表示画面に含まれるサムネイル画像とを含むモジュールを出力することを特徴とする。
The image ranking apparatus according to claim 6 is the image ranking apparatus according to any one of
請求項6に記載の画像ランキング装置によれば、ランキング表示をモジュールとしてインターネット上に出力する。このモジュールをインターネット上で公開し、他人のブログ等に掲載してもらうことにより、自らのサイトへのアクセス数を増加させたり、広告収入を増加させたりすることができる。 According to the image ranking apparatus of the sixth aspect, the ranking display is output as a module on the Internet. By publishing this module on the Internet and having it posted on other people's blogs, you can increase the number of accesses to your site and increase advertising revenue.
請求項7に記載の画像ランキング装置は、請求項1から6のいずれかに記載の画像ランキング装置において、前記識別情報は、前記画像に対してハッシュ関数を適用することにより算出されたハッシュ値であることを特徴とする。これにより、同一画像を同じ画像であると確実に認識することができる。
The image ranking device according to claim 7 is the image ranking device according to any one of
請求項8に記載の画像ランキング装置は、請求項1から6のいずれかに記載の画像ランキング装置において、前記識別情報は、前記画像固有の特徴を示す特徴量であることを特徴とする。これにより、拡大、縮小等がされた類似画像を同じ画像であると認識することができる。そのため、より精度の高いランキングをすることができる。 An image ranking apparatus according to an eighth aspect is the image ranking apparatus according to any one of the first to sixth aspects, wherein the identification information is a feature amount indicating a characteristic unique to the image. As a result, similar images that have been enlarged or reduced can be recognized as the same image. Therefore, ranking with higher accuracy can be performed.
請求項9に記載の画像ランキング方法は、インターネット上から画像を収集するステップと、前記取得された画像のサムネイル画像を生成するステップと、前記収集された画像から該画像の識別情報を算出するステップと、前記収集された各画像毎に該画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録するステップと、前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成するステップと、前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するステップと、を含むことを特徴とする。 The image ranking method according to claim 9, a step of collecting an image from the Internet, a step of generating a thumbnail image of the acquired image, and a step of calculating identification information of the image from the collected image Registering, in the first image information table, first image information in which thumbnail images generated from the collected images are associated with identification information calculated from the images; And creating a second image information table in which the identification information of the image and the registration number for each identification information are associated with each other based on the first image information registered in the first image information table. And extracting the identification information from the second image information table in the descending order of the number of registrations, and extracting the identification information extracted from the first image information table. Extracting a thumbnail image of an image corresponding to the ranking image, and outputting a ranking display screen including the extracted thumbnail image, the ranking display screen showing the order of the images having a large number of registrations. To do.
請求項10に記載のプログラムは、請求項9に記載の画像ランキング方法を演算装置に実行させることを特徴とする。 A program according to a tenth aspect causes an arithmetic device to execute the image ranking method according to the ninth aspect.
本発明によれば、キーワード等の入力をすることなく、話題性があると考えられる画像を自動でランキング表示することができる。 According to the present invention, it is possible to automatically display rankings of images considered to be topical without inputting keywords or the like.
<第1の実施の形態>
図1は、第1の実施の形態に係る画像ランキング装置1の全体構造の概略図である。画像ランキング装置1は、主として、クローリング部10と、ランキング部20とで構成される。クローリング部10は、主として、クローリングエンジン11と、画像ハッシュ算出装置12と、サムネイル画像生成手段13と、画像ハッシュ比較装置14と、データベース(DB)15とで構成され、ランキング部20は、画像ランキング表示生成装置21と、表示装置22とで構成される。クローリングエンジン11及び画像ランキング表示生成装置21には、インターネット30が接続される。
<First Embodiment>
FIG. 1 is a schematic diagram of the overall structure of an
クローリングエンジン11は、インターネット30上のウェブページに接続して、そのウェブページURLと、サイトURLとを取得する。また、クローリングエンジン11は、HTML(Hyper Text Markup Language)等で記述されたリンク情報を辿って、ウェブページに掲載された画像URLと、その画像データを取得する。クローリングエンジン11で取得された画像データは、画像ハッシュ算出装置12及びサムネイル画像生成手段13に出力される。
The crawling
画像ハッシュ算出装置12は、MD5やSHA−1といったハッシュ関数を利用して、クローリングエンジン11から出力された画像のハッシュ値を算出する。画像ハッシュ算出装置12で算出されたハッシュ値はクローリングエンジン11に入力される。
The image
サムネイル画像生成手段13は、クローリングエンジン11から出力された画像のサムネイル画像を生成する。サムネイル画像生成手段13で生成されたサムネイル画像はクローリングエンジン11に入力される。
The thumbnail
クローリングエンジン11は、画像ハッシュ算出装置12から出力された画像のハッシュ値を、その画像が取得されたウェブページURL、サイトURL、画像URL、その画像に基づいてサムネイル画像生成手段13から出力されたサムネイル画像などと関連付けられた第1画像情報をDB15内の第1画像情報テーブルに登録する。クローリングエンジン11は、インターネット30を自動巡回し、この処理を再帰的に行うことで、第1画像情報テーブルを継続的に増大させる。
The crawling
第1画像情報テーブルのデータ構造の一例を図2に示す。第1画像情報テーブルには、画像が掲載されているウェブページURLと、そのウェブページに掲載されている画像URLと、そのウェブページのサイトURLと、その画像のハッシュ値と、その画像のサムネイル画像とが関連付けられた第1画像情報が格納される。ハッシュ値は、画像の同一性を検出する指標であり、同じ画像からは同じハッシュ値が算出される。図2に示す場合においては、1行目、4行目及び7行目に同じハッシュ値「123456789」が格納されており、この3つが同じ画像であることを示している。 An example of the data structure of the first image information table is shown in FIG. The first image information table includes a web page URL on which an image is posted, an image URL posted on the web page, a site URL of the web page, a hash value of the image, and a thumbnail of the image. First image information associated with an image is stored. The hash value is an index for detecting the identity of images, and the same hash value is calculated from the same image. In the case illustrated in FIG. 2, the same hash value “123456789” is stored in the first row, the fourth row, and the seventh row, indicating that these three are the same image.
画像ハッシュ比較装置14は、画像ハッシュ算出装置12から出力された画像のハッシュ値とDB15に保存された第1画像情報テーブルとを比較し、その画像のハッシュ値が第1画像情報テーブルに保存されている数(以下、カウント数という)を算出する。画像ハッシュ比較装置14でカウント数を算出する処理については、後に詳述する。画像ハッシュ比較装置14で算出されたカウント数は、クローリングエンジン11に入力される。
The image
クローリングエンジン11は、第1の画像情報に基づいて、図3に示すような画像のハッシュ値と、カウント数とを関連付けた第2画像情報テーブルを作成し、DB15に保存する。
The crawling
DB15には、図2に示すような第1画像情報テーブルと、図3に示すような画像のハッシュ値と、カウント数とを関連付けた第2画像情報テーブルが保存される。また、DB15には、クローリングを行った日時と、そのときに取得した画像の詳細情報(画像のファイル名、縦・横幅、ファイルサイズ、取得日時など)とが関連付けて保存される。
The
画像ランキング表示生成装置21は、DB15に保存された第1画像情報テーブル及び第2画像情報テーブルに基づいて、画像ランキング表示用の画面データを生成する。画像ランキング表示生成装置21で生成された画像ランキング表示用の画面のデータは表示装置22又はインターネット30に出力される。画像ランキング表示生成装置21で生成する画像ランキング表示用の画面については、後に詳述する。
The image ranking
表示装置22は、カラー表示が可能な液晶ディスプレイであり、画像ランキング表示生成装置21から出力された画像ランキング表示用の画面を表示する。
The
このように構成された画像ランキング装置1の作用について説明する。まず、クローリング部の作用について説明する。図4は、クローリング部10で行う処理の流れを示すフローチャートである。
The operation of the
クローリングエンジン11は、インターネット30上にある画像と、その画像が掲載されているウェブページURLと、サイトURLと、画像URLとを取得する(ステップS1)。ステップS1で取得された画像は、画像ハッシュ算出装置12及びサムネイル画像生成手段13に入力される。
The crawling
画像ハッシュ算出装置12は、ステップS1で取得された画像のハッシュ値を算出し(ステップS2)、サムネイル画像生成手段13は、ステップS1で取得された画像のサムネイル画像を生成する(ステップS3)。ステップS2で算出されたハッシュ値及びステップS3で生成されたサムネイル画像は、クローリングエンジン11に入力される。
The image
クローリングエンジン11は、ステップS1で取得されたウェブページURL、サイトURL、及び画像URLと、ステップS2で算出されたハッシュ値と、ステップS3で生成されたサムネイル画像とを組にした第1画像情報を、DB15の第1画像情報テーブルに登録する(ステップS4)。
The crawling
クローリングエンジン11は、クローリングが終了したか、すなわちインターネット30上の全ての画像を収集したかを判断する(ステップS5)。クローリングが終了した場合(ステップS5でYES)には、処理を終了する。
The crawling
クローリングが終了していない場合(ステップS5でNO)には、クローリングエンジン11は、ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLと、第1画像情報テーブルに保存されたハッシュ値及びサイトURLとを比較し(ステップS6)、ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じハッシュ値及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されているかどうかを判断する(ステップS7)。
If the crawling has not ended (NO in step S5), the crawling
ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じ組み合わせの第1画像情報が既に第1画像情報テーブルに保存されている(ステップS7でYES)場合には、ハッシュ値のカウント処理(ステップS8〜S11)は行わず、ステップS1へ戻り再度クローリング処理(ステップS1〜S7)を行う。ここで、ハッシュ値のみでなくサイトURLを比較するのは、yahooなどの巨大なサイトで同じ画像が使いまわされているケースや、http://www.xxx.jp/とhttp://www.xxx.jp/index.htmlなどページの表記の違いで複数カウントされる事等を防ぐためである。 The first image information having the same combination as the first image information obtained by combining the hash value calculated in step S2 and the site URL acquired at the same time as the image on which the hash value is based is already stored in the first image information table. If YES (YES in step S7), the hash value counting process (steps S8 to S11) is not performed, the process returns to step S1, and the crawling process (steps S1 to S7) is performed again. Here, not only the hash value but also the site URL is compared in the case where the same image is reused in a huge site such as Yahoo, or http: // www. xxx. jp / and http: // www. xxx. jp / index. This is to prevent multiple counting due to differences in page notation such as html.
ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じ組み合わせの第1画像情報が第1画像情報テーブルに保存されていない(ステップS7でNO)場合には、ハッシュ値のカウント処理(ステップS8〜S11)へ進む。 First image information having the same combination as the first image information obtained by combining the hash value calculated in step S2 and the site URL acquired simultaneously with the image that is the basis of the hash value is stored in the first image information table. If not (NO in step S7), the process proceeds to the hash value counting process (steps S8 to S11).
画像ハッシュ比較装置14は、ステップS2で算出されたハッシュ値と、第2画像情報テーブルに保存されたハッシュ値とを比較し(ステップS8)、ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されているかどうかを判断する(ステップS9)。
The image
ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されている(ステップS9でYES)場合には、画像ハッシュ比較装置14は、第2画像情報テーブルの当該ハッシュ値と関連付けられたカウント数に1を追加する(ステップS10)。例えば、図3に示す第2画像情報テーブルがDB15に保存されている場合において、ステップS2で算出されたハッシュ値が123456789である場合には、画像ハッシュ比較装置14は、第2画像情報テーブルの現在のカウント数である950に1を追加して、カウント数を951に変更する。
If the same hash value as the hash value calculated in step S2 is stored in the second image information table (YES in step S9), the image
ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されていない(ステップS9でNO)場合には、クローリングエンジン11は、当該ハッシュ値をカウント数1と関連付けて第2画像情報テーブルに保存する(ステップS11)。例えば、図3に示す第2画像情報テーブルがDB15に保存されている場合において、ステップS2で算出されたハッシュ値が111111111である場合には、ハッシュ値111111111は第2画像情報テーブルに保存されていないため、カウント数を1としてハッシュ値111111111を第2画像情報テーブルに登録する。
When the same hash value as the hash value calculated in step S2 is not stored in the second image information table (NO in step S9), the crawling
これにより、ハッシュ値のカウント処理(ステップS8〜S11)が終了し、第1画像情報テーブルに保存されたハッシュ値の数がカウント数として算出される。ステップS1へ戻り再度クローリング処理(ステップS1〜S7)を行う。 As a result, the hash value counting process (steps S8 to S11) ends, and the number of hash values stored in the first image information table is calculated as the count number. Returning to step S1, the crawling process (steps S1 to S7) is performed again.
これにより、クローリング部10は、第1画像情報テーブル及び第2画像情報テーブルを継続的に更新し続け、第1画像情報テーブル及び第2画像情報テーブルを常に最新の状態に保つことができる。
Thereby, the crawling
次に、ランキング部20の作用について説明する。図5〜図8は、画像ランキング表示生成装置21が生成する画像ランキング表示用の画面である。
Next, the operation of the ranking
画像ランキング表示生成装置21は、第2画像情報テーブルのカウント数をポイントとして、ポイントの多いものから順にランキングを行う。例えば、図3に示す場合において、画像ランキング表示生成装置21は、ハッシュ値が123456789の画像が950ポイントでランキング1位とし、ハッシュ値が565656565の画像が892ポイントでランキング2位とし、ハッシュ値が787878787の画像が777ポイントでランキング3位とし・・・、というようにランキングを行う。なお、ポイントはカウント数に限らず、カウント数を元に算出した数値を用いてもよい。
The image ranking
図5は、画像ランキング表示画面の一例であり、ユーザが図示しない入力装置により画像ランキング装置1に画像ランキング表示の指示を入力したときに、最初に表示装置22に表示される画面(トップページ)である。画像ランキング表示生成装置21は、サムネイル画像、ポイント数等をランキング順に表示した画面をトップページとして生成する。トップページに表示するサムネイル画像は、第1画像情報テーブルに保存してあるサムネイル画像を使用する。なお、表示するサムネイル画像のサイズは、図5に示すように順位に応じて変えてもよいし、全て同じサイズでもよい。
FIG. 5 is an example of an image ranking display screen. When a user inputs an image ranking display instruction to the
また、図5に示すトップページには、各ランキング毎に他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「重複画像を見る」と書かれたソフトボタンには、図6に示すウェブページURL一覧表示画面へのリンクが張られており、サムネイル画像には、図7に示す画像詳細情報画面へのリンクが張られている。ユーザがソフトボタン又はサムネイル画像をクリックすることにより、それぞれ図6又は図7のページに遷移する。 Also, the top page shown in FIG. 5 is provided with a soft button or the like with a link to another page for each ranking. For example, a soft button written as “view duplicate images” has a link to the web page URL list display screen shown in FIG. 6, and thumbnail images go to the image detailed information screen shown in FIG. The link is stretched. When the user clicks a soft button or a thumbnail image, the page transitions to the page of FIG. 6 or FIG.
図6は、ウェブページURL一覧表示画面の一例であり、画像ランキング1位の画像が含まれるウェブページのURLの一覧が表示されている。図6に示す画面は、図5に示すトップページにおいて、ユーザがランキング1位の画像に隣接して表示された「重複画像を見る」と書かれたソフトボタンをクリックした場合に表示される画面である。画像ランキング表示生成装置21は、ウェブページURLを第1画像情報テーブルから取得し、取得したウェブページURLを例えば50音順、ABC順に並べてサムネイル画像、ポイントと共に表示した画面を生成する。なお図6では、ウェブページURLを10件ずつ表示する例を示したが、表示形態はこれに限定されない。
FIG. 6 shows an example of a web page URL list display screen, in which a list of URLs of web pages including the image ranked first is displayed. The screen shown in FIG. 6 is a screen displayed when the user clicks a soft button “view duplicate images” displayed adjacent to the image ranked first in the top page shown in FIG. It is. The image ranking
また、図6に示すウェブページURL一覧表示画面には、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「前の10件」と書かれたソフトボタンには、現在表示されている950件のうちの11〜20件の前の10件、すなわち950件のうちの1〜10件を表示するページへのリンクが張られており、「次の10件」と書かれたソフトボタンには、現在表示されている950件のうちの11〜20件の後の10件、すなわち950件のうちの20〜30件を表示するページへのリンクが張られており、「ランキング一覧に戻る」という文字には、図5に示すトップページへのリンクが張られている。また、サムネイル画像には、図7に示す画像詳細情報画面へのリンクが張られている。 Further, the web page URL list display screen shown in FIG. 6 is provided with a soft button or the like with a link to another page. For example, in the soft button written as “Previous 10”, the previous 10 to 20 of 950 currently displayed, that is, 1 to 10 of 950 are displayed. There is a link to the page, and the soft button labeled "Next 10" shows 10 out of 950 currently displayed, that is, 10 after -20, that is, out of 950 A link to a page displaying 20 to 30 is attached, and a link to the top page shown in FIG. 5 is attached to the characters “return to ranking list”. Further, the thumbnail image has a link to the image detailed information screen shown in FIG.
図7は、画像詳細情報画面の一例であり、画像ランキング1位の画像の詳細情報が表示されている。図7に示す画面は、図5に示すトップページにおいて、ユーザがランキング1位の画像のサムネイル画像をクリックした場合に表示される画面である。画像ランキング表示生成装置21は、画像の詳細情報、クローリングを行った日時などの情報をDB15から取得し、画像が掲載されていたウェブページURLを第1画像情報テーブルから取得し、これらをサムネイル画像、ポイントと共に表示した画面を生成する。
FIG. 7 shows an example of the image detailed information screen, which displays detailed information of the image ranked first in the image ranking. The screen shown in FIG. 7 is a screen displayed when the user clicks the thumbnail image of the image ranked first in the top page shown in FIG. The image ranking
また、図7に示す画像詳細情報画面には、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「重複画像を見る」と書かれたソフトボタンには、図6に示すウェブページURL一覧表示画面へのリンクが張られており、「前へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ上の順位の画像詳細情報画面へのリンクが張られており、「次へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ下の順位の画像詳細情報画面へのリンクが張られている。また、サムネイル画像には、画像URLへのリンクが張られている。 Further, the image detailed information screen shown in FIG. 7 is provided with a soft button or the like with a link to another page. For example, a soft button written “view duplicate images” has a link to the web page URL list display screen shown in FIG. 6, and a soft button written “previous” contains There is a link to the detailed image information screen that is one rank higher than the ranking of the displayed image, and the soft button labeled “Next” is 1 from the ranking of the currently displayed image. There is a link to the image detail information screen of the next order. The thumbnail image has a link to the image URL.
図8は、画像ランキング表示をモジュール、例えばブログパーツとした場合の例であり、(a)は、ブログパーツが貼り付けられたブログの一例であり、(b)は(a)のブログに貼り付けられたブログパーツを拡大した図である。ブログパーツとは、ブログの機能性やデザイン性を向上させるために他のサイトの情報等を小さな枠内に表示するシステムであり、自らのサイトの情報が記載されたブログパーツをインターネット上で公開し、他人のブログに貼り付けてもらうことにより、自らのサイトへのアクセス数を増加させたり、広告収入を増加させたりすることを目的としたものである。図8は、モジュールとしてブログパーツを提供する例を示すが、モジュールはブログパーツに限らず、バナーなどでもよい。 FIG. 8 is an example when the image ranking display is a module, for example, a blog part, (a) is an example of a blog with a blog part pasted, and (b) is pasted on the blog of (a). It is the figure which expanded the attached blog part. Blog parts are systems that display information on other sites in a small frame to improve the functionality and design of the blog, and blog parts that contain information about your site are published on the Internet. However, it is intended to increase the number of accesses to its own site and increase advertising revenue by having it posted on other people's blogs. FIG. 8 shows an example of providing a blog part as a module, but the module is not limited to a blog part but may be a banner or the like.
図8(b)に示すブログパーツは、横幅が180ピクセル程度の大きさであり、画像ランキング表示生成装置21は、所望のランキングの画像のサムネイル画像と、ランキングと、ポイントとが表示されたブログパーツをFlash、GIF等を用いて作成する。ブログパーツでは、所望のランキングの画像、ランキング、ポイントのみを表示するようにしてもよいし、一定時間経過すると異なる順位の紹介画面へと遷移するスライドショー形式で例えばランキング1〜10位までの画像、ランキング、ポイントを順番に表示するようにしてもよい。
The blog part shown in FIG. 8B has a width of about 180 pixels, and the image ranking
また、図8に示すブログパーツには、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「ランキングサイトへGO!」と書かれたソフトボタンには、図5に示すトップページへのリンクが張られており、「前へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ上の順位の紹介画面へのリンクが張られており、「次へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ下の順位の紹介画面へのリンクが張られている。また、サムネイル画像には、図5に示すトップページへのリンクが張られている。 In addition, the blog part shown in FIG. 8 is provided with a soft button or the like with a link to another page. For example, the soft button labeled “Go to ranking site!” Has a link to the top page shown in FIG. 5, and the soft button labeled “Previous” is currently displayed. There is a link to the introduction screen that is one rank higher than the ranking of the current image, and the soft button labeled “Next” has a rank one lower than the ranking of the currently displayed image. There is a link to the introduction screen. Further, the thumbnail image has a link to the top page shown in FIG.
画像ランキング表示生成装置21は、生成したトップページ、画像詳細情報画面を表示装置22又はインターネット30へ出力する。また、画像ランキング表示生成装置21は、生成したモジュールをインターネット30へ出力する。
The image ranking
本実施の形態によれば、クローリングによりインターネット上より画像を取得し、その画像のカウント数を算出することにより、インターネット上に多く掲載された画像、すなわち話題性があると考えられる画像を自動でランキング表示することができる。 According to the present embodiment, by acquiring an image from the Internet by crawling and calculating the number of counts of the image, an image that is frequently posted on the Internet, that is, an image that is considered to be topical is automatically acquired. Ranking can be displayed.
また、本実施の形態によれば、画像のハッシュ値を用いてインターネット上の画像をクローリングするため、同一画像を確実に検索することができる。また、取得した画像からハッシュ値を算出し、そのハッシュ値を用いて検索を行うため、ユーザがキーワード等を入力する必要が無く、使い勝手を良くすることができる。 In addition, according to the present embodiment, the image on the Internet is crawled using the hash value of the image, so that the same image can be reliably searched. Further, since a hash value is calculated from the acquired image and a search is performed using the hash value, the user does not need to input a keyword or the like, and usability can be improved.
なお、本実施の形態では、DB15にクローリングを行った日時と、そのときに取得した画像の詳細情報とを関連付けて保存したが、クローリングを行った日時を、ハッシュ値などと関連付けて第1画像情報テーブルに保存してもよい。この場合には、画像ハッシュ比較装置14で所望の期間別にハッシュ値の比較を行うことにより、所望の期間別のカウント数が格納された第2画像情報テーブルを期間別に複数作成することができる。したがって、画像ランキング表示生成装置21は、所望の期間別の画像ランキング表示画面を生成することができる。
In the present embodiment, the date and time when crawling is performed in the
また、本実施の形態によれば、クローリングを行う度にカウント数の算出を行ったが、カウント数の算出をクローリングの度に行なうのではなく、必要に応じて行なうようにしてもよい。例えば、一定期間が経過したらカウント数を算出するようにしてもよいし、一定の数の第1画像情報が第1画像情報テーブルに登録されたらカウント数を算出するようにしてもよい。 Further, according to the present embodiment, the count number is calculated every time crawling is performed. However, the count number may be calculated as needed instead of being calculated every time crawling is performed. For example, the count number may be calculated when a certain period has elapsed, or the count number may be calculated when a certain number of first image information is registered in the first image information table.
<第2の実施の形態>
第1の実施の形態では、ハッシュ値を用いてインターネット上にある画像をクローリングしたが、検索対象となる画像が掲載されたURLを検索する検索情報として、ハッシュ値の代わりに、画像データから算出可能な様々な特徴量を用いることができる。
<Second Embodiment>
In the first embodiment, an image on the Internet is crawled using a hash value, but is calculated from image data instead of a hash value as search information for searching a URL where an image to be searched is posted. Various possible features can be used.
第2の実施の形態は、画像の図柄、色、明るさなどの画像固有の特徴を示す特徴量を算出し、その特徴量を用いて画像をクローリングするものである。以下、第2の実施の形態の画像ランキング装置2について説明する。なお、第1の実施の形態と同一の部分については、同一の符号を付し、詳細な説明を省略する。
In the second embodiment, a feature amount indicating an image-specific feature such as an image pattern, color, and brightness is calculated, and the image is crawled using the feature amount. Hereinafter, the
図9は、特徴量を用いてインターネット上にある画像をクローリングする画像ランキング装置2の全体構造の概略図である。画像ランキング装置2は、主として、クローリング部10’と、ランキング部20とで構成される。クローリング部10’は、主として、クローリングエンジン11と、画像特徴量算出装置16と、サムネイル画像生成手段13と、データベース(DB)15と、画像特徴量比較装置17とで構成される。
FIG. 9 is a schematic diagram of the overall structure of the
画像特徴量算出装置16は、クローリングエンジン11から入力された画像の特徴量を算出する。特徴量とは、画像の図柄、色、明るさなどの画像固有の特徴を表す値であり、例えば多次元のベクトルで与えられる。画像特徴量算出装置16は、例えば、画像を4つに分割したときの左上の領域(領域1)、左下の領域(領域2)、右上の領域(領域3)及び右下の領域(領域4)と、画像の中心部の領域(領域5)との5個の領域の色(例えばY成分)の平均値を算出し、領域1、領域2、領域3、領域4及び領域5の色の平均値を用いた5次元のベクトルを特徴量として算出する。
The image feature
これにより、画像の図柄、色、明るさなどが同一、又はユーザから見て区別がつかない程度に図柄、色、明るさなどが異なる画像(類似画像)であれば、同一又は略同一(±1桁程度の多少の誤差を有する)の特徴量を算出することができる。すなわち、画像の拡大、縮小や、保存の形式(例えばjpeg形式からbmp形式)の変更などの処理が行われていたとしても、ユーザから見て区別がつかないのであれば、同一又は略同一の特徴量を算出することができる。 As a result, if images (similar images) having the same design, color, brightness, etc., or different in design, color, brightness, etc. are indistinguishable from the user's perspective, they are the same or substantially the same (± Feature quantity (with a slight error of about one digit) can be calculated. That is, even if processing such as enlargement / reduction of an image or change of a storage format (for example, jpeg format to bmp format) is performed, the same or substantially the same if it cannot be distinguished from the user A feature amount can be calculated.
画像特徴量比較装置17は、画像特徴量算出装置16から出力された特徴量とDB15に保存された第1画像情報テーブルとを比較し、カウント数を算出する。画像特徴量比較装置17でカウント数を算出する処理については、後に詳述する。
The image feature amount comparison device 17 compares the feature amount output from the image feature
このように構成された画像ランキング装置2の作用について説明する。ランキング部20の作用については第1の実施の形態と同一であるため、クローリング部10’の作用について説明する。図10は、クローリング部10’で行う処理の流れを示すフローチャートである。
The operation of the
クローリングエンジン11は、インターネット30上にある画像と、その画像が掲載されているウェブページURLと、サイトURLと、画像URLとを取得する(ステップS1)。
The crawling
画像特徴量算出装置16は、ステップS1で取得された画像の特徴量を算出し(ステップS12)、サムネイル画像生成手段13は、ステップS1で取得された画像のサムネイル画像を生成する(ステップS3)。ステップS12で算出された特徴量及びステップS3で生成されたサムネイル画像は、クローリングエンジン11に入力される。
The image feature
クローリングエンジン11は、ステップS1で取得されたウェブページURL、サイトURL、及び画像URLと、ステップS12で算出された特徴量と、ステップS3で生成されたサムネイル画像とを組にしてDB15の第1画像情報テーブルに登録する(ステップS13)。これにより、第1画像情報テーブルには、ウェブページURLと、画像URLと、サイトURLと、特徴量と、画像のサムネイル画像とが関連付けて保存される。
The crawling
クローリングエンジン11は、クローリングが終了したかどうかを判断する(ステップS5)。クローリングが終了した場合(ステップS5でYES)には、処理を終了する。
The crawling
クローリングが終了していない場合(ステップS5でNO)には、クローリングエンジン11は、ステップS12で算出された特徴量及びサイトURLと、第1画像情報テーブルに保存された特徴量及びサイトURLとを比較し(ステップS14)、ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されているかどうかを判断する(ステップS15)。
If crawling has not ended (NO in step S5), the crawling
ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されている(ステップS15でYES)場合には、特徴量のカウント処理(ステップS16〜S11)は行わず、ステップS1へ戻り再度クローリング処理(ステップS1〜S15)を行う。ここで、特徴量のみでなくサイトURLを比較するのは、第1の実施の形態と同様、巨大なサイトで同じ画像が使いまわされているケースや、ページの表記の違いで複数カウントされる事等を防ぐためである。 If the first image information in which the same feature quantity and site URL as the feature quantity and site URL calculated in step S12 are combined is already stored in the first image information table (YES in step S15), the feature quantity The counting process (steps S16 to S11) is not performed, and the process returns to step S1 and the crawling process (steps S1 to S15) is performed again. Here, not only the feature amount but also the site URL is compared, as in the first embodiment, a case where the same image is reused in a huge site or a difference in page notation is counted. This is to prevent things.
ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が第1画像情報テーブルに保存されていない(ステップS15でNO)場合には、特徴量のカウント処理(ステップS16〜S19)へ進む。 If the first image information in which the same feature amount and site URL as the feature amount and site URL calculated in step S12 are combined is not stored in the first image information table (NO in step S15), the feature amount The process proceeds to the count process (steps S16 to S19).
画像特徴量比較装置17は、ステップS12で算出された特徴量と、第2画像情報テーブルに保存された特徴量とを比較し(ステップS16)、ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されているかどうかを判断する(ステップS17)。この時、±1桁程度の多少の誤差を許容し、略同一の特徴量についても同一の特徴量として取り扱うようにしてもよい。これにより、拡大・縮小などの加工が行われたがユーザから見て元の画像と区別がつかないような類似画像を、同一の画像としてカウントすることができる。 The image feature quantity comparison device 17 compares the feature quantity calculated in step S12 with the feature quantity stored in the second image information table (step S16), and the same feature quantity as the feature quantity calculated in step S12. Is stored in the second image information table (step S17). At this time, a slight error of about ± 1 digit is allowed, and approximately the same feature amount may be handled as the same feature amount. As a result, similar images that have been processed such as enlargement / reduction, but are indistinguishable from the original image when viewed from the user, can be counted as the same image.
ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されている(ステップS17でYES)場合には、画像特徴量比較装置17は、第2画像情報テーブルの当該特徴量と関連付けられたカウント数に1を追加する(ステップS18)。 When the same feature quantity as that calculated in step S12 is stored in the second image information table (YES in step S17), the image feature quantity comparison device 17 performs the feature quantity in the second image information table. 1 is added to the count number associated with (step S18).
ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されていない(ステップS17でNO)場合には、画像特徴量比較装置17は、当該特徴量をカウント数1と関連付けて第2画像情報テーブルに保存する(ステップS19)。
If the same feature quantity calculated in step S12 is not stored in the second image information table (NO in step S17), the image feature quantity comparison device 17 associates the feature quantity with the
特徴量のカウント処理(ステップS16〜S19)が終了したら、ステップS1へ戻り再度クローリング処理(ステップS1〜S15)を行う。 When the feature amount counting process (steps S16 to S19) ends, the process returns to step S1 and the crawling process (steps S1 to S15) is performed again.
これにより、クローリング部10’は、第1画像情報テーブル及び第2画像情報テーブルを継続的に更新し続け、第1画像情報テーブル及び第2画像情報テーブル常に最新の状態に保つことができる。
Thereby, the crawling
本実施の形態によれば、完全一致する画像のみでなく、元画像が拡大又は縮小された画像、解像度を落として保存しなおされた画像、異なる形式で保存された画像などについても、一致する画像と判別できるため、画像ランキングの精度を上げることができる。 According to the present embodiment, not only a completely matched image, but also an image in which the original image is enlarged or reduced, an image re-saved at a reduced resolution, an image saved in a different format, and the like are matched. Since it can be distinguished from an image, the accuracy of image ranking can be increased.
ところで、本発明では、自動的に画像を収集しランキングを行うため、アダルト画像などの有害画像が画像ランキング表示用の画面に表示される虞がある。このような虞を回避するための手法として、以下に示す方法が考えられる。 By the way, in the present invention, since images are automatically collected and ranked, harmful images such as adult images may be displayed on the image ranking display screen. As a technique for avoiding such a concern, the following method can be considered.
(1)フィルタリングソフト形式(クライアントサイド)
画像ランキング装置に予めフィルタリングソフトをダウンロードしておいた上で、画像ランキング表示用の画面の表示を行う方法である。これにより、図5〜図8に示すような画像ランキング表示用の画面において、有害画像の部分のみを閲覧できないようにすることができる。
(1) Filtering software format (client side)
This is a method of displaying a screen for image ranking display after filtering software is downloaded in advance to the image ranking apparatus. Thereby, it is possible to prevent browsing of only the harmful image portions on the image ranking display screens as shown in FIGS.
(2)フィルタリングソフト方式(プロバイダ依存)
クローリングエンジン11が有害画像排除に対応したプロバイダを経由してクローリングを行う方法である。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(2) Filtering software method (provided by provider)
In this method, the crawling
(3)ホワイトリスト方式(サーバサイド)
予めクローリングの対象とするホストを限定してしまう方法である。クローリングの対象となるホストがクローリングエンジン11に登録されており、クローリングエンジン11は登録されたホストのみクローリングを行う。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(3) White list method (server side)
This is a method of previously limiting the hosts to be crawled. A host to be crawled is registered in the crawling
(4)ブラックリスト方式(サーバサイド)
警察が公開しているブラックリストにしたがって、有害サイトをクローリングの対象から外す方法である。クローリングの対象から外すサイトがクローリングエンジン11に登録されており、クローリングエンジン11は登録されたサイトについてはクローリングを行わない。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(4) Blacklist method (server side)
This is a method to remove harmful sites from crawling according to the black list published by the police. A site to be excluded from the crawling target is registered in the crawling
本発明は、静止画のみではなく、動画にも適用することができるし、音楽などの画像以外の各種コンテンツにも適用することができる。 The present invention can be applied not only to still images but also to moving images, and also to various contents other than images such as music.
また、本発明は、クローリング部、ランキング部が含まれた装置として提供してもよいし、2つ以上の装置からなるシステムとして提供してもよい。また、装置は、PCでもよいし、携帯端末でもよい。また、装置に限らず、装置に適用するプログラムとして提供することもできる。 The present invention may be provided as a device including a crawling unit and a ranking unit, or may be provided as a system including two or more devices. The apparatus may be a PC or a mobile terminal. Further, the present invention is not limited to the device, and can be provided as a program applied to the device.
1、2:画像ランキング装置、10、10’:クローリング部、11:クローリングエンジン、12:画像ハッシュ算出装置、13:サムネイル画像生成手段、14:画像ハッシュ比較装置、15:データベース(DB)、:20:ランキング部、21:画像ランキング表示生成装置、22:表示装置、30:インターネット 1, 2: Image ranking device, 10, 10 ′: Crawling unit, 11: Crawling engine, 12: Image hash calculation device, 13: Thumbnail image generation means, 14: Image hash comparison device, 15: Database (DB), 20: Ranking unit, 21: Image ranking display generation device, 22: Display device, 30: Internet
Claims (10)
前記クローリング手段により取得された画像のサムネイル画像を生成するサムネイル画像生成手段と、
前記クローリング手段により収集された画像から該画像の識別情報を算出する識別情報算出手段と、
前記クローリング手段により収集された各画像毎に前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する第1の画像情報登録手段と、
前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する第2の画像情報テーブル作成手段と、
前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するランキング表示画面出力手段と、
を備えたことを特徴とする画像ランキング装置。 A crawling means for collecting images from the Internet;
Thumbnail image generating means for generating a thumbnail image of the image acquired by the crawling means;
Identification information calculating means for calculating identification information of the image from the image collected by the crawling means;
First image information in which a thumbnail image generated from the image for each image collected by the crawling means and identification information calculated from the image are associated is registered in a first image information table. 1 image information registration means;
Based on the first image information registered in the first image information table, a second image information table is created in which the identification information of the image is associated with the registration number for each identification information. Image information table creation means,
The identification information is extracted from the second image information table in the descending order of the number of registrations, the thumbnail image of the image corresponding to the extracted identification information is extracted from the first image information table, and the extracted thumbnails are extracted. A ranking display screen output means for outputting a ranking display screen that includes an image and outputs a ranking display screen indicating an order of the images having a large number of registrations;
An image ranking apparatus comprising:
前記第1の画像情報登録手段は、前記画像に対応して収集されたURLと、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記ランキング表示画面出力手段は、前記第1の画像情報テーブルから前記登録数の多い画像のサムネイル画像及びURLを抽出し、前記抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力することを特徴とする請求項1に記載の画像ランキング装置。 The crawling means collects, together with the image, at least one URL of a site URL, a web page URL, and an image URL where the image is posted,
The first image information registration unit includes first image information in which a URL collected corresponding to the image, a thumbnail image generated from the image, and identification information calculated from the image are associated with each other. Is registered in the first image information table,
The ranking display screen output means extracts thumbnail images and URLs of the registered images from the first image information table, and outputs a ranking display screen including the extracted thumbnail images and URL link buttons. The image ranking apparatus according to claim 1, wherein:
前記判断手段により前記識別情報が前記第1の画像情報に保存されていると判断された場合には、現在のカウント数に1を加えた数を新たなカウント数とし、前記判断手段により前記識別情報が前記第1の画像情報に保存されていないと判断された場合には、カウント数を1とするカウント数算出手段と、を備え、
前記第2の画像情報テーブル作成手段は、前記カウント数算出手段により算出されたカウント数を前記登録数とすることを特徴とする請求項1又は2に記載の画像ランキング装置。 Determination means for determining whether or not the identification information calculated by the identification information calculation means is stored in the first image information;
When the determination means determines that the identification information is stored in the first image information, a number obtained by adding 1 to the current count number is set as a new count number, and the determination means determines the identification information. If it is determined that the information is not stored in the first image information, a count number calculating means for setting the count number to 1,
3. The image ranking apparatus according to claim 1, wherein the second image information table creation unit uses the count number calculated by the count number calculation unit as the registration number. 4.
前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が掲載されたサイトURLとが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記判断手段は、同一の識別情報に同一のサイトURLが関連付けられている組み合わせが前記第1の画像情報に複数保存されているか否かを判断し、
前記カウント数算出手段は、前記判断手段により同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されていると判断された場合には、前記複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出することを特徴とする請求項3に記載の画像ランキング装置。 The crawling means collects a site URL where the image is posted together with the image,
The first image information registration means obtains first image information in which a thumbnail image generated from the image, identification information calculated from the image, and a site URL where the image is posted are associated with each other. Registered in the image information table of 1,
The determination means determines whether or not a plurality of combinations in which the same site URL is associated with the same identification information are stored in the first image information,
When the determination unit determines that a plurality of combinations of the same identification information and the same site URL are stored in the first image information, the count number calculation unit stores the plurality of the same stored information. The image ranking apparatus according to claim 3, wherein the count number is calculated by setting a combination of the identification information of the URL and the same site URL as 1.
前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記第2の画像情報テーブル作成手段は、前記日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して前記第2の画像情報テーブルを作成することを特徴とする請求項1から4のいずれかに記載の画像ランキング装置。 The crawling means acquires the date and time information when the image was collected together with the image,
The first image information registration means obtains first image information in which a thumbnail image generated from the image, identification information calculated from the image, and date / time information when the image is collected are associated with each other. Registered in the image information table of 1,
The second image information table creating unit creates the second image information table for images collected by the crawling unit within a predetermined period based on the date and time information. The image ranking apparatus according to any one of 1 to 4.
前記取得された画像のサムネイル画像を生成するステップと、
前記収集された画像から該画像の識別情報を算出するステップと、
前記収集された各画像毎に該画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録するステップと、
前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成するステップと、
前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するステップと、
を含むことを特徴とする画像ランキング方法。 Collecting images from the internet;
Generating a thumbnail image of the acquired image;
Calculating identification information of the image from the collected image;
Registering, in the first image information table, first image information in which a thumbnail image generated from the image for each collected image is associated with identification information calculated from the image;
Creating a second image information table in which the identification information of the image and the number of registrations for each identification information are associated with each other based on the first image information registered in the first image information table; ,
The identification information is extracted from the second image information table in the descending order of the number of registrations, the thumbnail image of the image corresponding to the extracted identification information is extracted from the first image information table, and the extracted thumbnails are extracted. A ranking display screen including images, the step of outputting a ranking display screen indicating the order of the images with a large number of registrations;
An image ranking method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008198328A JP2010039533A (en) | 2008-07-31 | 2008-07-31 | Apparatus and method for image ranking, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008198328A JP2010039533A (en) | 2008-07-31 | 2008-07-31 | Apparatus and method for image ranking, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010039533A true JP2010039533A (en) | 2010-02-18 |
Family
ID=42012057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008198328A Pending JP2010039533A (en) | 2008-07-31 | 2008-07-31 | Apparatus and method for image ranking, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010039533A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011105608A1 (en) * | 2010-02-26 | 2011-09-01 | 楽天株式会社 | Information processing device, information processing method, and recording medium that has recorded information processing program |
EP2363731A1 (en) | 2010-02-25 | 2011-09-07 | Hitachi Ltd. | Location estimation system |
US9426507B2 (en) | 2012-02-09 | 2016-08-23 | Panasonic Intellectual Property Management Co., Ltd. | Information recommendation device, information recommendation system, and information recommendation method |
CN107679085A (en) * | 2017-09-01 | 2018-02-09 | 广州大学 | Data grabber algorithm based on search and spiders |
JP2018532198A (en) * | 2015-10-12 | 2018-11-01 | コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ | Method and device for detecting a copy in a stream of visual data |
-
2008
- 2008-07-31 JP JP2008198328A patent/JP2010039533A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2363731A1 (en) | 2010-02-25 | 2011-09-07 | Hitachi Ltd. | Location estimation system |
WO2011105608A1 (en) * | 2010-02-26 | 2011-09-01 | 楽天株式会社 | Information processing device, information processing method, and recording medium that has recorded information processing program |
WO2011105607A1 (en) * | 2010-02-26 | 2011-09-01 | 楽天株式会社 | Information processing device, information processing method, and recording medium that has recorded information processing program |
JP5075291B2 (en) * | 2010-02-26 | 2012-11-21 | 楽天株式会社 | Information processing apparatus, information processing method, and recording medium recording information processing program |
JP5259876B2 (en) * | 2010-02-26 | 2013-08-07 | 楽天株式会社 | Information processing apparatus, information processing method, and recording medium recording information processing program |
US8825670B2 (en) | 2010-02-26 | 2014-09-02 | Rakuten, Inc. | Information processing device, information processing method, and recording medium that has recorded information processing program |
US8949267B2 (en) | 2010-02-26 | 2015-02-03 | Rakuten, Inc. | Information processing device, information processing method, and recording medium that has recorded information processing program |
US9426507B2 (en) | 2012-02-09 | 2016-08-23 | Panasonic Intellectual Property Management Co., Ltd. | Information recommendation device, information recommendation system, and information recommendation method |
JP2018532198A (en) * | 2015-10-12 | 2018-11-01 | コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ | Method and device for detecting a copy in a stream of visual data |
CN107679085A (en) * | 2017-09-01 | 2018-02-09 | 广州大学 | Data grabber algorithm based on search and spiders |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929487B1 (en) | Customization of search results for search queries received from third party sites | |
JP6423845B2 (en) | Method and system for dynamically ranking images to be matched with content in response to a search query | |
JP5501373B2 (en) | System and method for collecting and ranking data from multiple websites | |
US7555478B2 (en) | Search results presented as visually illustrative concepts | |
US8862574B2 (en) | Providing a search-result filters toolbar | |
US8812500B2 (en) | System and method of displaying related sites | |
JP2017157192A (en) | Method of matching between image and content item based on key word | |
US20150242401A1 (en) | Network searching method and network searching system | |
JP6363682B2 (en) | Method for selecting an image that matches content based on the metadata of the image and content | |
CN109716327A (en) | The video capture frame of visual search platform | |
JP2008508605A5 (en) | ||
US20130263044A1 (en) | Method and system to provide a scroll map | |
WO2014029173A1 (en) | Method, apparatus and device for sequencing search results | |
US20160314348A1 (en) | Mathematical formula learner support system | |
JP2007334502A (en) | Retrieving device, method, and program | |
US20210248202A1 (en) | System and method for improved searching across multiple databases | |
WO2016094101A1 (en) | Webpage content storage and review | |
US8788521B2 (en) | Information processing device, information processing method, program for information processing device, and recording medium | |
JP2010039533A (en) | Apparatus and method for image ranking, and program | |
JP6419969B2 (en) | Method and apparatus for providing image presentation information | |
EP2638484B1 (en) | Dynamic image result stitching | |
JP2015011460A (en) | Electronic equipment including dictionary function, program and dictionary search system | |
JP5416253B2 (en) | Related content search apparatus and related content search method | |
JP5466133B2 (en) | Document search apparatus with image and document search program with image | |
JP2009187401A5 (en) |