JP2010039533A - Apparatus and method for image ranking, and program - Google Patents

Apparatus and method for image ranking, and program Download PDF

Info

Publication number
JP2010039533A
JP2010039533A JP2008198328A JP2008198328A JP2010039533A JP 2010039533 A JP2010039533 A JP 2010039533A JP 2008198328 A JP2008198328 A JP 2008198328A JP 2008198328 A JP2008198328 A JP 2008198328A JP 2010039533 A JP2010039533 A JP 2010039533A
Authority
JP
Japan
Prior art keywords
image
ranking
identification information
information
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008198328A
Other languages
Japanese (ja)
Inventor
Takuo Yamamoto
卓央 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2008198328A priority Critical patent/JP2010039533A/en
Publication of JP2010039533A publication Critical patent/JP2010039533A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically rank images expected to have newsworthiness. <P>SOLUTION: An image ranking apparatus includes: a crawling engine 11 which obtains images and a site URL with the images posted thereon from the Internet 30, and registers first image information, where the hash values of the collected images are associated with the site URL with the images posted thereon, etc., in a first image information table in a DB 15; an image hash comparing device 14 which compares the hash values of the collected images with hash values preserved in a second image information table, and, when the hash value being the same as the hash value is preserved, adds one to a counting number related to the hash value in the second image information table, when the hash value being the same as the hash value is not preserved, generates the second image information table where the hash value is related to the counting number one; and an image ranking display generating device 21 which performs image ranking, based on the second image information table. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は画像ランキング装置、画像ランキング方法及びプログラムに係り、特にインターネットに掲載された画像のランキングが可能な画像ランキング装置、画像ランキング方法及びプログラムに関する。   The present invention relates to an image ranking apparatus, an image ranking method, and a program, and more particularly to an image ranking apparatus, an image ranking method, and a program capable of ranking images posted on the Internet.

インターネット上にある情報に基づいて自動的にランキングを生成する発明として、以下のようなものが開示されている。   The following is disclosed as an invention for automatically generating a ranking based on information on the Internet.

特許文献1には、キーワードが入力されると、そのキーワードを含むウェブページを検索すると共に検索キーワードのログを作成し、検索キーワードログを検索キーワード毎に集計して検索キーワードの順位を決定するホットキーワード提示方法が開示されている。   In Patent Literature 1, when a keyword is input, a search is performed for a web page including the keyword, a search keyword log is created, and the search keyword log is aggregated for each search keyword to determine the ranking of the search keyword. A keyword presentation method is disclosed.

特許文献2には、入力されたキーワードに基づいてブログ記事を取得し、キーワード毎にブログサイト、ブログ記事との関係を抽出し、この結果に基づいてブログサイトとキーワードのスコアを算出し、算出されたスコアに基づいてブログサイトとキーワードをランキングする情報画像ランキング装置が開示されている。
特開2004−206517号公報 特開2007−334590号公報
According to Patent Document 2, a blog article is acquired based on an input keyword, a relationship between the blog site and the blog article is extracted for each keyword, and the score of the blog site and the keyword is calculated based on the result. An information image ranking device that ranks blog sites and keywords based on the score obtained is disclosed.
JP 2004-206517 A JP 2007-334590 A

しかしながら、特許文献1、2に記載の発明では、キーワードのランキング、すなわち話題性のあるキーワードを知ることができるが、話題性のある画像に適用するには、次のような問題点がある。   However, in the inventions described in Patent Documents 1 and 2, it is possible to know keyword rankings, that is, topical keywords, but there are the following problems when applied to topical images.

例えば、キーワードを入力し、キーワードにタグ付けされている画像をランキングして、その結果を一覧表示する手法が考えられる。しかしながら、この場合には、検索条件はキーワード情報に依存しており、適切なキーワードを入力しなければならないという問題点がある。また、キーワードに基づいて検索を行うため、画像そのものの情報は利用していない。つまり、画像そのものの話題性に基づいて検索を行っているとは言い難い。   For example, a method of inputting a keyword, ranking images tagged with the keyword, and displaying a list of the results can be considered. However, in this case, the search condition depends on the keyword information, and there is a problem that an appropriate keyword must be input. Further, since the search is performed based on the keyword, information on the image itself is not used. That is, it is difficult to say that the search is performed based on the topicality of the image itself.

また、キーワードの代わりに画像を入力して、インターネット上に入力された画像と同一の画像が掲載されているページのURLや個数を検索する手法も考えられる。インターネット上の複数のページにまったく同じ画像が掲載されている場合、その画像は何らかの話題性、人気を持っていると考えられるし、掲載されている個数が多いほど、その画像はより話題性を持ったものであると考えられるからである。しかしながら、画像をキーとして入力しなければ同じ画像の個数を調べる事はできないため、話題性のある画像の検索には適さない。   Another possible method is to input an image instead of a keyword and search for the URL and the number of pages on which the same image as the image input on the Internet is posted. When the exact same image is posted on multiple pages on the Internet, it is considered that the image has some topicality and popularity, and the more the number is posted, the more topical the image. This is because it is thought to be possessed. However, since it is impossible to check the number of the same images without inputting the images as keys, it is not suitable for searching for topical images.

本発明はこのような事情に鑑みてなされたもので、キーワード等の入力をすることなく、話題性があると考えられる画像を自動でランキング表示することができる画像ランキング装置、画像ランキング方法及びプログラムを提供することを目的とする。   The present invention has been made in view of such circumstances, and an image ranking apparatus, an image ranking method, and a program capable of automatically ranking and displaying images considered to be topical without inputting keywords or the like The purpose is to provide.

請求項1に記載の画像ランキング装置は、インターネット上から画像を収集するクローリング手段と、前記クローリング手段により取得された画像のサムネイル画像を生成するサムネイル画像生成手段と、前記クローリング手段により収集された画像から該画像の識別情報を算出する識別情報算出手段と、前記クローリング手段により収集された各画像毎に前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する第1の画像情報登録手段と、前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する第2の画像情報テーブル作成手段と、前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するランキング表示画面出力手段と、を備えたことを特徴とする。   The image ranking apparatus according to claim 1, a crawling unit that collects images from the Internet, a thumbnail image generating unit that generates thumbnail images of images acquired by the crawling unit, and an image collected by the crawling unit Identification information calculating means for calculating the identification information of the image from, a thumbnail image generated from the image for each image collected by the crawling means, and identification information calculated from the image are associated with each other. First image information registration means for registering one image information in the first image information table, based on the first image information registered in the first image information table, identification information of the image, A second image information table creation method for creating a second image information table in which the number of registrations for each identification information is associated Extracting the identification information from the second image information table in order of the number of registrations, extracting the thumbnail image of the image corresponding to the extracted identification information from the first image information table, And a ranking display screen output means for outputting a ranking display screen showing the order of the images with the most registered numbers.

請求項1に記載の画像ランキング装置によれば、インターネット上から画像を収集し、その画像からサムネイル画像を生成し、またその画像の識別情報(ハッシュ値、特徴量など)を算出する。収集した各画像毎に、画像から生成されたサムネイル画像と、画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、登録された第1の画像情報に基づいて画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する。第2の画像情報テーブルから登録数の多い順番に識別情報を抽出するとともに、第1の画像情報テーブルから抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、登録数の多い画像の順番を示すランキング表示画面を出力する。これにより、インターネット上に多く掲載された画像、すなわち話題性があると考えられる画像を自動でランキング表示することができる。   According to the image ranking apparatus of the first aspect, an image is collected from the Internet, a thumbnail image is generated from the image, and identification information (hash value, feature amount, etc.) of the image is calculated. For each collected image, the first image information in which the thumbnail image generated from the image and the identification information calculated from the image are associated is registered in the first image information table, and the registered first image information is stored. Based on the image information, a second image information table is created in which the identification information of the image is associated with the number of registrations for each identification information. The identification information is extracted from the second image information table in descending order of the number of registrations, the thumbnail images of the images corresponding to the identification information extracted from the first image information table are extracted, and the ranking including the extracted thumbnail images is included. A ranking display screen showing the order of images with a large number of registrations is output. Accordingly, it is possible to automatically display rankings of images that are frequently posted on the Internet, that is, images that are considered to be topical.

請求項2に記載の画像ランキング装置は、請求項1に記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURL、ウェブページURL、及び画像URLのうちの少なくとも1つのURLを収集し、前記第1の画像情報登録手段は、前記画像に対応して収集されたURLと、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記ランキング表示画面出力手段は、前記第1の画像情報テーブルから前記登録数の多い画像のサムネイル画像及びURLを抽出し、前記抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力することを特徴とする。   The image ranking device according to claim 2 is the image ranking device according to claim 1, wherein the crawling means includes, together with the image, a site URL where the image is posted, a web page URL, and an image URL. Collecting at least one URL, the first image information registration means includes a URL collected corresponding to the image, a thumbnail image generated from the image, and identification information calculated from the image. The associated first image information is registered in a first image information table, and the ranking display screen output means extracts thumbnail images and URLs of images with a large number of registrations from the first image information table, A ranking display screen including the extracted thumbnail image and the link button of the URL is output.

請求項2に記載の画像ランキング装置によれば、画像とともに、該画像が掲載されたサイトURL、ウェブページURL、及び画像URLのうちの少なくとも1つのURLを収集し、画像に対応して収集されたURLと、その画像から生成されたサムネイル画像と、その画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する。第1の画像情報テーブルから登録数の多い画像のサムネイル画像及びURLを抽出し、抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力する。これにより、ユーザは、検索を行うことなく、ランキングされた画像が掲載されたページを閲覧することができる。   According to the image ranking apparatus of claim 2, at least one URL of a site URL, a web page URL, and an image URL on which the image is posted is collected together with the image, and is collected corresponding to the image. The first image information in which the URL, the thumbnail image generated from the image, and the identification information calculated from the image are associated is registered in the first image information table. A thumbnail image and URL of an image with a large number of registrations are extracted from the first image information table, and a ranking display screen including the extracted thumbnail image and the link button of the URL is output. Thereby, the user can browse the page on which the ranked image is posted without performing a search.

請求項3に記載の画像ランキング装置は、請求項1又は2に記載の画像ランキング装置において、前記識別情報算出手段により算出された識別情報が前記第1の画像情報に保存されているかどうかを判断する判断手段と、前記判断手段により前記識別情報が前記第1の画像情報に保存されていると判断された場合には、現在のカウント数に1を加えた数を新たなカウント数とし、前記判断手段により前記識別情報が前記第1の画像情報に保存されていないと判断された場合には、カウント数を1とするカウント数算出手段と、を備え、前記第2の画像情報テーブル作成手段は、前記カウント数算出手段により算出されたカウント数を前記登録数とすることを特徴とする。   The image ranking apparatus according to claim 3 determines whether or not the identification information calculated by the identification information calculation means is stored in the first image information in the image ranking apparatus according to claim 1 or 2. And when the determination unit determines that the identification information is stored in the first image information, a number obtained by adding 1 to the current count number is set as a new count number, When the determination means determines that the identification information is not stored in the first image information, the second image information table creation means includes a count number calculation means that sets the count number to 1. Is characterized in that the count number calculated by the count number calculating means is the registered number.

請求項3に記載の画像ランキング装置によれば、インターネット上から収集された画像から算出された識別情報が第1の画像情報テーブルに保存されているかどうかを判断し、保存されている場合には、現在のカウント数に1を加えた数を新たなカウント数とし、保存されていない場合にはカウント数を1とし、このカウント数を登録数として第2の画像情報を作成する。これにより、識別情報が第1の画像情報に含まれる数をカウント数として算出することができる。   According to the image ranking apparatus of the third aspect, it is determined whether or not the identification information calculated from the images collected from the Internet is stored in the first image information table. Then, the number obtained by adding 1 to the current count number is set as a new count number, and when not stored, the count number is set as 1, and the second image information is created by using the count number as the registered number. Accordingly, the number of identification information included in the first image information can be calculated as the count number.

請求項4に記載の画像ランキング装置は、請求項3に記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURLを収集し、前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が掲載されたサイトURLとが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記判断手段は、同一の識別情報に同一のサイトURLが関連付けられている組み合わせが前記第1の画像情報に複数保存されているか否かを判断し、前記カウント数算出手段は、前記判断手段により同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されていると判断された場合には、前記複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出することを特徴とする。   The image ranking device according to claim 4 is the image ranking device according to claim 3, wherein the crawling means collects a URL of a site where the image is posted together with the image, and registers the first image information. The means registers, in the first image information table, first image information in which a thumbnail image generated from the image, identification information calculated from the image, and a site URL on which the image is posted are associated with each other. The determination means determines whether or not a plurality of combinations in which the same site URL is associated with the same identification information is stored in the first image information, and the count number calculation means determines the determination If it is determined by the means that a plurality of combinations of the same identification information and the same site URL are stored in the first image information, the plurality of storages are stored. And calculates the count number a combination of the same site URL and the same identification information as one.

請求項4に記載の画像ランキング装置によれば、同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されている場合には、複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出する。これにより、巨大なサイトで同じ画像が使いまわされている場合や、ページの表記の違いで複数カウントされる事を防ぎ、正確なカウント数を算出することができる。したがって、正確なランキングを行うことができる。   According to the image ranking apparatus of claim 4, when a plurality of combinations of the same identification information and the same site URL are stored in the first image information, a plurality of the same identification information stored. The number of counts is calculated assuming that the combination with the same site URL is 1. As a result, it is possible to prevent the case where the same image is reused in a huge site, or to prevent multiple counting due to the difference in page notation, and to calculate an accurate count. Therefore, accurate ranking can be performed.

請求項5に記載の画像ランキング装置は、請求項1から4のいずれかに記載の画像ランキング装置において、前記クローリング手段は、前記画像とともに、該画像が収集された日時情報を取得し、前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、前記第2の画像情報テーブル作成手段は、前記日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して前記第2の画像情報テーブルを作成することを特徴とする。   The image ranking device according to claim 5 is the image ranking device according to any one of claims 1 to 4, wherein the crawling means acquires date and time information when the image is collected together with the image, and The first image information registering means stores the first image information in which the thumbnail image generated from the image, the identification information calculated from the image, and the date / time information when the image is collected are associated with each other. The second image information table creation means creates the second image information table for the images collected by the crawling means within a predetermined period based on the date / time information. It is characterized by that.

請求項5に記載の画像ランキング装置によれば、画像とともに該画像が収集された日時情報を取得し、画像から生成されたサムネイル画像と、画像から算出された識別情報と、画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する。この日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して第2の画像情報テーブルを作成する。これにより、所定の期間毎のランキングを自動で行うことができる。   According to the image ranking device of claim 5, the date and time information when the image is collected is acquired together with the image, the thumbnail image generated from the image, the identification information calculated from the image, and the image are collected. The first image information associated with the date / time information is registered in the first image information table. Based on this date and time information, a second image information table is created for the images collected by the crawling means within a predetermined period. Thereby, ranking for every predetermined period can be performed automatically.

請求項6に記載の画像ランキング装置は、請求項1から5のいずれかに記載の画像ランキング装置において、前記ランキング表示出力手段は、前記ランキング表示画面と共に、該ランキング表示画面へのリンクボタンと、前記ランキング表示画面に含まれるサムネイル画像とを含むモジュールを出力することを特徴とする。   The image ranking apparatus according to claim 6 is the image ranking apparatus according to any one of claims 1 to 5, wherein the ranking display output means includes a link button to the ranking display screen, together with the ranking display screen, A module including a thumbnail image included in the ranking display screen is output.

請求項6に記載の画像ランキング装置によれば、ランキング表示をモジュールとしてインターネット上に出力する。このモジュールをインターネット上で公開し、他人のブログ等に掲載してもらうことにより、自らのサイトへのアクセス数を増加させたり、広告収入を増加させたりすることができる。   According to the image ranking apparatus of the sixth aspect, the ranking display is output as a module on the Internet. By publishing this module on the Internet and having it posted on other people's blogs, you can increase the number of accesses to your site and increase advertising revenue.

請求項7に記載の画像ランキング装置は、請求項1から6のいずれかに記載の画像ランキング装置において、前記識別情報は、前記画像に対してハッシュ関数を適用することにより算出されたハッシュ値であることを特徴とする。これにより、同一画像を同じ画像であると確実に認識することができる。   The image ranking device according to claim 7 is the image ranking device according to any one of claims 1 to 6, wherein the identification information is a hash value calculated by applying a hash function to the image. It is characterized by being. As a result, the same image can be reliably recognized as the same image.

請求項8に記載の画像ランキング装置は、請求項1から6のいずれかに記載の画像ランキング装置において、前記識別情報は、前記画像固有の特徴を示す特徴量であることを特徴とする。これにより、拡大、縮小等がされた類似画像を同じ画像であると認識することができる。そのため、より精度の高いランキングをすることができる。   An image ranking apparatus according to an eighth aspect is the image ranking apparatus according to any one of the first to sixth aspects, wherein the identification information is a feature amount indicating a characteristic unique to the image. As a result, similar images that have been enlarged or reduced can be recognized as the same image. Therefore, ranking with higher accuracy can be performed.

請求項9に記載の画像ランキング方法は、インターネット上から画像を収集するステップと、前記取得された画像のサムネイル画像を生成するステップと、前記収集された画像から該画像の識別情報を算出するステップと、前記収集された各画像毎に該画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録するステップと、前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成するステップと、前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するステップと、を含むことを特徴とする。   The image ranking method according to claim 9, a step of collecting an image from the Internet, a step of generating a thumbnail image of the acquired image, and a step of calculating identification information of the image from the collected image Registering, in the first image information table, first image information in which thumbnail images generated from the collected images are associated with identification information calculated from the images; And creating a second image information table in which the identification information of the image and the registration number for each identification information are associated with each other based on the first image information registered in the first image information table. And extracting the identification information from the second image information table in the descending order of the number of registrations, and extracting the identification information extracted from the first image information table. Extracting a thumbnail image of an image corresponding to the ranking image, and outputting a ranking display screen including the extracted thumbnail image, the ranking display screen showing the order of the images having a large number of registrations. To do.

請求項10に記載のプログラムは、請求項9に記載の画像ランキング方法を演算装置に実行させることを特徴とする。   A program according to a tenth aspect causes an arithmetic device to execute the image ranking method according to the ninth aspect.

本発明によれば、キーワード等の入力をすることなく、話題性があると考えられる画像を自動でランキング表示することができる。   According to the present invention, it is possible to automatically display rankings of images considered to be topical without inputting keywords or the like.

<第1の実施の形態>
図1は、第1の実施の形態に係る画像ランキング装置1の全体構造の概略図である。画像ランキング装置1は、主として、クローリング部10と、ランキング部20とで構成される。クローリング部10は、主として、クローリングエンジン11と、画像ハッシュ算出装置12と、サムネイル画像生成手段13と、画像ハッシュ比較装置14と、データベース(DB)15とで構成され、ランキング部20は、画像ランキング表示生成装置21と、表示装置22とで構成される。クローリングエンジン11及び画像ランキング表示生成装置21には、インターネット30が接続される。
<First Embodiment>
FIG. 1 is a schematic diagram of the overall structure of an image ranking apparatus 1 according to the first embodiment. The image ranking device 1 is mainly composed of a crawling unit 10 and a ranking unit 20. The crawling unit 10 mainly includes a crawling engine 11, an image hash calculation device 12, a thumbnail image generation unit 13, an image hash comparison device 14, and a database (DB) 15. The ranking unit 20 includes an image ranking. The display generation device 21 and the display device 22 are included. The Internet 30 is connected to the crawling engine 11 and the image ranking display generation device 21.

クローリングエンジン11は、インターネット30上のウェブページに接続して、そのウェブページURLと、サイトURLとを取得する。また、クローリングエンジン11は、HTML(Hyper Text Markup Language)等で記述されたリンク情報を辿って、ウェブページに掲載された画像URLと、その画像データを取得する。クローリングエンジン11で取得された画像データは、画像ハッシュ算出装置12及びサムネイル画像生成手段13に出力される。   The crawling engine 11 connects to a web page on the Internet 30 and acquires the web page URL and the site URL. The crawling engine 11 traces link information described in HTML (Hyper Text Markup Language) or the like, and acquires an image URL posted on a web page and its image data. The image data acquired by the crawling engine 11 is output to the image hash calculation device 12 and the thumbnail image generation means 13.

画像ハッシュ算出装置12は、MD5やSHA−1といったハッシュ関数を利用して、クローリングエンジン11から出力された画像のハッシュ値を算出する。画像ハッシュ算出装置12で算出されたハッシュ値はクローリングエンジン11に入力される。   The image hash calculation device 12 calculates a hash value of an image output from the crawling engine 11 using a hash function such as MD5 or SHA-1. The hash value calculated by the image hash calculation device 12 is input to the crawling engine 11.

サムネイル画像生成手段13は、クローリングエンジン11から出力された画像のサムネイル画像を生成する。サムネイル画像生成手段13で生成されたサムネイル画像はクローリングエンジン11に入力される。   The thumbnail image generation unit 13 generates a thumbnail image of the image output from the crawling engine 11. The thumbnail image generated by the thumbnail image generating means 13 is input to the crawling engine 11.

クローリングエンジン11は、画像ハッシュ算出装置12から出力された画像のハッシュ値を、その画像が取得されたウェブページURL、サイトURL、画像URL、その画像に基づいてサムネイル画像生成手段13から出力されたサムネイル画像などと関連付けられた第1画像情報をDB15内の第1画像情報テーブルに登録する。クローリングエンジン11は、インターネット30を自動巡回し、この処理を再帰的に行うことで、第1画像情報テーブルを継続的に増大させる。   The crawling engine 11 outputs the hash value of the image output from the image hash calculation device 12 from the thumbnail image generation unit 13 based on the web page URL, the site URL, the image URL, and the image from which the image was acquired. First image information associated with a thumbnail image or the like is registered in a first image information table in the DB 15. The crawling engine 11 circulates the Internet 30 automatically and recursively performs this process, thereby continuously increasing the first image information table.

第1画像情報テーブルのデータ構造の一例を図2に示す。第1画像情報テーブルには、画像が掲載されているウェブページURLと、そのウェブページに掲載されている画像URLと、そのウェブページのサイトURLと、その画像のハッシュ値と、その画像のサムネイル画像とが関連付けられた第1画像情報が格納される。ハッシュ値は、画像の同一性を検出する指標であり、同じ画像からは同じハッシュ値が算出される。図2に示す場合においては、1行目、4行目及び7行目に同じハッシュ値「123456789」が格納されており、この3つが同じ画像であることを示している。   An example of the data structure of the first image information table is shown in FIG. The first image information table includes a web page URL on which an image is posted, an image URL posted on the web page, a site URL of the web page, a hash value of the image, and a thumbnail of the image. First image information associated with an image is stored. The hash value is an index for detecting the identity of images, and the same hash value is calculated from the same image. In the case illustrated in FIG. 2, the same hash value “123456789” is stored in the first row, the fourth row, and the seventh row, indicating that these three are the same image.

画像ハッシュ比較装置14は、画像ハッシュ算出装置12から出力された画像のハッシュ値とDB15に保存された第1画像情報テーブルとを比較し、その画像のハッシュ値が第1画像情報テーブルに保存されている数(以下、カウント数という)を算出する。画像ハッシュ比較装置14でカウント数を算出する処理については、後に詳述する。画像ハッシュ比較装置14で算出されたカウント数は、クローリングエンジン11に入力される。   The image hash comparison device 14 compares the hash value of the image output from the image hash calculation device 12 with the first image information table stored in the DB 15, and the hash value of the image is stored in the first image information table. Is calculated (hereinafter referred to as the count number). The process of calculating the count number by the image hash comparison device 14 will be described in detail later. The count number calculated by the image hash comparison device 14 is input to the crawling engine 11.

クローリングエンジン11は、第1の画像情報に基づいて、図3に示すような画像のハッシュ値と、カウント数とを関連付けた第2画像情報テーブルを作成し、DB15に保存する。   The crawling engine 11 creates a second image information table in which the hash value of the image and the count number are associated with each other based on the first image information, and stores the second image information table in the DB 15.

DB15には、図2に示すような第1画像情報テーブルと、図3に示すような画像のハッシュ値と、カウント数とを関連付けた第2画像情報テーブルが保存される。また、DB15には、クローリングを行った日時と、そのときに取得した画像の詳細情報(画像のファイル名、縦・横幅、ファイルサイズ、取得日時など)とが関連付けて保存される。   The DB 15 stores a first image information table as shown in FIG. 2, a second image information table in which the hash value of the image as shown in FIG. Also, the date and time of crawling and detailed information of the image acquired at that time (image file name, vertical / horizontal width, file size, acquisition date / time, etc.) are stored in the DB 15 in association with each other.

画像ランキング表示生成装置21は、DB15に保存された第1画像情報テーブル及び第2画像情報テーブルに基づいて、画像ランキング表示用の画面データを生成する。画像ランキング表示生成装置21で生成された画像ランキング表示用の画面のデータは表示装置22又はインターネット30に出力される。画像ランキング表示生成装置21で生成する画像ランキング表示用の画面については、後に詳述する。   The image ranking display generation device 21 generates screen data for image ranking display based on the first image information table and the second image information table stored in the DB 15. The image ranking display screen data generated by the image ranking display generation device 21 is output to the display device 22 or the Internet 30. The image ranking display screen generated by the image ranking display generation device 21 will be described in detail later.

表示装置22は、カラー表示が可能な液晶ディスプレイであり、画像ランキング表示生成装置21から出力された画像ランキング表示用の画面を表示する。   The display device 22 is a liquid crystal display capable of color display, and displays the image ranking display screen output from the image ranking display generation device 21.

このように構成された画像ランキング装置1の作用について説明する。まず、クローリング部の作用について説明する。図4は、クローリング部10で行う処理の流れを示すフローチャートである。   The operation of the image ranking apparatus 1 configured as described above will be described. First, the operation of the crawling unit will be described. FIG. 4 is a flowchart showing a flow of processing performed by the crawling unit 10.

クローリングエンジン11は、インターネット30上にある画像と、その画像が掲載されているウェブページURLと、サイトURLと、画像URLとを取得する(ステップS1)。ステップS1で取得された画像は、画像ハッシュ算出装置12及びサムネイル画像生成手段13に入力される。   The crawling engine 11 acquires an image on the Internet 30, a web page URL where the image is posted, a site URL, and an image URL (step S1). The image acquired in step S1 is input to the image hash calculation device 12 and the thumbnail image generation means 13.

画像ハッシュ算出装置12は、ステップS1で取得された画像のハッシュ値を算出し(ステップS2)、サムネイル画像生成手段13は、ステップS1で取得された画像のサムネイル画像を生成する(ステップS3)。ステップS2で算出されたハッシュ値及びステップS3で生成されたサムネイル画像は、クローリングエンジン11に入力される。   The image hash calculation device 12 calculates the hash value of the image acquired in step S1 (step S2), and the thumbnail image generation unit 13 generates a thumbnail image of the image acquired in step S1 (step S3). The hash value calculated in step S2 and the thumbnail image generated in step S3 are input to the crawling engine 11.

クローリングエンジン11は、ステップS1で取得されたウェブページURL、サイトURL、及び画像URLと、ステップS2で算出されたハッシュ値と、ステップS3で生成されたサムネイル画像とを組にした第1画像情報を、DB15の第1画像情報テーブルに登録する(ステップS4)。   The crawling engine 11 includes first image information obtained by combining the web page URL, site URL, and image URL acquired in step S1, the hash value calculated in step S2, and the thumbnail image generated in step S3. Is registered in the first image information table of the DB 15 (step S4).

クローリングエンジン11は、クローリングが終了したか、すなわちインターネット30上の全ての画像を収集したかを判断する(ステップS5)。クローリングが終了した場合(ステップS5でYES)には、処理を終了する。   The crawling engine 11 determines whether crawling has ended, that is, whether all images on the Internet 30 have been collected (step S5). If crawling has ended (YES in step S5), the process ends.

クローリングが終了していない場合(ステップS5でNO)には、クローリングエンジン11は、ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLと、第1画像情報テーブルに保存されたハッシュ値及びサイトURLとを比較し(ステップS6)、ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じハッシュ値及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されているかどうかを判断する(ステップS7)。   If the crawling has not ended (NO in step S5), the crawling engine 11 determines that the site URL acquired at the same time as the hash value calculated in step S2 and the image on which the hash value is based, and the first image The hash value and the site URL stored in the information table are compared (step S6), and the first value obtained by combining the hash value calculated in step S2 and the site URL acquired at the same time as the image on which the hash value is based is combined. It is determined whether or not the first image information in which the same hash value and site URL as the image information are combined is already stored in the first image information table (step S7).

ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じ組み合わせの第1画像情報が既に第1画像情報テーブルに保存されている(ステップS7でYES)場合には、ハッシュ値のカウント処理(ステップS8〜S11)は行わず、ステップS1へ戻り再度クローリング処理(ステップS1〜S7)を行う。ここで、ハッシュ値のみでなくサイトURLを比較するのは、yahooなどの巨大なサイトで同じ画像が使いまわされているケースや、http://www.xxx.jp/とhttp://www.xxx.jp/index.htmlなどページの表記の違いで複数カウントされる事等を防ぐためである。   The first image information having the same combination as the first image information obtained by combining the hash value calculated in step S2 and the site URL acquired at the same time as the image on which the hash value is based is already stored in the first image information table. If YES (YES in step S7), the hash value counting process (steps S8 to S11) is not performed, the process returns to step S1, and the crawling process (steps S1 to S7) is performed again. Here, not only the hash value but also the site URL is compared in the case where the same image is reused in a huge site such as Yahoo, or http: // www. xxx. jp / and http: // www. xxx. jp / index. This is to prevent multiple counting due to differences in page notation such as html.

ステップS2で算出されたハッシュ値及びそのハッシュ値の基となる画像と同時に取得されたサイトURLが組み合わされた第1画像情報と同じ組み合わせの第1画像情報が第1画像情報テーブルに保存されていない(ステップS7でNO)場合には、ハッシュ値のカウント処理(ステップS8〜S11)へ進む。   First image information having the same combination as the first image information obtained by combining the hash value calculated in step S2 and the site URL acquired simultaneously with the image that is the basis of the hash value is stored in the first image information table. If not (NO in step S7), the process proceeds to the hash value counting process (steps S8 to S11).

画像ハッシュ比較装置14は、ステップS2で算出されたハッシュ値と、第2画像情報テーブルに保存されたハッシュ値とを比較し(ステップS8)、ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されているかどうかを判断する(ステップS9)。   The image hash comparison device 14 compares the hash value calculated in step S2 with the hash value stored in the second image information table (step S8), and the hash value same as the hash value calculated in step S2 is obtained. It is determined whether it is stored in the second image information table (step S9).

ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されている(ステップS9でYES)場合には、画像ハッシュ比較装置14は、第2画像情報テーブルの当該ハッシュ値と関連付けられたカウント数に1を追加する(ステップS10)。例えば、図3に示す第2画像情報テーブルがDB15に保存されている場合において、ステップS2で算出されたハッシュ値が123456789である場合には、画像ハッシュ比較装置14は、第2画像情報テーブルの現在のカウント数である950に1を追加して、カウント数を951に変更する。   If the same hash value as the hash value calculated in step S2 is stored in the second image information table (YES in step S9), the image hash comparison device 14 calculates the hash value in the second image information table. 1 is added to the associated count number (step S10). For example, when the second image information table shown in FIG. 3 is stored in the DB 15 and the hash value calculated in step S2 is 12345789, the image hash comparison device 14 stores the second image information table in the second image information table. 1 is added to 950 which is the current count number, and the count number is changed to 951.

ステップS2で算出されたハッシュ値と同じハッシュ値が第2画像情報テーブルに保存されていない(ステップS9でNO)場合には、クローリングエンジン11は、当該ハッシュ値をカウント数1と関連付けて第2画像情報テーブルに保存する(ステップS11)。例えば、図3に示す第2画像情報テーブルがDB15に保存されている場合において、ステップS2で算出されたハッシュ値が111111111である場合には、ハッシュ値111111111は第2画像情報テーブルに保存されていないため、カウント数を1としてハッシュ値111111111を第2画像情報テーブルに登録する。   When the same hash value as the hash value calculated in step S2 is not stored in the second image information table (NO in step S9), the crawling engine 11 associates the hash value with the count number 1 and stores the second hash value. Save in the image information table (step S11). For example, if the second image information table shown in FIG. 3 is stored in the DB 15 and the hash value calculated in step S2 is 111111111, the hash value 111111111 is stored in the second image information table. Therefore, the hash value 111111111 is registered in the second image information table with the count number being 1.

これにより、ハッシュ値のカウント処理(ステップS8〜S11)が終了し、第1画像情報テーブルに保存されたハッシュ値の数がカウント数として算出される。ステップS1へ戻り再度クローリング処理(ステップS1〜S7)を行う。   As a result, the hash value counting process (steps S8 to S11) ends, and the number of hash values stored in the first image information table is calculated as the count number. Returning to step S1, the crawling process (steps S1 to S7) is performed again.

これにより、クローリング部10は、第1画像情報テーブル及び第2画像情報テーブルを継続的に更新し続け、第1画像情報テーブル及び第2画像情報テーブルを常に最新の状態に保つことができる。   Thereby, the crawling unit 10 can continuously update the first image information table and the second image information table, and can always keep the first image information table and the second image information table in the latest state.

次に、ランキング部20の作用について説明する。図5〜図8は、画像ランキング表示生成装置21が生成する画像ランキング表示用の画面である。   Next, the operation of the ranking unit 20 will be described. 5 to 8 are image ranking display screens generated by the image ranking display generation device 21. FIG.

画像ランキング表示生成装置21は、第2画像情報テーブルのカウント数をポイントとして、ポイントの多いものから順にランキングを行う。例えば、図3に示す場合において、画像ランキング表示生成装置21は、ハッシュ値が123456789の画像が950ポイントでランキング1位とし、ハッシュ値が565656565の画像が892ポイントでランキング2位とし、ハッシュ値が787878787の画像が777ポイントでランキング3位とし・・・、というようにランキングを行う。なお、ポイントはカウント数に限らず、カウント数を元に算出した数値を用いてもよい。   The image ranking display generation device 21 performs ranking in descending order of the number of points with the count number of the second image information table as a point. For example, in the case shown in FIG. 3, the image ranking display generation device 21 ranks the image with a hash value of 123456789 as 1st ranking with 950 points, the image with the hash value of 5656656565 as 2nd ranking with 892 points, and the hash value Ranking is performed in such a manner that the image of 7878787787 is ranked third with 777 points. The point is not limited to the count number, and a numerical value calculated based on the count number may be used.

図5は、画像ランキング表示画面の一例であり、ユーザが図示しない入力装置により画像ランキング装置1に画像ランキング表示の指示を入力したときに、最初に表示装置22に表示される画面(トップページ)である。画像ランキング表示生成装置21は、サムネイル画像、ポイント数等をランキング順に表示した画面をトップページとして生成する。トップページに表示するサムネイル画像は、第1画像情報テーブルに保存してあるサムネイル画像を使用する。なお、表示するサムネイル画像のサイズは、図5に示すように順位に応じて変えてもよいし、全て同じサイズでもよい。   FIG. 5 is an example of an image ranking display screen. When a user inputs an image ranking display instruction to the image ranking device 1 using an input device (not shown), a screen (top page) that is first displayed on the display device 22. It is. The image ranking display generation device 21 generates a screen displaying thumbnail images, the number of points, etc. in the ranking order as a top page. As thumbnail images displayed on the top page, thumbnail images stored in the first image information table are used. Note that the size of the thumbnail image to be displayed may be changed according to the order as shown in FIG.

また、図5に示すトップページには、各ランキング毎に他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「重複画像を見る」と書かれたソフトボタンには、図6に示すウェブページURL一覧表示画面へのリンクが張られており、サムネイル画像には、図7に示す画像詳細情報画面へのリンクが張られている。ユーザがソフトボタン又はサムネイル画像をクリックすることにより、それぞれ図6又は図7のページに遷移する。   Also, the top page shown in FIG. 5 is provided with a soft button or the like with a link to another page for each ranking. For example, a soft button written as “view duplicate images” has a link to the web page URL list display screen shown in FIG. 6, and thumbnail images go to the image detailed information screen shown in FIG. The link is stretched. When the user clicks a soft button or a thumbnail image, the page transitions to the page of FIG. 6 or FIG.

図6は、ウェブページURL一覧表示画面の一例であり、画像ランキング1位の画像が含まれるウェブページのURLの一覧が表示されている。図6に示す画面は、図5に示すトップページにおいて、ユーザがランキング1位の画像に隣接して表示された「重複画像を見る」と書かれたソフトボタンをクリックした場合に表示される画面である。画像ランキング表示生成装置21は、ウェブページURLを第1画像情報テーブルから取得し、取得したウェブページURLを例えば50音順、ABC順に並べてサムネイル画像、ポイントと共に表示した画面を生成する。なお図6では、ウェブページURLを10件ずつ表示する例を示したが、表示形態はこれに限定されない。   FIG. 6 shows an example of a web page URL list display screen, in which a list of URLs of web pages including the image ranked first is displayed. The screen shown in FIG. 6 is a screen displayed when the user clicks a soft button “view duplicate images” displayed adjacent to the image ranked first in the top page shown in FIG. It is. The image ranking display generation device 21 acquires a web page URL from the first image information table, and generates a screen in which the acquired web page URLs are arranged together with, for example, 50-sound order and ABC order and displayed together with thumbnail images and points. In addition, although the example which displays 10 web page URLs every time was shown in FIG. 6, a display form is not limited to this.

また、図6に示すウェブページURL一覧表示画面には、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「前の10件」と書かれたソフトボタンには、現在表示されている950件のうちの11〜20件の前の10件、すなわち950件のうちの1〜10件を表示するページへのリンクが張られており、「次の10件」と書かれたソフトボタンには、現在表示されている950件のうちの11〜20件の後の10件、すなわち950件のうちの20〜30件を表示するページへのリンクが張られており、「ランキング一覧に戻る」という文字には、図5に示すトップページへのリンクが張られている。また、サムネイル画像には、図7に示す画像詳細情報画面へのリンクが張られている。   Further, the web page URL list display screen shown in FIG. 6 is provided with a soft button or the like with a link to another page. For example, in the soft button written as “Previous 10”, the previous 10 to 20 of 950 currently displayed, that is, 1 to 10 of 950 are displayed. There is a link to the page, and the soft button labeled "Next 10" shows 10 out of 950 currently displayed, that is, 10 after -20, that is, out of 950 A link to a page displaying 20 to 30 is attached, and a link to the top page shown in FIG. 5 is attached to the characters “return to ranking list”. Further, the thumbnail image has a link to the image detailed information screen shown in FIG.

図7は、画像詳細情報画面の一例であり、画像ランキング1位の画像の詳細情報が表示されている。図7に示す画面は、図5に示すトップページにおいて、ユーザがランキング1位の画像のサムネイル画像をクリックした場合に表示される画面である。画像ランキング表示生成装置21は、画像の詳細情報、クローリングを行った日時などの情報をDB15から取得し、画像が掲載されていたウェブページURLを第1画像情報テーブルから取得し、これらをサムネイル画像、ポイントと共に表示した画面を生成する。   FIG. 7 shows an example of the image detailed information screen, which displays detailed information of the image ranked first in the image ranking. The screen shown in FIG. 7 is a screen displayed when the user clicks the thumbnail image of the image ranked first in the top page shown in FIG. The image ranking display generation device 21 acquires detailed image information, information such as the date and time of crawling from the DB 15, acquires the web page URL on which the image was posted from the first image information table, and these are thumbnail images. , Generate a screen displayed with points.

また、図7に示す画像詳細情報画面には、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「重複画像を見る」と書かれたソフトボタンには、図6に示すウェブページURL一覧表示画面へのリンクが張られており、「前へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ上の順位の画像詳細情報画面へのリンクが張られており、「次へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ下の順位の画像詳細情報画面へのリンクが張られている。また、サムネイル画像には、画像URLへのリンクが張られている。   Further, the image detailed information screen shown in FIG. 7 is provided with a soft button or the like with a link to another page. For example, a soft button written “view duplicate images” has a link to the web page URL list display screen shown in FIG. 6, and a soft button written “previous” contains There is a link to the detailed image information screen that is one rank higher than the ranking of the displayed image, and the soft button labeled “Next” is 1 from the ranking of the currently displayed image. There is a link to the image detail information screen of the next order. The thumbnail image has a link to the image URL.

図8は、画像ランキング表示をモジュール、例えばブログパーツとした場合の例であり、(a)は、ブログパーツが貼り付けられたブログの一例であり、(b)は(a)のブログに貼り付けられたブログパーツを拡大した図である。ブログパーツとは、ブログの機能性やデザイン性を向上させるために他のサイトの情報等を小さな枠内に表示するシステムであり、自らのサイトの情報が記載されたブログパーツをインターネット上で公開し、他人のブログに貼り付けてもらうことにより、自らのサイトへのアクセス数を増加させたり、広告収入を増加させたりすることを目的としたものである。図8は、モジュールとしてブログパーツを提供する例を示すが、モジュールはブログパーツに限らず、バナーなどでもよい。   FIG. 8 is an example when the image ranking display is a module, for example, a blog part, (a) is an example of a blog with a blog part pasted, and (b) is pasted on the blog of (a). It is the figure which expanded the attached blog part. Blog parts are systems that display information on other sites in a small frame to improve the functionality and design of the blog, and blog parts that contain information about your site are published on the Internet. However, it is intended to increase the number of accesses to its own site and increase advertising revenue by having it posted on other people's blogs. FIG. 8 shows an example of providing a blog part as a module, but the module is not limited to a blog part but may be a banner or the like.

図8(b)に示すブログパーツは、横幅が180ピクセル程度の大きさであり、画像ランキング表示生成装置21は、所望のランキングの画像のサムネイル画像と、ランキングと、ポイントとが表示されたブログパーツをFlash、GIF等を用いて作成する。ブログパーツでは、所望のランキングの画像、ランキング、ポイントのみを表示するようにしてもよいし、一定時間経過すると異なる順位の紹介画面へと遷移するスライドショー形式で例えばランキング1〜10位までの画像、ランキング、ポイントを順番に表示するようにしてもよい。   The blog part shown in FIG. 8B has a width of about 180 pixels, and the image ranking display generation device 21 displays a thumbnail image, a ranking, and a point of an image with a desired ranking. Create parts using Flash, GIF, etc. In the blog part, you may make it display only the image of the desired ranking, the ranking, and the point, or, for example, images ranked 1 to 10 in a slide show format that transitions to an introduction screen of a different order after a certain period of time, Rankings and points may be displayed in order.

また、図8に示すブログパーツには、他ページへのリンクが張られたソフトボタン等が設けられている。例えば、「ランキングサイトへGO!」と書かれたソフトボタンには、図5に示すトップページへのリンクが張られており、「前へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ上の順位の紹介画面へのリンクが張られており、「次へ」と書かれたソフトボタンには、現在表示されている画像のランキングより1つ下の順位の紹介画面へのリンクが張られている。また、サムネイル画像には、図5に示すトップページへのリンクが張られている。   In addition, the blog part shown in FIG. 8 is provided with a soft button or the like with a link to another page. For example, the soft button labeled “Go to ranking site!” Has a link to the top page shown in FIG. 5, and the soft button labeled “Previous” is currently displayed. There is a link to the introduction screen that is one rank higher than the ranking of the current image, and the soft button labeled “Next” has a rank one lower than the ranking of the currently displayed image. There is a link to the introduction screen. Further, the thumbnail image has a link to the top page shown in FIG.

画像ランキング表示生成装置21は、生成したトップページ、画像詳細情報画面を表示装置22又はインターネット30へ出力する。また、画像ランキング表示生成装置21は、生成したモジュールをインターネット30へ出力する。   The image ranking display generation device 21 outputs the generated top page and image detailed information screen to the display device 22 or the Internet 30. In addition, the image ranking display generation device 21 outputs the generated module to the Internet 30.

本実施の形態によれば、クローリングによりインターネット上より画像を取得し、その画像のカウント数を算出することにより、インターネット上に多く掲載された画像、すなわち話題性があると考えられる画像を自動でランキング表示することができる。   According to the present embodiment, by acquiring an image from the Internet by crawling and calculating the number of counts of the image, an image that is frequently posted on the Internet, that is, an image that is considered to be topical is automatically acquired. Ranking can be displayed.

また、本実施の形態によれば、画像のハッシュ値を用いてインターネット上の画像をクローリングするため、同一画像を確実に検索することができる。また、取得した画像からハッシュ値を算出し、そのハッシュ値を用いて検索を行うため、ユーザがキーワード等を入力する必要が無く、使い勝手を良くすることができる。   In addition, according to the present embodiment, the image on the Internet is crawled using the hash value of the image, so that the same image can be reliably searched. Further, since a hash value is calculated from the acquired image and a search is performed using the hash value, the user does not need to input a keyword or the like, and usability can be improved.

なお、本実施の形態では、DB15にクローリングを行った日時と、そのときに取得した画像の詳細情報とを関連付けて保存したが、クローリングを行った日時を、ハッシュ値などと関連付けて第1画像情報テーブルに保存してもよい。この場合には、画像ハッシュ比較装置14で所望の期間別にハッシュ値の比較を行うことにより、所望の期間別のカウント数が格納された第2画像情報テーブルを期間別に複数作成することができる。したがって、画像ランキング表示生成装置21は、所望の期間別の画像ランキング表示画面を生成することができる。   In the present embodiment, the date and time when crawling is performed in the DB 15 and the detailed information of the image acquired at that time are stored in association with each other. However, the date and time when crawling is performed is associated with the hash value and the first image. It may be stored in an information table. In this case, by comparing the hash values for each desired period with the image hash comparison device 14, a plurality of second image information tables storing count numbers for each desired period can be created. Therefore, the image ranking display generation device 21 can generate an image ranking display screen for each desired period.

また、本実施の形態によれば、クローリングを行う度にカウント数の算出を行ったが、カウント数の算出をクローリングの度に行なうのではなく、必要に応じて行なうようにしてもよい。例えば、一定期間が経過したらカウント数を算出するようにしてもよいし、一定の数の第1画像情報が第1画像情報テーブルに登録されたらカウント数を算出するようにしてもよい。   Further, according to the present embodiment, the count number is calculated every time crawling is performed. However, the count number may be calculated as needed instead of being calculated every time crawling is performed. For example, the count number may be calculated when a certain period has elapsed, or the count number may be calculated when a certain number of first image information is registered in the first image information table.

<第2の実施の形態>
第1の実施の形態では、ハッシュ値を用いてインターネット上にある画像をクローリングしたが、検索対象となる画像が掲載されたURLを検索する検索情報として、ハッシュ値の代わりに、画像データから算出可能な様々な特徴量を用いることができる。
<Second Embodiment>
In the first embodiment, an image on the Internet is crawled using a hash value, but is calculated from image data instead of a hash value as search information for searching a URL where an image to be searched is posted. Various possible features can be used.

第2の実施の形態は、画像の図柄、色、明るさなどの画像固有の特徴を示す特徴量を算出し、その特徴量を用いて画像をクローリングするものである。以下、第2の実施の形態の画像ランキング装置2について説明する。なお、第1の実施の形態と同一の部分については、同一の符号を付し、詳細な説明を省略する。   In the second embodiment, a feature amount indicating an image-specific feature such as an image pattern, color, and brightness is calculated, and the image is crawled using the feature amount. Hereinafter, the image ranking apparatus 2 according to the second embodiment will be described. The same parts as those in the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.

図9は、特徴量を用いてインターネット上にある画像をクローリングする画像ランキング装置2の全体構造の概略図である。画像ランキング装置2は、主として、クローリング部10’と、ランキング部20とで構成される。クローリング部10’は、主として、クローリングエンジン11と、画像特徴量算出装置16と、サムネイル画像生成手段13と、データベース(DB)15と、画像特徴量比較装置17とで構成される。   FIG. 9 is a schematic diagram of the overall structure of the image ranking apparatus 2 that uses the feature amount to crawling an image on the Internet. The image ranking device 2 mainly includes a crawling unit 10 ′ and a ranking unit 20. The crawling unit 10 ′ is mainly composed of a crawling engine 11, an image feature amount calculation device 16, a thumbnail image generation unit 13, a database (DB) 15, and an image feature amount comparison device 17.

画像特徴量算出装置16は、クローリングエンジン11から入力された画像の特徴量を算出する。特徴量とは、画像の図柄、色、明るさなどの画像固有の特徴を表す値であり、例えば多次元のベクトルで与えられる。画像特徴量算出装置16は、例えば、画像を4つに分割したときの左上の領域(領域1)、左下の領域(領域2)、右上の領域(領域3)及び右下の領域(領域4)と、画像の中心部の領域(領域5)との5個の領域の色(例えばY成分)の平均値を算出し、領域1、領域2、領域3、領域4及び領域5の色の平均値を用いた5次元のベクトルを特徴量として算出する。   The image feature amount calculation device 16 calculates the feature amount of the image input from the crawling engine 11. The feature amount is a value representing image-specific features such as image design, color, and brightness, and is given as, for example, a multidimensional vector. For example, the image feature amount calculation device 16 has an upper left area (area 1), a lower left area (area 2), an upper right area (area 3), and a lower right area (area 4) when the image is divided into four. ) And the average value of the colors (for example, Y component) of the five areas of the central area (area 5) of the image, and the colors of the areas 1, 2, 3, 4, and 5 are calculated. A five-dimensional vector using the average value is calculated as a feature amount.

これにより、画像の図柄、色、明るさなどが同一、又はユーザから見て区別がつかない程度に図柄、色、明るさなどが異なる画像(類似画像)であれば、同一又は略同一(±1桁程度の多少の誤差を有する)の特徴量を算出することができる。すなわち、画像の拡大、縮小や、保存の形式(例えばjpeg形式からbmp形式)の変更などの処理が行われていたとしても、ユーザから見て区別がつかないのであれば、同一又は略同一の特徴量を算出することができる。   As a result, if images (similar images) having the same design, color, brightness, etc., or different in design, color, brightness, etc. are indistinguishable from the user's perspective, they are the same or substantially the same (± Feature quantity (with a slight error of about one digit) can be calculated. That is, even if processing such as enlargement / reduction of an image or change of a storage format (for example, jpeg format to bmp format) is performed, the same or substantially the same if it cannot be distinguished from the user A feature amount can be calculated.

画像特徴量比較装置17は、画像特徴量算出装置16から出力された特徴量とDB15に保存された第1画像情報テーブルとを比較し、カウント数を算出する。画像特徴量比較装置17でカウント数を算出する処理については、後に詳述する。   The image feature amount comparison device 17 compares the feature amount output from the image feature amount calculation device 16 with the first image information table stored in the DB 15 and calculates the count number. The process of calculating the count number by the image feature amount comparison device 17 will be described in detail later.

このように構成された画像ランキング装置2の作用について説明する。ランキング部20の作用については第1の実施の形態と同一であるため、クローリング部10’の作用について説明する。図10は、クローリング部10’で行う処理の流れを示すフローチャートである。   The operation of the image ranking device 2 configured as described above will be described. Since the operation of the ranking unit 20 is the same as that of the first embodiment, the operation of the crawling unit 10 'will be described. FIG. 10 is a flowchart showing a flow of processing performed by the crawling unit 10 '.

クローリングエンジン11は、インターネット30上にある画像と、その画像が掲載されているウェブページURLと、サイトURLと、画像URLとを取得する(ステップS1)。   The crawling engine 11 acquires an image on the Internet 30, a web page URL where the image is posted, a site URL, and an image URL (step S1).

画像特徴量算出装置16は、ステップS1で取得された画像の特徴量を算出し(ステップS12)、サムネイル画像生成手段13は、ステップS1で取得された画像のサムネイル画像を生成する(ステップS3)。ステップS12で算出された特徴量及びステップS3で生成されたサムネイル画像は、クローリングエンジン11に入力される。   The image feature quantity calculation device 16 calculates the feature quantity of the image acquired in step S1 (step S12), and the thumbnail image generation means 13 generates a thumbnail image of the image acquired in step S1 (step S3). . The feature amount calculated in step S12 and the thumbnail image generated in step S3 are input to the crawling engine 11.

クローリングエンジン11は、ステップS1で取得されたウェブページURL、サイトURL、及び画像URLと、ステップS12で算出された特徴量と、ステップS3で生成されたサムネイル画像とを組にしてDB15の第1画像情報テーブルに登録する(ステップS13)。これにより、第1画像情報テーブルには、ウェブページURLと、画像URLと、サイトURLと、特徴量と、画像のサムネイル画像とが関連付けて保存される。   The crawling engine 11 sets the first page of the DB 15 by combining the web page URL, site URL, and image URL acquired in step S1, the feature amount calculated in step S12, and the thumbnail image generated in step S3. Register in the image information table (step S13). As a result, the web page URL, the image URL, the site URL, the feature amount, and the thumbnail image of the image are stored in the first image information table in association with each other.

クローリングエンジン11は、クローリングが終了したかどうかを判断する(ステップS5)。クローリングが終了した場合(ステップS5でYES)には、処理を終了する。   The crawling engine 11 determines whether crawling has been completed (step S5). If crawling has ended (YES in step S5), the process ends.

クローリングが終了していない場合(ステップS5でNO)には、クローリングエンジン11は、ステップS12で算出された特徴量及びサイトURLと、第1画像情報テーブルに保存された特徴量及びサイトURLとを比較し(ステップS14)、ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されているかどうかを判断する(ステップS15)。   If crawling has not ended (NO in step S5), the crawling engine 11 uses the feature amount and site URL calculated in step S12 and the feature amount and site URL stored in the first image information table. The comparison is performed (step S14), and it is determined whether or not the first image information in which the same feature amount and site URL as the feature amount and site URL calculated in step S12 are combined is already stored in the first image information table (step S14). Step S15).

ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が既に第1画像情報テーブルに保存されている(ステップS15でYES)場合には、特徴量のカウント処理(ステップS16〜S11)は行わず、ステップS1へ戻り再度クローリング処理(ステップS1〜S15)を行う。ここで、特徴量のみでなくサイトURLを比較するのは、第1の実施の形態と同様、巨大なサイトで同じ画像が使いまわされているケースや、ページの表記の違いで複数カウントされる事等を防ぐためである。   If the first image information in which the same feature quantity and site URL as the feature quantity and site URL calculated in step S12 are combined is already stored in the first image information table (YES in step S15), the feature quantity The counting process (steps S16 to S11) is not performed, and the process returns to step S1 and the crawling process (steps S1 to S15) is performed again. Here, not only the feature amount but also the site URL is compared, as in the first embodiment, a case where the same image is reused in a huge site or a difference in page notation is counted. This is to prevent things.

ステップS12で算出された特徴量及びサイトURLと同じ特徴量及びサイトURLが組み合わされた第1画像情報が第1画像情報テーブルに保存されていない(ステップS15でNO)場合には、特徴量のカウント処理(ステップS16〜S19)へ進む。   If the first image information in which the same feature amount and site URL as the feature amount and site URL calculated in step S12 are combined is not stored in the first image information table (NO in step S15), the feature amount The process proceeds to the count process (steps S16 to S19).

画像特徴量比較装置17は、ステップS12で算出された特徴量と、第2画像情報テーブルに保存された特徴量とを比較し(ステップS16)、ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されているかどうかを判断する(ステップS17)。この時、±1桁程度の多少の誤差を許容し、略同一の特徴量についても同一の特徴量として取り扱うようにしてもよい。これにより、拡大・縮小などの加工が行われたがユーザから見て元の画像と区別がつかないような類似画像を、同一の画像としてカウントすることができる。   The image feature quantity comparison device 17 compares the feature quantity calculated in step S12 with the feature quantity stored in the second image information table (step S16), and the same feature quantity as the feature quantity calculated in step S12. Is stored in the second image information table (step S17). At this time, a slight error of about ± 1 digit is allowed, and approximately the same feature amount may be handled as the same feature amount. As a result, similar images that have been processed such as enlargement / reduction, but are indistinguishable from the original image when viewed from the user, can be counted as the same image.

ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されている(ステップS17でYES)場合には、画像特徴量比較装置17は、第2画像情報テーブルの当該特徴量と関連付けられたカウント数に1を追加する(ステップS18)。   When the same feature quantity as that calculated in step S12 is stored in the second image information table (YES in step S17), the image feature quantity comparison device 17 performs the feature quantity in the second image information table. 1 is added to the count number associated with (step S18).

ステップS12で算出された特徴量と同じ特徴量が第2画像情報テーブルに保存されていない(ステップS17でNO)場合には、画像特徴量比較装置17は、当該特徴量をカウント数1と関連付けて第2画像情報テーブルに保存する(ステップS19)。   If the same feature quantity calculated in step S12 is not stored in the second image information table (NO in step S17), the image feature quantity comparison device 17 associates the feature quantity with the count number 1. Is stored in the second image information table (step S19).

特徴量のカウント処理(ステップS16〜S19)が終了したら、ステップS1へ戻り再度クローリング処理(ステップS1〜S15)を行う。   When the feature amount counting process (steps S16 to S19) ends, the process returns to step S1 and the crawling process (steps S1 to S15) is performed again.

これにより、クローリング部10’は、第1画像情報テーブル及び第2画像情報テーブルを継続的に更新し続け、第1画像情報テーブル及び第2画像情報テーブル常に最新の状態に保つことができる。   Thereby, the crawling unit 10 ′ can continuously update the first image information table and the second image information table, and can always keep the first image information table and the second image information table in the latest state.

本実施の形態によれば、完全一致する画像のみでなく、元画像が拡大又は縮小された画像、解像度を落として保存しなおされた画像、異なる形式で保存された画像などについても、一致する画像と判別できるため、画像ランキングの精度を上げることができる。   According to the present embodiment, not only a completely matched image, but also an image in which the original image is enlarged or reduced, an image re-saved at a reduced resolution, an image saved in a different format, and the like are matched. Since it can be distinguished from an image, the accuracy of image ranking can be increased.

ところで、本発明では、自動的に画像を収集しランキングを行うため、アダルト画像などの有害画像が画像ランキング表示用の画面に表示される虞がある。このような虞を回避するための手法として、以下に示す方法が考えられる。   By the way, in the present invention, since images are automatically collected and ranked, harmful images such as adult images may be displayed on the image ranking display screen. As a technique for avoiding such a concern, the following method can be considered.

(1)フィルタリングソフト形式(クライアントサイド)
画像ランキング装置に予めフィルタリングソフトをダウンロードしておいた上で、画像ランキング表示用の画面の表示を行う方法である。これにより、図5〜図8に示すような画像ランキング表示用の画面において、有害画像の部分のみを閲覧できないようにすることができる。
(1) Filtering software format (client side)
This is a method of displaying a screen for image ranking display after filtering software is downloaded in advance to the image ranking apparatus. Thereby, it is possible to prevent browsing of only the harmful image portions on the image ranking display screens as shown in FIGS.

(2)フィルタリングソフト方式(プロバイダ依存)
クローリングエンジン11が有害画像排除に対応したプロバイダを経由してクローリングを行う方法である。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(2) Filtering software method (provided by provider)
In this method, the crawling engine 11 performs crawling via a provider corresponding to harmful image elimination. Thereby, the first image information table and the second image information table excluding the harmful image can be generated. Accordingly, the ranking without the harmful images is displayed on the image ranking display screen.

(3)ホワイトリスト方式(サーバサイド)
予めクローリングの対象とするホストを限定してしまう方法である。クローリングの対象となるホストがクローリングエンジン11に登録されており、クローリングエンジン11は登録されたホストのみクローリングを行う。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(3) White list method (server side)
This is a method of previously limiting the hosts to be crawled. A host to be crawled is registered in the crawling engine 11, and the crawling engine 11 performs crawling only on the registered host. Thereby, the first image information table and the second image information table excluding the harmful image can be generated. Accordingly, the ranking without the harmful images is displayed on the image ranking display screen.

(4)ブラックリスト方式(サーバサイド)
警察が公開しているブラックリストにしたがって、有害サイトをクローリングの対象から外す方法である。クローリングの対象から外すサイトがクローリングエンジン11に登録されており、クローリングエンジン11は登録されたサイトについてはクローリングを行わない。これにより、有害画像を除外した第1画像情報テーブル、第2画像情報テーブルを生成することができる。したがって、画像ランキング表示用の画面には、有害画像が省かれたランキングが表示される。
(4) Blacklist method (server side)
This is a method to remove harmful sites from crawling according to the black list published by the police. A site to be excluded from the crawling target is registered in the crawling engine 11, and the crawling engine 11 does not perform crawling on the registered site. Thereby, the first image information table and the second image information table excluding the harmful image can be generated. Accordingly, the ranking without the harmful images is displayed on the image ranking display screen.

本発明は、静止画のみではなく、動画にも適用することができるし、音楽などの画像以外の各種コンテンツにも適用することができる。   The present invention can be applied not only to still images but also to moving images, and also to various contents other than images such as music.

また、本発明は、クローリング部、ランキング部が含まれた装置として提供してもよいし、2つ以上の装置からなるシステムとして提供してもよい。また、装置は、PCでもよいし、携帯端末でもよい。また、装置に限らず、装置に適用するプログラムとして提供することもできる。   The present invention may be provided as a device including a crawling unit and a ranking unit, or may be provided as a system including two or more devices. The apparatus may be a PC or a mobile terminal. Further, the present invention is not limited to the device, and can be provided as a program applied to the device.

本発明の第1の実施の形態の画像ランキング装置1の概略図である。It is the schematic of the image ranking apparatus 1 of the 1st Embodiment of this invention. 画像ランキング装置1の第1画像情報テーブルのデータ構造の一例である。It is an example of the data structure of the 1st image information table of the image ranking apparatus 1. FIG. 画像ランキング装置1の第2画像情報テーブルのデータ構造の一例である。It is an example of the data structure of the 2nd image information table of the image ranking apparatus. 画像ランキング装置1のクローリング部10の処理の流れを示すフローチャートである。4 is a flowchart showing a process flow of a crawling unit 10 of the image ranking device 1. 画像ランキング装置1の画像ランキング表示用の画面の一例である。3 is an example of an image ranking display screen of the image ranking device 1. 画像ランキング装置1の画像ランキング表示用の画面の一例である。3 is an example of an image ranking display screen of the image ranking device 1. 画像ランキング装置1の画像ランキング表示用の画面の一例である。3 is an example of an image ranking display screen of the image ranking device 1. 画像ランキング装置1の画像ランキング表示用の画面の一例である。3 is an example of an image ranking display screen of the image ranking device 1. 本発明の第2の実施の形態の画像ランキング装置2の概略図である。It is the schematic of the image ranking apparatus 2 of the 2nd Embodiment of this invention. 画像ランキング装置2のクローリング部10’の処理の流れを示すフローチャートである。4 is a flowchart illustrating a processing flow of a crawling unit 10 ′ of the image ranking device 2.

符号の説明Explanation of symbols

1、2:画像ランキング装置、10、10’:クローリング部、11:クローリングエンジン、12:画像ハッシュ算出装置、13:サムネイル画像生成手段、14:画像ハッシュ比較装置、15:データベース(DB)、:20:ランキング部、21:画像ランキング表示生成装置、22:表示装置、30:インターネット 1, 2: Image ranking device, 10, 10 ′: Crawling unit, 11: Crawling engine, 12: Image hash calculation device, 13: Thumbnail image generation means, 14: Image hash comparison device, 15: Database (DB), 20: Ranking unit, 21: Image ranking display generation device, 22: Display device, 30: Internet

Claims (10)

インターネット上から画像を収集するクローリング手段と、
前記クローリング手段により取得された画像のサムネイル画像を生成するサムネイル画像生成手段と、
前記クローリング手段により収集された画像から該画像の識別情報を算出する識別情報算出手段と、
前記クローリング手段により収集された各画像毎に前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録する第1の画像情報登録手段と、
前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成する第2の画像情報テーブル作成手段と、
前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するランキング表示画面出力手段と、
を備えたことを特徴とする画像ランキング装置。
A crawling means for collecting images from the Internet;
Thumbnail image generating means for generating a thumbnail image of the image acquired by the crawling means;
Identification information calculating means for calculating identification information of the image from the image collected by the crawling means;
First image information in which a thumbnail image generated from the image for each image collected by the crawling means and identification information calculated from the image are associated is registered in a first image information table. 1 image information registration means;
Based on the first image information registered in the first image information table, a second image information table is created in which the identification information of the image is associated with the registration number for each identification information. Image information table creation means,
The identification information is extracted from the second image information table in the descending order of the number of registrations, the thumbnail image of the image corresponding to the extracted identification information is extracted from the first image information table, and the extracted thumbnails are extracted. A ranking display screen output means for outputting a ranking display screen that includes an image and outputs a ranking display screen indicating an order of the images having a large number of registrations;
An image ranking apparatus comprising:
前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURL、ウェブページURL、及び画像URLのうちの少なくとも1つのURLを収集し、
前記第1の画像情報登録手段は、前記画像に対応して収集されたURLと、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記ランキング表示画面出力手段は、前記第1の画像情報テーブルから前記登録数の多い画像のサムネイル画像及びURLを抽出し、前記抽出したサムネイル画像と前記URLのリンクボタンとを含むランキング表示画面を出力することを特徴とする請求項1に記載の画像ランキング装置。
The crawling means collects, together with the image, at least one URL of a site URL, a web page URL, and an image URL where the image is posted,
The first image information registration unit includes first image information in which a URL collected corresponding to the image, a thumbnail image generated from the image, and identification information calculated from the image are associated with each other. Is registered in the first image information table,
The ranking display screen output means extracts thumbnail images and URLs of the registered images from the first image information table, and outputs a ranking display screen including the extracted thumbnail images and URL link buttons. The image ranking apparatus according to claim 1, wherein:
前記識別情報算出手段により算出された識別情報が前記第1の画像情報に保存されているかどうかを判断する判断手段と、
前記判断手段により前記識別情報が前記第1の画像情報に保存されていると判断された場合には、現在のカウント数に1を加えた数を新たなカウント数とし、前記判断手段により前記識別情報が前記第1の画像情報に保存されていないと判断された場合には、カウント数を1とするカウント数算出手段と、を備え、
前記第2の画像情報テーブル作成手段は、前記カウント数算出手段により算出されたカウント数を前記登録数とすることを特徴とする請求項1又は2に記載の画像ランキング装置。
Determination means for determining whether or not the identification information calculated by the identification information calculation means is stored in the first image information;
When the determination means determines that the identification information is stored in the first image information, a number obtained by adding 1 to the current count number is set as a new count number, and the determination means determines the identification information. If it is determined that the information is not stored in the first image information, a count number calculating means for setting the count number to 1,
3. The image ranking apparatus according to claim 1, wherein the second image information table creation unit uses the count number calculated by the count number calculation unit as the registration number. 4.
前記クローリング手段は、前記画像とともに、該画像が掲載されたサイトURLを収集し、
前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が掲載されたサイトURLとが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記判断手段は、同一の識別情報に同一のサイトURLが関連付けられている組み合わせが前記第1の画像情報に複数保存されているか否かを判断し、
前記カウント数算出手段は、前記判断手段により同一の識別情報と同一のサイトURLとの組み合わせが前記第1の画像情報に複数保存されていると判断された場合には、前記複数保存された同一の識別情報と同一のサイトURLとの組み合わせを1としてカウント数を算出することを特徴とする請求項3に記載の画像ランキング装置。
The crawling means collects a site URL where the image is posted together with the image,
The first image information registration means obtains first image information in which a thumbnail image generated from the image, identification information calculated from the image, and a site URL where the image is posted are associated with each other. Registered in the image information table of 1,
The determination means determines whether or not a plurality of combinations in which the same site URL is associated with the same identification information are stored in the first image information,
When the determination unit determines that a plurality of combinations of the same identification information and the same site URL are stored in the first image information, the count number calculation unit stores the plurality of the same stored information. The image ranking apparatus according to claim 3, wherein the count number is calculated by setting a combination of the identification information of the URL and the same site URL as 1.
前記クローリング手段は、前記画像とともに、該画像が収集された日時情報を取得し、
前記第1の画像情報登録手段は、前記画像から生成されたサムネイル画像と、前記画像から算出された識別情報と、前記画像が収集された日時情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録し、
前記第2の画像情報テーブル作成手段は、前記日時情報に基づいて、所定の期間内に前記クローリング手段が収集した画像に対して前記第2の画像情報テーブルを作成することを特徴とする請求項1から4のいずれかに記載の画像ランキング装置。
The crawling means acquires the date and time information when the image was collected together with the image,
The first image information registration means obtains first image information in which a thumbnail image generated from the image, identification information calculated from the image, and date / time information when the image is collected are associated with each other. Registered in the image information table of 1,
The second image information table creating unit creates the second image information table for images collected by the crawling unit within a predetermined period based on the date and time information. The image ranking apparatus according to any one of 1 to 4.
前記ランキング表示出力手段は、前記ランキング表示画面と共に、該ランキング表示画面へのリンクボタンと、前記ランキング表示画面に含まれるサムネイル画像とを含むモジュールを出力することを特徴とする請求項1から5のいずれかに記載の画像ランキング装置。   6. The ranking display output means outputs a module including a link button to the ranking display screen and a thumbnail image included in the ranking display screen together with the ranking display screen. The image ranking apparatus according to any one of the above. 前記識別情報は、前記画像に対してハッシュ関数を適用することにより算出されたハッシュ値であることを特徴とする請求項1から6のいずれかに記載の画像ランキング装置。   The image ranking apparatus according to claim 1, wherein the identification information is a hash value calculated by applying a hash function to the image. 前記識別情報は、前記画像固有の特徴を示す特徴量であることを特徴とする請求項1から6のいずれかに記載の画像ランキング装置。   The image ranking apparatus according to claim 1, wherein the identification information is a feature amount indicating a characteristic unique to the image. インターネット上から画像を収集するステップと、
前記取得された画像のサムネイル画像を生成するステップと、
前記収集された画像から該画像の識別情報を算出するステップと、
前記収集された各画像毎に該画像から生成されたサムネイル画像と、前記画像から算出された識別情報とが関連付けられた第1の画像情報を第1の画像情報テーブルに登録するステップと、
前記第1の画像情報テーブルに登録された第1の画像情報に基づいて、前記画像の識別情報と、各識別情報毎の登録数とが関連付けられた第2の画像情報テーブルを作成するステップと、
前記第2の画像情報テーブルから前記登録数の多い順番に識別情報を抽出するとともに、前記第1の画像情報テーブルから前記抽出した識別情報に対応する画像のサムネイル画像を抽出し、該抽出したサムネイル画像を含むランキング表示画面であって、前記登録数の多い画像の順番を示すランキング表示画面を出力するステップと、
を含むことを特徴とする画像ランキング方法。
Collecting images from the internet;
Generating a thumbnail image of the acquired image;
Calculating identification information of the image from the collected image;
Registering, in the first image information table, first image information in which a thumbnail image generated from the image for each collected image is associated with identification information calculated from the image;
Creating a second image information table in which the identification information of the image and the number of registrations for each identification information are associated with each other based on the first image information registered in the first image information table; ,
The identification information is extracted from the second image information table in the descending order of the number of registrations, the thumbnail image of the image corresponding to the extracted identification information is extracted from the first image information table, and the extracted thumbnails are extracted. A ranking display screen including images, the step of outputting a ranking display screen indicating the order of the images with a large number of registrations;
An image ranking method comprising:
請求項9に記載の画像ランキング方法を演算装置に実行させることを特徴とするプログラム。   A program causing an arithmetic device to execute the image ranking method according to claim 9.
JP2008198328A 2008-07-31 2008-07-31 Apparatus and method for image ranking, and program Pending JP2010039533A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008198328A JP2010039533A (en) 2008-07-31 2008-07-31 Apparatus and method for image ranking, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008198328A JP2010039533A (en) 2008-07-31 2008-07-31 Apparatus and method for image ranking, and program

Publications (1)

Publication Number Publication Date
JP2010039533A true JP2010039533A (en) 2010-02-18

Family

ID=42012057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008198328A Pending JP2010039533A (en) 2008-07-31 2008-07-31 Apparatus and method for image ranking, and program

Country Status (1)

Country Link
JP (1) JP2010039533A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011105608A1 (en) * 2010-02-26 2011-09-01 楽天株式会社 Information processing device, information processing method, and recording medium that has recorded information processing program
EP2363731A1 (en) 2010-02-25 2011-09-07 Hitachi Ltd. Location estimation system
US9426507B2 (en) 2012-02-09 2016-08-23 Panasonic Intellectual Property Management Co., Ltd. Information recommendation device, information recommendation system, and information recommendation method
CN107679085A (en) * 2017-09-01 2018-02-09 广州大学 Data grabber algorithm based on search and spiders
JP2018532198A (en) * 2015-10-12 2018-11-01 コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ Method and device for detecting a copy in a stream of visual data

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2363731A1 (en) 2010-02-25 2011-09-07 Hitachi Ltd. Location estimation system
WO2011105608A1 (en) * 2010-02-26 2011-09-01 楽天株式会社 Information processing device, information processing method, and recording medium that has recorded information processing program
WO2011105607A1 (en) * 2010-02-26 2011-09-01 楽天株式会社 Information processing device, information processing method, and recording medium that has recorded information processing program
JP5075291B2 (en) * 2010-02-26 2012-11-21 楽天株式会社 Information processing apparatus, information processing method, and recording medium recording information processing program
JP5259876B2 (en) * 2010-02-26 2013-08-07 楽天株式会社 Information processing apparatus, information processing method, and recording medium recording information processing program
US8825670B2 (en) 2010-02-26 2014-09-02 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
US8949267B2 (en) 2010-02-26 2015-02-03 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
US9426507B2 (en) 2012-02-09 2016-08-23 Panasonic Intellectual Property Management Co., Ltd. Information recommendation device, information recommendation system, and information recommendation method
JP2018532198A (en) * 2015-10-12 2018-11-01 コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ Method and device for detecting a copy in a stream of visual data
CN107679085A (en) * 2017-09-01 2018-02-09 广州大学 Data grabber algorithm based on search and spiders

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
JP6423845B2 (en) Method and system for dynamically ranking images to be matched with content in response to a search query
JP5501373B2 (en) System and method for collecting and ranking data from multiple websites
US7555478B2 (en) Search results presented as visually illustrative concepts
US8862574B2 (en) Providing a search-result filters toolbar
US8812500B2 (en) System and method of displaying related sites
JP2017157192A (en) Method of matching between image and content item based on key word
US20150242401A1 (en) Network searching method and network searching system
JP6363682B2 (en) Method for selecting an image that matches content based on the metadata of the image and content
CN109716327A (en) The video capture frame of visual search platform
JP2008508605A5 (en)
US20130263044A1 (en) Method and system to provide a scroll map
WO2014029173A1 (en) Method, apparatus and device for sequencing search results
US20160314348A1 (en) Mathematical formula learner support system
JP2007334502A (en) Retrieving device, method, and program
US20210248202A1 (en) System and method for improved searching across multiple databases
WO2016094101A1 (en) Webpage content storage and review
US8788521B2 (en) Information processing device, information processing method, program for information processing device, and recording medium
JP2010039533A (en) Apparatus and method for image ranking, and program
JP6419969B2 (en) Method and apparatus for providing image presentation information
EP2638484B1 (en) Dynamic image result stitching
JP2015011460A (en) Electronic equipment including dictionary function, program and dictionary search system
JP5416253B2 (en) Related content search apparatus and related content search method
JP5466133B2 (en) Document search apparatus with image and document search program with image
JP2009187401A5 (en)