JP6696344B2 - Information processing device and program - Google Patents

Information processing device and program Download PDF

Info

Publication number
JP6696344B2
JP6696344B2 JP2016150364A JP2016150364A JP6696344B2 JP 6696344 B2 JP6696344 B2 JP 6696344B2 JP 2016150364 A JP2016150364 A JP 2016150364A JP 2016150364 A JP2016150364 A JP 2016150364A JP 6696344 B2 JP6696344 B2 JP 6696344B2
Authority
JP
Japan
Prior art keywords
image
target image
phrase
target
keyword candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016150364A
Other languages
Japanese (ja)
Other versions
JP2018018428A (en
Inventor
真人 藤垣
真人 藤垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016150364A priority Critical patent/JP6696344B2/en
Publication of JP2018018428A publication Critical patent/JP2018018428A/en
Application granted granted Critical
Publication of JP6696344B2 publication Critical patent/JP6696344B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置及びプログラムに関する。   The present invention relates to an information processing device and a program.

画像の内容を表現する画像属性情報(例えばキーワードやタグ情報)を自動的に画像に付与する技術が知られている。   A technique is known in which image attribute information (for example, keyword or tag information) representing the content of an image is automatically added to the image.

特許文献1に記載のシステムにおいては、キーワード付与対象画像の特徴と似た特徴を有する画像を含むhtmlページが検索され、そのhtmlページに記述されている名詞群が抽出される。名詞群の中で出現頻度の高い名詞がキーワード候補として提供される。   In the system described in Patent Document 1, an html page including an image having a feature similar to the feature of the keyword addition target image is searched, and the noun group described in the html page is extracted. Nouns that appear frequently in the noun group are provided as keyword candidates.

特開2011−54006号公報JP, 2011-54006, A

ところで、画像属性情報の付与対象となる画像(対象画像)に類似する画像の検索を用いて抽出された語句を、対象画像の画像属性情報候補として特定すると、当該語句の対象画像に対する画像属性情報としてのふさわしさを評価することがないため、対象画像を表現するのにふさわしくない語句が画像属性情報候補として特定されてしまう場合がある。   By the way, when a word or phrase extracted by searching for an image similar to the image to which the image attribute information is given (target image) is specified as an image attribute information candidate of the target image, the image attribute information for the target image of the word or phrase is specified. Therefore, there is a case where a word / phrase that is not suitable for expressing the target image is specified as the image attribute information candidate because it is not evaluated.

本発明の目的は、対象画像に類似する画像の検索を用いて抽出された語句を、対象画像の画像属性情報候補として特定する場合と比較して、対象画像を表現するのによりふさわしい語句を画像属性情報候補として特定することにある。   An object of the present invention is to compare words extracted using a search for an image similar to the target image with a case in which the words are more suitable for expressing the target image than in the case of specifying them as image attribute information candidates of the target image. It is to specify as an attribute information candidate.

請求項1に係る発明は、対象画像に類似する第1画像が含まれる抽出対象データに出現する語句を抽出する抽出手段と、前記抽出された語句を用いて第2画像を検索する画像検索手段と、前記対象画像に類似する第2画像の検索に用いられた語句を、前記対象画像の画像属性情報候補として特定する第1特定手段と、を有する情報処理装置である。   The invention according to claim 1 is an extraction unit that extracts a word or phrase that appears in extraction target data that includes a first image similar to the target image, and an image search unit that searches the second image using the extracted word or phrase. And a first specifying unit that specifies, as an image attribute information candidate of the target image, a phrase used to search for a second image similar to the target image.

請求項2に係る発明は、前記第1特定手段は、前記画像属性情報候補に関連する語句を前記対象画像の新たな画像属性情報候補として更に特定する、ことを特徴とする請求項1に記載の情報処理装置である。   The invention according to claim 2 is characterized in that the first specifying means further specifies a word or phrase related to the image attribute information candidate as a new image attribute information candidate of the target image. Information processing device.

請求項3に係る発明は、前記画像属性情報候補に関連する語句は、類義語群を定義する類義語辞書情報から抽出された、前記画像属性情報候補の類義語である、ことを特徴とする請求項2に記載の情報処理装置である。   The invention according to claim 3 is characterized in that the word or phrase related to the image attribute information candidate is a synonym of the image attribute information candidate extracted from synonym dictionary information defining a synonym group. The information processing device described in 1.

請求項4に係る発明は、複数の対象画像がある場合、前記抽出手段は、対象画像毎に語句を抽出し、前記画像検索手段は、前記複数の対象画像について抽出された語句群のうち共通する語句についてはまとめて前記第2画像を検索する、ことを特徴とする請求項1から請求項3のいずれか一項に記載の情報処理装置である。   In the invention according to claim 4, when there are a plurality of target images, the extraction unit extracts a word or phrase for each target image, and the image search unit is common among the word or phrase groups extracted for the plurality of target images. The information processing apparatus according to any one of claims 1 to 3, wherein the second image is searched collectively for words and phrases to be performed.

請求項5に係る発明は、前記複数の対象画像は、各対象画像が有する印象に従って、互いに異なる印象を有する複数のグループに分類されており、前記画像検索手段は、前記グループ毎に、同一の前記グループに属する対象画像群について抽出された語句群のうち共通する語句についてはまとめて前記第2画像を検索し、当該情報処理装置は、前記グループ毎に、前記第2画像を用いて特定された前記画像属性情報候補であって、同一の前記グループに属する前記対象画像群に共通する前記画像属性情報候補を、同一の前記グループに属する前記対象画像群についての共通属性情報候補として特定する第2特定手段を更に有する、ことを特徴とする請求項4に記載の情報処理装置である。   In the invention according to claim 5, the plurality of target images are classified into a plurality of groups having different impressions according to the impressions of the respective target images, and the image search means is the same for each group. The second image is searched collectively for common words / phrases in the word / phrase group extracted for the target image group belonging to the group, and the information processing device is specified for each group using the second image. Identifying the image attribute information candidates that are common to the target image groups that belong to the same group as the common attribute information candidates for the target image groups that belong to the same group. The information processing apparatus according to claim 4, further comprising two specifying means.

請求項6に係る発明は、前記第1特定手段は、前記対象画像との間の類似度が予め設定された閾値以上となる前記第2画像の検索に用いられた語句を、前記対象画像の前記画像属性情報候補として特定する、ことを特徴とする請求項1から請求項5のいずれか一項に記載の情報処理装置である。   According to a sixth aspect of the present invention, the first specifying unit determines that the word or phrase used in the search for the second image whose similarity to the target image is equal to or more than a preset threshold value is the target image. The information processing device according to any one of claims 1 to 5, wherein the information processing device is specified as the image attribute information candidate.

請求項7に係る発明は、前記画像属性情報候補を表示手段に表示させる制御手段を更に有する、ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置である。   The invention according to claim 7 is the information processing apparatus according to any one of claims 1 to 6, further comprising control means for displaying the image attribute information candidates on a display means. ..

請求項8に係る発明は、コンピュータを、対象画像に類似する第1画像が含まれる抽出対象データに出現する語句を抽出する抽出手段、前記抽出された語句を用いて第2画像を検索する画像検索手段、前記対象画像に類似する第2画像の検索に用いられた語句を、前記対象画像の画像属性情報候補として特定する特定手段、として機能させるプログラムである。   According to an eighth aspect of the present invention, a computer is used to extract a word or phrase that appears in extraction target data that includes a first image similar to the target image, and an image to search for a second image using the extracted word or phrase. It is a program that functions as a searching unit and a specifying unit that specifies a word or phrase used for searching a second image similar to the target image as an image attribute information candidate of the target image.

請求項1,2,3,6,7,8に係る発明によると、対象画像に類似する画像の検索を用いて抽出された語句を、対象画像の画像属性情報候補として特定する場合と比較して、対象画像を表現するのによりふさわしい語句が画像属性情報候補として特定される。   According to the inventions according to claims 1, 2, 3, 6, 7, and 8, comparison is made with a case where a word or phrase extracted by using a search for an image similar to the target image is specified as an image attribute information candidate of the target image. Then, a word more suitable for expressing the target image is specified as the image attribute information candidate.

請求項4に係る発明によると、個々の対象画像について抽出された語句について個別的に第2画像を検索する場合と比較して、第2画像の検索の効率が向上する。   According to the invention of claim 4, the efficiency of searching the second image is improved as compared with the case where the second image is individually searched for the words and phrases extracted for each target image.

請求項5に係る発明によると、対象画像に類似する画像の検索を用いて抽出された語句を、対象画像が属するグループの共通属性情報候補として特定する場合と比較して、グループを表現するのによりふさわしい語句が共通属性情報候補として特定される。   According to the fifth aspect of the invention, the group is expressed in comparison with the case where the word / phrase extracted using the search for the image similar to the target image is specified as the common attribute information candidate of the group to which the target image belongs. Therefore, a suitable word is specified as a common attribute information candidate.

本発明の第1実施形態に係るキーワード付与システムを示すブロック図である。It is a block diagram which shows the keyword provision system which concerns on 1st Embodiment of this invention. 第1実施形態に係るキーワード候補選定装置を示すブロック図である。It is a block diagram which shows the keyword candidate selection apparatus which concerns on 1st Embodiment. 端末装置を示すブロック図である。It is a block diagram which shows a terminal device. 対象画像の一例を示す図である。It is a figure which shows an example of a target image. ウェブページ(htmlページ)の一例を示す図である。It is a figure which shows an example of a web page (html page). 一次キーワード候補リストの一例を示す図である。It is a figure which shows an example of a primary keyword candidate list. 検索結果画像と最終キーワード候補の一例を示す図である。It is a figure which shows an example of a search result image and a final keyword candidate. 第1実施形態に係るキーワード候補選定装置による処理を示すフローチャートである。It is a flow chart which shows processing by a keyword candidate selection device concerning a 1st embodiment. 第2実施形態に係るキーワード候補選定装置を示すブロック図である。It is a block diagram which shows the keyword candidate selection apparatus which concerns on 2nd Embodiment. 対象画像、一次キーワード候補及び検索結果画像の対応関係の一例を示す図である。It is a figure which shows an example of the correspondence of a target image, a primary keyword candidate, and a search result image. 第4実施形態に係るキーワード候補選定装置を示すブロック図である。It is a block diagram which shows the keyword candidate selection apparatus which concerns on 4th Embodiment. 対象画像とグループの一例を示す図である。It is a figure which shows an example of a target image and a group. 対象画像、一次キーワード候補及び検索結果画像の対応関係の一例を示す図である。It is a figure which shows an example of the correspondence of a target image, a primary keyword candidate, and a search result image.

[第1実施形態]
以下、本発明の第1実施形態について説明する。図1には、本発明の第1実施形態に係る情報処理システムとしてのキーワード付与システムの一例が示されている。このシステムは、一例として、情報処理装置としてのキーワード候補選定装置10と、1又は複数の端末装置12と、1又は複数のウェブサーバ14と、を含む。キーワード候補選定装置10と端末装置12は、例えば、インターネットやLAN(Local Area Network)等の通信経路を介して互いに通信を行う。キーワード候補選定装置10と個々のウェブサーバ14は、例えば、インターネットやLAN等の通信経路を介して互いに通信を行う。もちろん、端末装置12と個々のウェブサーバ14は、インターネットやLAN等の通信経路を介して通信を行ってもよい。
[First Embodiment]
Hereinafter, the first embodiment of the present invention will be described. FIG. 1 shows an example of a keyword assigning system as an information processing system according to the first embodiment of the present invention. As an example, this system includes a keyword candidate selection device 10 as an information processing device, one or a plurality of terminal devices 12, and one or a plurality of web servers 14. The keyword candidate selection device 10 and the terminal device 12 communicate with each other via a communication path such as the Internet or a LAN (Local Area Network). The keyword candidate selection device 10 and the individual web servers 14 communicate with each other via a communication path such as the Internet or a LAN. Of course, the terminal device 12 and each web server 14 may communicate with each other via a communication path such as the Internet or a LAN.

キーワード候補選定装置10は、画像属性情報の付与対象となる画像(以下、「対象画像」と称する)を受け、その対象画像の内容を表わす画像属性情報の候補を特定する機能を備えている。画像属性情報は、例えば、キーワードやタグ情報等である。対象画像のデータは、例えば端末装置12から送られる。また、キーワード候補選定装置10は、他の装置との間でデータを送受信する機能を備えている。   The keyword candidate selection device 10 has a function of receiving an image to which image attribute information is added (hereinafter referred to as “target image”) and specifying a candidate of image attribute information representing the content of the target image. The image attribute information is, for example, a keyword or tag information. The data of the target image is sent from the terminal device 12, for example. The keyword candidate selection device 10 also has a function of transmitting and receiving data to and from other devices.

端末装置12は、例えば、PC(パーソナルコンピュータ)、タブレットPC、スマートフォン、携帯電話、等の装置であり、他の装置との間でデータを送受信する機能を備えている。   The terminal device 12 is, for example, a device such as a PC (personal computer), a tablet PC, a smart phone, and a mobile phone, and has a function of transmitting and receiving data to and from other devices.

ウェブサーバ14は、ウェブページを提供する機能、ウェブページを検索する機能、他の装置との間でデータを送受信する機能を備えている。例えば、ウェブサーバ14は、インターネットを介してウェブページのデータをキーワード候補選定装置10に提供する。   The web server 14 has a function of providing a web page, a function of searching a web page, and a function of transmitting / receiving data to / from another device. For example, the web server 14 provides the data of the web page to the keyword candidate selection device 10 via the Internet.

以下、キーワード付与システムについて詳しく説明する。以下では、画像属性情報の一例として、対象画像の内容を表わすキーワードを特定する場合について説明する。   Hereinafter, the keyword assigning system will be described in detail. In the following, as an example of the image attribute information, a case of specifying a keyword representing the content of the target image will be described.

図2を参照して、キーワード候補選定装置10の構成について詳しく説明する。図2には、キーワード候補選定装置10の構成が示されている。   The configuration of the keyword candidate selection device 10 will be described in detail with reference to FIG. FIG. 2 shows the configuration of the keyword candidate selection device 10.

通信部16は通信インターフェースであり、他の装置にデータを送信する機能、及び、他の装置からデータを受信する機能を備えている。通信部16は、無線通信機能を備えた通信インターフェースであってもよいし、有線通信機能を備えた通信インターフェースであってもよい。一例として、通信部16は、端末装置12から対象画像のデータを受信し、ウェブサーバ14からウェブページのデータを受信する。また、通信部16は、画像属性情報候補としてのキーワード候補のデータを端末装置12に送信する。   The communication unit 16 is a communication interface, and has a function of transmitting data to another device and a function of receiving data from another device. The communication unit 16 may be a communication interface having a wireless communication function or may be a communication interface having a wired communication function. As an example, the communication unit 16 receives the target image data from the terminal device 12 and the web page data from the web server 14. The communication unit 16 also transmits the keyword candidate data as the image attribute information candidates to the terminal device 12.

ウェブページ取得部18は、対象画像に類似する画像(以下、「類似画像」と称する)が含まれる1又は複数のウェブページのデータ(htmlページのデータ)を各ウェブサーバ14から取得する。類似画像は第1画像の一例に相当し、ウェブページのデータは抽出対象データの一例に相当する。例えば、各ウェブサーバ14は、キーワード候補選定装置10からの要求に応じて、類似画像が含まれるウェブページを検索し、そのウェブページのデータをキーワード候補選定装置10に送信する。ウェブページ取得部18は、そのウェブページのデータを取得する。なお、ウェブページ取得部18は、キーワード候補選定装置10に設けられておらず、他の装置(例えば検索サーバ等)に設けられていてもよい。この場合、キーワード候補選定装置10は、当該他の装置によって取得されたウェブページのデータを当該他の装置から取得する。   The web page acquisition unit 18 acquires, from each web server 14, one or a plurality of web page data (html page data) including an image similar to the target image (hereinafter referred to as “similar image”). The similar image corresponds to an example of the first image, and the web page data corresponds to an example of extraction target data. For example, each web server 14 searches for a web page including a similar image in response to a request from the keyword candidate selection device 10 and transmits the data of the web page to the keyword candidate selection device 10. The web page acquisition part 18 acquires the data of the web page. The web page acquisition unit 18 may not be provided in the keyword candidate selection device 10 but may be provided in another device (for example, a search server or the like). In this case, the keyword candidate selection device 10 acquires the data of the web page acquired by the other device from the other device.

類似という概念には、同一という概念も含まれるものとする。類似画像の検索処理や特徴抽出処理として、例えば公知の手法が用いられる。例えば、ウェブページ取得部18は、対象画像から特徴を表わす情報(例えば、画素の濃淡、濃淡の平均値、画像の輪郭、等のパラメータ)を抽出し、その抽出された特徴と類似する特徴を有する類似画像が含まれるウェブページのデータを、各ウェブサーバ14から取得する。例えば、建物の画像、山の画像、空の画像、雲の画像、海の画像、川の画像、人物の画像、動物の画像、植物の画像、物品の画像等が、対象画像の特徴情報として抽出される。例えば、対象画像から特徴情報として山の画像が抽出された場合、その山と形状が類似する山の画像を含むウェブページが各ウェブサーバ14によって検索され、そのウェブページのデータがキーワード候補選定装置10に送られる。   The concept of similarity includes the concept of identity. For example, a known method is used as the similar image search process or the feature extraction process. For example, the web page acquisition unit 18 extracts information representing a feature from the target image (for example, parameters such as pixel grayscale, average grayscale, image outline, and the like), and identifies features similar to the extracted feature. The data of the web page including the similar image is acquired from each web server 14. For example, a building image, a mountain image, a sky image, a cloud image, a sea image, a river image, a person image, an animal image, a plant image, an image of an article, etc. are characteristic information of the target image. To be extracted. For example, when a mountain image is extracted as feature information from the target image, each web server 14 searches for a web page including a mountain image having a shape similar to that of the mountain, and the data of the web page is used as the keyword candidate selection device. Sent to 10.

語句抽出部20は、ウェブページ取得部18によって取得されたウェブページ、つまり、類似画像が含まれるウェブページを解析することにより、そのウェブページに出現する語句(文字列)を一次キーワード候補として抽出する。複数のウェブページのデータがウェブページ取得部18によって取得された場合、語句抽出部20は、ウェブページ毎に語句を抽出する。   The word / phrase extraction unit 20 analyzes a web page acquired by the web page acquisition unit 18, that is, a web page including a similar image, and extracts a word / phrase (character string) appearing on the web page as a primary keyword candidate. To do. When the data of a plurality of web pages is acquired by the web page acquisition unit 18, the phrase extraction unit 20 extracts a phrase for each web page.

抽出対象データの一例としてウェブページのデータが用いられているが、ウェブページ以外のデータが抽出対象データとして用いられてもよい。例えば、画像と文字列とを含む文書データや画像データ等が抽出対象データとして用いられてもよい。この場合、ウェブページ取得部18は、抽出対象データが格納されている図示しない記憶装置(例えば文書データベースや画像データベース等)から、類似画像が含まれる文書データや画像データを取得する。画像と文字列とを含む文書データが抽出対象データとして用いられる場合、語句抽出部20は、その文書データから語句を抽出する。画像データが抽出対象データとして用いられる場合、語句抽出部20は、その画像データに対して例えばOCR(Optical Character Recognition)処理を適用することにより、その画像データから語句を抽出する。   Although the data of the web page is used as an example of the extraction target data, data other than the web page may be used as the extraction target data. For example, document data including an image and a character string, image data, or the like may be used as the extraction target data. In this case, the web page acquisition unit 18 acquires the document data or the image data including the similar image from a storage device (for example, a document database or an image database) (not shown) in which the extraction target data is stored. When document data including an image and a character string is used as extraction target data, the word / phrase extraction unit 20 extracts a word / phrase from the document data. When the image data is used as the extraction target data, the word / phrase extracting unit 20 extracts the word / phrase from the image data by applying, for example, OCR (Optical Character Recognition) processing to the image data.

画像検索部22は、語句抽出部20によって抽出された語句(一次キーワード候補)を検索キーワードとして用いて1又は複数の画像(以下、「検索結果画像」と称する)を検索する。検索結果画像は第2画像の一例に相当する。語句抽出部20によって複数の語句が抽出された場合、画像検索部22は、個々の語句を単独の検索キーワードとして用いて、個々の語句毎に画像を検索する。別の例として、画像検索部22は、複数の語句の組み合わせを検索キーワード群として用いて画像を検索してもよい。例えば、画像検索部22は、AND検索、つまり、検索キーワード群を構成する複数の語句に適合する画像を検索する。各ウェブサーバ14は、キーワード候補選定装置10からの要求に応じて、一次キーワード候補を用いて、インターネット上や画像データベース等に存在する画像群から画像を検索し、その画像(検索結果画像)のデータをキーワード候補選定装置10に送信する。画像検索部22は、その画像データを取得する。画像検索処理として、例えば公知の手法が用いられる。例えば、インターネット上や画像データベース等に存在する画像群から、一次キーワード候補と同一又は類似の語句が対応付けられている画像が検索され、その画像のデータ(検索結果画像のデータ)がキーワード候補選定装置10に送信される。もちろん、別の検索技術によって画像が検索されてもよい。   The image search unit 22 searches for one or a plurality of images (hereinafter, referred to as “search result image”) by using the words (primary keyword candidates) extracted by the word extraction unit 20 as search keywords. The search result image corresponds to an example of the second image. When a plurality of words / phrases are extracted by the word / phrase extraction unit 20, the image search unit 22 searches for an image for each word / phrase using each word / phrase as a single search keyword. As another example, the image search unit 22 may search for an image using a combination of a plurality of words as a search keyword group. For example, the image search unit 22 performs an AND search, that is, an image that matches a plurality of words and phrases that form the search keyword group. In response to a request from the keyword candidate selection device 10, each web server 14 searches for an image from a group of images existing on the Internet or in an image database using the primary keyword candidate, and searches for the image (search result image). The data is transmitted to the keyword candidate selection device 10. The image search unit 22 acquires the image data. For example, a known method is used as the image search processing. For example, an image in which the same or similar words as the primary keyword candidate are associated is searched from an image group existing on the Internet or in an image database, and the image data (data of the search result image) is selected as the keyword candidate. It is transmitted to the device 10. Of course, the images may be searched by another search technique.

類似度演算部24は、対象画像と検索結果画像との間の類似度を演算する。複数の検索結果画像が検索された場合、類似度演算部24は、検索結果画像毎に、対象画像と検索結果画像との間の類似度を演算する。類似度演算処理として、例えば公知の手法が用いられる。例えば、類似度演算部24は、対象画像及び検索結果画像のそれぞれから特徴情報(例えば、画素の濃淡、濃淡の平均値、画像の輪郭、等のパラメータ)を抽出し、対象画像から抽出された特徴情報と検索結果画像から抽出された特徴情報とを対比することにより、対象画像と検索結果画像との間の類似度を演算する。   The similarity calculation unit 24 calculates the similarity between the target image and the search result image. When a plurality of search result images are searched, the similarity calculation unit 24 calculates the similarity between the target image and the search result image for each search result image. As the similarity calculation processing, for example, a known method is used. For example, the similarity calculation unit 24 extracts characteristic information (for example, parameters such as pixel shading, average value of shading, image outline, etc.) from each of the target image and the search result image, and extracted from the target image. By comparing the characteristic information with the characteristic information extracted from the search result image, the degree of similarity between the target image and the search result image is calculated.

キーワード候補特定部26は、対象画像に類似する検索結果画像の検索に用いられた語句を、対象画像の最終キーワード候補(画像属性情報候補の一例に相当する情報)として特定する。例えば、キーワード候補特定部26は、対象画像との間の類似度が予め設定された類似度閾値以上となる検索結果画像の検索に用いられた語句(一次キーワード候補)を、対象画像の最終キーワード候補として特定する。類似度閾値は、ユーザや管理者等によって変更されてもよい。   The keyword candidate specifying unit 26 specifies the word or phrase used for searching the search result image similar to the target image as the final keyword candidate (information corresponding to an example of the image attribute information candidate) of the target image. For example, the keyword candidate specifying unit 26 determines a word (primary keyword candidate) used for searching a search result image whose similarity to the target image is equal to or more than a preset similarity threshold as a final keyword of the target image. Specify as a candidate. The similarity threshold may be changed by the user, the administrator, or the like.

最終キーワード候補のデータは、キーワード候補選定装置10から端末装置12に送信される。端末装置12においては、例えば、最終キーワード候補が表示される。   The final keyword candidate data is transmitted from the keyword candidate selection device 10 to the terminal device 12. On the terminal device 12, for example, the final keyword candidate is displayed.

制御部28は、キーワード候補選定装置10の各部の動作を制御する。   The control unit 28 controls the operation of each unit of the keyword candidate selection device 10.

以下、図3を参照して、端末装置12の構成について詳しく説明する。図3には、端末装置12の構成が示されている。   Hereinafter, the configuration of the terminal device 12 will be described in detail with reference to FIG. FIG. 3 shows the configuration of the terminal device 12.

通信部30は通信インターフェースであり、他の装置にデータを送信する機能、及び、他の装置からデータを受信する機能を備えている。通信部30は、無線通信機能を備えた通信インターフェースであってもよいし、有線通信機能を備えた通信インターフェースであってもよい。一例として、通信部30は、対象画像のデータをキーワード候補選定装置10に送信し、画像属性情報候補としての最終キーワード候補のデータをキーワード候補選定装置10から受信する。   The communication unit 30 is a communication interface, and has a function of transmitting data to another device and a function of receiving data from another device. The communication unit 30 may be a communication interface having a wireless communication function or may be a communication interface having a wired communication function. As an example, the communication unit 30 transmits the data of the target image to the keyword candidate selection device 10, and receives the data of the final keyword candidate as the image attribute information candidate from the keyword candidate selection device 10.

記憶部32はハードディスクやメモリ等の記憶装置であり、例えば、各種のプログラムや各種のデータ等を記憶する。もちろん、それらは別々の記憶装置に記憶されてもよいし、同一の記憶装置に記憶されてもよい。   The storage unit 32 is a storage device such as a hard disk or a memory, and stores, for example, various programs and various data. Of course, they may be stored in separate storage devices, or may be stored in the same storage device.

UI部34やユーザインターフェース部であり、表示部と操作部を含む。表示部は、例えば液晶ディスプレイ等の表示装置である。操作部は、例えば、タッチパネルやキーボード等の入力装置である。もちろん、UI部34は、表示部と操作部の両方の機能を兼ね備えたユーザインターフェース(例えば、タッチパネルとしてのディスプレイや、電子的にキーボード等を表示するディスプレイ等)であってもよい。   The UI unit 34 and the user interface unit include a display unit and an operation unit. The display unit is a display device such as a liquid crystal display. The operation unit is, for example, an input device such as a touch panel or a keyboard. Of course, the UI unit 34 may be a user interface having both functions of a display unit and an operation unit (for example, a display as a touch panel or a display that electronically displays a keyboard or the like).

制御部36は、端末装置12の各部の動作を制御する。最終キーワード候補のデータがキーワード候補選定装置10から端末装置12に送信されると、制御部36は、その最終キーワード候補をUI部34に表示させる。例えば、ユーザがUI部34を使用してキーワード付与の指示を与えると、制御部36は、対象画像に最終キーワード候補を対応付ける。もちろん、この対応付けは、キーワード候補選定装置10によって行われてもよい。   The control unit 36 controls the operation of each unit of the terminal device 12. When the data of the final keyword candidate is transmitted from the keyword candidate selection device 10 to the terminal device 12, the control unit 36 causes the UI unit 34 to display the final keyword candidate. For example, when the user gives a keyword addition instruction using the UI unit 34, the control unit 36 associates the final keyword candidate with the target image. Of course, this association may be performed by the keyword candidate selection device 10.

以下、キーワード付与システムについて詳しく説明する。   The keyword assigning system will be described in detail below.

図4には対象画像の一例が示されている。対象画像38は、一例として、「豆腐」が表わされている画像である。この対象画像38は、ユーザが端末装置12を使用して、キーワード付与対象の画像として指定された画像である。例えば、端末装置12のUI部34に画像群が表示され、ユーザはUI部34を使用して、画像群の中からキーワード付与対象となる対象画像38を指定する。もちろん、別の手法によって対象画像38が指定されたり、端末装置12に入力されたりしてもよい。対象画像38のデータは、通信経路を介して、端末装置12からキーワード候補選定装置10に送信される。   FIG. 4 shows an example of the target image. The target image 38 is, for example, an image showing “tofu”. The target image 38 is an image designated by the user using the terminal device 12 as a keyword addition target image. For example, an image group is displayed on the UI unit 34 of the terminal device 12, and the user uses the UI unit 34 to specify a target image 38 to be a keyword addition target from the image group. Of course, the target image 38 may be designated or input to the terminal device 12 by another method. The data of the target image 38 is transmitted from the terminal device 12 to the keyword candidate selection device 10 via the communication path.

ウェブページ取得部18は、対象画像38から「豆腐の画像」を特徴情報として抽出し、その「豆腐の画像」に類似する画像を含む1又は複数のウェブページのデータを、各ウェブサーバ14から取得する。   The web page acquisition unit 18 extracts “tofu image” from the target image 38 as characteristic information, and outputs data of one or more web pages including images similar to the “tofu image” from each web server 14. get.

図5には、ウェブサーバ14から提供されたウェブページの一例が示されている。このウェブページ40には画像42が含まれている。画像42には豆腐が表わされており、画像42は、対象画像38に類似する画像である。このように、対象画像38に類似する画像42が含まれるウェブページ40が検索され、そのウェブページ40のデータがウェブサーバ14からキーワード候補選定装置10に送信される。   FIG. 5 shows an example of a web page provided by the web server 14. The web page 40 includes an image 42. Tofu is represented in the image 42, and the image 42 is an image similar to the target image 38. In this way, the web page 40 including the image 42 similar to the target image 38 is searched, and the data of the web page 40 is transmitted from the web server 14 to the keyword candidate selection device 10.

ウェブページ40のデータがウェブサーバ14からキーワード候補選定装置10に提供されると、語句抽出部20は、ウェブページ40に出現する語句を一次キーワード候補として抽出する。例えば、語句抽出部20は、形態素解析を適用することにより、文字列を複数の単語に分割して名詞を一次キーワード候補として抽出する。もちろん、語句抽出部20は、名詞以外の語句(例えば動詞、形容詞、副詞等)を一次キーワード候補として抽出してもよい。   When the data of the web page 40 is provided from the web server 14 to the keyword candidate selection device 10, the word / phrase extraction unit 20 extracts a word / phrase appearing on the web page 40 as a primary keyword candidate. For example, the word / phrase extracting unit 20 applies a morphological analysis to divide the character string into a plurality of words and extracts a noun as a primary keyword candidate. Of course, the phrase extracting unit 20 may extract phrases other than nouns (for example, verbs, adjectives, adverbs, etc.) as primary keyword candidates.

語句抽出部20は、語句の出現回数に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の中で、出現回数が予め設定された回数閾値以上となる語句を一次キーワード候補として抽出し、出現回数が回数閾値未満となる語句を抽出しなくてもよい。回数閾値は、ユーザや管理者等によって変更されてもよい。出現回数が回数閾値以上となる語句は、画像42との関連性、つまり、対象画像38との関連性が、出現回数が回数閾値未満となる語句よりも高いと予測される。それ故、出現回数が回数閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   The word / phrase extraction unit 20 may extract a word / phrase as a primary keyword candidate based on the number of appearances of the word / phrase. For example, the word / phrase extracting unit 20 extracts, as a primary keyword candidate, a word / phrase whose number of appearances is equal to or more than a preset number-of-times threshold value in a group of terms / words appearing on the web page 40, and a number of words / phrases whose number of appearances is less than the number-of-times threshold value. Need not be extracted. The number of times threshold may be changed by a user, an administrator, or the like. It is predicted that a word or phrase whose number of appearances is equal to or more than the number of times threshold has a higher relevance to the image 42, that is, a relevance to the target image 38 than a word or phrase whose number of appearances is less than the number of times threshold. Therefore, by extracting words and phrases whose number of appearances is greater than or equal to the number of times threshold value, words and phrases predicted to have a relatively high degree of association with the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、語句の出現回数の順位に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、出現回数が多い順に上位の順位を語句に付けていき、ウェブページ40に出現する語句群の中で、出現回数の順位が予め設定された順位閾値以上となる語句を一次キーワード候補として抽出し、出現回数の順位が順位閾値未満となる語句を抽出しなくてもよい。順位閾値は、ユーザや管理者等によって変更されてもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の全体に対して、順位が上位から数番目(例えば5番目等)以内に含まれる語句を一次キーワード候補として抽出する。出現回数の順位が順位閾値以上となる語句は、対象画像38との関連性が、出現回数の順位が順位閾値未満となる語句よりも高いと予測される。それ故、出現回数の順位が順位閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase as a primary keyword candidate based on the rank of the number of appearances of the phrase. For example, the word / phrase extracting unit 20 assigns words to the higher rank in the descending order of the number of appearances, and in the word / phrase group appearing on the web page 40, the word or phrase in which the order of the number of appearances is equal to or higher than a preset rank threshold value. May be extracted as a primary keyword candidate, and a word having an appearance frequency rank less than a rank threshold may not be extracted. The rank threshold value may be changed by the user, the administrator, or the like. For example, the word / phrase extracting unit 20 extracts, as a primary keyword candidate, words / phrases included within the order of several (eg, fifth) from the top of the entire word group appearing on the web page 40. It is predicted that a word or phrase whose appearance frequency rank is equal to or higher than the rank threshold value has a higher relevance to the target image 38 than a word or phrase whose appearance frequency rank is lower than the rank threshold value. Therefore, by extracting a word or phrase whose appearance frequency rank is equal to or higher than the rank threshold value, a word or phrase predicted to be relatively high in relation to the target image 38 is extracted as a primary keyword candidate.

別の例として、語句抽出部20は、語句の出現頻度に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、ウェブページ40に出現する全語句の出現回数の総和を演算し、個々の語句毎に、その総和に対する当該語句の出現回数の割合を当該語句の出現頻度として演算する。語句抽出部20は、ウェブページ40に出現する語句群の中で、出現頻度が予め設定された頻度閾値以上となる語句を一次キーワード候補として抽出し、出現頻度が頻度閾値未満となる語句を抽出しなくてもよい。頻度閾値は、ユーザや管理者等によって変更されてもよい。出現頻度が頻度閾値以上となる語句は、対象画像38との関連性が、出現頻度が頻度閾値未満となる語句よりも高いと予測される。それ故、出現頻度が頻度閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase as a primary keyword candidate based on the frequency of appearance of the phrase. For example, the phrase extraction unit 20 calculates the total number of appearances of all the phrases appearing on the web page 40, and calculates, for each individual phrase, the ratio of the number of appearances of the relevant phrase to the total sum as the appearance frequency of the relevant phrase. .. The word / phrase extraction unit 20 extracts, from the word / phrase group appearing on the web page 40, words / phrases whose appearance frequency is equal to or higher than a preset frequency threshold as primary keyword candidates, and extracts words / phrases whose appearance frequency is less than the frequency threshold. You don't have to. The frequency threshold may be changed by the user, the administrator, or the like. It is predicted that a word or phrase whose appearance frequency is equal to or higher than the frequency threshold has a higher relevance to the target image 38 than a word or phrase whose appearance frequency is less than the frequency threshold. Therefore, by extracting a word or phrase whose appearance frequency is equal to or higher than the frequency threshold value, a word or phrase that is predicted to be relatively highly related to the target image 38 is extracted as a primary keyword candidate.

別の例として、語句抽出部20は、語句の出現頻度の順位に基づいて、一次キーワード候補となる語句を抽出してもよい。例えば、語句抽出部20は、出現頻度の高い順に上位の順位を語句に付けていき、ウェブページ40に出現する語句群の中で、出現頻度の順位が予め設定された順位閾値以上となる語句を一次キーワード候補として抽出し、出現頻度の順位が順位閾値未満となる語句を抽出しなくてもよい。順位閾値は、ユーザや管理者等によって変更されてもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の全体に対して、順位が上位から数番目(例えば5番目等)以内に含まれる語句を一次キーワード候補として抽出する。出現頻度の順位が順位閾値以上となる語句は、対象画像38との関連性が、出現頻度の順位が順位閾値未満となる語句よりも高いと予測される。それ故、出現頻度の順位が順位閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the word / phrase extracting unit 20 may extract a word / phrase that is a primary keyword candidate based on the rank of the appearance frequency of the word / phrase. For example, the word / phrase extracting unit 20 assigns words to a higher rank in descending order of appearance frequency, and among words / phrases appearing on the web page 40, a word or phrase whose appearance frequency rank is equal to or higher than a preset rank threshold value. May be extracted as a primary keyword candidate, and a word or phrase whose appearance frequency rank is less than the rank threshold may not be extracted. The rank threshold value may be changed by the user, the administrator, or the like. For example, the word / phrase extracting unit 20 extracts, as a primary keyword candidate, words / phrases included within the order of several (eg, fifth) from the top of the entire word group appearing on the web page 40. It is predicted that a word having an appearance frequency rank higher than the rank threshold has a higher relevance to the target image 38 than a word having an appearance frequency rank lower than the rank threshold. Therefore, by extracting words and phrases whose appearance frequency rank is equal to or higher than the rank threshold value, words and phrases predicted to be relatively high in relation to the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、語句のフォントサイズに基づいて、一次キーワード候補となる語句を抽出してもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の中で、フォントサイズが予め設定されたサイズ閾値以上となる語句を一次キーワード候補として抽出し、フォントサイズがサイズ閾値未満となる語句を抽出しなくてもよい。サイズ閾値は、ユーザや管理者等によって変更されてもよい。フォントサイズがサイズ閾値以上となる語句は、フォントサイズがサイズ閾値未満となる語句よりも、ウェブページ40内において目立っていると予測され、対象画像38との関連性が高いと予測される。それ故、フォントサイズがサイズ閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase that is a primary keyword candidate based on the font size of the phrase. For example, the word / phrase extraction unit 20 extracts, as a primary keyword candidate, a word / phrase having a font size that is equal to or larger than a preset size threshold value in the word group that appears on the web page 40, and a word whose font size is less than the size threshold value. Need not be extracted. The size threshold may be changed by the user, the administrator, or the like. It is predicted that words and phrases whose font size is equal to or larger than the size threshold value are more conspicuous in the web page 40 than words and phrases whose font size is smaller than the size threshold value, and are more likely to be associated with the target image 38. Therefore, by extracting words and phrases whose font size is equal to or larger than the size threshold value, words and phrases predicted to be relatively high in relation to the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、語句のフォントサイズの順位に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、フォントサイズの大きい順に上位の順位を語句に付けていき、ウェブページ40に出現する語句群の中で、フォントサイズの順位が予め設定された順位閾値以上となる語句を一次キーワード候補として抽出し、フォントサイズの順位が順位閾値未満となる語句を抽出しなくてもよい。順位閾値は、ユーザや管理者等によって変更されてもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の全体に対して、順位が上位から数番目(例えば5番目)以内に含まれる語句を一次キーワード候補として抽出する。フォントサイズの順位が順位閾値以上となる語句は、フォントサイズの順位が順位閾値未満となる語句よりも、ウェブページ40内において目立っていると予測され、対象画像38との関連性が高いと予測される。それ故、フォントサイズの順位が順位閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase as a primary keyword candidate based on the rank of the font size of the phrase. For example, the word / phrase extracting unit 20 assigns words to a higher rank in descending order of font size, and among words / phrases appearing on the web page 40, words / phrases whose font size rank is equal to or higher than a preset rank threshold value. May be extracted as a primary keyword candidate, and a word or phrase whose font size rank is less than the rank threshold may not be extracted. The rank threshold value may be changed by the user, the administrator, or the like. For example, the word / phrase extraction unit 20 extracts, as a primary keyword candidate, a word / phrase included within the order of several (eg, fifth) from the top of the entire word group appearing on the web page 40. It is predicted that words and phrases whose font size rank is equal to or higher than the rank threshold value are more prominent in the web page 40 than words and words whose font size rank rank is lower than the rank threshold value, and are highly relevant to the target image 38. To be done. Therefore, by extracting words and phrases whose font size rank is equal to or higher than the rank threshold value, words and phrases predicted to be relatively high in relation to the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、語句のフォントサイズの割合に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、ウェブページ40に出現する全語句についてのフォントサイズの平均(以下、「平均フォントサイズ」と称する)を演算し、個々の語句毎に、平均フォントサイズに対する当該語句のフォントサイズの割合を演算する。語句抽出部20は、ウェブページ40に出現する語句群の中で、その割合が予め設定された割合閾値以上となる語句を一次キーワード候補として抽出し、その割合が割合閾値未満となる語句を抽出しなくてもよい。割合閾値は、ユーザや管理者等によって変更されてもよい。フォントサイズの割合が割合閾値以上となる語句は、フォントサイズの割合が割合閾値未満となる語句よりも、ウェブページ40内において目立っていると予測され、対象画像38との関連性が高いと予測される。それ故、フォントサイズの割合が割合閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase as a primary keyword candidate based on the ratio of the font size of the phrase. For example, the word / phrase extracting unit 20 calculates the average font size (hereinafter, referred to as “average font size”) of all words / phrases appearing on the web page 40, and for each word / phrase, the word / phrase with respect to the average font size is calculated. Calculate the percentage of font size. The word / phrase extracting unit 20 extracts, as a primary keyword candidate, words / phrases whose ratio is equal to or higher than a preset threshold value ratio among words / phrases appearing on the web page 40, and extracts words / phrases whose ratio ratio is lower than the ratio threshold value. You don't have to. The ratio threshold may be changed by the user, the administrator, or the like. It is predicted that words and phrases whose font size ratio is equal to or greater than the ratio threshold value are more prominent in the web page 40 than words and phrases whose font size ratio is less than the ratio threshold value, and are predicted to be more relevant to the target image 38. To be done. Therefore, by extracting words and phrases having a font size ratio of not less than the ratio threshold value, words and phrases predicted to be relatively high in relation to the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、語句のフォントサイズの割合の順位に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、フォントサイズの割合の高い順に上位の順位を語句に付けていき、ウェブページ40に出現する語句群の中で、フォントサイズの割合の順位が予め設定された順位閾値以上となる語句を一次キーワード候補として抽出し、フォントサイズの割合が順位閾値未満となる語句を抽出しなくてもよい。順位閾値は、ユーザや管理者等によって変更されてもよい。例えば、語句抽出部20は、ウェブページ40に出現する語句群の全体に対して、順位が上位から数番目(例えば5番目)以内に含まれる語句を一次キーワード候補として抽出する。フォントサイズの割合の順位が順位閾値以上となる語句は、フォントサイズの割合の順位が順位閾値未満となる語句よりも、ウェブページ40内において目立っていると予測され、対象画像38との関連性が高いと予測される。それ故、フォントサイズの割合の順位が順位閾値以上となる語句を抽出することにより、対象画像38との関連性が相対的に高いと予測される語句が一次キーワード候補として抽出される。   As another example, the phrase extraction unit 20 may extract a phrase as a primary keyword candidate based on the rank of the font size ratio of the phrase. For example, the word / phrase extracting unit 20 assigns a higher rank to the words in the descending order of the font size ratio, and the rank of the font size ratio in the word group appearing on the web page 40 is a preset threshold value. The words and phrases described above may be extracted as primary keyword candidates, and the words and phrases in which the font size ratio is less than the rank threshold may not be extracted. The rank threshold value may be changed by the user, the administrator, or the like. For example, the word / phrase extraction unit 20 extracts, as a primary keyword candidate, a word / phrase included within the order of several (eg, fifth) from the top of the entire word group appearing on the web page 40. Words whose font size ratio rank is higher than the rank threshold value are predicted to be more prominent in the web page 40 than words whose font size ratio rank is lower than the rank threshold value, and are associated with the target image 38. Is expected to be high. Therefore, by extracting words and phrases whose ranks of the font size ratio are equal to or higher than the rank threshold value, words and phrases predicted to be relatively high in relation to the target image 38 are extracted as primary keyword candidates.

別の例として、語句抽出部20は、類似画像としての画像42との位置関係に基づいて、一次キーワード候補としての語句を抽出してもよい。例えば、語句抽出部20は、画像42の配置位置を基準として、予め設定された範囲内に記述されている名詞を一次キーワード候補として抽出してもよい。その範囲内に記述されている名詞は、対象画像38との関連性が、その範囲外に記述されている名詞よりも高いと予測される。それ故、その範囲内に含まれる名詞を抽出することにより、その範囲外に記述されている名詞よりも対象画像38との関連性が高いと予測される名詞が一次キーワード候補として抽出される。別の例として、語句抽出部20は、画像42に最も近い位置に記述されている名詞を一次キーワード候補として抽出してもよい。語句抽出部20は、例えば、ウェブページ40のhtmlソースの階層構造を解析することにより、画像42と各語句との位置関係を特定すればよい。   As another example, the phrase extracting unit 20 may extract a phrase as a primary keyword candidate based on the positional relationship with the image 42 as a similar image. For example, the word / phrase extracting unit 20 may extract, as a primary keyword candidate, a noun described within a preset range based on the arrangement position of the image 42. It is predicted that the nouns described in the range have higher relevance to the target image 38 than the nouns described outside the range. Therefore, by extracting the nouns included in the range, the nouns predicted to be more relevant to the target image 38 than the nouns described outside the range are extracted as the primary keyword candidates. As another example, the phrase extracting unit 20 may extract the noun described at the position closest to the image 42 as a primary keyword candidate. The phrase extraction unit 20 may specify the positional relationship between the image 42 and each phrase by analyzing the hierarchical structure of the html source of the web page 40, for example.

もちろん、語句抽出部20は、上記以外の基準に従って、ウェブページ40から語句を抽出してもよい。   Of course, the phrase extraction unit 20 may extract a phrase from the web page 40 according to a criterion other than the above.

ウェブページ40以外のウェブページも取得された場合、語句抽出部20は、ウェブページ40以外のウェブページからも上述したように語句を抽出する。   When the web page other than the web page 40 is also acquired, the word / phrase extracting unit 20 extracts the word / phrase from the web page other than the web page 40 as described above.

図6には、一次キーワード候補リストの一例が示されている。この一次キーワード候補リストには、一次キーワード候補として抽出された語句が含まれている。一例として、「豆腐」、「有限会社」、「AAA(店舗名)」、「店」、及び、「健康」、等の名詞が、一次キーワード候補として抽出されている。なお、「AAA(店舗名)」は固有名詞であるため、語句抽出部20は、「AAA(店舗名)」を一次キーワード候補から除外してもよい。この場合、「AAA(店舗名)」は、一次キーワード候補リストに含まれない。なお、一次キーワード候補リストのデータは、キーワード候補選定装置10から端末装置12に送信され、一次キーワード候補リストが端末装置12のUI部34に表示されてもよい。   FIG. 6 shows an example of the primary keyword candidate list. This primary keyword candidate list includes words and phrases extracted as primary keyword candidates. As an example, nouns such as “tofu”, “limited company”, “AAA (store name)”, “store”, and “health” are extracted as primary keyword candidates. Since “AAA (store name)” is a proper noun, the phrase extraction unit 20 may exclude “AAA (store name)” from the primary keyword candidates. In this case, “AAA (store name)” is not included in the primary keyword candidate list. The data of the primary keyword candidate list may be transmitted from the keyword candidate selection device 10 to the terminal device 12, and the primary keyword candidate list may be displayed on the UI unit 34 of the terminal device 12.

以下、図7を参照して、画像検索部22、類似度演算部24及びキーワード候補特定部26による処理について詳しく説明する。   Hereinafter, the processes performed by the image search unit 22, the similarity calculation unit 24, and the keyword candidate specifying unit 26 will be described in detail with reference to FIG. 7.

図6に示すように一次キーワード候補としての語句が抽出されると、画像検索部22は、一次キーワード候補を検索キーワードとして用いて画像を検索する。例えば、画像検索部22は、個々の一次キーワード候補を単独の検索キーワードとして用いて、個々の一次キーワード候補毎に画像を検索する。図7には、その検索によって取得された検索結果画像が示されている。検索結果画像44は、一次キーワード候補「豆腐」を検索キーワードとして用いて検索された画像(例えば、語句「豆腐」が対応付けられている画像)であり、例えば、豆腐が表わされた画像である。検索結果画像46は、一次キーワード候補「有限会社」を検索キーワードとして用いて検索された画像(例えば、語句「有限会社」が対応付けられている画像)であり、例えば、ある有限会社の外観が表わされた画像である。検索結果画像48は、一次キーワード候補「AAA(店舗名)」を検索キーワードとして用いて検索された画像(例えば、語句「AAA」が対応付けられている画像)であり、例えば、氏名が「AAA」である人物が表わされた画像である。検索結果画像50は、一次キーワード候補「店」を検索キーワードとして用いて検索された画像(例えば、語句「店」が対応付けられている画像)であり、例えば、ある店舗が表された画像である。検索結果画像52は、一次キーワード候補「健康」を検索キーワードとして用いて検索された画像(例えば、語句「健康」が対応付けられている画像)であり、例えば、健康を連想させるような画像である。   When a word or phrase as a primary keyword candidate is extracted as shown in FIG. 6, the image search unit 22 searches for an image using the primary keyword candidate as a search keyword. For example, the image search unit 22 searches for an image for each primary keyword candidate by using each primary keyword candidate as a single search keyword. FIG. 7 shows a search result image acquired by the search. The search result image 44 is an image searched using the primary keyword candidate “tofu” as the search keyword (for example, an image associated with the phrase “tofu”), and is an image showing tofu, for example. is there. The search result image 46 is an image searched using the primary keyword candidate “limited company” as a search keyword (for example, an image associated with the phrase “limited company”). It is a represented image. The search result image 48 is an image searched using the primary keyword candidate “AAA (store name)” as a search keyword (for example, an image associated with the phrase “AAA”), and for example, the name is “AAA. It is an image in which a person who is ". The search result image 50 is an image searched using the primary keyword candidate “store” as a search keyword (for example, an image associated with the word “store”), and is, for example, an image showing a certain store. is there. The search result image 52 is an image searched using the primary keyword candidate “health” as a search keyword (for example, an image associated with the phrase “health”), and is, for example, an image reminiscent of health. is there.

なお、一次キーワード候補リストが端末装置12のUI部34に表示され、ユーザによって、その一次キーワード候補リストの中から検索キーワードとして用いる一次キーワード候補が指定されてもよい。この場合、ユーザによって指定された一次キーワード候補のデータが端末装置12からキーワード候補選定装置10に送信され、画像検索部22は、ユーザによって指定された一次キーワード候補を検索キーワードとして用いて画像を検索する。複数の一次キーワード候補がユーザによって指定された場合、画像検索部22は、個々の一次キーワード候補を単独の検索キーワードとして用いて、個々の一次キーワード候補毎に画像を検索する。   The primary keyword candidate list may be displayed on the UI unit 34 of the terminal device 12, and the user may specify a primary keyword candidate to be used as a search keyword from the primary keyword candidate list. In this case, the data of the primary keyword candidate specified by the user is transmitted from the terminal device 12 to the keyword candidate selecting device 10, and the image search unit 22 searches for an image using the primary keyword candidate specified by the user as a search keyword. To do. When a plurality of primary keyword candidates are designated by the user, the image search unit 22 searches for an image for each primary keyword candidate by using each primary keyword candidate as a single search keyword.

画像検索部22は、複数の一次キーワード候補の組み合わせを検索キーワード群として用いて、AND検索を行うことにより画像を検索してもよい。図6に示す例で説明すると、画像検索部22は、例えば、一次キーワード候補「豆腐」と「健康」の組み合わせを検索キーワード群として用いて、AND検索を行うことにより、一次キーワード候補「豆腐」と「健康」の両方に適合する画像(例えば、語句「豆腐」と「健康」の両方が対応付けられている画像)を検索する。これにより、一次キーワード候補「豆腐」と「健康」の両方に関連する画像が検索される。検索キーワード群に含まれる一次キーワード候補の数は、予め設定された数であってもよいし、ユーザや管理者等によって変更されてもよい。また、検索キーワード群に含まれる一次キーワード候補は、一次キーワード候補群の中から画像検索部22によってランダムに選択されてもよいし、一次キーワード候補群の中からユーザによって選択されてもよい。例えば、一次キーワード候補リストが端末装置12のUI部34に表示され、ユーザによって、その一次キーワード候補リストの中から検索キーワード群として用いる複数の一次キーワード候補が指定されてもよい。   The image search unit 22 may search for an image by performing an AND search using a combination of a plurality of primary keyword candidates as a search keyword group. Explaining with the example shown in FIG. 6, the image search unit 22 uses, for example, a combination of the primary keyword candidates “tofu” and “health” as a search keyword group, and performs an AND search to obtain the primary keyword candidate “tofu”. And an image that matches both "health" (for example, an image in which both the words "tofu" and "health" are associated) are searched. As a result, images related to both the primary keyword candidates “tofu” and “health” are searched. The number of primary keyword candidates included in the search keyword group may be a preset number, or may be changed by the user, the administrator, or the like. The primary keyword candidates included in the search keyword group may be randomly selected by the image search unit 22 from the primary keyword candidate group, or may be selected by the user from the primary keyword candidate group. For example, the primary keyword candidate list may be displayed on the UI unit 34 of the terminal device 12, and the user may specify a plurality of primary keyword candidates to be used as a search keyword group from the primary keyword candidate list.

類似度演算部24は、対象画像38と検索結果画像44,46,48,50,52のそれぞれとの間の類似度を演算する。つまり、対象画像38と検索結果画像44との間の類似度、対象画像38と検索結果画像46との間の類似度、対象画像38と検索結果画像48との間の類似度、対象画像38と検索結果画像50との間の類似度、及び、対象画像38と検索結果画像52との間の類似度が演算される。   The similarity calculator 24 calculates the similarity between the target image 38 and each of the search result images 44, 46, 48, 50, 52. That is, the similarity between the target image 38 and the search result image 44, the similarity between the target image 38 and the search result image 46, the similarity between the target image 38 and the search result image 48, the target image 38 And the search result image 50 and the similarity between the target image 38 and the search result image 52 are calculated.

キーワード候補特定部26は、対象画像38との間の類似度が類似度閾値以上となる検索結果画像を特定し、その検索結果画像の検索に用いられた一次キーワード候補を、対象画像38の最終キーワード候補として特定する。図7に示す例では、対象画像38と検索結果画像44との間の類似度が類似度閾値以上になっており、検索結果画像44の検索に用いられた一次キーワード候補「豆腐」が最終キーワード候補として特定される。   The keyword candidate specifying unit 26 specifies the search result image whose similarity to the target image 38 is equal to or higher than the similarity threshold value, and determines the primary keyword candidate used to search the search result image as the final keyword of the target image 38. Specify as a keyword candidate. In the example shown in FIG. 7, the similarity between the target image 38 and the search result image 44 is equal to or higher than the similarity threshold, and the primary keyword candidate “tofu” used for searching the search result image 44 is the final keyword. Identified as a candidate.

最終キーワード候補「豆腐」のデータは、キーワード候補選定装置10から端末装置12に送信され、端末装置12のUI部34に最終キーワード候補「豆腐」が表示される。例えば、ユーザがUI部34を使用してキーワード付与の指示を与えると、端末装置12の制御部36は、最終キーワード候補「豆腐」を画像属性情報として対象画像38に対応付ける。もちろん、端末装置12において、最終キーワード候補「豆腐」が画像属性情報として対象画像38に自動的に対応付けられてもよい。なお、キーワード候補選定装置10において、最終キーワード候補「豆腐」が画像属性情報として対象画像38に自動的に対応付けられ、最終キーワード候補「豆腐」が対応付けられた対象画像38のデータが、キーワード候補選定装置10から端末装置12に送信されてもよい。   The data of the final keyword candidate “tofu” is transmitted from the keyword candidate selection device 10 to the terminal device 12, and the final keyword candidate “tofu” is displayed on the UI unit 34 of the terminal device 12. For example, when the user gives an instruction to attach a keyword using the UI unit 34, the control unit 36 of the terminal device 12 associates the final keyword candidate “tofu” with the target image 38 as image attribute information. Of course, in the terminal device 12, the final keyword candidate “tofu” may be automatically associated with the target image 38 as image attribute information. In the keyword candidate selection device 10, the final keyword candidate “tofu” is automatically associated with the target image 38 as image attribute information, and the data of the target image 38 associated with the final keyword candidate “tofu” is the keyword. It may be transmitted from the candidate selection device 10 to the terminal device 12.

画像属性情報としての最終キーワード候補「豆腐」は、例えば、対象画像38を検索するための検索キーワードとして用いられる。例えば、検索キーワードとして語句「豆腐」が与えられると、最終キーワード候補「豆腐」が対応付けられた対象画像38が検索される。   The final keyword candidate “tofu” as the image attribute information is used as a search keyword for searching the target image 38, for example. For example, when the phrase “tofu” is given as the search keyword, the target image 38 associated with the final keyword candidate “tofu” is searched.

図7に示す例では、一次キーワード候補群の中から1つの語句「豆腐」が最終キーワード候補として特定されているが、複数の語句が最終キーワード候補として特定される場合もある。例えば、対象画像38との間の類似度が類似度閾値以上となる検索結果画像が複数ある場合、各検索結果画像の検索に用いられた一次キーワード候補が、最終キーワード候補として特定される。この場合、端末装置12のUI部34に複数の最終キーワード候補が表示され、ユーザがUI部34を使用して複数の最終キーワード候補の中から付与対象の最終キーワード候補を指定すると、ユーザによって指定された最終キーワード候補が対象画像38に対応付けられる。もちろん、端末装置12又はキーワード候補選定装置10にて、複数の最終キーワード候補が画像属性情報として対象画像38に自動的に対応付けられてもよい。   In the example shown in FIG. 7, one word “tofu” is specified as the final keyword candidate from the primary keyword candidate group, but a plurality of words may be specified as the final keyword candidate. For example, when there are a plurality of search result images whose similarity to the target image 38 is equal to or higher than the similarity threshold value, the primary keyword candidate used to search each search result image is specified as the final keyword candidate. In this case, a plurality of final keyword candidates are displayed on the UI unit 34 of the terminal device 12, and when the user uses the UI unit 34 to specify a final keyword candidate to be given from among the plurality of final keyword candidates, the final keyword candidate is specified by the user. The final keyword candidates thus created are associated with the target image 38. Of course, the terminal device 12 or the keyword candidate selection device 10 may automatically associate a plurality of final keyword candidates with the target image 38 as image attribute information.

また、複数の一次キーワード候補の組み合わせを検索キーワード群として用いて画像が検索された場合、対象画像38との間の類似度が類似度閾値以上となる検索結果画像の検索に用いられた複数の一次キーワード候補が、最終キーワード候補として特定される。例えば、一次キーワード候補「豆腐」と「健康」の両方を検索キーワード群として用いてAND検索された画像(検索結果画像)と対象画像38との類似度が類似度閾値以上となる場合、一次キーワード候補「豆腐」と「健康」の両方が最終キーワード候補として特定される。   In addition, when an image is searched using a combination of a plurality of primary keyword candidates as a search keyword group, a plurality of search result images whose similarity with the target image 38 is equal to or higher than the similarity threshold value are used. The primary keyword candidate is identified as the final keyword candidate. For example, when the similarity between the image (search result image) ANDed using the primary keyword candidates “tofu” and “health” as the search keyword group is equal to or higher than the similarity threshold value, the primary keyword Both the candidates "tofu" and "health" are identified as final keyword candidates.

以下、図8を参照して、キーワード候補選定装置10による処理について説明する。図8には、その処理の一例を示すフローチャートが示されている。   Hereinafter, the processing by the keyword candidate selection device 10 will be described with reference to FIG. FIG. 8 shows a flowchart showing an example of the processing.

まず、キーワード候補選定装置10は、端末装置12から送信された対象画像のデータを受信する(S01)。ウェブページ取得部18は、対象画像の類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する(S02)。語句抽出部20は、ウェブページ毎に、ウェブページに出現する語句を一次キーワード候補として抽出する(S03)。これにより、一次キーワード候補を含む一次キーワード候補リストが生成される。以下、一次キーワード候補リストに含まれる全一次キーワード候補についての処理が終了するまで、処理を繰り返す。画像検索部22は、一次キーワード候補を検索キーワードとして用いて画像を検索する(S04)。この検索で得られた画像が検索結果画像である。類似度演算部24は、対象画像と検索結果画像との間の類似度を演算する(S05)。類似度が類似度閾値以上となる場合(S06,Yes)、キーワード候補特定部26は、その検索結果画像の検索に用いられた一次キーワード候補を最終キーワード候補として特定する(S07)。類似度が類似度閾値未満となる場合(S06,No)、次の一次キーワード候補を対象として処理が行われる。一次キーワード候補リストに含まれる全ての一次キーワード候補について、ステップS04からステップS07までの処理が終了した場合、処理は終了する。   First, the keyword candidate selection device 10 receives the data of the target image transmitted from the terminal device 12 (S01). The web page acquisition unit 18 acquires the data of one or a plurality of web pages including the similar image of the target image from each web server 14 (S02). The phrase extracting unit 20 extracts, for each web page, a phrase appearing on the web page as a primary keyword candidate (S03). As a result, the primary keyword candidate list including the primary keyword candidates is generated. Hereinafter, the processing is repeated until the processing for all the primary keyword candidates included in the primary keyword candidate list is completed. The image search unit 22 searches for an image using the primary keyword candidate as a search keyword (S04). The image obtained by this search is the search result image. The similarity calculation unit 24 calculates the similarity between the target image and the search result image (S05). When the similarity is equal to or higher than the similarity threshold (S06, Yes), the keyword candidate specifying unit 26 specifies the primary keyword candidate used for the search of the search result image as the final keyword candidate (S07). When the similarity is less than the similarity threshold (S06, No), the process is performed on the next primary keyword candidate. When the processing from step S04 to step S07 is completed for all the primary keyword candidates included in the primary keyword candidate list, the processing is completed.

以上のように、第1実施形態においては、対象画像に類似する画像(類似画像)の検索を用いて一次キーワード候補が抽出され、その一次キーワード候補を用いて画像(検索結果画像)が検索され、対象画像との間の類似度が類似度閾値以上となる検索結果画像の検索に用いられた一次キーワード候補が最終キーワード候補として特定される。対象画像と検索結果画像との間の類似度を検証することにより、一次キーワード候補が対象画像の内容を適切に表現する語句であるか否かの評価が行われることになる。つまり、一次キーワード候補の対象画像に対する画像属性情報としてのふさわしさが評価される。対象画像との間の類似度が類似度閾値以上となる検索結果画像の検索に用いられた一次キーワード候補を用いて画像を検索することにより、対象画像との間の類似度が類似度閾値以上となる画像が検索されるのであるから、対象画像との間の類似度が類似度閾値以上となる検索結果画像の検索に用いられた一次キーワード候補は、対象画像との間の類似度が類似度閾値未満となる検索結果画像の検索に用いられた一次キーワード候補よりも、対象画像を表現するのによりふさわしい語句(一次キーワード候補)であると予測される。それ故、一次キーワード候補群の中で対象画像との間の類似度が類似度閾値以上となる検索結果画像の検索に用いられた一次キーワード候補を最終キーワード候補として特定することにより、一次キーワード候補群をそのまま最終キーワード候補として特定する場合と比較して、対象画像を表現するのによりふさわしい語句(一次キーワード候補)が最終キーワード候補として特定される。   As described above, in the first embodiment, a primary keyword candidate is extracted by using a search for an image (similar image) similar to the target image, and an image (search result image) is searched using the primary keyword candidate. The primary keyword candidate used for the search of the search result image whose similarity to the target image is equal to or higher than the similarity threshold is specified as the final keyword candidate. By verifying the degree of similarity between the target image and the search result image, it is evaluated whether or not the primary keyword candidate is a phrase that appropriately expresses the content of the target image. That is, the suitability as the image attribute information for the target image of the primary keyword candidate is evaluated. The similarity with the target image is greater than or equal to the similarity threshold. By searching the image using the primary keyword candidates used to search the search result image, the similarity with the target image is greater than or equal to the similarity threshold. Therefore, the primary keyword candidates used in the search for the search result image whose similarity to the target image is equal to or higher than the similarity threshold are similar in similarity to the target image. It is predicted that the word (primary keyword candidate) more suitable for expressing the target image than the primary keyword candidate used for the search of the search result image that is less than the frequency threshold value. Therefore, by specifying the primary keyword candidate used for the search of the search result image whose similarity to the target image is equal to or higher than the similarity threshold value in the primary keyword candidate group as the final keyword candidate, Compared to the case where the group is directly specified as the final keyword candidate, a word (primary keyword candidate) more suitable for expressing the target image is specified as the final keyword candidate.

例えば、インターネットオークションに代表される商品販売用のウェブページ等には、対象画像とは関係のない画像が含まれる場合がある。また、ウェブページに出現する語句とウェブページに含まれる画像とは、必ずしも相関するとは限らない。それ故、このような場合に、対象画像に類似する画像を含むウェブページを検索し、そのウェブページに出現する語句(一次キーワード候補)を最終キーワード候補として特定したとしても、対象画像を適切に表現する最終キーワード候補が特定されるとは限らない。図6及び図7を参照して説明すると、一次キーワード候補として抽出された語句「有限会社」、「AAA」、「店」、「健康」は、豆腐を表わす対象画像38に関係のない語句、つまり、対象画像38を表現するのにふさわしい語句とは限らない。このような語句を最終キーワード候補として特定した場合、対象画像38を表現するのにふさわしくない語句が最終キーワード候補として特定されることがある。これに対して、第1実施形態によると、一次キーワード候補が対象画像38の内容を適切に表現する語句であるか否かの検証が行われるので、対象画像38を表現するのにふさわしくない語句が最終キーワード候補から除外され、対象画像38を表現するのにふさわしい語句が最終キーワード候補として特定されることになる。   For example, a web page for selling products, such as an Internet auction, may include an image that is not related to the target image. In addition, the words appearing on the web page and the images included in the web page do not always correlate. Therefore, in such a case, even if the web page including an image similar to the target image is searched and the word (primary keyword candidate) appearing on the web page is specified as the final keyword candidate, the target image is appropriately searched. The final keyword candidate to be expressed is not always specified. Explaining with reference to FIG. 6 and FIG. 7, the terms “limited company”, “AAA”, “store”, and “health” extracted as primary keyword candidates are terms not related to the target image 38 representing tofu, That is, it is not always a word suitable for expressing the target image 38. When such a phrase is specified as the final keyword candidate, a phrase that is not suitable for expressing the target image 38 may be specified as the final keyword candidate. On the other hand, according to the first embodiment, it is verified whether or not the primary keyword candidate is a phrase that appropriately expresses the content of the target image 38, and thus a phrase that is not suitable for expressing the target image 38. Are excluded from the final keyword candidates, and the words and phrases suitable for expressing the target image 38 are specified as the final keyword candidates.

[第2実施形態]
以下、本発明の第2実施形態について説明する。図9には、第2実施形態に係るキーワード候補選定装置が示されている。第2実施形態に係るキーワード候補選定装置10Aは、第1実施形態に係るキーワード候補選定装置10の構成に加えて、類義語辞書DB(データベース)54を含む。類義語辞書DB54以外の構成は、第1実施形態に係るキーワード候補選定装置10の構成と同じである。
[Second Embodiment]
The second embodiment of the present invention will be described below. FIG. 9 shows a keyword candidate selection device according to the second embodiment. The keyword candidate selection device 10A according to the second embodiment includes a synonym dictionary DB (database) 54 in addition to the configuration of the keyword candidate selection device 10 according to the first embodiment. The configuration other than the synonym dictionary DB 54 is the same as the configuration of the keyword candidate selection device 10 according to the first embodiment.

類義語辞書DB54は、ハードディスクやメモリ等の記憶装置であり、語句の類義語(同義語)を示すデータを記憶する。類義語辞書DB54においては、語句毎に、語句と類義語とが対応付けられている。類義語を示すデータは、例えば予め作成されて類義語辞書DB54に記憶されている。   The synonym dictionary DB 54 is a storage device such as a hard disk or a memory, and stores data indicating synonyms (synonyms) of phrases. In the synonym dictionary DB 54, the words and the synonyms are associated with each other. The data indicating the synonyms is created in advance and stored in the synonym dictionary DB 54, for example.

キーワード候補特定部26は、第1実施形態と同様に、画像属性情報候補としての最終キーワード候補を特定する。さらに、キーワード候補特定部26は、その最終キーワード候補に関連する語句を新たな最終キーワード候補として特定する。最終キーワード候補に関連する語句は、例えば、その最終キーワード候補の類義語である。キーワード候補特定部26は、類義語辞書DB54を対象として最終キーワード候補の類義語を検索し、その検索によって得られた類義語を新たな最終キーワード候補として特定する。   The keyword candidate specifying unit 26 specifies the final keyword candidate as the image attribute information candidate, as in the first embodiment. Further, the keyword candidate specifying unit 26 specifies a word or phrase related to the final keyword candidate as a new final keyword candidate. The phrase related to the final keyword candidate is, for example, a synonym of the final keyword candidate. The keyword candidate specifying unit 26 searches the synonym dictionary DB 54 for a synonym of the final keyword candidate, and specifies the synonym obtained by the search as a new final keyword candidate.

以上のように、最終キーワード候補の類義語を新たな最終キーワード候補として特定することにより、一次キーワード候補をそのまま最終キーワード候補として特定する場合と比較して、対象画像を表現するのによりふさわしい語句が最終キーワード候補として特定される。   As described above, by specifying a synonym of the final keyword candidate as a new final keyword candidate, as compared with the case where the primary keyword candidate is directly specified as the final keyword candidate, the word more suitable for expressing the target image is the final word. It is specified as a keyword candidate.

[第3実施形態]
以下、本発明の第3実施形態について説明する。第3実施形態に係るキーワード候補選定装置は、第1実施形態に係るキーワード候補選定装置10、又は、第2実施形態に係るキーワード候補選定装置10Aと同じ構成を有する。
[Third Embodiment]
The third embodiment of the present invention will be described below. The keyword candidate selection device according to the third embodiment has the same configuration as the keyword candidate selection device 10 according to the first embodiment or the keyword candidate selection device 10A according to the second embodiment.

第3実施形態においては、複数の対象画像に対する最終キーワード候補が特定される。例えば、ウェブページ取得部18は、対象画像毎に、対象画像の類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する。語句抽出部20は、対象画像毎にウェブページから語句(一次キーワード候補)を抽出する。画像検索部22は、複数の対象画像について抽出された語句群(一次キーワード候補群)の中で共通する語句(一次キーワード候補)についてはまとめて画像(検索結果画像)を検索する。類似度演算部24は、対象画像毎に、対象画像と検索結果画像との間の類似度を演算する。キーワード候補特定部26は、対象画像毎に、類似度が類似度閾値以上となる検索結果画像の検索に用いられた語句(一次キーワード候補)を、対象画像の最終キーワード候補として特定する。   In the third embodiment, final keyword candidates for a plurality of target images are specified. For example, the web page acquisition unit 18 acquires, for each target image, data of one or a plurality of web pages including similar images of the target image from each web server 14. The word / phrase extraction unit 20 extracts a word / phrase (primary keyword candidate) from the web page for each target image. The image search unit 22 collectively searches for images (search result images) for common phrases (primary keyword candidates) in a group of phrases (primary keyword candidates) extracted for a plurality of target images. The similarity calculation unit 24 calculates the similarity between the target image and the search result image for each target image. The keyword candidate specifying unit 26 specifies, for each target image, a word or phrase (primary keyword candidate) used for searching a search result image whose similarity is equal to or higher than the similarity threshold as a final keyword candidate of the target image.

以下、図10を参照して、第3実施形態について詳しく説明する。図10には、対象画像、一次キーワード候補及び検索結果画像の対応関係の一例が示されている。   Hereinafter, the third embodiment will be described in detail with reference to FIG. 10. FIG. 10 shows an example of the correspondence relationship between the target image, the primary keyword candidate, and the search result image.

一例として、対象画像A,Bのデータが端末装置12からキーワード候補選定装置10に送信され、対象画像A,Bに対する最終キーワード候補を特定するものとする。   As an example, it is assumed that the data of the target images A and B are transmitted from the terminal device 12 to the keyword candidate selection device 10 and the final keyword candidates for the target images A and B are specified.

ウェブページ取得部18は、対象画像Aの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得し、対象画像Bの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する。   The web page acquisition unit 18 acquires data of one or a plurality of web pages including the similar image of the target image A from each web server 14, and data of one or a plurality of web pages including the similar image of the target image B. From each web server 14.

語句抽出部20は、対象画像Aに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出し、対象画像Bに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出する。図10に示すように、一例として、対象画像Aに関して語句a,bが一次キーワード候補として抽出され、対象画像Bに関して語句a,cが一次キーワード候補として抽出されたものとする。語句aは、対象画像A,Bで共通する一次キーワード候補である。   The word / phrase extracting unit 20 extracts words / phrases (primary keyword candidates) from the one or more web pages acquired for the target image A, and words / words (primary keyword candidates) from the one or more web pages acquired for the target image B. To extract. As shown in FIG. 10, for example, it is assumed that the words a and b are extracted as the primary keyword candidates for the target image A and the words a and c are extracted as the primary keyword candidates for the target image B. The word a is a primary keyword candidate common to the target images A and B.

画像検索部22は、共通する語句aについてはまとめて画像を検索する。例えば、語句aに関して検索結果画像αが検索されたものとする。語句b,cは対象画像A,Bで共通する一次キーワード候補ではないので、画像検索部22は、語句b,cについてそれぞれ個別に画像を検索する。例えば、語句bに関して検索結果画像βが検索され、語句cに関して検索結果画像γが検索されたものとする。   The image search unit 22 collectively searches for images of the common word a. For example, it is assumed that the search result image α has been searched for the word a. Since the words and phrases b and c are not primary keyword candidates that are common to the target images A and B, the image search unit 22 searches the images individually for the words and phrases b and c. For example, it is assumed that the search result image β is searched for the word b and the search result image γ is searched for the word c.

類似度演算部24は、検索結果画像と、その検索結果画像の検索に用いられた語句に関する対象画像(その語句が抽出されたウェブページの取得に用いられた対象画像)と、の間の類似度を演算する。図10に示す例では、類似度演算部24は、対象画像Aと検索結果画像αとの間の類似度、対象画像Aと検索結果画像βとの間の類似度、対象画像Bと検索結果画像αとの間の類似度、及び、対象画像Bと検索結果画像γとの間の類似度を演算する。   The similarity calculation unit 24 determines the similarity between the search result image and the target image related to the phrase used to search the search result image (the target image used to acquire the web page from which the phrase was extracted). Calculate the degree. In the example shown in FIG. 10, the similarity calculation unit 24 determines the similarity between the target image A and the search result image α, the similarity between the target image A and the search result image β, the target image B and the search result. The similarity between the image α and the similarity between the target image B and the search result image γ are calculated.

キーワード候補特定部26は、第1実施形態と同様に、対象画像毎に、類似度が類似度閾値以上となる検索結果画像の検索に用いられた語句(一次キーワード候補)を、対象画像の最終キーワード候補として特定する。図10に示す例では、対象画像Aと検索結果画像αとの間の類似度が類似度閾値以上となっているため、検索結果画像αの検索に用いられた語句a(一次キーワード候補)が、対象画像Aに対する最終キーワード候補として特定される。一方、対象画像Aと検索結果画像βとの間の類似度は類似度閾値未満であるため、検索結果画像βの検索に用いられた語句b(一次キーワード候補)は、対象画像Aに対する最終キーワード候補として特定されない。また、対象画像Bと検索結果画像γとの間の類似度が類似度閾値以上となっているため、検索結果画像γの検索に用いられた語句c(一次キーワード候補)が、対象画像Bに対する最終キーワード候補として特定される。一方、対象画像Bと検索結果画像αとの間の類似度は類似度閾値以下であるため、検索結果画像αの検索に用いられた語句a(一次キーワード候補)は、対象画像Bに対する最終キーワード候補として特定されない。   As in the first embodiment, the keyword candidate specifying unit 26 determines, for each target image, the word (primary keyword candidate) used for searching the search result image whose similarity is equal to or higher than the similarity threshold as the final target image. Specify as a keyword candidate. In the example shown in FIG. 10, since the similarity between the target image A and the search result image α is equal to or higher than the similarity threshold, the phrase a (primary keyword candidate) used for searching the search result image α is , Is specified as the final keyword candidate for the target image A. On the other hand, since the similarity between the target image A and the search result image β is less than the similarity threshold, the phrase b (primary keyword candidate) used for searching the search result image β is the final keyword for the target image A. Not identified as a candidate. Further, since the similarity between the target image B and the search result image γ is equal to or higher than the similarity threshold, the phrase c (primary keyword candidate) used for searching the search result image γ is the same as the target image B. It is specified as the final keyword candidate. On the other hand, since the similarity between the target image B and the search result image α is equal to or less than the similarity threshold, the phrase a (primary keyword candidate) used for searching the search result image α is the final keyword for the target image B. Not identified as a candidate.

以上のように、共通する一次キーワード候補についてはまとめて検索結果画像を検索することにより、個々の一次キーワード候補について個別的に検索結果画像を検索する場合と比較して、検索結果画像の検索の効率が向上する。   As described above, by searching the search result images collectively for the common primary keyword candidates, the search result images are searched for in comparison with the case where the search result images are individually searched for the individual primary keyword candidates. Efficiency is improved.

もちろん、第3実施形態においても、第2実施形態と同様に、最終キーワード候補の類義語を新たな最終キーワード候補として特定してもよい。   Of course, in the third embodiment, as in the second embodiment, the synonyms of the final keyword candidates may be specified as new final keyword candidates.

[第4実施形態]
以下、本発明の第4実施形態について説明する。図11には、第2実施形態に係るキーワード候補選定装置10Bが示されている。第4実施形態に係るキーワード候補選定装置10Bは、第1実施形態に係るキーワード候補選定装置10の構成に加えて、共通キーワード候補特定部56を含む。共通キーワード候補特定部56以外の構成は、第1実施形態に係るキーワード候補選定装置10の構成と同じである。もちろん、第4実施形態に係るキーワード候補選定装置10Bは、第2実施形態に係る類義語辞書DB54を含んでいてもよい。
[Fourth Embodiment]
Hereinafter, a fourth embodiment of the present invention will be described. FIG. 11 shows a keyword candidate selection device 10B according to the second exemplary embodiment. The keyword candidate selection device 10B according to the fourth embodiment includes a common keyword candidate identification unit 56 in addition to the configuration of the keyword candidate selection device 10 according to the first embodiment. The configuration other than the common keyword candidate identification unit 56 is the same as the configuration of the keyword candidate selection device 10 according to the first embodiment. Of course, the keyword candidate selection device 10B according to the fourth embodiment may include the synonym dictionary DB 54 according to the second embodiment.

第4実施形態においては、複数の対象画像に対する最終キーワード候補が特定される。複数の対象画像は、各対象画像が喚起する印象(テイスト)に従って、互いに異なるテイストを有する複数のグループに分類されている。その分類は予め行われてもよいし、複数の対象画像のデータを受けたキーワード候補選定装置10Bにて行われてもよい。   In the fourth embodiment, final keyword candidates for a plurality of target images are specified. The plurality of target images are classified into a plurality of groups having different tastes according to the impression (taste) of each target image. The classification may be performed in advance, or may be performed by the keyword candidate selection device 10B that has received data of a plurality of target images.

テイストは、例えば、ある対象に対して人が感じる印象を類型化した嗜好モデルに従って決定される。例えば、対象画像が喚起する印象を数値化することにより、印象類似度としての感性スコアが得られる。感性スコアは、対象画像が印象の喚起に寄与する程度を示す値(印象の強度を示す値)である。感性スコアは、例えば、類型化1類に従った感性評価実験によって得られる。   The taste is determined, for example, according to a preference model that typifies the impression that a person feels for a certain object. For example, by quantifying the impression evoked by the target image, the affective score as the impression similarity can be obtained. The affective score is a value indicating the degree to which the target image contributes to arousing an impression (a value indicating the intensity of the impression). The affective score is obtained, for example, by an affective evaluation experiment according to typification 1.

例えば、対象画像についての感性スコアが予め決定されており、その感性スコアに基づいて対象画像が有するテイストが予め決定され、対象画像にテイストを示す情報が対応付けられている。テイストの一例として、例えば、「温かい印象」、「冷たい印象」、「硬い印象」、「柔らかい印象」、等がある。より具体的には、テイストの一例として、「ワイルド」、「ナチュラル」、「ロマンチック」、「ダイナミック」、「プリティ」、等がある。各テイストが感性スコアとして予め数値化されており、各テイストについての感性スコア、つまり、各テイストを表わす感性スコアが予め決定されている。対象画像についての感性スコアに対応するテイストが、当該対象画像のテイストとして決定される。   For example, the affective score for the target image is predetermined, the taste of the target image is predetermined based on the affective score, and the target image is associated with information indicating the taste. Examples of tastes include, for example, "warm impression", "cold impression", "hard impression", "soft impression", and the like. More specifically, examples of the taste include “wild”, “natural”, “romantic”, “dynamic”, “pretty”, and the like. Each taste is digitized in advance as an affective score, and the affective score for each taste, that is, the affective score representing each taste is determined in advance. The taste corresponding to the affective score of the target image is determined as the taste of the target image.

各対象画像は、テイストに従ってグループに予め分類されている。例えば、互いに同一又は類似のテイストを有する複数の対象画像が、同一のグループに分類され、互いに異なるテイスト(非同一及び非類似のテイスト)を有する複数の対象画像は、それぞれ異なるグループに分類される。なお、互いに類似する複数のテイストとは、例えば、各テイストについての感性スコアの差が予め設定された数値範囲内に含まれる複数のテイストである。   Each target image is pre-classified according to taste. For example, a plurality of target images having the same or similar tastes to each other are classified into the same group, and a plurality of target images having different tastes (non-identical and non-similar tastes) are classified into different groups. .. Note that the plurality of tastes that are similar to each other are, for example, a plurality of tastes in which the difference in the affective score for each taste is included in a preset numerical range.

なお、キーワード候補選定装置10Bの制御部28が、受け付けた対象画像の感性スコアを演算し、その感性スコアに対応するテイストを特定することにより、対象画像が有するテイストを特定してもよい。この場合、制御部28は、各対象画像が有するテイストに従って、各対象画像を同一又は異なるグループに分類してもよい。   The control unit 28 of the keyword candidate selection device 10B may specify the taste of the target image by calculating the affective score of the received target image and specifying the taste corresponding to the affective score. In this case, the control unit 28 may classify each target image into the same or different groups according to the taste of each target image.

第4実施形態においては、例えば、ウェブページ取得部18は、対象画像毎に、対象画像の類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する。語句抽出部20は、対象画像毎にウェブページから語句(一次キーワード候補)を抽出する。画像検索部22は、同一のグループに属する対象画像群について抽出された語句群(一次キーワード候補群)の中で共通する語句(一次キーワード候補)についてはまとめて画像(検索結果画像)を検索する。もちろん、画像検索部22は、共通する語句についてまとめて画像を検索せずに、個々の語句毎に画像を検索してもよい。類似度演算部24は、対象画像毎に、対象画像と検索結果画像との間の類似度を演算する。キーワード候補特定部26は、対象画像毎に、類似度が類似度閾値以上となる検索結果画像の検索に用いられた語句(一次キーワード候補)を、対象画像の最終キーワード候補として特定する。   In the fourth embodiment, for example, the web page acquisition unit 18 acquires, for each target image, data of one or a plurality of web pages including similar images of the target image from each web server 14. The word / phrase extraction unit 20 extracts a word / phrase (primary keyword candidate) from the web page for each target image. The image search unit 22 collectively searches images (search result images) for common phrases (primary keyword candidates) in the phrase groups (primary keyword candidate groups) extracted for the target image groups belonging to the same group. .. Of course, the image search unit 22 may search an image for each word or phrase, instead of collectively searching the images for common words and phrases. The similarity calculation unit 24 calculates the similarity between the target image and the search result image for each target image. The keyword candidate specifying unit 26 specifies, for each target image, a word or phrase (primary keyword candidate) used for searching a search result image whose similarity is equal to or higher than the similarity threshold as a final keyword candidate of the target image.

第4実施形態では、更に、共通キーワード候補特定部56が、グループ毎に、同一のグループに属する対象画像群に共通する最終キーワード候補を、当該同一のグループに属する対象画像群についての共通キーワード候補として特定する。共通キーワード候補が共通属性情報候補の一例に相当する。   In the fourth embodiment, the common keyword candidate specifying unit 56 further sets, for each group, a final keyword candidate common to target image groups belonging to the same group as a common keyword candidate for target image groups belonging to the same group. Specify as. The common keyword candidate corresponds to an example of the common attribute information candidate.

以下、図12及び図13を参照して、第4実施形態について詳しく説明する。図12には、対象画像とグループの一例が示されている。図13には、対象画像、一次キーワード候補及び検索結果画像の対応関係の一例が示されている。   Hereinafter, the fourth embodiment will be described in detail with reference to FIGS. 12 and 13. FIG. 12 shows an example of target images and groups. FIG. 13 shows an example of the correspondence relationship between the target image, the primary keyword candidate, and the search result image.

一例として、対象画像A,B,C,Dのデータが端末装置12からキーワード候補選定装置10Bに送信され、対象画像A,B,C,Dに対する最終キーワード候補を特定するものとする。   As an example, it is assumed that the data of the target images A, B, C, D are transmitted from the terminal device 12 to the keyword candidate selection device 10B, and the final keyword candidates for the target images A, B, C, D are specified.

対象画像A,B,C,Dは、各対象画像が有するテイスト(例えば各対象画像に対応付けられているテイストを示す情報)に従って、同一又は異なるグループに分類されている。図12に示す例では、対象画像A,Bのそれぞれのテイストが同一又は類似であるため、対象画像A,Bが同一のグループXに分類されており、対象画像C,Dのそれぞれのテイストが同一又は類似であるため、対象画像C,Dが同一のグループYに分類されている。この分類は予め行われていてもよいし、キーワード候補選定装置10Bの制御部28によって行われてもよい。   The target images A, B, C, and D are classified into the same or different groups according to the taste of each target image (for example, information indicating the taste associated with each target image). In the example shown in FIG. 12, since the tastes of the target images A and B are the same or similar, the target images A and B are classified into the same group X, and the tastes of the target images C and D are different. The target images C and D are classified into the same group Y because they are the same or similar. This classification may be performed in advance or may be performed by the control unit 28 of the keyword candidate selection device 10B.

以下、図13を参照して、第4実施形態に係る処理について詳しく説明する。   Hereinafter, the processing according to the fourth embodiment will be described in detail with reference to FIG. 13.

ウェブページ取得部18は、対象画像A,B,C,Dのそれぞれについて、類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する。つまり、ウェブページ取得部18は、対象画像Aの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得し、対象画像Bの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得し、対象画像Cの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得し、対象画像Dの類似画像が含まれる1又は複数のウェブページのデータを各ウェブサーバ14から取得する。   The web page acquisition unit 18 acquires, for each of the target images A, B, C, and D, data of one or a plurality of web pages including similar images from each web server 14. That is, the web page acquisition unit 18 acquires data of one or a plurality of web pages including the similar image of the target image A from each web server 14, and one or a plurality of web pages including the similar image of the target image B. Of the target image C is acquired from each web server 14, the data of one or more web pages including the similar image of the target image C is acquired from each web server 14, and the one or more of the similar images of the target image D are included. The web page data is acquired from each web server 14.

語句抽出部20は、対象画像A,B,C,Dのそれぞれに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出する。つまり、語句抽出部20は、対象画像Aに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出し、対象画像Bに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出し、対象画像Cに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出し、対象画像Dに関して取得された1又は複数のウェブページから語句(一次キーワード候補)を抽出する。図13に示すように、一例として、グループXについては、対象画像Aに関して語句a,b,cが一次キーワード候補として抽出され、対象画像Bに関して語句a,b,dが一次キーワード候補として抽出されたものとする。語句a,bは、対象画像A,Bで共通する一次キーワード候補である。グループYに属する対象画像C,Dについては説明を省略するが、グループXと同様に、一次キーワード候補としての語句が抽出される。   The word / phrase extracting unit 20 extracts a word / phrase (primary keyword candidate) from one or a plurality of web pages acquired for each of the target images A, B, C, and D. That is, the word / phrase extracting unit 20 extracts words / phrases (primary keyword candidates) from the one or more web pages acquired for the target image A, and extracts words / words (primary keywords) from the one or more web pages acquired for the target image B. Candidates), and extracts words (primary keyword candidates) from the one or more web pages acquired for the target image C, and extracts words (primary keyword candidates) from the one or more web pages acquired for the target image D. To extract. As shown in FIG. 13, as an example, for group X, words a, b, and c are extracted as primary keyword candidates for target image A, and words a, b, and d are extracted as primary keyword candidates for target image B. It is assumed that The words a and b are primary keyword candidates common to the target images A and B. Although the description of the target images C and D belonging to the group Y is omitted, as with the group X, words and phrases as primary keyword candidates are extracted.

画像検索部22は、グループ毎に、共通する一次キーワード候補についてはまとめて画像を検索する。グループXにおいて、語句a,bは対象画像A,Bで共通する一次キーワード候補であるため、画像検索部22は、共通する語句aについてまとめて画像を検索し、同様に、共通する語句bについてまとめて画像を検索する。語句aに関して検索結果画像αが検索され、語句bに関して検索結果画像βが検索されたものとする。語句c,dは対象画像A,Bで共通する一次キーワード候補ではないので、画像検索部22は、語句c,dについてそれぞれ個別に画像を検索する。例えば、語句cに関して検索結果画像γが検索され、語句dに関して検索結果画像δが検索されたものとする。グループYについてもグループXと同様に、一次キーワード候補を用いて画像が検索される。   The image search unit 22 collectively searches images for common primary keyword candidates for each group. In group X, the words a and b are primary keyword candidates that are common to the target images A and B, so the image search unit 22 searches the images collectively for the common words a and similarly, for the common words b. Search images collectively. It is assumed that the search result image α is searched for the phrase a and the search result image β is searched for the phrase b. Since the words and phrases c and d are not primary keyword candidates that are common to the target images A and B, the image search unit 22 searches the images individually for the words and phrases c and d. For example, it is assumed that the search result image γ is searched for the word c and the search result image δ is searched for the word d. As with the group X, the images of the group Y are searched using the primary keyword candidates.

類似度演算部24は、検索結果画像と、その検索結果画像の検索に用いられた語句に関する対象画像(その語句が抽出されたウェブページの取得に用いられた対象画像)と、の間の類似度を演算する。図13に示す例では、類似度演算部24は、グループXについて、対象画像Aと検索結果画像αとの間の類似度、対象画像Aと検索結果画像βとの間の類似度、対象画像Aと検索結果画像γとの間の類似度、対象画像Bと検索結果画像αとの間の類似度、対象画像Bと検索結果画像βとの間の類似度、及び、対象画像Bと検索結果画像δとの間の類似度を演算する。グループYについてもグループXと同様に、対象画像と検索結果画像との間の類似度が演算される。   The similarity calculation unit 24 determines the similarity between the search result image and the target image related to the phrase used to search the search result image (the target image used to acquire the web page from which the phrase was extracted). Calculate the degree. In the example illustrated in FIG. 13, for the group X, the similarity calculation unit 24 determines the similarity between the target image A and the search result image α, the similarity between the target image A and the search result image β, and the target image. Similarity between A and search result image γ, similarity between target image B and search result image α, similarity between target image B and search result image β, and target image B and search The degree of similarity with the result image δ is calculated. Similar to the group X, the similarity between the target image and the search result image is calculated for the group Y.

キーワード候補特定部26は、第1実施形態と同様に、対象画像毎に、類似度が類似度閾値以上となる検索結果画像の検索に用いられた語句(一次キーワード候補)を、対象画像の最終キーワード候補として特定する。図13に示す例では、対象画像Aと検索結果画像αとの間の類似度が類似度閾値以上となっているため、検索結果画像αの検索に用いられた語句a(一次キーワード候補)が、対象画像Aに対する最終キーワード候補として特定される。同様に、対象画像Aと検索結果画像βとの間の類似度が類似度閾値以上となっているため、検索結果画像βの検索に用いられた語句b(一次キーワード候補)が、対象画像Aに対する最終キーワード候補として特定される。一方、対象画像Aと検索結果画像γとの間の類似度は類似度閾値未満であるため、検索結果画像γの検索に用いられた語句c(一次キーワード候補)は、対象画像Aに対する最終キーワード候補として特定されない。また、対象画像Bと検索結果画像βとの間の類似度が類似度閾値以上となっているため、検索結果画像βの検索に用いられた語句b(一次キーワード候補)が、対象画像Bに対する最終キーワード候補として特定される。一方、対象画像Bと検索結果画像αとの間の類似度は類似度閾値未満であるため、検索結果画像αの検索に用いられた語句aは、対象画像Bに対する最終キーワード候補として特定されない。同様に、対象画像Bと検索結果画像δとの間の類似度は類似度閾値未満であるため、検索結果画像δの検索に用いられた語句dは、対象画像Bに対する最終キーワード候補として特定されない。グループYについてもグループXと同様に、対象画像毎に最終キーワード候補が特定される。   As in the first embodiment, the keyword candidate specifying unit 26 determines, for each target image, the word (primary keyword candidate) used for searching the search result image whose similarity is equal to or higher than the similarity threshold as the final target image. Specify as a keyword candidate. In the example shown in FIG. 13, since the similarity between the target image A and the search result image α is equal to or higher than the similarity threshold, the phrase a (primary keyword candidate) used for searching the search result image α is , Is specified as the final keyword candidate for the target image A. Similarly, since the similarity between the target image A and the search result image β is equal to or higher than the similarity threshold, the phrase b (primary keyword candidate) used for searching the search result image β is the target image A. Is identified as the final keyword candidate for. On the other hand, since the similarity between the target image A and the search result image γ is less than the similarity threshold, the phrase c (primary keyword candidate) used for searching the search result image γ is the final keyword for the target image A. Not identified as a candidate. Further, since the similarity between the target image B and the search result image β is equal to or higher than the similarity threshold, the phrase b (primary keyword candidate) used for searching the search result image β is the same as the target image B. It is specified as the final keyword candidate. On the other hand, since the similarity between the target image B and the search result image α is less than the similarity threshold, the phrase a used for searching the search result image α is not specified as the final keyword candidate for the target image B. Similarly, since the similarity between the target image B and the search result image δ is less than the similarity threshold, the phrase d used for searching the search result image δ is not specified as the final keyword candidate for the target image B. .. As with the group X, the final keyword candidates for the group Y are specified for each target image.

もちろん、第4実施形態においても、第2実施形態と同様に、最終キーワード候補の類義語を新たな最終キーワード候補として特定してもよい。   Of course, also in the fourth embodiment, similar to the second embodiment, a synonym of the final keyword candidate may be specified as a new final keyword candidate.

共通キーワード候補特定部56は、グループXについて、当該グループXに属する対象画像A,Bに共通する最終キーワード候補を、当該グループXに属する対象画像A,Bについての共通キーワード候補として特定する。図13に示す例では、最終キーワード候補としての語句bが、対象画像A,Bに共通する最終キーワード候補である。そのため、語句bが、グループXについての共通キーワード候補として特定される。グループYについてもグループXと同様に、共通キーワード候補が特定される。もちろん、同一グループに属する対象画像群で共通する最終キーワード候補が存在しない場合、そのグループについての共通キーワード候補は特定されない。   The common keyword candidate specifying unit 56 specifies the final keyword candidate common to the target images A and B belonging to the group X as the common keyword candidate for the target images A and B belonging to the group X. In the example shown in FIG. 13, the word b as the final keyword candidate is the final keyword candidate common to the target images A and B. Therefore, the phrase b is specified as a common keyword candidate for the group X. Similar to group X, common keyword candidates are specified for group Y as well. Of course, if there is no final keyword candidate common to the target image groups belonging to the same group, no common keyword candidate for that group is specified.

各対象画像についての最終キーワード候補のデータと、各グループについての共通キーワード候補のデータは、キーワード候補選定装置10Bから端末装置12に送信され、最終キーワード候補と共通キーワード候補が、端末装置12のUI部34に表示される。ユーザがUI部34を使用して、最終キーワード候補とその最終キーワード候補の付与対象となる対象画像を指定すると、ユーザによって指定された最終キーワード候補が、ユーザによって指定された対象画像に対応付けられる。また、ユーザがUI部34を使用して、共通キーワード候補とその共通キーワード候補の付与対象となるグループを指定すると、ユーザによって指定された共通キーワード候補が、ユーザによって指定されたグループに対応付けられる。もちろん、指定された共通キーワード候補が、指定されたグループに属する対象画像に対応付けられてもよい。   The final keyword candidate data for each target image and the common keyword candidate data for each group are transmitted from the keyword candidate selecting device 10B to the terminal device 12, and the final keyword candidate and the common keyword candidate are the UI of the terminal device 12. It is displayed on the section 34. When the user uses the UI unit 34 to specify a final keyword candidate and a target image to which the final keyword candidate is given, the final keyword candidate specified by the user is associated with the target image specified by the user. .. Further, when the user uses the UI unit 34 to specify a common keyword candidate and a group to which the common keyword candidate is given, the common keyword candidate specified by the user is associated with the group specified by the user. .. Of course, the designated common keyword candidate may be associated with the target image belonging to the designated group.

端末装置12又はキーワード候補選定装置10Bにて、最終キーワード候補が、当該最終キーワード候補に対応する対象画像に対応付けられてもよいし、共通キーワード候補が、当該共通キーワード候補に対応するグループやそのグループに属する対象画像に対応付けられてもよい。図13に示す例では、語句a,bが最終キーワード候補として対象画像Aに対応付けられ、語句bが最終キーワード候補として対象画像Bに対応付けられてもよい。また、語句bが共通キーワード候補としてグループXや対象画像A,Bに対応付けられてもよい。グループYについてもグループXと同様に、対象画像に最終キーワード候補が自動的に対応付けられてもよいし、グループYに共通キーワード候補が自動的に対応付けられてもよい。   In the terminal device 12 or the keyword candidate selection device 10B, the final keyword candidate may be associated with the target image corresponding to the final keyword candidate, or the common keyword candidate may be a group corresponding to the common keyword candidate or the group thereof. It may be associated with the target image belonging to the group. In the example shown in FIG. 13, the phrases a and b may be associated with the target image A as final keyword candidates, and the phrase b may be associated with the target image B as final keyword candidates. Further, the phrase b may be associated with the group X and the target images A and B as common keyword candidates. Similarly to the group X, for the group Y, the final keyword candidate may be automatically associated with the target image, or the common keyword candidate may be automatically associated with the group Y.

以上のように、第4実施形態においては、同一グループに属する対象画像群について共通する最終キーワード候補が、当該グループについての共通キーワード候補として特定される。これにより、同一グループに属する対象画像群について共通しない最終キーワード候補を当該グループについての共通キーワード候補として特定する場合と比較して、当該グループを表現するのによりふさわしい語句(最終キーワード候補)が共通キーワード候補として特定される。   As described above, in the fourth embodiment, the final keyword candidate common to the target image groups belonging to the same group is specified as the common keyword candidate for the group. As a result, compared to the case where the final keyword candidates that are not common to the target image groups that belong to the same group are specified as the common keyword candidates for the group, the phrase (final keyword candidate) that is more suitable for expressing the group is the common keyword. Identified as a candidate.

上記のキーワード候補選定装置10,10A,10B及び端末装置12のそれぞれは、一例としてハードウェア資源とソフトウェアとの協働により実現される。具体的には、キーワード候補選定装置10,10A,10B及び端末装置12のそれぞれは、図示しないCPU等の1又は複数のプロセッサを備えている。当該プロセッサが、図示しない記憶装置に記憶されたプログラムを読み出して実行することにより、キーワード候補選定装置10,10A,10B及び端末装置12のそれぞれの各部の機能が実現される。上記プログラムは、CDやDVD等の記録媒体を経由して、又は、ネットワーク等の通信経路を経由して、記憶装置に記憶される。または、キーワード候補選定装置10,10A,10B及び端末装置12のそれぞれの各部は、例えばプロセッサや電子回路等のハードウェア資源により実現されてもよい。その実現においてメモリ等のデバイスが利用されてもよい。別の例として、キーワード候補選定装置10,10A,10B及び端末装置12のそれぞれの各部は、DSP(Digital Signal Processor)やFPGA(Field Programmable Gate Array)等によって実現されてもよい。   Each of the above keyword candidate selection devices 10, 10A, 10B and the terminal device 12 is realized by the cooperation of hardware resources and software, for example. Specifically, each of the keyword candidate selection devices 10, 10A, 10B and the terminal device 12 includes one or more processors such as a CPU (not shown). The processor reads and executes a program stored in a storage device (not shown), whereby the functions of the respective units of the keyword candidate selection devices 10, 10A, 10B and the terminal device 12 are realized. The program is stored in the storage device via a recording medium such as a CD or a DVD, or via a communication path such as a network. Alternatively, the respective units of the keyword candidate selection device 10, 10A, 10B and the terminal device 12 may be realized by hardware resources such as a processor and an electronic circuit. A device such as a memory may be used in the realization thereof. As another example, each part of the keyword candidate selection devices 10, 10A, 10B and the terminal device 12 may be realized by a DSP (Digital Signal Processor), an FPGA (Field Programmable Gate Array), or the like.

10,10A,10B キーワード候補選定装置、12 端末装置、14 ウェブサーバ、16 通信部、18 ウェブページ取得部、20 語句抽出部、22 画像検索部、24 類似度演算部、26 キーワード候補特定部、28 制御部、54 類義語辞書DB、56 共通キーワード候補特定部。   10, 10A, 10B keyword candidate selection device, 12 terminal device, 14 web server, 16 communication unit, 18 web page acquisition unit, 20 word extraction unit, 22 image search unit, 24 similarity calculation unit, 26 keyword candidate specifying unit, 28 control unit, 54 synonym dictionary DB, 56 common keyword candidate specifying unit.

Claims (8)

対象画像に類似する第1画像が含まれる抽出対象データに出現する語句を抽出する抽出手段と、
前記抽出された語句を用いて第2画像を検索する画像検索手段と、
前記対象画像に類似する第2画像の検索に用いられた語句を、前記対象画像の画像属性情報候補として特定する第1特定手段と、
を有する情報処理装置。
Extraction means for extracting a word or phrase that appears in the extraction target data including the first image similar to the target image;
An image search means for searching the second image using the extracted words and phrases;
First specifying means for specifying a word or phrase used for searching for a second image similar to the target image as an image attribute information candidate of the target image;
Information processing device having a.
前記第1特定手段は、前記画像属性情報候補に関連する語句を前記対象画像の新たな画像属性情報候補として更に特定する、
ことを特徴とする請求項1に記載の情報処理装置。
The first specifying unit further specifies a word or phrase related to the image attribute information candidate as a new image attribute information candidate of the target image,
The information processing apparatus according to claim 1, wherein:
前記画像属性情報候補に関連する語句は、類義語群を定義する類義語辞書情報から抽出された、前記画像属性情報候補の類義語である、
ことを特徴とする請求項2に記載の情報処理装置。
The phrase related to the image attribute information candidate is a synonym of the image attribute information candidate extracted from the synonym dictionary information defining a synonym group,
The information processing apparatus according to claim 2, wherein:
複数の対象画像がある場合、前記抽出手段は、対象画像毎に語句を抽出し、
前記画像検索手段は、前記複数の対象画像について抽出された語句群のうち共通する語句についてはまとめて前記第2画像を検索する、
ことを特徴とする請求項1から請求項3のいずれか一項に記載の情報処理装置。
When there are a plurality of target images, the extracting means extracts a phrase for each target image,
The image search means collectively searches the second image for common words / phrases in the word / phrase group extracted for the plurality of target images.
The information processing apparatus according to any one of claims 1 to 3, characterized in that:
前記複数の対象画像は、各対象画像が有する印象に従って、互いに異なる印象を有する複数のグループに分類されており、
前記画像検索手段は、前記グループ毎に、同一の前記グループに属する対象画像群について抽出された語句群のうち共通する語句についてはまとめて前記第2画像を検索し、
当該情報処理装置は、
前記グループ毎に、前記第2画像を用いて特定された前記画像属性情報候補であって、同一の前記グループに属する前記対象画像群に共通する前記画像属性情報候補を、同一の前記グループに属する前記対象画像群についての共通属性情報候補として特定する第2特定手段を更に有する、
ことを特徴とする請求項4に記載の情報処理装置。
The plurality of target images are classified into a plurality of groups having different impressions according to the impression of each target image,
The image search means collectively searches the second image for common words / phrases among the word / phrase groups extracted for the target image groups belonging to the same group for each group,
The information processing device is
For each of the groups, the image attribute information candidates identified by using the second image, and the image attribute information candidates that are common to the target image groups that belong to the same group belong to the same group. Further comprising second specifying means for specifying as a common attribute information candidate for the target image group,
The information processing apparatus according to claim 4, wherein:
前記第1特定手段は、前記対象画像との間の類似度が予め設定された閾値以上となる前記第2画像の検索に用いられた語句を、前記対象画像の前記画像属性情報候補として特定する、
ことを特徴とする請求項1から請求項5のいずれか一項に記載の情報処理装置。
The first specifying unit specifies, as the image attribute information candidate of the target image, a phrase used for searching for the second image having a similarity with the target image equal to or greater than a preset threshold value. ,
The information processing apparatus according to any one of claims 1 to 5, characterized in that:
前記画像属性情報候補を表示手段に表示させる制御手段を更に有する、
ことを特徴とする請求項1から請求項6のいずれか一項に記載の情報処理装置。
Further comprising control means for displaying the image attribute information candidates on a display means,
The information processing apparatus according to any one of claims 1 to 6, characterized in that.
コンピュータを、
対象画像に類似する第1画像が含まれる抽出対象データに出現する語句を抽出する抽出手段、
前記抽出された語句を用いて第2画像を検索する画像検索手段、
前記対象画像に類似する第2画像の検索に用いられた語句を、前記対象画像の画像属性情報候補として特定する特定手段、
として機能させるプログラム。
Computer,
Extraction means for extracting a word or phrase that appears in the extraction target data including the first image similar to the target image,
An image search means for searching the second image using the extracted words and phrases;
Specifying means for specifying a word or phrase used for searching for a second image similar to the target image as a candidate for image attribute information of the target image;
Program to function as.
JP2016150364A 2016-07-29 2016-07-29 Information processing device and program Active JP6696344B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016150364A JP6696344B2 (en) 2016-07-29 2016-07-29 Information processing device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016150364A JP6696344B2 (en) 2016-07-29 2016-07-29 Information processing device and program

Publications (2)

Publication Number Publication Date
JP2018018428A JP2018018428A (en) 2018-02-01
JP6696344B2 true JP6696344B2 (en) 2020-05-20

Family

ID=61081737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016150364A Active JP6696344B2 (en) 2016-07-29 2016-07-29 Information processing device and program

Country Status (1)

Country Link
JP (1) JP6696344B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7171349B2 (en) * 2018-09-28 2022-11-15 富士フイルム株式会社 Image processing device, image processing method, program and recording medium
JP2020194472A (en) * 2019-05-30 2020-12-03 オリンパス株式会社 Server, display method, creation method, and program

Also Published As

Publication number Publication date
JP2018018428A (en) 2018-02-01

Similar Documents

Publication Publication Date Title
CN110325986B (en) Article processing method, article processing device, server and storage medium
CN107193962B (en) Intelligent map matching method and device for Internet promotion information
US8606733B2 (en) System and method for classification and selection of color palettes
JP6381775B2 (en) Information processing system and information processing method
US20150269163A1 (en) Providing search recommendation
KR102170206B1 (en) Information Search System and Method using keyword and relation information
US20140201180A1 (en) Intelligent Supplemental Search Engine Optimization
US20180081880A1 (en) Method And Apparatus For Ranking Electronic Information By Similarity Association
JP6033697B2 (en) Image evaluation device
JP6428795B2 (en) Model generation method, word weighting method, model generation device, word weighting device, device, computer program, and computer storage medium
KR101355945B1 (en) On line context aware advertising apparatus and method
KR20200087977A (en) Multimodal ducument summary system and method
JP6664599B2 (en) Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program
KR100876214B1 (en) Apparatus and method for context aware advertising and computer readable medium processing the method
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
JP6696344B2 (en) Information processing device and program
JP6446987B2 (en) Video selection device, video selection method, video selection program, feature amount generation device, feature amount generation method, and feature amount generation program
JP2016045552A (en) Feature extraction program, feature extraction method, and feature extraction device
JP2016038667A (en) Information provision device, information provision method and information provision program
JP5368900B2 (en) Information presenting apparatus, information presenting method, and program
CN113704623A (en) Data recommendation method, device, equipment and storage medium
JP5844887B2 (en) Support for video content search through communication network
JP5277090B2 (en) Link creation support device, link creation support method, and program
JP2004206571A (en) Method, device, and program for presenting document information, and recording medium
JP7037778B2 (en) Search device and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200406

R150 Certificate of patent or registration of utility model

Ref document number: 6696344

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350