JP2007026316A - Image management device, image-managing computer program and recording medium recording the same - Google Patents

Image management device, image-managing computer program and recording medium recording the same Download PDF

Info

Publication number
JP2007026316A
JP2007026316A JP2005210374A JP2005210374A JP2007026316A JP 2007026316 A JP2007026316 A JP 2007026316A JP 2005210374 A JP2005210374 A JP 2005210374A JP 2005210374 A JP2005210374 A JP 2005210374A JP 2007026316 A JP2007026316 A JP 2007026316A
Authority
JP
Japan
Prior art keywords
image
recognition result
recognition
person
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005210374A
Other languages
Japanese (ja)
Inventor
Akihiro Yamazaki
章弘 山▲崎▼
Hirobumi Mochizuki
博文 望月
Mutsumi Yoshida
睦 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2005210374A priority Critical patent/JP2007026316A/en
Publication of JP2007026316A publication Critical patent/JP2007026316A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image management device capable of reducing trouble of information addition to individual image data, and allowing accurate retrieval. <P>SOLUTION: A plurality of image data including a person image are stored in a photograph database 20. A person image detection part 31 extracts a person image (e.g. face image) area inside each the image data. Image is recognized by a person image recognition processing part 32 in an image of the extracted area, and a recognition result is stored in the photograph database 20. Correction input of the recognition result by a user is received by a correction input reception part 34. According thereto, a recognition result correction processing part 35 corrects the recognition result stored in the photograph database 20. The the image data is retrieved by an image retrieval processing part 39 according to a retrieval condition received through a retrieval condition input reception part 38. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この発明は、人物画像を含む複数枚の画像データを管理するための画像管理装置、コンピュータをそのような画像管理装置として機能させるためのコンピュータプログラム、およびこのようなプログラムを記録したコンピュータ読取可能な記録媒体に関する。   The present invention relates to an image management apparatus for managing a plurality of pieces of image data including a person image, a computer program for causing a computer to function as such an image management apparatus, and a computer readable recording such a program The present invention relates to a recording medium.

多数枚の写真データから特定の人物を写した写真データを検索するための従来技術は、下記特許文献1〜3に開示されている。
特許文献1および2には、予め個々の写真に名前、日付その他の情報を予め付加しておき、この情報を元に特定の写真を検索する技術が開示されている。しかし、個々の写真に名前等の情報を付加する作業が検索の前提となるため、検索機能の利用のための準備に膨大な手間がかかる。
Conventional techniques for searching for photographic data showing a specific person from a large number of photographic data are disclosed in Patent Documents 1 to 3 below.
Patent Documents 1 and 2 disclose a technique in which names, dates, and other information are added in advance to individual photos, and specific photos are searched based on this information. However, since the task of adding information such as a name to each photo is a precondition for the search, it takes a great deal of time to prepare for using the search function.

一方、特許文献3には、画像認識技術を用いて個々の写真に自動的に情報付けを行い、その情報に基づいて目的の写真を検索する技術についての開示がある。しかし、複数枚の写真のなかにさまざまなポーズで写っている人物の自動認識は容易ではないから、自動で付与された情報の信頼性が低い。そのため、正確な検索結果を得難いという問題がある。
特開平11−066089号公報 特開2001−084274号公報 特開平11−250071号公報
On the other hand, Patent Document 3 discloses a technique for automatically attaching information to individual photographs using an image recognition technique and retrieving a target photograph based on the information. However, since it is not easy to automatically recognize a person in various poses in a plurality of photos, the reliability of information automatically assigned is low. Therefore, there is a problem that it is difficult to obtain an accurate search result.
Japanese Patent Laid-Open No. 11-066089 JP 2001-084274 A Japanese Patent Laid-Open No. 11-250071

そこで、この発明の目的は、個々の画像データに対する情報付加の手間を軽減でき、かつ、正確な検索が可能な画像管理装置を提供することである。
また、この発明の他の目的は、コンピュータをそのような画像管理装置として機能させるためのコンピュータプログラムを提供することである。
この発明のさらに他の目的は、そのようなコンピュータプログラムを記録した記録媒体を提供することである。
SUMMARY OF THE INVENTION An object of the present invention is to provide an image management apparatus that can reduce the effort of adding information to individual image data and can perform an accurate search.
Another object of the present invention is to provide a computer program for causing a computer to function as such an image management apparatus.
Still another object of the present invention is to provide a recording medium on which such a computer program is recorded.

上記の目的を達成するための請求項1記載の発明は、人物画像(たとえば顔画像)を含む複数枚の画像データを記憶するための画像データ記憶手段と、この画像データ記憶手段に記憶されている個々の画像データ中の人物画像を認識する人物画像認識手段と、この人物画像認識手段による認識結果を各画像データに対応付けて記憶するための認識結果記憶手段と、前記人物画像認識手段による認識結果を修正するための修正入力を受け付ける修正入力受付手段と、この修正入力受付手段によって受け付けられた修正入力に応じて、前記認識結果記憶手段に記憶されている認識結果を修正する認識結果修正手段とを含むことを特徴とする画像管理装置である。   In order to achieve the above object, the invention according to claim 1 is an image data storage means for storing a plurality of pieces of image data including a person image (for example, a face image), and is stored in the image data storage means. A person image recognizing means for recognizing a person image in the individual image data, a recognition result storing means for storing the recognition result by the person image recognizing means in association with each image data, and the person image recognizing means. A correction input receiving means for receiving a correction input for correcting the recognition result, and a recognition result correction for correcting the recognition result stored in the recognition result storage means in accordance with the correction input received by the correction input receiving means. And an image management apparatus.

この構成によれば、複数枚の画像データ中の人物画像が人物画像認識手段によって認識されて、認識結果記憶手段に記憶される。この認識結果に対する修正入力が、修正入力受付手段によって受け付けられる。修正入力受付手段によって修正入力が受け付けられると、その修正入力に従って、認識結果修正手段が認識結果を修正する。こうして、人物画像認識手段による人物画像認識処理を操作者の修正入力によって補う構成により、個々の画像データに対して、正確な情報を少ない手数で付加することができる。このようにして付加された情報を用いることにより、画像データの正確な検索が可能になる。   According to this configuration, human images in a plurality of pieces of image data are recognized by the human image recognition unit and stored in the recognition result storage unit. A correction input for this recognition result is received by the correction input receiving means. When the correction input is received by the correction input receiving means, the recognition result correcting means corrects the recognition result according to the correction input. Thus, accurate information can be added to individual image data with a small number of steps by a configuration in which the person image recognition process by the person image recognition means is supplemented by correction input by the operator. By using the information added in this way, it is possible to accurately search image data.

前記人物画像認識手段は、画像中の人物を特定できる任意の特徴に基づいて人物認識処理を行うものであってもよい。そのような特徴の例としては、画像中の人物の顔画像、人物の全体像、半身像、服装(着衣の色など)を挙げることができる。
前記修正入力受付手段は、複数の認識候補(候補人物)のうちのいずれかの選択入力を受け付けるものであってもよい。これにより、認識結果を容易に修正することができる。
The person image recognition means may perform person recognition processing based on an arbitrary feature that can identify a person in an image. Examples of such features include a face image of a person in the image, a whole image of the person, a half-body image, and clothes (color of clothes, etc.).
The correction input accepting unit may accept a selection input of any of a plurality of recognition candidates (candidate persons). Thereby, the recognition result can be easily corrected.

また、前記修正入力受付手段は、前記人物画像認識手段による認識候補外の新規認識候補の入力を受け付ける新規登録手段をさらに含むことが好ましい。これにより、人物画像認識手段による認識が不可能な人物画像についても、適切な情報を付加することができる。
前記修正入力受付手段は、画像中の人物画像(好ましくは、使用者が選択する任意の人物画像)に対して、「付加情報なし」を登録する付加情報なし登録手段を含むことが好ましい。たとえば、見ず知らずの他人の人物画像について「付加情報なし」を登録しておくことにより、必要な人物画像の検索をより正確に行える。
Moreover, it is preferable that the said correction input reception means further includes the new registration means which receives the input of the new recognition candidate other than the recognition candidate by the said person image recognition means. Accordingly, appropriate information can be added to a person image that cannot be recognized by the person image recognition means.
The correction input accepting unit preferably includes a registration unit without additional information for registering “no additional information” for a person image in the image (preferably, an arbitrary person image selected by the user). For example, by registering “no additional information” for a stranger person image of a stranger, a necessary person image can be searched more accurately.

請求項2記載の発明は、前記画像データ記憶手段に記憶されている画像データとともに前記人物画像認識手段による認識結果を表示装置に表示するための表示信号を生成する表示信号生成手段をさらに含むことを特徴とする請求項1記載の画像管理装置である。この構成によれば、操作者は、認識結果を視覚により確認しながら、その修正を行うことができる。   The invention according to claim 2 further includes display signal generation means for generating a display signal for displaying the recognition result by the person image recognition means on the display device together with the image data stored in the image data storage means. The image management apparatus according to claim 1. According to this configuration, the operator can correct the recognition result while visually confirming the recognition result.

前記修正入力受付手段が、複数の認識候補のうちのいずれかの選択入力を受け付けるものである場合には、前記表示信号生成手段は、複数の認識候補を表示するための表示信号を生成するものであることが好ましい。
請求項3記載の発明は、人物画像の認識のための辞書データを記憶する辞書記憶手段と、前記認識結果修正手段によって修正された認識結果に基づき、前記辞書記憶手段の辞書データを修正する辞書修正手段とをさらに含み、前記人物画像認識手段は、前記辞書記憶手段に記憶されている辞書データに基づいて、画像データ中の人物画像を認識するものであることを特徴とする請求項1または2記載の画像管理装置である。
When the correction input accepting unit accepts a selection input from among a plurality of recognition candidates, the display signal generating unit generates a display signal for displaying the plurality of recognition candidates. It is preferable that
The invention according to claim 3 is a dictionary storing means for storing dictionary data for recognizing a person image, and a dictionary for correcting dictionary data in the dictionary storing means based on the recognition result corrected by the recognition result correcting means. The human image recognition means further comprises a correction means for recognizing a human image in the image data based on dictionary data stored in the dictionary storage means. 2. The image management apparatus according to 2.

この構成によれば、認識結果が修正されると、人物画像の認識のための辞書データが修正される。これにより、操作者が修正操作を行うたびに、辞書データの精度が高められ、人物画像認識の精度が高くなっていく。これにより、画像データに対する情報の付加をさらに効率的に行うことができるようになる。
前記修正入力受付手段が、前記新規登録手段を含むものである場合には、前記辞書修正手段は、新規登録された新規認識候補のデータを前記辞書データに追加するものであることが好ましい。これにより、画像認識可能な認識候補を増やすことができる。こうして、新規登録操作によって、認識候補のデータを辞書データ中に蓄積していくことができるから、人物画像認識精度が高められ、使用者による修正入力作業を減らしていくことができる。
According to this configuration, when the recognition result is corrected, dictionary data for recognizing the person image is corrected. Thereby, every time the operator performs a correction operation, the accuracy of the dictionary data is increased, and the accuracy of the human image recognition is increased. As a result, information can be added to the image data more efficiently.
When the correction input receiving means includes the new registration means, it is preferable that the dictionary correction means adds newly registered new recognition candidate data to the dictionary data. Thereby, the recognition candidates which can recognize an image can be increased. In this way, recognition candidate data can be accumulated in the dictionary data by a new registration operation, so that human image recognition accuracy can be improved and correction input work by the user can be reduced.

辞書データは、認識候補毎の特徴量データの集合である。特徴量データは、認識候補の画像データであってもよいし、そのような画像データから抽出された所定の特徴量を表すものであってもよい。
請求項4記載の発明は、前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、前記辞書修正手段は、前記確定された認識結果に基づいて前記辞書記憶手段の辞書データを修正する手段を含むことを特徴とする請求項3記載の画像管理装置である。
Dictionary data is a set of feature data for each recognition candidate. The feature amount data may be recognition candidate image data, or may represent a predetermined feature amount extracted from such image data.
The invention according to claim 4 further includes a recognition result determination unit for determining a recognition result stored in the recognition result storage unit, wherein the dictionary correction unit is configured to use the dictionary based on the determined recognition result. 4. The image management apparatus according to claim 3, further comprising means for correcting dictionary data in the storage means.

この構成によれば、認識結果が確定されることにより、辞書データが修正される。より具体的には、或る人物画像に対する認識結果が確定されると、当該人物画像に対して同一の認識結果が得られる確率を高めるように、辞書データが修正される。さらに具体的に言えば、認識結果が確定された人物画像の特徴量データが、当該認識結果の認識候補に対応する辞書データとして辞書記憶手段に追記されるようになっていてもよい。このような辞書データを用いて人物画像認識処理を行うことにより、個々の認識候補について、様々なポーズや照明条件などでの特徴量データが蓄積されていくから、高精度な人物認識が可能になる。   According to this configuration, the dictionary data is corrected by confirming the recognition result. More specifically, when the recognition result for a certain person image is determined, the dictionary data is corrected so as to increase the probability that the same recognition result is obtained for the person image. More specifically, the feature amount data of the person image for which the recognition result is confirmed may be added to the dictionary storage means as dictionary data corresponding to the recognition candidate of the recognition result. By performing person image recognition processing using such dictionary data, feature amount data in various poses and lighting conditions is accumulated for each recognition candidate, enabling highly accurate person recognition. Become.

前記認識結果確定手段は、使用者によって認識結果が追認されたことを表す追認完了データを所定の追認完了データ記憶手段に書き込むものであってもよい。たとえば、追認完了データは、認識結果の確定/未確定を表す「確定フラグ」であってもよい。
前記認識結果確定手段は、前記認識結果修正手段によって修正された認識結果を自動確定する手段を含むものであってもよい。この場合、確定された認識結果に基づいて辞書データを修正することにより、結果的に、認識結果修正手段によって修正された認識結果に基づく辞書データの修正の目的を達することができる。
The recognition result determination means may write confirmation completion data indicating that the recognition result has been confirmed by the user into a predetermined confirmation completion data storage means. For example, the confirmation completion data may be a “confirmation flag” indicating confirmation / unconfirmation of the recognition result.
The recognition result determining means may include means for automatically determining the recognition result corrected by the recognition result correcting means. In this case, by correcting the dictionary data based on the confirmed recognition result, the purpose of correcting the dictionary data based on the recognition result corrected by the recognition result correcting means can be achieved as a result.

また、認識結果を確定するための確定入力を受け付ける確定入力受付手段がさらに備えられていてもよい。この場合、前記認識結果確定手段は、前記確定入力受付手段によって確定入力が受け付けられたことに応答して、前記認識結果記憶手段に記憶されている認識結果を確定する手段を含むことが好ましい。
前記人物画像認識手段は、前記認識結果確定手段によって認識結果が確定された人物画像を、認識処理の対象から除外するものであることが好ましい。これにより、正しい認識結果に修正が加えられることを防止できる。
Further, a confirmation input accepting unit that accepts a confirmation input for confirming the recognition result may be further provided. In this case, it is preferable that the recognition result confirmation unit includes a unit that confirms the recognition result stored in the recognition result storage unit in response to the confirmation input received by the confirmation input reception unit.
It is preferable that the person image recognizing unit excludes a human image whose recognition result is confirmed by the recognition result confirming unit from a recognition process target. Thereby, it is possible to prevent the correct recognition result from being corrected.

請求項5記載の発明は、前記認識結果記憶手段に記憶されている認識結果に基づいて画像データを検索する検索手段をさらに含むことを特徴とする請求項1ないし4のいずれかに記載の画像管理装置である。
この構成によれば、画像データに付加された正確な情報に基づいて画像データを検索できるので、目的の人物画像を含む画像データを高精度に検索できるようになる。
The invention according to claim 5 further includes a search means for searching image data based on the recognition result stored in the recognition result storage means. It is a management device.
According to this configuration, the image data can be searched based on the accurate information added to the image data, so that the image data including the target person image can be searched with high accuracy.

請求項6記載の発明は、前記人物画像認識手段は、人物画像が認識候補の画像である尤度を複数の認識候補についてそれぞれ演算する尤度演算手段と、複数の人物画像を含む画像データ中において、最大尤度の認識候補が2以上の人物画像間で重複する場合に、前記尤度演算手段によって求められた尤度に従って認識候補の優先順位を定める優先順位設定手段とを含むことを特徴とする請求項1ないし5のいずれかに記載の画像管理装置である。   According to a sixth aspect of the present invention, the person image recognition means includes likelihood calculation means for calculating the likelihood that the person image is a recognition candidate image for each of a plurality of recognition candidates, and image data including a plurality of person images. And a priority setting unit that determines the priority of the recognition candidate according to the likelihood obtained by the likelihood calculating unit when the maximum likelihood recognition candidate overlaps between two or more person images. An image management apparatus according to any one of claims 1 to 5.

この構成によれば、人物画像認識手段は、認識候補ごとの尤度を計算し、その尤度に基づく順位で認識結果を定めることができる。一方、写真撮影された画像のように現実の情景を撮影した画像中には、原則として、同一人物の画像が重複して存在することはない。そこで、一つの画像データ中の2以上の人物画像について、各最大尤度の認識候補が重複する場合には、その最大尤度が互いに比較される。そして、最大尤度の大きい方の人物画像について、その認識候補が優先され、他の人物画像についての認識候補は2位以下の尤度の認識候補に変更される。こうして、合理的な認識結果を得ることができるから、使用者による認識結果修正の手数を少なくすることができる。   According to this configuration, the person image recognition means can calculate the likelihood for each recognition candidate and can determine the recognition result based on the order based on the likelihood. On the other hand, as a general rule, images of a real scene such as a photographed image do not have duplicate images of the same person. Therefore, when the recognition candidates of the maximum likelihood overlap for two or more person images in one image data, the maximum likelihoods are compared with each other. The recognition candidate is given priority for the person image having the largest maximum likelihood, and the recognition candidates for the other person images are changed to the recognition candidates having the second or lower likelihood. Thus, since a reasonable recognition result can be obtained, the number of steps for correcting the recognition result by the user can be reduced.

請求項7記載の発明は、前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、前記修正入力受付手段は、使用者に対して、複数の認識候補の選択肢を提示する選択候補提示手段を含み、複数の人物画像を含む画像データ中において、いずれかの人物画像の認識結果が前記認識結果確定手段によって確定された場合に、当該画像データ中の認識結果未確定の人物画像について前記選択候補提示手段によって提示される認識候補の選択肢から、前記確定された認識結果を除外する認識候補除外手段をさらに含むことを特徴とする請求項1ないし6のいずれかに記載の画像管理装置である。   The invention according to claim 7 further includes a recognition result confirmation means for confirming a recognition result stored in the recognition result storage means, wherein the correction input accepting means provides a plurality of recognition candidates to the user. A recognition candidate in the image data when the recognition result of one of the person images is determined by the recognition result determination means in the image data including a plurality of person images. The recognition candidate excluding means for excluding the confirmed recognition result from the recognition candidate options presented by the selection candidate presenting means for a human image whose result is not yet confirmed, further comprising: The image management apparatus according to claim 1.

この構成では、使用者は、選択候補提示手段によって提示される認識候補の選択肢のなかから、いずれかを選択することによって、認識結果の修正を行うことができる。
写真撮影された画像のように現実の情景を撮影した画像中には、原則として、同一人物の画像が重複して存在することはない。そこで、画像データ中のいずれかの人物画像について、認識結果が確定されると、未確定人物画像については、認識候補の選択肢から当該確定された認識結果の認識候補が排除される。これにより、選択候補提示手段によって、合理的な選択候補のみが提示されることになるから、使用者は、認識候補の選択を行いやすく、また、入力ミスも少なくできる。これにより、画像データに対する情報の付加をより効率的に行うことができる。
In this configuration, the user can correct the recognition result by selecting one of the recognition candidate options presented by the selection candidate presenting unit.
In principle, there is no duplicate image of the same person in an image of a real scene such as a photographed image. Therefore, when the recognition result is confirmed for any person image in the image data, the recognition candidate for the confirmed recognition result is excluded from the choices of recognition candidates for the unconfirmed person image. As a result, only reasonable selection candidates are presented by the selection candidate presenting means, so that the user can easily select recognition candidates and input errors can be reduced. Thereby, it is possible to more efficiently add information to the image data.

請求項8記載の発明は、前記人物画像認識手段は、認識結果データとして、認識結果に対応するインデックス画像データを特定するインデックス画像特定データを生成するものであることを特徴とする請求項1ないし7のいずれかに記載の画像管理装置である。
この構成によれば、インデックス画像特定データが認識結果データとして生成される。これにより、インデックス画像特定データによって特定されるインデックス画像データを、画像データ中の人物画像に対する付加情報として使用することができる。こうして、より直感的な把握が可能な形式の情報(インデックス画像)を画像データに付加することができる。
The invention according to claim 8 is characterized in that the person image recognition means generates index image specifying data for specifying index image data corresponding to the recognition result as the recognition result data. The image management apparatus according to any one of claims 7 to 9.
According to this configuration, index image specifying data is generated as recognition result data. Thereby, the index image data specified by the index image specifying data can be used as additional information for the person image in the image data. In this way, information (index image) in a format that allows more intuitive grasping can be added to the image data.

この場合に、インデックス画像特定データに対応するインデックス画像を予め記憶するインデックス画像データ記憶手段が備えられていることが好ましい。さらに、請求項2の発明の構成の場合には、表示信号生成手段は、認識結果としてのインデックス画像特定データに対応するインデックス画像データをインデックス画像データ記憶手段から読み出し、そのインデックス画像データを認識結果として表示手段に表示するための表示信号を生成するものであることが好ましい。   In this case, it is preferable that an index image data storage unit that stores in advance an index image corresponding to the index image specifying data is provided. Further, in the case of the configuration of the invention of claim 2, the display signal generation means reads index image data corresponding to the index image specifying data as the recognition result from the index image data storage means, and the index image data is recognized as the recognition result. It is preferable to generate a display signal for display on the display means.

前記インデックス画像データは、人物候補を識別可能な画像を表すデータであればよく、たとえば、人物候補の代表的な顔画像であってもよいし、アイコン、キャラクタその他の簡易表示画像であってもよい。
請求項9記載の発明は、前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、前記画像データ記憶手段に記憶される画像データは、順序付けされており、前記人物画像認識手段は、前記順序付けに従って前記画像データ記憶手段に記憶されている複数枚の画像データに関して人物画像認識処理を実行するものであり、前記認識結果確定手段によって確定された認識結果に対応した画像データ以前の順位の画像データに関する認識結果を自動確定(未確定の認識結果をすべて確定)する認識結果自動確定手段をさらに含むことを特徴とする請求項1ないし8のいずれかに記載の画像管理装置である。
The index image data may be data representing an image that can identify a person candidate. For example, the index image data may be a representative face image of a person candidate, an icon, a character, or another simple display image. Good.
The invention according to claim 9 further includes a recognition result determination means for determining a recognition result stored in the recognition result storage means, and the image data stored in the image data storage means are ordered. The person image recognition means executes person image recognition processing for a plurality of image data stored in the image data storage means according to the ordering, and the recognition result confirmed by the recognition result confirmation means 9. A recognition result automatic confirming unit for automatically confirming recognition results regarding image data of a rank prior to corresponding image data (all unconfirmed recognition results are confirmed). Image management apparatus.

たとえば、操作者は、画像データの順に認識結果を閲覧して必要な修正を行っていく。その場合に、途中の画像データに関する認識結果については、逐一、これを確定する必要はない。すなわち、その後の順序の画像データに関する認識結果が確定されることによって、当該画像データ以前の順序の画像データに関する認識結果が自動確定される。こうして、操作者の入力の手間を著しく軽減することができる。   For example, the operator browses the recognition results in the order of the image data and performs necessary corrections. In this case, it is not necessary to confirm the recognition result regarding the intermediate image data one by one. That is, the recognition result regarding the image data in the order before the image data is automatically determined by determining the recognition result regarding the image data in the subsequent order. In this way, the operator's input effort can be significantly reduced.

前記認識結果確定手段は、使用者によって認識結果が追認されたことを表す追認完了データを所定の追認完了データ記憶手段に書き込むものであってもよい。
請求項10記載の発明は、人物画像を含む複数枚の画像データを管理するための画像管理装置としてコンピュータを動作させるためのコンピュータプログラムであって、前記コンピュータは、人物画像を含む複数枚の画像データを記憶するための画像データ記憶手段、および人物画像の認識結果を記憶するための認識結果記憶手段を含み、前記コンピュータプログラムは、前記コンピュータを、前記画像データ記憶手段に記憶されている個々の画像データ中の人物画像を認識する人物画像認識手段、この人物画像認識手段による認識結果を各画像データに対応付けて前記認識結果記憶手段に書き込む手段、前記人物画像認識手段による認識結果を修正するための修正入力を受け付ける修正入力受付手段、および
この修正入力受付手段によって受け付けられた修正入力に応じて、前記認識結果記憶手段に記憶されている認識結果を修正する認識結果修正手段として機能させるものであることを特徴とする画像管理用コンピュータプログラムである。
The recognition result determination means may write confirmation completion data indicating that the recognition result has been confirmed by the user into a predetermined confirmation completion data storage means.
The invention according to claim 10 is a computer program for operating a computer as an image management apparatus for managing a plurality of image data including a person image, wherein the computer includes a plurality of images including a person image. Image data storage means for storing data, and recognition result storage means for storing a recognition result of a person image, wherein the computer program stores each computer stored in the image data storage means. Person image recognition means for recognizing a person image in image data, means for writing the recognition result by the person image recognition means in association with each image data into the recognition result storage means, and correcting the recognition result by the person image recognition means Correction input receiving means for receiving correction input for correction, and correction input receiving means An image management computer program that functions as a recognition result correction unit that corrects a recognition result stored in the recognition result storage unit according to a received correction input.

このコンピュータプログラムをコンピュータ上で実行することにより、請求項1の画像管理装置を構成できる。
むろん、このコンピュータプログラムに関しても、前述の画像管理装置に関して説明した種々の変形を適用することができる。
請求項11記載の発明は、請求項10記載のコンピュータプログラムが記録されたコンピュータ読取可能な記録媒体である。
By executing this computer program on a computer, the image management apparatus of claim 1 can be configured.
Of course, the various modifications described for the image management apparatus can be applied to this computer program.
The invention described in claim 11 is a computer-readable recording medium on which the computer program according to claim 10 is recorded.

この記録媒体に記録されたコンピュータプログラムをコンピュータに読み取らせて実行させることにより、このコンピュータを前述のような画像管理装置として機能させることができる。
コンピュータプログラムは、どのような形式で記録媒体に記録されていてもよく、たとえば、圧縮した形式で記録されていてもよい。記録媒体には、磁気記録媒体、光記録媒体および光磁気記録媒体を含む任意の記録形式のものを適用できる。
By making a computer read the computer program recorded on this recording medium and making it run, this computer can be functioned as an image management apparatus as mentioned above.
The computer program may be recorded on the recording medium in any format, for example, may be recorded in a compressed format. As the recording medium, any recording format including a magnetic recording medium, an optical recording medium, and a magneto-optical recording medium can be applied.

以下では、この発明の実施の形態を、添付図面を参照して詳細に説明する。
図1は、この発明の一実施形態に係る画像管理装置として動作可能なコンピュータの基本的構成を説明するためのブロック図である。このコンピュータは、コンピュータ本体1と、このコンピュータ本体1に接続された入力操作部2と、同じくコンピュータ本体1に接続された表示装置(ディスプレイ)3とを備え、パーソナルコンピュータとしての形態を有している。入力操作部2および表示装置3は、コンピュータ本体1に対するマンマシンインタフェースを提供する。使用者は、表示装置3における表示を確認しながら、入力操作部2から必要な入力操作を行う。
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
FIG. 1 is a block diagram for explaining a basic configuration of a computer operable as an image management apparatus according to an embodiment of the present invention. The computer includes a computer main body 1, an input operation unit 2 connected to the computer main body 1, and a display device (display) 3 also connected to the computer main body 1, and has a form as a personal computer. Yes. The input operation unit 2 and the display device 3 provide a man-machine interface for the computer main body 1. The user performs a necessary input operation from the input operation unit 2 while confirming the display on the display device 3.

入力操作部2の例としては、キーボード、ポインティングデバイス(たとえば、マウスまたはトラックパッド)、およびタッチパネル(表示装置3の表示画面上に配置されたもの)を挙げることができる。表示装置3は、たとえば、CRT、液晶表示パネルその他の2次元表示装置からなる。
コンピュータ本体1は、CPU5、ROM6、RAM7、外部記憶装置としてのハードディスクドライブ(HDD)8、CD−ROMドライブ9、ディプレイコントローラ10、入力部コントローラ11、通信インタフェース12(USBインタフェースやLANインタフェース)およびメモリカードスロット13を備え、これらがバス14に接続されている。
Examples of the input operation unit 2 include a keyboard, a pointing device (for example, a mouse or a track pad), and a touch panel (arranged on the display screen of the display device 3). The display device 3 includes, for example, a CRT, a liquid crystal display panel, or other two-dimensional display device.
The computer main body 1 includes a CPU 5, a ROM 6, a RAM 7, a hard disk drive (HDD) 8 as an external storage device, a CD-ROM drive 9, a display controller 10, an input controller 11, a communication interface 12 (USB interface or LAN interface), and A memory card slot 13 is provided, and these are connected to the bus 14.

CD−ROMドライブ9には、このコンピュータを画像管理装置として動作させるためのコンピュータプログラム(デジタルフォトアルバムプログラム。画像管理用プログラム)を記録した記録媒体としてのCD−ROM15を装填することができる。CD−ROM15をCD−ROMドライブ9に装填すると、そこに記録されたコンピュータプログラムが読み取り可能となる。使用者が、入力操作部2を操作してインストール操作を行うと、コンピュータプログラムはハードディスクドライブ8の記憶領域に展開される。このコンピュータプログラムを実行することによって、当該コンピュータを画像管理装置として作動させることができる。すなわち、CPU5は、ROM6、RAM7その他コンピュータ本体1内の構成要素と協働して、コンピュータプログラムを実行する。   The CD-ROM drive 9 can be loaded with a CD-ROM 15 as a recording medium on which a computer program (digital photo album program; image management program) for operating this computer as an image management apparatus is recorded. When the CD-ROM 15 is loaded into the CD-ROM drive 9, the computer program recorded there can be read. When the user performs an installation operation by operating the input operation unit 2, the computer program is expanded in the storage area of the hard disk drive 8. By executing this computer program, the computer can be operated as an image management apparatus. That is, the CPU 5 executes the computer program in cooperation with the ROM 6, the RAM 7, and other components in the computer main body 1.

このようなコンピュータプログラムは、CD−ROMの形態で提供される必要はなく、光磁気ディスクその他の任意の形式の記録媒体の形態で提供されてもよい。また、通信インタフェース12に接続された通信回線を介してコンピュータプログラムを取得し、ハードディスクドライブ8の記憶領域に格納するようにしてもよい。
ディプレイコントローラ10は、CPU5からの指令に基づいて表示装置3における表示を制御するためのものである。また、入力部コントローラ11は、入力操作部2からの入力を受け付けてCPU5に伝達するためのものである。
Such a computer program need not be provided in the form of a CD-ROM, but may be provided in the form of a magneto-optical disk or any other type of recording medium. Further, a computer program may be acquired via a communication line connected to the communication interface 12 and stored in a storage area of the hard disk drive 8.
The display controller 10 is for controlling display on the display device 3 based on a command from the CPU 5. The input unit controller 11 is for receiving an input from the input operation unit 2 and transmitting it to the CPU 5.

前記コンピュータプログラムを実行することにより、CPU5は、ハードディスクドライブ8の記憶領域に、写真データベース20(画像データ記憶手段、認識結果記憶手段および追認完了データ記憶手段)および認識辞書記憶部21(辞書記憶手段)を形成する。写真データベース20には、複数枚の写真画像のデータを蓄積することができる。すなわち、写真データベース20には、写真画像を表す画像データと、その画像データに関連した付加データとを含む写真データが格納される。認識辞書記憶部21には、画像データ中の人物を画像認識するための辞書データが格納される。この辞書データは、認識候補となる複数の人物の顔画像の特徴量データの群を含む。   By executing the computer program, the CPU 5 stores the photo database 20 (image data storage means, recognition result storage means and confirmation completion data storage means) and recognition dictionary storage unit 21 (dictionary storage means) in the storage area of the hard disk drive 8. ). The photo database 20 can store data of a plurality of photo images. That is, the photo database 20 stores photo data including image data representing a photo image and additional data related to the image data. The recognition dictionary storage unit 21 stores dictionary data for recognizing a person in the image data. This dictionary data includes a group of feature amount data of face images of a plurality of persons who are recognition candidates.

特徴量データは、認識対象の画像データと照合すべき照合データであり、認識候補の顔画像を他人の顔画像と区別するために有用な特徴量を表すデータである。具体的には、特徴量データは、認識候補の顔画像データそのものであってもよいし、顔画像データに対して所定の処理を施して抽出されるデータであってもよい。一人の認識候補に対して、複数枚の顔画像に対応する特徴量データを辞書データとして蓄積することにより、認識精度を高めることができる。とくに、被写体の向き、表情、照明条件その他顔画像に変化を生じさせる様々な撮影条件下で撮影された複数の顔画像に対応する特徴量を蓄積することにより、認識精度を高めることができる。   The feature amount data is collation data to be collated with image data to be recognized, and is data representing feature amounts useful for distinguishing recognition candidate face images from other people's face images. Specifically, the feature amount data may be recognition candidate face image data itself, or may be data extracted by performing predetermined processing on the face image data. The recognition accuracy can be improved by accumulating feature amount data corresponding to a plurality of face images as dictionary data for one recognition candidate. In particular, recognition accuracy can be improved by accumulating feature amounts corresponding to a plurality of face images photographed under various photographing conditions that cause changes in the orientation, facial expression, lighting conditions, and other face images of the subject.

写真データベース20に格納される画像データは、たとえば、ディジタルスチルカメラによって撮影された写真画像データであり、主として人物を被写体としたものである。写真画像データは、USBインタフェースやLANインタフェース等の通信インタフェース12を介して取得されてもよいし、メモリカードスロット13に装填可能なメモリカード、CD−ROMその他の記録媒体(図示省略)を介して取得されてもよい。   The image data stored in the photo database 20 is, for example, photographic image data taken by a digital still camera, and mainly uses a person as a subject. The photographic image data may be acquired via a communication interface 12 such as a USB interface or a LAN interface, or via a memory card, CD-ROM or other recording medium (not shown) that can be loaded into the memory card slot 13. May be acquired.

図2は、前記コンピュータプログラムの実行状態におけるコンピュータ本体1の構成を説明するためのブロック図である。すなわち、コンピュータ本体1は、前記コンピュータプログラムを実行することによって、図2に示された複数の機能処理部を実質的に有することになる。
これらの複数の機能処理部は、写真登録処理部30、人物画像検出部31、人物画像認識処理部32(人物画像認識手段)、表示信号生成処理部33(表示信号生成手段)、修正入力受付部34(修正入力受付手段)、認識結果修正処理部35(認識結果修正手段)、確定入力受付部36(確定入力受付手段)、認識結果確定処理部37(認識結果確定手段)、検索条件入力受付部38、画像検索処理部39(検索手段)、辞書修正処理部40(辞書修正手段)、および認識候補除外処理部41(認識候補除外手段)を含む。
FIG. 2 is a block diagram for explaining the configuration of the computer main body 1 in the execution state of the computer program. That is, the computer main body 1 substantially has a plurality of function processing units shown in FIG. 2 by executing the computer program.
The plurality of function processing units include a photo registration processing unit 30, a person image detection unit 31, a person image recognition processing unit 32 (person image recognition unit), a display signal generation processing unit 33 (display signal generation unit), and a correction input acceptance. Unit 34 (correction input receiving unit), recognition result correction processing unit 35 (recognition result correcting unit), confirmation input receiving unit 36 (confirmation input receiving unit), recognition result confirmation processing unit 37 (recognition result determination unit), search condition input It includes a reception unit 38, an image search processing unit 39 (search unit), a dictionary correction processing unit 40 (dictionary correction unit), and a recognition candidate exclusion processing unit 41 (recognition candidate exclusion unit).

写真登録処理部30は、写真データベース20に写真画像の画像データを登録する処理を実行する。
人物画像検出部31は、写真データベース20に格納されている画像データを読み出し、その画像データ中の人物の顔部分の画像(人物画像認識処理部32での処理対象とすべき画像部分)を切り出す。より具体的には、人物画像検出部31は、画像データ中における人物の顔部分を含む矩形領域を顔画像領域(切り出し枠)として特定し、その顔画像領域の原点座標(たとえば矩形領域の左上隅頂点の座標)および切り出し枠サイズ(たとえば矩形領域の縦横の長さ)を表すデータを生成する。これらのデータは、当該画像データと対応付けて写真データベース20に格納される。
The photo registration processing unit 30 executes processing for registering image data of a photo image in the photo database 20.
The person image detection unit 31 reads out image data stored in the photo database 20 and cuts out an image of a person's face part (image part to be processed by the person image recognition processing unit 32) in the image data. . More specifically, the person image detection unit 31 specifies a rectangular area including the face portion of the person in the image data as a face image area (cutout frame), and the origin coordinates of the face image area (for example, the upper left corner of the rectangular area) Data representing the corner vertex coordinates) and the cutting frame size (for example, the vertical and horizontal lengths of the rectangular area) are generated. These data are stored in the photograph database 20 in association with the image data.

人物画像認識処理部32は、人物画像検出部31によって検出された顔画像領域に対して、人物認識処理を実行し、処理結果を写真データベース20に書き込む。具体的には、人物画像認識処理部32は、顔画像領域中の画像と認識辞書記憶部21に格納されている辞書データとを照合し、当該顔画像領域中の顔画像の人物の候補を表す候補データを生成する。さらに詳しく説明すると、人物画像認識処理部32は、認識辞書記憶部21に特徴量データが格納されている複数の認識候補(候補人物)に関して、顔画像領域中の顔画像の人物である尤もらしさ表す尤度を演算する尤度演算部43(尤度演算手段)と、この尤度演算部43によって演算された尤度に基づいて認識候補の順位を定める優先順位設定部44(優先順位設定手段)とを備えている。   The person image recognition processing unit 32 performs a person recognition process on the face image area detected by the person image detection unit 31 and writes the processing result in the photo database 20. Specifically, the person image recognition processing unit 32 collates the image in the face image area with the dictionary data stored in the recognition dictionary storage unit 21, and determines a person candidate for the face image in the face image area. Generate candidate data to represent. More specifically, the person image recognition processing unit 32 relates to a plurality of recognition candidates (candidate persons) whose feature amount data is stored in the recognition dictionary storage unit 21 and is likely to be a person of a face image in the face image area. A likelihood calculating unit 43 (likelihood calculating unit) that calculates the likelihood to be expressed, and a priority setting unit 44 (priority setting unit) that determines the rank of recognition candidates based on the likelihood calculated by the likelihood calculating unit 43 ).

優先順位設定部44は、個々の顔画像領域中の顔画像に関して、原則として、尤度の高いものから順に認識候補に対する順位を付与する。しかし、同一画像データ中に2つ以上の顔画像領域が含まれている場合に、複数の顔画像領域において最大尤度を持つ認識候補が同一人物である場合もあり得る。このような場合には、その複数の顔画像領域における当該認識候補の尤度が比較され、尤度の大きい方の顔画像領域に対して当該認識候補が第1候補とされ、他の顔画像領域では他の認識候補が第1候補とされる。   The priority order setting unit 44 assigns ranks to recognition candidates in descending order of the likelihood, in principle, for face images in individual face image regions. However, when two or more face image areas are included in the same image data, the recognition candidate having the maximum likelihood in the plurality of face image areas may be the same person. In such a case, the likelihoods of the recognition candidates in the plurality of face image areas are compared, and the recognition candidate is set as the first candidate for the face image area with the higher likelihood, and other face images In the region, other recognition candidates are set as the first candidates.

表示信号生成処理部33は、表示装置3に表示すべき画像に対応した表示信号を生成する。具体的には、画像データおよびこの画像データ中の人物の認識結果等の表示に必要な表示信号を生成する。
修正入力受付部34は、人物画像認識処理部32による認識結果の修正のための入力を受け付ける。すなわち、使用者が入力操作部2を操作して、認識結果の修正を指示するための指示入力を行うと、この指示入力が修正入力受付部34によって受け付けられる。この修正入力受付部34は、認識候補の選択肢をプルダウンリストボックスの形式で表示装置3に表示させて使用者に提示するための選択候補提示部42(選択候補提示手段)を備えている。この選択候補提示部42は、プルダウンリストボックスを表示装置3に表示させるための指令を表示信号生成処理部33に与える。この指令を受けて、表示信号生成処理部33は、プルダウンリストボックスの表示のための表示信号を生成する。
The display signal generation processing unit 33 generates a display signal corresponding to an image to be displayed on the display device 3. Specifically, a display signal necessary for displaying image data and a recognition result of a person in the image data is generated.
The correction input receiving unit 34 receives an input for correcting the recognition result by the person image recognition processing unit 32. That is, when the user operates the input operation unit 2 and inputs an instruction for instructing correction of the recognition result, the instruction input is received by the correction input receiving unit 34. The correction input receiving unit 34 includes a selection candidate presenting unit 42 (selection candidate presenting means) for displaying recognition candidate options on the display device 3 in the form of a pull-down list box and presenting them to the user. The selection candidate presentation unit 42 gives a command for displaying the pull-down list box on the display device 3 to the display signal generation processing unit 33. Upon receiving this command, the display signal generation processing unit 33 generates a display signal for displaying the pull-down list box.

認識結果修正処理部35は、修正入力受付部34によって受け付けられた指示入力に従って、認識結果の修正を行う。より具体的には、認識結果修正処理部35は、指示入力の対象の画像データに対応する認識結果データを写真データベース20から読み出し、認識結果を変更するための処理を実行する。
確定入力受付部36は、写真データベース20に格納されている個々の顔画像領域に対応する認識結果を追認して確定させるための確定入力を受け付けるものである。すなわち、使用者が入力操作部2を操作して、認識結果の追認を指示する指示入力を行うと、この指示入力が確定入力受付部36によって受け付けられる。
The recognition result correction processing unit 35 corrects the recognition result according to the instruction input received by the correction input receiving unit 34. More specifically, the recognition result correction processing unit 35 reads the recognition result data corresponding to the image data to be input as an instruction from the photo database 20 and executes a process for changing the recognition result.
The confirmation input receiving unit 36 receives a confirmation input for confirming and confirming a recognition result corresponding to each face image area stored in the photo database 20. That is, when the user operates the input operation unit 2 and inputs an instruction for instructing confirmation of the recognition result, the instruction input is received by the confirmed input receiving unit 36.

個々の画像データに対して、認識結果が使用者によって追認されたか(確定済みか)または追認されていないか(未確定か)を表す追認完了データとしての確定フラグが、写真データベース20に記憶されるようになっている。人物画像認識処理部32による認識処理の直後には、この確定フラグは、「未確定」を表す値とされている。
認識結果確定処理部37は、写真データベース20に記録されている個々の顔画像領域ごとの確定フラグを「確定」に変更する処理を行う。この認識結果確定処理部37は、確定入力受付部36によって確定入力が受け付けられたことに応答して、確定フラグを「確定」に書き換える。また、認識結果確定処理部37は、認識結果修正処理部35によって認識結果が修正された場合にも、その修正対象の顔画像領域に対応した確定フラグを「確定」に書き換える。この確定フラグの値が「確定」となっている顔画像領域は、人物画像認識処理部32の処理対象から除外される。
A confirmation flag as confirmation completion data indicating whether the recognition result is confirmed by the user (confirmed) or not confirmed (unconfirmed) for each image data is stored in the photo database 20. It has become so. Immediately after the recognition processing by the person image recognition processing unit 32, the confirmation flag is set to a value representing “unconfirmed”.
The recognition result confirmation processing unit 37 performs a process of changing the confirmation flag for each individual face image area recorded in the photo database 20 to “confirmed”. The recognition result confirmation processing unit 37 rewrites the confirmation flag to “confirmed” in response to the confirmation input accepted by the confirmation input acceptance unit 36. Further, even when the recognition result correction processing unit 35 corrects the recognition result, the recognition result confirmation processing unit 37 rewrites the confirmation flag corresponding to the face image area to be corrected to “confirmation”. The face image area in which the value of the confirmation flag is “confirmed” is excluded from the processing target of the person image recognition processing unit 32.

さらに、認識結果確定処理部37は、認識結果自動確定処理部45(認識結果自動確定手段)を備えている。認識結果自動確定処理部45は、一定の条件が満たされた場合に、認識結果が未確定の顔画像領域に対応する確定フラグを「確定」に自動的に変更する。
より具体的に説明すると、写真データベース20に格納された複数枚の画像データは、所定の基準で順序付けされる。たとえば、それらは写真の撮影日付順にソートされていてもよいし、写真データベース20への登録順にソートされていてもよいし、画像データの最終更新日時順にソートされていてもよいし、画像データのデータ名(ファイル名)によってソートされていてもよい。このような場合に、使用者が、ある画像データに関して確定/または修正操作を行うと、認識結果自動確定処理部45は、当該画像データ以前の順位の画像データ中に存在する認識結果未確定のすべての顔画像領域に関して、確定フラグを「確定」に変更する。
Furthermore, the recognition result confirmation processing unit 37 includes a recognition result automatic confirmation processing unit 45 (recognition result automatic confirmation means). The recognition result automatic confirmation processing unit 45 automatically changes the confirmation flag corresponding to the face image area for which the recognition result is undetermined to “confirmed” when a certain condition is satisfied.
More specifically, a plurality of pieces of image data stored in the photo database 20 are ordered according to a predetermined standard. For example, they may be sorted in the order of the shooting date of the photos, may be sorted in the order of registration in the photo database 20, may be sorted in the order of the last update date and time of the image data, It may be sorted by data name (file name). In such a case, when the user performs a confirmation / or correction operation with respect to certain image data, the recognition result automatic confirmation processing unit 45 determines that the recognition result is unconfirmed that exists in the image data of the rank before the image data. The confirmation flag is changed to “confirmed” for all face image regions.

検索条件入力受付部38は、使用者が入力操作部2を操作して指定する検索条件を受け付ける。検索条件としては、人物画像認識処理部32によって認識される認識候補の識別情報を設定できる。この識別情報は、写真データベース20に認識結果として登録される情報であり、典型例は、認識候補の名前(姓、名、通称等)である。
画像検索処理部39は、検索条件入力受付部38によって受け付けられた検索条件に従って、画像データを検索する。たとえば、使用者が検索条件として、いずれかの認識候補の名前を指定すると、画像検索処理部39は、その認識候補の名前を認識結果とする顔画像領域を含む画像データを抽出する。
The search condition input accepting unit 38 accepts a search condition specified by the user operating the input operation unit 2. As search conditions, identification information of recognition candidates recognized by the person image recognition processing unit 32 can be set. This identification information is information registered as a recognition result in the photo database 20, and a typical example is a name of a recognition candidate (last name, first name, common name, etc.).
The image search processing unit 39 searches for image data according to the search condition received by the search condition input receiving unit 38. For example, when the user designates one of the names of recognition candidates as a search condition, the image search processing unit 39 extracts image data including a face image area having the recognition candidate name as a recognition result.

辞書修正処理部40は、認識結果確定処理部37による確定処理を受けて、認識辞書記憶部21に記憶されている辞書データを修正する。より具体的には、認識結果確定処理部37によって認識結果が確定されると、その確定された認識結果と顔画像データ(顔画像領域中の画像データ)との対応関係が辞書データに反映させられる。すなわち、当該認識結果に相当する認識候補について、当該顔画像データに対応した特徴量データが辞書データに追加される。こうして、認識処理を行っていくうちに、辞書データの精度が高められていく。   The dictionary correction processing unit 40 corrects the dictionary data stored in the recognition dictionary storage unit 21 in response to the confirmation process by the recognition result confirmation processing unit 37. More specifically, when the recognition result is confirmed by the recognition result confirmation processing unit 37, the correspondence between the confirmed recognition result and the face image data (image data in the face image area) is reflected in the dictionary data. It is done. That is, feature amount data corresponding to the face image data is added to the dictionary data for recognition candidates corresponding to the recognition result. Thus, as the recognition process is performed, the accuracy of the dictionary data is improved.

とくに、この実施形態では、認識結果修正処理部35によって認識結果が修正されると、その認識結果が確定されるようになっている。そのため、認識結果の修正を、辞書データに反映させることができる。これにより、辞書データの精度が効率的に高められていくようになっている。
図3は、写真データベース20に格納されるデータの構造を説明するための図解図である。写真データベース20には、複数枚の写真に対応した写真データi(i=1,2,……,N。Nは自然数であり、写真データの総数を表す。)が格納されているものとする。この場合、各写真データiは、写真画像に対応した画像データと、この画像データに対応付けられた付加データとを含む。付加データは、当該画像データ中で検出された顔画像領域の個数M(Mは自然数)を表す個数データと、個々の顔画像領域毎の個別領域データj(j=1,2,……,M)とを含む。個別領域データjは、当該顔画像領域の座標、切り出し枠サイズ、認識結果データ、認識候補データおよび確定フラグを含む。認識結果データは、認識結果の人物を識別するための識別情報であり、たとえば、当該人物の名前であってもよい。また、認識候補データは、少なくとも1つ(通常は複数)の認識候補に関して、当該認識候補を特定するための識別情報と、当該顔画像領域中の人物が当該認識候補である尤度を表す尤度データとを含む。
In particular, in this embodiment, when the recognition result is corrected by the recognition result correction processing unit 35, the recognition result is fixed. Therefore, the correction of the recognition result can be reflected in the dictionary data. As a result, the accuracy of the dictionary data is efficiently increased.
FIG. 3 is an illustrative view for explaining the structure of data stored in the photo database 20. The photo database 20 stores photo data i (i = 1, 2,..., N, where N is a natural number and represents the total number of photo data) corresponding to a plurality of photos. . In this case, each photograph data i includes image data corresponding to the photograph image and additional data associated with the image data. The additional data includes number data representing the number M (M is a natural number) of face image areas detected in the image data, and individual area data j (j = 1, 2,..., Each face image area). M). The individual area data j includes coordinates of the face image area, a cutout frame size, recognition result data, recognition candidate data, and a confirmation flag. The recognition result data is identification information for identifying the person of the recognition result, and may be, for example, the name of the person. Further, the recognition candidate data includes identification information for specifying the recognition candidate and a likelihood representing the likelihood that the person in the face image region is the recognition candidate with respect to at least one (usually a plurality of) recognition candidates. Degree data.

人物画像認識処理部32による認識処理の直後の状態では、第1認識候補データと認識結果データは一致している。認識結果修正処理部35による修正処理は、認識結果データを書き換える処理である。
図4は、表示装置3における表示例を示す図解図である。この例では、表示ウィンドウ50内に、写真画像51,52,53,54が配列されて表示されている。これらの写真画像51〜54は、この順に順位付けされている。そして、図4は、三番目の写真画像53に対して、使用者が認識結果の修正操作を行っている状況を示している。
In a state immediately after the recognition processing by the person image recognition processing unit 32, the first recognition candidate data and the recognition result data match. The correction process by the recognition result correction processing unit 35 is a process for rewriting the recognition result data.
FIG. 4 is an illustrative view showing a display example on the display device 3. In this example, photographic images 51, 52, 53 and 54 are arranged and displayed in the display window 50. These photographic images 51 to 54 are ranked in this order. FIG. 4 shows a situation where the user performs a correction operation on the recognition result for the third photographic image 53.

表示ウィンドウ50の右辺部には、スクロールバー55が配置されている。このスクロールバー55をポインティングデバイスで操作するか、あるいはキーボードから所定のスクロール操作を行うことによって、写真画像51〜54より前に順位付けされた写真画像や、これらよりも後に順位付けされた写真画像を表示ウィンドウ50に表示させることができる。また、表示ウィンドウ50の右上隅には、当該プログラムを終了させるための終了ボタン56が配置されている。   A scroll bar 55 is arranged on the right side of the display window 50. By operating the scroll bar 55 with a pointing device or by performing a predetermined scroll operation from the keyboard, the photographic images ranked before the photographic images 51 to 54, or the photographic images ranked after these. Can be displayed on the display window 50. An end button 56 for ending the program is arranged at the upper right corner of the display window 50.

図4に表された状態の表示ウィンドウ50内において、第1の写真画像51は、一人の人物Aの全身像を含んでいる。この人物Aの顔部分を含む矩形の顔画像領域61が、人物画像検出部31によって検出される。この顔画像領域61の近傍には、確定された認識結果62が表示されている。この例では、認識結果62は、人物Aの名前を表す文字列「Aさん」である。顔画像領域61内の顔画像データに対応する特徴量データは、確定された認識結果62に対応した認識候補「Aさん」に関する辞書データとして、認識辞書記憶部21に書き込まれる。   In the display window 50 in the state shown in FIG. 4, the first photographic image 51 includes a whole body image of one person A. A rectangular face image area 61 including the face portion of the person A is detected by the person image detecting unit 31. In the vicinity of the face image area 61, a confirmed recognition result 62 is displayed. In this example, the recognition result 62 is a character string “Mr. A” representing the name of the person A. The feature amount data corresponding to the face image data in the face image area 61 is written into the recognition dictionary storage unit 21 as dictionary data relating to the recognition candidate “Mr. A” corresponding to the confirmed recognition result 62.

第2の写真画像52は、二人の人物AおよびBの全身像を含んでいる。人物画像検出部31は、これらの人物AおよびBの顔画像部分をそれぞれ含む2つの顔画像領域63,64を検出する。これらの顔画像領域63,64の近傍には、それぞれ確定された認識結果65,66が表示されている。認識結果65,66は、それぞれ、「Aさん」、「Bさん」という文字列である。顔画像領域63,64内の顔画像データに対応する特徴量データは、確定された認識結果65,66に対応した認識候補「Aさん」、「Bさん」にそれぞれ関連付けた辞書データとして、認識辞書記憶部21に書き込まれる。   The second photographic image 52 includes full body images of two persons A and B. The person image detection unit 31 detects two face image areas 63 and 64 each including the face image portions of the persons A and B. In the vicinity of these face image areas 63 and 64, confirmed recognition results 65 and 66 are displayed, respectively. The recognition results 65 and 66 are character strings “Mr. A” and “Mr. B”, respectively. The feature amount data corresponding to the face image data in the face image areas 63 and 64 is recognized as dictionary data associated with the recognition candidates “Mr. A” and “Mr. B” corresponding to the recognized recognition results 65 and 66, respectively. It is written in the dictionary storage unit 21.

第3の写真画像53は、一人の人物67の全身像を含む。人物画像検出部31は、この人物67の顔部分を含む矩形の顔画像領域68を抽出する。この顔画像領域68の近傍に、認識候補69が表示される。認識候補69は、プルダウンリストボックス70の形態で表示される。すなわち、初期状態では、プルダウンリストボックス70は、最大尤度の一人の候補のみが表示された状態である。この状態から、右端部のプルダウンボタン71をポインティングデバイスで操作(クリック)することによって、修正候補を表示させることができるようになっている。   The third photographic image 53 includes a whole body image of one person 67. The person image detection unit 31 extracts a rectangular face image area 68 including the face portion of the person 67. A recognition candidate 69 is displayed in the vicinity of the face image area 68. The recognition candidates 69 are displayed in the form of a pull-down list box 70. That is, in the initial state, the pull-down list box 70 is a state in which only one candidate with the maximum likelihood is displayed. From this state, a correction candidate can be displayed by operating (clicking) the pull-down button 71 at the right end with a pointing device.

この例では、最大尤度の候補は「Aさん」であり、2番目に尤度の高い候補は「Bさん」である。最大尤度の候補「Aさん」を選択する操作は、自動認識された認識結果を確定する確定操作となる。また、最大尤度以外の候補を選択する操作は、自動認識された認識結果を修正する修正操作となる。確定操作または修正操作が行われると、その認識結果が確定状態となる。これにより、顔画像領域68内の顔画像データに対応する特徴量データは、当該確定された認識結果に対応した認識候補に関する辞書データとして、認識辞書記憶部21に記憶されることになる。   In this example, the maximum likelihood candidate is “Mr. A”, and the second most likely candidate is “Mr. B”. The operation for selecting the maximum likelihood candidate “Mr. A” is a confirmation operation for confirming the automatically recognized recognition result. In addition, an operation for selecting a candidate other than the maximum likelihood is a correction operation for correcting the automatically recognized recognition result. When a confirmation operation or a correction operation is performed, the recognition result becomes a confirmation state. As a result, the feature amount data corresponding to the face image data in the face image area 68 is stored in the recognition dictionary storage unit 21 as dictionary data relating to recognition candidates corresponding to the determined recognition result.

プルダウンリストボックス70には、認識候補のほかに、さらに、「新規登録」(新規登録手段)および「登録なし」(付加情報なし登録手段)という選択肢が用意されている。
「新規登録」は、認識辞書記憶部21の辞書データ中に認識候補として登録されていない人物を登録する操作を始めるための選択肢である。「新規登録」を選択すると、プルダウンリストボックス70の「新規登録」欄が編集可能なテキスト入力エリアとなる。このテキスト入力エリアに、認識候補の識別情報(名前など)を入力操作部2から入力することによって、顔画像領域68の認識結果が修正されて確定される。それとともに、顔画像領域68の顔画像データに対応する特徴量データが、当該新たに入力された認識候補(たとえば「Cさん」)に関連付けられた辞書データとして、認識辞書記憶部21に格納される。
In the pull-down list box 70, in addition to the recognition candidates, options of “new registration” (new registration means) and “no registration” (registration means without additional information) are prepared.
“New registration” is an option for starting an operation of registering a person who is not registered as a recognition candidate in the dictionary data of the recognition dictionary storage unit 21. When “new registration” is selected, the “new registration” field in the pull-down list box 70 becomes an editable text input area. By inputting identification information (such as a name) of recognition candidates from the input operation unit 2 in this text input area, the recognition result of the face image area 68 is corrected and confirmed. At the same time, the feature amount data corresponding to the face image data in the face image area 68 is stored in the recognition dictionary storage unit 21 as dictionary data associated with the newly input recognition candidate (for example, “Mr. C”). The

「登録なし」は、たとえば、面識のない人物が写っている場合に、その人物の認識結果として選択される。より一般的には、後に検索する対象となる蓋然性が極めて低い人物の顔画像領域に対しては、認識結果を「登録なし」(付加情報なし)とすることが適切である。
第4の写真画像54は、4人の人物75,76,77,78の全身像を含んでいる。これらの人物75〜78のうち、人物75,76および78に対しては、顔画像領域80,81,83が検出されていて、それらに対応して認識候補がプルダウンリストボックス85,86,88の形式で表示されている。人物77については、顔画像領域が未検出であるが、ポインティングデバイスを用いて人物77をポイントすることにより、この人物77に対する付加データを事後的に登録することができる。
“No registration” is selected, for example, as a recognition result of an unacquainted person. More generally, it is appropriate that the recognition result is “no registration” (no additional information) for a face image region of a person with a very low probability of being searched later.
The fourth photographic image 54 includes full body images of four persons 75, 76, 77, 78. Among these persons 75 to 78, face image areas 80, 81, and 83 are detected for persons 75, 76, and 78, and recognition candidates corresponding to these are displayed in pull-down list boxes 85, 86, and 88. It is displayed in the format. For the person 77, the face image area has not been detected. However, by pointing the person 77 using a pointing device, additional data for the person 77 can be registered afterwards.

第1〜第3の写真画像51〜53のいずれかのなかに、認識結果が未確定の状態の顔画像領域が存在している場合を想定する。この場合に、使用者が、第4の写真画像54中の顔画像領域に対して、認識結果を修正する修正操作または認識結果を確定する確定操作を行うと、認識結果自動確定処理部45の働きによって、第1〜第3の写真画像51〜53中の未確定状態の認識結果が確定させられる。   Assume that any one of the first to third photographic images 51 to 53 includes a face image area in which the recognition result is undetermined. In this case, when the user performs a correction operation for correcting the recognition result or a confirmation operation for confirming the recognition result on the face image area in the fourth photographic image 54, the recognition result automatic confirmation processing unit 45 The recognition result of the unconfirmed state in the first to third photographic images 51 to 53 is confirmed by the operation.

もっとも、認識結果が確定された後に、当該確定済みの認識結果を修正することも可能である。たとえば、第1の写真画像51の顔画像領域61の近傍に表示された認識結果62をポイントして所定の操作(クリック)を行うと、プルダウンリストボックスの形式で認識候補のリストが表示される。このリスト中から適切な認識候補(「新規登録」および「登録なし」を含む。)を選択することができる。   However, after the recognition result is confirmed, the confirmed recognition result can be corrected. For example, when a predetermined operation (click) is performed by pointing the recognition result 62 displayed near the face image area 61 of the first photographic image 51, a list of recognition candidates is displayed in the form of a pull-down list box. . Appropriate recognition candidates (including “new registration” and “no registration”) can be selected from this list.

前述のとおり、認識結果に対して修正もしくは確定操作または新規登録操作を実行すると、認識辞書記憶部の辞書データが更新される。そこで、この更新された辞書データを用いて、修正もしくは確定または新規登録のための操作が実行された写真画像よりも後の順位の写真画像に対して、改めて、人物画像認識処理が行われる。
図5は、認識結果修正時のより詳細な処理を説明するための図である。この図5では、写真画像90中に、2人の人物91および92の全身像が含まれており、これらの人物91,92の顔画像領域93,94が検出されている。人物91については、認識結果95が「Bさん」で確定済みである。この場合、人物92の顔画像領域94についての認識候補を示すプルダウンリストボックス96では、「Bさん」がリスト中から除外されている。
As described above, when a correction or confirmation operation or a new registration operation is executed on the recognition result, the dictionary data in the recognition dictionary storage unit is updated. Therefore, using the updated dictionary data, the person image recognition process is performed again on the photographic images in the rank after the photographic image on which the operation for correction or confirmation or new registration is executed.
FIG. 5 is a diagram for explaining more detailed processing when the recognition result is corrected. In FIG. 5, the photographic image 90 includes full-length images of two persons 91 and 92, and face image areas 93 and 94 of these persons 91 and 92 are detected. For the person 91, the recognition result 95 has been confirmed as “Mr. B”. In this case, “Mr. B” is excluded from the list in the pull-down list box 96 indicating recognition candidates for the face image area 94 of the person 92.

これは、同一写真中には、原則として、同一人物の顔画像が2回現れることはないという事実に基づく処理であり、認識候補除外処理部41(図2参照)の働きによる。これにより、写真画像中の各顔画像領域に対する人物認識を適正に行うことができ、また、認識結果の修正作業もスムーズに行える。
図6は、認識候補の表示順に関する処理の詳細を説明するための図である。この図6では、写真画像100中に、3人の人物101,102,103の全身像が含まれており、これらの人物101,102,103の顔画像領域104,105,106が検出されている。これらの顔画像領域104,105,106に含まれる画像に基づく人物画像認識処理によって演算された尤度の一例が、下記表1に示されている。
This is a process based on the fact that, in principle, a face image of the same person never appears twice in the same photograph, and is based on the action of the recognition candidate exclusion processing unit 41 (see FIG. 2). As a result, it is possible to properly perform person recognition on each face image area in the photographic image, and to smoothly perform correction of the recognition result.
FIG. 6 is a diagram for explaining the details of the processing related to the display order of recognition candidates. In FIG. 6, the photographic image 100 includes full body images of three persons 101, 102, and 103, and face image areas 104, 105, and 106 of these persons 101, 102, and 103 are detected. Yes. An example of the likelihood calculated by the human image recognition process based on the images included in these face image areas 104, 105, and 106 is shown in Table 1 below.

人物画像認識処理の直後には、各顔画像領域104,105,106に対して、第1位の認識候補(すなわち、最大尤度の認識候補)がプルダウンリストボックス107,108,109に表示される。もしも、第1位の認識候補が複数の顔画像領域において重複する場合には、尤度が大きい方が優先される。
たとえば、図6の例において、顔画像領域104の認識結果を「Aさん」から「Bさん」に変更した場合の処理について説明する。当初の認識結果では、顔画像領域105の認識候補として、プルダウンリストボックス108に文字列「Bさん」が表示されている。しかし、顔画像領域104の認識結果が「Bさん」に修正されて確定されることにより、顔画像領域105の認識候補「Bさん」は必然的に誤りとなる。同一写真画像中に同一人物が2度現れることは原則としてあり得ないからである。
Immediately after the person image recognition processing, the first-ranked recognition candidates (that is, recognition candidates with the maximum likelihood) are displayed in the pull-down list boxes 107, 108, and 109 for the face image regions 104, 105, and 106, respectively. The If the first recognition candidate overlaps in a plurality of face image regions, the higher likelihood is given priority.
For example, in the example of FIG. 6, processing when the recognition result of the face image area 104 is changed from “Mr. A” to “Mr. B” will be described. In the initial recognition result, the character string “Mr. B” is displayed in the pull-down list box 108 as a recognition candidate for the face image area 105. However, the recognition candidate “Mr. B” in the face image area 105 inevitably becomes an error because the recognition result of the face image area 104 is corrected and determined to be “Mr. B”. This is because it is impossible in principle for the same person to appear twice in the same photographic image.

そこで、優先順位設定部44は、顔画像領域105,106の認識候補を修正する。この場合、表1を参照すると、顔画像領域105の第2位の認識候補は「Cさん」であるが、これは顔画像領域106の第1位の認識候補と重複する。そこで、優先順位設定部44は、顔画像領域105,106における認識候補「Cさん」に対応した尤度を比較する。表1を参照すれば、顔画像領域105における認識候補「Cさん」の尤度の方が大きい。そこで、優先順位設定部44は、顔画像領域105の認識候補を「Cさん」に変更する。それとともに、優先順位設定部44は、顔画像領域106の認識候補を、確定済みの「Bさん」と、顔画像領域105の認識候補とすることとした「Cさん」とを除いたうちで、最も尤度の高い認識候補「Aさん」に変更する。むろん、認識候補除外処理部41の働きによって、顔画像領域105,106の認識候補の選択肢からは、確定済みの「Bさん」は除かれる。   Therefore, the priority order setting unit 44 corrects the recognition candidates for the face image areas 105 and 106. In this case, referring to Table 1, the second recognition candidate in the face image area 105 is “Mr. C”, which overlaps with the first recognition candidate in the face image area 106. Therefore, the priority order setting unit 44 compares the likelihood corresponding to the recognition candidate “Mr. C” in the face image areas 105 and 106. Referring to Table 1, the likelihood of the recognition candidate “Mr. C” in the face image area 105 is larger. Therefore, the priority order setting unit 44 changes the recognition candidate of the face image area 105 to “Mr. C”. At the same time, the priority order setting unit 44 excludes the confirmed “Mr. B” as the recognition candidate for the face image area 106 and the “Mr. C” as the recognition candidate for the face image area 105. , Change to the most likely recognition candidate “Mr. A”. Of course, the confirmed candidate “Mr. B” is excluded from the recognition candidate choices in the face image areas 105 and 106 by the action of the recognition candidate exclusion processing unit 41.

図7は、処理の流れを説明するためのフローチャートである。まず、使用者は、入力操作部2を操作することによって、写真データベース20に写真画像の画像データを登録する(ステップS1)。入力操作部2の操作に応答して、写真登録処理部30は、たとえば、ハードディスクドライブ8の記憶領域内、CD−ROM、メモリカードその他の外部記録媒体、またはネットワーク上の所定の場所に予め格納してある画像データを写真データベース20に登録する。より具体的には、画像データを含む写真データ(図3参照)が登録すべき画像データの数だけ作成されて、写真データベース20に登録される。   FIG. 7 is a flowchart for explaining the flow of processing. First, the user registers the image data of a photographic image in the photographic database 20 by operating the input operation unit 2 (step S1). In response to the operation of the input operation unit 2, the photo registration processing unit 30 stores in advance in a storage area of the hard disk drive 8, a CD-ROM, a memory card or other external recording medium, or a predetermined location on the network, for example. The registered image data is registered in the photo database 20. More specifically, photo data including image data (see FIG. 3) is created for the number of image data to be registered and registered in the photo database 20.

次に、人物画像検出部31は、写真データベース20に登録された画像データに対して、顔画像領域検出処理を実行する(ステップS2)。このとき、顔画像領域検出処理の対象とされるのは、顔画像領域検出処理が未了の画像データである。こうして、顔画像領域検出処理が未了であるすべての画像データ中の顔画像領域が抽出され、各顔画像領域の座標および切り出し枠サイズを表すデータが写真データベース20に登録される。   Next, the person image detection unit 31 performs a face image area detection process on the image data registered in the photograph database 20 (step S2). At this time, the target of the face image area detection process is image data that has not undergone the face image area detection process. In this way, face image areas are extracted from all image data for which face image area detection processing has not been completed, and data representing the coordinates of each face image area and the cutout frame size is registered in the photo database 20.

次いで、ステップS2の顔画像領域検出処理によって検出されたすべての顔画像領域に対して、人物画像認識処理部32による人物画像認識処理が実行される(ステップS3)。これにより、各顔画像領域に対する認識候補データが写真データベース20に登録される。また、認識結果は、写真画像とともに表示装置3に表示される(ステップS4)。
人物画像認識処理(ステップS3)の終了後に、使用者が、入力操作部2を操作して、表示装置3の表示画面上にいずれかの位置をポインティングデバイスで操作(クリック)すると(ステップS5)、CPU5は、プログラムを終了するかどうかを判断する(ステップS6)。すなわち、画面上の終了ボタン56(図4参照。ウィンドウ内に別途表示される終了ボタンであってもよい。)が操作されたかどうかにより、プログラムを終了するかどうかを判断する。
Next, the person image recognition process by the person image recognition processing unit 32 is executed on all the face image areas detected by the face image area detection process in step S2 (step S3). Thereby, recognition candidate data for each face image area is registered in the photo database 20. The recognition result is displayed on the display device 3 together with the photographic image (step S4).
After the person image recognition process (step S3) is completed, the user operates (clicks) any position on the display screen of the display device 3 with the pointing device by operating the input operation unit 2 (step S5). The CPU 5 determines whether to end the program (step S6). That is, it is determined whether or not to end the program depending on whether or not the end button 56 on the screen (see FIG. 4 may be an end button separately displayed in the window) is operated.

プログラムを終了すべきときは、表示信号生成処理部33は、認識結果を「確定する」か「確定しない」かを使用者に選択させるための選択画面を表示装置3に表示させるための信号を生成する(ステップS7)。この選択画面は、たとえば、「確定する」ボタンおよび「確定しない」ボタンを含むウィンドウであってもよい。
使用者が、入力操作部2から、認識結果の確定/非確定の選択操作を行うと(ステップS8)、その選択操作に応じた処理がCPU5によって実行される(ステップS9)。すなわち、「確定する」ボタンが操作されると(ステップS9のYES)、この操作が確定入力受付部36によって受け付けられ、認識結果確定処理部37は、未確定の認識結果のすべてを確定させる(ステップS10)。すなわち、「未確定」の確定フラグがすべて「確定」に変更される。これにより、処理が終了する。「確定しない」ボタンが操作されたときには(ステップS9のNO)、ステップS10の処理を迂回して処理を終了する。この場合には、認識結果が未確定の顔画像領域の確定フラグは「未確定」のままとなる。
When the program is to be ended, the display signal generation processing unit 33 displays a signal for causing the display device 3 to display a selection screen for allowing the user to select “confirm” or “not confirm” the recognition result. Generate (step S7). This selection screen may be, for example, a window including a “confirm” button and a “not confirm” button.
When the user performs a selection operation for confirming / non-confirming the recognition result from the input operation unit 2 (step S8), processing corresponding to the selection operation is executed by the CPU 5 (step S9). That is, when the “confirm” button is operated (YES in step S9), this operation is accepted by the confirmation input receiving unit 36, and the recognition result confirmation processing unit 37 confirms all of the unconfirmed recognition results ( Step S10). That is, all the “unconfirmed” confirmation flags are changed to “confirmed”. Thereby, the process ends. When the “don't confirm” button is operated (NO in step S9), the process of step S10 is bypassed and the process ends. In this case, the confirmation flag of the face image area whose recognition result is undetermined remains “undetermined”.

一方、ステップS5において、操作位置(クリック位置)が終了ボタン56以外の場所(ただし、ウィンドウ50内)であるときには、前回の操作位置(クリック位置)と同じ写真画像内の位置かどうかが判断される(ステップS11)。操作位置が同一写真画像内でなければ、認識結果自動確定処理部45は、その写真画像よりも前に順位付けされているすべての写真画像内のすべての顔画像領域について、確定フラグを「確定」に変更する自動確定処理を行う(ステップS12)。操作位置が同一写真画像内でなければ、ステップS12の認識結果自動確定処理は省かれる。   On the other hand, in step S5, when the operation position (click position) is a place other than the end button 56 (however, in the window 50), it is determined whether or not the position is in the same photographic image as the previous operation position (click position). (Step S11). If the operation position is not within the same photo image, the recognition result automatic confirmation processing unit 45 sets the confirmation flag to “Confirm” for all face image regions in all the photo images ranked before the photo image. Is performed (step S12). If the operation position is not within the same photograph image, the recognition result automatic determination process in step S12 is omitted.

次に、CPU5は、操作位置(クリック位置)が、認識候補表示位置かどうかを判断する(ステップS13)。操作位置が認識結果表示位置(前述のプルダウンリストボックス)の場合には、CPU5は、「候補選択ボタンクリック時処理」を実行する(ステップS14)。操作位置が認識結果表示位置でなければ、CPU5は、顔画像領域が検出された位置以外の位置がクリックされたときには、「未検出位置クリック時処理」を実行する(ステップS15)。   Next, the CPU 5 determines whether or not the operation position (click position) is a recognition candidate display position (step S13). When the operation position is the recognition result display position (the above-described pull-down list box), the CPU 5 executes a “candidate selection button click process” (step S14). If the operation position is not the recognition result display position, the CPU 5 executes “undetected position click process” when a position other than the position where the face image area is detected is clicked (step S15).

図8は、「候補選択ボタンクリック時処理」(図7のステップS14)の詳細を説明するためのフローチャートである。認識結果は、前述のとおり、選択候補提示部42の働きによって、プルダウンリストボックスの形式で表示される(図4等参照)。そして、このプルダウンリストボックスがクリックされることにより、認識候補を含む選択肢を示すプルダウンリストが展開されて表示される(ステップS21)。前述のとおり、認識候補は、基本的には、尤度の順序で表示される。そして、認識候補のほかに、「新規登録」および「登録なし」も選択肢として表示されることになる。   FIG. 8 is a flowchart for explaining details of the “processing when the candidate selection button is clicked” (step S14 in FIG. 7). As described above, the recognition result is displayed in the form of a pull-down list box by the function of the selection candidate presentation unit 42 (see FIG. 4 and the like). When this pull-down list box is clicked, a pull-down list showing options including recognition candidates is expanded and displayed (step S21). As described above, the recognition candidates are basically displayed in the order of likelihood. In addition to the recognition candidates, “new registration” and “no registration” are displayed as options.

使用者が、入力操作部2を操作して、いずれかの選択肢を選択する操作(クリック)を行うと(ステップS22)、この操作が、修正入力受付部34または確定入力受付部36によって受け付けられ、認識結果修正処理部35または認識結果確定処理部37に受け渡される。
認識結果修正処理部35または認識結果確定処理部37は、いずれかの認識候補が選択された場合には(ステップS23のYES)、当該顔画像領域に対応する認識結果を当該選択された認識候補に確定する処理を行う。より具体的には、第1認識候補が選択されたときには(ステップS24のYES)、この選択入力が確定入力受付部36によって受け付けられ、認識結果確定処理部37は、当該顔画像領域の認識結果(第1認識候補に等しい。)を確定するために、確定フラグの値を「確定」に書き換える(ステップS26)。一方、第2位以下の認識候補が選択されたときには(ステップS24のNO)、この選択入力が修正入力受付部34によって受け付けられ、認識結果修正処理部35は、当該選択された認識候補を、当該顔画像領域の認識結果として写真データベース20に書き込む(ステップS25)。さらに、認識結果修正処理部35による修正処理の通知を受けて、認識結果確定処理部37は、当該顔画像領域の確定フラグの値を「確定」に書き換える(ステップS26)。
When the user performs an operation (click) for selecting one of the options by operating the input operation unit 2 (step S22), this operation is received by the correction input receiving unit 34 or the confirmed input receiving unit 36. The result is transferred to the recognition result correction processing unit 35 or the recognition result confirmation processing unit 37.
When any recognition candidate is selected (YES in step S23), the recognition result correction processing unit 35 or the recognition result confirmation processing unit 37 displays the recognition result corresponding to the face image region as the selected recognition candidate. Perform the process to confirm. More specifically, when the first recognition candidate is selected (YES in step S24), this selection input is accepted by the confirmation input acceptance unit 36, and the recognition result confirmation processing unit 37 recognizes the recognition result of the face image region. In order to confirm (equal to the first recognition candidate), the value of the confirmation flag is rewritten to “confirmed” (step S26). On the other hand, when the second or lower recognition candidate is selected (NO in step S24), this selection input is received by the correction input receiving unit 34, and the recognition result correction processing unit 35 selects the selected recognition candidate. The recognition result of the face image area is written in the photo database 20 (step S25). Further, upon receiving the notification of the correction processing by the recognition result correction processing unit 35, the recognition result determination processing unit 37 rewrites the value of the determination flag of the face image area to “confirmation” (step S26).

一方、「新規登録」が選択された場合には(ステップS23のNOおよびステップS27のYES)、表示信号生成処理部33の働きによって、使用者が当該顔画像の人物の名前その他の識別情報を入力するためのテキスト入力エリアが表示装置3に表示される(ステップS28)。このテキスト入力エリアに対して、使用者が入力操作部2を操作して、名前その他の識別情報を入力すると(ステップS29)、認識結果修正処理部35は、当該入力された識別情報を当該顔画像領域の認識結果として写真データベース20に登録する(ステップS30)。この登録の通知を受けて、認識結果確定処理部37は、当該顔画像領域に対応した確定フラグの値を「確定」に書き換える(ステップS26)。   On the other hand, when “new registration” is selected (NO in step S23 and YES in step S27), the display signal generation processing unit 33 allows the user to display the name of the person in the face image and other identification information. A text input area for inputting is displayed on the display device 3 (step S28). When the user operates the input operation unit 2 to input a name and other identification information to the text input area (step S29), the recognition result correction processing unit 35 uses the input identification information as the face. The image area recognition result is registered in the photo database 20 (step S30). Receiving this registration notification, the recognition result confirmation processing unit 37 rewrites the value of the confirmation flag corresponding to the face image area to “confirm” (step S26).

さらに、「登録なし」が選択された場合(ステップS23のNOおよびステップS27のNO)には、認識結果修正処理部35は、その顔画像領域の認識結果を「登録なし」として写真データベース20に書き込み(ステップS31)、認識結果確定処理部37は、確定フラグの値を「確定」に書き換える(ステップS32)。
ステップS26において、写真データベース20の認識結果が確定された後には、辞書修正処理部40によって、認識辞書記憶部21の辞書データの修正処理が行われる(ステップS33)。すなわち、辞書修正処理部40は、確定された認識結果に該当する認識候補に関連する辞書データとして、当該顔画像領域中の画像の特徴量データを認識辞書記憶部21に追加する。
Further, when “no registration” is selected (NO in step S23 and NO in step S27), the recognition result correction processing unit 35 sets the recognition result of the face image area as “no registration” in the photo database 20. Writing (step S31), the recognition result confirmation processing unit 37 rewrites the value of the confirmation flag to “confirm” (step S32).
In step S26, after the recognition result of the photo database 20 is confirmed, the dictionary correction processing unit 40 performs correction processing of the dictionary data in the recognition dictionary storage unit 21 (step S33). That is, the dictionary correction processing unit 40 adds the feature amount data of the image in the face image area to the recognition dictionary storage unit 21 as dictionary data related to the recognition candidate corresponding to the confirmed recognition result.

その後、CPU5は、後述の「同一写真内重複時処理」を実行し(ステップS34)、さらに、修正された辞書データを用いて、処理中の写真画像以降の未確定のすべての顔画像領域に対して、人物画像認識処理を実行する(ステップS35)。
図9は、「未検出位置クリック時処理」(図7のステップS15)の詳細を説明するためのフローチャートである。この処理は、顔画像領域が未検出の任意の位置に検索用の付加データを付与するための処理である。使用者が写真画像中において顔画像が検出されていない位置を選択する操作(クリック)を行うと、選択候補提示部42は、当該操作位置(クリック位置)に、辞書データに登録されている複数の認識候補、「新規登録」および「登録なし」を選択肢として含むプルダウンリストボックスを展開された形式で表示させるための指令を表示信号生成処理部33に与える(ステップS40)。この状態で、使用者は、入力操作部2を操作して、いずれかの選択肢を選択する(ステップS41)。操作された選択肢がいずれかの認識候補であれば(ステップS42のYES)、認識結果修正処理部35は、クリック位置(図7のステップS5)の座標を含み、当該選択された認識候補を認識結果(検索用付加データ)として有する個別領域データを生成して、写真データベース20に登録する(ステップS43)。この登録の通知を受けて、認識結果確定処理部37は、その個別領域データの確定フラグの値を「確定」とする(ステップS44)。
Thereafter, the CPU 5 executes the “duplicate processing within the same photo” described later (step S34), and further uses the corrected dictionary data to all uncertain face image areas after the photo image being processed. On the other hand, a human image recognition process is executed (step S35).
FIG. 9 is a flowchart for explaining details of the “processing when clicking an undetected position” (step S15 in FIG. 7). This process is a process for adding additional data for search to an arbitrary position where the face image area is not detected. When the user performs an operation (click) to select a position in which no face image is detected in the photographic image, the selection candidate presenting unit 42 has a plurality of registration positions registered in the dictionary data at the operation position (click position). A command for displaying the pull-down list box including the recognition candidates “new registration” and “no registration” in the expanded form is given to the display signal generation processing unit 33 (step S40). In this state, the user operates the input operation unit 2 to select one of the options (step S41). If the operated option is any recognition candidate (YES in step S42), the recognition result correction processing unit 35 recognizes the selected recognition candidate including the coordinates of the click position (step S5 in FIG. 7). Individual area data as a result (additional data for search) is generated and registered in the photo database 20 (step S43). Receiving this registration notification, the recognition result confirmation processing unit 37 sets the value of the confirmation flag of the individual area data to “confirm” (step S44).

一方、「新規登録」の選択肢が選択された場合には(ステップS42のNOおよびステップS45のYES)、修正入力受付部34は、新規登録される認識候補の識別情報を入力させるためのテキスト入力エリアを表示装置3の表示画面上に表示させる(ステップS46)。このテキスト入力エリアに、使用者が入力操作部2の操作によって名前等の識別情報を入力すると(ステップS47)、認識結果修正処理部35は、図7のステップS5でのクリック位置の座標を含み、当該識別情報を認識結果とする個別領域データを生成して、写真データベース20に登録する(ステップS48)。この登録の通知を受けて、認識結果確定処理部37は、その個別領域データの確定フラグの値を「確定」に変更する(ステップS44)。   On the other hand, when the “new registration” option is selected (NO in step S42 and YES in step S45), the correction input receiving unit 34 inputs a text for inputting identification information of a recognition candidate to be newly registered. The area is displayed on the display screen of the display device 3 (step S46). When the user inputs identification information such as a name by operating the input operation unit 2 in this text input area (step S47), the recognition result correction processing unit 35 includes the coordinates of the click position in step S5 of FIG. Individual area data having the identification information as a recognition result is generated and registered in the photograph database 20 (step S48). Receiving this registration notification, the recognition result confirmation processing unit 37 changes the value of the confirmation flag of the individual area data to “confirm” (step S44).

「登録なし」の選択肢が選択された場合には(ステップS42のNOおよびステップS45のNO)、認識結果修正処理部35は、当該クリック位置(図7のステップS5)の座標を含み、認識結果を「登録なし」とした個別領域データを生成し、これを写真データベース20に登録する(ステップS49)。また、認識結果確定処理部37は、その個別領域データの確定フラグの値を「確定」とする(ステップS44)。   When the “no registration” option is selected (NO in step S42 and NO in step S45), the recognition result correction processing unit 35 includes the coordinates of the click position (step S5 in FIG. 7), and the recognition result. The individual area data with “not registered” is generated and registered in the photo database 20 (step S49). Further, the recognition result confirmation processing unit 37 sets the value of the confirmation flag of the individual area data to “confirm” (step S44).

図10は、人物画像認識処理の詳細(図7のステップS3および図8のステップS35)を説明するためのフローチャートである。人物画像認識処理部32は、確定フラグの値が「未確定」の顔画像領域を含む写真画像を順に処理し、顔画像領域中の画像を認識辞書記憶部21に記憶されている辞書データと照合することによって、人物画像を認識していく(ステップS51)。これにより、辞書データに格納されているすべての認識候補に対して、当該顔画像領域中の人物が当該認識候補である尤度が演算される。演算された認識候補ごとの尤度は、写真データベース20の当該顔画像領域に対応する個別領域データ中に、認識候補データとして登録される。   FIG. 10 is a flowchart for explaining the details of the human image recognition process (step S3 in FIG. 7 and step S35 in FIG. 8). The person image recognition processing unit 32 sequentially processes the photographic images including the face image region whose confirmation flag value is “unconfirmed”, and the image in the face image region is stored in the recognition dictionary storage unit 21 and the dictionary data. By collating, the person image is recognized (step S51). Thereby, the likelihood that the person in the face image area is the recognition candidate is calculated for all the recognition candidates stored in the dictionary data. The calculated likelihood for each recognition candidate is registered as recognition candidate data in the individual area data corresponding to the face image area of the photo database 20.

次に、後述の「同一写真内重複時処理」(ステップS52)が行われる。
人物画像認識処理部32は、1枚の写真画像中のすべての顔画像領域について同様の処理を行うと、当該写真画像が最後の写真画像かどうかを調べ(ステップS53)、最後の写真画像でなければ、次の写真画像に対して同様の処理を繰り返す(ステップS54)。こうして、最後の写真まで処理が進み、その処理が終了すると(ステップS53のYES)、表示信号生成処理部33は、認識結果を表示装置3に表示させるための表示信号を生成する(ステップS55)。これにより、人物画像認識処理が終了する。
Next, the “duplicate processing in the same picture” described later (step S52) is performed.
When the person image recognition processing unit 32 performs the same processing for all the face image areas in one photographic image, it checks whether or not the photographic image is the last photographic image (step S53). If not, the same process is repeated for the next photographic image (step S54). Thus, when the process proceeds to the last photo and the process ends (YES in step S53), the display signal generation processing unit 33 generates a display signal for displaying the recognition result on the display device 3 (step S55). . Thereby, the person image recognition process is completed.

図11は、「同一写真内重複時処理」(図8のステップS34および図10のステップS52)の詳細を説明するためのフローチャートである。優先順位設定部44は、同一写真内に同一人物の認識結果がある場合(ステップS60)、これを修正するための処理を実行する。すなわち、たとえば、優先順位設定部44は、顔画像領域検出の順序で相前後する一対の顔画像領域について、認識結果が重複する場合に(ステップS60のYES)、そのうちの一方が確定しているかどうかを判断する(ステップS61)。一方が確定済みであれば、確定していない方の顔画像領域について、同一写真内で確定された顔画像領域の認識結果として選択されていない認識候補のうちで、最も尤度の高い認識候補に認識結果を変更する(ステップS62)。   FIG. 11 is a flowchart for explaining details of the “duplicate processing in the same picture” (step S34 in FIG. 8 and step S52 in FIG. 10). When there is a recognition result of the same person in the same photograph (step S60), the priority order setting unit 44 executes a process for correcting this. That is, for example, when the recognition result overlaps for a pair of face image areas that follow each other in the order of face image area detection (YES in step S60), the priority order setting unit 44 determines one of them. It is determined whether or not (step S61). If one is confirmed, the recognition candidate with the highest likelihood among the recognition candidates not selected as the recognition result of the face image region confirmed in the same photograph for the face image region that has not been confirmed. The recognition result is changed to (Step S62).

一方、認識結果が重複する場合に(ステップS60のYES)、そのいずれもが未確定の場合には、それらの認識候補の尤度を比較し、尤度が高い方の認識結果を優先し、尤度が低い方の認識結果については、次に尤度の高い認識候補を認識結果とする修正を行う(ステップS62)。もしも、認識結果が重複し、それらの尤度が等しい場合には、たとえば、先に顔画像検出処理が行われた方(したがって人物認識処理が先に行われた方)の認識結果を優先することとし、後に処理された顔画像領域についての認識結果を修正すればよい。   On the other hand, when the recognition results overlap (YES in step S60), if both of them are uncertain, the likelihoods of those recognition candidates are compared, and the recognition result with the higher likelihood is given priority, For the recognition result with the lower likelihood, the recognition candidate with the next highest likelihood is corrected as the recognition result (step S62). If the recognition results overlap and their likelihoods are equal, for example, priority is given to the recognition result of the face image detection process performed first (the person recognition process performed first). In other words, the recognition result for the face image area processed later may be corrected.

以上のようにこの実施形態によれば、コンピュータによる人物画像認識処理を行い、その認識結果を入力操作部2の操作によって使用者が修正する構成となっている。そのため、人物画像認識処理が完全である必要はなく、使用者による修正入力によって、すべての写真画像に対して正確な付加情報(人物情報)を付与することができる。また、コンピュータによる人物画像認識処理を利用することにより、使用者の入力負担が軽減されており、少ない労力で正確な付加情報を写真画像に対して付加することができる。このようにして正確に付与された付加情報を検索条件として設定することにより、正確な検索処理を実行することができる。   As described above, according to this embodiment, a human image recognition process is performed by a computer, and the user corrects the recognition result by operating the input operation unit 2. Therefore, the person image recognition process does not need to be complete, and accurate additional information (person information) can be given to all the photographic images by a correction input by the user. Further, by utilizing the human image recognition process by the computer, the input burden on the user is reduced, and accurate additional information can be added to the photographic image with less effort. By setting the additional information correctly given as a search condition in this way, an accurate search process can be executed.

さらに、この実施形態では、認識結果が使用者によって確定または修正されることによって、認識辞書記憶部21の辞書データが修正されるようになっている。これにより、写真画像を蓄積していけばいくほど、人物画像認識処理の精度が高められていく仕組みになっている。これにより、使い込むほど、人物画像認識処理結果(認識結果)の修正作業が少なくなっていき、使用者の労力を低減していくことができる。   Further, in this embodiment, the dictionary data in the recognition dictionary storage unit 21 is corrected by confirming or correcting the recognition result by the user. As a result, the more photographic images are accumulated, the higher the accuracy of the human image recognition process. As a result, the correction work of the human image recognition processing result (recognition result) decreases as the user uses it, and the user's labor can be reduced.

また、同一写真画像中には同一人物の顔画像が表れることがないという事実に基づいて、認識結果の自動修正が行われるので、合理的な認識結果を提供することができる。これにより、使用者の修正負担を一層軽減することができるようになっている。
さらには、いずれかの写真画像データに対して確定または修正処理を実行すると、それ以前の順位の写真画像データ中の顔画像領域に関しては、認識結果が自動的に確定するようになっている。したがって、使用者は、すべての顔画像領域に関して認識結果を確定する操作を行う必要がなく、認識結果の修正が必要な画像についてだけ修正操作を行えばよい。これにより、使用者の操作負担をより一層軽減できるようになっている。
Further, since the recognition result is automatically corrected based on the fact that the same person's face image does not appear in the same photo image, a reasonable recognition result can be provided. Thereby, the user's correction burden can be further reduced.
Furthermore, when the confirmation or correction process is executed on any of the photographic image data, the recognition result is automatically determined for the face image areas in the photographic image data of the previous rank. Therefore, the user does not need to perform an operation for determining the recognition result for all the face image areas, and only needs to perform a correction operation for an image that requires correction of the recognition result. Thereby, the operation burden on the user can be further reduced.

認識結果の確定は、人物画像認識処理部32による処理対象を特定する目的で行われる。すなわち、人物画像認識処理部32は、認識結果が未確定の顔画像領域に関してのみ人物画像認識処理を実行する。これにより、人物画像認識処理を繰り返し実行するうちに、正しい認識結果が誤った認識結果に変更されてしまうことを防ぐことができる。
以上、この発明の一実施形態について説明したが、この発明は、さらに他の形態で実施することも可能である。
The recognition result is determined for the purpose of specifying the processing target by the human image recognition processing unit 32. That is, the person image recognition processing unit 32 executes the person image recognition process only for the face image area whose recognition result is undetermined. Thereby, it is possible to prevent the correct recognition result from being changed to an incorrect recognition result while the person image recognition process is repeatedly executed.
As mentioned above, although one Embodiment of this invention was described, this invention can also be implemented with another form.

たとえば、前述の実施形態では、認識結果として認識候補の名前が登録されるようにしているが、代表的な顔画像データを特定するデータを、認識結果データとして、写真データベース20に登録するようにしてもよい。具体的には、図2に仮想線で示すように、認識候補の代表的な顔画像を表すインデックス画像データを写真データベース20に登録するようにすればよい。すなわち、写真データベース20をインデックス画像データ記憶手段として用いることとし、インデックス画像登録受付部131およびインデックス画像登録処理部132を設けておく。使用者が、入力操作部2に対して、インデックス画像の登録のための所定の入力操作を行うと、この入力がインデックス画像登録受付部131によって受け付けられ、インデックス画像登録処理部131の働きによって、インデックス画像データが写真データベース20に登録される。   For example, in the above-described embodiment, the names of recognition candidates are registered as recognition results. However, data specifying typical face image data is registered in the photo database 20 as recognition result data. May be. Specifically, index image data representing a representative face image of a recognition candidate may be registered in the photo database 20 as indicated by a virtual line in FIG. That is, the photo database 20 is used as index image data storage means, and an index image registration receiving unit 131 and an index image registration processing unit 132 are provided. When the user performs a predetermined input operation for registering an index image on the input operation unit 2, this input is received by the index image registration receiving unit 131, Index image data is registered in the photo database 20.

これにより、たとえば、図4に示すような画面において、所定の入力操作を行うことで、顔画像領域61内の顔画像データを、認識候補「Aさん」のインデックス画像データとして写真データベース20に登録することができる。また、新規登録されるときの顔画像領域内のデータをインデックス画像データとして写真データベース20に登録するようにしてもよい。   Thereby, for example, by performing a predetermined input operation on the screen as shown in FIG. 4, the face image data in the face image area 61 is registered in the photo database 20 as index image data of the recognition candidate “Mr. A”. can do. Further, the data in the face image area when newly registered may be registered in the photo database 20 as index image data.

認識結果としては、インデックス画像データを特定する識別データが人物画像認識処理部32によって生成されて、個別領域データ中に登録される。この場合、表示信号生成処理部33は、写真データベース20からインデックス画像データを読み出して、各顔画像領域の近傍に、当該識別データによって特定されるインデックス画像データを表示するための表示信号を生成することが好ましい。また、選択候補のリストについても、インデックス画像データを用いて表示するようにしてもよく、さらに、検索条件の設定もインデックス画像データを用いて行えるようにしてもよい。   As the recognition result, identification data for specifying the index image data is generated by the person image recognition processing unit 32 and registered in the individual area data. In this case, the display signal generation processing unit 33 reads the index image data from the photo database 20 and generates a display signal for displaying the index image data specified by the identification data in the vicinity of each face image region. It is preferable. The selection candidate list may also be displayed using the index image data, and the search condition may be set using the index image data.

このような構成により、直感的な操作によって、認識結果を把握し、その修正を行い、また、必要な写真画像を検索することができる。また、キーボード等の熟練を要する入力装置を用いずに、ポインティングデバイスのみの操作で写真画像の管理を行うことも可能となる。
さらに、前述の実施形態では、顔画像領域を検出して、顔画像認識処理によって人物の認識を行うようにしているが、人物認識処理はこれに限定されるものではない。たとえば、人物の着衣の色に基づく認識も可能である。この場合には、人物画像検出部31による処理は、人物の着衣の部分の画像を切り出す処理となる。
With such a configuration, the recognition result can be grasped and corrected by an intuitive operation, and a necessary photographic image can be searched. In addition, it is possible to manage photographic images by operating only a pointing device without using a skillful input device such as a keyboard.
Furthermore, in the above-described embodiment, the face image area is detected and the person is recognized by the face image recognition process. However, the person recognition process is not limited to this. For example, recognition based on the color of a person's clothes is also possible. In this case, the process performed by the person image detection unit 31 is a process of cutting out an image of a person's clothes.

また、前述の実施形態では、写真画像中に人物の全身像が写っている例を挙げているが、むろん、写真画像中に必ずしも人物の全身像が写っている必要はない。
さらに、前述の実施形態では、パーソナルコンピュータ上で画像管理用プログラムを実行する例について説明したが、ウェブ(インターネットおよびイントラネットに代表されるネットワーク上で用いられるドキュメントシステム)上のアプリケーションプログラムによって、この発明の画像管理装置がネットワークに置かれたコンピュータであるサーバー上で構成されてもよい。この場合、使用者は、当該ネットワークに接続された別のコンピュータであるクライアント装置を操作することによって、写真画像の登録、認識結果の修正・確定、新規認識候補の登録といった操作をネットワークを介して行うことができる。
In the above-described embodiment, an example is shown in which a full body image of a person is shown in a photographic image, but it is needless to say that a full body image of the person is not necessarily shown in the photographic image.
Furthermore, in the above-described embodiment, an example in which an image management program is executed on a personal computer has been described. However, the present invention can be applied to an application program on the web (document system used on a network represented by the Internet and an intranet). The image management apparatus may be configured on a server which is a computer placed on a network. In this case, the user operates a client device, which is another computer connected to the network, to perform operations such as registration of photographic images, correction / confirmation of recognition results, and registration of new recognition candidates via the network. It can be carried out.

むろん、この発明の画像管理装置は、汎用コンピュータを用いて構成される必要はなく、写真画像のストックおよび閲覧が可能な専用装置として構成することもできる。このような専用装置は、たとえば、写真画像印刷サービス店の店頭に設置して、写真画像プリント注文システムに組み込んで用いることができる。
その他、特許請求の範囲に記載された事項の範囲で種々の設計変更を施すことが可能である。
Of course, the image management apparatus of the present invention does not need to be configured using a general-purpose computer, and can also be configured as a dedicated apparatus capable of stocking and browsing photographic images. Such a dedicated device can be installed in a photographic image printing service store and incorporated into a photographic image print ordering system, for example.
In addition, various design changes can be made within the scope of matters described in the claims.

この発明の一実施形態に係る画像管理装置として動作可能なコンピュータの基本的構成を説明するためのブロック図である。It is a block diagram for explaining a basic configuration of a computer operable as an image management apparatus according to an embodiment of the present invention. 前記コンピュータプログラムの実行状態におけるコンピュータ本体の機能的な構成を説明するためのブロック図である。It is a block diagram for demonstrating the functional structure of the computer main body in the execution state of the said computer program. 写真データベースに格納されるデータの構造を説明するための図解図である。It is an illustration figure for demonstrating the structure of the data stored in a photograph database. 表示装置における表示例を示す図解図である。It is an illustration figure which shows the example of a display in a display apparatus. 認識結果修正時のより詳細な処理を説明するための図である。It is a figure for demonstrating the more detailed process at the time of recognition result correction. 認識候補の表示順に関する処理の詳細を説明するための図である。It is a figure for demonstrating the detail of the process regarding the display order of a recognition candidate. 処理の流れを説明するためのフローチャートである。It is a flowchart for demonstrating the flow of a process. 「候補選択ボタンクリック時処理」(図7のステップS14)の詳細を説明するためのフローチャートである。It is a flowchart for demonstrating the detail of "a candidate selection button click process" (step S14 of FIG. 7). 「未検出位置クリック時処理」(図7のステップS15)の詳細を説明するためのフローチャートである。It is a flowchart for demonstrating the detail of "the process at the time of an undetected position click" (step S15 of FIG. 7). 人物画像認識処理の詳細(図7のステップS3および図8のステップS35)を説明するためのフローチャートである。It is a flowchart for demonstrating the detail (step S3 of FIG. 7, and step S35 of FIG. 8) of a person image recognition process. 「同一写真内重複時処理」(図8のステップS34および図10のステップS52)の詳細を説明するためのフローチャートである。13 is a flowchart for explaining details of “duplicate processing in the same photograph” (step S34 in FIG. 8 and step S52 in FIG. 10).

符号の説明Explanation of symbols

1 コンピュータ本体
2 入力操作部
3 表示装置
5 CPU
6 ROM
7 RAM
8 ハードディスクドライブ
9 CD−ROMドライブ
10 ディプレイコントローラ
11 入力部コントローラ
12 通信インタフェース
13 メモリカードスロット
14 バス
15 CD−ROM
20 写真データベース
21 認識辞書記憶部
30 写真登録処理部
31 人物画像検出部
32 人物画像認識処理部
33 表示信号生成処理部
34 修正入力受付部
35 認識結果修正処理部
36 確定入力受付部
37 認識結果確定処理部
38 検索条件入力受付部
39 画像検索処理部
40 辞書修正処理部
41 認識候補除外処理部
42 選択候補提示部
43 尤度演算部
44 優先順位設定部
45 認識結果自動確定処理部
50 表示ウィンドウ
51〜54 写真画像
55 スクロールバー
56 終了ボタン
61 顔画像領域
62 認識結果
63,64 顔画像領域
65,66 認識結果
67 人物
68 顔画像領域
69 認識候補
70 プルダウンリストボックス
71 プルダウンボタン
75〜78 人物
80,81,83 顔画像領域
85,86,88 プルダウンリストボックス
90 写真画像
91,92 人物
93,94 顔画像領域
95 認識結果
96 プルダウンリストボックス
100 写真画像
101〜103 人物
104〜106 顔画像領域
107〜109 プルダウンリストボックス
131 インデックス画像登録処理部
132 インデックス画像登録処理部
A,B 人物
DESCRIPTION OF SYMBOLS 1 Computer main body 2 Input operation part 3 Display apparatus 5 CPU
6 ROM
7 RAM
8 Hard disk drive 9 CD-ROM drive 10 Display controller 11 Input controller 12 Communication interface 13 Memory card slot 14 Bus 15 CD-ROM
DESCRIPTION OF SYMBOLS 20 Photo database 21 Recognition dictionary memory | storage part 30 Photo registration process part 31 Person image detection part 32 Person image recognition process part 33 Display signal generation process part 34 Correction input reception part 35 Recognition result correction process part 36 Confirmation input reception part 37 Recognition result confirmation Processing unit 38 Search condition input receiving unit 39 Image search processing unit 40 Dictionary correction processing unit 41 Recognition candidate exclusion processing unit 42 Selection candidate presentation unit 43 Likelihood calculation unit 44 Priority order setting unit 45 Recognition result automatic decision processing unit 50 Display window 51 -54 Photo image 55 Scroll bar 56 End button 61 Face image area 62 Recognition result 63, 64 Face image area 65, 66 Recognition result 67 Person 68 Face image area 69 Recognition candidate 70 Pull-down list box 71 Pull-down button 75-78 Person 80, 81, 83 Face image area 85, 86, 8 Pull-down list box 90 Photo image 91, 92 Person 93, 94 Face image area 95 Recognition result 96 Pull-down list box 100 Photo image 101-103 Person 104-106 Face image area 107-109 Pull-down list box 131 Index image registration processing unit 132 Index Image registration processing part A, B

Claims (11)

人物画像を含む複数枚の画像データを記憶するための画像データ記憶手段と、
この画像データ記憶手段に記憶されている個々の画像データ中の人物画像を認識する人物画像認識手段と、
この人物画像認識手段による認識結果を各画像データに対応付けて記憶するための認識結果記憶手段と、
前記人物画像認識手段による認識結果を修正するための修正入力を受け付ける修正入力受付手段と、
この修正入力受付手段によって受け付けられた修正入力に応じて、前記認識結果記憶手段に記憶されている認識結果を修正する認識結果修正手段とを含むことを特徴とする画像管理装置。
Image data storage means for storing a plurality of image data including a person image;
Person image recognition means for recognizing person images in individual image data stored in the image data storage means;
A recognition result storage means for storing the recognition result by the person image recognition means in association with each image data;
Correction input receiving means for receiving a correction input for correcting a recognition result by the person image recognition means;
An image management apparatus comprising: a recognition result correcting unit that corrects a recognition result stored in the recognition result storage unit according to a correction input received by the correction input receiving unit.
前記画像データ記憶手段に記憶されている画像データとともに前記人物画像認識手段による認識結果を表示装置に表示するための表示信号を生成する表示信号生成手段をさらに含むことを特徴とする請求項1記載の画像管理装置。   2. The display signal generating means for generating a display signal for displaying a recognition result by the human image recognition means on a display device together with the image data stored in the image data storage means. Image management device. 人物画像の認識のための辞書データを記憶する辞書記憶手段と、
前記認識結果修正手段によって修正された認識結果に基づき、前記辞書記憶手段の辞書データを修正する辞書修正手段とをさらに含み、
前記人物画像認識手段は、前記辞書記憶手段に記憶されている辞書データに基づいて、画像データ中の人物画像を認識するものであることを特徴とする請求項1または2記載の画像管理装置。
Dictionary storage means for storing dictionary data for recognition of person images;
A dictionary correction unit for correcting dictionary data in the dictionary storage unit based on the recognition result corrected by the recognition result correction unit;
3. The image management apparatus according to claim 1, wherein the person image recognition means recognizes a person image in the image data based on dictionary data stored in the dictionary storage means.
前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、
前記辞書修正手段は、前記確定された認識結果に基づいて前記辞書記憶手段の辞書データを修正する手段を含むことを特徴とする請求項3記載の画像管理装置。
A recognition result confirmation unit for confirming the recognition result stored in the recognition result storage unit;
4. The image management apparatus according to claim 3, wherein the dictionary correction means includes means for correcting dictionary data in the dictionary storage means based on the determined recognition result.
前記認識結果記憶手段に記憶されている認識結果に基づいて画像データを検索する検索手段をさらに含むことを特徴とする請求項1ないし4のいずれかに記載の画像管理装置。   5. The image management apparatus according to claim 1, further comprising search means for searching for image data based on a recognition result stored in the recognition result storage means. 前記人物画像認識手段は、
人物画像が認識候補の画像である尤度を複数の認識候補についてそれぞれ演算する尤度演算手段と、
複数の人物画像を含む画像データ中において、最大尤度の認識候補が2以上の人物画像間で重複する場合に、前記尤度演算手段によって求められた尤度に従って認識候補の優先順位を定める優先順位設定手段とを含むことを特徴とする請求項1ないし5のいずれかに記載の画像管理装置。
The person image recognition means
Likelihood calculating means for calculating the likelihood that the person image is an image of a recognition candidate for each of the plurality of recognition candidates;
Priority for determining the priority of recognition candidates according to the likelihood obtained by the likelihood calculating means when the maximum likelihood recognition candidate overlaps between two or more person images in image data including a plurality of person images 6. The image management apparatus according to claim 1, further comprising a rank setting unit.
前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、
前記修正入力受付手段は、使用者に対して、複数の認識候補の選択肢を提示する選択候補提示手段を含み、
複数の人物画像を含む画像データ中において、いずれかの人物画像の認識結果が前記認識結果確定手段によって確定された場合に、当該画像データ中の認識結果未確定の人物画像について前記選択候補提示手段によって提示される認識候補の選択肢から、前記確定された認識結果を除外する認識候補除外手段をさらに含むことを特徴とする請求項1ないし6のいずれかに記載の画像管理装置。
A recognition result confirmation unit for confirming the recognition result stored in the recognition result storage unit;
The correction input receiving means includes a selection candidate presenting means for presenting a plurality of recognition candidate options to the user,
When the recognition result of any person image is determined by the recognition result determination means in the image data including a plurality of person images, the selection candidate presenting means for the person image whose recognition result is not determined in the image data. The image management apparatus according to claim 1, further comprising: a recognition candidate exclusion unit that excludes the confirmed recognition result from the recognition candidate options presented by the step.
前記人物画像認識手段は、認識結果データとして、認識結果に対応するインデックス画像データを特定するインデックス画像特定データを生成するものであることを特徴とする請求項1ないし7のいずれかに記載の画像管理装置。   8. The image according to claim 1, wherein the person image recognition means generates index image specifying data for specifying index image data corresponding to the recognition result as the recognition result data. Management device. 前記認識結果記憶手段に記憶されている認識結果を確定するための認識結果確定手段をさらに含み、
前記画像データ記憶手段に記憶される画像データは、順序付けされており、
前記人物画像認識手段は、前記順序付けに従って前記画像データ記憶手段に記憶されている複数枚の画像データに関して人物画像認識処理を実行するものであり、
前記認識結果確定手段によって確定された認識結果に対応した画像データ以前の順位の画像データに関する認識結果を自動確定する認識結果自動確定手段をさらに含むことを特徴とする請求項1ないし8のいずれかに記載の画像管理装置。
A recognition result confirmation unit for confirming the recognition result stored in the recognition result storage unit;
The image data stored in the image data storage means are ordered,
The person image recognition means performs person image recognition processing on a plurality of pieces of image data stored in the image data storage means according to the ordering,
9. The automatic recognition result confirming unit for automatically confirming a recognition result related to image data of an order prior to image data corresponding to the recognition result determined by the recognition result determining unit. The image management apparatus described in 1.
人物画像を含む複数枚の画像データを管理するための画像管理装置としてコンピュータを動作させるためのコンピュータプログラムであって、
前記コンピュータは、人物画像を含む複数枚の画像データを記憶するための画像データ記憶手段、および人物画像の認識結果を記憶するための認識結果記憶手段を含み、
前記コンピュータプログラムは、前記コンピュータを、
前記画像データ記憶手段に記憶されている個々の画像データ中の人物画像を認識する人物画像認識手段、
この人物画像認識手段による認識結果を各画像データに対応付けて前記認識結果記憶手段に書き込む手段、
前記人物画像認識手段による認識結果を修正するための修正入力を受け付ける修正入力受付手段、および
この修正入力受付手段によって受け付けられた修正入力に応じて、前記認識結果記憶手段に記憶されている認識結果を修正する認識結果修正手段
として機能させるものであることを特徴とする画像管理用コンピュータプログラム。
A computer program for operating a computer as an image management device for managing a plurality of image data including a person image,
The computer includes image data storage means for storing a plurality of image data including a person image, and a recognition result storage means for storing a recognition result of the person image,
The computer program stores the computer,
Person image recognition means for recognizing a person image in individual image data stored in the image data storage means;
Means for writing the recognition result by the person image recognition means in association with each image data into the recognition result storage means;
A correction input receiving means for receiving a correction input for correcting the recognition result by the person image recognition means, and a recognition result stored in the recognition result storage means in response to the correction input received by the correction input receiving means. A computer program for image management, which functions as a recognition result correcting means for correcting the image.
請求項10記載のコンピュータプログラムが記録されたコンピュータ読取可能な記録媒体。   A computer-readable recording medium on which the computer program according to claim 10 is recorded.
JP2005210374A 2005-07-20 2005-07-20 Image management device, image-managing computer program and recording medium recording the same Withdrawn JP2007026316A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005210374A JP2007026316A (en) 2005-07-20 2005-07-20 Image management device, image-managing computer program and recording medium recording the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005210374A JP2007026316A (en) 2005-07-20 2005-07-20 Image management device, image-managing computer program and recording medium recording the same

Publications (1)

Publication Number Publication Date
JP2007026316A true JP2007026316A (en) 2007-02-01

Family

ID=37786959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005210374A Withdrawn JP2007026316A (en) 2005-07-20 2005-07-20 Image management device, image-managing computer program and recording medium recording the same

Country Status (1)

Country Link
JP (1) JP2007026316A (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020374A (en) * 2008-07-08 2010-01-28 Sony Corp Information processor, information processing method, and computer program
JP2011010012A (en) * 2009-06-25 2011-01-13 Nikon Corp Digital camera
JP2011516966A (en) * 2008-04-02 2011-05-26 グーグル インコーポレイテッド Method and apparatus for incorporating automatic face recognition in a digital image collection
WO2011065236A1 (en) * 2009-11-25 2011-06-03 Kddi株式会社 Secondary content provision system and method
WO2014021005A1 (en) * 2012-07-31 2014-02-06 日本電気株式会社 Image processing system, image processing method, and program
KR101378372B1 (en) 2007-07-12 2014-03-27 삼성전자주식회사 Digital image processing apparatus, method for controlling the same, and recording medium storing program to implement the method
JP2015062141A (en) * 2009-08-07 2015-04-02 グーグル インコーポレイテッド User interface for presenting search results for multiple regions of visual query
JP2016173847A (en) * 2011-09-01 2016-09-29 クアルコム,インコーポレイテッド Systems and methods involving augmented menu using mobile device
JP2017513090A (en) * 2014-05-15 2017-05-25 華為技術有限公司Huawei Technologies Co.,Ltd. Object search method and apparatus
JP2018197980A (en) * 2017-05-24 2018-12-13 シャープ株式会社 Image display device, image forming device, control program, and control method
JP2019023923A (en) * 2009-08-07 2019-02-14 グーグル エルエルシー Facial recognition with social network aiding
JP2019200536A (en) * 2018-05-15 2019-11-21 オリンパス株式会社 Image acquisition apparatus, image acquisition method, and image acquisition program

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101378372B1 (en) 2007-07-12 2014-03-27 삼성전자주식회사 Digital image processing apparatus, method for controlling the same, and recording medium storing program to implement the method
US8897508B2 (en) 2008-04-02 2014-11-25 Google Inc. Method and apparatus to incorporate automatic face recognition in digital image collections
JP2011516966A (en) * 2008-04-02 2011-05-26 グーグル インコーポレイテッド Method and apparatus for incorporating automatic face recognition in a digital image collection
KR101618735B1 (en) * 2008-04-02 2016-05-09 구글 인코포레이티드 Method and apparatus to incorporate automatic face recognition in digital image collections
JP2014222519A (en) * 2008-04-02 2014-11-27 グーグル インコーポレイテッド Method and apparatus to incorporate automatic face recognition in digital image collections
JP2010020374A (en) * 2008-07-08 2010-01-28 Sony Corp Information processor, information processing method, and computer program
JP2011010012A (en) * 2009-06-25 2011-01-13 Nikon Corp Digital camera
JP2019023923A (en) * 2009-08-07 2019-02-14 グーグル エルエルシー Facial recognition with social network aiding
JP2015062141A (en) * 2009-08-07 2015-04-02 グーグル インコーポレイテッド User interface for presenting search results for multiple regions of visual query
JP2011134302A (en) * 2009-11-25 2011-07-07 Kddi Corp System and method for providing secondary content
WO2011065236A1 (en) * 2009-11-25 2011-06-03 Kddi株式会社 Secondary content provision system and method
JP2016173847A (en) * 2011-09-01 2016-09-29 クアルコム,インコーポレイテッド Systems and methods involving augmented menu using mobile device
US10368010B2 (en) 2012-07-31 2019-07-30 Nec Corporation Image processing system, image processing method, and program
JPWO2014021005A1 (en) * 2012-07-31 2016-07-21 日本電気株式会社 Image processing system, image processing method, and program
WO2014021005A1 (en) * 2012-07-31 2014-02-06 日本電気株式会社 Image processing system, image processing method, and program
US10554905B2 (en) 2012-07-31 2020-02-04 Nec Corporation Image processing system, image processing method, and program
US10623659B2 (en) 2012-07-31 2020-04-14 Nec Corporation Image processing system, image processing method, and program
US11082634B2 (en) 2012-07-31 2021-08-03 Nec Corporation Image processing system, image processing method, and program
JP2017513090A (en) * 2014-05-15 2017-05-25 華為技術有限公司Huawei Technologies Co.,Ltd. Object search method and apparatus
US10311115B2 (en) 2014-05-15 2019-06-04 Huawei Technologies Co., Ltd. Object search method and apparatus
JP2018197980A (en) * 2017-05-24 2018-12-13 シャープ株式会社 Image display device, image forming device, control program, and control method
JP2019200536A (en) * 2018-05-15 2019-11-21 オリンパス株式会社 Image acquisition apparatus, image acquisition method, and image acquisition program

Similar Documents

Publication Publication Date Title
JP2007026316A (en) Image management device, image-managing computer program and recording medium recording the same
US11868717B2 (en) Multi-page document recognition in document capture
US11775744B2 (en) Systems and methods for on-image navigation and direct image-to-data storage table data capture
US10120537B2 (en) Page-independent multi-field validation in document capture
KR101033017B1 (en) Change request form annotation
US8069173B2 (en) Information processing apparatus and method of controlling the same, information processing method, and computer program
US20070098263A1 (en) Data entry apparatus and program therefor
AU2016201273B2 (en) Recommending form fragments
JP2007286864A (en) Image processor, image processing method, program, and recording medium
JP6826293B2 (en) Information information system and its processing method and program
JP2007317034A (en) Image processing apparatus, image processing method, program, and recording medium
JP2010205257A (en) Image management apparatus, and control method thereof, and program
US9824447B2 (en) Information processing apparatus, information processing system, and information processing method
US10242030B2 (en) Information processing system, information processing method, and information processing apparatus
JP4964080B2 (en) Image processing system, image processing method, and image processing program
JP5541868B2 (en) Image search command system and operation control method thereof
JP5039505B2 (en) Document search apparatus and document search support method
JP7377565B2 (en) Drawing search device, drawing database construction device, drawing search system, drawing search method, and program
JP2002259173A (en) File management program, computer readable recording medium in which file management program is recorded, file managing device and file managing method
JP4189461B2 (en) File management program, computer-readable recording medium storing file management program, file management apparatus, and file management method
JP5298484B2 (en) Document processing device
JP6512236B2 (en) Information processing apparatus and program
JP2024027246A (en) Document management apparatus, document management method, and document management program
JP2009003565A (en) Information processor and information processing method
JP2003050968A (en) Device and method for document filing and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080606

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100211