JP5826513B2 - Similar image search system - Google Patents

Similar image search system Download PDF

Info

Publication number
JP5826513B2
JP5826513B2 JP2011109071A JP2011109071A JP5826513B2 JP 5826513 B2 JP5826513 B2 JP 5826513B2 JP 2011109071 A JP2011109071 A JP 2011109071A JP 2011109071 A JP2011109071 A JP 2011109071A JP 5826513 B2 JP5826513 B2 JP 5826513B2
Authority
JP
Japan
Prior art keywords
image
search
similar
keyword
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011109071A
Other languages
Japanese (ja)
Other versions
JP2012242878A5 (en
JP2012242878A (en
Inventor
小倉 慎矢
慎矢 小倉
平井 誠一
誠一 平井
秀昭 打越
秀昭 打越
智巳 高田
智巳 高田
伊藤 渡
渡 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2011109071A priority Critical patent/JP5826513B2/en
Priority to PCT/JP2012/062309 priority patent/WO2012157611A1/en
Publication of JP2012242878A publication Critical patent/JP2012242878A/en
Publication of JP2012242878A5 publication Critical patent/JP2012242878A5/ja
Application granted granted Critical
Publication of JP5826513B2 publication Critical patent/JP5826513B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、類似画像検索システム、および、類似画像検索方法に係り、特に、映像監視システムの人物の検索のためのユーザインタフェースを使い勝手のよいものにする用途に用いて好適な類似画像検索システム、および、類似画像検索方法に関する。   The present invention relates to a similar image search system and a similar image search method, and in particular, a similar image search system suitable for use in making a user interface for searching for a person in a video surveillance system easy to use, The present invention also relates to a similar image search method.

従来から、ホテル、ビル、コンビニエンスストア、金融機関、ダムや道路といった不特定多数の人が訪れる施設には、犯罪抑止や事故防止等の目的で、映像監視システムが設置されている。これは、監視対象の人物等をカメラ等の撮像装置で撮影し、その映像を、管理事務所や警備室等の監視センタに伝送し、常駐する監視者がそれを監視し、目的や必要に応じて注意する、あるいは映像を記録するものである。   Conventionally, video surveillance systems are installed in facilities visited by an unspecified number of people such as hotels, buildings, convenience stores, financial institutions, dams and roads for the purpose of crime prevention and accident prevention. This is because a person to be monitored is photographed by an imaging device such as a camera, and the video is transmitted to a monitoring center such as a management office or a security room, and the resident supervisor monitors it, and the purpose and necessity Be careful depending on the situation, or record video.

映像監視システムにおいて、映像を記録するための記録媒体には、従来のビデオテープ媒体から、ハードディスクドライブ(HDD)に代表されるランダムアクセス媒体が用いられる事例が増えている。さらに近年ではこのような記録媒体の大容量化が進んでいる。
記録媒体の大容量化は、記録できる映像の量を飛躍的に増大させ、より多地点や長時間の記録を可能にしつつある反面、記録画像を目視でチェックする負担の増加が問題として顕在化しつつある。
In video surveillance systems, a random access medium represented by a hard disk drive (HDD) is increasingly used as a recording medium for recording video from a conventional videotape medium. In recent years, the capacity of such recording media has been increasing.
Increasing the capacity of recording media has dramatically increased the amount of video that can be recorded, making it possible to record at many locations and for a long time, while increasing the burden of visually checking recorded images has become a problem. It's getting on.

このような背景から、所望の映像をより簡単に見つけ出すための検索機能を備える映像監視システムが普及しつつある。特に、近年では、映像中の特定の事象(イベント)の発生に対して、画像認識技術を用いてリアルタイムに自動検知して映像と共に記録し、事後にそれらのイベントを検索可能とする、より高度な検索機能を備えたシステムが登場しつつある。その中の代表的な一つに人物検索機能がある。
人物検索機能とは、映像中への人物の登場を自動検知の対象として、リアルタイムに記録し、事後に記録画像中から人物登場画像を探し出せる機能である。
Against this background, video surveillance systems having a search function for finding a desired video more easily are becoming widespread. In particular, in recent years, the occurrence of specific events (events) in video can be automatically detected in real time using image recognition technology and recorded along with the video, and these events can be searched afterwards. A system with a simple search function is emerging. One of them is a person search function.
The person search function is a function that records in real time the appearance of a person in a video as an object of automatic detection, and can search for a person appearance image from recorded images after the fact.

機能面から人物検索機能は、以下の2種類に大別される。
1つ目は、登場イベント検索機能である。登場イベント検索機能は、映像中への人物の登場(イベント)の有無を、単純に探し出す機能である。検索結果にはイベントの有無に加え、イベント有と判定された場合には、そのイベント数と各イベントの発生時刻やイベントを撮影した撮像装置番号、撮影した画像(人物登場画像)等を提示する。なお、この検索のクエリ(Query)には、イベント発生時刻や撮像装置番号等の検索対象範囲を絞込むための情報として与える場合が多い。以下では、この検索対象範囲を絞込むための情報を、「絞込みパラメータ」ということにする。
2つ目は、類似人物検索機能である。上述の登場イベント検索機能が、登場人物を特定しない検索であるのに対し、こちらはユーザが指定する特定人物が、他の時間、あるいは他の地点の撮像装置で撮影されていないかどうかを、記録画像中から探し出す機能である。検索結果には、特定人物が映った他の画像の有無に加え、有の場合には、その数と撮影時刻、撮像装置番号、撮影した画像(人物登場画像)、後述の類似度等を返す。
特定人物の指定は、探したい人物が映った画像(以降、検索キー画像)をユーザが1ケ指定することで実施される。検索キー画像は、記録画像や外部装置からの任意の画像から指定される。検索は、この検索キー画像中の人物の画像特徴量を画像認識技術により抽出し、記録画像中の人物の画像特徴量と照合し、その類似性(類似度)を求め、同一人物判定を実施することにより実現される。記録画像中の人物特徴量の抽出と記録は、映像録画時等の別タイミングにて予め実施しておく。この検索のクエリにおいても、絞込みパラメータを与えることが可能である場合が多い。
From the functional aspect, the person search function is roughly divided into the following two types.
The first is an appearance event search function. The appearance event search function is a function for simply searching for the presence or absence of a person (event) in the video. In the search result, in addition to the presence or absence of an event, if it is determined that there is an event, the number of events, the occurrence time of each event, the imaging device number that captured the event, the captured image (person appearance image), etc. are presented . In many cases, this search query is given as information for narrowing the search target range such as the event occurrence time and the imaging device number. Hereinafter, the information for narrowing down the search target range is referred to as “narrowing parameter”.
The second is a similar person search function. While the above-mentioned appearance event search function is a search that does not specify a character, this is whether or not a specific person specified by the user has been taken by an imaging device at another time or at another point. This is a function for searching for recorded images. In the search result, in addition to the presence / absence of other images showing a specific person, the number and shooting time, imaging device number, captured image (person appearing image), similarity degree to be described later, and the like are returned if present. .
The designation of the specific person is performed by the user designating one image (hereinafter referred to as a search key image) showing the person to be searched. The search key image is designated from a recorded image or an arbitrary image from an external device. In the search, the image feature quantity of the person in this search key image is extracted by image recognition technology, collated with the image feature quantity of the person in the recorded image, the similarity (similarity) is obtained, and the same person determination is performed. It is realized by doing. The extraction and recording of the human feature amount in the recorded image is performed in advance at another timing such as during video recording. Even in this search query, it is often possible to give a refinement parameter.

両検索機能のどちらにおいても、検索結果には記録画像を取り出すためのリンケージ情報が付与されており、検索結果から記録画像の頭出し再生が可能になっている。
特許文献1には、このように検索キー画像を指定して、検索結果の画像から選択して、別の表示領域に表示して、それを次の検索キー画像にするなどしてユーザの利便性を高めるようにした画像検索装置が開示されている。
また、特許文献2には、ユーザの利便性をさらに高める類似画像検索システムが記載されている。この特許文献2では、ユーザは、類似画像検索の結果に対して、人名や特徴などのキーワードを付与する。画像検索には、二種類の検索方法が用意されており、キーワードを付与された画像を検索の対象から除く類似画像検索と、キーワードを付与された画像のみを検索の対象とする登場イベント検索がある。ユーザは、類似画像検索を複数回行い、充分多くの画像にキーワードを付与した判断した後に、登場イベント検索を行う。
In both search functions, linkage information for taking out a recorded image is given to the search result, and it is possible to cue and reproduce the recorded image from the search result.
In Patent Document 1, a search key image is designated in this way, selected from search result images, displayed in another display area, and used as the next search key image. An image search apparatus that improves the performance is disclosed.
Patent Document 2 describes a similar image search system that further enhances user convenience. In this patent document 2, the user gives keywords such as a person name and features to the result of similar image search. There are two types of search methods available for image search: similar image search that excludes images with keywords from search targets, and appearance event search that searches only images with keywords. is there. The user performs similar event search a plurality of times, and performs appearance event search after determining that keywords have been assigned to a sufficiently large number of images.

特開2009−123196号公報JP 2009-123196 A 特開2011−090476号公報JP 2011-090476 A

特許文献2に示すようなキーワード付与機能は、類似画像検索を行う場合に非常に便利である。しかしながら、現状の類似人物検索におけるキーワード付与機能は、ユーザの入力負荷が大きいという問題がある。
即ち、ユーザは類似画像検索の結果に対し、検索結果から多数の正解画像を選択してキーワードの付与を行う必要がある。
また、登場イベント検索の結果に対してキーワードを付与したい場合には、キーワードを、その都度キーボードから入力する手間をかける必要がある。
さらに、当該システムの運用において、例えば名字と名前を合わせたフルネームをキーワードとして入力することと規定されていた場合には、ユーザはそのフルネームを完全に知っておく必要がある。つまり、以前に入力したことはあるが、姓を覚えているが名を忘れてしまった場合や、漢字やスペルを忘れてしまった場合に、別途調査して完全な情報を手に入れないと入力できない問題がある。
本発明は、上記のような問題に鑑み、キーワード付与機能の向上、検索の容易性の向上した類似画像検索システムの提供を目的とする。
The keyword assignment function as shown in Patent Document 2 is very convenient when performing a similar image search. However, the keyword assignment function in the current similar person search has a problem that the user's input load is large.
That is, the user needs to select a number of correct images from the search results and assign keywords to the similar image search results.
Further, when it is desired to assign a keyword to the result of the appearance event search, it is necessary to take time and effort to input the keyword from the keyboard each time.
Further, in the operation of the system, for example, when it is stipulated that a full name combining a surname and a name is input as a keyword, the user needs to know the full name completely. In other words, if you have entered it before, but you have remembered your last name but forgot your first name, or if you forgot your kanji or spelling, you have to investigate and get complete information There is a problem that cannot be entered.
In view of the above problems, an object of the present invention is to provide a similar image search system with an improved keyword assignment function and improved search ease.

上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有するものである。   In order to achieve the above object, a similar image search system according to the present invention includes an image pickup device, a recording device that records image data input from the image pickup device on a recording medium, and a terminal device. The recording device extracts the feature amount of the image data, evaluates the similarity of the images, designates a search key image, and outputs image data having a high similarity to the designated search key image. It has a means for searching and assigning a keyword to each image data, and a means for dynamically presenting the keyword assignment candidate.

上記本発明の類似画像検索システムにおいて、前記端末装置は、前記録画装置が検索した結果から、類似度が高い画像を自動的に選択状態にして表示することを特徴とする。   In the similar image search system of the present invention, the terminal device automatically selects and displays an image having a high degree of similarity based on a search result of the recording device.

また上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記端末装置は、前記録画装置が当該登場イベント検索手段を実行した結果を表示し、前記録画装置は、前記端末装置に表示された画像データの一覧から、ユーザによって選択された画像を検索キー画像として類似度が高い画像データを検索し、類似画像検索結果にキーワード付与済みの結果が含まれていれば、そのキーワードを付与候補として表示する、画像の類似度によらず画像データの一覧を提示する登場イベント検索する手段を有するものである。   In order to achieve the above object, a similar image retrieval system of the present invention includes an imaging device, a recording device that records image data input from the imaging device on a recording medium, and a terminal device. The terminal device displays a result of the recording device executing the appearance event search means, and the recording device searches for an image selected by the user from a list of image data displayed on the terminal device. Search for image data with a high similarity as a key image, and if the similar image search result includes a keyword-added result, the keyword is displayed as a candidate for addition. A list of image data regardless of the image similarity It has a means to search for the appearance event which presents.

本発明によれば、類似画像検索の結果から、多数の画像を選択して、一度にキーワードを付与することができる。   According to the present invention, it is possible to select a large number of images from the results of similar image search and assign keywords at once.

本発明の類似画像検索システムの一実施例のシステム構成図である。It is a system configuration | structure figure of one Example of the similar image search system of this invention. 本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。It is a figure which shows one Example of the hardware constitutions of the imaging device used for the similar image search system of this invention. 本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。It is a figure which shows one Example of the hardware constitutions of the video recording apparatus used for the similar image search system of this invention. 本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。It is a figure which shows one Example of the hardware constitutions of the terminal device used for the similar image search system of this invention. 本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。It is a figure which shows one Example of the data structure used for the similar image search system of this invention. 本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。It is a figure which shows one Example of the data structure used for the similar image search system of this invention. 本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。It is a figure which shows one Example of the data structure used for the similar image search system of this invention. 本発明の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。It is a process sequence diagram between the video recording apparatus 102 and the terminal device 103 in the keyword provision from the similar image search result of this invention. 本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。In the similar image search system of this invention, it shows one Example of the process sequence figure between the video recording apparatus and a terminal device in the keyword assignment from an appearance event search result. 本発明の類似画像検索システムにおいて、検索実行前の初期状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the initial state before search execution. 本発明の類似画像検索システムにおいて、類似人物検索実行直前状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the state immediately before similar person search execution. 本発明の類似画像検索システムにおいて、類似人物検索実行直後状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the state immediately after similar person search execution. 本発明の類似画像検索システムにおいて、キーワード付与実行直後状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the state immediately after keyword provision execution. 本発明の類似画像検索システムにおいて、登場イベント検索実行直前状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the state just before execution event search execution. 本発明の類似画像検索システムにおいて、登場イベント検索実行直後状態における検索画面の一実施例を示した図である。It is the figure which showed one Example of the search screen in the state immediately after execution appearance search in the similar image search system of this invention. 本発明の類似画像検索システムにおいて、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示した図である。It is the figure which showed one Example of the search screen after the person selection operation by the user after an appearance event search in the similar image search system of this invention. 本発明の類似画像検索システムにおいて、登場イベント検索後のキーワード付与実行直後状態における検索画面の一実施例を示した図である。In the similar image search system of this invention, it is the figure which showed one Example of the search screen in the state immediately after the keyword provision execution after appearance event search.

本発明の類似画像検索システムは、例えば、撮像装置、撮像装置から送信された画像データを記録する録画装置、および録画装置に記録された画像データから所望の画像を検索し、当該検索した画像を要求して表示する端末装置から構成される類似画像検索システムにおいて、録画装置は、当該録画装置の各部の制御および所定の機能を実現するための第1のプログラムを実行する第1のCPUと、検索のための画像データおよび第1のCPUで実行する前記第1のプログラムをロードして格納する第1の主記憶部と、撮像装置から受信した画像データおよび第1のプログラムを格納する第1の補助記憶部とからなる。
また端末装置は、例えば、当該端末装置の各部の制御および所定の機能を実現するための第2のプログラムを実行する第2のCPUと、表示装置に表示するための画像データや第2のCPU261で実行する第2のプログラムをロードして格納するための第2の主記憶部と、検索キーワード、画像データ、および第2のプログラムを格納する第2の補助記憶部とからなる。
The similar image retrieval system of the present invention retrieves a desired image from, for example, an imaging device, a recording device that records image data transmitted from the imaging device, and image data recorded in the recording device. In a similar image retrieval system configured by requesting and displaying a terminal device, the recording device includes a first CPU that executes a first program for controlling each part of the recording device and realizing a predetermined function; A first main storage unit that loads and stores the image data for search and the first program executed by the first CPU, and a first main unit that stores the image data and the first program received from the imaging apparatus. And an auxiliary storage unit.
In addition, the terminal device includes, for example, a second CPU that executes a second program for realizing control of each unit of the terminal device and a predetermined function, image data to be displayed on the display device, and a second CPU 261. The second main storage unit for loading and storing the second program to be executed in (2), and the second auxiliary storage unit for storing the search keyword, the image data, and the second program.

また例えば、第1のCPUは、撮像装置から受信した画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う人物領域検出部、人物領域検出部で検出した領域に対して画像認識技術を用いて特徴量算出を行う人物特徴量抽出部、人物特徴量抽出部で算出した特徴量を主記憶部に記録する人物特徴量記録部、端末装置からの検索要求の受信を行う要求受信部、要求受信部にて受信した検索要求に応じて検索を行う検索部、検索部から得た検索結果を端末装置に送信する検索結果送信部、要求受信部が前記端末装置から受信したキーワード付与要求に基づきキーワードを主記憶部に記録するキーワード記録部、要求受信部が受信した検索要求データ中にキーワードが含まれていた場合には、補助記憶部に記録された画像データについてキーワードで検索を行うキーワード検索部を備える。
また例えば、第2のCPUは、検索要求の録画装置への送信を行う検索要求送信部、検索結果画像および検索結果データを録画装置から受信する検索結果受信部、検索結果受信部にて受信した検索結果画像を画面表示する検索結果表示部、録画装置から入力された画像データを連続動画表示する再生画像表示部、ユーザによる操作内容の検知および取得を行う画面操作検知部、キーワード付与要求を前記録画装置に送信するキーワード付与要求送信部を備える。
Further, for example, the first CPU performs person detection using image recognition technology on the image data received from the imaging device, determines the presence of a person in the image, and if a person exists, A person area detection unit that performs coordinate calculation, a person feature amount extraction unit that performs image feature calculation on an area detected by the person area detection unit, and a feature amount calculated by the person feature amount extraction unit A personal feature amount recording unit to be recorded in the unit, a request receiving unit for receiving a search request from the terminal device, a search unit for performing a search according to the search request received by the request receiving unit, and a search result obtained from the search unit A search result transmission unit that transmits to the terminal device, a keyword recording unit that records a keyword in the main storage unit based on a keyword assignment request received by the request reception unit from the terminal device, and a keyword in the search request data received by the request reception unit. If that contained the de includes a keyword search part which performs a search on the keyword for the image data recorded in the auxiliary storage unit.
Also, for example, the second CPU receives the search request transmission unit that transmits the search request to the recording device, the search result reception unit that receives the search result image and the search result data from the recording device, and the search result reception unit. A search result display unit that displays a search result image on a screen, a playback image display unit that continuously displays image data input from a recording device, a screen operation detection unit that detects and obtains operation contents by a user, and a keyword assignment request A keyword assignment request transmitter for transmitting to the recording device is provided.

さらに、本発明の類似画像検索システムの検索要求は、類似画像検索要求と登場イベント検索要求である。   Furthermore, the search request of the similar image search system of the present invention is a similar image search request and an appearance event search request.

以下、本発明に係る一実施形態を、図1〜図7および図8A〜図8Hを用いて説明する。なお、各図の説明において、共通な機能を有する構成要素には同一の参照番号を付し、できるだけ説明の重複を避けるため、説明を省略するようにした。   Hereinafter, an embodiment according to the present invention will be described with reference to FIGS. 1 to 7 and FIGS. 8A to 8H. In the description of each figure, the same reference numerals are assigned to components having a common function, and the description is omitted to avoid duplication as much as possible.

まず、図1〜図4を用いて、本発明の一実施形態に係る類似画像検索システムの構成について説明する。図1は、本発明の類似画像検索システムの一実施例のシステム構成図である。また図2は、撮像装置のハードウェア構成図である。また図3は、録画装置のハードウェア構成図である。また図4は、端末装置のハードウェア構成図である。   First, the configuration of a similar image search system according to an embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a system configuration diagram of an embodiment of a similar image search system of the present invention. FIG. 2 is a hardware configuration diagram of the imaging apparatus. FIG. 3 is a hardware configuration diagram of the recording apparatus. FIG. 4 is a hardware configuration diagram of the terminal device.

類似画像検索システムは、図1に示すように、ネットワーク200に、撮像装置201、録画装置102、端末装置103が接続され、互いに通信可能な状態で構成される。
ネットワーク200は、データ通信を行う専用ネットワークやイントラネット、インターネット、無線LAN(Local Area Network)等の各装置を相互に接続して通信を行う通信手段である。
撮像装置201は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)素子等で撮像した画像にデジタル変換処理を施し、変換処理された画像データを、ネットワーク200を介して録画装置へ送信するネットワークカメラや監視カメラ等の装置である。
録画装置102は、ネットワーク200を介して撮像装置201より入力された画像データをHDD等の記録媒体に記録するネットワークデジタルレコーダ等の装置である。また、本装置には、本発明の類似画像検索システムを含む人物検索機能を搭載している。
As shown in FIG. 1, the similar image search system is configured such that an imaging apparatus 201, a recording apparatus 102, and a terminal apparatus 103 are connected to a network 200 and can communicate with each other.
The network 200 is a communication unit that performs communication by mutually connecting devices such as a dedicated network that performs data communication, an intranet, the Internet, and a wireless local area network (LAN).
The imaging device 201 performs digital conversion processing on an image captured by a CCD (Charge Coupled Device), a CMOS (Complementary Metal Oxide Semiconductor) element, or the like, and transmits the converted image data to the recording device via the network 200. Devices such as network cameras and surveillance cameras.
The recording device 102 is a device such as a network digital recorder that records image data input from the imaging device 201 via the network 200 on a recording medium such as an HDD. Further, this apparatus is equipped with a person search function including the similar image search system of the present invention.

録画装置102は、機能構成として、画像送受信部210、画像記録部211、再生制御部212、人物領域検出部213、人物特徴量抽出部214、人物特徴量記録部215、属性情報記録部216、要求受信部217、検索部、検索結果送信部220、キーワード記録部110、キーワード検索部111の各処理部よりなる。検索部は、類似人物検索部218および登場イベント検索部219で構成される。   The recording apparatus 102 has an image transmission / reception unit 210, an image recording unit 211, a reproduction control unit 212, a person area detection unit 213, a person feature amount extraction unit 214, a person feature amount recording unit 215, an attribute information recording unit 216, as a functional configuration. The processing unit includes a request receiving unit 217, a search unit, a search result transmission unit 220, a keyword recording unit 110, and a keyword search unit 111. The search unit includes a similar person search unit 218 and an appearance event search unit 219.

図1の録画装置102において、画像送受信部210は、装置外部からの画像の入出力を行う処理部であり、撮像装置201からの入力画像データの受信、端末装置103への出力画像データの送信を行う。
画像記録部211は、入力画像データの記録媒体への書込みや出力画像データの記録媒体からの読出しを行う。書込みの際には、画像データに加え、画像データを読出す際の情報となる画像ID(後述)も併せて記録する。
再生制御部212は、端末装置103への映像再生を制御する。
In the recording device 102 of FIG. 1, the image transmission / reception unit 210 is a processing unit that inputs and outputs images from the outside of the device, receives input image data from the imaging device 201, and transmits output image data to the terminal device 103. I do.
The image recording unit 211 writes input image data to a recording medium and reads output image data from the recording medium. At the time of writing, in addition to the image data, an image ID (described later) serving as information for reading the image data is also recorded.
The playback control unit 212 controls video playback on the terminal device 103.

人物領域検出部213は、入力画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う。
人物特徴量抽出部214は、人物領域検出部212で検出した領域に対して画像認識技術を用いて特徴量算出を行う。ここで算出する人物特徴量とは、例えば、人物の輪郭の形状や方向、皮膚の色、歩容(どの脚をどのようにどんなタイミングで動かすかといった脚の捌き方)、あるいは、人物を特定する代表的な部位である顔の輪郭の形状や方向、目や鼻、口といった主要構成要素の大きさ、形状、配置関係等が挙げられるが、本実施形態においては、使用する特徴量の種類や数はいずれであってもよい。
人物特徴量記録部215は、人物特徴量抽出部で算出した特徴量の記録媒体への書込みと読出しを行う。画像記録部における画像データの記録媒体と本処理部における人物特徴量の記録媒体とは同一であっても別個であってもよい。
属性情報記録部216は、画像データに関連する属性情報の記録媒体への書込みと読出しを行う。属性情報とは、例えば、画像の撮影時刻や撮像装置番号等である。
The person area detection unit 213 performs person detection using image recognition technology on the input image data, determines the presence of a person in the image, and, if a person exists, calculates the coordinates of that area.
The person feature amount extraction unit 214 performs feature amount calculation on the region detected by the person region detection unit 212 using an image recognition technique. The human feature value calculated here is, for example, the shape and direction of the person's outline, the skin color, the gait (how to roll the legs such as which leg is moved at what timing), or the person is specified The shape and direction of the contour of the face, which is a representative part, and the size, shape, arrangement relationship, etc. of main components such as eyes, nose, and mouth, etc., but in this embodiment, the type of feature amount to be used Any number can be used.
The person feature amount recording unit 215 writes and reads the feature amount calculated by the person feature amount extraction unit to and from the recording medium. The image data recording medium in the image recording unit and the human feature amount recording medium in the processing unit may be the same or different.
The attribute information recording unit 216 writes and reads attribute information related to image data to and from a recording medium. The attribute information is, for example, an image shooting time, an imaging device number, or the like.

要求受信部217は、端末装置からの検索要求やキーワード付与要求の受信を行う。検索要求には、類似画像検索要求と、登場イベント検索要求がある。
類似人物検索部218は、要求受信部にて受信した要求が類似人物検索要求であった場合に、類似画像の検索を行う。
登場イベント検索部219は、要求受信部にて受信した要求が登場イベント検索要求であった場合に、登場イベントの検索を行う。
検索結果送信部220は、類似人物検索部218や登場イベント検索部219から得た類似人物検索結果や登場イベント検索結果の端末装置への送信を行う。
キーワード記録部110は、要求受信部にて受信したキーワード付与要求に基づくキーワードの記録媒体への書込みと読出しを行う。
キーワード検索部111は、要求受信部にて受信した検索要求データ中にキーワードが含まれていた場合に、キーワード検索を行う。
The request receiving unit 217 receives a search request and a keyword assignment request from the terminal device. The search request includes a similar image search request and an appearance event search request.
The similar person search unit 218 searches for a similar image when the request received by the request reception unit is a similar person search request.
The appearance event search unit 219 searches for an appearance event when the request received by the request reception unit is an appearance event search request.
The search result transmission unit 220 transmits the similar person search result and the appearance event search result obtained from the similar person search unit 218 and the appearance event search unit 219 to the terminal device.
The keyword recording unit 110 writes and reads keywords to the recording medium based on the keyword assignment request received by the request receiving unit.
The keyword search unit 111 performs a keyword search when the keyword is included in the search request data received by the request receiving unit.

端末装置103は、ネットワーク機能を有する一般のPC(パーソナルコンピュータ)で実現してもよいし、専用の検索端末でもよい。
端末装置103は、機能構成として、検索要求送信部221、検索結果受信部222、検索結果表示部223、再生画像表示部224、画面操作検知部225、キーワード付与要求送信部112の各処理部にて構成される。また、端末装置103には、本発明を実現するための人物検索機能も搭載している。
The terminal device 103 may be realized by a general PC (personal computer) having a network function, or may be a dedicated search terminal.
The terminal device 103 includes, as functional configurations, processing units such as a search request transmission unit 221, a search result reception unit 222, a search result display unit 223, a reproduction image display unit 224, a screen operation detection unit 225, and a keyword assignment request transmission unit 112. Configured. The terminal device 103 is also equipped with a person search function for realizing the present invention.

検索要求送信部221は、検索要求の録画装置への送信を行う。類似人物検索の場合、検索要求データには、検索キー画像が含まれる。また、検索要求データには、絞込みパラメータを含めることも可能である。
検索結果受信部222は、検索結果の録画装置からの受信を行う。検索結果として受信するデータには、録画装置において、類似人物検索、あるいは、登場イベント検索を実施して得られた画像の集合が含まれる。集合を構成する個々の画像は、録画装置に記録された映像から画像サイズ縮小処理等を施して生成される。以下、この個々の画像を「検索結果画像」、検索結果として送受信するデータを「検索結果データ」と称する。
検索結果表示部223は、検索結果受信部にて受信した検索結果の画面表示を行う。表示される画面例については後述する。
再生画像表示部224は、録画装置から入力された画像データの画面への連続動画表示を行う。
画面操作検知部225は、ユーザによる操作内容の検知および取得を行う。
キーワード付与要求送信部112は、キーワード付与要求の録画装置への送信を行う。
The search request transmission unit 221 transmits a search request to the recording device. In the case of the similar person search, the search request data includes a search key image. The search request data can also include a refinement parameter.
The search result receiving unit 222 receives the search result from the recording device. The data received as a search result includes a set of images obtained by performing similar person search or appearance event search in the recording apparatus. The individual images constituting the set are generated by performing image size reduction processing or the like from the video recorded in the recording device. Hereinafter, each individual image is referred to as a “search result image”, and data transmitted and received as a search result is referred to as “search result data”.
The search result display unit 223 displays a screen of the search result received by the search result receiving unit. An example of the displayed screen will be described later.
The reproduction image display unit 224 performs continuous moving image display on the screen of the image data input from the recording device.
The screen operation detection unit 225 detects and acquires the operation content by the user.
The keyword assignment request transmission unit 112 transmits a keyword assignment request to the recording device.

図2によって、本発明の類似画像検索システムに用いる撮像装置201のハードウェア構成の一実施例を説明する。図2は、本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。撮像装置201の構成は、撮像部241、主記憶部242、符号化部243、ネットワークインタフェース(I/F)244が、バス240で結合された形態である。   With reference to FIG. 2, an embodiment of the hardware configuration of the imaging apparatus 201 used in the similar image search system of the present invention will be described. FIG. 2 is a diagram illustrating an example of a hardware configuration of an imaging apparatus used in the similar image search system of the present invention. The configuration of the imaging apparatus 201 is a configuration in which an imaging unit 241, a main storage unit 242, an encoding unit 243, and a network interface (I / F) 244 are coupled by a bus 240.

図2において、撮像部241は、レンズで撮像した光信号をデジタルデータに変換する。符号化部243は、撮像部241が出力するデジタルデータを符号化して、JPEG(Joint Photographic Experts Group)などの画像データに変換する。主記憶部242は、撮像したデジタルデータ、符号化された画像データを記憶する。ネットワークI/F244は、ネットワーク200を介して、主記憶部242上の画像データを録画装置102に送信するためのインタフェースである。   In FIG. 2, the imaging unit 241 converts an optical signal captured by a lens into digital data. The encoding unit 243 encodes the digital data output from the imaging unit 241 and converts it into image data such as JPEG (Joint Photographic Experts Group). The main storage unit 242 stores captured digital data and encoded image data. The network I / F 244 is an interface for transmitting image data on the main storage unit 242 to the recording device 102 via the network 200.

図3によって、本発明の類似画像検索システムに用いる録画装置102のハードウェア構成の一実施例を説明する。図3は、本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。録画装置102のハードウェア構成としては、図3に示すように、CPU(Central Processing Unit)251、主記憶部252、補助記憶部253、ネットワークI/F254が、バス250で結合された形態である。   With reference to FIG. 3, an embodiment of the hardware configuration of the recording apparatus 102 used in the similar image search system of the present invention will be described. FIG. 3 is a diagram showing an embodiment of a hardware configuration of a recording apparatus used in the similar image search system of the present invention. As a hardware configuration of the recording apparatus 102, as shown in FIG. 3, a CPU (Central Processing Unit) 251, a main storage unit 252, an auxiliary storage unit 253, and a network I / F 254 are coupled via a bus 250. .

CPU251は、録画装置102の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部252は、DRAMなどの半導体装置で実現され、検索のための画像データやCPU251で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部253は、HDDやフラッシュメモリなどで実現され、主記憶部252より大容量のメモリであり、画像データやプログラムを格納する。ネットワークI/F254は、ネットワーク200を介して、撮像装置201からの画像データを受信したり、端末装置103から検索キーワードを受信したり、端末装置103に画像データを送信するためのインタフェースである。   The CPU 251 performs control of each unit of the recording device 102 and execution of a program for realizing the function. The main storage unit 252 is realized by a semiconductor device such as a DRAM, and is an intermediate memory for loading and storing image data for search and a program executed by the CPU 251. The auxiliary storage unit 253 is realized by an HDD, a flash memory, or the like, and has a larger capacity than the main storage unit 252 and stores image data and programs. The network I / F 254 is an interface for receiving image data from the imaging apparatus 201, receiving a search keyword from the terminal apparatus 103, and transmitting image data to the terminal apparatus 103 via the network 200.

図4によって、本発明の類似画像検索システムに用いる端末装置103のハードウェア構成の一実施例を説明する。図4は、本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。端末装置103のハードウェア構成としては、図4に示すように、CPU261、主記憶部262、補助記憶部263、表示I/F264、入出力I/F265、ネットワークI/F266が、バス260で結合された形態である。また、表示I/F264は、表示装置270と接続し、入出力I/F265は、キーボード280やマウス282などの入出力装置と接続する。   An example of the hardware configuration of the terminal device 103 used in the similar image search system of the present invention will be described with reference to FIG. FIG. 4 is a diagram showing an embodiment of a hardware configuration of a terminal device used in the similar image search system of the present invention. As shown in FIG. 4, the hardware configuration of the terminal device 103 includes a CPU 261, a main storage unit 262, an auxiliary storage unit 263, a display I / F 264, an input / output I / F 265, and a network I / F 266 coupled via a bus 260. It is a form made. The display I / F 264 is connected to the display device 270, and the input / output I / F 265 is connected to input / output devices such as a keyboard 280 and a mouse 282.

図4において、CPU261は、端末装置103の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部262は、DRAM(Dynamic Random Access Memory)などの半導体装置で実現され、表示のための画像データやCPU261で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部263は、HDDやフラッシュメモリなどで実現され、主記憶部262より大容量のメモリであり、検索キーワード、画像データやプログラムを格納する。表示I/F264は、表示装置270と接続するためのインタフェースである。入出力I/F265は、キーボード280やマウス282などの入出力装置と接続するためのインタフェースである。ネットワークI/F266は、ネットワーク200を介して、録画装置102からの画像データを受信したり、録画装置102に検索キーワードを送信したり、録画装置102から画像データを受信するためのインタフェースである。表示装置270は、例えば、LCD(Liquid Crystal Display)などの装置であり、画像や動画をその表示部に表示する装置である。ユーザは、表示装置270の表示部に表示された画像を、キーボード280やマウス282などの入出力装置を操作して、例えばGUI(Graphical User Interface)操作することによって、端末装置103、および、類似画像検索システムを操作する。   In FIG. 4, the CPU 261 performs control of each unit of the terminal device 103 and execution of a program for realizing the function. The main storage unit 262 is realized by a semiconductor device such as a DRAM (Dynamic Random Access Memory), and is an intermediate memory for loading and storing image data for display and a program executed by the CPU 261. The auxiliary storage unit 263 is realized by an HDD, a flash memory, or the like, and has a larger capacity than the main storage unit 262, and stores search keywords, image data, and programs. The display I / F 264 is an interface for connecting to the display device 270. The input / output I / F 265 is an interface for connecting to input / output devices such as a keyboard 280 and a mouse 282. The network I / F 266 is an interface for receiving image data from the recording apparatus 102, transmitting a search keyword to the recording apparatus 102, and receiving image data from the recording apparatus 102 via the network 200. The display device 270 is a device such as an LCD (Liquid Crystal Display), for example, and is a device that displays an image or a moving image on its display unit. The user operates the input / output device such as the keyboard 280 and the mouse 282 on the image displayed on the display unit of the display device 270, for example, the GUI (Graphical User Interface), thereby performing the terminal device 103 and the like. Operate the image search system.

次に、図5Aと図5Bを用いて本発明の一実施形態に係る類似画像検索システムに用いられるデータ構造について説明する。図5Aと図5Bは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
本発明の類似画像検索システムに用いられるデータ構造の一実施例には、図5Aに示すようなフレームテーブル300と、図5Bに示すような属性情報データテーブル310がある。
Next, a data structure used in the similar image search system according to the embodiment of the present invention will be described with reference to FIGS. 5A and 5B. 5A and 5B are diagrams showing an embodiment of a data structure used in the similar image search system of the present invention.
An example of the data structure used in the similar image search system of the present invention includes a frame table 300 as shown in FIG. 5A and an attribute information data table 310 as shown in FIG. 5B.

フレームテーブル300は、映像データを格納するためのテーブルである。フレームテーブル300には、画像ID301が付され、付された画像IDと関連付けられたフレームデータ302が記録される。フレームデータ302は、例えば、JPEG形式のデータなどで記録される。   The frame table 300 is a table for storing video data. An image ID 301 is assigned to the frame table 300, and frame data 302 associated with the assigned image ID is recorded. The frame data 302 is recorded, for example, as JPEG format data.

属性情報データテーブル310は、画像データを解析した結果の画像についての属性情報データを格納するためのテーブルである。属性情報データテーブル310には、登録ID311が識別のために付与され、付与された登録ID311と関連付けられて、画像ID312、特徴量313、カメラID314、時刻情報315、およびキーワード316が記録される。
例えば、付与された登録ID311と関連付けられて、フレームテーブル300に格納されたフレームの一部が、画像ID312により指定される。また、その画像の特徴量は、特徴量313に、撮像した撮像装置201のIDは、カメラID314に、フレームの撮像時刻に関する情報は、時刻情報315に、フレームに付与されたキーワードは、キーワード316にと、各々のフィールドに格納される。
The attribute information data table 310 is a table for storing attribute information data for an image obtained as a result of analyzing image data. In the attribute information data table 310, a registration ID 311 is assigned for identification, and an image ID 312, a feature amount 313, a camera ID 314, time information 315, and a keyword 316 are recorded in association with the assigned registration ID 311.
For example, a part of the frame stored in the frame table 300 in association with the given registration ID 311 is designated by the image ID 312. In addition, the feature amount of the image is the feature amount 313, the ID of the imaging device 201 that has captured the image is the camera ID 314, the information related to the imaging time of the frame is the time information 315, and the keyword assigned to the frame is the keyword 316 And stored in each field.

なお、例えば、録画のフレームレートが、30fps(Frames Per Second)のときに、画像の解析を行うのは、その内で、人がいると認識した部分あり、最大3fps程度のフレームレートで画像を捉えて解析を行うのが一般的である。   For example, when the recording frame rate is 30 fps (Frames Per Second), the image is analyzed because there is a part recognized as having a person, and the image is recorded at a maximum frame rate of about 3 fps. It is common to capture and analyze.

次に図6、図8A、図8B、図8C、および図8Dを用いて、本発明の類似画像検索における類似度が高い検索結果画像を自動的に選択状態にして提示する選択方式について説明する。図6は、本発明の類似画像検索システムの一実施例の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。また、図8A〜図8Dは、本発明の類似画像検索において、端末装置103の表示装置270に表示される類似画像検索を行っているときの各フェーズの画面を示す図である。   Next, with reference to FIG. 6, FIG. 8A, FIG. 8B, FIG. 8C, and FIG. 8D, a selection method for automatically displaying a search result image having a high similarity in the similar image search of the present invention in a selected state will be described. . FIG. 6 is a processing sequence diagram between the recording device 102 and the terminal device 103 in assigning keywords from the similar image search result of one embodiment of the similar image search system of the present invention. 8A to 8D are diagrams showing screens of respective phases when a similar image search displayed on the display device 270 of the terminal device 103 is performed in the similar image search of the present invention.

図6において、軸501は、録画装置102の上部から下部へ進む時系列を表し、軸502は、端末装置103の上部から下部へ進む時系列を表している。また、タイミング503〜506は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103上に表示される画面の一実施例や、ユーザ操作内容の一例については後述する。   In FIG. 6, an axis 501 represents a time series that proceeds from the top to the bottom of the recording apparatus 102, and an axis 502 represents a time series that proceeds from the top to the bottom of the terminal apparatus 103. Timings 503 to 506 represent timings on the time series, respectively. An example of a screen displayed on the terminal device 103 at each timing and an example of user operation contents will be described later.

図6において、通信510〜512は、録画装置102と端末装置103間の主な通信を示している。
通信510と通信511は、リクエストとレスポンスの関係にあり、通信510は、類似人物検索要求を含み、通信511は、類似人物検索結果を含む。この2つの通信により、1回の類似人物検索が実行されることになる。
通信512は、画像に対するキーワード付与要求を含む。
ここで、通信511に含まれる類似人物検索結果には、画像ID301等の属性情報データテーブル310の静的な情報だけでなく、録画装置102における検索処理時に算出された検索キー画像に対する類似度を含むようにする。
本実施例では類似度は0〜100までの範囲の数値とし、100に近いほど検索キー画像に似た画像であることを表すものとする。
In FIG. 6, communications 510 to 512 indicate main communications between the recording device 102 and the terminal device 103.
Communication 510 and communication 511 are in a request-response relationship, communication 510 includes a similar person search request, and communication 511 includes a similar person search result. One similar person search is executed by these two communications.
Communication 512 includes a keyword assignment request for an image.
Here, the similar person search result included in the communication 511 includes not only the static information of the attribute information data table 310 such as the image ID 301 but also the similarity to the search key image calculated during the search process in the recording device 102. To include.
In this embodiment, the similarity is a numerical value in the range of 0 to 100, and the closer to 100, the more similar to the search key image.

次に、図8A〜図8Dを用いて、本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。   Next, a user operation image in the terminal device 103 of the similar image search system of the present invention will be described with reference to FIGS. 8A to 8D.

図8Aは、検索実行前の初期状態、すなわち、図6のタイミング503における端末装置103の表示部に表示される検索画面801の一実施例である。ユーザは、この検索画面801から検索を開始する。
図8Aの検索画面801は、再生画像表示領域3001、画像再生操作領域3003、検索キー画像指定領域3004、検索絞込パラメータ指定領域3008、検索実行領域4017、および、検索結果表示領域4020よりなる。
FIG. 8A shows an example of a search screen 801 displayed on the display unit of the terminal device 103 at the initial state before execution of the search, that is, at the timing 503 in FIG. The user starts a search from this search screen 801.
8A includes a reproduction image display area 3001, an image reproduction operation area 3003, a search key image designation area 3004, a search refinement parameter designation area 3008, a search execution area 4017, and a search result display area 4020.

図8Aの検索画面801において、再生画像表示領域3001は、録画装置102に記録された画像を動画像として表示する領域である。また再生画像表示領域3001の動画3002は、録画装置に記録された画像を動画像として表示するものである。
画像再生操作領域3003は、録画装置に記録された画像を再生操作する領域である。
本領域3003を構成する各ボタンには、それぞれ固有の再生種類が割当てられている。図8Aにおける各ボタンには、例えば左から、巻戻し、逆再生、再生停止、順再生、早送りの再生種類が割当てられている。ユーザが各ボタンをマウス282で適宜押下することにより、動画3002がボタンに割当てられた再生種類に切り替る。
In the search screen 801 of FIG. 8A, a playback image display area 3001 is an area for displaying an image recorded in the recording apparatus 102 as a moving image. A moving image 3002 in the reproduction image display area 3001 displays an image recorded in the recording device as a moving image.
An image reproduction operation area 3003 is an area for performing an operation for reproducing an image recorded in the recording apparatus.
Each button constituting this area 3003 is assigned a unique reproduction type. Each button in FIG. 8A is assigned, for example, from the left, playback types of rewind, reverse playback, playback stop, forward playback, and fast forward. When the user appropriately presses each button with the mouse 282, the moving image 3002 is switched to the reproduction type assigned to the button.

検索キー画像指定領域3004は、検索キー画像の指定と表示を行う領域である。本領域は、検索キー画像3005と、映像指定ボタン3006、ファイル指定ボタン3007よりなる。
検索キー画像3005は、類似検索のためのキーとする画像である。初期状態においては、検索キー画像は、未指定であるので、画像表示はされていない状態となる。なお、未指定の場合に、別途用意した未指定状態を示す画像を表示する等、未指定である旨の表記をするようにしてもよい。
A search key image designation area 3004 is an area for designating and displaying a search key image. This area includes a search key image 3005, a video designation button 3006, and a file designation button 3007.
A search key image 3005 is an image used as a key for similarity search. In the initial state, the search key image is not specified, so that no image is displayed. In the case of non-designation, an indication of non-designation may be provided, such as displaying an image indicating a non-designated state prepared separately.

映像指定ボタン3006は、押下時に再生画像表示領域3001に表示されている画像を、検索キー画像3005として指定するボタンである。
ファイル指定ボタン3007は、録画装置102に記録されている画像以外の画像、例えば、デジタルスチルカメラで撮影した画像やスキャナで取込んだ画像等を、検索キー画像3005として指定するボタンである。このボタン3007を押下すると、それらの画像をファイル指定するダイアログボックスが表示され、ユーザはそこで所望の画像を指定することができる。
A video designation button 3006 is a button for designating an image displayed in the reproduction image display area 3001 as a search key image 3005 when pressed.
The file designation button 3007 is a button for designating an image other than the image recorded in the recording apparatus 102, for example, an image taken with a digital still camera or an image taken with a scanner as the search key image 3005. When this button 3007 is pressed, a dialog box for designating those images is displayed, and the user can designate a desired image there.

検索絞込パラメータ指定領域3008は、検索の際の絞込パラメータの種類とその値(範囲)を指定する領域である。この領域3008は、撮像装置(カメラ)指定チェックボックス3009、3010、3011、3012と、時刻指定チェックボックス3013、3014、時刻指定欄3015、3016から構成される。   The search refinement parameter designation area 3008 is an area for designating the type and value (range) of the refinement parameter at the time of search. This area 3008 includes imaging device (camera) designation check boxes 3009, 3010, 3011, and 3012, time designation check boxes 3013 and 3014, and time designation columns 3015 and 3016.

撮像装置指定チェックボックス3009、3010、3011、3012は、検索の際に検索対象とする撮像装置(カメラ1〜4)を指定するボタンである。本ボタンは、押下すると選ばれたことを示すチェックマークがそれぞれ表示される。このマークは再押下すると非表示となり、押下で表示と非表示を繰り返す。
初期状態においては、全撮像装置を検索対象とするため、撮像装置指定チェックボックスは全て選択状態となる。
Imaging device designation check boxes 3009, 3010, 3011, and 3012 are buttons for designating imaging devices (cameras 1 to 4) to be searched at the time of searching. When this button is pressed, a check mark indicating that it has been selected is displayed. This mark disappears when pressed again, and is repeatedly displayed and hidden when pressed.
In the initial state, all imaging devices are targeted for search, and all imaging device designation check boxes are selected.

時刻指定チェックボックス3013、3014は、検索の際に検索対象とする時刻範囲を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。時刻指定チェックボックス3013を選択状態にした場合には時刻範囲に先頭時刻を与える。非選択状態にした場合には、時刻範囲に先頭時刻を与えない、即ち、録画装置に記録された最も古い時刻の画像までを検索対象範囲とすることを意味する。
同様に時刻指定チェックボックス3014を選択状態にした場合には時刻範囲に末尾時刻を与える。非選択状態にした場合には、時刻範囲に末尾時刻を与えない、すなわち、録画装置に記録された最も新しい時刻の画像までを検索対象範囲とすることを意味する。
時刻指定欄3015、3016は、上述の先頭時刻と末尾時刻の値を指定する入力欄である。
初期状態においては、全時間帯を検索対象とするため、時刻指定チェックボックスは全て非選択状態、時刻指定欄は空欄とする。
The time designation check boxes 3013 and 3014 are buttons for designating a time range to be searched in the search. As for the display mode, this button is the same as other check boxes. When the time designation check box 3013 is selected, the start time is given to the time range. In the non-selected state, it means that the start time is not given to the time range, that is, the search target range is up to the image of the oldest time recorded in the recording device.
Similarly, when the time designation check box 3014 is selected, the end time is given to the time range. In the non-selected state, it means that the end time is not given to the time range, that is, the image up to the latest time recorded in the recording device is set as the search target range.
The time designation fields 3015 and 3016 are input fields for designating the above-mentioned start time and end time values.
In the initial state, since all time zones are to be searched, all the time specification check boxes are not selected and the time specification column is blank.

検索実行領域4017は、検索実行を指示する領域である。本領域は、類似人物検索ボタン3018と登場イベント検索ボタン3019に加え、キーワード指定チェックボックス4021とキーワード指定欄4022、キーワード付与ボタン4023よりなる。
類似人物検索ボタン3018は、検索キー画像3005による類似人物検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
登場イベント検索ボタン3019は、登場イベント検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
キーワード指定チェックボックス4021は、キーワード指定欄4022の有効または無効を指定するボタンである。表示の態様については本ボタンも撮像装置指定チェックボックスと同様である。
キーワード指定欄4022は、キーワードの値を指定する入力欄である。
キーワード付与ボタン4023は、キーワード指定欄4022に入力されたキーワードの付与実行を指示するボタンである。
初期状態においては、キーワード指定チェックボックス4021は、非選択状態、キーワード指定欄4022は、空欄とする。
キーワードの働きや、類似人物検索ボタン3018や登場イベント検索ボタン3019とキーワードとの関係については、後述する。
The search execution area 4017 is an area for instructing search execution. This area includes a keyword specification check box 4021, a keyword specification field 4022, and a keyword assignment button 4023 in addition to a similar person search button 3018 and an appearance event search button 3019.
The similar person search button 3018 is a button for instructing execution of a similar person search by the search key image 3005. When a parameter is specified in the search refinement parameter specification area 3008, an instruction is given to execute the search according to the specified parameter.
The appearance event search button 3019 is a button for instructing execution event search execution. When a parameter is specified in the search refinement parameter specification area 3008, an instruction is given to execute the search according to the specified parameter.
The keyword designation check box 4021 is a button for designating whether the keyword designation field 4022 is valid or invalid. Regarding the display mode, this button is the same as the imaging device designation check box.
The keyword specification field 4022 is an input field for specifying a keyword value.
The keyword assignment button 4023 is a button for instructing execution of the keyword input in the keyword designation field 4022.
In the initial state, the keyword designation check box 4021 is not selected, and the keyword designation column 4022 is blank.
The function of the keyword and the relationship between the similar person search button 3018 and the appearance event search button 3019 and the keyword will be described later.

検索結果表示領域4020は、検索結果を表示する領域である。検索結果の表示は、検索結果画像を一覧表示することにより実施する。初期状態においては、検索結果表示領域4020には何も表示されない。
ここで、ユーザは、映像指定ボタン3006を押下し、また、撮像装置指定チェックボックス3009、3010、3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
この操作により、検索画面は、類似人物検索実行直前状態、すなわち、図6のタイミング504の端末装置103の状態に遷移する。図8Bは、この状態における検索画面802の一実施例を示したものである。
The search result display area 4020 is an area for displaying search results. Search results are displayed by displaying a list of search result images. In the initial state, nothing is displayed in the search result display area 4020.
Here, the user depresses the video designation button 3006, depresses the imaging apparatus designation check boxes 3009, 3010, and 3012, depresses the time designation check boxes 3013 and 3014, and enters the time designation columns 3015 and 3016. Enter "2009/6/26 15:30:20" and "2009/7/13 12:30:20" respectively.
By this operation, the search screen transits to the state immediately before the similar person search execution, that is, the state of the terminal device 103 at the timing 504 in FIG. FIG. 8B shows an example of the search screen 802 in this state.

図8Bの検索画面802において、検索キー画像3005には、動画3002に表示された人物「Aさん」が検索キー画像として表示され、また、検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つの撮像装置が指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
ここで、ユーザが、類似人物検索ボタン3018を押下する。この押下によって、タイミング504から、検索画面は、類似人物検索実行直後状態、即ち、図6のタイミング505の端末装置103の状態に遷移する。図8Cは、この状態における検索画面803の一実施例を示したものである。
In the search screen 802 of FIG. 8B, the search key image 3005 displays the person “Mr. A” displayed in the video 3002 as a search key image, and “camera 1, camera 2, The state that 3 imaging devices of “Camera 4” are specified and “From 6/26/15 15:30:20 to 2009/7/13 12:30:20” is specified as the time range to be searched. Show.
Here, the user presses the similar person search button 3018. By this pressing, the search screen transitions from the timing 504 to the state immediately after the similar person search execution, that is, the state of the terminal device 103 at the timing 505 in FIG. FIG. 8C shows an example of the search screen 803 in this state.

図8Cの検索画面803において、検索結果表示領域4020には、検索キー画像3005をキーとして類似人物検索を実行し得られた検索結果を表示している。検索結果の表示は、検索結果画像3031〜3141を検索結果表示領域4020に一覧表示することにより実施する。
検索結果画像3031〜3141は、例えば、最上段左から右へ、次に2段目左から右へと検索キー画像に対する類似度順に表示する。この表示例においては、検索結果画像3031が検索キー画像3005に対し最も類似度が高く、検索結果画像3141が最も類似度が低いということを示している。
ここで検索結果表示領域4020に表示されているのは、「カメラ1、カメラ2、カメラ4の2009/6/26 15:30:20から2009/7/13 12:30:20までの画像で、Aさんと類似した画像」を検索要求した検索結果である。
In the search screen 803 of FIG. 8C, the search result display area 4020 displays search results obtained by executing similar person search using the search key image 3005 as a key. Search results are displayed by displaying search result images 3031 to 3141 in a search result display area 4020 as a list.
The search result images 3031 to 3141 are displayed in order of similarity to the search key image, for example, from the top left to the right and then from the second left to the right. In this display example, the search result image 3031 has the highest similarity to the search key image 3005, and the search result image 3141 has the lowest similarity.
Here, what is displayed in the search result display area 4020 is “Images of Camera 1, Camera 2, and Camera 4 from 2009/6/26 15:30:20 to 2009/7/13 12:30:20. , “A similar image to Mr. A”.

図8Cに示された表記において、検索結果表示領域4020内の検索結果画像上に図示した円とアルファベットは、人物の顔と人物名称を簡略表示したものである。
例えば、検索結果画像3031には、人物「Aさん」が登場することを示している。この簡略表示している部分には、もちろん、実際のシステムでの表示では実画像が表示される。
検索結果画像3031の周辺には、頭出し再生ボタン3032と検索キー画像指定ボタン3033、キーワード対象チェックボックス4034を備える。他の検索結果画像でも同様である。
頭出し再生ボタン3032は、検索結果画像を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン3032を押下すると動画3002が検索結果画像3031に切り替り、その検索結果画像を先頭として始まる動画をユーザは、視聴することができる。
In the notation shown in FIG. 8C, the circles and alphabets shown on the search result image in the search result display area 4020 are simplified representations of the person's face and person name.
For example, the search result image 3031 indicates that a person “Mr. A” appears. Of course, an actual image is displayed in this simplified display portion in the actual system display.
In the vicinity of the search result image 3031, a cue playback button 3032, a search key image designation button 3033, and a keyword target check box 4034 are provided. The same applies to other search result images.
The cue playback button 3032 is a button for instructing the start of continuous video playback starting from the search result image. For example, when the cue / play button 3032 is pressed, the moving image 3002 is switched to the search result image 3031 and the user can view the moving image starting from the search result image.

検索キー画像指定ボタン3033は、検索結果画像3031を検索キー画像3005として指定するボタンである。例えば、検索キー画像指定ボタン3033を押下すると、検索結果画像3031が、検索キー画像3005に表示される。これにより、指定された検索結果画像3005を使って、画像の再検索を実施することができる。
類似度表示欄8035は、検索キー画像に対する類似度を表示する領域である。検索結果画像3031の類似度表示欄8035には、例えば、90という値が表示されており、他の検索結果の類似度表示欄にもそれぞれ数値が表示されている。
キーワード付与チェックボックス4034は、キーワード付与の対象となる検索結果画像を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。例えば、ユーザが、キーワード付与チェックボックス4034を押下すると、チェックマークが表示され、検索結果画像3031が、キーワード付与対象となる。
The search key image designation button 3033 is a button for designating the search result image 3031 as the search key image 3005. For example, when a search key image designation button 3033 is pressed, a search result image 3031 is displayed on the search key image 3005. As a result, the search can be performed again using the designated search result image 3005.
The similarity display column 8035 is an area for displaying the similarity to the search key image. For example, a value of 90 is displayed in the similarity display column 8035 of the search result image 3031, and a numerical value is also displayed in each of the similarity display columns of other search results.
The keyword assignment check box 4034 is a button for designating a search result image as a keyword assignment target. As for the display mode, this button is the same as other check boxes. For example, when the user presses the keyword assignment check box 4034, a check mark is displayed, and the search result image 3031 becomes a keyword assignment target.

この図8Cに示された実施例は、「Aさん」を目的に類似人物検索を実行した際の検索結果である。したがって、検索結果画像3031、3041、3051、3061、3081、3091、3121、3141が正解で、検索結果画像3071、3101、3111、3131が不正解であるということを示している。
ここで、類似度表示欄8035の数値が一定以上、図8Cにおいては75以上の検索結果画像3031、3041、3051、3061、3071、3081、3091のキーワード付与チェックボックスが既選択状態になっている。
The example shown in FIG. 8C is a search result when a similar person search is performed for the purpose of “Mr. A”. Therefore, the search result images 3031, 3041, 3051, 3061, 3081, 3091, 3121, 3141 are correct, and the search result images 3071, 3101, 3111, 3131 are incorrect.
Here, the keyword assignment check boxes of the search result images 3031, 3041, 3051, 3061, 3071, 3081, and 3091 in the similarity display column 8035 are a predetermined value or more in FIG. 8C. .

類似人物検索実行直後(タイミング505)の状態において、キーワード対象チェックボックス4034を、本発明のように類似度によって選択状態か否かを切り替える処理を設けることによって、全て非選択状態にする方法や全て選択状態にする従来の方法と比較し、少ない選択操作数で正解画像を選択できる。
例えば、正解である検索結果画像3031、3041、3051、3061、3081、3091、3121、3141を全て選択する場合、類似人物検索実行直後状態に全て非選択状態にする方法では、8回の選択操作が必要であり、類似人物検索実行直後状態に全て選択状態にする方法では4回の選択を外す操作が必要である。一方、本発明の方法では1回の選択を外す操作と2回の選択する操作の計3回の操作で良い。
Immediately after the similar person search is executed (timing 505), the keyword target check box 4034 can be set to a non-selected state or all by providing a process for switching whether or not the keyword target check box 4034 is selected depending on the similarity. The correct image can be selected with a smaller number of selection operations compared to the conventional method of selecting.
For example, when all the search result images 3031, 3041, 3051, 3061, 3081, 3091, 3121, and 3141 that are correct answers are selected, the selection operation is performed eight times in the method in which all are selected immediately after the similar person search is executed. In the method of making all the selected states immediately after executing the similar person search, an operation of removing the selection four times is necessary. On the other hand, in the method of the present invention, a total of three operations, that is, an operation of removing one selection and an operation of selecting two times are sufficient.

また、ユーザがキーワード指定チェックボックス4021を押下し、キーワード指定欄4022に「Aさん」と入力し、さらにキーワード付与ボタン4023を押下する。ユーザのこの操作によって、検索画面803は、キーワード付与実行直後のキーワード指定欄4022に「Aさん」入力状態となる。即ち、図6のタイミング506の端末状態103に遷移する。図8Dは、タイミング506における検索画面804の一例を示したものである。   Further, the user presses the keyword specification check box 4021, inputs “Mr. A” in the keyword specification field 4022, and further presses the keyword assignment button 4023. As a result of the user's operation, the search screen 803 enters the “Mr. A” input state in the keyword designation field 4022 immediately after execution of keyword assignment. That is, the terminal state 103 at the timing 506 in FIG. FIG. 8D shows an example of the search screen 804 at the timing 506.

次に図7、図8A、図8D、図8F、図8G、図8H、および図5Cを用いて、本発明の登場イベント検索における類似度を用いたキーワードの付与候補を提示する方式について説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。また図5Cは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図であり、類似画像検索の検索結果に含まれるデータ320を示すものである。   Next, with reference to FIGS. 7, 8A, 8D, 8F, 8G, 8H, and 5C, a method of presenting keyword assignment candidates using similarity in appearance event search according to the present invention will be described. . FIG. 7 shows an example of a processing sequence diagram between the recording device and the terminal device in assigning keywords from the appearance event search result in the similar image search system of the present invention. FIG. 5C is a diagram showing an example of a data structure used in the similar image search system of the present invention, and shows data 320 included in the search result of the similar image search.

図7を用いて、本発明の登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の登場イベント検索の処理シーケンスを説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。
ここで、図6と同様に、図7の軸501と軸502は、録画装置102、端末装置103の上部から下部へ進む時系列を表している。また、タイミング703〜707は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103の表示部上に表示される画面の一例や、ユーザ操作内容の一例については後述する。
The appearance event search processing sequence between the recording device 102 and the terminal device 103 in the keyword assignment from the appearance event search result of the present invention will be described with reference to FIG. FIG. 7 is a processing sequence diagram between the recording device 102 and the terminal device 103 in assigning keywords from the appearance event search result in the similar image search system of the present invention.
Here, as in FIG. 6, the axes 501 and 502 in FIG. 7 represent time series that proceed from the top to the bottom of the recording device 102 and the terminal device 103. Timings 703 to 707 represent timings on the time series, respectively. An example of a screen displayed on the display unit of the terminal device 103 at each timing and an example of user operation content will be described later.

図7において、通信711〜718は、録画装置102と端末装置103間の主な通信を示している。
通信711と通信712は、リクエストとレスポンスの関係にあり、通信711には登場イベント検索要求を、通信712には登場イベント検索結果を含み、この2つの通信により、1回の登場イベント検索要求が実行されることになる。さらに通信713は類似人物検索要求を、通信714は類似人物検索結果を含む。通信716、717についても同様である。通信715には、画像に対するキーワード付与要求を含む。通信718についても同様である。
In FIG. 7, communications 711 to 718 indicate main communications between the recording device 102 and the terminal device 103.
The communication 711 and the communication 712 have a request-response relationship. The communication 711 includes an appearance event search request, and the communication 712 includes an appearance event search result. Will be executed. Further, the communication 713 includes a similar person search request, and the communication 714 includes a similar person search result. The same applies to the communications 716 and 717. The communication 715 includes a keyword assignment request for the image. The same applies to the communication 718.

次に、図8E、図8D、図8F、図8G、および図8Hを用いて本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。
図8A、図8E、図8F、図8G、図8Hは、本発明の類似画像検索において、端末装置103の表示装置270に表示される登場イベント検索を行っているときの各フェーズの画面を示す図である。
Next, a user operation image in the terminal device 103 of the similar image search system of the present invention will be described with reference to FIGS. 8E, 8D, 8F, 8G, and 8H.
FIG. 8A, FIG. 8E, FIG. 8F, FIG. 8G, and FIG. 8H show screens for each phase when searching for appearance events displayed on the display device 270 of the terminal device 103 in the similar image search of the present invention. FIG.

図8Aは、前述したように、検索実行前の初期状態(検索画面801)である。ここでは、図7のタイミング703における端末装置103での検索画面の一実施例である。
ここで、ユーザは、撮像装置指定チェックボックス3009、3010、および3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
このユーザ操作により、検索画面は、登場イベント検索実行直前状態、即ち、図7のタイミング704の端末装置103の状態に遷移する。図8Eは、この状態における検索画面805の一実施例を示したものである。
FIG. 8A shows the initial state (search screen 801) before execution of search, as described above. This is an example of a search screen on the terminal device 103 at the timing 703 in FIG.
Here, the user depresses the imaging device designation check boxes 3009, 3010, and 3012, depresses the time designation check boxes 3013 and 3014, and displays “2009/6/26 15: Enter "30:20" and "2009/7/13 12:30:20".
By this user operation, the search screen transits to the state immediately before the appearance event search execution, that is, the state of the terminal device 103 at the timing 704 in FIG. FIG. 8E shows an example of the search screen 805 in this state.

検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つが指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
図8Bの検索画面802と比較すると、図8Eの検索画面805では、検索キー画像3005が指定されていない。
ここで、ユーザが、登場イベント検索ボタン3019を押下する。すると、検索画面805は、登場イベント検索実行直後状態、すなわち、図7のタイミング705の端末装置103の状態に遷移する。図8Fは、この状態における検索画面806の一例を示したものである。
Camera 1, Camera 2, Camera 4” is designated as the imaging device to be searched, and the time range to be searched is from “2009/6/26 15:30:20 to 2009/7/13 12:30 : Up to 20 ”is indicated.
Compared to the search screen 802 in FIG. 8B, the search key image 3005 is not specified in the search screen 805 in FIG. 8E.
Here, the user presses the appearance event search button 3019. Then, the search screen 805 transitions to the state immediately after the appearance event search is executed, that is, the state of the terminal device 103 at the timing 705 in FIG. FIG. 8F shows an example of the search screen 806 in this state.

ここで、図8F等における8036は、人物矩形表示であり、人物を矩形で囲ったものである。人物矩形表示8036の選択は、マウスでクリックするなどのユーザ操作によって可能である。選択状態の人物顔矩形表示8036を再度選択すると、非選択状態にできる。選択状態と非選択状態は矩形枠の太さを変えて提示する場合や、色を変えて提示する場合がある。
登場イベント検索では、検索結果画像3081のように1つの画像に2つ以上の選択すべき人物が現れる場合がある。このため、図8Cのキーワード対象チェックボックス4034ではなく、人物矩形表示8036のような選択可能な表示を設ける。
なお、他の項目に関しては図8Cと同じであるので説明を省略する。
Here, reference numeral 8036 in FIG. 8F or the like denotes a person rectangle display, which is a person surrounded by a rectangle. Selection of the person rectangular display 8036 can be performed by a user operation such as clicking with a mouse. When the selected human face rectangle display 8036 is selected again, it can be brought into a non-selected state. The selected state and the non-selected state may be presented by changing the thickness of the rectangular frame, or may be presented by changing the color.
In the appearance event search, there may be a case where two or more persons to be selected appear in one image like a search result image 3081. For this reason, a selectable display such as a person rectangle display 8036 is provided instead of the keyword target check box 4034 in FIG. 8C.
The other items are the same as in FIG.

ここで、ユーザが、検索結果画像のうちの1つである検索結果画像3031にキーワードを付与したいと考えていて、キーワードを与える操作を、過去にユーザあるいは他のユーザが行っている場合を想定する。
このとき、ユーザは、検索結果画像3031の人物矩形表示8036をマウスでクリックして選択操作を行う。その結果、検索画面は、人物選択済み状態、即ち、図7のタイミング706の端末装置103の状態に遷移する。
このとき、端末装置103内部ではAさんの人物画像をキー画像にして類似人物検索要求を行っている。
Here, it is assumed that the user wants to assign a keyword to the search result image 3031 which is one of the search result images, and the user or another user has previously performed an operation of giving the keyword. To do.
At this time, the user performs a selection operation by clicking the person rectangle display 8036 of the search result image 3031 with the mouse. As a result, the search screen transits to the person selected state, that is, the state of the terminal device 103 at the timing 706 in FIG.
At this time, inside the terminal device 103, the person image of Mr. A is used as a key image to make a similar person search request.

ここで、前術の実施例で、図8Aから図8B、および図8Bから図8Cに遷移したときと比較すると、検索キー画像3005は指定されておらず、検索結果表示領域4020も更新されず、バックグランドで類似人物検索要求処理が行われることに注意されたい。
本実施例では、類似人物検索結果に属性情報と検索キー画像に対する類似度が格納されている。即ち、ここではAさんに類似した画像のキーワードと類似度が取得できる。
図5(c)に示すデータ320は、類似画像検索の検索結果に含まれるデータであり、検索結果の返送データのうち本発明に必須の部分である。
類似画像検索の検索結果に含まれるデータ302は、ここでは、キーワード「Aさん」「Bさん」「Cさん」が付与されているものおよび空欄すなわちキーワード未付与のものが検索結果として返送されていることを表す。
Here, in the embodiment of the previous operation, the search key image 3005 is not specified and the search result display area 4020 is not updated as compared to when the transition is made from FIG. 8A to FIG. 8B and FIG. 8B to FIG. Note that similar person search request processing is performed in the background.
In this embodiment, the similarity information for the attribute information and the search key image is stored in the similar person search result. That is, the keyword and similarity of an image similar to Mr. A can be acquired here.
Data 320 shown in FIG. 5C is data included in the search result of the similar image search, and is an essential part of the present invention in the return data of the search result.
In the data 302 included in the search result of the similar image search, here, data to which the keywords “Mr. A”, “Mr. B”, and “Mr. C” are assigned and blanks, that is, those to which no keyword is assigned are returned as search results. Represents that

図7のタイミング706の端末装置103の状態では、図8Gの検索画面807が表示される。図8Gは、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示したものである。
ここで、人物矩形表示8036は、選択済み状態を表す太枠表示になっている。
また、キーワード指定欄4022がキーワード指定およびキーワード候補選択欄8100になっている。
キーワード指定およびキーワード候補選択欄8100は、キーワードを入力することが可能であり、候補表示されている中から選択することも可能である。
In the state of the terminal device 103 at the timing 706 in FIG. 7, the search screen 807 in FIG. 8G is displayed. FIG. 8G shows an example of a search screen after a person selection operation by the user after appearance event search.
Here, the person rectangle display 8036 is a thick frame display indicating the selected state.
A keyword designation field 4022 is a keyword designation and keyword candidate selection field 8100.
In the keyword designation and keyword candidate selection field 8100, a keyword can be input, and can be selected from candidates displayed.

端末装置103は、検索結果データのうち同一キーワードで最も類似度が高いものを選んで、キーワード候補表示欄である8100に表示する。
ユーザは、これを見て、キーワード候補表示欄8100の「Aさん」が目的の「Aさん」であることを確認し、マウスを使ってクリックなどで選択する。すると、図7のタイミング707の端末装置103の状態に遷移する。図7のタイミング707の端末装置103の状態では図8Hの検索画像808が表示される。
図8Hの8037はキーワード表示欄である。キーワード表示欄8037には付与済みのキーワードが表示される。
The terminal device 103 selects the same keyword having the highest similarity among the search result data, and displays it on the keyword candidate display field 8100.
The user sees this, confirms that “Mr. A” in the keyword candidate display field 8100 is the target “Mr. A”, and selects it by clicking with the mouse. Then, the state transitions to the state of the terminal device 103 at timing 707 in FIG. In the state of the terminal device 103 at the timing 707 in FIG. 7, the search image 808 in FIG. 8H is displayed.
Reference numeral 8037 in FIG. 8H denotes a keyword display field. In the keyword display field 8037, assigned keywords are displayed.

ユーザは、以後も、検索結果画像の中から1つあるいは複数同時に選択して、キーワード付与操作を行うことができる。1回の登場イベント検索におけるユーザのキーワード付与操作が全て終われば、ユーザは条件を変えて再度登場イベント検索を行うこともできる。
このようにすることで、ユーザが「Aさん」の名前の正確な漢字やスペルを知らなくても、他のユーザが正確な漢字やスペルを入力済みであれば、誤りなく入力できる。また、ユーザが、毎回キーボードで「Aさん」の名前を入力しなくても、マウスでクリックするだけで、キーワードを付与する作業を行うことができる。
Thereafter, the user can select one or more of the search result images at the same time and perform the keyword assignment operation. When the user's keyword assignment operation in one appearance event search is completed, the user can change the conditions and perform the appearance event search again.
In this way, even if the user does not know the exact kanji or spelling of the name “Mr. A”, if the other user has already entered the correct kanji or spelling, it can be entered without error. Further, even if the user does not input the name “Mr. A” with the keyboard every time, the user can perform the task of assigning a keyword by simply clicking with the mouse.

ここまでに示したように、本実施形態に示した類似画像検索システムより、ユーザは類似画像検索の結果に対し、より少ない結果画像の選択回数でキーワードの付与を行うことを可能にした。また、ユーザが登場イベント検索においてキーワードを付与する場合に毎回キーボードによる正確なキーワードの入力を行う必要のないキーワード付与を可能にした。   As described so far, the similar image search system shown in the present embodiment enables the user to assign keywords to the result of similar image search with a smaller number of selection of result images. In addition, when a user assigns a keyword in an appearance event search, it is possible to assign a keyword without having to input an accurate keyword with the keyboard every time.

また、ここまでの説明においては、撮像装置、録画装置、および端末装置は、各1台に限られず、図1に示したように、撮像装置や端末装置が複数台接続されていてもよい。また、図1では、録画装置は、1台のみであったが、録画装置が複数台接続されていてもよい。   In the description so far, the imaging device, the recording device, and the terminal device are not limited to one each, and a plurality of imaging devices and terminal devices may be connected as shown in FIG. In FIG. 1, only one recording device is used, but a plurality of recording devices may be connected.

本実施形態においては、図7に示すように、登場イベント検索後の検索結果選択後に類似人物検索要求を行った。しかし、登場イベント検索要求711時に録画装置102内部において類似人物検索要求されたのと同等の処理を行い、あらかじめ各々の検索結果画像に対する類似度によるキーワード付与候補を含めたものを登場イベント検索結果712として、検索結果選択時に都度行う類似人物検索要求を省略するような実施形態でもよい。   In the present embodiment, as shown in FIG. 7, a similar person search request is made after selecting a search result after an appearance event search. However, processing equivalent to that requested for the similar person search in the recording apparatus 102 at the time of appearance event search request 711 is performed, and appearance event search results 712 including keyword assignment candidates based on similarities for the respective search result images are included. As another example, an embodiment may be adopted in which a similar person search request that is performed each time a search result is selected is omitted.

また、本実施形態においては、図8Gに示すように、キーワード候補表示欄である8100にキーワードと類似度を表示したが、件数を含めてもよい。図5(c)の類似画像検索の検索結果に含まれるデータ302においては「Aさん」が3件、「Bさん」および「Cさん」がそれぞれ1件という結果となり、これをキーワード候補表示欄である8100に表示することでユーザの判断の参考情報を増やすような実施形態でもよい。   Moreover, in this embodiment, as shown to FIG. 8G, although the keyword and the similarity were displayed on 8100 which is a keyword candidate display column, you may include the number of cases. In the data 302 included in the search result of the similar image search in FIG. 5C, “Mr. A” has three results, “Mr. B” and “Mr. C” each have one result, and this is displayed as a keyword candidate display field. It may be an embodiment in which the reference information of the user's judgment is increased by displaying it in 8100.

また、本実施形態においては、類似度を図5(c)に示すように、キーワード未付与の検索結果も通信したが、キーワード未付与のものを通信から除くような実施形態でもよい。
また、本実施形態においては、人物検索に関わる人物検出処理や人物特徴量抽出処理等を録画装置上で実施する構成で説明したが、ネットワークで接続された録画装置とは別個の装置にて実施するようにしてもよい。
また、本実施形態においては、キーワードが文字列であるように示したが、特定の番号や記号列にて実施するようにしてもよい。
さらに、本実施形態においては、人物検索を対象に示したが、本発明は人物だけでなく一般的な画像検索にも適用することができる。
Further, in the present embodiment, as shown in FIG. 5C, the similarity is also transmitted with the keyword non-assigned search result, but the embodiment in which the keyword non-assigned is excluded from the communication may be used.
In the present embodiment, the person detection process related to person search, the person feature amount extraction process, and the like have been described as being performed on the recording apparatus. However, the apparatus is implemented on a separate apparatus from the networked recording apparatus. You may make it do.
In the present embodiment, the keyword is shown as a character string. However, the keyword may be executed with a specific number or symbol string.
Furthermore, in the present embodiment, the person search is shown, but the present invention can be applied not only to a person but also to a general image search.

102:録画装置、 103:端末装置、 110:キーワード記録部、 111:キーワード検索部、 112:キーワード付与要求送信部、 200:ネットワーク、 201:撮像装置、 202:録画装置、 203:端末装置、 210:画像送受信部、 211:画像記録部、 212:再生制御部、 213:人物領域検出部、 214:人物特徴量抽出部、 215:人物特徴量記録部、 216:属性情報記録部、 217:要求受信部、 218:類似人物検索部、 219:登場イベント検索部、 220:検索結果送信部、 221:検索要求送信部、 222:検索結果受信部、 223:検索結果表示部、 224:再生画像表示部、 225:画面操作検知部、 240:バス、 241:撮像部、 242:主記憶部、 243:符号化部、 244:ネットワークI/F、 250:バス、 251:CPU、 252:主記憶部、 253:補助記憶部、 254:ネットワークI/F、 260:バス、 261:CPU、 262:主記憶部、 263:補助記憶部、 264:表示I/F、 265:入出力I/F、 266:ネットワークI/F、 270:表示装置、 280:キーボード、 282:マウス、 300:フレームテーブル、 301:画像ID、 302:フレームデータ、 310:属性情報データテーブル、 311:登録ID、 312:画像ID、 313:特徴量、 314:カメラID、 315:時刻情報、 316:キーワード、 320:類似画像検索の検索結果に含まれるデータ、 801、802、803、804、805、806、807、808:検索画面、 3001:再生画像表示領域、 3002:動画、 3003:画像再生操作領域、 3004:検索キー画像指定領域、 3005:検索キー画像、 3006:映像指定ボタン、 3007:ファイル指定ボタン、 3008:検索絞込パラメータ指定領域、 3009〜3012:撮像装置指定チェックボックス、 3013〜3014:時刻指定チェックボックス、 3015〜3016:時刻指定欄、 3017:検索実行領域、 3018:類似人物検索ボタン、 3019:登場イベント検索ボタン、 3020:検索結果表示領域、 3031、3041、3051、3061、3071、3081、3091、3101、3111、3121、3131、3141:検索結果画像、 3032:頭出し再生ボタン、 3033:検索キー画像指定ボタン、 4017:検索実行領域、 4020:検索結果表示領域、 4021:キーワード指定チェックボックス、 4022:キーワード指定欄、 4023:キーワード付与ボタン、 4034:キーワード付与チェックボックス、 8035:類似度表示欄、 8036:人物矩形表示、 8037:キーワード表示欄、 8100:キーワード指定およびキーワード候補選択欄。   102: Recording device, 103: Terminal device, 110: Keyword recording unit, 111: Keyword search unit, 112: Keyword assignment request transmission unit, 200: Network, 201: Imaging device, 202: Recording device, 203: Terminal device, 210 : Image transmission / reception unit 211: Image recording unit 212: Playback control unit 213: Person area detection unit 214: Person feature amount extraction unit 215: Person feature amount recording unit 216: Attribute information recording unit 217: Request Receiving unit, 218: similar person searching unit, 219: appearance event searching unit, 220: search result transmitting unit, 221: search request transmitting unit, 222: search result receiving unit, 223: search result displaying unit, 224: reproduction image display Unit, 225: screen operation detection unit, 240: bus, 241: imaging unit, 242: main storage unit, 24 : Encoding unit, 244: Network I / F, 250: Bus, 251: CPU, 252: Main storage unit, 253: Auxiliary storage unit, 254: Network I / F, 260: Bus, 261: CPU, 262: Main Storage unit 263: Auxiliary storage unit 264: Display I / F, 265: Input / output I / F, 266: Network I / F, 270: Display device, 280: Keyboard, 282: Mouse, 300: Frame table, 301 : Image ID, 302: Frame data, 310: Attribute information data table, 311: Registration ID, 312: Image ID, 313: Feature quantity, 314: Camera ID, 315: Time information, 316: Keyword, 320: Similar image search 801, 802, 803, 804, 805, 8 6, 807, 808: search screen, 3001: playback image display area, 3002: moving image, 3003: image playback operation area, 3004: search key image designation area, 3005: search key image, 3006: video designation button, 3007: file Designation button, 3008: Search refinement parameter designation area, 3009-3012: Imaging device designation check box, 3013-3014: Time designation check box, 3015-3016: Time designation column, 3017: Search execution area, 3018: Similar person search Button, 3019: Appearance event search button, 3020: Search result display area, 3031, 3041, 3051, 3061, 3071, 3081, 3091, 3101, 3111, 3121, 3131, 3141: Search result image, 3032: Head Play button, 3033: Search key image designation button, 4017: Search execution area, 4020: Search result display area, 4021: Keyword designation check box, 4022: Keyword designation column, 4023: Keyword assignment button, 4034: Keyword assignment check box 8035: Similarity display field 8036: Person rectangle display 8037: Keyword display field 8100: Keyword specification and keyword candidate selection field

Claims (3)

撮像した複数の画像の画像データを記憶し、前記画像の特徴量を抽出して、指定されたキー画像の特徴量と類似度が高い画像を検索する類似画像検索システムであって、
検索結果の画像を一覧表示する第1ユーザインタフェースと、
前記検索結果の画像のそれぞれを、選択状態または非選択状態のいずれかに指定する入力を受け付ける第2ユーザインタフェースと、
前記選択状態の画像へ付与される任意のキーワードの入力を受け付ける第3ユーザインタフェースと、を備え、
前記第2ユーザインタフェースは、前記検索結果の画像の内、前記キー画像の特徴量と所定以上類似する画像の少なくとも1つを、自動的に選択状態にし、
前記第3ユーザインタフェースは、前記選択状態の画像に類似する画像に付与されているキーワードを、前記選択状態の画像に付与されるべきキーワードの候補として、類似度の降順で提示することを特徴とする類似画像検索システム。
A similar image search system for storing image data of a plurality of captured images, extracting a feature amount of the image, and searching for an image having a high similarity with a feature amount of a designated key image,
A first user interface displaying a list of search result images;
A second user interface that accepts an input for designating each of the search result images as either a selected state or a non-selected state;
A third user interface that accepts an input of an arbitrary keyword given to the image in the selected state,
The second user interface automatically selects at least one of the images that are similar to the feature amount of the key image among the search result images, and automatically selects the image.
The third user interface presents keywords assigned to an image similar to the image in the selected state in descending order of similarity as keyword candidates to be assigned to the image in the selected state. Similar image search system.
前記選択状態の画像に類似する画像は、前記第2ユーザインタフェースによっていずれかの画像を選択状態とする入力が受け付けられたときに、該選択状態の画像をキー画像としてバックグラウンドで行った類似画像検索の結果、取得され、
前記キーワードの候補は、前記選択状態の画像に類似する画像に付与されているキーワードのうち、最も類似度が高いものであることを特徴とする請求項1記載の類似画像検索システム。
An image similar to the image in the selected state is a similar image obtained in the background using the image in the selected state as a key image when an input for selecting any image is received by the second user interface. As a result of the search,
The similar image search system according to claim 1, wherein the keyword candidates are those having the highest similarity among keywords assigned to images similar to the image in the selected state .
前記類似画像検索システムは、画像の類似度によらない画像検索方法である登場イベント検索機能を有し、
前記第2ユーザインタフェースが、前記登場イベント検索の結果の画像を選択状態にする操作を受け付けたとき、該選択画像をキー画像として類似画像検索を行い、該類似画像検索の結果にキーワード付与済みの画像が含まれていれば、そのキーワードを付与候補として提示することを特徴とする請求項1記載の類似画像検索システム。
The similar image search system has an appearance event search function that is an image search method that does not depend on the similarity of images,
When the second user interface accepts an operation for selecting an image as a result of the appearance event search, a similar image search is performed using the selected image as a key image, and a keyword has been assigned to the result of the similar image search The similar image search system according to claim 1, wherein, if an image is included, the keyword is presented as an assignment candidate.
JP2011109071A 2011-05-16 2011-05-16 Similar image search system Active JP5826513B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011109071A JP5826513B2 (en) 2011-05-16 2011-05-16 Similar image search system
PCT/JP2012/062309 WO2012157611A1 (en) 2011-05-16 2012-05-14 Similar image search system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011109071A JP5826513B2 (en) 2011-05-16 2011-05-16 Similar image search system

Publications (3)

Publication Number Publication Date
JP2012242878A JP2012242878A (en) 2012-12-10
JP2012242878A5 JP2012242878A5 (en) 2014-06-26
JP5826513B2 true JP5826513B2 (en) 2015-12-02

Family

ID=47176928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011109071A Active JP5826513B2 (en) 2011-05-16 2011-05-16 Similar image search system

Country Status (2)

Country Link
JP (1) JP5826513B2 (en)
WO (1) WO2012157611A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6213557B2 (en) 2013-03-01 2017-10-18 日本電気株式会社 Information processing apparatus, data processing method thereof, and program
JP6947085B2 (en) 2018-03-09 2021-10-13 オムロン株式会社 Electronic devices and their control methods
JP6573346B1 (en) 2018-09-20 2019-09-11 パナソニック株式会社 Person search system and person search method
JP7235612B2 (en) * 2019-07-11 2023-03-08 i-PRO株式会社 Person search system and person search method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3500930B2 (en) * 1997-09-22 2004-02-23 ミノルタ株式会社 Keyword assignment method and keyword automatic assignment device
JP2000099531A (en) * 1998-09-22 2000-04-07 Minolta Co Ltd Information processor
JP4478513B2 (en) * 2004-06-10 2010-06-09 キヤノン株式会社 Digital camera, digital camera control method, program, and recording medium storing the same
JP2010271769A (en) * 2009-05-19 2010-12-02 Seiko Epson Corp Image processing method and apparatus, and computer program therefor

Also Published As

Publication number Publication date
JP2012242878A (en) 2012-12-10
WO2012157611A1 (en) 2012-11-22

Similar Documents

Publication Publication Date Title
JP5863400B2 (en) Similar image search system
JP5506324B2 (en) Similar image search system and similar image search method
KR20190026738A (en) Method, system and computer program product for interactively identifying the same person or object present within a video recording
US11308158B2 (en) Information processing system, method for controlling information processing system, and storage medium
JP6589082B2 (en) Similar image search system
KR20180058019A (en) The Apparatus For Searching Image And The Method For Storing Data And The Apparatus For Storing Data
JP6203188B2 (en) Similar image search device
JP5826513B2 (en) Similar image search system
JP5768265B2 (en) Similar image search system
JP2009123196A (en) Image retrieval device
JP6214762B2 (en) Image search system, search screen display method
JP3372096B2 (en) Image information access device
JP5329130B2 (en) Search result display method
US10817709B2 (en) Similar image search system
JP6210634B2 (en) Image search system
JP6485978B2 (en) Image processing apparatus and image processing system
JP2006163527A (en) Image retrieval device and method
JP5147737B2 (en) Imaging device
JP5351445B2 (en) Image search system
JP3727794B2 (en) Information storage search method, information storage search device, and recording medium
WO2017056948A1 (en) Image processing system
JP2016009278A (en) Image processing system
JP2010278600A (en) Image processor

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151014

R150 Certificate of patent or registration of utility model

Ref document number: 5826513

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250