WO2020115910A1 - 情報処理システム、情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理システム、情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
WO2020115910A1
WO2020115910A1 PCT/JP2018/045176 JP2018045176W WO2020115910A1 WO 2020115910 A1 WO2020115910 A1 WO 2020115910A1 JP 2018045176 W JP2018045176 W JP 2018045176W WO 2020115910 A1 WO2020115910 A1 WO 2020115910A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
person
image
face
area
Prior art date
Application number
PCT/JP2018/045176
Other languages
English (en)
French (fr)
Inventor
伸明 川瀬
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2020558792A priority Critical patent/JP7020567B2/ja
Priority to US17/298,064 priority patent/US20220122377A1/en
Priority to PCT/JP2018/045176 priority patent/WO2020115910A1/ja
Priority to EP18942553.1A priority patent/EP3893193A4/en
Publication of WO2020115910A1 publication Critical patent/WO2020115910A1/ja
Priority to JP2022014709A priority patent/JP7298729B2/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Definitions

  • the present invention relates to an information processing system, an information processing apparatus, an information processing method, and a program, and particularly to an information processing system, an information processing apparatus, an information processing method, and a program that perform image recognition processing.
  • Patent Document 1 person characteristic information is stored for each image included in a video, a person who meets a preset condition is searched for the stored information, and information corresponding to the search result is searched. It is described to extract. Further, it is also described that the above-mentioned person state is used when the person state is determined and the person is identified using various feature amounts.
  • Patent Document 2 describes a system for identifying all the persons who meet the search condition from a group of images shot by a plurality of cameras. Further, in Patent Document 3, a walking state of a person is detected from a human image sequence obtained by a distant frame or a different camera, and whether or not the persons included in different image sequences are the same based on the walking state. Is described. In Patent Document 4, even when there are face images of a plurality of people in the video, the unique information of the matching face image is acquired by matching with the database for each face image, and the unique information is provided near the person in the video. It is described to display.
  • an object of the present invention is to provide a new method for keeping track of a specific person with a plurality of cameras by using image processing.
  • the first aspect relates to an information processing device.
  • the information processing device of the first aspect is Extracting means for extracting first face feature information from the face area of the person included in the first image, and extracting first person region feature information from the area including the area other than the face of the person; Collating means for collating two or more characteristic information, If the extraction unit is unable to extract the second face feature information from the face area of the person included in the second image, the second person area feature is extracted from the area other than the face of the person included in the second image. Extract information, The collation unit collates the first human area characteristic information with the second human area characteristic information.
  • the second aspect relates to an information processing method executed by at least one computer.
  • the first information processing method according to the second aspect is The information processing device First facial feature information is extracted from the face area of the person included in the first image, and first human area feature information is extracted from the area other than the face of the person, Match two or more feature information, When the second face feature information cannot be extracted from the face area of the person included in the second image, the second person area feature information is extracted from the area other than the face of the person included in the second image, Collating the first person area characteristic information with the second person area characteristic information.
  • the present invention may be a program that causes at least one computer to execute the method of the second aspect, or a computer-readable recording medium that records such a program. May be.
  • the recording medium includes a non-transitory tangible medium.
  • the computer program includes a computer program code that, when executed by a computer, causes the computer to execute the control method on the information processing device.
  • the various constituent elements of the present invention do not necessarily have to exist independently, and a plurality of constituent elements are formed as one member, and one constituent element is formed by a plurality of members. May be present, a certain component may be a part of another component, a part of a certain component may overlap a part of another component, and the like.
  • the order of description does not limit the order of executing the plurality of procedures. Therefore, when executing the method and computer program of the present invention, the order of the plurality of procedures can be changed within a range that does not hinder the contents.
  • the plurality of procedures of the method and computer program of the present invention are not limited to being executed at different timings. For this reason, another procedure may occur during execution of a certain procedure, the execution timing of a certain procedure may partially or completely overlap the execution timing of another procedure, and the like.
  • FIG. 1 is a diagram conceptually showing the configuration of an image processing system according to an embodiment of the present invention.
  • the image processing system 1 includes an information processing device 100.
  • the information processing apparatus 100 is connected via a communication network 3 to a plurality of cameras 5a, 5b,... (If there is no particular need to distinguish them, they will be referred to as “cameras 5”).
  • the information processing apparatus 100 can continue to track a person who is a tracking target (hereinafter, referred to as a tracking target person) even if the face does not appear in the image.
  • a tracking target person hereinafter, referred to as a tracking target person
  • the camera 5 is a network camera such as an IP (Internet Protocol) camera, which includes an imaging element such as a lens and a CCD (Charge Coupled Device) image sensor.
  • the network camera has, for example, a wireless LAN (Local Area Network) communication function, and is connected to the information processing apparatus 100 via a communication network, that is, a relay device (not shown) such as a router.
  • These cameras 5 may be so-called surveillance cameras installed in the city or inside and outside the building.
  • the camera 5 may include a mechanism that follows the movement of a specific person to control the orientation of the camera body or mens, zoom control, focus adjustment, and the like.
  • the camera 5 and the information processing device 100 may be directly connected, or may be connected via the communication network 3 or the like as described above.
  • the image data captured by the camera 5 may be directly transmitted to the information processing device 100, and the information processing device 100 may sequentially receive the image data.
  • a storage device (not shown) that can be accessed by both the camera 5 and the information processing device 100 may be provided. In this case, the image data captured by the camera 5 is stored in the storage device. Then, the information processing apparatus 100 reads the image data from this storage device.
  • the image data here may be at least one of a still image and a moving image.
  • the data format, file format, file size, image size, image resolution, moving image frame rate, etc. are not particularly limited, and the specifications, standards, performance, etc. of the camera 5 and the information processing apparatus 100, or the image analysis processing capacity, Various types can be adopted depending on the precision and the like.
  • at least one frame of this image data may be at least one of a first image and a second image described later.
  • acquisition means that the device itself acquires data or information stored in another device or a storage medium (active acquisition), and outputs to the device itself from another device. Inputting data or information (passive acquisition) to be performed. Examples of active acquisition include requesting or inquiring another device to receive the reply, and accessing and reading the other device or a storage medium. Examples of passive acquisition include receiving information to be distributed (or transmitted, push notification, etc.). Furthermore, “acquisition” may mean selecting and acquiring from the received data or information, or selecting and receiving the distributed data or information.
  • the timing of transmitting an image from the camera 5 to the information processing device 100 may be real-time distribution, for example, streaming distribution, or images for a predetermined period may be transmitted at predetermined intervals.
  • the transmission timing may be appropriately selected based on the memory capacity, the communication capacity, the image processing capacity of the camera 5 or the information processing apparatus 100, the communication status between the camera 5 and the information processing apparatus 100, or the like. , May be changed according to changes in the situation.
  • FIG. 2 is a functional block diagram showing a logical configuration of the information processing apparatus 100 of this embodiment.
  • the information processing device 100 includes an extraction unit 102 and a matching unit 104.
  • the extraction unit 102 extracts the first facial feature information from the facial region of the person included in the first image 10, and extracts the first human region characteristic information from the region other than the human face.
  • the collation unit 104 collates two or more characteristic information. Then, when the extraction unit 102 cannot extract the second face feature information from the face area of the person included in the second image 20, the extraction unit 102 determines the second person area from the area other than the face of the person included in the second image 20. Extract feature information. Then, the matching unit 104 matches the first person area characteristic information with the second person area characteristic information.
  • the first image 10 is a reference image showing the person to be tracked.
  • the second image 20 is an image to be searched for the person to be tracked.
  • the first image 10 and the second image 20 are captured at different timings.
  • the first image 10 and the second image 20 may be captured by the same camera 5 or may be captured by different cameras 5.
  • the extraction unit 102 receives the first image 10 from the camera 5 or reads it from another recording medium (not shown) to acquire it.
  • the extraction unit 102 first identifies at least one person as a tracking target person from the acquired first image 10 and specifies the face area thereof, and extracts at least one first face characteristic information.
  • the tracking target person may be at least one predetermined person included in the first image 10 or all persons included in the first image 10.
  • the face feature information database The specific at least one person registered in.
  • the tracking target person may be able to select at least one person from the persons included in the first image 10 or the persons registered in the facial feature information database by the operator. These settings may be determined in advance, or may be configured to accept the designation of the operator and change the settings.
  • the extraction unit 102 identifies the person area connected to the first face area from the first image 10.
  • the human area is an area showing a human body and personal belongings. Then, the extraction unit 102 extracts the first person area characteristic information from the person area.
  • the extracted first person area characteristic information may be stored in a storage device (not shown).
  • the first person area characteristic information is information generated from the person area connected to the face area of the person to be traced, which is extracted by the extraction unit 102, and indicates the appearance characteristics such as the person's profile or clothes. It is characteristic information.
  • the first person area characteristic information is, for example, height, shoulder width, ratio of body parts, clothes (shape, color, material, etc.), hairstyle (including hair color), ornaments (hat, glasses, accessories, etc.), personal belongings. It includes information indicating characteristics of (bag, umbrella, cane, etc.).
  • the human area feature information may include information such as the likelihood of the feature information.
  • the extraction unit 102 determines the second person area from the area other than the face of the person included in the second image 20. Extract feature information. Then, the matching unit 104 matches the extracted first person area characteristic information and second person area characteristic information.
  • the person area of the second image 20 from which the second person area characteristic information matching the first person area characteristic information is extracted is the person area of the person to be tracked. Thereby, it becomes possible to continue the tracking even if the face of the tracking target person in the second image 20 is not shown.
  • the case where the second face feature information cannot be extracted includes the case where the degree of matching with the first face feature information is less than the threshold value. Furthermore, in the second image 20, a case where at least a part of the face of the tracking target person is occluded or the face is turned sideways, and a feature amount suitable for matching cannot be extracted is also included.
  • the information processing apparatus 100 may be capable of displaying the face image data of the person on the display in order to show the face of the person to be tracked to the operator.
  • FIG. 3 is a diagram showing an example of the data structure of the first image 10 and the second image 20.
  • the first image 10 and the second image 20 include an image ID for identifying an image, a camera ID for identifying the camera 5 that has captured the image, and an image capture date/time (or a storage date/time or an update date/time).
  • the information includes the body of the image data.
  • the image ID may be a file name.
  • the first image 10 and the second image 20 may include information indicating a frame number that can identify the frame.
  • the second image 20 is an image captured after the first image 10, and the one received in real time from each camera 5 can be used.
  • the second image 20 may be recorded data captured before the first image 10, that is, data stored in a non-volatile storage unit.
  • the second image 20 is assumed to be a period in which clothes cannot be changed or a period in which the same clothes as those in the first image 10 are supposed to be worn from the time when the first image 10 was captured. It will be what was imaged.
  • FIG. 4 is a flowchart showing an example of the operation of the information processing device 100.
  • the extraction unit 102 acquires the first image 10 and extracts at least one first face characteristic information from the face area by using at least one person included in the first image 10 as a tracking target person (step). S101).
  • the extraction unit 102 extracts the first person area characteristic information from the area including the person other than the person's face from the first image 10 (step S103).
  • the extraction unit 102 specifies, for example, a human area from a portion located below the first face area in the area connected to the first face area.
  • the extraction unit 102 may also include, in the human area, a portion located above the first face area in the area connected to the first face area.
  • the extraction unit 102 acquires the second image 20 from the camera 5, and determines whether or not the second face characteristic information has been extracted from the face area of the person included in the second image 20 (step S105). When the second face characteristic information cannot be extracted (NO in step S105), the extraction unit 102 extracts the second person area characteristic information from the area including the face other than the person's face included in the second image 20 (step S107). ).
  • the collation unit 104 collates the first person area characteristic information extracted in step S103 with the second person area characteristic information extracted in step S107 (step S109).
  • the second person area characteristic information matches the first person area characteristic information
  • the person area in the second image 20 from which the second person area characteristic information is extracted becomes the tracking target person.
  • the process of extracting the second person area characteristic information from the second image 20 and collating the same is performed. The process ends without doing anything. That is, the face area in which the second face feature information is extracted in the second image 20 from the matching result of the face feature information is the tracking target person.
  • the extraction unit 102 extracts the first face characteristic information and the first person area characteristic information of the person who is the tracking target from the first image 10. Then, even if the second face feature information is not extracted from the second image 20 and the face feature information cannot be tracked, the second person region feature information and the first person region feature information extracted from the second image 20 The person to be tracked can be tracked by the second image 20 by collating.
  • FIG. 5 is a functional block diagram showing a logical configuration of the information processing apparatus 100 of this embodiment.
  • the information processing apparatus 100 of this embodiment is the same as that of the first embodiment except that the facial feature information of the person to be tracked is registered in advance in a blacklist or the like.
  • the information processing apparatus 100 further includes a face characteristic information database 110 (shown as “face characteristic information DB” in the figure).
  • the face characteristic information database 110 may be included in a plurality of devices.
  • the face characteristic information database 110 may be integrated with the main body of the information processing device 100 or may be a separate body.
  • the facial feature information database 110 has a database structure, but may have another data structure.
  • the feature information of the face of the person to be tracked is registered in the face feature information database 110.
  • the matching unit 104 matches the face feature information extracted from the face area of the person included in the first image 10 with the first face information stored in the face feature information database 110.
  • the matching result is a match
  • the first person region characteristic information is extracted from the person included in the first image 10.
  • FIG. 6 is a diagram showing an example of the data structure of the face feature information database 110.
  • the first face information which is the feature information of the face of at least one person to be tracked.
  • the face feature information database 110 associates a registrant ID for identifying a registered person, face feature information (corresponding to the first face information) of the person, a name, and face image data with each other.
  • the face characteristic information does not necessarily have to be stored in the face characteristic information database 110.
  • the information processing apparatus 100 extracts the face feature information from the face image data when performing the matching process.
  • the file format of face image data is not particularly limited, but examples include JPEG (Joint Photographic Experts Group), BMP (Bit MaP), PNG (Portable Network Graphics), and TIFF (Tagged Image File Format).
  • the entity of the image data may be registered in the face characteristic information database 110, or the path where the image data is stored and the file name may be registered.
  • the extraction unit 102 identifies a face area from the first image 10 and collates with the first face information registered in the face feature information database 110 (hereinafter, also referred to as face authentication processing). I do.
  • the target person to whom the matching process is performed may be all of the plurality of persons registered in the facial feature information database 110, or at least one person may be selected by the operator. These settings may be determined in advance, or may be configured to accept the designation of the operator and change the settings.
  • the information processing apparatus 100 of the present embodiment is the same as the information processing apparatus 100 except that step S111 (not shown) is included instead of step S101 in the flowchart of FIG.
  • step S111 first, the extraction unit 102 acquires the first image 10 and extracts the face characteristic information from the face area of the person included in the first image 10. Then, the matching unit 104 matches the extracted face feature information with the first face information in the face feature information database 110. Then, the extraction unit 102 sets the face feature information that matches the first face information stored in the face feature information database 110 as the first face feature information.
  • the extraction unit 102 extracts the first person area feature information from the area of the first image 10 that includes the areas other than the person's face (step S103), and if the face feature information cannot be extracted from the second image 20 (step S103). (NO in S105), the second person region characteristic information is extracted from the second image 20 (step S107).
  • the matching unit 104 matches the second person area characteristic information extracted in step S107 with the first person area characteristic information extracted in step S103 (step S109).
  • the extraction unit 102 causes the extraction unit 102 to match the first face feature information that matches the first face information registered in the face feature information database 110 and the person in the face area. And the first person region characteristic information of are extracted. Then, as in the case of the above-described embodiment, the second image feature information that matches the first face feature information of the tracking target person is not extracted from the second image 20 and the second image feature information is not tracked. By collating the second person area characteristic information extracted from 20 and the first person area characteristic information, the tracking target person can be tracked by the second image 20.
  • the same effects as the above embodiments can be obtained, and a person registered in advance in the facial feature information database 110 can be tracked as a tracking target person.
  • the information processing apparatus 100 performs the face authentication processing on the second image 20 as well, and then performs the face authentication processing on the person region connected to the face region for which the face authentication cannot be performed, with the first person region characteristic information.
  • the second embodiment is the same as the first embodiment except that the matching process is performed.
  • the operation of the third embodiment is different from that of the first embodiment, but the configuration is the same as that of the information processing apparatus 100 of FIG. 2, and therefore the functional block diagram of FIG. 2 is used in the following description. It should be noted that this embodiment may have the same configuration as the information processing apparatus 100 according to the other embodiments, and can be combined within a consistent range.
  • FIG. 7 is a flowchart showing an example of the operation of the information processing device 100 of this embodiment.
  • the present embodiment has the same steps S101 to S109 as in FIG. 4, and further includes step S120.
  • the collation unit 104 when the collation unit 104 can extract the second face feature information from the person included in the second image 20 (YES in step S105), the first face feature information and the second face feature information are collated. Yes (step S120).
  • the second face characteristic information cannot be extracted from the person included in the second image 20 (NO in step S105)
  • the first person area characteristic information extracted in step S103 and the second person extracted in step S107 The area characteristic information is collated (step S109).
  • the person whose second face feature information can be extracted is ( If YES in step S105), the person is tracked by collating with the face feature information, and if the second face feature information could not be extracted (NO in step S105), collate with the human area feature information. May track the person. In other words, when the face is visible, it can be tracked by the face, and when the face is not visible, it can be tracked by clothes (human area).
  • the information processing apparatus 100 performs the tracking process using the human area feature information when the face that matches the first face information is not found in the second image 20. Further, the information processing apparatus 100 can continue the tracking with the face of the person without performing the tracking process using the human area feature information when the face is found. As described above, according to the present embodiment, the same effects as those of the first and second embodiments are obtained, and further, the matching process using the human area feature information when face recognition is not possible, such as when a face is not captured. Therefore, it is efficient.
  • FIG. 8 is a functional block diagram showing a logical configuration of the information processing device 100 of this embodiment.
  • the information processing apparatus 100 according to the present embodiment has a configuration in which the extraction result by the extraction unit 102, the human region feature information extracted by the extraction unit 102, the person tracking information by the matching unit 104, and the like are output, and the embodiment described above. Is the same as.
  • the information processing device 100 further includes a first registration unit 120 and an output processing unit 130 in addition to the configuration shown in FIG. It should be noted that this embodiment may have the same configuration as the information processing apparatus 100 according to the other embodiments, and can be combined within a consistent range.
  • the first registration unit 120 stores the first face feature information and the first person area feature information extracted from the person included in the first image 10 in the person area information storage unit 112 in association with the person identification information. .. In other words, the first registration unit 120 associates the first face feature information and the first person area feature information extracted from the person included in the first image 10 with the person identification information, and the person area information storage unit 112. Register with.
  • the output processing unit 130 causes the output unit to output the identification information of the person stored in the human area information storage unit 112 when the matching results of the matching unit 104 match.
  • the first face characteristic information and the first person area characteristic information registered in the person area information storage unit 112 are also referred to as registered face characteristic information and registered person area characteristic information.
  • the output means is, for example, a display device that displays a screen, a printing device that prints out, a communication device that sends an email, and the like.
  • the output processing unit 130 causes the display device 132 such as a liquid crystal display or an organic EL (ElectroLuminescence) display connected to the information processing device 100 to display various information.
  • FIG. 9 is a diagram showing an example of the data structure of the human area characteristic information storage unit 112.
  • the human-region characteristic information storage unit 112 stores the human-region information ID identifying the human-region characteristic information and the human-region characteristic information extracted by the extraction unit 102 (first human-region characteristic information as Equivalent) is associated with.
  • the first person area characteristic information extracted from the person area other than the area is stored in the person area characteristic information storage unit 112 as the registered person area characteristic information.
  • the person area information ID, the first person area characteristic information, and the registrant ID of the first face information that matches the first face characteristic information extracted from the first image 10 are: It is associated.
  • the name and face image of the person corresponding to the registrant ID can be read from the face feature information database 110 of FIG.
  • the extraction unit 102 acquires the second image 20 from the plurality of cameras 5 and performs extraction processing on the acquired second image 20.
  • FIG. 10 is a diagram showing an example of a screen displayed on the display device 132 by the output processing unit 130.
  • FIG. 10A is a multi-screen 200 that displays images captured by a plurality of cameras 5 side by side on one screen.
  • FIG. 10B is a view screen 210 for browsing an operation image of one camera 5 in FIG. 10A.
  • the human area of the tracking target person extracted by the extraction unit 102 is surrounded by a rectangular frame 212. Further, the name 214 of the person identified by the collation unit 104 is displayed.
  • the multi-screen 200 and the view screen 210 may be a moving image captured by the camera 5 in real time, or may be at least one frame in which the moving image is stopped at a certain point. Also on the multi-screen 200, a frame 212 or a name 214 indicating the detected tracking target person may be displayed as in the view screen 210.
  • the multi screen 200 and the view screen 210 may be displayed in different windows, or may be switched and displayed. Also, a plurality of view screens 210 may be displayed simultaneously.
  • the multi-screen 200 and the view screen 210 may display information such as the date and time when the displayed image was taken, information about the shooting location, and the like.
  • the property information of the images displayed on the multi screen 200 and the view screen 210 may be displayed in another window according to the operation of the operator.
  • the frame 212 may be possible to receive an operator's operation on the area of the frame 212 and display information of the person, for example, information such as a face photograph and a profile.
  • the output processing unit 130 can display the multi-screen 200 or the view screen 210, it is possible to obtain the same effect as in the above-described embodiment and further to grasp the tracking status in real time.
  • FIG. 11 is a functional block diagram showing a logical configuration of the information processing device 100 of this embodiment.
  • the information processing apparatus 100 of the present embodiment is the same as the above-described embodiment except that the information of the person who is not registered in the facial feature information database 110 is registered as the unregistered person information.
  • the information processing device 100 further includes a second registration unit 140 in addition to the configuration shown in FIG. It should be noted that this embodiment may have the same configuration as the information processing apparatus 100 according to the other embodiments, and can be combined within a consistent range.
  • the extraction unit 102 when the comparison result of the first face feature information extracted from the face area of the person included in the first image 10 and the first face information stored in the face feature information database 110 does not match, The third person area characteristic information corresponding to the person area connected to the face area is extracted.
  • the second registration unit 140 stores the extracted third person region characteristic information and the first face characteristic information in the unregistered person information storage unit 142 in association with each other. In other words, the second registration unit 140 registers the extracted third person region characteristic information and the first face characteristic information in the unregistered person information storage unit 142 in association with each other.
  • the unregistered person information storage unit 142 may have a database structure.
  • the unregistered person information storage unit 142 may be included in the same device as at least one of the facial feature information database 110 and the human area feature information storage unit 112, or may be included in different devices. Further, the unregistered person information storage unit 142 may be integrated with the body of the information processing apparatus 100 or may be a separate body together with the face characteristic information database 110 and the human area characteristic information storage unit 112.
  • FIG. 12 is a diagram showing an example of a data structure of the unregistered person information storage unit 142.
  • the unregistered person ID for identifying the unregistered person is included in the first face feature information extracted from the face area of the person included in the first image 10 whose matching result with the first face information does not match. Has been granted.
  • the first face characteristic information and the third person area characteristic information are registered in the unregistered person information storage unit 142 in association with the unregistered person ID.
  • at least one of the image data of the face area of the person included in the first image 10 and the image data of the person area of the third person area characteristic information may be registered. ..
  • the person area or face area of the person is surrounded by a rectangular frame 212, and Information indicating an unregistered person may be displayed on the image in the vicinity of the frame 212. Further, the unregistered person ID may be displayed.
  • the frame 212 of the registrant and the unregistered person may be displayed separately by changing the color of the line and the type of the line (for example, a solid line, a broken line, etc.) so that they can be distinguished. Further, the frame 212 is not always necessary.
  • FIG. 13 is a flowchart showing an example of the operation of the information processing device 100 of this embodiment.
  • the second registration unit 140 identifies the human region connected to the second face region that the extraction unit 102 has determined not to match the first face information (step S141), and determines the second human region feature information corresponding to the human region. It is generated (step S143). Then, the second registration unit 140 registers the generated second person region characteristic information and the second face region in the unregistered person information storage unit 142 in association with each other (step S145).
  • a person whose face cannot be authenticated in the second image 20 can be registered as an unregistered person in the unregistered person information storage unit 142 with the face image and the person area characteristic information.
  • the non-member information can be acquired and registered.
  • FIG. 14 is a diagram showing an example of the configuration of a computer 80 that realizes the information processing apparatus 100 of each of the above-described embodiments.
  • the computer 80 stores a CPU (Central Processing Unit) 82, a memory 84, a program 90 that realizes the constituent elements of each of the information processing devices 100 of FIGS. 2, 9 and 11 loaded in the memory 84, and the program 90.
  • a storage 85, an I/O (Input/Output) 86, and a network connection interface (communication I/F 87) are provided.
  • the CPU 82, the memory 84, the storage 85, the I/O 86, and the communication I/F 87 are connected to each other via the bus 89, and the CPU 82 controls the entire information processing apparatus.
  • the method of connecting the CPU 82 and the like to each other is not limited to bus connection.
  • the memory 84 is a memory such as a RAM (Random Access Memory) or a ROM (Read Only Memory).
  • the storage 85 is a storage device such as a hard disk, SSD (Solid State Drive), or memory card.
  • the storage 85 may be a memory such as RAM or ROM.
  • the storage 85 may be provided inside the computer 80, or may be provided outside the computer 80 and connected to the computer 80 by wire or wirelessly if the computer 80 is accessible. Alternatively, it may be detachably attached to the computer 80.
  • each function of each unit of the information processing apparatus 100 of each embodiment can be realized.
  • the I/O 86 controls input/output of data and control signals between the computer 80 and other input/output devices.
  • the other input/output device includes, for example, an input device (not shown) such as a keyboard, a touch panel, a mouse, and a microphone connected to the computer 80, an output device (not shown) such as a display, a printer, and a speaker. These input/output devices and the interface of the computer 80 are included. Further, the I/O 86 may control the input/output of data to/from a reading/writing device (not shown) of another recording medium.
  • the communication I/F 87 is a network connection interface for communicating between the computer 80 and an external device.
  • the communication I/F 87 may be a network interface for connecting to a wired line or a network interface for connecting to a wireless line.
  • the computer 80 that realizes the information processing apparatus 100 is connected to at least one camera 5 via the network by the communication I/F 87.
  • Each component of the information processing apparatus 100 of each embodiment is realized by an arbitrary combination of hardware and software of the computer 80 in this figure. It will be understood by those skilled in the art that there are various modified examples of the method and device for realizing the same.
  • the functional block diagram showing the information processing apparatus 100 according to each of the above-described embodiments does not show the configuration in hardware units but the blocks in logical function units.
  • the information processing device 100 may be composed of a plurality of computers 80, or may be realized by a virtual server.
  • the present invention can be implemented as an information processing system exemplified below as an example configured by a plurality of computers 80, but is not limited thereto.
  • the extraction unit 102 and the matching unit 104 are implemented by different devices (computer 80).
  • the information processing system may include a terminal device having the extraction unit 102 and a server device having the matching unit 104.
  • the extraction processing of the extraction unit 102 the extraction processing of the characteristic information from the first image 10 and the extraction processing of the characteristic information from the second image 20 are performed by different devices (computer 80).
  • the information processing system may include a plurality of terminal devices having the extraction unit 102 for analyzing a video and a server device that integrates information from the terminals and performs a matching process.
  • a plurality of terminal devices may be separately provided for each area, and the extraction unit 102 may be realized by a plurality of physical devices. (3) It may be divided into different devices (computers 80) according to the type of feature information (face feature information and human region feature information) that is the target of image analysis (extracting unit 102 and collating unit 104).
  • the extraction unit 102 performs the tracking person search process using one person area feature information registered in the person area feature information registration process, but in another example, the extraction unit 102 , A plurality of first person area characteristic information is generated from each of the plurality of first images 10, and these first person area characteristic information are associated with each other and registered in the person area characteristic information storage unit 112 as registered person area characteristic information. May be.
  • the matching unit 104 can perform matching processing on at least one registered person area characteristic information or each of a plurality of registered person area characteristic information.
  • the operator may specify which of the plurality of registered person area characteristic information is used, or may receive the specification of all registered person area characteristic information from the operator.
  • FIG. 15 is a diagram showing an example of the data structure of the human area feature information storage unit 112.
  • the person area information ID is registered in association with the registrant ID and a plurality of person area characteristic information n (n is a natural number).
  • the human area characteristic information is mainly based on the characteristics of the person's clothes and the like, so that the tracking is premised on that the person has not changed his clothes. However, even if the user changes his/her clothes, it is possible to track the person by using different person area characteristic information corresponding to different clothes.
  • the extraction unit 102 may store the image including the generated human area corresponding to the first human area characteristic information in the human area characteristic information storage unit 112 in association with the first human area characteristic information.
  • FIG. 16 is a schematic diagram for explaining an example of the data structure of the human area characteristic information storage unit 112.
  • the information processing apparatus 100 compares the matching process using the facial feature information in step S105 of FIG. 5 or 8 with the matching process using the human area feature information in step S109 of FIG. 5 or 8. Although priority is given to priority, either the facial feature information matching process or the human region feature information matching process may be prioritized. It may be possible to change which process is given priority by receiving an operator's instruction.
  • the information processing apparatus 100 acts on the first person area characteristic information and the second image extracted from the person area of the person included in the first image 10.
  • the matching process with the second person area feature information extracted from the person acquisition area included in 20 is performed first, and then the matching process using the face feature information is performed without depending on the result of the person area match. May be.
  • the information processing apparatus 100 performs face authentication first, for example, in a situation where there are many people who wear similar clothes such as uniforms, and collation processing that uses the human area feature information only for persons who cannot be face authenticated. You may go.
  • the information processing apparatus 100 may accept a designation of which process is to be prioritized and can change the processing order according to the designation.
  • the information processing apparatus 100 may automatically switch to prioritize the face authentication processing when the similarity of the human area feature information in the second image 20 exceeds the reference value.
  • the information processing apparatus 100 uses at least one of face area detection, human area characteristic information extraction, and human area characteristic information person tracking triggered by detecting a predetermined event.
  • the predetermined event may be, for example, a predetermined action regarding a person, that is, an action that should be watched, such as leaving, stumbling, prowling, swinging around an object, or entering a predetermined area.
  • the predetermined event may be detected by the image recognition processing of the information processing device 100 from the image captured by the surveillance camera, or may be detected by another information processing device or sensor.
  • the extraction unit 102 may specify a person in which a predetermined event is detected, and may extract face area characteristic information and person area characteristic information with the person as a tracking target person.
  • the collating unit collates the first facial characteristic information with the second facial characteristic information
  • the information processing device In the information processing device according to any one of Extraction processing of the first face feature information, the second face feature information, the first person region feature information, and the second person region feature information by the extraction unit, and the person by the matching unit An information processing apparatus in which at least one of the collation processing of the area feature information is performed by using a detection of a predetermined event as a trigger. 6. 1. To 5. In the information processing device according to any one of Registration means for storing the extracted first person area characteristic information in the storage unit as registered person area characteristic information in association with the image including the person area corresponding to the first person area characteristic information, The collation unit is an information processing device that collates the registered person area characteristic information stored in the storage unit with the second person area characteristic information. 7. 1. To 6.
  • the collation means is an information processing device for collating at least one of the registered person area characteristic information stored in the storage unit and the second person area characteristic information.
  • the matching unit matches the first face feature information extracted from the face area of the person included in the first image with the first face information stored in the storage unit, and the matching result is a match. In the case of being, the information processing apparatus that extracts the first person region characteristic information from the person included in the first image. 9. 8.
  • the extraction means does not match the matching result between the first face feature information extracted from the face area of the person included in the first image and the first face information stored in the storage unit.
  • Extracting third human region characteristic information from a human region including a region other than the face region of the person The information processing apparatus further comprising a registration unit that associates the extracted third person region characteristic information and the first face characteristic information with each other and stores them in a second storage unit. 10.
  • the registration unit associates the image of the face area, from which the first facial feature information is extracted, with the first facial feature information and the third human area feature information and stores the image in the second storage unit.
  • Information processing device 11. 1. To 10.
  • An information processing apparatus further comprising: an output processing unit that causes the output unit to output the identification information of the person stored in the storage unit when the matching results of the matching unit match. 12. 1. To 11. In the information processing device according to any one of Connected to multiple imaging units via a network, The said extraction means acquires the said 2nd image from a some imaging part, The information processing apparatus which performs the extraction process with respect to the acquired said 2nd image.
  • the collating unit collates the first facial feature information with the second facial feature information
  • any one of Extraction processing of the first face feature information, the second face feature information, the first person region feature information, and the second person region feature information by the extraction unit, and the person by the matching unit An information processing system in which at least one of the collation processings of the area feature information is executed with a trigger of detecting a predetermined event. 18. 13. To 17. In the information processing system described in any one of Registration means for storing the extracted first person area characteristic information in the storage unit as registered person area characteristic information in association with the image including the person area corresponding to the first person area characteristic information, The collation means is an information processing system for collating the registered person area characteristic information stored in the storage unit with the second person area characteristic information. 19. 13. To 18.
  • the collation means is an information processing system for collating at least one of the registered person area characteristic information stored in the storage unit and the second person area characteristic information. 20. 13. To 19.
  • the matching unit matches the first face feature information extracted from the face area of the person included in the first image with the first face information stored in the storage unit, and the matching result is a match. In this case, the information processing system extracts the first person region characteristic information from the person included in the first image. 21. 20.
  • the extraction means does not match the matching result between the first face feature information extracted from the face area of the person included in the first image and the first face information stored in the storage unit.
  • Extracting third person area feature information from a person area including a face area other than the person's face area The information processing system further comprising a registration unit that associates the extracted third person region characteristic information and the first face characteristic information with each other and stores them in a second storage unit. 22. 21.
  • the registration means associates the image of the face area from which the first facial feature information is extracted with the first facial feature information and the third human area feature information, and stores the image in the second storage unit.
  • An information processing system further comprising: an output processing unit that causes the output unit to output the identification information of the person stored in the storage unit when the matching results of the matching unit match. 24. 13. To 23. In the information processing system described in any one of Connected to multiple imaging units via a network, The information processing system, wherein the extraction unit acquires the second image from a plurality of image capturing units and performs an extraction process on the acquired second image.
  • the information processing device First facial feature information is extracted from the face area of the person included in the first image, and first human area feature information is extracted from the area other than the person's face; Match two or more feature information, When the second face feature information cannot be extracted from the face area of the person included in the second image, the second person area feature information is extracted from the area other than the face of the person included in the second image, Collating the first human area characteristic information with the second human area characteristic information, Information processing method. 26. 25. In the information processing method described in An information processing method in which the second image is generated by an imaging unit different from the first image. 27. 25. Or 26. In the information processing method described in The information processing method, wherein the second image is an image captured after the first image. 28. 25. To 27.
  • the information processing method described in any one of The information processing device is When the second facial feature information can be extracted from the person included in the second image, the first facial feature information and the second facial feature information are collated to determine the person included in the second image.
  • the information processing method described in any one of The information processing device is Of the first face feature information, the second face feature information, the first human region feature information, and the second human region feature information extraction process, and the human region feature information matching process
  • An information processing method, wherein at least one of the methods is executed by using a detection of a predetermined event as a trigger. 30. 25. To 29.
  • the extracted first person area characteristic information is stored in the storage unit as registered person area characteristic information in association with the image including the person area corresponding to the first person area characteristic information, An information processing method for collating the registered person area characteristic information stored in the storage unit with the second person area characteristic information. 31. 25. To 30.
  • a plurality of the first person area characteristic information is extracted using a plurality of the first images, and the plurality of first person area characteristic information items are stored in a storage unit in association with each other as registered person area characteristic information; An information processing method for collating at least one of the registered person area characteristic information stored in the storage unit and the second person area characteristic information. 32. 25. To 31.
  • any one of The information processing device is When the first face feature information extracted from the face area of the person included in the first image and the first face information stored in the storage unit are collated, and the collation result is coincident, the first face information is compared.
  • the information processing device is When the comparison result of the first face feature information extracted from the face area of the person included in the first image and the first face information stored in the storage unit does not match, the face of the person The third person area characteristic information is extracted from the person area including areas other than the area, Furthermore, the information processing method of storing the extracted third human region characteristic information and the first face characteristic information in a second storage unit in association with each other. 34. 33.
  • the information processing method described in The information processing device is An information processing method, wherein the image of the face region from which the first face feature information is extracted is stored in the second storage unit in association with the first face feature information and the third person region feature information. 35. 25. To 34.
  • the information processing device Storing the first face characteristic information and the first human region characteristic information extracted from the person included in the first image in the storage unit in association with the person identification information; An information processing method of causing the output unit to output the identification information of the person stored in the storage unit when the collation results match. 36. 25. To 35. In the information processing method described in any one of Connected to multiple imaging units via a network, The information processing device is An information processing method of acquiring the second image from a plurality of image capturing units and performing an extraction process on the acquired second image.
  • a procedure for collating two or more characteristic information A procedure for extracting the second human region feature information from a region other than the face of the person included in the second image when the second face feature information cannot be extracted from the face region of the person included in the second image.
  • the face of the person A procedure for extracting third human area feature information from a human area including areas other than the area;

Abstract

情報処理装置(100)は、第1画像(10)に含まれる人物の顔領域から第1の顔特徴情報を抽出し、人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出部(102)と、2以上の特徴情報を照合する照合手段と、を備え、抽出部(102)は、第2画像(20)に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、第2画像(20)に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、照合部(104)は、第1の人領域特徴情報と第2の人領域特徴情報とを照合する。

Description

情報処理システム、情報処理装置、情報処理方法、およびプログラム
 本発明は、情報処理システム、情報処理装置、情報処理方法、およびプログラムに関し、特に、画像認識処理を行う情報処理システム、情報処理装置、情報処理方法、およびプログラムに関する。
 近年、画像を用いて所望する条件に合致する人物を検知する技術が開発されている。例えば特許文献1には、映像に含まれる各画像に対して人物特徴情報を蓄積し、蓄積された情報に対して予め設定される条件に該当する人物を検索し、検索結果に対応する情報を抽出することが記載されている。さらに、人物の状態を判定し、各種特徴量を用いて人物を同定する際に、上記した人物の状態を使用することも記載されている。
 また、特許文献2には、複数のカメラで撮影された映像群から、検索条件に該当する人物を全て洗い出すシステムが記載されている。また、特許文献3には、離れたフレームや異なるカメラにより得られる人物画像シーケンスから、人物の歩行状態を検出し、歩行状態に基づいて、異なる画像シーケンスに含まれる人物が同一であるか否かを判定することが記載されている。特許文献4には、映像に複数人の顔画像が存在する場合でも、各顔画像についてデータベースとのマッチングにより一致した顔画像の固有情報を取得して、映像中において人物の近傍に固有情報を表示することが記載されている。
特開2010-257451号公報 特開2006-301995号公報 国際公開第2006/013765号 特開2006-293912号公報
 本発明者は、画像処理を用いて特定の人物を複数カメラで追跡し続けるための新たな手法を検討した。すなわち本発明が目的とするところは、画像処理を用いて特定の人物を複数カメラで追跡し続けるための新たな手法を提供することにある。
 本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
 第一の側面は、情報処理装置に関する。
 第一の側面の情報処理装置は、
 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出手段と、
 2以上の特徴情報を照合する照合手段と、を有し、
 前記抽出手段は、第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
 前記照合手段は、前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する。
 第二の側面は、少なくとも1つのコンピュータにより実行される情報処理方法に関する。
 第二の側面に係る第1の情報処理方法は、
 情報処理装置が、
 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出し、
 2以上の特徴情報を照合し、
 第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
 前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、ことを含む。
 なお、本発明の他の側面としては、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
 このコンピュータプログラムは、コンピュータにより実行されたとき、コンピュータに、情報処理装置上で、その制御方法を実施させるコンピュータプログラムコードを含む。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
 また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
 また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障のない範囲で変更することができる。
 さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
 上記各側面によれば、画像処理を用いて特定の人物を複数カメラで追跡し続けるための新たな手法を提供できる。
 上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
本発明の実施の形態に係る画像処理システムの構成を概念的に示す図である。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 第1画像および第2画像のデータ構造の一例を示す図である。 情報処理装置の動作の例を示すフローチャートである。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 顔特徴情報データベースのデータ構造の一例を示す図である。 情報処理装置の動作の一例を示すフローチャートである。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 人領域特徴情報記憶部のデータ構造のバリエーションを示す図である。 表示処理部が表示装置に表示する画面の例を示す図である。 本実施形態の情報処理装置の論理的な構成を示す機能ブロック図である。 未登録者情報記憶部のデータ構造の一例を示す図である。 情報処理装置の動作の一例を示すフローチャートである。 各実施形態の情報処理装置を実現するコンピュータの構成の一例を示す図である。 人領域特徴情報記憶部のデータ構造の例を示す図である。 人領域特徴情報記憶部のデータ構造の例を説明するための概略図である。
 以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
 また、本明細書の各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
(第1の実施の形態)
 図1は、本発明の実施の形態に係る画像処理システムの構成を概念的に示す図である。画像処理システム1は、情報処理装置100を備える。情報処理装置100は、複数のカメラ5a,5b,・・・(特に区別する必要がない場合は「カメラ5」と呼ぶ。)に通信ネットワーク3を介して接続されている。情報処理装置100は、詳細を後述するように、画像に追跡対象の人物(以下、追跡対象人物と記載)の顔が写らない状況があったとしても、その人物の追跡を続けることができる。
 カメラ5は、レンズとCCD(Charge Coupled Device)イメージセンサといった撮像素子を備え、例えばIP(Internet Protocol)カメラ等のネットワークカメラである。ネットワークカメラは、たとえば、無線LAN(Local Area Network)通信機能を有し、通信ネットワーク、すなわちルータなどの中継装置(不図示)を介して情報処理装置100に接続される。これらのカメラ5は、街中や建物内外に設置されている、所謂、監視カメラであってもよい。そして、カメラ5は、特定の人物の動きに合わせて追従してカメラ本体やメンズの向きの制御、ズーム制御、焦点合わせ等を行う機構を備えてもよい。
 カメラ5と情報処理装置100は直接接続されてもよいし、上記したように通信ネットワーク3などを介して接続されてもよい。たとえば、カメラ5で撮像された画像データが情報処理装置100に直接送信され、情報処理装置100がこの画像データを逐次受信してもよい。また、カメラ5及び情報処理装置100の双方がアクセス可能な記憶装置(不図示)を設けてもよい。この場合、カメラ5により撮像された画像データは、記憶装置に記憶される。そして、情報処理装置100は、この記憶装置から画像データを読み出す。
 ここで画像データは、静止画および動画の少なくともいずれかであってよい。データ形式、ファイル形式、ファイルサイズ、画像サイズ、画像の解像度、動画のフレームレート等も特に限定されず、カメラ5および情報処理装置100の仕様、規格、性能等、あるいは、画像解析の処理能力、精度等に応じて様々な形式のものを採用し得る。そしてこの画像データの少なくとも一つのフレームが、後述する第1画像及び第2画像の少なくとも一方としてもよい。
 また、実施形態において「取得」とは、自装置が他の装置や記憶媒体に格納されているデータまたは情報を取りに行くこと(能動的な取得)、および、自装置に他の装置から出力されるデータまたは情報を入力すること(受動的な取得)の少なくとも一方を含む。能動的な取得の例は、他の装置にリクエストまたは問い合わせしてその返信を受信すること、及び、他の装置や記憶媒体にアクセスして読み出すこと等がある。また、受動的な取得の例は、配信(または、送信、プッシュ通知等)される情報を受信すること等がある。さらに、「取得」とは、受信したデータまたは情報の中から選択して取得すること、または、配信されたデータまたは情報を選択して受信することであってもよい。
 また、カメラ5から情報処理装置100への画像の送信のタイミングは、リアルタイム配信、例えば、ストリーミング配信であってもよいし、所定間隔で所定期間分の画像を送信してもよい。この送信タイミングは、カメラ5や情報処理装置100のメモリ容量、通信容量、画像処理能力、及び、カメラ5と情報処理装置100間の通信状況等に基づいて、適宜選択されてもよいし、又は、状況変化に応じて変更されてもよい。
 図2は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。情報処理装置100は、抽出部102と、照合部104と、を備える。
 抽出部102は、第1画像10に含まれる人物の顔領域から第1の顔特徴情報を抽出し、人物の顔以外を含む領域から第1人領域特徴情報を抽出する。照合部104は、2以上の特徴情報を照合する。そして、抽出部102は、第2画像20に含まれる人物の顔領域から第2顔特徴情報を抽出できなかった場合、第2画像20に含まれる人物の顔以外を含む領域から第2人領域特徴情報を抽出する。そして、照合部104は、第1人領域特徴情報と第2人領域特徴情報とを照合する。
 詳細には、第1画像10は、追跡対象の人物が写っている基準となる画像である。第2画像20は、追跡対象人物を検索する対象となる画像である。第1画像10と第2画像20は、異なるタイミングで撮像されている。第1画像10と第2画像20は同じカメラ5で撮像されていてもよいし、異なるカメラ5で撮像されていてもよい。
 そして、抽出部102は、第1画像10を、カメラ5から受信、又は他の記録媒体(不図示)から読み込んで取得する。抽出部102は、取得した第1画像10からまず少なくとも1人の人物を追跡対象人物として、その顔領域を特定し、第1の顔特徴情報を少なくとも1つ抽出する。追跡対象人物は、第1画像10に含まれる少なくとも1人の所定の人物、又は第1画像10に含まれるすべての人物であってもよいし、後述する実施形態のように、顔特徴情報データベースに登録されている特定の少なくとも1人の人物としてもよい。また、追跡対象人物は、第1画像10に含まれる人物、又は、顔特徴情報データベースに登録されている人物の中からオペレータにより少なくとも1人を選択できてもよい。これらの設定は、予め定められていてもよいし、オペレータの指定を受け付けて設定変更できる構成を有していてもよい。
 抽出部102は、上記したように、第1画像10から、第1顔領域に繋がっている人領域を特定する。人領域は、人の体及び所持物を示す領域である。そして抽出部102は、当該人領域から第1人領域特徴情報を抽出する。
 抽出された第1人領域特徴情報は、記憶装置(不図示)に記憶されてもよい。
 第1人領域特徴情報は、抽出部102によって抽出された追跡対象の人物の顔領域に繋がっている人領域から生成される情報であり、当該人物の背格好又は服装等の見た目の特徴を示す特徴情報である。
 第1人領域特徴情報は、例えば、背丈、肩幅、身体パーツの比率、衣服(形、色、素材等)、髪型(髪色も含む)、装飾品(帽子、眼鏡、アクセサリ等)、所持品(バッグ、傘、杖等)等の特徴を示す情報を含む。また、人領域特徴情報は、その特徴情報の尤度等の情報を含んでもよい。
 抽出部102は、さらに、第2画像20に含まれる人物の顔領域から第2顔特徴情報を抽出できなかった場合、第2画像20に含まれる人物の顔以外を含む領域から第2人領域特徴情報を抽出する。そして、照合部104は、抽出された第1人領域特徴情報と第2人領域特徴情報を照合する。第1人領域特徴情報にマッチングする第2人領域特徴情報が抽出された第2画像20の人領域が追跡対象の人物の人領域である。これにより第2画像20内の追跡対象人物の顔が写っていなくても追跡を続けることが可能となる。
 ここで、第2顔特徴情報を抽出できない場合とは、第1顔特徴情報とのマッチングの度合いが閾値未満の場合を含む。さらに、第2画像20中で、追跡対象人物の顔の少なくとも一部が遮蔽されていたり、顔を横に向けたりしていて、照合に適した特徴量が抽出できない場合も含む。
 なお、情報処理装置100は、オペレータに当該追跡対象人物の顔を見せるために、人物の顔画像データをディスプレイに表示できるようになっていてもよい。
 図3は、第1画像10および第2画像20のデータ構造の一例を示す図である。第1画像10および第2画像20は、画像を識別する画像IDと、当該画像を撮像したカメラ5を識別するカメラIDと、画像の撮像日時(又は、保存日時、更新日時でもよい)とを示す情報、及び画像データの本体を含む。画像IDは、ファイル名でもよい。第1画像10及び第2画像20は、当該画像がフレームである場合、そのフレームを特定可能なフレーム番号を示す情報を含んでもよい。
 本実施形態において、第2画像20は、第1画像10より後に撮像された画像であり、各カメラ5からリアルタイムに受信したものを用いることができる。しかし、他の実施形態において、第2画像20は、第1画像10より前に撮像された録画データ、すなわち不揮発性の記憶手段に記憶されたデータであってもよい。後述するように、本実施形態では、人物の顔が写っていなくても、衣服等の特徴で当該人物を追跡するため、衣服を着替えてしまうと追跡ができなくなる。このため、第2画像20は、第1画像10の撮像時刻から、衣服を替られないと想定される期間、または、第1画像10の衣服と同じものを着ている期間と想定される期間に撮像されたものになる。
 このように構成された本実施形態の情報処理装置100の動作について、以下説明する。
 図4は、情報処理装置100の動作の例を示すフローチャートである。
 まず、抽出部102は、第1画像10を取得し、第1画像10に含まれる少なくとも1人の人物を追跡対象人物として、その顔領域から第1顔特徴情報を少なくとも1つ抽出する(ステップS101)。
 さらに、抽出部102は、第1画像10から当該人物の顔以外を含む領域から第1人領域特徴情報を抽出する(ステップS103)。抽出部102は、例えば、第1顔領域につながる領域のうち当該第1顔領域の下方に位置する部分から、人領域を特定する。また、抽出部102は、第1顔領域につながる領域のうち当該第1顔領域の上方に位置する部分も人領域に含めてもよい。
 次に、抽出部102は、カメラ5から第2画像20を取得し、第2画像20に含まれる人物の顔領域から第2顔特徴情報が抽出できたか否かを判定する(ステップS105)。第2顔特徴情報が抽出できなかった場合(ステップS105のNO)、抽出部102は、第2画像20に含まれる人物の顔以外を含む領域から第2人領域特徴情報を抽出する(ステップS107)。
 次に、照合部104は、ステップS103で抽出された第1人領域特徴情報とステップS107で抽出された第2人領域特徴情報とを照合する(ステップS109)。第2人領域特徴情報が第1人領域特徴情報と一致した場合、第2画像20内で、当該第2人領域特徴情報が抽出された人領域が追跡対象人物となる。また、ステップS105で、第2顔特徴情報が抽出された場合(ステップS105のYES)、第2画像20から第2人領域特徴情報を抽出し、照合する処理(ステップS107とステップS109)は行わずに処理を終了する。つまり、顔特徴情報の照合結果から、第2画像20内で第2顔特徴情報が抽出された顔領域が追跡対象人物となる。
 以上説明したように、本実施形態において、抽出部102により、第1画像10から追跡対象となる人物の第1顔特徴情報と第1人領域特徴情報が抽出される。そして、第2画像20から第2顔特徴情報が抽出されずに、顔特徴情報での追跡ができない場合でも、第2画像20から抽出した第2人領域特徴情報と第1人領域特徴情報とを照合することで追跡対象人物を第2画像20で追跡することができる。
 このように、本実施形態によれば、カメラ5から受信した第2画像20において、たとえ追跡対象の人物の顔が写っていなくても、当該人物の追跡を継続することが可能になる。
(第2の実施の形態)
 図5は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。本実施形態の情報処理装置100は、追跡対象となる人物の顔特徴情報が予めブラックリスト等に登録されている点以外は第1の実施形態と同様である。
 情報処理装置100は、さらに顔特徴情報データベース110(図中、「顔特徴情報DB」と示す)を含む。顔特徴情報データベース110は、複数の装置に含まれてもよい。また、顔特徴情報データベース110は、情報処理装置100の本体と一体であってもよいし、別体であってもよい。顔特徴情報データベース110は、データベース構造を有しているが、他のデータ構造を有していてもよい。
 本実施形態において、追跡対象の人物は、顔特徴情報データベース110に、その顔の特徴情報が登録されている。
 照合部104は、第1画像10に含まれる人物の顔領域から抽出された顔特徴情報と顔特徴情報データベース110に記憶された第1顔情報とを照合する。当該照合結果が一致となった場合、第1画像10に含まれる人物から第1人領域特徴情報を抽出する。
 図6は、顔特徴情報データベース110のデータ構造の一例を示す図である。顔特徴情報データベース110には、追跡対象となる少なくとも1人の人物の顔の特徴情報である第1顔情報が登録されている。顔特徴情報データベース110は、登録されている人物を識別する登録者IDと、当該人物の顔特徴情報(第1顔情報相当)と、氏名と、顔画像データとが紐付けられている。なお、顔特徴情報は必ずしも顔特徴情報データベース110に格納されていなくてもよい。この場合、情報処理装置100は、照合処理を行う際に顔画像データから顔特徴情報を抽出する。
 顔画像データのファイル形式は特に限定されないが、たとえば、JPEG(Joint Photographic Experts Group)、BMP(Bit MaP)、PNG(Portable Network Graphics)、TIFF(Tagged Image File Format)等が例示される。また、顔特徴情報データベース110には画像データの実体が登録されてもよいし、画像データが保存されている場所とファイル名を示すパスが登録されていてもよい。
 図5に戻り、抽出部102は、第1画像10から、顔領域を特定し、顔特徴情報データベース110に登録されている第1顔情報との照合処理(以後、顔認証処理とも呼ぶ。)を行う。照合処理を行う対象人物は、顔特徴情報データベース110に登録されている複数の人物全てとしてもよいし、オペレータにより少なくとも1人を選択できてもよい。これらの設定は、予め定められていてもよいし、オペレータの指定を受け付けて設定変更できる構成を有していてもよい。
 本実施形態の情報処理装置100は、図4のフローチャートのステップS101の代わりにステップS111(不図示)を含む以外は同じである。ステップS111で、まず、抽出部102は、第1画像10を取得し、第1画像10に含まれる人物の顔領域から顔特徴情報を抽出する。そして、照合部104は、抽出した顔特徴情報と顔特徴情報データベース110の第1顔情報とを照合する。そして、抽出部102は、顔特徴情報データベース110に記憶されている第1顔情報に一致する顔特徴情報を第1顔特徴情報とする。
 そして、抽出部102は、第1画像10の人物の顔以外を含む領域から第1人領域特徴情報を抽出し(ステップS103)、第2画像20から顔特徴情報が抽出できなかった場合(ステップS105のNO)、第2画像20から第2人領域特徴情報を抽出する(ステップS107)。照合部104は、ステップS107で抽出した第2人領域特徴情報とステップS103で抽出した第1人領域特徴情報を照合する(ステップS109)。
 以上説明したように、本実施形態において、抽出部102により、第1画像10から顔特徴情報データベース110に登録されている第1顔情報に一致する第1顔特徴情報と、当該顔領域の人物の第1人領域特徴情報とが抽出される。そして、上記実施形態と同様に第2画像20から追跡対象人物の第1顔特徴情報と一致する第2顔特徴情報が抽出されずに、顔特徴情報での追跡ができない場合でも、第2画像20から抽出した第2人領域特徴情報と第1人領域特徴情報とを照合することで追跡対象人物を第2画像20で追跡することができる。
 つまり、本実施形態では、上記実施形態同様の効果を奏するとともに、予め顔特徴情報データベース110に登録されている人物を追跡対象人物として追跡することができる。
(第3の実施の形態)
 第3の実施の形態の情報処理装置100は、第2画像20に対しても顔認証処理を行った後、顔認証できなかった顔領域に繋がる人領域について、第1人領域特徴情報との照合処理を行う点以外は第1の実施形態と同様である。第3実施形態は、第1実施形態とは動作が異なるが、構成は図2の情報処理装置100と同じであるので、以下の説明では図2の機能ブロック図を用いる。なお、本実施形態はその他の実施形態の情報処理装置100と同じ構成を有してもよく、矛盾のない範囲で組み合わせることができる。
 図7は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。本実施形態では、図4と同じステップS101~ステップS109を有するとともに、さらに、ステップS120を含む。
 本実施形態において、照合部104、第2画像20に含まれる人物から第2顔特徴情報を抽出できた場合は(ステップS105のYES)、第1顔特徴情報と第2顔特徴情報とを照合する(ステップS120)。第2画像20に含まれる人物から第2顔特徴情報を抽出できなかった場合は(ステップS105のNO)、ステップS103で抽出された第1人領域特徴情報とステップS107で抽出された第2人領域特徴情報とを照合する(ステップS109)。
 本実施形態において、第1画像10に含まれる全ての人物を追跡対象人物とした場合、ステップS105で第2画像20に含まれる人物のうち、第2顔特徴情報が抽出できた人物については(ステップS105のYES)、顔特徴情報で照合を行うことで当該人物を追跡し、第2顔特徴情報が抽出できなかった人物については(ステップS105のNO)、人領域特徴情報で照合を行うことで当該人物を追跡してもよい。つまり、顔が写ってる時は顔で追跡し、顔が写っていない時は服装(人領域)で追跡することができる。
 本実施形態において、情報処理装置100は、第1顔情報と一致する顔が第2画像20に見つからなかった場合に、人領域特徴情報を用いた追跡処理を行う。また、情報処理装置100は、顔が見つかった場合は人領域特徴情報を用いた追跡処理を行なわず、人物の顔で追跡を続けることができる。このように本実施形態によれば、第1および第2の実施形態と同様な効果を奏するとともに、さらに、顔が写っていない等、顔認証ができない場合に人領域特徴情報を用いた照合処理を行うので、効率がよい。
(第4の実施の形態)
 図8は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。本実施形態の情報処理装置100は、抽出部102による抽出結果、および抽出部102により抽出された人領域特徴情報、照合部104による人物の追跡情報等を出力する構成を有する以外は上記実施形態と同じである。
 情報処理装置100は、図2に示した構成に加え、さらに、第1登録部120と、出力処理部130とを有する。なお、本実施形態はその他の実施形態の情報処理装置100と同じ構成を有してもよく、矛盾のない範囲で組み合わせることができる。第1登録部120は、第1画像10に含まれる人物から抽出された第1顔特徴情報と第1人領域特徴情報とを人物の識別情報に対応付けて人領域情報記憶部112に記憶させる。言い換えると、第1登録部120は、第1画像10に含まれる人物から抽出された第1顔特徴情報と第1人領域特徴情報とを人物の識別情報に対応付けて人領域情報記憶部112に登録する。出力処理部130は、照合部104による照合結果が一致となった場合、人領域情報記憶部112が記憶する人物の識別情報を出力手段に出力させる。以後、人領域情報記憶部112に登録された第1顔特徴情報および第1人領域特徴情報は、登録顔特徴情報および登録人領域特徴情報とも呼ぶ。
 出力手段は、例えば、画面表示を行う表示装置、印字出力する印刷装置、メールを送信する通信装置等である。本実施形態では、出力処理部130は、情報処理装置100に接続された液晶ディスプレイ、有機EL(ElectroLuminescence)ディスプレイ等の表示装置132に各種情報を表示させる。
 図9は、人領域特徴情報記憶部112のデータ構造の例を示す図である。
 図9(a)の例では、人領域特徴情報記憶部112は、人領域特徴情報を識別する人領域情報IDと、抽出部102により抽出された人領域特徴情報(第1人領域特徴情報に相当)とが紐付けられている。
 また、図9(b)と図9(c)の例は、上記第2の実施形態で、顔特徴情報データベース110の第1顔情報と一致する第1顔特徴情報が抽出された人物の顔領域以外の人領域から抽出された第1人領域特徴情報が登録人領域特徴情報として人領域特徴情報記憶部112に記憶されている。
 図9(b)の例では、人領域情報IDと、第1人領域特徴情報と、第1画像10から抽出された第1顔特徴情報と一致した第1顔情報の登録者IDと、が対応付けられている。登録者IDと紐付けておくことで、図6の顔特徴情報データベース110から登録者IDに対応する人物の氏名や顔画像を読み出すことができる。
 図9(c)の例では、登録者IDの代わりに第1画像10から抽出された第1顔特徴情報と一致した第1顔情報の登録者の氏名および顔画像データの少なくともいずれか1つと紐付けられている。
 本実施形態において、抽出部102は、複数のカメラ5から第2画像20を取得し、取得した第2画像20に対して抽出処理を行う。
 図10は、出力処理部130が表示装置132に表示する画面の例を示す図である。図10(a)は、複数のカメラ5の撮像画像を一画面に並べて表示するマルチ画面200である。図10(b)は、図10(a)の中のある1つのカメラ5の操作画像を閲覧するビュー画面210である。図10(b)のビュー画面210の例では、抽出部102によって抽出された追跡対象者の人領域が矩形の枠212で囲まれている。さらに、照合部104により特定された当該人物の氏名214が表示されている。
 マルチ画面200およびビュー画面210は、リアルタイムにカメラ5で撮像されている動画像であってもよいし、ある時点で動画像を停止させた少なくとも1つのフレームであってもよい。また、マルチ画面200においても、ビュー画面210と同様に検出された追跡対象人物を示す枠212や氏名214を表示してもよい。マルチ画面200とビュー画面210は、別のウインドウで表示されてもよいし、切り替えて表示されてもよい。また、複数のビュー画面210を同時に表示してもよい。
 さらに、マルチ画面200およびビュー画面210には、表示されている画像の撮像日時の情報、撮影場所の情報等を表示してもよい。あるいは、マルチ画面200およびビュー画面210で表示されている画像のプロパティ情報をオペレータの操作に応じて別のウインドウで表示できてもよい。
 また、枠212の領域に対するオペレータの操作を受け付けて、当該人物の情報、例えば、顔写真、プロフィール等の情報を表示できてもよい。
 本実施形態によれば、出力処理部130によりマルチ画面200又はビュー画面210を表示できるので、上記実施形態と同様な効果を奏するとともに、さらに、追跡状況をリアルタイムに把握できる。
(第5の実施の形態)
 図11は、本実施形態の情報処理装置100の論理的な構成を示す機能ブロック図である。本実施形態の情報処理装置100は、顔特徴情報データベース110に登録されていない人物の情報を未登録者情報として登録する構成を有する点以外は上記実施形態と同じである。
 情報処理装置100は、図2に示した構成に加え、さらに、第2登録部140を有する。なお、本実施形態はその他の実施形態の情報処理装置100と同じ構成を有してもよく、矛盾のない範囲で組み合わせることができる。抽出部102は、第1画像10に含まれる人物の顔領域から抽出された第1顔特徴情報と顔特徴情報データベース110に記憶された第1顔情報との照合結果が不一致となった場合、当該顔領域に繋がる人領域に対応する第3人領域特徴情報を抽出する。第2登録部140は、抽出された第3人領域特徴情報及び第1顔特徴情報を互いに関連付けて未登録者情報記憶部142に記憶させる。言い換えると、第2登録部140は、抽出された第3人領域特徴情報及び当該第1顔特徴情報を互いに関連付けて未登録者情報記憶部142に登録する。未登録者情報記憶部142はデータベース構造を有していてもよい。
 未登録者情報記憶部142は、顔特徴情報データベース110および人領域特徴情報記憶部112の少なくともいずれか一方と同一の装置に含まれてもよいし、互いに異なる装置に含まれていてもよい。また、未登録者情報記憶部142は、顔特徴情報データベース110および人領域特徴情報記憶部112とともに、情報処理装置100の本体と一体であってもよいし、別体であってもよい。
 図12は、未登録者情報記憶部142のデータ構造の一例を示す図である。この例では、第1顔情報との照合結果が一致しなかった第1画像10に含まれる人物の顔領域から抽出された第1顔特徴情報には未登録者を識別する未登録者IDが付与されている。そして、第1顔特徴情報及び第3人領域特徴情報は、未登録者IDに紐付けられて未登録者情報記憶部142に登録されている。さらに、未登録者情報記憶部142には、第1画像10に含まれる人物の顔領域の画像データおよび第3人領域特徴情報の人領域の画像データの少なくともいずれか1つが登録されてもよい。
 本実施形態においても、上記実施形態で図10(b)に示したビュー画面210の例において、抽出された未登録者について、当該人物の人領域又は顔領域を矩形の枠212で囲むとともに、当該枠212の近傍に未登録者であることを示す情報を画像に重畳表示してもよい。さらに、未登録者IDを表示してもよい。登録者と未登録者の枠212は識別できるように、線の色や線の種類(例えば、実線、破線等)を変えて区別して表示してもよい。また、枠212は必ずしも必要ではない。
 図13は、本実施形態の情報処理装置100の動作の一例を示すフローチャートである。図4のステップS103と同様な処理を行い、顔領域が検知できなかった場合(ステップS103のNO)、本処理に進む。第2登録部140は、抽出部102が第1顔情報に一致しないと判断した第2顔領域に繋がる人領域を特定し(ステップS141)、当該人領域に対応する第2人領域特徴情報を生成する(ステップS143)。そして、第2登録部140は、生成された第2人領域特徴情報及び当該第2顔領域を互いに関連付けて未登録者情報記憶部142に登録する(ステップS145)。
 以上説明したように、本実施形態において、第2画像20で顔認証できなかった人物を未登録者として、その顔画像および人領域特徴情報を未登録者情報記憶部142に登録できる。これにより、例えば、予め登録されている会員が利用する施設内に、非会員が入場した場合等に、非会員の情報を取得して登録することができる。
 図14は、上述した各実施形態の情報処理装置100を実現するコンピュータ80の構成の一例を示す図である。
 コンピュータ80は、CPU(Central Processing Unit)82、メモリ84、メモリ84にロードされた図2、図9および図11の各情報処理装置100の構成要素を実現するプログラム90、そのプログラム90を格納するストレージ85、I/O(Input/Output)86、およびネットワーク接続用インタフェース(通信I/F87)を備える。
 CPU82、メモリ84、ストレージ85、I/O86、通信I/F87は、バス89を介して互いに接続され、CPU82により情報処理装置全体が制御される。ただし、CPU82などを互いに接続する方法は、バス接続に限定されない。
 メモリ84は、RAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。ストレージ85は、ハードディスク、SSD(Solid State Drive)、またはメモリカードなどの記憶装置である。
 ストレージ85は、RAMやROMなどのメモリであってもよい。ストレージ85は、コンピュータ80の内部に設けられてもよいし、コンピュータ80がアクセス可能であれば、コンピュータ80の外部に設けられ、コンピュータ80と有線または無線で接続されてもよい。あるいは、コンピュータ80に着脱可能に設けられてもよい。
 CPU82が、ストレージ85に記憶されるプログラム90をメモリ84に読み出して実行することにより、各実施形態の情報処理装置100の各ユニットの各機能を実現することができる。
 I/O86は、コンピュータ80と他の入出力装置間のデータおよび制御信号の入出力制御を行う。他の入出力装置とは、たとえば、コンピュータ80に接続されるキーボード、タッチパネル、マウス、およびマイクロフォン等の入力装置(不図示)と、ディスプレイ、プリンタ、およびスピーカ等の出力装置(不図示)と、これらの入出力装置とコンピュータ80のインタフェースとを含む。さらに、I/O86は、他の記録媒体の読み取りまたは書き込み装置(不図示)とのデータの入出力制御を行ってもよい。
 通信I/F87は、コンピュータ80と外部の装置との通信を行うためのネットワーク接続用インタフェースである。通信I/F87は、有線回線と接続するためのネットワークインタフェースでもよいし、無線回線と接続するためのネットワークインタフェースでもよい。たとえば、情報処理装置100を実現するコンピュータ80は、通信I/F87によりネットワークを介して少なくとも1台のカメラ5と接続される。
 各実施形態の情報処理装置100の各構成要素は、本図のコンピュータ80のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。上述した各実施形態の情報処理装置100を示す機能ブロック図は、ハードウェア単位の構成ではなく、論理的な機能単位のブロックを示している。
 情報処理装置100は、複数のコンピュータ80により構成されてもよいし、仮想サーバにより実現されてもよい。
 複数のコンピュータ80により構成される例として、以下に例示される情報処理システムとして本発明は実現できるが、これらに限定されない。
(1)抽出部102と照合部104は別の装置(コンピュータ80)で実施する。例えば、情報処理システムは、抽出部102を有する端末装置と、照合部104を有するサーバ装置と備えてもよい。
(2)抽出部102の抽出処理のうち、第1画像10からの特徴情報の抽出処理と、第2画像20からの特徴情報の抽出処理を別の装置(コンピュータ80)で実施する。例えば、情報処理システムは、抽出部102を有する映像を解析する複数の端末装置と、それらからの情報を統合して照合処理を行うサーバ装置とを含んでもよい。複数の端末装置はエリア毎に分かれて配備され、抽出部102は、複数の物理的装置によって実現されてもよい。
(3)映像の解析(抽出部102と照合部104)の対象となる特徴情報の種別(顔特徴情報と人領域特徴情報)で別々の装置(コンピュータ80)に分けてもよい。
 以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
 たとえば、上記実施形態において、抽出部102は、人領域特徴情報登録処理で登録された1つの人領域特徴情報を用いて追跡人物検索処理を行っていたが、他の例において、抽出部102は、複数の第1画像10のそれぞれから複数の第1人領域特徴情報を生成し、これらの第1人領域特徴情報を互いに関連付けて登録人領域特徴情報として人領域特徴情報記憶部112に登録してもよい。
 そして、照合部104は、少なくとも1つの登録人領域特徴情報、又は複数の登録人領域特徴情報の各々について、照合処理を行うことができる。複数の登録人領域特徴情報のうちのいずれの情報を用いるか、オペレータの指定を受け付けてもよいし、全ての登録人領域特徴情報を用いる指定をオペレータから受け付けてもよい。
 図15は、人領域特徴情報記憶部112のデータ構造の例を示す図である。図15の例では、人領域情報IDに、登録者IDと、複数の人領域特徴情報n(nは自然数)が紐付けられて登録されている。
 上記したように人領域特徴情報は主に人物の衣服等の特徴に基づいているため、追跡は当該人物が衣服を着替えていないことが前提となる。しかし、着替えた場合も、別の服装に対応する別の人領域特徴情報を用いれば追跡が可能になる。
 また、抽出部102は、生成した第1人領域特徴情報に対応する人領域を含む画像を第1人領域特徴情報に関連付けて人領域特徴情報記憶部112に記憶してもよい。図16は、人領域特徴情報記憶部112のデータ構造の例を説明するための概略図である。
 図16(a)の例において、人領域特徴情報記憶部112には、1人の人物に対して、当該人物の顔画像データと、氏名と、1つの人領域特徴情報(不図示)と、1つの人領域特徴情報に対応する人領域の画像データとが登録されている。図16(b)の例では、人領域特徴情報記憶部112には、1人の人物に対して、当該人物の顔画像データと、氏名と、複数の人領域特徴情報(不図示)と、当該人領域特徴情報に各々対応する人領域の複数の画像データとが登録されている。
 上記実施形態では、情報処理装置100は、図5又は図8のステップS105で顔特徴情報を用いた照合処理の方を図5又は図8のステップS109での人領域特徴情報を用いた照合処理より優先して行っているが、顔特徴情報の照合処理と、人領域特徴情報の照合処理は、どちらを優先して行ってもよい。いずれの処理を優先させるか、オペレータの指示を受け付けて変更できてもよい。
 例えば、情報処理装置100は、わざと顔を隠して行動している可能性が高い人物については、第1画像10に含まれる人物の人領域から抽出される第1人領域特徴情報と第2画像20に含まれる人物の取得領域から抽出される第2人領域特徴情報との照合処理を先に行い、その後、人領域の照合の結果に依存せずに顔特徴情報を用いた照合処理を行ってもよい。また、情報処理装置100は、例えば、制服等、同じような服装の人物が多い状況では、先に顔認証を行い、顔認証できなかった人物に対してのみ人領域特徴情報を用いた照合処理を行ってもよい。さらに、情報処理装置100は、どちらの処理を優先させるかの指定を受け付け、この指定に従って処理順序を変更できてもよい。さらに、情報処理装置100は、第2画像20内の人領域特徴情報の類似度が基準値を超える場合に、顔認証処理を優先させるように自動的に切り替えてもよい。
 また、他の実施形態において、情報処理装置100は、所定の事象を検知したことをトリガとして、顔領域の検出、人領域特徴情報の抽出、人領域特徴情報による人物追跡のうち少なくともいずれか一つを実施してもよい。所定の事象は、例えば、置き去り、キョロキョロする、うろつく、物を振り回す、所定のエリアに侵入する、といった、人物に関する所定の行動、つまり、注視すべき行動でもよい。所定の事象は、監視カメラの撮像画像から情報処理装置100の画像認識処理によって検知されてもよいし、別の情報処理装置やセンサによって検知されてもよい。この場合、抽出部102は、所定の事象が検知された人物を特定し、当該人物を追跡対象人物として顔領域特徴情報、人領域特徴情報を抽出してもよい。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 なお、本発明において利用者に関する情報を取得、利用する場合は、これを適法に行うものとする。
 上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1. 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出手段と、
 2以上の特徴情報を照合する照合手段と、を備え、
 前記抽出手段は、第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
 前記照合手段は、前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理装置。
2. 1.に記載の情報処理装置において、
 前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理装置。
3. 1.又は2.に記載の情報処理装置において、
 前記第2画像は、前記第1画像より後に撮像された画像である情報処理装置。
4. 1.から3.のいずれか一つに記載の情報処理装置において、
 前記照合手段は、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理装置。
5. 1.から4.のいずれか一つに記載の情報処理装置において、
 前記抽出手段による前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記照合手段による前記人領域特徴情報の照合処理のうち少なくともいずれか1つは、所定の事象を検知したことをトリガとして実施される、情報処理装置。
6. 1.から5.のいずれか一つに記載の情報処理装置において、
 抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる登録手段をさらに備え、
 前記照合手段は、前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理装置。
7. 1.から6.のいずれか一つに記載の情報処理装置において、
 複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる登録手段をさらに備え、
 前記照合手段は、前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理装置。
8. 1.から7.のいずれか一つに記載の情報処理装置において、
 前記照合手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理装置。
9. 8.に記載の情報処理装置において、
 前記抽出手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
 抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる登録手段をさらに備える情報処理装置。
10. 9.に記載の情報処理装置において、
 前記登録手段は、前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理装置。
11. 1.から10.のいずれか一つに記載の情報処理装置において、
 前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる登録手段と、
 前記照合手段による照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる出力処理手段と、をさらに備える情報処理装置。
12. 1.から11.のいずれか一つに記載の情報処理装置において、
 複数の撮像部とネットワークを介して接続され、
 前記抽出手段は、複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理装置。
13. 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出手段と、
 2以上の特徴情報を照合する照合手段と、を備え、
 前記抽出手段は、第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
 前記照合手段は、前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、
 情報処理システム。
14. 13.に記載の情報処理システムにおいて、
 前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理システム。
15. 13.又は14.に記載の情報処理システムにおいて、
 前記第2画像は、前記第1画像より後に撮像された画像である情報処理システム。
16. 13.から15.のいずれか一つに記載の情報処理システムにおいて、
 前記照合手段は、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理システム。
17. 13.から16.のいずれか一つに記載の情報処理システムにおいて、
 前記抽出手段による前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記照合手段による前記人領域特徴情報の照合処理のうち少なくともいずれか1つは、所定の事象を検知したことをトリガとして実施される、情報処理システム。
18. 13.から17.のいずれか一つに記載の情報処理システムにおいて、
 抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる登録手段をさらに備え、
 前記照合手段は、前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理システム。
19. 13.から18.のいずれか一つに記載の情報処理システムにおいて、
 複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる登録手段をさらに備え、
 前記照合手段は、前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理システム。
20. 13.から19.のいずれか一つに記載の情報処理システムにおいて、
 前記照合手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理システム。
21. 20.に記載の情報処理システムにおいて、
 前記抽出手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
 抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる登録手段をさらに備える情報処理システム。
22. 21.に記載の情報処理システムにおいて、
 前記登録手段は、前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理システム。
23. 13.から22.のいずれか一つに記載の情報処理システムにおいて、
 前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる登録手段と、
 前記照合手段による照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる出力処理手段と、をさらに備える情報処理システム。
24. 13.から23.のいずれか一つに記載の情報処理システムにおいて、
 複数の撮像部とネットワークを介して接続され、
 前記抽出手段は、複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理システム。
25. 情報処理装置が、
 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出し、
 2以上の特徴情報を照合し、
 第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
 前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、
情報処理方法。
26. 25.に記載の情報処理方法において、
 前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理方法。
27. 25.又は26.に記載の情報処理方法において、
 前記第2画像は、前記第1画像より後に撮像された画像である情報処理方法。
28. 25.から27.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、
  前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理方法。
29. 25.から28.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、
 前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記人領域特徴情報の照合処理のうち少なくともいずれか1つを、所定の事象を検知したことをトリガとして実施する、情報処理方法。
30. 25.から29.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、さらに、
 抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させ、
 前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理方法。
31. 25.から30.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、さらに、
 複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させ、
 前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理方法。
32. 25.から31.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、
 前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理方法。
33. 32.に記載の情報処理方法において、
 前記情報処理装置が、
 前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
 さらに、抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる情報処理方法。
34. 33.に記載の情報処理方法において、
 前記情報処理装置が、
 前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理方法。
35. 25.から34.のいずれか一つに記載の情報処理方法において、
 前記情報処理装置が、さらに、
 前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させ、
 照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる、情報処理方法。
36. 25.から35.のいずれか一つに記載の情報処理方法において、
 複数の撮像部とネットワークを介して接続され、
 前記情報処理装置が、
 複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理方法。
37. コンピュータに、
 第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する手順、
 2以上の特徴情報を照合する手順、
 第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出する手順、
 前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する手順、
を実行させるためのプログラム。
38. 37.に記載のプログラムにおいて、
 前記第2画像は、前記第1画像とは異なる撮像部により生成されるプログラム。
39. 37.又は38.に記載のプログラムにおいて、
 前記第2画像は、前記第1画像より後に撮像された画像であるプログラム。
40. 37.から39.のいずれか一つに記載のプログラムにおいて、
 前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
41. 37.から40.のいずれか一つに記載のプログラムにおいて、
 前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記人領域特徴情報の照合処理のうち少なくともいずれか1つを、所定の事象を検知したことをトリガとして実施する手順をコンピュータに実行させるためのプログラム。
42. 37.から41.のいずれか一つに記載のプログラムにおいて、
 抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる手順、
 前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
43. 37.から42.のいずれか一つに記載のプログラムにおいて、
 複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる手順、
 前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
44. 37.から43.のいずれか一つに記載のプログラムにおいて、
 前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する手順をコンピュータに実行させるためのプログラム。
45. 44.に記載のプログラムにおいて、
 前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出する手順、
 抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる手順をコンピュータに実行させるためのプログラム。
46. 45.に記載のプログラムにおいて、
 前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる手順をコンピュータに実行させるためのプログラム。
47. 37.から46.のいずれか一つに記載のプログラムにおいて、
 前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる手順、
 照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる手順をコンピュータに実行させるためのプログラム。
48. 37.から47.のいずれか一つに記載のプログラムにおいて、
 複数の撮像部とネットワークを介して接続され、
 複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う手順をコンピュータに実行させるためのプログラム。

Claims (48)

  1.  第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出手段と、
     2以上の特徴情報を照合する照合手段と、を備え、
     前記抽出手段は、第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
     前記照合手段は、前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理装置。
  2.  請求項1に記載の情報処理装置において、
     前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理装置。
  3.  請求項1又は2に記載の情報処理装置において、
     前記第2画像は、前記第1画像より後に撮像された画像である情報処理装置。
  4.  請求項1から3のいずれか一項に記載の情報処理装置において、
     前記照合手段は、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理装置。
  5.  請求項1から4のいずれか一項に記載の情報処理装置において、
     前記抽出手段による前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記照合手段による前記人領域特徴情報の照合処理のうち少なくともいずれか1つは、所定の事象を検知したことをトリガとして実施される、情報処理装置。
  6.  請求項1から5のいずれか一項に記載の情報処理装置において、
     抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる登録手段をさらに備え、
     前記照合手段は、前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理装置。
  7.  請求項1から6のいずれか一項に記載の情報処理装置において、
     複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる登録手段をさらに備え、
     前記照合手段は、前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理装置。
  8.  請求項1から7のいずれか一項に記載の情報処理装置において、
     前記照合手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理装置。
  9.  請求項8に記載の情報処理装置において、
     前記抽出手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
     抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる登録手段をさらに備える情報処理装置。
  10.  請求項9に記載の情報処理装置において、
     前記登録手段は、前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理装置。
  11.  請求項1から10のいずれか一項に記載の情報処理装置において、
     前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる登録手段と、
     前記照合手段による照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる出力処理手段と、をさらに備える情報処理装置。
  12.  請求項1から11のいずれか一項に記載の情報処理装置において、
     複数の撮像部とネットワークを介して接続され、
     前記抽出手段は、複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理装置。
  13.  第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する抽出手段と、
     2以上の特徴情報を照合する照合手段と、を備え、
     前記抽出手段は、第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
     前記照合手段は、前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、
     情報処理システム。
  14.  請求項13に記載の情報処理システムにおいて、
     前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理システム。
  15.  請求項13又は14に記載の情報処理システムにおいて、
     前記第2画像は、前記第1画像より後に撮像された画像である情報処理システム。
  16.  請求項13から15のいずれか一項に記載の情報処理システムにおいて、
     前記照合手段は、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理システム。
  17.  請求項13から16のいずれか一項に記載の情報処理システムにおいて、
     前記抽出手段による前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記照合手段による前記人領域特徴情報の照合処理のうち少なくともいずれか1つは、所定の事象を検知したことをトリガとして実施される、情報処理システム。
  18.  請求項13から17のいずれか一項に記載の情報処理システムにおいて、
     抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる登録手段をさらに備え、
     前記照合手段は、前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理システム。
  19.  請求項13から18のいずれか一項に記載の情報処理システムにおいて、
     複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる登録手段をさらに備え、
     前記照合手段は、前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理システム。
  20.  請求項13から19のいずれか一項に記載の情報処理システムにおいて、
     前記照合手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理システム。
  21.  請求項20に記載の情報処理システムにおいて、
     前記抽出手段は、前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
     抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる登録手段をさらに備える情報処理システム。
  22.  請求項21に記載の情報処理システムにおいて、
     前記登録手段は、前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理システム。
  23.  請求項13から22のいずれか一項に記載の情報処理システムにおいて、
     前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる登録手段と、
     前記照合手段による照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる出力処理手段と、をさらに備える情報処理システム。
  24.  請求項13から23のいずれか一項に記載の情報処理システムにおいて、
     複数の撮像部とネットワークを介して接続され、
     前記抽出手段は、複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理システム。
  25.  情報処理装置が、
     第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出し、
     2以上の特徴情報を照合し、
     第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出し、
     前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、
    情報処理方法。
  26.  請求項25に記載の情報処理方法において、
     前記第2画像は、前記第1画像とは異なる撮像部により生成される情報処理方法。
  27.  請求項25又は26に記載の情報処理方法において、
     前記第2画像は、前記第1画像より後に撮像された画像である情報処理方法。
  28.  請求項25から27のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、
      前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する、情報処理方法。
  29.  請求項25から28のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、
     前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記人領域特徴情報の照合処理のうち少なくともいずれか1つを、所定の事象を検知したことをトリガとして実施する、情報処理方法。
  30.  請求項25から29のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させ、
     前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理方法。
  31.  請求項25から30のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させ、
     前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する情報処理方法。
  32.  請求項25から31のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、
     前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する、情報処理方法。
  33.  請求項32に記載の情報処理方法において、
     前記情報処理装置が、
     前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出し、
     さらに、抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる情報処理方法。
  34.  請求項33に記載の情報処理方法において、
     前記情報処理装置が、
     前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる、情報処理方法。
  35.  請求項25から34のいずれか一項に記載の情報処理方法において、
     前記情報処理装置が、さらに、
     前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させ、
     照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる、情報処理方法。
  36.  請求項25から35のいずれか一項に記載の情報処理方法において、
     複数の撮像部とネットワークを介して接続され、
     前記情報処理装置が、
     複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う情報処理方法。
  37.  コンピュータに、
     第1画像に含まれる人物の顔領域から第1の顔特徴情報を抽出し、前記人物の顔以外を含む領域から第1の人領域特徴情報を抽出する手順、
     2以上の特徴情報を照合する手順、
     第2画像に含まれる人物の顔領域から第2の顔特徴情報を抽出できなかった場合、前記第2画像に含まれる人物の顔以外を含む領域から第2の人領域特徴情報を抽出する手順、
     前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する手順、
    を実行させるためのプログラム。
  38.  請求項37に記載のプログラムにおいて、
     前記第2画像は、前記第1画像とは異なる撮像部により生成されるプログラム。
  39.  請求項37又は38に記載のプログラムにおいて、
     前記第2画像は、前記第1画像より後に撮像された画像であるプログラム。
  40.  請求項37から39のいずれか一項に記載のプログラムにおいて、
     前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できた場合は前記第1の顔特徴情報と前記第2の顔特徴情報とを照合し、前記第2画像に含まれる人物から前記第2の顔特徴情報を抽出できなかった場合は前記第1の人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
  41.  請求項37から40のいずれか一項に記載のプログラムにおいて、
     前記第1の顔特徴情報、前記第2の顔特徴情報、前記第1の人領域特徴情報、および前記第2の人領域特徴情報の抽出処理、ならびに、前記人領域特徴情報の照合処理のうち少なくともいずれか1つを、所定の事象を検知したことをトリガとして実施する手順をコンピュータに実行させるためのプログラム。
  42.  請求項37から41のいずれか一項に記載のプログラムにおいて、
     抽出した前記第1の人領域特徴情報を、当該第1の人領域特徴情報に対応する前記人領域を含む画像に関連付けて登録人領域特徴情報として記憶部に記憶させる手順、
     前記記憶部に記憶された前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
  43.  請求項37から42のいずれか一項に記載のプログラムにおいて、
     複数の前記第1画像を用いて複数の前記第1の人領域特徴情報を抽出し、前記複数の第1の人領域特徴情報を登録人領域特徴情報として互いに関連付けて記憶部に記憶させる手順、
     前記記憶部に記憶された少なくとも1つの前記登録人領域特徴情報と前記第2の人領域特徴情報とを照合する手順をコンピュータに実行させるためのプログラム。
  44.  請求項37から43のいずれか一項に記載のプログラムにおいて、
     前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と記憶部に記憶された第1顔情報とを照合し、当該照合結果が一致となった場合、前記第1画像に含まれる前記人物から前記第1の人領域特徴情報を抽出する手順をコンピュータに実行させるためのプログラム。
  45.  請求項44に記載のプログラムにおいて、
     前記第1画像に含まれる人物の顔領域から抽出された前記第1の顔特徴情報と前記記憶部に記憶された前記第1顔情報との照合結果が不一致となった場合、当該人物の顔領域以外を含む人領域から第3の人領域特徴情報を抽出する手順、
     抽出された前記第3の人領域特徴情報及び当該第1の顔特徴情報を互いに関連付けて第2の記憶部に記憶させる手順をコンピュータに実行させるためのプログラム。
  46.  請求項45に記載のプログラムにおいて、
     前記第1の顔特徴情報が抽出された前記顔領域の画像を前記第1の顔特徴情報および前記第3の人領域特徴情報と関連付けて前記第2の記憶部に記憶させる手順をコンピュータに実行させるためのプログラム。
  47.  請求項37から46のいずれか一項に記載のプログラムにおいて、
     前記第1画像に含まれる人物から抽出された前記第1の顔特徴情報と前記第1の人領域特徴情報とを前記人物の識別情報に対応付けて記憶部に記憶させる手順、
     照合結果が一致となった場合、前記記憶部が記憶する前記人物の識別情報を出力部に出力させる手順をコンピュータに実行させるためのプログラム。
  48.  請求項37から47のいずれか一項に記載のプログラムにおいて、
     複数の撮像部とネットワークを介して接続され、
     複数の撮像部から前記第2画像を取得し、取得した前記第2画像に対して抽出処理を行う手順をコンピュータに実行させるためのプログラム。
PCT/JP2018/045176 2018-12-07 2018-12-07 情報処理システム、情報処理装置、情報処理方法、およびプログラム WO2020115910A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2020558792A JP7020567B2 (ja) 2018-12-07 2018-12-07 情報処理システム、情報処理装置、情報処理方法、およびプログラム
US17/298,064 US20220122377A1 (en) 2018-12-07 2018-12-07 Information processing apparatus, information processing method, and program
PCT/JP2018/045176 WO2020115910A1 (ja) 2018-12-07 2018-12-07 情報処理システム、情報処理装置、情報処理方法、およびプログラム
EP18942553.1A EP3893193A4 (en) 2018-12-07 2018-12-07 INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM
JP2022014709A JP7298729B2 (ja) 2018-12-07 2022-02-02 情報処理システム、情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/045176 WO2020115910A1 (ja) 2018-12-07 2018-12-07 情報処理システム、情報処理装置、情報処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
WO2020115910A1 true WO2020115910A1 (ja) 2020-06-11

Family

ID=70974224

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/045176 WO2020115910A1 (ja) 2018-12-07 2018-12-07 情報処理システム、情報処理装置、情報処理方法、およびプログラム

Country Status (4)

Country Link
US (1) US20220122377A1 (ja)
EP (1) EP3893193A4 (ja)
JP (1) JP7020567B2 (ja)
WO (1) WO2020115910A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023281559A1 (ja) * 2021-07-05 2023-01-12 三菱電機株式会社 人物同定装置、及び人物同定方法
JP7435837B2 (ja) 2018-12-27 2024-02-21 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、およびプログラム
US11971952B2 (en) 2022-02-15 2024-04-30 Nec Corporation Information processing apparatus, information processing method, and program

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279540A (ja) * 2001-03-16 2002-09-27 Victor Co Of Japan Ltd 画像監視システム及びネットワークを用いた画像監視システム
JP2005086626A (ja) * 2003-09-10 2005-03-31 Matsushita Electric Ind Co Ltd 広域監視装置
WO2006013765A1 (ja) 2004-08-03 2006-02-09 Matsushita Electric Industrial Co., Ltd. 人物判定装置及び人物検索追跡装置
JP2006293912A (ja) 2005-04-14 2006-10-26 Toshiba Corp 情報表示システム、情報表示方法および携帯端末装置
JP2006301995A (ja) 2005-04-21 2006-11-02 Matsushita Electric Ind Co Ltd 人物検索装置及び人物検索方法
JP2009199322A (ja) * 2008-02-21 2009-09-03 Hitachi Kokusai Electric Inc 監視システム、人物検索方法
JP2010257451A (ja) 2009-03-31 2010-11-11 Sogo Keibi Hosho Co Ltd 人物検索装置、人物検索方法、及び人物検索プログラム
JP2013196423A (ja) * 2012-03-21 2013-09-30 Glory Ltd 監視システム、監視装置及び監視方法
JP2014149620A (ja) * 2013-01-31 2014-08-21 Secom Co Ltd 撮影システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6470503B2 (ja) * 2014-05-20 2019-02-13 キヤノン株式会社 画像照合装置、画像検索システム、画像照合方法、画像検索方法およびプログラム
JP6128468B2 (ja) * 2015-01-08 2017-05-17 パナソニックIpマネジメント株式会社 人物追尾システム及び人物追尾方法
JP6267380B1 (ja) * 2017-02-16 2018-01-24 株式会社リクルートホールディングス 順番管理システム、順番管理装置、およびプログラム
TWI604332B (zh) * 2017-03-24 2017-11-01 緯創資通股份有限公司 遠距離的身份辨識方法及其系統與電腦可讀取記錄媒體

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279540A (ja) * 2001-03-16 2002-09-27 Victor Co Of Japan Ltd 画像監視システム及びネットワークを用いた画像監視システム
JP2005086626A (ja) * 2003-09-10 2005-03-31 Matsushita Electric Ind Co Ltd 広域監視装置
WO2006013765A1 (ja) 2004-08-03 2006-02-09 Matsushita Electric Industrial Co., Ltd. 人物判定装置及び人物検索追跡装置
JP2006293912A (ja) 2005-04-14 2006-10-26 Toshiba Corp 情報表示システム、情報表示方法および携帯端末装置
JP2006301995A (ja) 2005-04-21 2006-11-02 Matsushita Electric Ind Co Ltd 人物検索装置及び人物検索方法
JP2009199322A (ja) * 2008-02-21 2009-09-03 Hitachi Kokusai Electric Inc 監視システム、人物検索方法
JP2010257451A (ja) 2009-03-31 2010-11-11 Sogo Keibi Hosho Co Ltd 人物検索装置、人物検索方法、及び人物検索プログラム
JP2013196423A (ja) * 2012-03-21 2013-09-30 Glory Ltd 監視システム、監視装置及び監視方法
JP2014149620A (ja) * 2013-01-31 2014-08-21 Secom Co Ltd 撮影システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3893193A4

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7435837B2 (ja) 2018-12-27 2024-02-21 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、およびプログラム
US11928181B2 (en) 2018-12-27 2024-03-12 Nec Corporation Information processing apparatus, information processing method, and program
US11934483B2 (en) 2018-12-27 2024-03-19 Nec Corporation Information processing apparatus, information processing method, and program
WO2023281559A1 (ja) * 2021-07-05 2023-01-12 三菱電機株式会社 人物同定装置、及び人物同定方法
US11971952B2 (en) 2022-02-15 2024-04-30 Nec Corporation Information processing apparatus, information processing method, and program

Also Published As

Publication number Publication date
EP3893193A1 (en) 2021-10-13
JP7020567B2 (ja) 2022-02-16
JPWO2020115910A1 (ja) 2021-10-28
US20220122377A1 (en) 2022-04-21
EP3893193A4 (en) 2021-12-22

Similar Documents

Publication Publication Date Title
JP7196932B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11704934B2 (en) Information processing apparatus, information processing method, and program
WO2020115910A1 (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP2024045460A (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP7298729B2 (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP7371806B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2021529404A (ja) 識別を容易にするための方法および装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18942553

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020558792

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018942553

Country of ref document: EP

Effective date: 20210707