WO2021070611A1 - 画像処理装置、および非一時的なコンピュータ可読媒体 - Google Patents

画像処理装置、および非一時的なコンピュータ可読媒体 Download PDF

Info

Publication number
WO2021070611A1
WO2021070611A1 PCT/JP2020/035796 JP2020035796W WO2021070611A1 WO 2021070611 A1 WO2021070611 A1 WO 2021070611A1 JP 2020035796 W JP2020035796 W JP 2020035796W WO 2021070611 A1 WO2021070611 A1 WO 2021070611A1
Authority
WO
WIPO (PCT)
Prior art keywords
feature point
person
body part
image
face
Prior art date
Application number
PCT/JP2020/035796
Other languages
English (en)
French (fr)
Inventor
久光 原田
靖典 塚原
基貴 梶田
忠 関原
絵里奈 北原
安利 深谷
Original Assignee
株式会社東海理化電機製作所
Necソリューションイノベータ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社東海理化電機製作所, Necソリューションイノベータ株式会社 filed Critical 株式会社東海理化電機製作所
Priority to US17/766,772 priority Critical patent/US20230034307A1/en
Priority to DE112020004823.3T priority patent/DE112020004823T5/de
Priority to CN202080066596.9A priority patent/CN114450723A/zh
Publication of WO2021070611A1 publication Critical patent/WO2021070611A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle

Definitions

  • the present disclosure relates to an image processing apparatus and a non-transitory computer-readable medium in which a computer program that can be executed by the processing unit of the image processing apparatus is stored.
  • the reception section that accepts image data corresponding to the image of a person, and Based on the image data, a processing unit that estimates a hidden body part that is blocked by a part of the person's body and is not reflected in the image, and a processing unit.
  • the processing unit Based on the image data, at least one first feature point corresponding to the characteristic part contained in the left limb of the person and at least one second feature corresponding to the characteristic part contained in the right limb of the person. Detect points and The hidden body part is estimated based on the distance between the first feature point and the second feature point.
  • One aspect of meeting the above requirements is a non-transitory computer-readable medium in which a computer program that can be executed by a processing unit of an image processing apparatus is stored.
  • the image processing device is subjected to Accept the image data corresponding to the image in which the person is reflected, Based on the image data, at least one first feature point corresponding to the characteristic part contained in the left limb of the person and at least one second feature corresponding to the characteristic part contained in the right limb of the person. Let the point be detected Based on the distance between the first feature point and the second feature point, a hidden body part that is blocked by a part of the body of the person and is not reflected in the image is estimated.
  • the person as the subject reflected in the image acquired by the image pickup device does not always face the front of the image pickup device.
  • the above image processing apparatus can be configured as follows.
  • the processing unit Based on the image data, the orientation of the person's face is estimated.
  • the hidden body part is estimated based on the distance and the orientation of the face.
  • the above computer-readable medium can be configured as follows.
  • the image processing device is subjected to Based on the image data, the orientation of the person's face is estimated.
  • the hidden body part is estimated based on the distance and the orientation of the face.
  • the above image processing apparatus can be configured as follows.
  • the processing unit Based on the image data, the orientation of the person's face is estimated.
  • a first region containing the at least one first feature point is generated and
  • a second region containing at least one second feature point is generated and
  • the hidden body part is estimated based on the multiplicity of the first region and the second region and the orientation of the face.
  • the above computer-readable medium can be configured as follows.
  • the image processing device is subjected to Based on the image data, the orientation of the person's face is estimated.
  • a first region containing the at least one first feature point is generated, and the first region is generated.
  • a second region containing at least one second feature point is generated to generate the second region.
  • the hidden body part is estimated based on the degree of overlap of the first region and the second region and the orientation of the face.
  • the orientation of the person's face is highly related to the direction in which the front of the person's torso faces. Therefore, according to the above processing, it is possible to improve the estimation accuracy of the hidden body part that may occur depending on the posture of the person as the subject.
  • the above image processing apparatus can be configured as follows.
  • the processing unit determines the orientation of the face.
  • the estimation result of the hidden body part obtained based on the above is adopted.
  • the above computer-readable medium can be configured as follows. When the estimation result of the hidden body part obtained based on the face orientation and the estimation result of the hidden body part obtained without being based on the face orientation are different, the estimation result was obtained based on the face orientation. The estimation result of the hidden body part is adopted.
  • the estimation result based on the orientation of the face which is relatively highly related to the orientation of the body of the person, is prioritized, so that the estimation accuracy of the hidden body part can be improved.
  • the above image processing apparatus can be configured as follows.
  • the processing unit estimates the twisting direction of the body of the person based on the image data, and estimates the hidden body portion based on the twisting direction of the body.
  • the above computer-readable medium can be configured as follows.
  • the image processing device is subjected to
  • the twisting direction of the person's body is estimated based on the image data.
  • the hidden body part is estimated based on the twisting direction of the body.
  • Hidden body parts may occur even when the person as the subject takes a posture accompanied by twisting of the body. According to the above-mentioned treatment, the hidden body part that may be caused by the twist of the body can be added to the estimation target.
  • the functional configuration of the image processing system is illustrated.
  • An example is shown in which the image processing system of FIG. 1 is mounted on a vehicle.
  • the skeleton model used by the image processing apparatus of FIG. 1 is illustrated.
  • An example in which the skeleton model of FIG. 3 is applied to a plurality of subjects is shown.
  • An example of a method of determining the center of the human body and an example of a method of determining the central region in the skeleton model of FIG. 3 are shown.
  • An example of a method of determining the center of the human body and an example of a method of determining the central region in the skeleton model of FIG. 3 are shown.
  • the flow of the process of applying the skeleton model of FIG. 3 to the subject is illustrated.
  • the flow of the process of applying the skeleton model of FIG. 3 to the subject is illustrated.
  • the flow of the process of applying the skeleton model of FIG. 3 to the subject is illustrated.
  • the flow of the process of applying the skeleton model of FIG. 3 to the subject is illustrated. It is a figure explaining the process of estimating the twist of the body of a person as a subject. It is a figure explaining the process of estimating the hidden body part of a person as a subject. It is a figure explaining the process of estimating the hidden body part of a person as a subject. It is a figure explaining the process of estimating the hidden body part of a person as a subject. It is a figure explaining the process of estimating the hidden body part of a person as a subject. It is a figure explaining the process of estimating the hidden body part of a person as a subject.
  • FIG. 1 illustrates the functional configuration of the image processing system 10 according to the embodiment.
  • the image processing system 10 includes an image pickup device 11 and an image processing device 12.
  • the imaging device 11 is a device that acquires an image of a predetermined imaging region. Examples of the image pickup device 11 include a camera and an image sensor. The image pickup apparatus 11 is configured to output the image data DI corresponding to the acquired image.
  • the image data DI may be analog data or digital data.
  • the image processing device 12 includes a reception unit 121, a processing unit 122, and an output unit 123.
  • the reception unit 121 is configured as an interface for receiving image data DI.
  • the reception unit 121 includes an appropriate conversion circuit including an A / D converter.
  • the processing unit 122 processes the image data DI, which is a form of digital data. The details of the processing performed by the processing unit 122 will be described later.
  • the processing unit 122 allows the output of the control data DC from the output unit 123 based on the result of the processing.
  • the control data DC is data that controls the operation of various controlled devices.
  • the control data DC may be digital data or analog data.
  • the output unit 123 includes an appropriate conversion circuit including a D / A converter.
  • the image processing system 10 can be mounted on the vehicle 20, for example, as shown in FIG.
  • examples of the controlled device whose operation is controlled by the control data DC include a door opening / closing device, a door locking device, an air conditioning device, a lighting device, an audiovisual equipment, and the like in the vehicle 20.
  • the image pickup device 11 is arranged at an appropriate position in the vehicle 20 according to a desired image pickup region.
  • the image processing device 12 is arranged at an appropriate position in the vehicle 20.
  • the image pickup apparatus 11 is arranged on the right side of the vehicle 20, and the image pickup region A is defined on the right side of the vehicle 20. In other words, the image pickup apparatus 11 has acquired the image of the image pickup region A.
  • Various subjects 30 can enter the imaging area A.
  • the subject 30 enters the imaging region A, the subject 30 is reflected in the image acquired by the imaging device 11.
  • the subject 30 reflected in the image is reflected in the image data DI.
  • the image processing system 10 has a function of estimating the skeleton of the person when the subject 30 is a person.
  • the processing unit 122 is configured to perform a process of applying the skeleton model to the subject 30 reflected in the image acquired by the image pickup device 11 on the image data DI.
  • the skeletal model M illustrated in FIG. 3 is adopted.
  • the skeletal model M includes a central region CA that includes a central feature point C that corresponds to the center of the model human body.
  • the skeletal model M includes an upper left limb group LU, an upper right limb group RU, a left lower limb group LL, and a right lower limb group RL.
  • the left upper limb group LU includes a plurality of feature points corresponding to a plurality of characteristic parts in the upper left limb of the model human body.
  • the left upper limb group LU includes a left shoulder feature point LU1, a left elbow feature point LU2, and a left wrist feature point LU3.
  • the left shoulder feature point LU1 is a point corresponding to the left shoulder of the model human body.
  • the left elbow feature point LU2 is a point corresponding to the left elbow of the model human body.
  • the left wrist feature point LU3 is a point corresponding to the left wrist of the model human body.
  • the right upper limb group RU contains a plurality of feature points corresponding to a plurality of characteristic parts in the upper right limb of the model human body.
  • the right upper limb group RU includes a right shoulder feature point RU1, a right elbow feature point RU2, and a right wrist feature point RU3.
  • the right shoulder feature point RU1 is a point corresponding to the right shoulder of the model human body.
  • the right elbow feature point RU2 is a point corresponding to the right elbow of the model human body.
  • the right wrist feature point RU3 is a point corresponding to the right wrist of the model human body.
  • the left lower limb group LL contains a plurality of feature points corresponding to a plurality of characteristic parts in the left lower limb of the model human body.
  • the left lower limb group LL includes a left hip feature point LL1, a left knee feature point LL2, and a left ankle feature point LL3.
  • the left waist feature point LL1 is a point corresponding to the left part of the waist of the model human body.
  • the left knee feature point LL2 is a point corresponding to the left knee of the model human body.
  • the left ankle feature point LL3 is a point corresponding to the left ankle of the model human body.
  • the right lower limb group RL contains a plurality of feature points corresponding to a plurality of characteristic parts in the right lower limb of the model human body.
  • the right lower limb group RL includes a right hip feature point RL1, a right knee feature point RL2, and a right ankle feature point RL3.
  • the right waist feature point RL1 is a point corresponding to the right part of the waist of the model human body.
  • the right knee feature point RL2 is a point corresponding to the right knee of the model human body.
  • the right ankle feature point RL3 is a point corresponding to the right ankle of the model human body.
  • the upper left limb group LU is connected to the central region CA via the upper left skeletal line LUS.
  • the right upper limb group RU is connected to the central region CA via the upper right skeletal line RUS.
  • the left lower limb group LL is connected to the central region CA via the left lower skeletal line LLS.
  • the right lower limb group RL is connected to the central region CA via the right lower skeletal line RLS. That is, in the skeleton model M, a plurality of feature points corresponding to the limbs of the model human body are connected to the central feature point C of the model human body.
  • the skeleton model M includes a facial feature point F and a neck feature point NK.
  • the facial feature point F is a point corresponding to the face of the model human body.
  • the neck feature point NK is a point corresponding to the neck of the model human body.
  • the facial feature point F, the left upper limb group LU, and the right upper limb group RU are connected to the central region CA via the neck feature point NK.
  • the facial feature point F can be replaced by the head feature point H.
  • the head feature point H is a point corresponding to the center of the head of the model human body.
  • process for applying a skeleton model detects a plurality of feature points defined in the skeleton model in a subject reflected in an image acquired by the image pickup apparatus 11, and the plurality of feature points specified in the skeleton model. It means that the feature points are connected by a plurality of skeleton connecting lines specified in the skeleton model.
  • FIG. 4 shows an example in which the skeleton model M is applied to a plurality of persons 31 and 32 as the subject 30 reflected in the image I acquired by the image pickup apparatus 11.
  • the position of the central feature point C of the model human body is determined based on the positions of a plurality of feature points corresponding to the limbs of the model human body. Specifically, the position of the central feature point C can be determined by the following procedure.
  • the dimension X1 corresponding to the distance along the X direction between the left shoulder feature point LU1 and the right shoulder feature point RU1.
  • a long side having a dimension Y1 corresponding to the distance along the Y direction between the left shoulder feature point LU1 and the left waist feature point LL1 (or between the right shoulder feature point RU1 and the right waist feature point RL1).
  • the rectangle R formed by is set.
  • the position of the central feature point C can be determined based on a plurality of feature points corresponding to the limbs that are relatively easy to detect.
  • the skeleton model M capable of improving the discrimination accuracy as described above, it is not necessary to detect the position of the central feature point C as a feature point. Therefore, it is possible to improve the discrimination accuracy of the subject 30 while suppressing an increase in the processing load of the image processing device 12.
  • the straight line extending in the Y direction used to determine the position of the central feature point C does not necessarily have to pass through the midpoint of the short side of the rectangle R.
  • the straight line extending in the X direction used to determine the position of the central feature point C does not necessarily have to pass through the midpoint of the long side of the rectangle R.
  • the point at which these straight lines intersect the short and long sides of the rectangle R can be changed as appropriate.
  • the neck feature point NK can also be determined based on the positions of the plurality of feature points corresponding to the limbs.
  • the neck feature point NK can be defined as the midpoint of a straight line connecting the left shoulder feature point LU1 and the right shoulder feature point RU1. That is, when applying the skeleton model M, it is not necessary to detect the neck feature point NK. This also makes it possible to suppress an increase in the processing load of the image processing apparatus 12.
  • the central feature point C can be defined without using the rectangle R shown in FIG.
  • a quadrangle Q having the left shoulder feature point LU1, the right shoulder feature point RU1, the left hip feature point LL1, and the right hip feature point RL1 as vertices is set. Subsequently, the center of gravity of the quadrangle Q is determined as the position of the central feature point C.
  • the restriction on the posture of the subject 30 in determining the central feature point C can be relaxed.
  • the size of the central region CA of the model human body is determined based on the distance between a plurality of feature points corresponding to the limbs of the model human body.
  • the central region CA has a rectangular shape.
  • the dimension X2 of the short side of the central region CA is half of the dimension X1 of the short side of the rectangle R.
  • the dimension Y2 of the long side of the central region CA is half of the dimension Y1 of the long side of the rectangle R.
  • the ratio of the dimension X2 to the dimension X1 and the ratio of the dimension Y2 to the dimension Y1 can be individually and appropriately determined.
  • the central feature point C defined as described above is located inside the body of the person as the subject 30 reflected in the image I.
  • the central region CA has an area that reflects the actual spread of the body of the person as the subject 30.
  • the actual torso since the actual torso has an expanse, depending on the posture of the person as the subject 30, there may be a hidden body part that is blocked by the torso and is not reflected in the image I. Based on the positional relationship between the detected feature points and the central region CA, the estimation accuracy of such hidden body parts can be improved.
  • the central region CA of the human body does not necessarily have to be rectangular.
  • the central region CA has an elliptical shape.
  • the dimension X2 along the X direction and the dimension Y2 along the Y direction of the elliptical shape can be appropriately determined based on the size of the previously determined quadrangle Q (or the rectangle R exemplified in FIG. 5). ..
  • the number of body parts and feature points corresponding to the feature points included in the upper left limb group LU can be appropriately determined.
  • a feature point that serves as a reference for determining the central feature point C and the central region CA can also be appropriately determined.
  • the left upper limb group LU includes the left shoulder feature point LU1. This is because the left shoulder feature point LU1 is a feature point that can be detected with relatively high stability regardless of the state of the upper left limb. For the same reason, it is preferable that the left shoulder feature point LU1 is used as a reference for determining the central feature point C and the central region CA.
  • the number of body parts and feature points corresponding to the feature points included in the upper right limb group RU can be appropriately determined.
  • a feature point that serves as a reference for determining the central feature point C and the central region CA can also be appropriately determined.
  • the right upper limb group RU preferably includes the right shoulder feature point RU1. This is because the right shoulder feature point RU1 is a feature point that can be detected with relatively high stability regardless of the state of the right upper limb. For the same reason, it is preferable that the right shoulder feature point RU1 is used as a reference for determining the central feature point C and the central region CA.
  • the number of body parts and feature points corresponding to the feature points included in the left lower limb group LL can be appropriately determined.
  • a feature point that serves as a reference for determining the central feature point C and the central region CA can also be appropriately determined.
  • the left lower limb group LL includes the left hip feature point LL1. This is because the left hip feature point LL1 is a feature point that can be detected with relatively high stability regardless of the state of the left lower limb. For the same reason, it is preferable that the left hip feature point LL1 is used as a reference for determining the central feature point C and the central region CA.
  • the number of body parts and feature points corresponding to the feature points included in the right lower limb group RL can be appropriately determined.
  • a feature point that serves as a reference for determining the central feature point C and the central region CA can also be appropriately determined.
  • the right lower limb group RL includes the right hip feature point RL1. This is because the right hip feature point RL1 is a feature point that can be detected with relatively high stability regardless of the state of the right lower limb. For the same reason, it is preferable that the right hip feature point RL1 is used as a reference for determining the central feature point C and the central region CA.
  • the processing unit 122 of the image processing device 12 executes a process of detecting an object having a high likelihood of being a person included in the image I based on the image data DI received by the receiving unit 121. Since the processing can be appropriately performed using a well-known method, detailed description thereof will be omitted.
  • the frame F0 in FIG. 7 represents a region in the image I that includes an object with a high likelihood of being a person.
  • the processing unit 122 detects a plurality of actual feature points based on the assumption that the subject 30 is a person. Since the process of detecting a plurality of actual feature points corresponding to a plurality of characteristic body parts from the subject 30 reflected in the image I can be appropriately performed by using a well-known method, detailed description thereof will be omitted.
  • left ankle feature point LL3, right waist feature point RL1, right knee feature point RL2, right ankle feature point RL3, left eye feature point LY, right eye feature point RY, nose feature point NS, mouth feature point MS , Left ear feature point LA, and right ear feature point RA have been detected.
  • the left eye feature point LY is a feature point corresponding to the left eye of the human body.
  • the right eye feature point RY is a feature point corresponding to the right eye of the human body.
  • the nose feature point NS is a feature point corresponding to the nose of the human body.
  • Mouth feature points MS are feature points corresponding to the mouth of the human body.
  • the left ear feature point LA is a feature point corresponding to the left ear of the human body.
  • the right ear feature point RA is a feature point corresponding to the right ear of the human body.
  • the processing unit 122 classifies the detected plurality of actual feature points into a plurality of groups defined in the skeleton model M.
  • a plurality of groups are formed so as to include a predetermined actual feature point.
  • the left upper limb group LU is formed so as to include the left shoulder feature point LU1, the left elbow feature point LU2, and the left wrist feature point LU3.
  • the right upper limb group RU is formed to include the right shoulder feature point RU1, the right elbow feature point RU2, and the right wrist feature point RU3.
  • the left lower limb group LL is formed to include the left hip feature point LL1, the left knee feature point LL2, and the left ankle feature point LL3.
  • the right lower limb group RL is formed to include the right hip feature point RL1, the right knee feature point RL2, and the right ankle feature point RL3.
  • processing unit 122 performs a process of connecting a plurality of actual feature points included in each group with a skeleton line.
  • the face feature point F is defined based on the left eye feature point LY, the right eye feature point RY, the nose feature point NS, the mouth feature point MS, the left ear feature point LA, and the right ear feature point RA.
  • the head feature point H may be defined.
  • the facial feature point F can provide information related to the position and orientation of the face.
  • the head feature point H can represent an estimated position of the central part of the head.
  • the processing unit 122 performs a process of determining the central feature point C.
  • the rectangle R described with reference to FIG. 5 is used.
  • the processing unit 122 performs processing for determining the neck feature point NK.
  • the midpoint of the straight line connecting the left shoulder feature point LU1 and the right shoulder feature point RU1 is defined as the neck feature point NK.
  • the processing unit 122 performs a process of determining the central region CA.
  • the method described with reference to FIG. 5 is used.
  • the processing unit 122 performs processing for connecting each of the central feature point C and the plurality of groups corresponding to the limbs with a skeleton line.
  • the left shoulder feature point LU1 and the right shoulder feature point RU1 are connected to the central feature point C via the neck feature point NK.
  • Each of the left hip feature point LL1 and the right hip feature point RL1 is directly connected to the central feature point C.
  • At least one of the face feature point F and the head feature point H is connected to the neck feature point NK.
  • the processing unit 122 can determine that the skeleton model M does not fit the subject 30.
  • the threshold ratio can be set as appropriate. That is, the processing unit 122 can determine whether the subject 30 is a person based on whether the skeleton model M fits into the plurality of actual feature points.
  • the person as the subject 30 reflected in the image I acquired by the image pickup device 11 does not always face the front with respect to the image pickup device 11.
  • the processing unit 122 of the image processing device 12 is configured to estimate the presence or absence of twisting of the body of the person reflected in the image I based on the image data DI received by the reception unit 121.
  • the processing unit 122 has a distance D1 along the X direction of the right shoulder feature point RU1 and the face feature point F, and the X direction of the left shoulder feature point LU1 and the face feature point F. Acquires the distance D2 along.
  • the right shoulder feature point RU1 is an example of the first feature point.
  • the left shoulder feature point LU1 is an example of the second feature point.
  • the facial feature point F is an example of the third feature point.
  • the distance D1 is an example of the first value.
  • the distance D2 is an example of the second value.
  • the processing unit 122 estimates whether or not the body of the person reflected in the image I is twisted based on the ratio of the distance D1 and the distance D2. Specifically, when the difference between the ratio and 1 exceeds the threshold value, it is estimated that the body is twisted.
  • the left shoulder feature point LU1 and the right shoulder feature point RU1 are located symmetrically with respect to the face feature point F in the left-right direction (X direction). There is a high probability that it will be there. Therefore, the ratio of the distance D1 and the distance D2 approaches 1. In other words, the farther the ratio is from 1, the more likely it is that the front of the face and the front of the upper body are facing different directions.
  • the distance D1'between the right shoulder feature point RU1 and the face feature point F and the distance between the left shoulder feature point LU1 and the face feature point F D2' may be obtained and the ratio of these values may be determined directly.
  • the distance D1' is an example of the first value
  • the distance D2' is an example of the second value.
  • the feature points for which the distance to the face feature point F is acquired are not limited to the left shoulder feature point LU1 and the right shoulder feature point RU1. Any point corresponding to the characteristic portion included in the upper left limb of the person as the subject 30 can be adopted as the first characteristic point. Similarly, any point corresponding to the characteristic portion included in the upper right limb of the person as the subject 30 can be adopted as the second characteristic point. However, two points such as the left elbow feature point LU2 and the right elbow feature point RU2 are located symmetrically with respect to the face feature point F when the person as the subject 30 faces the front of the image pickup device 11. Must be chosen.
  • Adopting RU1 as the first feature point and the second feature point is advantageous in accurately estimating the presence or absence of twisting of the face and upper body.
  • a feature point other than the face feature point F can be adopted as the third feature point as long as it corresponds to the characteristic part included in the face of the person as the subject 30.
  • the nose feature point NS and the mouth feature point MS when the person as the subject 30 faces the front with respect to the image pickup apparatus 11, there is a symmetrical relationship between the first feature point and the second feature point. It is necessary to select the points that hold.
  • the processing unit 122 can estimate the twisting direction of the body of the person as the subject 30 based on the magnitude relationship of the ratio of the distance D1 and the distance D2 to 1.
  • the processing unit 122 when the ratio is larger than 1 (when D1 is larger than D2), the processing unit 122 states that the face is twisted to the left with respect to the upper body. presume. If the ratio is less than 1 (D2 is greater than D1), the processing unit 122 presumes that the face is twisted to the right with respect to the upper body.
  • the processing unit 122 acquires a value corresponding to the shoulder width of the person as the subject 30.
  • the distance D3 along the X direction between the left shoulder feature point LU1 and the right shoulder feature point RU1 is acquired as a value corresponding to the shoulder width.
  • the processing unit 122 acquires the distance D4 along the X direction between the left hip feature point LL1 and the right hip feature point RL1.
  • the left hip feature point LL1 is an example of the first feature point.
  • the right hip feature point RL1 is an example of the second feature point.
  • the distance D3 is an example of the first value.
  • the distance D4 is an example of the second value.
  • the processing unit 122 estimates whether or not the body of the person reflected in the image I is twisted based on the ratio of the distance D3 and the distance D4. Specifically, when the ratio of the distance D3 to the distance D4 does not fall within a predetermined threshold range, it is estimated that the body is twisted.
  • the threshold range is set as a value of 1 or more and 2 or less.
  • the distance D3 corresponding to the shoulder width may be less than the distance D4 corresponding to the waist width.
  • the distance D3 corresponding to the shoulder width may greatly exceed the distance D4 corresponding to the waist width. That is, when the ratio does not fall within the above threshold range, it is highly probable that the front of the upper body and the front of the lower body are facing different directions.
  • the distance D3' between the left shoulder feature point LU1 and the right shoulder feature point RU1 and between the left hip feature point LL1 and the right hip feature point RL1.
  • Distance D4' is obtained, and the ratio of these values may be obtained directly.
  • the distance D3' is an example of the first value
  • the distance D4' is an example of the second value.
  • the feature points used for comparison with the shoulder width are not limited to the left hip feature point LL1 and the right hip feature point RL1. Any point corresponding to the characteristic portion included in the left lower limb of the person as the subject 30 can be adopted as the first characteristic point. Similarly, any point corresponding to the characteristic portion included in the right lower limb of the person as the subject 30 can be adopted as the second characteristic point. However, two points such as the left knee feature point LL2 and the right knee feature point RL2, which are located symmetrically with respect to the central axis of the body when the person as the subject 30 faces the front with respect to the imaging device 11. Must be chosen.
  • the left hip feature point LL1 and the position of the right hip feature point RL1 are relatively stable regardless of the state of both lower limbs. It is advantageous to adopt it as the second feature point in order to accurately estimate the presence or absence of twisting of the upper body and the lower body.
  • the person as the subject 30 reflected in the image I acquired by the image pickup device 11 does not always face the front with respect to the image pickup device 11.
  • the upper right limb and the right part of the waist of the person as the subject 30 are not reflected in the image I, and the right shoulder feature point RU1, the right elbow feature point RU2, and the right wrist feature point RU3, And the right hip feature point RL1 is not detected.
  • Accurate recognition of hidden body parts is also important when estimating a person's posture through the application of a skeletal model.
  • a technique for detecting a plurality of feature points constituting a skeletal model using deep learning or the like has become widespread. Based on this technology, it is a non-hidden part that is actually blocked by a part of the body and is not reflected in the image, but is reflected in the image without being blocked by a part of the body. Feature points may be detected as if they were body parts. In the image I illustrated in FIG. 13, the right shoulder feature point RU1, the right elbow feature point RU2, the right wrist feature point RU3, and the right hip feature point RL1 in the person as the subject 30 are detected.
  • the processing unit 122 of the image processing device 12 is configured to estimate the hidden body part of the person reflected in the image I based on the image data DI received by the reception unit 121.
  • the processing unit 122 acquires the distance between the feature points included in the left limb and the feature points included in the right limb of the person as the subject 30. For example, the distance along the X direction between the left shoulder feature point LU1 and the right shoulder feature point RU1 is acquired. When the distance is smaller than the threshold value, the processing unit 122 executes a process for estimating the hidden body part.
  • the threshold value is set as an appropriate value smaller than the distance between the left shoulder feature point LU1 and the right shoulder feature point RU1 when the person is facing the front of the imaging device 11.
  • the left shoulder feature point LU1 is an example of the first feature point.
  • the right shoulder feature point RU1 is an example of the second feature point.
  • the distance between the feature points included in the left limb and the feature points included in the right limb is generally shorter than that in the case where the body of the person is facing the front with respect to the imaging device 11. is there. Therefore, when the distance along the X direction between the left shoulder feature point LU1 and the right shoulder feature point RU1 is smaller than the threshold value, it is probable that one of the left shoulder feature point LU1 and the right shoulder feature point RU1 is included in the hidden body part. high.
  • Likelihood is an index showing the certainty of detection. Since the likelihood can be appropriately obtained by using a well-known method, detailed description thereof will be omitted.
  • the processing unit 122 When the distance along the X direction between the left shoulder feature point LU1 and the right shoulder feature point RU1 is smaller than the threshold value, the processing unit 122 is assigned the likelihood given to the left shoulder feature point LU1 and the right shoulder feature point RU1. The likelihoods are compared and it is presumed that the hidden body part contains feature points with a smaller likelihood. In the example shown in FIG. 13, the likelihood given to the left shoulder feature point LU1 is 220, and the likelihood given to the right shoulder feature point RU1 is 205. Therefore, the processing unit 122 estimates that the right shoulder feature point RU1 is included in the hidden body part.
  • the distance between other feature points contained in the upper left limb and other feature points contained in the upper right limb can be obtained.
  • the distance between the feature points located symmetrically with respect to the central axis of the human body is acquired.
  • at least one of the distance between the left elbow feature point LU2 and the right elbow feature point RU2 and the distance between the left wrist feature point LU3 and the right wrist feature point RU3 is acquired.
  • Each of the left elbow feature point LU2 and the left wrist feature point LU3 is an example of the first feature point.
  • Each of the right elbow feature point RU2 and the right wrist feature point RU3 is an example of the second feature point.
  • the likelihood given to the left elbow feature point LU2 is 220, and the likelihood given to the right elbow feature point RU2 is 200. Therefore, the processing unit 122 estimates that the right elbow feature point RU2 is included in the hidden body part.
  • the likelihood given to the left wrist feature point LU3 is 220, and the likelihood given to the right wrist feature point RU3 is 210. Therefore, the processing unit 122 estimates that the right wrist feature point RU3 is included in the hidden body part.
  • the processing unit 122 states that other feature points belonging to the same group are also included in the hidden body part. You may estimate. For example, when it is estimated that the right shoulder feature point RU1 is included in the hidden body part among the right shoulder feature point RU1, the right elbow feature point RU2, and the right wrist feature point RU3 belonging to the right upper limb group RU, processing is performed. Part 122 can presume that the right elbow feature point RU2 and the right wrist feature point RU3 are also included in the hidden body part. In this case, it is preferable that the left shoulder feature point LU1 and the right shoulder feature point RU1 are used as references. This is because the distance between these feature points reflects the frontal orientation of the torso with relatively high stability, regardless of the condition of the upper limbs.
  • the processing unit 122 performs a process of connecting the plurality of feature points with a plurality of skeleton lines.
  • the plurality of skeletal lines include a hidden skeletal line corresponding to a hidden body part and a non-hidden skeletal line corresponding to a non-hidden body part.
  • the hidden skeleton line is shown by a broken line
  • the non-hidden skeleton line is shown by a solid line.
  • the right shoulder feature point RU1 and the right elbow feature point RU2, both of which are presumed to correspond to the hidden body part, are connected by a hidden skeleton line.
  • the upper right arm is presumed to be a hidden body part.
  • the right elbow feature point RU2 and the right wrist feature point RU3, both presumed to correspond to the hidden body part, are connected by a hidden skeleton line.
  • the right lower arm is presumed to be a hidden body part.
  • each of the left hip feature point LL1, the left knee feature point LL2, and the left ankle feature point LL3 can be an example of the first feature point.
  • each of the right hip feature point RL1, the right knee feature point RL2, and the right ankle feature point RL3 can be an example of the second feature point.
  • FIG. 15 shows another example of processing that the processing unit 122 can perform in order to estimate the hidden body part of the person reflected in the image I.
  • the processing unit 122 estimates the orientation of the person's face as the subject 30.
  • the estimation can be made based on, for example, the position of the facial feature point F.
  • the processing unit 122 generates a frame F1 corresponding to the upper left limb group LU and a frame F2 corresponding to the upper right limb group RU.
  • the frame F1 is generated to include the left shoulder feature point LU1, the left elbow feature point LU2, and the left wrist feature point LU3.
  • the frame F1 is an example of the first region.
  • the frame F2 is generated to include the right shoulder feature point RU1, the right elbow feature point RU2, and the right wrist feature point RU3.
  • the frame F2 is an example of the second region.
  • the upper end edge of the frame F1 is defined so as to overlap the uppermost feature point among the plurality of feature points included in the upper left limb group LU.
  • the lower end edge of the frame F1 is defined so as to overlap the lowermost feature point among the plurality of feature points included in the upper left limb group LU.
  • the left end edge of the frame F1 is defined so as to overlap with the feature point located on the leftmost side among the plurality of feature points included in the upper left limb group LU.
  • the right end edge of the frame F1 is defined so as to overlap the feature point located on the rightmost side among the plurality of feature points included in the upper left limb group LU.
  • the upper end edge of the frame F2 is defined so as to overlap the uppermost feature point among the plurality of feature points included in the upper right limb group RU.
  • the lower end edge of the frame F2 is defined so as to overlap the lowermost feature point among the plurality of feature points included in the upper right limb group RU.
  • the left edge of the frame F2 is defined so as to overlap the leftmost feature point among the plurality of feature points included in the upper right limb group RU.
  • the right end edge of the frame F2 is defined so as to overlap the feature point located on the rightmost side among the plurality of feature points included in the upper right limb group RU.
  • the processing unit 122 acquires the degree of overlap between the frame F1 and the frame F2.
  • the degree of overlap can be calculated as the ratio of the area of the portion where the frame F1 and the frame F2 overlap to the smaller area of the frame F1 and the frame F2.
  • the processing unit 122 executes a process for estimating the hidden body part.
  • the distance between the feature points included in the left limb and the feature points included in the right limb is generally shorter than that in the case where the body of the person is facing the front with respect to the imaging device 11. is there.
  • the frame F1 and the frame F2 tend to overlap. Therefore, when the overlap rate of the frame F1 and the frame F2 is larger than the threshold value, it is highly probable that one of the upper left limb group LU corresponding to the frame F1 and the upper right limb group RU corresponding to the frame F2 corresponds to the hidden body part. ..
  • the processing unit 122 refers to the previously estimated face orientation, and either the upper left limb group LU or the upper right limb group RU corresponds to the hidden body part. Estimate if it is.
  • the processing unit 122 estimates that the right upper limb group RU corresponds to the hidden body part.
  • the right shoulder feature point RU1 the right elbow feature point RU2, and the right wrist feature point RU3 included in the right upper limb group RU are included in the hidden body part.
  • These feature points are connected by a hidden skeleton line.
  • the processing unit 122 presumes that the upper left limb group LU corresponds to the hidden body part.
  • the orientation of the person's face is highly related to the direction in which the front of the person's torso faces. Therefore, according to the above processing, it is possible to improve the estimation accuracy of the hidden body portion that may occur depending on the posture of the person as the subject 30. At this time, the reference of the likelihood given to each feature point is not essential.
  • the above processing related to the estimation of the hidden body part does not necessarily have to be based on the multiplicity of the frame F1 and the frame F2.
  • the hidden body part may be estimated with reference to the orientation of the face.
  • a midpoint along the X direction of the frame F1 and a midpoint along the X direction of the frame F2 can be adopted as representative points.
  • the distance between the representative point in the frame F1 and the representative point in the frame F2 can be an example of the distance between the first feature point and the second feature point.
  • left hip feature point LL1 left knee feature point LL2, and left ankle feature point LL3 belonging to the left lower limb group LL
  • right hip feature point RL1 right belonging to the right lower limb group RL.
  • the same can be applied to the knee feature point RL2 and the right ankle feature point RL3.
  • the processing unit 122 generates a frame F3 corresponding to the left lower limb group LL and a frame F4 corresponding to the right lower limb group RL.
  • the frame F3 is generated to include the left hip feature point LL1, the left knee feature point LL2, and the left ankle feature point LL3.
  • the frame F3 is an example of the first region.
  • the frame F4 is generated to include the right hip feature point RL1, the right knee feature point RL2, and the right ankle feature point RL3.
  • the frame F4 is an example of the second region.
  • the upper end edge of the frame F3 is defined so as to overlap the uppermost feature point among the plurality of feature points included in the left lower limb group LL.
  • the lower end edge of the frame F3 is defined so as to overlap the lowermost feature point among the plurality of feature points included in the left lower limb group LL.
  • the left end edge of the frame F3 is defined so as to overlap the leftmost feature point among the plurality of feature points included in the left lower limb group LL.
  • the right end edge of the frame F3 is defined so as to overlap the feature point located on the rightmost side among the plurality of feature points included in the left lower limb group LL.
  • the upper end edge of the frame F4 is defined so as to overlap the uppermost feature point among the plurality of feature points included in the right lower limb group RL.
  • the lower end edge of the frame F4 is defined so as to overlap the lowermost feature point among the plurality of feature points included in the right lower limb group RL.
  • the left edge of the frame F4 is defined so as to overlap the leftmost feature point among the plurality of feature points included in the right lower limb group RL.
  • the right end edge of the frame F4 is defined so as to overlap the feature point located on the rightmost side among the plurality of feature points included in the right lower limb group RL.
  • the processing unit 122 acquires the degree of overlap between the frame F3 and the frame F4.
  • the degree of overlap can be calculated as the ratio of the area of the portion where the frame F3 and the frame F4 overlap to the smaller area of the frame F3 and the frame F4.
  • the processing unit 122 executes a process for estimating the hidden body part.
  • the processing unit 122 refers to the previously estimated face orientation, and either the left lower limb group LL or the right lower limb group RL corresponds to the hidden body part. Estimate if it is.
  • the processing unit 122 estimates that the right lower limb group RL corresponds to the hidden body part. If it is presumed that the face is facing to the right, the processing unit 122 presumes that the left lower limb group LL corresponds to the hidden body part.
  • the above processing related to the estimation of the hidden body part does not necessarily have to be based on the multiplicity of the frame F3 and the frame F4.
  • the hidden body part may be estimated with reference to the orientation of the face.
  • a midpoint along the X direction of the frame F3 and a midpoint along the X direction of the frame F4 can be adopted as representative points.
  • the distance between the representative point in the frame F3 and the representative point in the frame F4 can be an example of the distance between the first feature point and the second feature point.
  • the processing unit 122 may execute both the process described with reference to FIG. 13 and the process described with reference to FIG. 15, and compare the estimation results obtained by both processes. When both results are different, the processing unit 122 adopts the estimation result by the processing based on the orientation of the face.
  • the right hip feature point RL1 is not detected.
  • the distance between the left hip feature point LL1 and the right hip feature point RL1 is below the threshold value, and the right hip feature point RL1 to which a lower likelihood is given is a hidden body. It can be presumed to correspond to the site.
  • the frame F3 corresponding to the left lower limb group LL and the frame F4 corresponding to the right lower limb group RL have a low degree of overlap. Therefore, the right hip feature point RL1, the right knee feature point RL2, and the right ankle feature point RL3 included in the right lower limb group RL are presumed to be non-hidden body parts, and as illustrated in FIG. 14, the non-hidden skeletal line. Connected by. In this case, the right hip feature point RL1 is presumed to correspond to a non-hidden body part.
  • the right hip feature point RL1 is presumed to be a hidden body part.
  • the estimation result based on the orientation of the face which is relatively highly related to the orientation of the body of the person, is prioritized, so that the estimation accuracy of the hidden body part can be improved.
  • the process of estimating the twisting direction of the body described with reference to FIG. 11 can be used to estimate the hidden body part. As illustrated in FIG. 16, if the body is twisted so that the anterior direction of the face and the anterior direction of the torso are relatively large, hidden body parts may occur.
  • the processing unit 122 estimates that the upper limbs in the direction opposite to the twisting direction correspond to the hidden body part. In this example, it is estimated that the upper right limb of the person as the subject 30 corresponds to the hidden body part.
  • the hidden body part may not be correctly estimated by the process described with reference to FIG. 13 or the process described with reference to FIG. .. This is because the direction of the front surface of the torso is relatively close to the front surface with respect to the imaging device 11, and the distance between the feature points included in the upper left limb and the feature points included in the upper right limb is relatively large. According to the above-mentioned treatment, the hidden body part that may be caused by the twist of the body can be added to the estimation target.
  • the processing unit 122 of the image processing device 12 refers to the central region CA in the skeleton model M described with reference to FIG. It is determined whether at least one of the left elbow feature point LU2 and the left wrist feature point LU3 is located inside. Similarly, the processing unit 122 determines whether at least one of the right elbow feature point RU2 and the right wrist feature point RU3 is located in the central region CA. The processing unit 122 presumes that the feature points determined to be located in the central region CA are included in the hidden body portion.
  • the left wrist feature point LU3 is located in the central region CA. Therefore, it is presumed that the left wrist feature point LU3 corresponds to the hidden body part. Based on the connection rule described above, the skeleton line connecting the left wrist feature point LU3 and the left elbow feature point LU2 is a hidden skeleton line. As a result, it is estimated that the left lower arm of the person as the subject 30 is a hidden body part.
  • the left upper limb group LU and the right The presence of hidden body parts may be presumed for both upper limb group RUs. Based on the above-mentioned skeletal line connection rule, the presence of hidden body parts is presumed in both the upper left limb and the upper right limb, which are relatively close to each other. The reality of such an attitude is low.
  • At least one of the plurality of feature points included in the upper left limb group LU is included in the hidden body part of the processing unit 122 of the image processing device 12, and the plurality of feature points included in the upper right limb group RU. If it is estimated that at least one of the feature points of is contained in the hidden body part, all of the plurality of feature points contained in one of both groups are treated as the feature points contained in the hidden body part, and the other. All of the plurality of feature points included in the above are treated as feature points included in the non-hidden body part.
  • the plurality of feature points included in the left upper limb group LU is an example of a plurality of first feature points.
  • the plurality of feature points included in the right upper limb group RU is an example of the plurality of second feature points.
  • all the feature points included in the upper left limb group LU are treated as feature points included in the non-hidden body part.
  • all feature points included in the left upper limb group LU are connected by a non-hidden skeletal line.
  • all the feature points included in the right upper limb group RU are treated as feature points included in the hidden body part.
  • all feature points included in the right upper limb group RU are connected by hidden skeletal lines.
  • the above-mentioned switching of the estimation result relating to the hidden body part with respect to the feature point can be performed, for example, by acquiring the representative value of the likelihood given to each feature point.
  • representative values include an average value, an intermediate value, a mode value, and a total value.
  • the processing unit 122 has a representative value of a plurality of likelihoods given to a plurality of feature points included in the upper left limb group LU and a representative value of a plurality of likelihoods given to a plurality of feature points included in the upper right limb group RU. Compare with.
  • the processing unit 122 treats all of the plurality of feature points included in the group associated with the smaller representative values as feature points included in the hidden body part.
  • the processing unit 122 treats all of the plurality of feature points included in the group associated with the larger representative value as feature points included in the non-hidden body part.
  • the average value of a plurality of likelihoods is acquired for each of the upper left limb group LU and the upper right limb group RU.
  • the average value of the plurality of likelihoods in the left upper limb group LU is an example of the first representative value.
  • the average value of the plurality of likelihoods in the right upper limb group RU is an example of the second representative value.
  • the average value of the plurality of likelihoods in the upper left limb group LU is larger than the average value of the plurality of likelihoods in the upper right limb group RU. Therefore, all the feature points included in the upper left limb group LU are treated as feature points included in the non-hidden body part, and all the feature points included in the upper right limb group RU are included in the hidden body part. It is treated as a point.
  • the above switching of the estimation result relating to the hidden body part with respect to the feature point can be made by counting the number of the feature points estimated to be included in the hidden body part in each group.
  • the processing unit 122 includes the number of feature points estimated to be included in the hidden body part among the plurality of feature points included in the upper left limb group LU and the hidden feature points among the plurality of feature points included in the upper right limb group RU. Compare with the number of feature points estimated to be contained in the body part.
  • the number of feature points estimated to be included in the hidden body part among the plurality of feature points included in the upper left limb group LU is an example of the first value.
  • the number of feature points estimated to be included in the hidden body part among the plurality of feature points included in the right upper limb group RU is an example of the second value.
  • the processing unit 122 treats all of the plurality of feature points included in the group having a larger number of feature points estimated to be included in the hidden body part as the feature points included in the hidden body part.
  • the processing unit 122 treats all of the plurality of feature points included in the group in which the number of feature points estimated to be included in the hidden body part is smaller as the feature points included in the non-hidden body part.
  • the number of feature points estimated to be included in the hidden body part in the upper left limb group LU is estimated to be included in the hidden body part in the upper right limb group RU. Less than the number of points. Therefore, all the feature points included in the upper left limb group LU are treated as feature points included in the non-hidden body part, and all the feature points included in the upper right limb group RU are included in the hidden body part. It is treated as a point.
  • processing based on the number of feature points estimated to be contained in the hidden body part is performed first, and when the counting results of both groups are the same, processing based on the representative value of likelihood is performed. You may. By combining the processing with a relatively low load and the processing with a relatively high accuracy, it is possible to efficiently perform the estimation related to the hidden body part.
  • the above-mentioned switching of the estimation result relating to the hidden body part with respect to the feature point may be performed based on the orientation of the face of the person as the subject 30. For example, when the face of a person reflected in the image I acquired by the image pickup apparatus 11 is facing to the left, all of the plurality of feature points included in the upper right limb of the person are included in the hidden body part. Can be treated as a point.
  • the above description described with reference to FIG. 18 can be similarly applied to a plurality of feature points included in the left lower limb group LL and a plurality of feature points included in the right lower limb group RL.
  • the plurality of feature points included in the left lower limb group LL is an example of the plurality of first feature points.
  • the plurality of feature points included in the right lower limb group RL is an example of the plurality of second feature points.
  • the representative values obtained for the plurality of likelihoods in the left lower limb group LL are an example of the first representative value.
  • the representative values obtained for the plurality of likelihoods in the right lower limb group RL are an example of the second representative value.
  • the number of feature points estimated to be included in the hidden body part among the plurality of feature points included in the left lower limb group LL is an example of the first value.
  • the number of feature points estimated to be included in the hidden body part among the plurality of feature points included in the right lower limb group RL is an example of the second value.
  • the processing unit 122 having the above-mentioned functions can be realized by a general-purpose microprocessor that operates in cooperation with a general-purpose memory.
  • general-purpose microprocessors include CPUs, MPUs, and GPUs.
  • a ROM or RAM can be exemplified as a general-purpose memory.
  • the ROM may store a computer program that executes the above-described processing.
  • ROM is an example of a non-temporary computer-readable medium in which a computer program is stored.
  • the general-purpose microprocessor specifies at least a part of the program stored in the ROM, expands it on the RAM, and performs the above-described processing in cooperation with the RAM.
  • the above computer program may be pre-installed in the general-purpose memory, or may be downloaded from an external server via a communication network and installed in the general-purpose memory.
  • the external server is an example of a non-transitory computer-readable medium in which a computer program is stored.
  • the processing unit 122 may be realized by a dedicated integrated circuit capable of executing the above-mentioned computer program such as a microprocessor, an ASIC, or an FPGA.
  • the above computer program is pre-installed in the storage element included in the dedicated integrated circuit.
  • the storage element is an example of a non-temporary computer-readable medium in which a computer program is stored.
  • the processing unit 122 can also be realized by a combination of a general-purpose microprocessor and a dedicated integrated circuit.
  • the above embodiment is merely an example for facilitating the understanding of the present disclosure.
  • the configuration according to the above embodiment may be appropriately changed or improved without departing from the gist of the present disclosure.
  • the image processing system 10 can be mounted on a moving body other than the vehicle 20. Examples of mobiles include railroads, aircraft, ships and the like.
  • the moving body does not have to require a driver.
  • the imaging region A of the imaging device 11 may be set inside the moving body.
  • the image processing system 10 does not need to be mounted on a moving body such as a vehicle 20.
  • the image processing system 10 can be used to control the operation of monitoring devices, locking devices, air conditioners, lighting devices, audiovisual equipment, and the like in houses and facilities.

Abstract

画像処理装置は、受付部と処理部を備えている。受付部は、被写体(30)が写り込んだ画像(I)に対応する画像データを受け付ける。処理部は、画像データに基づいて、人物の左肩特徴点(LU1)と右肩特徴点(RU1)を検出する。処理部は、左肩特徴点(LU1)と右肩特徴点(RU1)の間の距離に基づいて、当該人物の身体の一部に遮られることにより画像(I)に写り込まない隠れ身体部位を推定する。

Description

画像処理装置、および非一時的なコンピュータ可読媒体
 本開示は、画像処理装置、および当該画像処理装置の処理部により実行可能なコンピュータプログラムが記憶された非一時的なコンピュータ可読媒体に関連する。
 例えば日本国特許出願公開2017-091377号公報に開示されているように、撮像装置により取得された画像に写り込んだ被写体に人体を模した骨格モデルを適用することにより、当該被写体の骨格や姿勢などの判別を行なう技術が知られている。
 撮像装置により取得された画像に写り込んだ被写体の判別精度を高めることが求められている。
 上記の要求に応えるための一態様は、画像処理装置であって、
 人物が写り込んだ画像に対応する画像データを受け付ける受付部と、
 前記画像データに基づいて、前記人物の身体の一部に遮られることにより前記画像に写り込まない隠れ身体部位を推定する処理部と、
を備えており、
 前記処理部は、
  前記画像データに基づいて、前記人物の左肢に含まれる特徴的部分に対応する少なくとも一つの第一特徴点と、当該人物の右肢に含まれる特徴的部分に対応する少なくとも一つの第二特徴点を検出し、
  前記第一特徴点および前記第二特徴点の間の距離に基づいて、前記隠れ身体部位を推定する。
 上記の要求に応えるための一態様は、画像処理装置の処理部により実行可能なコンピュータプログラムが記憶された非一時的なコンピュータ可読媒体であって、
 前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
  人物が写り込んだ画像に対応する画像データを受け付けさせ、
  前記画像データに基づいて、前記人物の左肢に含まれる特徴的部分に対応する少なくとも一つの第一特徴点と、当該人物の右肢に含まれる特徴的部分に対応する少なくとも一つの第二特徴点を検出させ、
  前記第一特徴点および前記第二特徴点の間の距離に基づいて、前記人物の身体の一部に遮られることにより前記画像に写り込まない隠れ身体部位を推定させる。
 撮像装置により取得される画像に写り込む被写体としての人物は、常に撮像装置に対して正面を向いているとは限らない。当該人物の姿勢によっては、当該人物の身体の一部に遮られて画像に写り込まない隠れ身体部位が生じうる。上記のような処理によれば、そのような隠れ身体部位を推定できるので、撮像装置により取得された画像に写り込んだ被写体の判別精度を高めることができる。
 上記の画像処理装置は、以下のように構成されうる。
 前記処理部は、
  前記画像データに基づいて、前記人物の顔の向きを推定し、
  前記距離と前記顔の向きに基づいて、前記隠れ身体部位を推定する。
 上記のコンピュータ可読媒体は、以下のように構成されうる。
 前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
  前記画像データに基づいて、前記人物の顔の向きを推定させ、
  前記距離と前記顔の向きに基づいて、前記隠れ身体部位を推定させる。
 上記の画像処理装置は、以下のように構成されうる。
 前記処理部は、
  前記画像データに基づいて、前記人物の顔の向きを推定し、
  前記少なくとも一つの第一特徴点を含む第一領域を生成し、
  前記少なくとも一つの第二特徴点を含む第二領域を生成し、
  前記第一領域および前記第二領域の重複度と、前記顔の向きとに基づいて、前記隠れ身体部位を推定する。
 上記のコンピュータ可読媒体は、以下のように構成されうる。
 前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
  前記画像データに基づいて、前記人物の顔の向きを推定させ、
  前記少なくとも一つの第一特徴点を含む第一領域を生成させ、
  前記少なくとも一つの第二特徴点を含む第二領域を生成させ、
  前記第一領域および前記第二領域の重複度と、前記顔の向きとに基づいて、前記隠れ身体部位を推定させる。
 人物の顔の向きは、当該人物の胴体の正面が向く方向との関連性が高い。したがって、上記のような処理によれば、被写体としての人物の姿勢によって生じうる隠れ身体部位の推定精度を高めることができる。
 上記の画像処理装置は、以下のように構成されうる。
 前記処理部は、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果と前記顔の向きに基づかずに得られた前記隠れ身体部位の推定結果が異なる場合、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果を採用する。
 上記のコンピュータ可読媒体は、以下のように構成されうる。
 前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果と前記顔の向きに基づかずに得られた前記隠れ身体部位の推定結果が異なる場合、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果を採用させる。
 上記のような処理によれば、人物の胴体の向きとの関連性が比較的高い顔の向きに基づいた推定結果が優先されるので、隠れ身体部位の推定精度を高めることができる。
 上記の画像処理装置は、以下のように構成されうる。
 前記処理部は、前記画像データに基づいて前記人物の身体のねじれ方向を推定し、当該身体のねじれ方向に基づいて前記隠れ身体部位を推定する。
 上記のコンピュータ可読媒体は、以下のように構成されうる。
 前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
  前記画像データに基づいて前記人物の身体のねじれ方向を推定させ、
  前記身体のねじれ方向に基づいて前記隠れ身体部位を推定させる。
 被写体としての人物が身体のねじれを伴う姿勢をとった場合にも、隠れ身体部位が生じる可能性がある。上記のような処理によれば、身体のねじれによって生じうる隠れ身体部位も推定の対象に加えることができる。
一実施形態に係る画像処理システムの機能構成を例示している。 図1の画像処理システムが車両に搭載された例を示している。 図1の画像処理装置が使用する骨格モデルを例示している。 複数の被写体に図3の骨格モデルが適用された例を示している。 図3の骨格モデルにおける人体の中心を定める手法の一例と中心領域を定める手法の一例を示している。 図3の骨格モデルにおける人体の中心を定める手法の一例と中心領域を定める手法の一例を示している。 被写体に図3の骨格モデルを適用する処理の流れを例示している。 被写体に図3の骨格モデルを適用する処理の流れを例示している。 被写体に図3の骨格モデルを適用する処理の流れを例示している。 被写体に図3の骨格モデルを適用する処理の流れを例示している。 被写体としての人物の身体のねじれを推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。 被写体としての人物の隠れ身体部位を推定する処理を説明する図である。
 添付の図面を参照しつつ、実施形態の例について以下詳細に説明する。図1は、一実施形態に係る画像処理システム10の機能構成を例示している。画像処理システム10は、撮像装置11と画像処理装置12を含んでいる。
 撮像装置11は、予め定められた撮像領域の画像を取得する装置である。撮像装置11としては、カメラやイメージセンサが例示されうる。撮像装置11は、取得した画像に対応する画像データDIを出力するように構成されている。画像データDIは、アナログデータでもよいし、デジタルデータでもよい。
 画像処理装置12は、受付部121、処理部122、及び出力部123を備えている。
 受付部121は、画像データDIを受け付けるインターフェースとして構成されている。画像データDIがアナログデータである場合、受付部121は、A/Dコンバータを含む適宜の変換回路を備える。
 処理部122は、デジタルデータの形態である画像データDIを処理の対象とする。処理部122によって行なわれる処理の詳細については後述する。処理部122は、当該処理の結果に基づいて、出力部123からの制御データDCの出力を許容する。制御データDCは、各種の被制御装置の動作を制御するデータである。制御データDCは、デジタルデータでもよいし、アナログデータでもよい。制御データDCがアナログデータである場合、出力部123は、D/Aコンバータを含む適宜の変換回路を備える。
 画像処理システム10は、例えば図2に示されるように、車両20に搭載されうる。この場合、上記の制御データDCにより動作を制御される被制御装置の例としては、車両20におけるドアの開閉装置、ドアの施錠装置、空調装置、照明装置、映像音響設備などが挙げられる。
 撮像装置11は、所望の撮像領域に応じて車両20における適宜の位置に配置される。画像処理装置12は、車両20内の適宜の位置に配置される。本例においては、撮像装置11は、車両20の右側部に配置されており、車両20の右側方に撮像領域Aを規定している。換言すると、撮像装置11は、撮像領域Aの画像を取得している。
 撮像領域A内には様々な被写体30が進入しうる。撮像領域Aに被写体30が進入すると、撮像装置11により取得される画像に被写体30が写り込む。画像に写り込んだ被写体30は、画像データDIに反映される。
 画像処理システム10は、被写体30が人物である場合において、当該人物の骨格を推定する機能を有している。
 上記の機能を実現するために処理部122は、撮像装置11により取得された画像に写り込んだ被写体30に骨格モデルを適用する処理を、画像データDIに対して行なうように構成されている。
 具体的には、図3に例示される骨格モデルMが採用されている。骨格モデルMは、モデル人体の中心に対応する中心特徴点Cを含む中心領域CAを含んでいる。骨格モデルMは、左上肢グループLU、右上肢グループRU、左下肢グループLL、および右下肢グループRLを含んでいる。
 左上肢グループLUは、モデル人体の左上肢における特徴的な複数の部位に対応する複数の特徴点を含んでいる。具体的には、左上肢グループLUは、左肩特徴点LU1、左肘特徴点LU2、および左手首特徴点LU3を含んでいる。左肩特徴点LU1は、モデル人体の左肩に対応する点である。左肘特徴点LU2は、モデル人体の左肘に対応する点である。左手首特徴点LU3は、モデル人体の左手首に対応する点である。
 右上肢グループRUは、モデル人体の右上肢における特徴的な複数の部位に対応する複数の特徴点を含んでいる。具体的には、右上肢グループRUは、右肩特徴点RU1、右肘特徴点RU2、および右手首特徴点RU3を含んでいる。右肩特徴点RU1は、モデル人体の右肩に対応する点である。右肘特徴点RU2は、モデル人体の右肘に対応する点である。右手首特徴点RU3は、モデル人体の右手首に対応する点である。
 左下肢グループLLは、モデル人体の左下肢における特徴的な複数の部位に対応する複数の特徴点を含んでいる。具体的には、左下肢グループLLは、左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3を含んでいる。左腰特徴点LL1は、モデル人体の腰の左部に対応する点である。左膝特徴点LL2は、モデル人体の左膝に対応する点である。左足首特徴点LL3は、モデル人体の左足首に対応する点である。
 右下肢グループRLは、モデル人体の右下肢における特徴的な複数の部位に対応する複数の特徴点を含んでいる。具体的には、右下肢グループRLは、右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3を含んでいる。右腰特徴点RL1は、モデル人体の腰の右部に対応する点である。右膝特徴点RL2は、モデル人体の右膝に対応する点である。右足首特徴点RL3は、モデル人体の右足首に対応する点である。
 左上肢グループLUは、左上骨格線LUSを介して中心領域CAに接続されている。右上肢グループRUは、右上骨格線RUSを介して中心領域CAに接続されている。左下肢グループLLは、左下骨格線LLSを介して中心領域CAに接続されている。右下肢グループRLは、右下骨格線RLSを介して中心領域CAに接続されている。すなわち、骨格モデルMにおいては、モデル人体の中心特徴点Cにモデル人体の四肢に対応する複数の特徴点が接続されている。
 より具体的には、骨格モデルMは、顔特徴点Fと首特徴点NKを含んでいる。顔特徴点Fは、モデル人体の顔に対応する点である。首特徴点NKは、モデル人体の首に対応する点である。顔特徴点F、左上肢グループLU、および右上肢グループRUは、首特徴点NKを経由して中心領域CAと接続されている。顔特徴点Fは、頭特徴点Hに置き換えられうる。頭特徴点Hは、モデル人体の頭中心に対応する点である。
 本明細書で用いられる「骨格モデルを適用する処理」という語は、撮像装置11により取得された画像に写り込んだ被写体において当該骨格モデルにおいて規定された複数の特徴点を検出し、当該複数の特徴点同士を当該骨格モデルにおいて規定された複数の骨格接続線で接続することを意味する。
 図4は、撮像装置11により取得された画像Iに写り込んだ被写体30としての複数の人物31、32に骨格モデルMが適用された例を示している。
 上記のように人体の中心に対応する中心特徴点Cに人体の四肢に対応する複数の特徴点が接続されている骨格モデルMを採用することにより、より現実に近い人物の骨格の推定が可能になる。より現実に近い骨格が推定されることにより、例えば、画像Iに写り込んだ人物の姿勢や動作を推定しようとする場合において、より正確な推定結果を提供できる。したがって、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を高めることができる。
 図5に例示されるように、モデル人体の中心特徴点Cの位置は、モデル人体の四肢に対応する複数の特徴点の位置に基づいて定められている。具体的には、中心特徴点Cの位置は、以下の手順で定められうる。
 撮像装置11により取得された画像Iにおける左右方向と上下方向をそれぞれX方向、Y方向と規定した場合、左肩特徴点LU1と右肩特徴点RU1の間のX方向に沿う距離に対応する寸法X1を有する短辺と、左肩特徴点LU1と左腰特徴点LL1の間(または右肩特徴点RU1と右腰特徴点RL1の間)のY方向に沿う距離に対応する寸法Y1を有する長辺とによって形成される矩形Rが設定される。続いて、矩形Rの短辺の中点を通ってY方向に延びる直線と、矩形Rの長辺の中点を通ってX方向に延びる直線の交点が、中心特徴点Cの位置として定められる。
 このような構成によれば、比較的検出が容易な四肢に対応する複数の特徴点に基づいて中心特徴点Cの位置が定められうる。換言すると、上記のように判別精度を高めることが可能な骨格モデルMを適用するために、中心特徴点Cの位置を特徴点として検出する必要がない。したがって、画像処理装置12の処理負荷の増大を抑制しつつ、被写体30の判別精度を高めることができる。
 なお、中心特徴点Cの位置を定めるために用いられるY方向に延びる直線は、必ずしも矩形Rの短辺の中点を通ることを要しない。同様に、中心特徴点Cの位置を定めるために用いられるX方向に延びる直線は、必ずしも矩形Rの長辺の中点を通ることを要しない。これらの直線が矩形Rの短辺および長辺と交わる点は、適宜に変更されうる。
 首特徴点NKもまた、四肢に対応する複数の特徴点の位置に基づいて定められうる。例えば、首特徴点NKは、左肩特徴点LU1と右肩特徴点RU1を結ぶ直線の中点として定められうる。すなわち、骨格モデルMの適用に際しては、首特徴点NKを検出する必要がない。このことによっても、画像処理装置12の処理負荷の増大を抑制できる。
 図6に例示されるように、中心特徴点Cは、図5に示される矩形Rを用いなくとも定められうる。本例においては、左肩特徴点LU1、右肩特徴点RU1、左腰特徴点LL1、および右腰特徴点RL1を頂点とする四角形Qが設定される。続いて、四角形Qの重心が、中心特徴点Cの位置として定められる。
 このような構成によれば、中心特徴点Cを定めるにあたっての被写体30の姿勢に係る制約が緩和されうる。
 図5に例示されるように、モデル人体の中心領域CAの大きさは、モデル人体の四肢に対応する複数の特徴点間の距離に基づいて定められている。本例においては、中心領域CAは、矩形状を有している。中心領域CAの短辺の寸法X2は、矩形Rの短辺の寸法X1の半分とされている。中心領域CAの長辺の寸法Y2は、矩形Rの長辺の寸法Y1の半分とされている。
 なお、寸法X2の寸法X1に対する比率と、寸法Y2の寸法Y1に対する比率は、個別かつ適宜に定められうる。
 上記のように定められた中心特徴点Cは、画像Iに写り込んだ被写体30としての人物の胴体内に位置している。中心領域CAは、被写体30としての人物の実際の胴体の広がりを反映した面積を有する。単に中心特徴点Cの位置を定めるだけでなく、中心特徴点Cを含む中心領域CAを設定することによって、より現実の人体に近い骨格モデルMを提供できる。したがって、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を、さらに高めることができる。
 例えば、現実の胴体は広がりを有しているので、被写体30としての人物の姿勢によっては、胴体に遮られて画像Iに写り込まない隠れ身体部位が生じうる。検出される特徴点と中心領域CAの位置関係に基づいて、そのような隠れ身体部位の推定精度を高めることができる。
 図6に例示されるように、人体の中心領域CAは、必ずしも矩形状であることを要しない。本例においては、中心領域CAは、楕円形状を有している。この場合、楕円形状のX方向に沿う寸法X2とY方向に沿う寸法Y2が、先に定められた四角形Q(あるいは図5に例示される矩形R)の大きさに基づいて適宜に定められうる。
 左上肢グループLUに含まれる特徴点が対応する身体部位と特徴点の数は、適宜に定められうる。中心特徴点Cや中心領域CAを定めるための基準となる特徴点も、適宜に定められうる。しかしながら、左上肢グループLUには左肩特徴点LU1が含まれることが好ましい。左肩特徴点LU1は、左上肢の状態によらず比較的高い安定性をもって検出されうる特徴点だからである。同様の理由により、中心特徴点Cや中心領域CAを定めるための基準として左肩特徴点LU1が使用されることが好ましい。
 右上肢グループRUに含まれる特徴点が対応する身体部位と特徴点の数は、適宜に定められうる。中心特徴点Cや中心領域CAを定めるための基準となる特徴点も、適宜に定められうる。しかしながら、右上肢グループRUには右肩特徴点RU1が含まれることが好ましい。右肩特徴点RU1は、右上肢の状態によらず比較的高い安定性をもって検出されうる特徴点だからである。同様の理由により、中心特徴点Cや中心領域CAを定めるための基準として右肩特徴点RU1が使用されることが好ましい。
 左下肢グループLLに含まれる特徴点が対応する身体部位と特徴点の数は、適宜に定められうる。中心特徴点Cや中心領域CAを定めるための基準となる特徴点も、適宜に定められうる。しかしながら、左下肢グループLLには左腰特徴点LL1が含まれることが好ましい。左腰特徴点LL1は、左下肢の状態によらず比較的高い安定性をもって検出されうる特徴点だからである。同様の理由により、中心特徴点Cや中心領域CAを定めるための基準として左腰特徴点LL1が使用されることが好ましい。
 右下肢グループRLに含まれる特徴点が対応する身体部位と特徴点の数は、適宜に定められうる。中心特徴点Cや中心領域CAを定めるための基準となる特徴点も、適宜に定められうる。しかしながら、右下肢グループRLには右腰特徴点RL1が含まれることが好ましい。右腰特徴点RL1は、右下肢の状態によらず比較的高い安定性をもって検出されうる特徴点だからである。同様の理由により、中心特徴点Cや中心領域CAを定めるための基準として右腰特徴点RL1が使用されることが好ましい。
 図7から図10を参照しつつ、撮像装置11により取得された画像Iに写り込んだ被写体30に骨格モデルMが適用される処理の一例を説明する。
 画像処理装置12の処理部122は、受付部121が受け付けた画像データDIに基づいて、画像I中に含まれる人物である尤度が高い物体を検出する処理を実行する。当該処理は、周知の手法を用いて適宜に行なわれうるので、詳細な説明は省略する。図7における枠F0は、画像I内において特定された、人物である尤度が高い物体が含まれている領域を表している。
 続いて、処理部122は、被写体30が人物であるとの仮定に基づき、複数の実特徴点を検出する。画像Iに写り込んだ被写体30から特徴的な複数の身体部位に対応する複数の実特徴点を検出する処理は、周知の手法を用いて適宜に行なわれうるので、詳細な説明は省略する。
 本例においては、前述した左肩特徴点LU1、左肘特徴点LU2、左手首特徴点LU3、右肩特徴点RU1、右肘特徴点RU2、右手首特徴点RU3、左腰特徴点LL1、左膝特徴点LL2、左足首特徴点LL3、右腰特徴点RL1、右膝特徴点RL2、右足首特徴点RL3に加えて、左目特徴点LY、右目特徴点RY、鼻特徴点NS、口特徴点MS、左耳特徴点LA、および右耳特徴点RAが検出されている。左目特徴点LYは、人体の左目に対応する特徴点である。右目特徴点RYは、人体の右目に対応する特徴点である。鼻特徴点NSは、人体の鼻に対応する特徴点である。口特徴点MSは、人体の口に対応する特徴点である。左耳特徴点LAは、人体の左耳に対応する特徴点である。右耳特徴点RAは、人体の右耳に対応する特徴点である。
 続いて図8に例示されるように、処理部122は、検出された複数の実特徴点を、骨格モデルMにおいて規定されている複数のグループに分類する。換言すると、所定の実特徴点を含むように複数のグループが形成される。
 本例においては、左肩特徴点LU1、左肘特徴点LU2、および左手首特徴点LU3を含むように、左上肢グループLUが形成されている。右肩特徴点RU1、右肘特徴点RU2、および右手首特徴点RU3を含むように、右上肢グループRUが形成されている。左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3を含むように、左下肢グループLLが形成されている。右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3を含むように、右下肢グループRLが形成されている。
 さらに、処理部122は、各グループに含まれる複数の実特徴点同士を骨格線で接続する処理を行なう。
 加えて、左目特徴点LY、右目特徴点RY、鼻特徴点NS、口特徴点MS、左耳特徴点LA、および右耳特徴点RAに基づいて、顔特徴点Fが定められている。これに加えてあるいは代えて、頭特徴点Hが定められてもよい。顔特徴点Fは、顔の位置や向きに係る情報を提供しうる。頭特徴点Hは、頭の中心部の推定位置を表しうる。人体の左目特徴点LY、右目特徴点RY、鼻特徴点NS、口特徴点MS、左耳特徴点LA、および右耳特徴点RAに基づいて顔特徴点Fや頭特徴点Hを定める処理は、周知の手法を用いて適宜に行なわれうるので、詳細な説明は省略する。
 続いて図9に例示されるように、処理部122は、中心特徴点Cを定める処理を行なう。本例においては、図5を参照して説明した矩形Rが用いられている。加えて、処理部122は、首特徴点NKを定める処理を行なう。本例においては、左肩特徴点LU1と右肩特徴点RU1を結ぶ直線の中点が、首特徴点NKとして定められている。
 続いて図10に例示されるように、処理部122は、中心領域CAを定める処理を行なう。本例においては、図5を参照して説明した手法が用いられている。
 続いて、処理部122は、中心特徴点Cと四肢に対応する複数のグループの各々を骨格線で接続する処理を行なう。具体的には、左肩特徴点LU1と右肩特徴点RU1が、首特徴点NKを経由して中心特徴点Cに接続される。左腰特徴点LL1と右腰特徴点RL1の各々は、中心特徴点Cに直接的に接続される。顔特徴点Fと頭特徴点Hの少なくとも一方は、首特徴点NKと接続される。
 所定の実特徴点の検出や、検出された複数の実特徴点の複数のグループへの分類、および骨格線による複数の実特徴点の接続の少なくとも一つが実行不能である場合、実特徴点同士を接続できない骨格線が生じる。全ての骨格線のうち、閾値比率を上回る数の骨格線による接続が不能である場合、処理部122は、被写体30に骨格モデルMが適合しないと判断しうる。閾値比率は適宜に設定されうる。すなわち、処理部122は、複数の実特徴点に骨格モデルMが適合するかに基づいて、被写体30が人物であるかを判断しうる。
 このような構成によれば、人物ではない被写体30に対して骨格モデルMに基づく無用の処理が行なわれる可能性を抑制できる。したがって、被写体30の判別精度をさらに高めるとともに、画像処理装置12の処理負荷の増大を抑制できる。
 撮像装置11により取得される画像Iに写り込む被写体30としての人物は、常に撮像装置11に対して正面を向いているとは限らない。画像処理装置12の処理部122は、受付部121が受け付けた画像データDIに基づいて、画像Iに写り込んだ人物の身体のねじれの有無を推定するように構成されている。
 具体的には、図11に例示されるように、処理部122は、右肩特徴点RU1と顔特徴点FのX方向に沿う距離D1と、左肩特徴点LU1と顔特徴点FのX方向に沿う距離D2を取得する。右肩特徴点RU1は、第一特徴点の一例である。左肩特徴点LU1は、第二特徴点の一例である。顔特徴点Fは、第三特徴点の一例である。距離D1は、第一の値の一例である。距離D2は、第二の値の一例である。
 続いて、処理部122は、距離D1と距離D2の比率に基づいて、画像Iに写り込んだ人物の身体のねじれの有無を推定する。具体的には、当該比率と1との差分が閾値を超えている場合に、身体がねじれていると推定する。被写体30としての人物が撮像装置11に対して正面を向いている場合、左肩特徴点LU1と右肩特徴点RU1は、顔特徴点Fに対して左右方向(X方向)に対称に位置している蓋然性が高い。したがって、距離D1と距離D2の比率は1に近づく。換言すると、当該比率が1から離れるほど、顔の正面と上半身の正面が別方向を向いている蓋然性が高い。
 したがって、上記のような処理によれば、被写体30としての人物の顔と上半身の間のねじれの有無を推定できる。これにより、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を高めることができる。
 図11に例示されるように、身体のねじれの有無の推定に際しては、右肩特徴点RU1と顔特徴点Fの間の距離D1’と、左肩特徴点LU1と顔特徴点Fの間の距離D2’が取得され、これらの値の比率が直接的に求められてもよい。この場合、距離D1’は第一の値の一例であり、距離D2’は第二の値の一例である。
 顔特徴点Fに対する距離が取得される特徴点は、左肩特徴点LU1と右肩特徴点RU1に限られない。被写体30としての人物の左上肢に含まれる特徴的部分に対応する点であれば、適宜の点が第一特徴点として採用されうる。同様に、被写体30としての人物の右上肢に含まれる特徴的部分に対応する点であれば、適宜の点が第二特徴点として採用されうる。但し、左肘特徴点LU2と右肘特徴点RU2のように、被写体30としての人物が撮像装置11に対して正面を向いたときに顔特徴点Fに対して左右対称に位置する二つの点が選ばれる必要がある。
 しかしながら、左肩特徴点LU1の位置と右肩特徴点RU1の位置は、両上肢の状態によらず比較的安定しており、かつ顔特徴点Fに近いので、左肩特徴点LU1と右肩特徴点RU1を第一特徴点と第二特徴点として採用することは、顔と上半身のねじれの有無を精度よく推定する上では有利である。
 被写体30としての人物の顔に含まれる特徴的部分に対応していれば、顔特徴点F以外の特徴点を、第三特徴点として採用できる。但し、鼻特徴点NSや口特徴点MSのように、被写体30としての人物が撮像装置11に対して正面を向いたときに第一特徴点と第二特徴点に対して左右対称の関係が成立する点が選ばれる必要がある。
 処理部122は、1に対する距離D1と距離D2の比率の大小関係に基づいて、被写体30としての人物の身体のねじれ方向を推定しうる。
 具体的には、図11に例示されるように、当該比率が1よりも大きい場合(D1がD2よりも大きい場合)、処理部122は、顔が上半身に対して左方にねじれていると推定する。当該比率が1よりも小さい場合(D2がD1よりも大きい場合)、処理部122は、顔が上半身に対して右方にねじれていると推定する。
 このような処理によれば、身体のねじれの有無だけでなく、ねじれの方向も推定できるので、被写体30としての人物の姿勢をより正確に判別できる。
 図11に例示されるように、処理部122は、被写体30としての人物の肩幅に対応する値を取得する。本例においては、左肩特徴点LU1と右肩特徴点RU1の間のX方向に沿う距離D3が、肩幅に対応する値として取得されている。加えて、処理部122は、左腰特徴点LL1と右腰特徴点RL1の間のX方向に沿う距離D4を取得する。左腰特徴点LL1は、第一特徴点の一例である。右腰特徴点RL1は、第二特徴点の一例である。距離D3は、第一の値の一例である。距離D4は、第二の値の一例である。
 続いて、処理部122は、距離D3と距離D4の比率に基づいて、画像Iに写り込んだ人物の身体のねじれの有無を推定する。具体的には、距離D4に対する距離D3の比率が所定の閾値範囲に収まらない場合、身体がねじれていると推定する。例えば、閾値範囲は、1以上2以下の値として設定される。被写体30としての人物が撮像装置11に対して正面を向いている場合、肩幅に対応する距離D3は、腰幅に対応する距離D4よりも大きい。したがって、距離D4に対する距離D3の比率は、上記の閾値範囲内に収まる。他方、被写体30としての人物の上半身の正面と下半身の正面が別方向を向いていると、肩幅に対応する距離D3が腰幅に対応する距離D4を下回る場合がある。あるいは、肩幅に対応する距離D3が腰幅に対応する距離D4を大きく上回る場合がある。すなわち、当該比率が上記の閾値範囲に収まらない場合、上半身の正面と下半身の正面が別方向を向いている蓋然性が高い。
 したがって、上記のような処理によれば、被写体30としての人物の上半身と下半身の間のねじれの有無を推定できる。これにより、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を高めることができる。
 図11に例示されるように、身体のねじれの有無の推定に際しては、左肩特徴点LU1と右肩特徴点RU1の間の距離D3’と、左腰特徴点LL1と右腰特徴点RL1の間の距離D4’が取得され、これらの値の比率が直接的に求められてもよい。この場合、距離D3’は第一の値の一例であり、距離D4’は第二の値の一例である。
 肩幅との比較に供される特徴点は、左腰特徴点LL1と右腰特徴点RL1に限られない。被写体30としての人物の左下肢に含まれる特徴的部分に対応する点であれば、適宜の点が第一特徴点として採用されうる。同様に、被写体30としての人物の右下肢に含まれる特徴的部分に対応する点であれば、適宜の点が第二特徴点として採用されうる。但し、左膝特徴点LL2と右膝特徴点RL2のように、被写体30としての人物が撮像装置11に対して正面を向いたときに身体の中心軸に対して左右対称に位置する二つの点が選ばれる必要がある。
 しかしながら、左腰特徴点LL1の位置と右腰特徴点RL1の位置は、両下肢の状態によらず比較的安定しているので、左腰特徴点LL1と右腰特徴点RL1を第一特徴点と第二特徴点として採用することは、上半身と下半身のねじれの有無を精度よく推定する上では有利である。
 前述のように、撮像装置11により取得される画像Iに写り込む被写体30としての人物は、常に撮像装置11に対して正面を向いているとは限らない。当該人物の姿勢によっては、当該人物の身体の一部に遮られて画像Iに写り込まない隠れ身体部位が生じうる。図12に示される例においては、被写体30としての人物の右上肢と腰の右部が画像Iに写り込んでおらず、右肩特徴点RU1、右肘特徴点RU2、右手首特徴点RU3、および右腰特徴点RL1が検出されていない。骨格モデルの適用を通じて人物の姿勢を推定する際には、隠れ身体部位を正確に認識することもまた重要である。
 近年、深層学習等を用いて骨格モデルを構成する複数の特徴点を検出する技術が普及しつつある。当該技術に基づくと、実際には身体の一部に遮られて画像に写り込んでいない隠れ身体部位であるにも関わらず、身体の一部に遮られることなく画像に写り込んでいる非隠れ身体部位であるかのように特徴点が検出される場合がある。図13に例示される画像Iにおいては、被写体30としての人物における右肩特徴点RU1、右肘特徴点RU2、右手首特徴点RU3、および右腰特徴点RL1が検出されている。
 画像処理装置12の処理部122は、受付部121が受け付けた画像データDIに基づいて、画像Iに写り込んだ人物の隠れ身体部位を推定するように構成されている。
 具体的には、処理部122は、被写体30としての人物の左肢に含まれる特徴点と右肢に含まれる特徴点の距離を取得する。例えば、左肩特徴点LU1と右肩特徴点RU1の間のX方向に沿う距離が取得される。当該距離が閾値よりも小さい場合、処理部122は、隠れ身体部位を推定するための処理を実行する。当該閾値は、人物が撮像装置11に対して正面を向いているときの左肩特徴点LU1と右肩特徴点RU1の間の距離よりも小さな適宜の値として設定される。左肩特徴点LU1は、第一特徴点の一例である。右肩特徴点RU1は、第二特徴点の一例である。
 人物の胴体の正面が撮像装置11に対して斜め方向あるいは側方を向いている場合、隠れ身体部位が生じやすくなる。このとき、当該人物の胴体が撮像装置11に対して正面を向いている場合よりも、左肢に含まれる特徴点と右肢に含まれる特徴点の間の距離が短くなることが一般的である。したがって、左肩特徴点LU1と右肩特徴点RU1の間のX方向に沿う距離が閾値よりも小さい場合、左肩特徴点LU1と右肩特徴点RU1の一方が隠れ身体部位に含まれている蓋然性が高い。
 深層学習等により人体の特徴点が検出される場合、当該特徴点には尤度を示すデータが付与されることが一般的である。尤度とは、検出の確からしさを示す指標である。尤度は、周知の手法を用いて適宜に取得されうるので、詳細な説明は省略する。
 左肩特徴点LU1と右肩特徴点RU1の間のX方向に沿う距離が閾値よりも小さい場合、処理部122は、左肩特徴点LU1に付与された尤度と右肩特徴点RU1に付与された尤度を比較し、より小さい尤度が付与された特徴点が隠れ身体部位に含まれていると推定する。図13に示される例においては、左肩特徴点LU1に付与された尤度が220であり、右肩特徴点RU1に付与された尤度が205である。したがって、処理部122は、右肩特徴点RU1が隠れ身体部位に含まれていると推定する。
 これに加えてあるいは代えて、左上肢に含まれる他の特徴点と右上肢に含まれる他の特徴点の間の距離が取得されうる。但し、人物が撮像装置11に対して正面を向いたときに人体の中心軸に対して左右対称に位置する特徴点の間の距離が取得される。例えば、左肘特徴点LU2と右肘特徴点RU2の間の距離、および左手首特徴点LU3と右手首特徴点RU3の間の距離の少なくとも一方が取得される。左肘特徴点LU2と左手首特徴点LU3の各々は、第一特徴点の一例である。右肘特徴点RU2と右手首特徴点RU3の各々は、第二特徴点の一例である。
 図13に示される例においては、左肘特徴点LU2に付与された尤度が220であり、右肘特徴点RU2に付与された尤度が200である。したがって、処理部122は、右肘特徴点RU2が隠れ身体部位に含まれていると推定する。同様に、左手首特徴点LU3に付与された尤度が220であり、右手首特徴点RU3に付与された尤度が210である。したがって、処理部122は、右手首特徴点RU3が隠れ身体部位に含まれていると推定する。
 なお、同じグループに属する複数の特徴点の一つが隠れ身体部位に含まれていると推定された場合、処理部122は、同じグループに属する他の特徴点も隠れ身体部位に含まれていると推定してもよい。例えば、右上肢グループRUに属する右肩特徴点RU1、右肘特徴点RU2、および右手首特徴点RU3のうち、右肩特徴点RU1が隠れ身体部位に含まれていると推定された場合、処理部122は、右肘特徴点RU2と右手首特徴点RU3もまた隠れ身体部位に含まれていると推定しうる。この場合、左肩特徴点LU1と右肩特徴点RU1が基準とされることが好ましい。これらの特徴点の間の距離は、上肢の状態に依らず、胴体の正面の向きを比較的高い安定性で反映するからである。
 上記の推定結果は、図14に例示されるように反映される。本例においては、隠れ身体部位に含まれていると推定された特徴点が白丸で表されている。その後、処理部122は、複数の特徴点同士を複数の骨格線で接続する処理を行なう。複数の骨格線は、隠れ身体部位に対応する隠れ骨格線と、非隠れ身体部位に対応する非隠れ骨格線を含む。図14においては、隠れ骨格線が破線で示されており、非隠れ骨格線が実線で示されている。処理部122は、骨格線により接続される二つの特徴点の少なくとも一方が隠れ身体部位に含まれている場合、隠れ骨格線で当該二つの特徴点を接続する。換言すると、骨格線により接続される二つの特徴点の双方が非隠れ身体部位に含まれている場合のみ、当該二つの特徴点が非隠れ骨格線により接続される。
 図14に示される例においては、ともに隠れ身体部位に対応すると推定された右肩特徴点RU1と右肘特徴点RU2が、隠れ骨格線により接続されている。この場合、右上腕は隠れ身体部位であると推定される。同様に、ともに隠れ身体部位に対応すると推定された右肘特徴点RU2と右手首特徴点RU3が、隠れ骨格線により接続されている。この場合、右下腕は隠れ身体部位であると推定される。
 したがって、上記のような処理によれば、被写体30としての人物の姿勢によって生じうる隠れ身体部位を推定できる。これにより、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を高めることができる。
 図13と図14を参照したこれまでの説明は、左下肢グループLLに属する左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3、および右下肢グループRLに属する右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3にも同様に適用されうる。すなわち、左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3の各々は、第一特徴点の一例になりうる。同様に、右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3の各々は、第二特徴点の一例になりうる。
 図15は、画像Iに写り込んだ人物の隠れ身体部位を推定するために処理部122が行ないうる処理の別例を示している。
 本例においては、処理部122は、被写体30としての人物の顔の向きを推定する。当該推定は、例えば、顔特徴点Fの位置に基づいて行なわれうる。
 加えて、処理部122は、左上肢グループLUに対応する枠F1と右上肢グループRUに対応する枠F2を生成する。枠F1は、左肩特徴点LU1、左肘特徴点LU2、および左手首特徴点LU3を含むように生成される。枠F1は、第一領域の一例である。枠F2は、右肩特徴点RU1、右肘特徴点RU2、および右手首特徴点RU3を含むように生成される。枠F2は、第二領域の一例である。
 例えば、枠F1の上端縁は、左上肢グループLUに含まれる複数の特徴点のうち最も上側に位置する特徴点と重なるように定められる。枠F1の下端縁は、左上肢グループLUに含まれる複数の特徴点のうち最も下側に位置する特徴点と重なるように定められる。枠F1の左端縁は、左上肢グループLUに含まれる複数の特徴点のうち最も左側に位置する特徴点と重なるように定められる。枠F1の右端縁は、左上肢グループLUに含まれる複数の特徴点のうち最も右側に位置する特徴点と重なるように定められる。
 同様に、枠F2の上端縁は、右上肢グループRUに含まれる複数の特徴点のうち最も上側に位置する特徴点と重なるように定められる。枠F2の下端縁は、右上肢グループRUに含まれる複数の特徴点のうち最も下側に位置する特徴点と重なるように定められる。枠F2の左端縁は、右上肢グループRUに含まれる複数の特徴点のうち最も左側に位置する特徴点と重なるように定められる。枠F2の右端縁は、右上肢グループRUに含まれる複数の特徴点のうち最も右側に位置する特徴点と重なるように定められる。
 続いて、処理部122は、枠F1と枠F2の重複度を取得する。例えば、重複度は、枠F1と枠F2のうちより小さい方の面積に対する枠F1と枠F2が重なっている部分の面積の比率として算出されうる。処理部122は、当該重複度が閾値よりも大きい場合、処理部122は、隠れ身体部位を推定するための処理を実行する。
 人物の胴体の正面が撮像装置11に対して斜め方向あるいは側方を向いている場合、隠れ身体部位が生じやすくなる。このとき、当該人物の胴体が撮像装置11に対して正面を向いている場合よりも、左肢に含まれる特徴点と右肢に含まれる特徴点の間の距離が短くなることが一般的である。左肢に含まれる特徴点と右肢に含まれる特徴点が近づくにつれて、枠F1と枠F2は重なる傾向を持つ。したがって、枠F1と枠F2の重複率が閾値よりも大きい場合、枠F1に対応する左上肢グループLUと枠F2に対応する右上肢グループRUの一方が隠れ身体部位に対応している蓋然性が高い。
 枠F1と枠F2の重複率が閾値よりも大きい場合、処理部122は、先に推定された顔の向きを参照し、左上肢グループLUと右上肢グループRUのいずれが隠れ身体部位に対応しているのかを推定する。
 具体的には、図15に例示されるように顔が左方を向いていると推定された場合、処理部122は、右上肢グループRUが隠れ身体部位に対応していると推定する。結果として、図14に例示されるように、右上肢グループRUに含まれる右肩特徴点RU1、右肘特徴点RU2、および右手首特徴点RU3が隠れ身体部位に含まれていると推定され、これらの特徴点が隠れ骨格線により接続される。顔が右方を向いていると推定された場合、処理部122は、左上肢グループLUが隠れ身体部位に対応していると推定する。
 人物の顔の向きは、当該人物の胴体の正面が向く方向との関連性が高い。したがって、上記のような処理によれば、被写体30としての人物の姿勢によって生じうる隠れ身体部位の推定精度を高めることができる。このとき、各特徴点に付与された尤度の参照は必須でない。
 隠れ身体部位の推定に係る上記の処理は、必ずしも枠F1と枠F2の重複度に基づくことを要しない。例えば、枠F1における代表点と枠F2における代表点の間の距離が閾値よりも小さい場合に、顔の向きを参照して隠れ身体部位が推定されてもよい。例えば、枠F1のX方向に沿う中点と枠F2のX方向に沿う中点が、代表点として採用されうる。枠F1における代表点と枠F2における代表点の間の距離は、第一特徴点と第二特徴点の間の距離の一例となりうる。
 図15を参照したこれまでの説明は、左下肢グループLLに属する左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3、および右下肢グループRLに属する右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3にも同様に適用されうる。
 すなわち、処理部122は、左下肢グループLLに対応する枠F3と右下肢グループRLに対応する枠F4を生成する。枠F3は、左腰特徴点LL1、左膝特徴点LL2、および左足首特徴点LL3を含むように生成される。枠F3は、第一領域の一例である。枠F4は、右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3を含むように生成される。枠F4は、第二領域の一例である。
 例えば、枠F3の上端縁は、左下肢グループLLに含まれる複数の特徴点のうち最も上側に位置する特徴点と重なるように定められる。枠F3の下端縁は、左下肢グループLLに含まれる複数の特徴点のうち最も下側に位置する特徴点と重なるように定められる。枠F3の左端縁は、左下肢グループLLに含まれる複数の特徴点のうち最も左側に位置する特徴点と重なるように定められる。枠F3の右端縁は、左下肢グループLLに含まれる複数の特徴点のうち最も右側に位置する特徴点と重なるように定められる。
 同様に、枠F4の上端縁は、右下肢グループRLに含まれる複数の特徴点のうち最も上側に位置する特徴点と重なるように定められる。枠F4の下端縁は、右下肢グループRLに含まれる複数の特徴点のうち最も下側に位置する特徴点と重なるように定められる。枠F4の左端縁は、右下肢グループRLに含まれる複数の特徴点のうち最も左側に位置する特徴点と重なるように定められる。枠F4の右端縁は、右下肢グループRLに含まれる複数の特徴点のうち最も右側に位置する特徴点と重なるように定められる。
 続いて、処理部122は、枠F3と枠F4の重複度を取得する。例えば、重複度は、枠F3と枠F4のうちより小さい方の面積に対する枠F3と枠F4が重なっている部分の面積の比率として算出されうる。処理部122は、当該重複度が閾値よりも大きい場合、処理部122は、隠れ身体部位を推定するための処理を実行する。
 枠F3と枠F4の重複率が閾値よりも大きい場合、処理部122は、先に推定された顔の向きを参照し、左下肢グループLLと右下肢グループRLのいずれが隠れ身体部位に対応しているのかを推定する。
 具体的には、顔が左方を向いていると推定された場合、処理部122は、右下肢グループRLが隠れ身体部位に対応していると推定する。顔が右方を向いていると推定された場合、処理部122は、左下肢グループLLが隠れ身体部位に対応していると推定する。
 隠れ身体部位の推定に係る上記の処理は、必ずしも枠F3と枠F4の重複度に基づくことを要しない。例えば、枠F3における代表点と枠F4における代表点の間の距離が閾値よりも小さい場合に、顔の向きを参照して隠れ身体部位が推定されてもよい。例えば、枠F3のX方向に沿う中点と枠F4のX方向に沿う中点が、代表点として採用されうる。枠F3における代表点と枠F4における代表点の間の距離は、第一特徴点と第二特徴点の間の距離の一例となりうる。
 処理部122は、図13を参照して説明した処理と図15を参照して説明した処理の双方を実行し、両処理によって得られた推定結果同士を比較してもよい。両結果が相違する場合、処理部122は、顔の向きに基づく処理による推定結果を採用する。
 例えば、図12に示される例においては、右腰特徴点RL1が検出されていない。この場合、図13に例示される処理においては、左腰特徴点LL1と右腰特徴点RL1の間の距離が閾値を下回り、より低い尤度が付与されている右腰特徴点RL1が隠れ身体部位に対応すると推定されうる。
 他方、図15に例示される処理においては、左下肢グループLLに対応する枠F3と右下肢グループRLに対応する枠F4は、重複度が低い。したがって、右下肢グループRLに含まれる右腰特徴点RL1、右膝特徴点RL2、および右足首特徴点RL3は、非隠れ身体部位と推定され、図14に例示されるように、非隠れ骨格線により接続される。この場合、右腰特徴点RL1は、非隠れ身体部位に対応すると推定される。
 このように顔方向に基づく処理で得られた推定結果と顔方向に基づかない処理で得られた推定結果が相違する場合、前者が採用される。したがって、本例の場合、右腰特徴点RL1は、隠れ身体部位であると推定される。
 このような構成によれば、人物の胴体の向きとの関連性が比較的高い顔の向きに基づいた推定結果が優先されるので、隠れ身体部位の推定精度を高めることができる。
 図11を参照して説明した身体のねじれ方向を推定する処理は、隠れ身体部位の推定に使用されうる。図16に例示されるように、顔の正面方向と胴体の正面方向が比較的大きくなるように身体がねじれている場合、隠れ身体部位が生じる可能性がある。
 図11を参照して説明した処理に基づけば、図16に示される例においては、顔が上半身に対して左方にねじれていると推定される。この場合、処理部122は、ねじれ方向と逆方向の上肢が隠れ身体部位に対応すると推定する。本例においては、被写体30としての人物の右上肢が、隠れ身体部位に対応すると推定されている。
 図16に例示される姿勢を被写体30としての人物がとっている場合、図13を参照して説明した処理や図15を参照して説明した処理では、隠れ身体部位を正しく推定できない場合がある。胴体の正面の向きが撮像装置11に対する正面に比較的近く、左上肢に含まれる特徴点と右上肢に含まれる特徴点の距離が比較的大きくなるからである。上記のような処理によれば、身体のねじれによって生じうる隠れ身体部位も推定の対象に加えることができる。
 図17に例示される姿勢を被写体30としての人物がとっている場合、すなわち人物が撮像装置11に対して背中を向けている場合、上肢の一部が胴体に遮られて隠れ身体部位が生じる可能性がある。この場合においても左上肢に含まれる特徴点と右上肢に含まれる特徴点の距離が比較的大きくなり、かつ身体がねじれていないので、図13から図16を参照して説明したいずれの処理においても、隠れ身体部位を正しく推定できない場合がある。
 画像処理装置12の処理部122は、被写体30としての人物の顔が撮像装置11に対して後方を向いていると推定される場合、図3を参照して説明した骨格モデルMにおける中心領域CA内に左肘特徴点LU2と左手首特徴点LU3の少なくとも一方が位置しているかを判断する。同様に、処理部122は、中心領域CA内に右肘特徴点RU2と右手首特徴点RU3の少なくとも一方が位置しているかを判断する。処理部122は、中心領域CA内に位置していると判断された特徴点を、隠れ身体部位に含まれていると推定する。
 図17に示される例においては、左手首特徴点LU3が、中心領域CA内に位置している。したがって、左手首特徴点LU3が隠れ身体部位に対応すると推定される。前述の接続規則に基づき、左手首特徴点LU3と左肘特徴点LU2を接続する骨格線は、隠れ骨格線とされる。これにより、被写体30としての人物の左下腕部が、隠れ身体部位であると推定される。
 このような処理によれば、撮像装置11に対して背を向けている人物の胴体に遮られた隠れ身体部位の推定精度を高めることができる。
 図13を参照して説明したように、各特徴点に付与された尤度を参照して隠れ身体部位の推定が行なわれる結果として、図18に例示されるように、左上肢グループLUと右上肢グループRUの双方について、隠れ身体部位の存在が推定される場合がある。前記した骨格線の接続規則に基づけば、比較的近い位置にある左上肢と右上肢の双方に隠れ身体部位の存在が推定されることになる。このような姿勢の現実性は低い。
 画像処理装置12の処理部122は、左上肢グループLUに含まれる複数の特徴点のうちの少なくとも一つが隠れ身体部位に含まれていると推定されており、かつ右上肢グループRUに含まれる複数の特徴点のうちの少なくとも一つが隠れ身体部位に含まれていると推定されている場合、両グループの一方に含まれる複数の特徴点の全てを隠れ身体部位に含まれる特徴点として扱い、他方に含まれる複数の特徴点の全てを非隠れ身体部位に含まれる特徴点として扱う。左上肢グループLUに含まれる複数の特徴点は、複数の第一特徴点の一例である。右上肢グループRUに含まれる複数の特徴点は、複数の第二特徴点の一例である。
 図18に例示される例においては、左上肢グループLUに含まれる全ての特徴点が、非隠れ身体部位に含まれる特徴点として扱われている。結果として、左上肢グループLUに含まれる全ての特徴点が、非隠れ骨格線により接続されている。他方、右上肢グループRUに含まれる全ての特徴点が、隠れ身体部位に含まれる特徴点として扱われている。結果として、右上肢グループRUに含まれる全ての特徴点が、隠れ骨格線により接続されている。
 特徴点に対する隠れ身体部位に係る推定結果の上記のような切り替えは、例えば、各特徴点に付与された尤度の代表値を取得することによってなされうる。代表値の例としては、平均値、中間値、最頻値、合計値などが挙げられる。処理部122は、左上肢グループLUに含まれる複数の特徴点に付与された複数の尤度の代表値と右上肢グループRUに含まれる複数の特徴点に付与された複数の尤度の代表値とを比較する。処理部122は、より小さい代表値に対応付けられたグループに含まれる複数の特徴点の全てを、隠れ身体部位に含まれる特徴点として扱う。処理部122は、より大きい代表値に対応付けられたグループに含まれる複数の特徴点の全てを、非隠れ身体部位に含まれる特徴点として扱う。
 図18に示される例においては、左上肢グループLUと右上肢グループRUの各々について複数の尤度の平均値が取得されている。左上肢グループLUにおける複数の尤度の平均値は、第一代表値の一例である。右上肢グループRUにおける複数の尤度の平均値は、第二代表値の一例である。左上肢グループLUにおける複数の尤度の平均値が右上肢グループRUにおける複数の尤度の平均値よりも大きい。したがって、左上肢グループLUに含まれる全ての特徴点が、非隠れ身体部位に含まれる特徴点として扱われており、右上肢グループRUに含まれる全ての特徴点が、隠れ身体部位に含まれる特徴点として扱われている。
 あるいは、特徴点に対する隠れ身体部位に係る推定結果の上記のような切り替えは、各グループにおいて隠れ身体部位に含まれていると推定された特徴点の数を計数することによってなされうる。処理部122は、左上肢グループLUに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数と、右上肢グループRUに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数とを比較する。左上肢グループLUに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数は、第一の値の一例である。右上肢グループRUに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数は、第二の値の一例である。
 処理部122は、隠れ身体部位に含まれていると推定された特徴点の数がより多いグループに含まれる複数の特徴点の全てを、隠れ身体部位に含まれる特徴点として扱う。処理部122は、隠れ身体部位に含まれていると推定された特徴点の数がより少ないグループに含まれる複数の特徴点の全てを、非隠れ身体部位に含まれる特徴点として扱う。
 図18に示される例においては、左上肢グループLUにおいて隠れ身体部位に含まれていると推定された特徴点の数が、右上肢グループRUにおいて隠れ身体部位に含まれていると推定された特徴点の数よりも少ない。したがって、左上肢グループLUに含まれる全ての特徴点が、非隠れ身体部位に含まれる特徴点として扱われており、右上肢グループRUに含まれる全ての特徴点が、隠れ身体部位に含まれる特徴点として扱われている。
 上記のような処理によれば、隠れ身体部位に係る不自然な推定結果を是正することができる。したがって、撮像装置11により取得された画像Iに写り込んだ被写体30の判別精度を高めることができる。
 これら二つの処理は組み合わせて実行されてもよい。例えば、隠れ身体部位に含まれていると推定された特徴点の数に基づく処理が先に行なわれ、両グループの計数結果が同じである場合に、尤度の代表値に基づく処理が行なわれてもよい。相対的に負荷の低い処理と相対的に精度の高い処理が組み合わされることにより、隠れ身体部位に係る推定を効率よく遂行できる。
 特徴点に対する隠れ身体部位に係る推定結果の上記のような切り替えは、被写体30としての人物の顔の向きに基づいて行なわれてもよい。例えば、撮像装置11により取得された画像I内に写り込んだ人物の顔が左方を向いている場合、当該人物の右上肢に含まれる複数の特徴点の全てが隠れ身体部位に含まれる特徴点として扱われうる。
 図18を参照して説明したこれまでの説明は、左下肢グループLLに含まれる複数の特徴点と右下肢グループRLに含まれる複数の特徴点にも同様に適用されうる。この場合、左下肢グループLLに含まれる複数の特徴点は、複数の第一特徴点の一例である。右下肢グループRLに含まれる複数の特徴点は、複数の第二特徴点の一例である。左下肢グループLLにおける複数の尤度について得られる代表値は、第一代表値の一例である。右下肢グループRLにおける複数の尤度について得られる代表値は、第二代表値の一例である。左下肢グループLLに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数は、第一の値の一例である。右下肢グループRLに含まれる複数の特徴点のうち隠れ身体部位に含まれていると推定された特徴点の数は、第二の値の一例である。
 上記のような機能を有する処理部122は、汎用メモリと協働して動作する汎用マイクロプロセッサにより実現されうる。汎用マイクロプロセッサとしては、CPU、MPU、GPUが例示されうる。汎用メモリとしては、ROMやRAMが例示されうる。この場合、ROMには、上述した処理を実行するコンピュータプログラムが記憶されうる。ROMは、コンピュータプログラムが記憶された非一時的なコンピュータ可読媒体の一例である。汎用マイクロプロセッサは、ROM上に記憶されたプログラムの少なくとも一部を指定してRAM上に展開し、RAMと協働して上述した処理を実行する。上記のコンピュータプログラムは、汎用メモリにプリインストールされてもよいし、通信ネットワークを介して外部サーバからダウンロードされて汎用メモリにインストールされてもよい。この場合、外部サーバは、コンピュータプログラムが記憶された非一時的なコンピュータ可読媒体の一例である。
 処理部122は、マイクロコントローラ、ASIC、FPGAなどの上記のコンピュータプログラムを実行可能な専用集積回路によって実現されてもよい。この場合、当該専用集積回路に含まれる記憶素子に上記のコンピュータプログラムがプリインストールされる。当該記憶素子は、コンピュータプログラムが記憶された非一時的なコンピュータ可読媒体の一例である。処理部122は、汎用マイクロプロセッサと専用集積回路の組合せによっても実現されうる。
 上記の実施形態は、本開示の理解を容易にするための例示にすぎない。上記の実施形態に係る構成は、本開示の趣旨を逸脱しなければ、適宜に変更・改良されうる。
 画像処理システム10は、車両20以外の移動体にも搭載されうる。移動体の例としては、鉄道、航空機、船舶などが挙げられる。当該移動体は、運転者を必要としなくてもよい。撮像装置11の撮像領域Aは、移動体の内部に設定されてもよい。
 画像処理システム10は、車両20などの移動体に搭載されることを要しない。画像処理システム10は、住宅や施設における監視装置、施錠装置、空調装置、照明装置、映像音響設備などの動作を制御するために使用されうる。
 本開示の一部を構成するものとして、2019年10月7日に提出された日本国特許出願2019-184712号の内容が援用される。

Claims (10)

  1.  人物が写り込んだ画像に対応する画像データを受け付ける受付部と、
     前記画像データに基づいて、前記人物の身体の一部に遮られることにより前記画像に写り込まない隠れ身体部位を推定する処理部と、
    を備えており、
     前記処理部は、
      前記画像データに基づいて、前記人物の左肢に含まれる特徴的部分に対応する少なくとも一つの第一特徴点と、当該人物の右肢に含まれる特徴的部分に対応する少なくとも一つの第二特徴点を検出し、
      前記第一特徴点および前記第二特徴点の間の距離に基づいて、前記隠れ身体部位を推定する、
    画像処理装置。
  2.  前記処理部は、
      前記画像データに基づいて、前記人物の顔の向きを推定し、
      前記距離と前記顔の向きに基づいて、前記隠れ身体部位を推定する、
    請求項1に記載の画像処理装置。
  3.  前記処理部は、
      前記画像データに基づいて、前記人物の顔の向きを推定し、
      前記少なくとも一つの第一特徴点を含む第一領域を生成し、
      前記少なくとも一つの第二特徴点を含む第二領域を生成し、
      前記第一領域および前記第二領域の重複度と、前記顔の向きとに基づいて、前記隠れ身体部位を推定する、
    請求項1に記載の画像処理装置。
  4.  前記処理部は、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果と前記顔の向きに基づかずに得られた前記隠れ身体部位の推定結果が異なる場合、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果を採用する、
    請求項2または3に記載の画像処理装置。
  5.  前記処理部は、前記画像データに基づいて前記人物の身体のねじれ方向を推定し、当該身体のねじれ方向に基づいて前記隠れ身体部位を推定する、
    請求項1から4のいずれか一項に記載の画像処理装置。
  6.  画像処理装置の処理部により実行可能なコンピュータプログラムが記憶された非一時的なコンピュータ可読媒体であって、
     前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
      人物が写り込んだ画像に対応する画像データを受け付けさせ、
      前記画像データに基づいて、前記人物の左肢に含まれる特徴的部分に対応する少なくとも一つの第一特徴点と、当該人物の右肢に含まれる特徴的部分に対応する少なくとも一つの第二特徴点を検出させ、
      前記第一特徴点および前記第二特徴点の間の距離に基づいて、前記人物の身体の一部に遮られることにより前記画像に写り込まない隠れ身体部位を推定させる、
    コンピュータ可読媒体。
  7.  前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
      前記画像データに基づいて、前記人物の顔の向きを推定させ、
      前記距離と前記顔の向きに基づいて、前記隠れ身体部位を推定させる、
    請求項6に記載のコンピュータ可読媒体。
  8.  前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
      前記画像データに基づいて、前記人物の顔の向きを推定させ、
      前記少なくとも一つの第一特徴点を含む第一領域を生成させ、
      前記少なくとも一つの第二特徴点を含む第二領域を生成させ、
      前記第一領域および前記第二領域の重複度と、前記顔の向きとに基づいて、前記隠れ身体部位を推定させる、
    請求項6に記載のコンピュータ可読媒体。
  9.  前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果と前記顔の向きに基づかずに得られた前記隠れ身体部位の推定結果が異なる場合、前記顔の向きに基づいて得られた前記隠れ身体部位の推定結果を採用させる、
    請求項7または8に記載のコンピュータ可読媒体。
  10.  前記コンピュータプログラムが実行されることにより、前記画像処理装置に、
      前記画像データに基づいて前記人物の身体のねじれ方向を推定させ、
      前記身体のねじれ方向に基づいて前記隠れ身体部位を推定させる、
    請求項6から9のいずれか一項に記載のコンピュータ可読媒体。
PCT/JP2020/035796 2019-10-07 2020-09-23 画像処理装置、および非一時的なコンピュータ可読媒体 WO2021070611A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/766,772 US20230034307A1 (en) 2019-10-07 2020-09-23 Image processing device, and non-transitory computer-readable medium
DE112020004823.3T DE112020004823T5 (de) 2019-10-07 2020-09-23 Bildverarbeitungsvorrichtung und nicht-vorübergehendes computerlesbares Medium
CN202080066596.9A CN114450723A (zh) 2019-10-07 2020-09-23 图像处理装置以及非暂时性计算机可读介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019184712A JP7312079B2 (ja) 2019-10-07 2019-10-07 画像処理装置、およびコンピュータプログラム
JP2019-184712 2019-10-07

Publications (1)

Publication Number Publication Date
WO2021070611A1 true WO2021070611A1 (ja) 2021-04-15

Family

ID=75380210

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/035796 WO2021070611A1 (ja) 2019-10-07 2020-09-23 画像処理装置、および非一時的なコンピュータ可読媒体

Country Status (5)

Country Link
US (1) US20230034307A1 (ja)
JP (1) JP7312079B2 (ja)
CN (1) CN114450723A (ja)
DE (1) DE112020004823T5 (ja)
WO (1) WO2021070611A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023188302A1 (ja) * 2022-03-31 2023-10-05 日本電気株式会社 画像処理装置、画像処理方法、及び、記録媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123733A (ja) * 2009-12-11 2011-06-23 Denso Corp 乗員姿勢推定装置
JP2012518857A (ja) * 2009-02-25 2012-08-16 本田技研工業株式会社 内側距離形状関係を使用する身体特徴検出及び人間姿勢推定
JP2012155391A (ja) * 2011-01-24 2012-08-16 Panasonic Corp 姿勢状態推定装置および姿勢状態推定方法
JP6562437B1 (ja) * 2019-04-26 2019-08-21 アースアイズ株式会社 監視装置、及び、監視方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7025756B2 (ja) 2018-04-04 2022-02-25 株式会社北島製作所 可動式スクリーンの設置装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012518857A (ja) * 2009-02-25 2012-08-16 本田技研工業株式会社 内側距離形状関係を使用する身体特徴検出及び人間姿勢推定
JP2011123733A (ja) * 2009-12-11 2011-06-23 Denso Corp 乗員姿勢推定装置
JP2012155391A (ja) * 2011-01-24 2012-08-16 Panasonic Corp 姿勢状態推定装置および姿勢状態推定方法
JP6562437B1 (ja) * 2019-04-26 2019-08-21 アースアイズ株式会社 監視装置、及び、監視方法

Also Published As

Publication number Publication date
CN114450723A (zh) 2022-05-06
DE112020004823T5 (de) 2022-06-23
JP7312079B2 (ja) 2023-07-20
US20230034307A1 (en) 2023-02-02
JP2021060815A (ja) 2021-04-15

Similar Documents

Publication Publication Date Title
US20190377409A1 (en) Neural network image processing apparatus
JP4898026B2 (ja) ステレオカメラを使用した顔・視線認識装置
WO2019006760A1 (zh) 一种姿态的识别方法、设备及可移动平台
US11298050B2 (en) Posture estimation device, behavior estimation device, storage medium storing posture estimation program, and posture estimation method
JP7369184B2 (ja) 運転者注意状態推定
JP6584717B2 (ja) 顔向き推定装置および顔向き推定方法
CN109543651A (zh) 一种驾驶员危险驾驶行为检测方法
WO2021070611A1 (ja) 画像処理装置、および非一時的なコンピュータ可読媒体
Martin et al. Real time driver body pose estimation for novel assistance systems
US11783636B2 (en) System and method for detecting abnormal passenger behavior in autonomous vehicles
WO2021070609A1 (ja) 画像処理装置、および非一時的なコンピュータ可読媒体
WO2021070610A1 (ja) 画像処理装置、および非一時的なコンピュータ可読媒体
WO2021070612A1 (ja) 画像処理装置、および非一時的なコンピュータ可読媒体
JP2021068088A (ja) 画像処理装置、コンピュータプログラム、および画像処理システム
JP7281733B2 (ja) 監視システム、移動体、監視方法及びプログラム
JP2021068087A (ja) 画像処理装置、コンピュータプログラム、および画像処理システム
JP2021101288A (ja) 制御装置、コンピュータプログラム、および認証システム
JP7412514B1 (ja) キャビンモニタリング方法及び上記キャビンモニタリング方法を実行するキャビンモニタリングシステム
Klingner et al. Modeling human movements with self-organizing maps using adaptive metrics
TW202414246A (zh) 艙內偵測方法及其系統
CN116883436A (zh) 一种基于视线估计的辅助理解方法及系统
CN111696312A (zh) 乘员观察装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20875390

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 20875390

Country of ref document: EP

Kind code of ref document: A1