WO2017098709A1 - 画像認識装置および画像認識方法 - Google Patents

画像認識装置および画像認識方法 Download PDF

Info

Publication number
WO2017098709A1
WO2017098709A1 PCT/JP2016/005037 JP2016005037W WO2017098709A1 WO 2017098709 A1 WO2017098709 A1 WO 2017098709A1 JP 2016005037 W JP2016005037 W JP 2016005037W WO 2017098709 A1 WO2017098709 A1 WO 2017098709A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
distance
image recognition
luminance
region
Prior art date
Application number
PCT/JP2016/005037
Other languages
English (en)
French (fr)
Inventor
繁 齋藤
村瀬 洋
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Priority to JP2017554783A priority Critical patent/JP6358552B2/ja
Priority to CN201680065134.9A priority patent/CN108351964B/zh
Priority to EP16872611.5A priority patent/EP3389008A4/en
Publication of WO2017098709A1 publication Critical patent/WO2017098709A1/ja
Priority to US15/960,050 priority patent/US10339405B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/12Acquisition of 3D measurements of objects
    • G06V2201/121Acquisition of 3D measurements of objects using special illumination

Definitions

  • This disclosure relates to an image recognition apparatus and an image recognition method.
  • cameras that can acquire not only luminance images but also distance information are attracting attention. Since this camera can recognize a space three-dimensionally by using distance information of an image, it is expected that a distance between a person and a car can be known, and a person can be recognized with higher accuracy.
  • Patent Document 1 proposes a method for recognizing the similarity of a distance histogram as a feature amount, compared to a conventional human recognition method using a luminance gradient feature amount. Thereby, even when there are many complicated backgrounds or when people overlap, a reduction in recognition accuracy is suppressed.
  • the conventional human recognition method using a distance image scans the entire image including an object other than a person such as a background to perform human recognition, which causes a problem that the calculation processing time becomes long and the recognition speed decreases.
  • the problem to be solved by the present disclosure is to provide an image recognition apparatus and an image recognition method that cause little reduction in detection speed even for high-resolution images, and little reduction in recognition accuracy even under complicated backgrounds. is there.
  • One form of the image recognition device includes a camera unit that generates a distance signal and a luminance signal using reflected light from a plurality of subjects, a distance image from the distance signal, and a luminance image from the luminance signal And an image recognition processing unit for performing image recognition, wherein the image recognition processing unit divides the distance image and the luminance image into a plurality of regions, and each of the plurality of regions. A first region where it is clear that a specific object does not exist and a second region other than the first region are determined, and the first region is excluded from the plurality of regions. To execute image recognition processing.
  • a distance image including pixel data indicating a distance value and a luminance image including pixel data indicating a luminance value are generated by imaging with a camera, and the distance image and the distance image
  • the luminance image is divided into a plurality of regions, and each of the plurality of regions is either a first region where it is clear that a specific object does not exist, or any other second region Determination is performed, and image recognition is executed by excluding the first region from the plurality of regions.
  • FIG. 1 is a block diagram illustrating a configuration example of an image recognition apparatus according to an embodiment.
  • FIG. 2 is a diagram illustrating an example of a subject assumed when an image is taken with an in-vehicle camera.
  • FIG. 3A is a diagram illustrating a luminance image obtained when the subject illustrated in FIG. 2 is imaged by the image recognition apparatus according to the embodiment.
  • FIG. 3B is a diagram showing a luminance value along a dotted line 3B in FIG. 3A.
  • FIG. 3C is a diagram illustrating a luminance value along a dotted line 3C in FIG. 3A.
  • FIG. 4 is a diagram illustrating a result of subject boundary extraction using only a luminance image.
  • FIG. 4 is a diagram illustrating a result of subject boundary extraction using only a luminance image.
  • FIG. 5A is a diagram illustrating a distance image obtained when the subject illustrated in FIG. 2 is imaged by the image recognition apparatus according to the embodiment.
  • FIG. 5B is a diagram showing a distance value along a dotted line 5B in FIG. 5A.
  • FIG. 5C is a diagram illustrating a distance value along a dotted line 5C in FIG. 5A.
  • FIG. 6 is a diagram illustrating a result of subject boundary extraction using only a distance image.
  • FIG. 7 is a diagram in which the extracted boundary is synthesized using the luminance image and the distance image.
  • FIG. 8 is a diagram illustrating a first region among a plurality of regions divided by the boundary of the subject extracted using the distance image and the luminance image.
  • FIG. 9 is a flowchart of an image recognition method executed by the image recognition apparatus according to the embodiment.
  • FIG. 1 is a block diagram illustrating a configuration example of an image recognition apparatus according to an embodiment.
  • An image recognition apparatus 100 illustrated in FIG. 1 includes a camera unit 10, an image generation unit 20, and an image recognition processing unit 30.
  • the camera unit 10 includes a light source 11, a light source control unit 12, a camera lens 13, and an image sensor 14.
  • the image generation unit 20 includes a distance image generation unit 21 and a luminance image generation unit 22.
  • the image recognition processing unit 30 includes an area determination unit 31, an image extraction unit 32, a feature amount calculation unit 33, and a recognition processing unit 34.
  • the camera unit 10 generates a distance signal and a luminance signal using reflected light from a plurality of subjects.
  • the light source 11 is mainly a light source with a near-infrared wavelength (such as an LED or a laser diode), and irradiates light in a pulse shape at a specific frequency under the control of the light source control unit 12.
  • a near-infrared wavelength such as an LED or a laser diode
  • the light source control unit 12 irradiates the subject with pulsed light from the light source 11 and forms an image of reflected light from the subject on the image sensor 14 through the camera lens 13.
  • the image sensor 14 has a plurality of pixel portions arranged two-dimensionally, and each pixel portion receives reflected light.
  • the distance signal can be acquired by calculating the time difference between the timing when the reflected light arrives and the timing when the light source 11 irradiates the light.
  • the distance signal indicates, for example, the distance between the subject and the camera unit 10 for each pixel unit.
  • the imaging device 14 also acquires a luminance signal while not emitting pulsed light from the light source 11 as in a normal camera.
  • the image generation unit 20 generates a distance image and a luminance image from the distance signal and luminance signal obtained from the camera unit 10.
  • the distance image generation unit 21 generates a distance image by calculating a time difference between the timing when the light of the reflected signal arrives and the timing when the light is irradiated.
  • the luminance image generation unit 22 generates a luminance image similarly to a general camera.
  • the camera unit 10 and the image generation unit 20 have a configuration in which light emission control for TOF (Time Of Flight) distance measurement is added and a distance image generation unit 21 is added as compared with a general camera.
  • TOF Time Of Flight
  • the image recognition processing unit 30 is configured to exclude the first region of the luminance image and the distance image from the object of image recognition.
  • the first area is an area where it is clear that a specific object does not exist among all areas of the luminance image and the distance image.
  • the specific object may typically be a person, but in addition to this, a bicycle, a two-wheeled vehicle, a car, or the like on which a person is riding, or an animal other than a person may be used.
  • the region determination unit 31 performs a process of dividing the subject into a plurality of regions using the luminance image and the distance image.
  • the area determination unit 31 determines whether each of the divided areas is the first area or the other second area. For the first region, the feature amount necessary for identifying the object is not calculated by the feature amount calculation unit 33, and the feature amount is calculated for the second region.
  • the image extraction unit 32 reflects the determination result of the region determination unit 31 and performs image extraction of the second region.
  • the feature amount calculation unit 33 calculates the feature amount only in the image extracted by the image extraction unit 32.
  • the recognition processing unit 34 performs recognition processing according to the feature amount calculated by the feature amount calculation unit 33.
  • FIG. 2 is a diagram showing an example of a subject assumed when an image is taken with an in-vehicle camera.
  • the subject shown in FIG. 2 includes general subjects such as pedestrians, buildings, ground, roads, cars, traffic lights, pedestrian crossings, trees, sky, and clouds.
  • a luminance image and a distance image obtained when the subject shown in FIG. 2 is imaged by the image recognition apparatus 100 will be described.
  • FIG. 3A shows a luminance image obtained when the image recognition apparatus 100 images the subject shown in FIG.
  • the luminance image includes pixel data indicating luminance.
  • the contrast of the subject in FIG. 3A corresponds to the amount of the luminance signal.
  • the bright portion has a large luminance value, and the dark portion has a small luminance value.
  • region division using the luminance image that is, region boundary extraction in the region determination unit 31.
  • FIG. 3B is a diagram showing a luminance value along a dotted line 3B in FIG. 3A.
  • FIG. 3C is a diagram illustrating a luminance value along a dotted line 3C in FIG. 3A.
  • FIG. 3B and FIG. 3C are diagrams in which the horizontal axis of the dotted lines 3B and 3C in FIG. 3A is the horizontal axis and the luminance value is plotted on the vertical axis.
  • the region division of the subject that is, the extraction of the boundary (edge) will be described with the luminance value shown in FIG. 3B as an example.
  • the boundary between the building and the ground, the boundary between the ground and the road, and the boundary between the ground and the tree can be extracted.
  • a luminance value difference of 5 to 10% or more is observed between adjacent pixels is extracted as a boundary.
  • this value is arbitrarily determined depending on camera noise or the like, and is not limited thereto.
  • FIG. 4 shows the result when the boundary of the subject is extracted using only the luminance image.
  • the boundary between the person and the tree a portion 3b surrounded by a circle in FIG. 3B
  • the boundary between the person and the building the circle in FIG. It can be seen that the portion 3c surrounded by
  • the present disclosure proposes an image recognition apparatus 100 that uses a distance image together in order to accurately extract a subject boundary even if it is difficult to extract the subject boundary only with a luminance image.
  • region division using the distance image that is, region boundary extraction in the region determination unit 31.
  • FIG. 5A shows a distance image obtained when the image recognition apparatus 100 images the subject shown in FIG.
  • the distance image includes pixel data indicating a distance value.
  • the contrast of the subject in FIG. 5A corresponds to the distance
  • the bright part is far from the image recognition apparatus 100 to the subject
  • the dark part is close.
  • FIG. 5B is a diagram showing the distance value along the dotted line 5B in FIG. 5A.
  • FIG. 5C is a diagram illustrating a distance value along a dotted line 5C in FIG. 5A.
  • 5B and 5C are graphs in which the horizontal pixel rows of dotted lines 5B and 5C in FIG. 5A are plotted on the horizontal axis, and distance values are plotted on the vertical axis. Since the dotted lines 5B and 5C are spatially the same position as the above-described dotted lines 3B and 3C, it is easy to use both values because the address of the pixel value of the image sensor is also the same.
  • extraction of the boundary of the subject will be described using the distance value shown in FIG. 5B as an example.
  • the boundary between the building and the ground, the boundary between the ground and the traffic light pillar, the boundary between the ground and the tree, and the boundary between the person and the tree can be extracted.
  • the distance value changes by 5-10% or more between adjacent pixels, or when the difference (gradient) of the distance value of several pixels including adjacent pixels is about 50% or more
  • the gradient changes.
  • the pixel to be extracted is extracted as a boundary, but this value is arbitrarily determined by camera noise or the like, and is not limited to this.
  • FIG. 5B it can be seen that due to the difference in the distance value between the tree and the person, a boundary that cannot be clearly extracted in the luminance image can be extracted.
  • the boundary can be extracted based on the difference in the distance value between the building and the person.
  • FIG. 6 shows the result when the boundary of the subject is extracted using only the distance image.
  • a distance image such as a road and the ground
  • a thing with small change in distance value small unevenness
  • a road crosswalk a thing with small change in distance value
  • the region determination unit 31 integrates both the boundary division processing of a plurality of subjects using a luminance image and the boundary division processing of a plurality of subjects using a distance image. That is, as shown in FIG. 7, by combining the boundaries extracted using the respective luminance images and distance images, it is possible to accurately extract the boundary of the subject.
  • the camera unit 10 and the image generation unit 20 that perform TOF distance measurement used in the image recognition apparatus 100 can acquire the luminance image and the distance image optically coaxially, optical axis correction or the like is unnecessary. It becomes. For this reason, it is clear that the luminance image and the distance image are superior not only in cost but also in recognition speed as compared with the case where they are acquired by separate cameras.
  • the region determination unit 31 of the image recognition apparatus 100 is either the first region where it is clear that a specific object does not exist for each of the plurality of divided regions, or the other second region. Judgment is made.
  • the area determination unit 31 performs a determination process as to whether or not to calculate a feature amount necessary for identifying an object for each of a plurality of areas.
  • these determination processes will be described using the identification of a person as a specific object as an example.
  • FIG. 8 is a diagram illustrating a first region among a plurality of regions divided by the boundary of the subject extracted using the distance image and the luminance image. That is, FIG.
  • a distance value is a certain value or more (in this case, a camera's limit measurable distance Xm or more) among a plurality of regions divided by the subject boundary extracted using the distance image and the luminance image shown in FIG. 8A) and a region 8B in which the distance value changes while maintaining a constant inclination in the horizontal pixel direction or the vertical pixel direction.
  • the region 8A is a region that does not include a pixel indicating a distance smaller than a predetermined value (for example, the limit measurable distance Xm) in the distance image.
  • the region 8B is a region where the difference between adjacent pixels is uniform in a certain direction (for example, the vertical direction of the distance image).
  • the subject is an empty or far background in the region where the region beyond the limit measurement distance of the camera is continuous at the upper part of the screen like the region 8A.
  • Recognition processing can be omitted.
  • the ground including a road here
  • human recognition processing can be omitted as well. That is, while the feature amount necessary for the human identification process has been calculated in the entire area of the subject, the image recognition apparatus 100 uses the boundary area of the subject obtained from the luminance image and the distance image.
  • the image recognition apparatus 100 generates the distance image and the luminance signal using the reflected light from the plurality of subjects, generates the distance image from the distance signal, and generates the luminance signal.
  • An image generation unit 20 that generates a luminance image from the image
  • an image recognition processing unit 30 that performs image recognition.
  • the image recognition processing unit 30 divides the distance image and the luminance image into a plurality of regions, respectively. For each of the plurality of regions, a determination is made as to which of the first region and the second region other than the first region where it is clear that a specific object does not exist, and the first of the plurality of regions The image recognition process is executed by excluding the region 1.
  • the image recognition processing unit 30 may perform the determination based on a distance value obtained from the distance image divided into the plurality of regions.
  • the image recognition processing unit 30 may determine, as the first region, a region that does not include a pixel indicating a distance smaller than a predetermined value in the distance image among the plurality of regions.
  • a sky or a distant background can be included in the first area.
  • the image recognition processing unit 30 may determine an area where the difference between adjacent pixels is uniform among the plurality of areas in the distance image as the first area.
  • the ground, roads, etc. can be included in the first area.
  • the image recognition processing unit 30 may set a boundary between the adjacent pixels as a boundary between the plurality of regions when a difference between distance values obtained by adjacent pixels in the distance image is equal to or larger than a threshold value.
  • the camera unit 10 may include an image sensor 14 that generates the distance signal and the luminance signal.
  • the distance image and the luminance image are generated by the same camera, processing such as optical axis correction is unnecessary, and the cost is compared with the case where the luminance image and the distance image are acquired by separate cameras. It is effective not only in recognition speed.
  • the image recognition method executed by the image recognition apparatus 100 is based on the image captured by the camera, the distance image including the pixel data indicating the distance value, and the luminance image including the pixel data indicating the luminance value.
  • the distance image and the luminance image are each divided into a plurality of regions (S12), and it is clear that a specific object does not exist for each of the plurality of regions.
  • any other second region (S13) and image recognition is executed by excluding the first region from the plurality of regions (S14).
  • FIG. 9 is a flowchart of an image recognition method executed by the image recognition apparatus 100.
  • each component such as the light source control unit, the image recognition processing unit, and the image recognition processing unit is configured by dedicated hardware or executes a software program suitable for each component. May be realized.
  • Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • a comprehensive or specific aspect of the present disclosure may be realized by a system, a method, an integrated circuit, a computer program, or a recording medium such as a computer-readable CD-ROM. You may implement
  • the image recognition apparatus according to the present disclosure can be suitably used for, for example, a vehicle-mounted sensor.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

画像認識装置(100)は、複数の被写体からの反射光を用いて距離信号と輝度信号とを生成するカメラ部(10)と、距離信号から距離画像を生成し、輝度信号から輝度画像を生成する画像生成部(20)と、画像認識をする画像認識処理部(30)とを備える。画像認識処理部(30)は、距離画像および輝度画像を、それぞれ複数の領域に分割し、複数の領域のそれぞれが、特定の物体が存在しないことが明白な第1の領域であるか、および、それ以外の第2の領域であるかの判定を行い、複数の領域のうち第1の領域を除外して画像認識を実行する。

Description

画像認識装置および画像認識方法
 本開示は画像認識装置および画像認識方法に関する。
 近年、カメラの撮像画像を用いて物体を認識する技術に関する研究が盛んに行われている。たとえば、人認識に関する技術は自動車用カメラなどに搭載することができれば、衝突防止や自動運転などに応用できる技術として大きな注目を集めている。
 特に、輝度画像だけでなく、距離情報も取得することができるカメラが注目されている。このカメラは画像の距離情報を利用することで3次元的に空間を認識することができるため人と自動車との距離がわかり、更に高精度な人認識が可能となると期待されている。
 例えば特許文献1では、従来の輝度勾配特徴量を用いる人認識手法に対して、距離ヒストグラムの類似度を特徴量として認識する手法が提案されている。これにより、複雑な背景が多い場合や人の重なりが生じている場合でも認識精度の低下を抑制している。
特許第5500559号公報
 しかしながら、従来の距離画像を用いた人認識手法では背景などの人以外の物体を含む画像全体をスキャンして人認識を行うため、計算処理時間が長くなり認識速度が低下するといった課題が生じる。
 そこで本開示が解決しようとする課題は、高解像度の画像を対象としても検出速度の低下が少なく、複雑な背景下においても認識精度の低下が少ない画像認識装置および画像認識方法を提供することにある。
 本開示における画像認識装置の一形態は、複数の被写体からの反射光を用いて距離信号と輝度信号とを生成するカメラ部と、前記距離信号から距離画像を生成し、前記輝度信号から輝度画像を生成する画像生成部と、画像認識をする画像認識処理部とを備え、前記画像認識処理部は、前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し、前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い、前記複数の領域のうち前記第1の領域を除外して画像認識処理を実行する。
 また、本開示における画像認識方法の一形態は、カメラの撮像により、距離値を示す画素データを含む距離画像と、輝度値を示す画素データを含む輝度画像とを生成し、前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し、前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い、前記複数の領域のうち前記第1の領域を除外して画像認識を実行する。
 本開示によれば、高解像度の画像全領域を物体検出しても検出速度の低下が少なく、複雑な背景画像においても認識精度の低下を少なくすることができる。
図1は、実施の形態における画像認識装置の構成例を示すブロック図である。 図2は、車載カメラで撮像した場合に想定される被写体の一例を示す図である。 図3Aは、実施の形態における画像認識装置にて図2に示した被写体を撮像した場合に得られる輝度画像を示す図である。 図3Bは、図3A中の点線3Bにおける輝度値を示す図である。 図3Cは、図3A中の点線3Cにおける輝度値を示す図である。 図4は、輝度画像のみを用いて被写体の境界抽出を行った結果を示す図である。 図5Aは、実施の形態における画像認識装置にて図2に示した被写体を撮像した場合に得られる距離画像を示す図である。 図5Bは、図5A中の点線5Bにおける距離値を示す図である。 図5Cは、図5A中の点線5Cにおける距離値を示す図である。 図6は、距離画像のみを用いて被写体の境界抽出を行った結果を示す図である。 図7は、輝度画像と距離画像を用いて抽出した境界を合成した図である。 図8は、距離画像と輝度画像を用いて抽出した被写体の境界により分割された複数の領域のうち第1の領域を示す図である。 図9は、実施の形態における画像認識装置が実行する画像認識方法のフローチャートである。
 以下、実施の形態に係る画像認識装置を、図面を参照しながら説明する。
 但し、必要以上に詳細な説明は省略する場合がある。
 例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面および以下の説明は当業者が本開示を十分に理解するためのものであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
 (実施の形態)
 図1は実施の形態における画像認識装置の構成例を示すブロック図である。図1に示す画像認識装置100は、カメラ部10、画像生成部20および画像認識処理部30を備える。カメラ部10は、光源11、光源制御部12、カメラレンズ13および撮像素子14を備える。また、画像生成部20は、距離画像生成部21および輝度画像生成部22を備える。そして画像認識処理部30は、領域判定部31、画像抽出部32、特徴量計算部33および認識処理部34を備える。
 カメラ部10は、複数の被写体からの反射光を用いて距離信号と輝度信号とを生成する。
 光源11は、主に近赤外の波長の光源(LEDやレーザーダイオード等)であり、光源制御部12の制御の下で特定の周波数でパルス状に光を照射する。
 光源制御部12は、光源11からパルス状の光を被写体に照射させ、被写体からの反射光を、カメラレンズ13を通して撮像素子14上に結像させる。
 撮像素子14は、二次元状に配置された複数の画素部を有し、各画素部で反射光を受光する。この反射光が到達したタイミングと光源11が光を照射したタイミングとの時間差を計算することで距離信号を取得することができる。距離信号は、例えば、画素部毎に被写体とカメラ部10との距離を示す。また、撮像素子14は、通常のカメラのように、光源11からパルス状の光を照射しない間に輝度信号も取得する。
 画像生成部20は、カメラ部10より得られた距離信号と輝度信号から距離画像と輝度画像を生成する。距離画像生成部21は、上記の反射信号の光が到達したタイミングと光を照射したタイミングとの時間差を計算することで距離画像を生成する。輝度画像生成部22は、一般的なカメラと同様に輝度画像を生成する。カメラ部10および画像生成部20は、一般的なカメラと比較して、TOF(Time Of Flight)測距用の発光制御が追加され、距離画像生成部21が追加された構成である。
 また、画像認識処理部30は、輝度画像および距離画像のうち第1の領域を、画像認識の対象から除外するように構成されている。ここで、第1の領域は、輝度画像および距離画像の全領域のうち、特定の物体が存在しないことが明白な領域をいう。また、特定の物体とは、典型的には人でよいが、これ以外にも、人が乗っている自転車、二輪車または車等でもよいし、人以外の動物でもよい。
 画像認識処理部30において、まず、領域判定部31は、輝度画像と距離画像を用いて被写体を複数の領域に分割する処理を実施する。
 次に、領域判定部31は、分割された複数の領域毎に第1の領域であるか、それ以外の第2の領域であるかの判定を行う。第1の領域に対しては、特徴量計算部33による物体の識別に必要な特徴量の計算が行われず、第2の領域に対しては、特徴量の計算が行われる。
 画像抽出部32は、領域判定部31の判定結果を反映させて、第2の領域の画像抽出を実施する。
 特徴量計算部33は、画像抽出部32にて抽出された画像内でのみ特徴量の計算を行う。
 認識処理部34は、特徴量計算部33で計算された特徴量に従って認識処理を行う。
 次に、これらの詳細な内容について図面を用いながら説明する。
 図2に車載カメラで撮像した場合に想定される被写体の一例を示す図である。図2の被写体は歩行者、建物、地面、道路、車、信号機、横断歩道、木、空、雲といった一般的な被写体で構成されている。次に、図2に示した被写体を画像認識装置100にて撮像した場合に得られる輝度画像と距離画像について説明する。
 図3Aは、画像認識装置100にて図2に示した被写体を撮像した場合に得られる輝度画像を示している。輝度画像が、輝度を示す画素データを含む。ここで、図3Aの被写体のコントラストは輝度信号の量に対応しており、明るい部分は輝度値が大きく、暗い部分は輝度値が小さい。
 次に、領域判定部31における、輝度画像を用いた領域の分割つまり領域の境界の抽出について説明する。
 図3Bは、図3A中の点線3Bにおける輝度値を示す図である。図3Cは、図3A中の点線3Cにおける輝度値を示す図である。図3Bと図3Cはそれぞれ図3A中の点線3Bおよび3Cの水平画素行を横軸とし、縦軸に輝度値をプロットした図である。ここで図3Bで表された輝度値を例に被写体の領域分割すなわち境界(エッジ)の抽出について説明する。輝度値の変化が大きい箇所を被写体の境界として分割すると、建物と地面との境界、地面と道路との境界、地面と木との境界が抽出できる。具体的には隣接画素間で5-10%以上の輝度値の差異が見られる場合を境界として抽出するが、カメラのノイズ等によってこの値は任意に定められるためこれに限定されない。
 しかし、図3Bでは、地面と信号機の柱との境界および木と人の上半身との境界が抽出できず、輝度画像のみでは境界抽出が困難となってしまう。これは、輝度信号の量が被写体からの反射光の量とカメラの感度とによって決まるため、もし被写体の反射率が同等程度であった場合、異なる被写体であってもそれぞれの輝度値の間に明確な差異が生じず、被写体同士が重なり合ってしまい、被写体の境界(エッジ)が抽出できないためである。同様に、図3Cのように建物と人の輝度値の差異が小さい場合、輝度画像のみでは被写体の境界抽出が困難となる。
 図4に輝度画像のみを用いて被写体の境界抽出を行った場合の結果を示す。図4からも明らかなように、輝度値で明確な差異が見られなかった人と木との境界(図3Bの丸で囲った3bの部分)及び人と建物との境界(図3Cの丸で囲った3cの部分)は抽出できていないことがわかる。これを用いて後述の識別処理を行ったとしても、正確な判定ができない。
 そこで、本開示では輝度画像のみでは被写体の境界抽出が困難となる場合あっても精度良く被写体の境界抽出するために、距離画像を併用した画像認識装置100を提案している。
 次に、領域判定部31における、距離画像を用いた領域の分割つまり領域の境界の抽出について説明する。
 図5Aは、画像認識装置100にて図2に示した被写体を撮像した場合に得られる距離画像を示している。距離画像は、距離値を示す画素データを含む。ここで、図5Aの被写体のコントラストは距離に対応しており、明るい部分は画像認識装置100から被写体までの距離が遠く、暗い部分は距離が近い。
 図5Bは、図5A中の点線5Bにおける距離値を示す図である。図5Cは、図5A中の点線5Cにおける距離値を示す図である。図5Bと図5Cはそれぞれ図5A中の点線5Bおよび5Cの水平画素行を横軸とし、縦軸に距離値をプロットした図である。なお、点線5Bおよび5Cは先述した点線3Bおよび3Cと空間的に同じ位置であることから、撮像素子の画素値のアドレスも同じであるため双方の値を用いることは容易である。ここで、図5Bで表された距離値を例に被写体の境界の抽出について説明する。距離値の変化が大きい箇所を被写体の境界として分割すると、建物と地面との境界、地面と信号機の柱との境界、地面と木との境界、人と木との境界が抽出できる。具体的には隣接画素間で5-10%以上の距離値の変化、または隣接画素を含む数画素の距離値の勾配(傾き)に50%程度以上の差異が見られる場合、その勾配が変化する画素を境界として抽出するが、カメラのノイズ等によってこの値は任意に定められるためこれに限定されない。図5Bでは木と人との距離値の差異により、輝度画像では明確に抽出できなかった境界が抽出できていることがわかる。同様に図5Cでも、建物と人との距離値の差異により、境界が抽出可能である。
 図6に距離画像のみを用いて被写体の境界抽出を行った場合の結果を示す。図6から明らかなように、輝度画像のみでは被写体の境界が得られなかった人と建物との境界および、人と木との境界が抽出可能となる。しかし、距離画像のみでは道路と地面、および道路の横断歩道のような距離値の変化が小さい(凹凸が小さい)ものに関してはその境界を抽出することが困難である。すなわち、地面や道路などの被写体を識別するためには、距離画像のみでは困難となる。
 そこで、画像認識装置100では、領域判定部31は、輝度画像による複数の被写体の境界分割処理と距離画像による複数の被写体の境界分割処理の双方を統合している。すなわち図7に示すように、それぞれの輝度画像と距離画像とを用いて抽出した境界を合成することで、被写体の正確な境界抽出を可能としている。
 また、画像認識装置100に用いられているTOF測距するカメラ部10および画像生成部20は、輝度画像と距離画像とを光学的に同軸で取得することができるため、光軸補正などが不要となる。このため、輝度画像と距離画像とを別々のカメラで取得した場合と比較し、コストだけでなく認識速度の点でも優位であることは明らかである。
 さらに、画像認識装置100の領域判定部31は、分割された複数の領域毎に特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行う。言い換えれば、領域判定部31は、複数の領域毎に物体の識別に必要な特徴量の計算を行わないか行うかの判定処理を実施している。ここでは特定の物体としての人の識別を例として、これらの判定処理について説明する。図8は、距離画像と輝度画像を用いて抽出した被写体の境界により分割された複数の領域のうち第1の領域を示す図である。つまり、図8は、図7に示した距離画像と輝度画像を用いて抽出した被写体の境界により分割された複数領域のうち、距離値が一定値以上(ここではカメラの限界測定可能距離Xm以上)の領域8Aと、距離値が水平画素方向または垂直画素方向に一定の傾きを維持して変化している領域8Bとを示した図である。すなわち、領域8Aは、距離画像において所定値(例えば、上記の限界測定可能距離Xm)よりも小さい距離を示す画素を含まない領域である。領域8Bは、ある方向(例えば、距離画像の垂直方向)において隣接画素間の差分が一様である領域である。
 ここで、領域8Aのように画面上部にてカメラの限界測定距離以上の領域が連続している領域については被写体が空または遠い背景などであることが明白であり、特定の物体としての人の認識処理を省略することができる。また、領域8Bのように距離値が一定の傾きを維持して変化している領域は3次元空間における高さが非常に低い物体が連続していることから、地面(ここでは道路も含む)であることが明白であり、同様に人の認識処理を省略することができる。すなわち、これまで被写体の全領域において人の識別処理に必要な特徴量の計算を実施していたのに対して、画像認識装置100では、輝度画像と距離画像とにより得られた被写体の境界領域を、さらに特徴量の計算を行う領域と行わない領域とに絞り込むことによって、不要な領域の計算を省略し計算速度、すなわち認識速度を向上させることができる。例えば、図8に示した領域8Aと領域8Bを、特徴量算出の対象から除外する領域として計算を省略した場合、約2倍の認識速度が見込める。
 以上説明してきたように、画像認識装置100は、複数の被写体からの反射光を用いて距離信号と輝度信号とを生成するカメラ部10と、前記距離信号から距離画像を生成し、前記輝度信号から輝度画像を生成する画像生成部20と、画像認識をする画像認識処理部30とを備え、前記画像認識処理部30は、前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し、前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い、前記複数の領域のうち前記第1の領域を除外して画像認識処理を実行する。
 これによれば、高解像度の画像全領域を物体検出しても検出速度の低下を少なくし、複雑な背景画像においても認識精度の低下を少なくすることができる。
 ここで、前記画像認識処理部30は、前記複数の領域に分割された前記距離画像から得られた距離値に基づいて、前記判定を行ってもよい。
 ここで、前記画像認識処理部30は、前記複数の領域のうち、前記距離画像において所定値よりも小さい距離を示す画素を含まない領域を前記第1の領域と判定してもよい。
 これによれば、空または遠い背景などを第1の領域に含めることができる。
 ここで、前記画像認識処理部30は、前記距離画像における前記複数の領域のうち、隣接画素間の差分が一様である領域を前記第1の領域と判定してもよい。
 これによれば、地面や道路などを第1の領域に含めることができる。
 ここで、前記画像認識処理部30は、前記距離画像において、隣接画素で得られた距離値の差分が閾値以上の場合に、前記隣接画素間を前記複数の領域の境界としてもよい。
 これによれば、距離値により境界を求めるので領域の分割精度を高めることができる。
 ここで、前記カメラ部10は、前記距離信号と前記輝度信号とを生成する撮像素子14を有していてもよい。
 これによれば、距離画像と輝度画像とは同じカメラで生成されるので、光軸補正等の処理が不要であり、輝度画像と距離画像とを別々のカメラで取得した場合と比較し、コストだけでなく認識速度の点でも効果的である。
 また、図9に示されるように、画像認識装置100によって実行される画像認識方法は、カメラの撮像により、距離値を示す画素データを含む距離画像と、輝度値を示す画素データを含む輝度画像とを生成し(S11)、前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し(S12)、前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い(S13)、前記複数の領域のうち前記第1の領域を除外して画像認識を実行する(S14)。図9は、画像認識装置100が実行する画像認識方法のフローチャートである。
 (その他の実施の形態)
 以上、一つまたは複数の態様に係る画像認識装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。
 例えば、上記各実施の形態において、光源制御部、画像認識処理部、画像認識処理部などの各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 また、本開示の包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
 本開示に係る画像認識装置は、例えば、車載用のセンサに好適に利用可能である。
10 カメラ部
11 光源
12 光源制御部
13 カメラレンズ
14 撮像素子
20 画像生成部
21 距離画像生成部
22 輝度画像生成部
30 画像認識処理部
31 領域判定部
32 画像抽出部
33 特徴量計算部
34 認識処理部
100 画像認識装置

Claims (7)

  1.  複数の被写体からの反射光を用いて距離信号と輝度信号とを生成するカメラ部と、
     前記距離信号から距離画像を生成し、前記輝度信号から輝度画像を生成する画像生成部と、
     画像認識をする画像認識処理部とを備え、
     前記画像認識処理部は、
     前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し、
     前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い、
     前記複数の領域のうち前記第1の領域を除外して画像認識処理を実行する
    画像認識装置。
  2.  前記画像認識処理部は、前記複数の領域に分割された前記距離画像から得られた距離値に基づいて、前記判定を行う
    請求項1に記載の画像認識装置。
  3.  前記画像認識処理部は、前記複数の領域のうち、前記距離画像において所定値よりも小さい距離を示す画素を含まない領域を前記第1の領域と判定する
    請求項2に記載の画像認識装置。
  4.  前記画像認識処理部は、前記距離画像における前記複数の領域のうち、隣接画素間の差分が一様である領域を前記第1の領域と判定する
    請求項2または3に記載の画像認識装置。
  5.  前記画像認識処理部は、前記距離画像において、隣接画素で得られた距離値の差分が閾値以上の場合に、前記隣接画素間を前記複数の領域の境界とする
    請求項1~4のいずれか1項に記載の画像認識装置。
  6.  前記カメラ部は、前記距離信号と前記輝度信号とを生成する撮像素子を有する
    請求項1~3のいずれか1項に記載の画像認識装置。
  7.  カメラの撮像により、距離値を示す画素データを含む距離画像と、輝度値を示す画素データを含む輝度画像とを生成し、
     前記距離画像および前記輝度画像を、それぞれ複数の領域に分割し、
     前記複数の領域のそれぞれについて、特定の物体が存在しないことが明白な第1の領域、および、それ以外の第2の領域のいずれであるかの判定を行い、
     前記複数の領域のうち前記第1の領域を除外して画像認識を実行する
    画像認識方法。
PCT/JP2016/005037 2015-12-08 2016-12-01 画像認識装置および画像認識方法 WO2017098709A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017554783A JP6358552B2 (ja) 2015-12-08 2016-12-01 画像認識装置および画像認識方法
CN201680065134.9A CN108351964B (zh) 2015-12-08 2016-12-01 图像识别装置及图像识别方法
EP16872611.5A EP3389008A4 (en) 2015-12-08 2016-12-01 Image recognition device and image recognition method
US15/960,050 US10339405B2 (en) 2015-12-08 2018-04-23 Image recognition device and image recognition method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-239726 2015-12-08
JP2015239726 2015-12-08

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/960,050 Continuation US10339405B2 (en) 2015-12-08 2018-04-23 Image recognition device and image recognition method

Publications (1)

Publication Number Publication Date
WO2017098709A1 true WO2017098709A1 (ja) 2017-06-15

Family

ID=59013962

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/005037 WO2017098709A1 (ja) 2015-12-08 2016-12-01 画像認識装置および画像認識方法

Country Status (5)

Country Link
US (1) US10339405B2 (ja)
EP (1) EP3389008A4 (ja)
JP (1) JP6358552B2 (ja)
CN (1) CN108351964B (ja)
WO (1) WO2017098709A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019188389A1 (ja) * 2018-03-29 2019-10-03 ソニー株式会社 信号処理装置、および信号処理方法、プログラム、並びに移動体
JP2019203959A (ja) * 2018-05-22 2019-11-28 キヤノン株式会社 撮像装置、及びその制御方法
JP2021043633A (ja) * 2019-09-10 2021-03-18 株式会社豊田中央研究所 物体識別装置、及び物体識別プログラム
JP2023170536A (ja) * 2022-05-19 2023-12-01 キヤノン株式会社 画像処理装置、画像処理方法、移動体、及びコンピュータプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7117646B2 (ja) * 2018-09-03 2022-08-15 パナソニックIpマネジメント株式会社 距離測定装置
JP6726324B1 (ja) * 2019-01-17 2020-07-22 オリンパス株式会社 撮像装置、画像合成方法、及び画像合成プログラム
KR20220010885A (ko) 2020-07-20 2022-01-27 에스케이하이닉스 주식회사 ToF 센서를 이용한 모션 인식 장치 및 이의 동작 방법
US11854239B2 (en) 2021-01-07 2023-12-26 Canon Kabushiki Kaisha Image processing device, imaging device, image processing method, and recording medium
CN116456199B (zh) * 2023-06-16 2023-10-03 Tcl通讯科技(成都)有限公司 拍摄补光方法、装置、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55559B2 (ja) 1977-05-16 1980-01-08
JP2011128756A (ja) * 2009-12-16 2011-06-30 Fuji Heavy Ind Ltd 物体検出装置
WO2014073322A1 (ja) * 2012-11-08 2014-05-15 日立オートモティブシステムズ株式会社 物体検出装置及び物体検出方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010140613A1 (ja) 2009-06-03 2010-12-09 学校法人中部大学 物体検出装置
CN102122390B (zh) * 2011-01-25 2012-11-14 于仕琪 基于深度图像进行人体检测的方法
CN102737370B (zh) * 2011-04-02 2015-07-01 株式会社理光 检测图像前景的方法及设备
CN104427291B (zh) * 2013-08-19 2018-09-28 华为技术有限公司 一种图像处理方法及设备
CN103714321B (zh) * 2013-12-26 2017-09-26 苏州清研微视电子科技有限公司 基于距离图像和强度图像的驾驶员人脸定位系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55559B2 (ja) 1977-05-16 1980-01-08
JP2011128756A (ja) * 2009-12-16 2011-06-30 Fuji Heavy Ind Ltd 物体検出装置
WO2014073322A1 (ja) * 2012-11-08 2014-05-15 日立オートモティブシステムズ株式会社 物体検出装置及び物体検出方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3389008A4

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019188389A1 (ja) * 2018-03-29 2019-10-03 ソニー株式会社 信号処理装置、および信号処理方法、プログラム、並びに移動体
CN111886626A (zh) * 2018-03-29 2020-11-03 索尼公司 信号处理设备和信号处理方法、程序及移动体
JPWO2019188389A1 (ja) * 2018-03-29 2021-03-18 ソニー株式会社 信号処理装置、および信号処理方法、プログラム、並びに移動体
JP7351293B2 (ja) 2018-03-29 2023-09-27 ソニーグループ株式会社 信号処理装置、および信号処理方法、プログラム、並びに移動体
US11860640B2 (en) 2018-03-29 2024-01-02 Sony Corporation Signal processing device and signal processing method, program, and mobile body
JP2019203959A (ja) * 2018-05-22 2019-11-28 キヤノン株式会社 撮像装置、及びその制御方法
JP7118737B2 (ja) 2018-05-22 2022-08-16 キヤノン株式会社 撮像装置、及びその制御方法
JP2021043633A (ja) * 2019-09-10 2021-03-18 株式会社豊田中央研究所 物体識別装置、及び物体識別プログラム
JP7235308B2 (ja) 2019-09-10 2023-03-08 株式会社豊田中央研究所 物体識別装置、及び物体識別プログラム
JP2023170536A (ja) * 2022-05-19 2023-12-01 キヤノン株式会社 画像処理装置、画像処理方法、移動体、及びコンピュータプログラム
JP7483790B2 (ja) 2022-05-19 2024-05-15 キヤノン株式会社 画像処理装置、画像処理方法、移動体、及びコンピュータプログラム

Also Published As

Publication number Publication date
US20180247148A1 (en) 2018-08-30
JP6358552B2 (ja) 2018-07-18
CN108351964B (zh) 2019-10-18
JPWO2017098709A1 (ja) 2018-04-05
CN108351964A (zh) 2018-07-31
US10339405B2 (en) 2019-07-02
EP3389008A1 (en) 2018-10-17
EP3389008A4 (en) 2018-11-21

Similar Documents

Publication Publication Date Title
JP6358552B2 (ja) 画像認識装置および画像認識方法
US11390276B2 (en) Control device, control method, and non-transitory storage medium
JP4263737B2 (ja) 歩行者検知装置
US9047518B2 (en) Method for the detection and tracking of lane markings
JP5747549B2 (ja) 信号機検出装置及びプログラム
Eum et al. Enhancing light blob detection for intelligent headlight control using lane detection
US9965690B2 (en) On-vehicle control device
US9460343B2 (en) Method and system for proactively recognizing an action of a road user
US9619895B2 (en) Image processing method of vehicle camera and image processing apparatus using the same
JP4732985B2 (ja) 画像処理装置
JP2013232091A (ja) 接近物体検知装置、接近物体検知方法及び接近物体検知用コンピュータプログラム
JP4528283B2 (ja) 車両周辺監視装置
JP2018063680A (ja) 交通信号認識方法および交通信号認識装置
CN106573588A (zh) 驾驶辅助装置、驾驶辅助方法和程序
JP6782433B2 (ja) 画像認識装置
JP2009298344A (ja) 車両灯火判定装置及びプログラム
JP6483360B2 (ja) 対象物認識装置
JP2011103058A (ja) 誤認識防止装置
JP4765113B2 (ja) 車両周辺監視装置、車両、車両周辺監視用プログラム、車両周辺監視方法
KR101340014B1 (ko) 위치 정보 제공 장치 및 방법
US9030560B2 (en) Apparatus for monitoring surroundings of a vehicle
JP2010020557A (ja) 画像処理装置及び画像処理方法
JP2014203196A (ja) 危険度判定装置、危険度判定方法、警報装置、及び運転支援装置
KR20140096576A (ko) 차량 검지 장치 및 차량 검지 방법
JP6943092B2 (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16872611

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017554783

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE