WO2021084833A1 - 物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器 - Google Patents

物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器 Download PDF

Info

Publication number
WO2021084833A1
WO2021084833A1 PCT/JP2020/029804 JP2020029804W WO2021084833A1 WO 2021084833 A1 WO2021084833 A1 WO 2021084833A1 JP 2020029804 W JP2020029804 W JP 2020029804W WO 2021084833 A1 WO2021084833 A1 WO 2021084833A1
Authority
WO
WIPO (PCT)
Prior art keywords
event
pixels
unit
recognition system
object recognition
Prior art date
Application number
PCT/JP2020/029804
Other languages
English (en)
French (fr)
Inventor
健太 遠藤
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to CN202080074125.2A priority Critical patent/CN114600116A/zh
Priority to US17/771,217 priority patent/US11869273B2/en
Priority to EP20882429.2A priority patent/EP4053500B1/en
Priority to JP2021554089A priority patent/JPWO2021084833A1/ja
Publication of WO2021084833A1 publication Critical patent/WO2021084833A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • G01B11/25Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures by projecting a pattern, e.g. one or more lines, moiré fringes on the object
    • G01B11/254Projection of a pattern, viewing through a pattern, e.g. moiré
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/02Measuring arrangements characterised by the use of optical techniques for measuring length, width or thickness
    • G01B11/026Measuring arrangements characterised by the use of optical techniques for measuring length, width or thickness by measuring distance between sensor and object
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • G01B11/25Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures by projecting a pattern, e.g. one or more lines, moiré fringes on the object
    • G01B11/2513Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures by projecting a pattern, e.g. one or more lines, moiré fringes on the object with several lines being projected in more than one direction, e.g. grids, patterns
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J1/00Photometry, e.g. photographic exposure meter
    • G01J1/42Photometry, e.g. photographic exposure meter using electric radiation detectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/02Systems using reflection of radio waves, e.g. primary radar systems; Analogous systems
    • G01S13/06Systems determining position data of a target
    • G01S13/08Systems for measuring distance only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/169Holistic features and representations, i.e. based on the facial image taken as a whole
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/56Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/71Circuitry for evaluating the brightness variation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/74Circuitry for compensating brightness variation in the scene by influencing the scene brightness using illuminating means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/76Circuitry for compensating brightness variation in the scene by influencing the image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/50Control of the SSIS exposure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/703SSIS architectures incorporating pixels for producing signals other than image signals
    • H04N25/707Pixels for event detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Definitions

  • This disclosure relates to an object recognition system, a signal processing method of the object recognition system, and an electronic device.
  • a structured light method technology using a dynamic projector and a dynamic visual camera is available. It has been proposed (see, for example, Patent Document 1).
  • a predetermined pattern of dot light is projected from a dynamic projector onto the object / subject to be measured, and the degree of distortion of the pattern is analyzed based on the imaging result by the dynamic visual camera to obtain depth information. / Distance information will be acquired.
  • a vertical cavity surface emitting laser (VCSEL: Vertical Cavity Surface Emitting Laser) is used as a dynamic projector which is a light source unit, and DVS (Dynamic Vision) is used as a dynamic visual camera which is a light receiving unit.
  • VCSEL Vertical Cavity Surface Emitting Laser
  • DVS Dynamic Vision
  • a technique using an event detection sensor called Sensor) is disclosed.
  • the event detection sensor is a sensor that detects as an event that the change in the brightness of the pixel that photoelectrically converts the incident light exceeds a predetermined threshold value.
  • the present disclosure discloses a signal processing method of an object recognition system and an object recognition system that can remove noise caused by flare and the like generated under high-intensity light and reduce the burden of signal processing in the subsequent stage, and the object recognition.
  • An object of the present invention is to provide an electronic device having a system.
  • the object recognition system of the present disclosure for achieving the above object is A light source unit that irradiates a subject with a predetermined pattern of dot light, An event detection sensor that receives a predetermined pattern of dot light reflected by the subject and detects as an event that the change in pixel brightness exceeds a predetermined threshold value, and A signal processing unit that performs processing to remove an event as noise when a plurality of consecutive pixels having a predetermined number of pixels or more detect the occurrence of an event within a certain period of time in the pixel array unit of the event detection sensor. To be equipped.
  • a light source unit that irradiates the subject with a predetermined pattern of dot light
  • An event detection sensor that receives a predetermined pattern of dot light reflected by the subject and detects as an event that the change in pixel brightness exceeds a predetermined threshold value.
  • the electronic device of the present disclosure for achieving the above object has an object recognition system having the above configuration.
  • FIG. 1A is a schematic diagram showing an example of a system configuration of an object recognition system to which the technique according to the present disclosure is applied
  • FIG. 1B is a block diagram showing an example of a circuit configuration of the object recognition system
  • FIG. 2A is a diagram showing an array dot arrangement of the light source of the vertical resonator type surface emitting laser in the object recognition system of the present disclosure
  • FIG. 2B is a diagram showing a random dot arrangement as opposed to the array dot arrangement
  • FIG. 3 is a block diagram showing an example of the configuration of the event detection sensor according to the first configuration example in the object recognition system to which the technique according to the present disclosure is applied.
  • FIG. 1A is a schematic diagram showing an example of a system configuration of an object recognition system to which the technique according to the present disclosure is applied
  • FIG. 1B is a block diagram showing an example of a circuit configuration of the object recognition system
  • FIG. 2A is a diagram showing an array dot arrangement of the light source of the vertical resonator type
  • FIG. 4 is a block diagram showing an example of the configuration of the pixel array unit in the event detection sensor according to the first configuration example.
  • FIG. 5 is a circuit diagram showing an example of a pixel circuit configuration in the event detection sensor according to the first configuration example.
  • FIG. 6 is a block diagram showing a first configuration example of the address event detection unit in the event detection sensor according to the first configuration example.
  • FIG. 7 is a circuit diagram showing an example of the configuration of the current-voltage conversion unit in the address event detection unit according to the first configuration example.
  • FIG. 8 is a circuit diagram showing an example of the configuration of the subtractor and the quantizer in the address event detection unit according to the first configuration example.
  • FIG. 9 is a block diagram showing a second configuration example of the address event detection unit in the event detection sensor according to the first configuration example.
  • FIG. 10 is a block diagram showing an example of the configuration of the event detection sensor according to the second configuration example in the object recognition system to which the technique according to the present disclosure is applied.
  • FIG. 11 is an exploded perspective view showing an outline of a stacked chip structure of an event detection sensor in an object recognition system.
  • FIG. 12 is a block diagram showing an example of a circuit configuration for realizing the signal processing according to the first embodiment, and illustrates a configuration in which the unit detected as a noise event is five pixels continuous in the row direction.
  • FIG. 13 is a block diagram showing a configuration in which the unit detected as a noise event is 5 pixels continuous in the column direction.
  • FIG. 14 is a block diagram showing a configuration in which the unit detected as a noise event is 5 pixels continuously in the oblique direction.
  • FIG. 15A is a diagram schematically showing noise events N 1 to N 3 caused by flare or the like when the sun enters the background
  • FIG. 15B is an example of a signal processing method of the object recognition system of the present disclosure. It is a flowchart which shows.
  • FIG. 16 is a diagram schematically showing a minute noise event N 11 such as sensor noise and a large noise event N 12 based on a light spot reflected by a background behind the face.
  • FIG. 17A is a functional block diagram of the signal processing unit for realizing the signal processing according to the third embodiment, and FIG.
  • FIG. 17B shows the size of the spot light incident on the event detection sensor due to the difference in the distance to the subject. It is a conceptual diagram showing the difference.
  • FIG. 18 is a flowchart showing an example of signal processing according to the fourth embodiment.
  • FIG. 19 is an external view of a smartphone, which is an example of the electronic device of the present disclosure, as viewed from the front side.
  • Pixel circuit configuration example 2-3-3 First example of address event detection unit 2-3-4. Configuration example of current-voltage converter 2-3-5. Configuration example of subtractor and quantizer 2-3-6. Second configuration example of the address event detection unit 2-4. Event detection sensor (scan method) according to the second configuration example 2-5. Configuration example of chip structure 2-6. Configuration example of column processing unit 2-7. About noise events 3. Object recognition system according to the embodiment of the present disclosure 3-1. Example 1 (Example of removing noise caused by flare or the like as a noise event) 3-2. Example 2 (Example of setting a lower limit threshold value and an upper limit threshold value for detecting a true event) 3-3.
  • Example 3 Example of changing the number of pixels of the lower limit threshold value and the upper limit threshold value for detecting a true event according to the distance to the subject
  • Example 4 Example of processing for face recognition when applied to face recognition
  • Modification example 5 Application example 6.
  • Electronic device of the present disclosure (example of smartphone) 7. Configuration that can be taken by this disclosure
  • a plurality of pixels are configured to be a group of pixels continuous in at least one direction in the row direction, the column direction, and the diagonal direction in the pixel array portion of the event detection sensor. Can be.
  • the number of first pixels adjacent to each other is set as the lower limit threshold, and the number of pixels adjacent to each other is larger than the number of first pixels.
  • the number of second pixels is set as the upper limit threshold, when each of the adjacent pixels of the first pixel number or more and the second pixel number or less detects the occurrence of an event within a certain period of time in the signal processing unit. It can be configured to be read out as event information derived from dot light of a predetermined pattern. Further, the signal processing unit may be configured to remove the event as noise when the occurrence of the event is detected by a number of pixels smaller than the number of the first pixels.
  • the lower limit threshold value (first number of pixels) and the upper limit threshold value (second number of pixels) of the signal processing unit are set according to the distance to the subject.
  • the number of pixels) can be changed.
  • the signal processing unit has a distance measuring function for measuring the distance to the subject, and the distance to the subject is measured by this distance measuring function, or the distance to the subject is measured by using the proximity sensor. It can be configured.
  • the light source unit is configured to be composed of a surface emitting semiconductor laser, and the surface emitting semiconductor laser is a vertical resonator type surface emitting laser. Is preferable.
  • the configuration used for face authentication can be used. Then, in the face recognition process, the face at a specific position is detected by using the vertical resonator type surface emitting laser and the event detection sensor, which are the light source units, and then the detected face feature is recognized. Next, the shape of the recognized face can be recognized, and finally, the shape-recognized face can be authenticated.
  • the object recognition system to which the technique according to the present disclosure is applied is composed of a set of point light sources, and is composed of a combination of a light source unit capable of controlling light emission / non-light emission in units of point light sources and an event detection sensor for detecting an event.
  • the object recognition system to which the technique according to the present disclosure is applied has a function of acquiring a three-dimensional (3D) image and a function of measuring the distance to the subject.
  • 3D three-dimensional
  • a three-dimensional image is acquired by identifying the coordinates of a point image (spot light) and from which point light source the point image is projected by pattern matching.
  • the object recognition system to which the technique according to the present disclosure is applied has a function of acquiring a three-dimensional image, it can be said to be a three-dimensional image acquisition system, and since it has a function of measuring the distance to the subject, it has a function. It can be called a distance measurement system. Further, the object recognition system to which the technique according to the present disclosure is applied can be called a face recognition system because face recognition is also possible when the subject is, for example, a human face.
  • FIG. 1A is a schematic diagram showing an example of a system configuration of an object recognition system to which the technique according to the present disclosure is applied
  • FIG. 1B is a block diagram showing an example of a circuit configuration of the object recognition system.
  • the object recognition system 1 to which the technique according to the present disclosure is applied is composed of a set of point light sources, and as a light source unit for irradiating a subject with dot light of a predetermined pattern, a surface emitting semiconductor laser, for example, a vertical resonator type surface emitting laser (VCSEL: Vertical Cavity Surface Emitting Laser) 10 is used, and an event detection sensor 20 called DVS (Dynamic Vision Sensor) is used as a light receiving unit.
  • a surface emitting semiconductor laser for example, a vertical resonator type surface emitting laser (VCSEL: Vertical Cavity Surface Emitting Laser) 10
  • DVS Dynamic Vision Sensor
  • As the light source unit that irradiates the subject with a predetermined pattern of dot light an ordinary end face emitting semiconductor laser (LD) or the like can be exemplified in addition to the vertical cavity type surface emitting laser (VCSEL).
  • LD vertical cavity type surface emitting laser
  • the vertical resonator type surface emitting laser 10 can control light emission / non-emission in units of a point light source, and projects, for example, a predetermined pattern of dot light onto the subject 200.
  • the event detection sensor 20 has IR (infrared light) sensitivity, receives dot light reflected by the subject 200, and detects as an event that the change in the brightness of the pixels exceeds a predetermined threshold value.
  • the event detection sensor 20 is a sensor that can realize high speed, data saving, and low power consumption by reading only the signal of a pixel having a change in brightness.
  • the object recognition system 1 to which the technique according to the present disclosure is applied includes a system control unit 100, a light source drive unit 40, and a sensor control in addition to the vertical resonator type surface emitting laser (VCSEL) 10 and the event detection sensor (DVS) 20.
  • a unit 50, a signal processing unit 60, a light source side optical system 70, and a camera side optical system 80 are provided. Details of the vertical resonator type surface emitting laser 10 and the event detection sensor 20 will be described later.
  • the system control unit 100 is composed of, for example, a processor (CPU), drives a vertical resonator type surface emitting laser 10 via a light source drive unit 40, and drives an event detection sensor 20 via a sensor control unit 50. ..
  • a processor CPU
  • the system control unit 100 controls them in synchronization with each other.
  • VCSEL Very cavity type surface emitting laser
  • the arrangement of the point light sources (dots) 11 of the vertical resonator type surface emitting laser 10 will be described.
  • the arrangement of the point light sources 11 of the vertical resonator type surface emitting laser 10 is arranged in an array of the point light sources 11 at a constant pitch (matrix) as shown in FIG. 2A. It is a so-called array dot arrangement, which is two-dimensionally arranged in a shape).
  • the point light source 11 of the vertical resonator type surface emitting laser 10 is sequentially turned on and the event time recorded by the event detection sensor 20 is recorded.
  • the stamp that is, the time information (time information) representing the relative time when the event occurred, it is possible to easily identify which point light source 11 the image is projected from.
  • the point light source 11 has a unique arrangement without repetition, and the point light source 11 has a characteristic in the spatial direction, as compared with the case of the so-called random dot arrangement. Since the number can be increased, there is an advantage that the resolution of the distance image determined by the number of point light sources 11 can be increased.
  • the "distance image” is an image for obtaining distance information to the subject.
  • the arrangement of the point light source 11 of the vertical resonator type surface emitting laser 10 in the object recognition system 1 to which the technique according to the present disclosure is applied is not limited to the array dot arrangement, and may be a random dot arrangement. it can.
  • the vertical resonator type surface emitting laser 10 is a surface emitting light source that can control light emission / non-emission in units of a point light source 11 under the control of the system control unit 100. Therefore, the vertical resonator type surface emitting laser 10 can irradiate the subject with light over the entire surface, and is desired by dot irradiation in a point light source unit, line irradiation in a pixel row unit, and the like. It is possible to partially irradiate the dot light of the pattern of.
  • the shape of the subject can be recognized by irradiating the subject (distance measuring object) with light from a plurality of point light sources 11 at different angles and reading the reflected light from the subject.
  • the event detection sensor 20 that detects as an event that the change in the brightness of the pixel exceeds a predetermined threshold value will be described.
  • FIG. 3 is a block diagram showing an example of the configuration of the event detection sensor according to the first configuration example, which can be used as the event detection sensor 20 in the object recognition system 1.
  • the event detection sensor 20 is an asynchronous event detection sensor called DVS, and is a pixel array unit 21, a drive unit 22, an arbiter unit (arbitration unit) 23, and column processing. It is configured to include a unit 24 and a signal processing unit 25.
  • a plurality of pixels 30 are two-dimensionally arranged in a matrix (array) in the pixel array unit 21.
  • a vertical signal line VSL which will be described later, is wired for each pixel sequence with respect to this matrix-like pixel array.
  • Each of the plurality of pixels 30 generates an analog signal having a voltage corresponding to the photocurrent as a pixel signal. Further, each of the plurality of pixels 30 detects the presence or absence of an address event depending on whether or not the amount of change in the photocurrent exceeds a predetermined threshold value. Then, when the address event occurs, the pixel 30 outputs the request to the arbiter unit 23.
  • the drive unit 22 drives each of the plurality of pixels 30 to output the pixel signal generated by each pixel 30 to the column processing unit 24.
  • the arbiter unit 23 arbitrates the requests from each of the plurality of pixels 30, and transmits a response based on the arbitration result to the pixels 30.
  • the pixel 30 that has received the response from the arbiter unit 23 supplies a detection signal (address event detection signal) indicating the detection result to the drive unit 22 and the signal processing unit 25.
  • a detection signal address event detection signal
  • the column processing unit 24 is composed of, for example, an analog-digital converter, and performs a process of converting an analog pixel signal output from the pixels 30 of the pixel array unit 21 into a digital signal for each pixel array of the pixel array unit 21. Then, the column processing unit 24 supplies the digital signal after the analog-to-digital conversion to the signal processing unit 25.
  • the signal processing unit 25 executes predetermined signal processing such as CDS (Correlated Double Sampling) processing and image recognition processing on the digital signal supplied from the column processing unit 24. Then, the signal processing unit 25 supplies the data indicating the processing result and the detection signal supplied from the arbiter unit 23 to the recording unit 12 (see FIG. 1) via the signal line 14.
  • predetermined signal processing such as CDS (Correlated Double Sampling) processing and image recognition processing
  • FIG. 4 is a block diagram showing an example of the configuration of the pixel array unit 21 in the event detection sensor 20 according to the first configuration example.
  • each of the plurality of pixels 30 has a light receiving unit 31, a pixel signal generation unit 32, and an address event detection unit 33. ing.
  • the light receiving unit 31 photoelectrically converts the incident light to generate a photocurrent. Then, the light receiving unit 31 supplies the photocurrent generated by photoelectric conversion to either the pixel signal generation unit 32 or the address event detection unit 33 under the control of the drive unit 22 (see FIG. 3).
  • the pixel signal generation unit 32 generates a signal having a voltage corresponding to the optical current supplied from the light receiving unit 31 as a pixel signal SIG, and the generated pixel signal SIG is generated by the column processing unit 24 via the vertical signal line VSL (FIG. FIG. 3).
  • the address event detection unit 33 detects the presence or absence of an address event depending on whether or not the amount of change in the photocurrent from each of the light receiving units 31 exceeds a predetermined threshold value.
  • the address event includes, for example, an on-event indicating that the amount of change in photocurrent exceeds the upper limit threshold value and an off-event indicating that the amount of change has fallen below the lower limit threshold value.
  • the address event detection signal is composed of, for example, one bit indicating the on-event detection result and one bit indicating the off-event detection result.
  • the address event detection unit 33 may be configured to detect only on-events.
  • the address event detection unit 33 When an address event occurs, the address event detection unit 33 supplies a request for transmitting an address event detection signal to the arbiter unit 23 (see FIG. 3). Then, when the address event detection unit 33 receives the response to the request from the arbiter unit 23, the address event detection unit 33 supplies the address event detection signal to the drive unit 22 and the signal processing unit 25.
  • FIG. 5 is a circuit diagram showing an example of the circuit configuration of the pixel 30 in the event detection sensor 20 according to the first configuration example.
  • each of the plurality of pixels 30 has a light receiving unit 31, a pixel signal generation unit 32, and an address event detection unit 33.
  • the light receiving unit 31 has a light receiving element (photoelectric conversion element) 311, a transfer transistor 312, and an OFG (Over Flow Gate) transistor 313.
  • a light receiving element photoelectric conversion element
  • a transfer transistor 312 As the transfer transistor 312 and the OFG transistor 313, for example, an N-type MOS (Metal Oxide Semiconductor) transistor is used.
  • the transfer transistor 312 and the OFG transistor 313 are connected in series with each other.
  • the light receiving element 311 is connected between the common connection node N 1 of the transfer transistor 312 and the OFG transistor 313 and the ground, and photoelectrically converts the incident light to generate a charge amount corresponding to the light amount of the incident light. To do.
  • the transfer signal TRG is supplied from the drive unit 22 shown in FIG. 3 to the gate electrode of the transfer transistor 312.
  • the transfer transistor 312 supplies the charge photoelectrically converted by the light receiving element 311 to the pixel signal generation unit 32 in response to the transfer signal TRG.
  • a control signal OFG is supplied from the drive unit 22 to the gate electrode of the OFG transistor 313.
  • the OFG transistor 313 supplies the electric signal generated by the light receiving element 311 to the address event detection unit 33 in response to the control signal OFG.
  • the electrical signal supplied to the address event detection unit 33 is a photocurrent composed of electric charges.
  • the pixel signal generation unit 32 has a reset transistor 321 and an amplification transistor 322, a selection transistor 323, and a floating diffusion layer 324.
  • a reset transistor 321 and an amplification transistor 322, a selection transistor 323, and a floating diffusion layer 324 As the reset transistor 321 and the amplification transistor 322 and the selection transistor 323, for example, an N-type MOS transistor is used.
  • the pixel signal generation unit 32 is supplied with electric charges that have been photoelectrically converted by the light receiving element 311 by the transfer transistor 312 from the light receiving unit 31.
  • the electric charge supplied from the light receiving unit 31 is accumulated in the floating diffusion layer 324.
  • the floating diffusion layer 324 generates a voltage signal having a voltage value corresponding to the amount of accumulated charge. That is, the floating diffusion layer 324 converts the electric charge into a voltage.
  • the reset transistor 321 is connected between the power supply line of the power supply voltage V DD and the floating diffusion layer 324.
  • a reset signal RST is supplied from the drive unit 22 to the gate electrode of the reset transistor 321.
  • the reset transistor 321 initializes (reset) the charge amount of the floating diffusion layer 324 in response to the reset signal RST.
  • the amplification transistor 322 is connected in series with the selection transistor 323 between the power supply line of the power supply voltage V DD and the vertical signal line VSL.
  • the amplification transistor 322 amplifies the charge-voltage-converted voltage signal in the floating diffusion layer 324.
  • the selection signal SEL is supplied from the drive unit 22 to the gate electrode of the selection transistor 323.
  • the selection transistor 323 outputs the voltage signal amplified by the amplification transistor 322 as a pixel signal SIG to the column processing unit 24 (see FIG. 3) via the vertical signal line VSL.
  • the drive unit 22 starts detecting an address event by the control unit 13 shown in FIG.
  • the control signal OFG is supplied to the OFG transistor 313 of the light receiving unit 31 to drive the OFG transistor 313 to supply an optical current to the address event detection unit 33.
  • the drive unit 22 turns off the OFG transistor 313 of the pixel 30 and stops the supply of the photocurrent to the address event detection unit 33.
  • the drive unit 22 drives the transfer transistor 312 by supplying the transfer signal TRG to the transfer transistor 312, and transfers the charge photoelectrically converted by the light receiving element 311 to the floating diffusion layer 324.
  • the event detection sensor 20 according to the first configuration example having the pixel array unit 21 in which the pixels 30 having the above configuration are arranged two-dimensionally, columns only the pixel signals of the pixels 30 in which the address event is detected. Output to the processing unit 24.
  • the power consumption of the event detection sensor 20 and the processing amount of image processing can be reduced as compared with the case where the pixel signals of all the pixels are output regardless of the presence or absence of the address event.
  • the configuration of the pixel 30 illustrated here is an example, and is not limited to this configuration example.
  • the OFG transistor 313 may be omitted in the light receiving unit 31, and the transfer transistor 312 may have the function of the OFG transistor 313.
  • FIG. 6 is a block diagram showing a first configuration example of the address event detection unit 33 in the event detection sensor 20 according to the first configuration example.
  • the address event detection unit 33 according to this configuration example has a current / voltage conversion unit 331, a buffer 332, a subtractor 333, a quantizer 334, and a transfer unit 335.
  • the current-voltage conversion unit 331 converts the photocurrent from the light receiving unit 33 of the pixel 30 into a logarithmic voltage signal.
  • the current-voltage conversion unit 331 supplies the converted voltage signal to the buffer 332.
  • the buffer 332 buffers the voltage signal supplied from the current-voltage conversion unit 331 and supplies it to the subtractor 333.
  • a row drive signal is supplied to the subtractor 333 from the drive unit 22.
  • the subtractor 333 lowers the level of the voltage signal supplied from the buffer 332 according to the row drive signal. Then, the subtractor 333 supplies the voltage signal after the level drop to the quantizer 334.
  • the quantizer 334 quantizes the voltage signal supplied from the subtractor 333 into a digital signal and outputs it to the transfer unit 335 as an address event detection signal.
  • the transfer unit 335 transfers the detection signal of the address event supplied from the quantizer 334 to the arbiter unit 23 and the like.
  • the transfer unit 335 supplies the arbiter unit 23 with a request for transmitting an address event detection signal. Then, when the transfer unit 335 receives the response to the request from the arbiter unit 23, the transfer unit 335 supplies the detection signal of the address event to the drive unit 22 and the signal processing unit 25.
  • FIG. 7 is a circuit diagram showing an example of the configuration of the current-voltage conversion unit 331 in the address event detection unit 33 according to the first configuration example.
  • the current-voltage conversion unit 331 according to this example has a circuit configuration including an N-type transistor 3311, a P-type transistor 3312, and an N-type transistor 3313.
  • transistors 3311 to 3313 for example, MOS transistors are used.
  • the N-type transistor 3311 is connected between the power supply line of the power supply voltage V DD and the signal input line 3314.
  • the P-type transistor 3312 and the N-type transistor 3313 are connected in series between the power supply line of the power supply voltage V DD and the ground.
  • the gate electrode of the N-type transistor 3311 and the input terminal of the buffer 332 shown in FIG. 6 are connected to the common connection node N 2 of the P-type transistor 3312 and the N-type transistor 3313.
  • a predetermined bias voltage V bias is applied to the gate electrode of the P-type transistor 3312.
  • the P-type transistor 3312 supplies a constant current to the N-type transistor 3313.
  • a photocurrent is input from the light receiving unit 31 to the gate electrode of the N-type transistor 3313 through the signal input line 3314.
  • the drain electrodes of the N-type transistor 3311 and the N-type transistor 3313 are connected to the power supply side, and such a circuit is called a source follower.
  • the photocurrent from the light receiving unit 31 is converted into a logarithmic voltage signal by these two source followers connected in a loop.
  • FIG. 8 is a circuit diagram showing an example of the configuration of the subtractor 333 and the quantizer 334 in the address event detection unit 33 according to the first configuration example.
  • the subtractor 333 has a configuration including a capacitance element 3331, an inverter circuit 3332, a capacitance element 3333, and a switch element 3334.
  • One end of the capacitance element 3331 is connected to the output terminal of the buffer 332 shown in FIG. 6, and the other end is connected to the input terminal of the inverter circuit 3332.
  • the capacitance element 3333 is connected in parallel to the inverter circuit 3332.
  • the switch element 3334 is connected between both ends of the capacitance element 3333.
  • a row drive signal is supplied from the drive unit 22 to the switch element 3334 as an open / close control signal.
  • the switch element 3334 opens and closes a path connecting both ends of the capacitance element 3333 in response to a row drive signal.
  • the inverter circuit 3332 inverts the polarity of the voltage signal input via the capacitance element 3331.
  • the charge Q 2 stored in the capacitance element 3333 is expressed by the following equation (3), where the capacitance value of the capacitance element 3333 is C 2 and the output voltage is V out.
  • Q 2 -C 2 x V out ... (3)
  • Equation (5) represents the subtraction operation of the voltage signal, and the gain of the subtraction result is C 1 / C 2 . Since it is usually desired to maximize the gain, it is preferable to design C 1 to be large and C 2 to be small. On the other hand, if C 2 is too small, kTC noise may increase and the noise characteristics may deteriorate . Therefore, the capacity reduction of C 2 is limited to the range in which noise can be tolerated. Further, since the address event detection unit 33 including the subtractor 333 is mounted on each pixel 30, the capacitance element 3331 and the capacitance element 3333 have an area limitation. In consideration of these, the capacitance values C 1 and C 2 of the capacitance elements 3331 and 3333 are determined.
  • the quantizer 334 is configured to have a comparator 3341.
  • the comparator 3341 has an output signal of the inverter circuit 3332, that is, a voltage signal from the subtractor 430 as a non-inverting (+) input, and a predetermined threshold voltage V th as an inverting ( ⁇ ) input. Then, the comparator 3341 compares the voltage signal from the subtractor 430 with the predetermined threshold voltage V th, and outputs a signal indicating the comparison result to the transfer unit 335 as an address event detection signal.
  • FIG. 9 is a block diagram showing a second configuration example of the address event detection unit 33 in the event detection sensor 20 according to the first configuration example.
  • the address event detection unit 33 according to the second configuration example includes a storage unit 336 in addition to the current-voltage conversion unit 331, the buffer 332, the subtractor 333, the quantizer 334, and the transfer unit 335. It is configured to have a control unit 337 and a control unit 337.
  • the storage unit 336 is provided between the quantizer 334 and the transfer unit 335, and based on the sample signal supplied from the control unit 337, the output of the quantizer 334, that is, the comparison result of the comparator 3341 is obtained. accumulate.
  • the storage unit 336 may be a sampling circuit such as a switch, plastic, or capacitance, or may be a digital memory circuit such as a latch or flip-flop.
  • the control unit 337 supplies a predetermined threshold voltage V th to the inverting ( ⁇ ) input terminal of the comparator 3341.
  • the threshold voltage V th supplied from the control unit 337 to the comparator 3341 may have different voltage values in time division. For example, the control unit 337 sets the threshold voltage V th1 corresponding to the on-event indicating that the amount of change in the optical current exceeds the upper limit threshold value and the off-event indicating that the amount of change has fallen below the lower limit threshold value.
  • one comparator 3341 can detect a plurality of types of address events.
  • the storage unit 336 uses, for example, the threshold voltage V th1 corresponding to the on-event during the period in which the threshold voltage V th2 corresponding to the off-event is supplied from the control unit 337 to the inverting (-) input terminal of the comparator 3341.
  • the comparison result of the comparator 3341 that has been used may be accumulated.
  • the storage unit 336 may be inside the pixel 30 or outside the pixel 30. Further, the storage unit 336 is not an essential component of the address event detection unit 33. That is, the storage unit 336 may be omitted.
  • the event detection sensor 20 is an asynchronous event detection sensor that reads an event by an asynchronous reading method.
  • the event reading method is not limited to the asynchronous reading method, and may be a synchronous reading method.
  • the event detection sensor to which the synchronous reading method is applied is a scan type event detection sensor, which is the same as a normal imaging device that performs imaging at a predetermined frame rate.
  • FIG. 10 shows an example of the configuration of the event detection sensor according to the second configuration example, that is, the scan type event detection sensor, which can be used as the event detection sensor 20 in the object recognition system 1 to which the technique according to the present disclosure is applied. It is a block diagram which shows.
  • the event detection sensor 20 has a configuration including a pixel array unit 21, a drive unit 22, a signal processing unit 25, a read area selection unit 27, and a signal generation unit 28. ing.
  • the pixel array unit 21 includes a plurality of pixels 30.
  • the plurality of pixels 30 output an output signal in response to the selection signal of the read area selection unit 27.
  • Each of the plurality of pixels 30 may have a comparator in the pixel, as shown in FIG. 8, for example.
  • the plurality of pixels 30 output an output signal corresponding to the amount of change in light intensity. As shown in FIG. 10, the plurality of pixels 30 may be two-dimensionally arranged in a matrix.
  • the drive unit 22 drives each of the plurality of pixels 30 to output the pixel signal generated by each pixel 30 to the signal processing unit 25.
  • the drive unit 22 and the signal processing unit 25 are circuit units for acquiring gradation information. Therefore, when only the event information is acquired, the drive unit 22 and the signal processing unit 25 may be omitted.
  • the read area selection unit 27 selects a part of the plurality of pixels 30 included in the pixel array unit 21. Specifically, the read area selection unit 27 determines the selection area in response to a request from each pixel 30 of the pixel array unit 21. For example, the read area selection unit 27 selects any one or a plurality of rows included in the structure of the two-dimensional matrix corresponding to the pixel array unit 21. The read area selection unit 27 sequentially selects one or a plurality of rows according to a preset cycle.
  • the signal generation unit 28 generates an event signal corresponding to the active pixel that has detected an event among the selected pixels, based on the output signal of the pixel selected by the read area selection unit 27.
  • An event is an event in which the intensity of light changes.
  • An active pixel is a pixel in which the amount of change in light intensity corresponding to an output signal exceeds or falls below a preset threshold value.
  • the signal generation unit 28 compares the output signal of a pixel with a reference signal, detects an active pixel that outputs an output signal when it is larger or smaller than the reference signal, and generates an event signal corresponding to the active pixel. ..
  • the signal generation unit 28 can be configured to include, for example, a column selection circuit that arbitrates the signal entering the signal generation unit 28. Further, the signal generation unit 28 can be configured to output not only the information of the active pixel that detected the event but also the information of the inactive pixel that does not detect the event.
  • the signal generation unit 28 outputs the address information and the time stamp information (for example, (X, Y, T)) of the active pixel that detected the event through the output line 15.
  • the data output from the signal generation unit 28 may be not only address information and time stamp information but also frame format information (for example, (0, 0, 1, 0, ...)). ..
  • FIG. 11 is an exploded perspective view showing an outline of a stacked chip structure of the event detection sensor 20.
  • the laminated chip structure is a structure in which at least two chips of the light receiving chip 201, which is the first chip, and the detection chip 202, which is the second chip, are laminated. It has become. Then, in the circuit configuration of the pixel 30 shown in FIG. 5, each of the light receiving elements 311 is arranged on the light receiving chip 201, and all the elements other than the light receiving element 311 and the elements of the other circuit parts of the pixel 30 are detected chips. Placed on 202.
  • the light receiving chip 201 and the detection chip 202 are electrically connected via a connecting portion such as a via (VIA), a Cu—Cu junction, or a bump.
  • each element of the light receiving unit 31 is arranged on the light receiving chip 201, and elements other than the light receiving unit 31 and elements of other circuit parts of the pixel 30 are arranged on the detection chip 202. It can be configured to be. Further, each element of the light receiving unit 31, the reset transistor 321 of the pixel signal generation unit 32, and the floating diffusion layer 324 can be arranged on the light receiving chip 201, and the other elements can be arranged on the detection chip 202. .. Further, a part of the elements constituting the address event detection unit 33 can be arranged on the light receiving chip 201 together with the elements of the light receiving unit 31 and the like.
  • the event detection sensor 20 emits a predetermined pattern of dot light (hereinafter, "dot pattern") emitted from the vertical resonator type surface emitting laser 10 to the subject as event information. Not only event information (true event) derived from (may be described as "light”) is output.
  • dot pattern a predetermined pattern of dot light
  • the object recognition system 1 is derived from dot pattern light (dot light of a predetermined pattern) emitted to a subject from a surface emitting semiconductor laser as a light source unit, for example, a vertical resonator type surface emitting laser 10.
  • dot pattern light dot light of a predetermined pattern
  • a surface emitting semiconductor laser as a light source unit
  • a vertical resonator type surface emitting laser for example, a vertical resonator type surface emitting laser 10.
  • Information other than the event information to be performed that is, noise caused by flare or the like generated under high-intensity light is removed, and the burden of signal processing in the subsequent stage can be reduced.
  • the first embodiment is an example of removing noise caused by flare or the like generated under high illuminance light as a noise event (false event).
  • a noise event false event
  • the first embodiment when a plurality of consecutive pixels of a predetermined number of pixels or more detect the occurrence of an event within a certain period in the pixel array unit 21 of the event detection sensor 20, this event is removed as a noise event (false event). Then, the event information derived from the dot pattern light radiated to the subject from the vertical resonator type surface emitting laser 10 is read out as a true event.
  • the signal processing according to the first embodiment is executed as one of the signal processing of the signal processing unit 60 shown in FIG. 1B.
  • the signal processing unit 60 has a filtering function for removing noise caused by flare or the like generated under high illuminance light as a noise event.
  • FIG. 12 shows an example of a circuit configuration for realizing the signal processing according to the first embodiment.
  • the pixel array unit 21 of the event detection sensor 20 that is, in the matrix-like pixel array, for example, five pixels continuous in the row direction are subjected to high-intensity light.
  • the unit is a unit for detecting noise caused by flare or the like generated below as a noise event, and the arithmetic circuit 41 is provided for each unit.
  • the arithmetic circuit 41 detects that an event has occurred within a certain period of time with five consecutive pixels 30 in the same row.
  • the signal processing unit 60 removes the event generated in five consecutive pixels in the row direction as a noise event caused by flare or the like generated under high-intensity light. Perform processing.
  • the unit to be detected as a noise event is set to 5 consecutive pixels in one pixel row, but it is not limited to 5 pixels, and is, for example, 4 consecutive pixels or 6 or more continuous pixels.
  • the pixel group is not limited to one pixel row, and a plurality of rows may be continuous in the row direction.
  • the matrix-shaped pixel array is not limited to a configuration that is continuous in the row direction, and may be a configuration that is continuous in the column direction as shown in FIG.
  • the number of continuous pixels is not limited to five pixels, and the number of continuous pixels is not limited to one pixel row, and a plurality of rows of consecutive pixels may be a pixel group continuous in the row direction.
  • the configuration may be composed of a group of pixels that are continuous in the oblique direction.
  • the configuration may be composed of a group of pixels that are continuous in the row direction, the column direction, and the diagonal direction. That is, the pixel array unit 21 of the event detection sensor 20 may be configured to include a group of pixels that are continuous in at least one direction in the row direction, the column direction, and the diagonal direction.
  • noise events caused by flares and the like generated under high-intensity light are removed, and the subject is irradiated from the vertical resonator type surface emitting laser 10. Since the event information derived from the dot pattern light can be read out as a true event, the burden of signal processing in the subsequent stage can be reduced.
  • FIG. 15A schematically illustrates noise events N 1 to N 3 caused by flare and the like when the sun enters the background.
  • the noise event N 1 that occurs linearly in the row direction can be detected by a group of pixels that are continuous in the row direction shown in FIG. 12, and the noise event N 2 that occurs linearly in the diagonal direction is shown in FIG. can be detected by the group of pixels continuous in the oblique direction as shown in, for noise events N 3 that occur linearly in the column direction, it can be detected by the group of pixels continuous in the row direction shown in FIG. 13. Therefore, in detecting noise events that occur linearly (linearly) in all directions, it is preferable to have a configuration that is continuous in the row direction, the column direction, and the diagonal direction.
  • the truth / falseness of the event information is determined by the hardware using the arithmetic circuit 41, but this is only an example and is not limited to the signal processing using the arithmetic circuit 41.
  • the signal processing unit 60 first acquires the outputs of five consecutive pixels 30 in the same line (step S1), and then determines whether or not an event has occurred within a certain period (step S2). Then, if the event occurs within a certain period of time (YES in S2), it is removed as a noise event (step S3), otherwise (NO in S2), it is derived from the dot pattern light emitted to the subject. Read as event information (true event) (step S4).
  • noise events N 1 to N 3 caused by flare and the like occur linearly (linearly), and the pixel group for detecting these is generated in the row direction, the column direction, or the diagonal direction.
  • the configuration is such that the noise events are arranged linearly in the direction, the shape of the noise event caused by flare or the like is learned by machine learning, and a continuous pixel group can be arranged according to the learning result.
  • the second embodiment is an example of setting a lower limit threshold value and an upper limit threshold value for detecting a true event derived from the dot pattern light applied to the subject.
  • the noise event is considered to occur independently for each pixel, for example.
  • the animal body has a certain size. Therefore, the event information derived from the dot pattern light emitted from the vertical resonator type surface emitting laser 10 to the subject is generated over the pixels in a certain region.
  • the event detection sensor 20 sets the lower limit threshold value and the upper limit threshold value as the threshold value for detecting the true event derived from the dot pattern light applied to the subject.
  • the distance to the subject that is, the distance between the subject and the event detection sensor 20
  • the distance between the subject and the event detection sensor 20 is a predetermined distance, for example, 2 pixels in the row direction ⁇ 2 pixels in the column direction are adjacent to each other.
  • a total of 4 pixels (the number of first pixels) is set as the lower limit of true event detection.
  • the object recognition system 1 As the "predetermined distance”, assuming that the object recognition system 1 according to the present embodiment is used as, for example, a face recognition system mounted on a smartphone, a smartphone and a human face holding the smartphone are used. The average distance between can be exemplified.
  • each pixel of a total of 9 pixels adjacent to each other for example, 3 pixels in the row direction ⁇ 3 pixels in the column direction, which is equal to or higher than the lower limit threshold value (number of first pixels) and equal to or lower than the upper limit threshold value (number of second pixels), is used for a certain period of time.
  • the event information derived from the dot pattern light applied to the subject that is, the true event is read out.
  • noise events in addition to linear noise events caused by flare and the like, as shown in FIG. 16, minute noise event N 11 caused by sensor noise and the like and light reflected by the background behind the face.
  • a large noise event N 12 based on a spot can be illustrated.
  • the lower limit threshold value and the upper limit threshold value are smaller than the lower limit threshold value, for example, sensor noise and the like. It is possible to reliably remove the noise event N 11 caused by the noise event N 11 and the noise event N 12 larger than the upper limit threshold value. Then, the event information equal to or higher than the lower limit threshold value and equal to or lower than the upper limit threshold value can be read out as event information derived from the dot pattern light applied to the subject, that is, as a true event.
  • the third embodiment is an example in which the number of pixels of the lower limit threshold value and the upper limit threshold value for detecting a true event is changed according to the distance to the subject (that is, the distance between the subject and the event detection sensor 20). ..
  • the signal processing unit 60 shown in FIG. 1B has a function of measuring the distance to the subject. By using this distance measurement function, the distance between the subject and the event detection sensor 20 can be measured.
  • the measurement of the distance between the subject and the event detection sensor 20 is not limited to using the distance measurement function of the signal processing unit 60, and is, for example, a ToF (Time of Flight) sensor. It is also possible to use a proximity sensor such as.
  • a ToF Time of Flight
  • FIG. 17A A functional block diagram of the signal processing unit 60 for realizing the signal processing according to the third embodiment is shown in FIG. 17A, and the size (magnitude) of the spot light incident on the event detection sensor 20 due to the difference in the distance to the subject.
  • FIG. 17B A conceptual diagram showing the difference between the above is shown in FIG. 17B.
  • the dot pattern light emitted from the vertical resonator type surface emitting laser 10 to the subject is reflected by the subject, and the size (magnitude) of the spot light incident on the event detection sensor 20 is relatively larger as the subject is closer. It becomes smaller, and the farther the subject is, the larger the size becomes.
  • the object recognition system 1 As an example, assuming that the object recognition system 1 according to the present embodiment is used as a face recognition system mounted on a smartphone, for example, as shown in FIG. 17B, a light spot reflected by a human face close to the smartphone.
  • the size of the light spot is relatively small, and the size of the light spot reflected by the background behind the face is relatively large.
  • the size of the light spot reflected by the irradiation target and incident on the event detection sensor 20 differs depending on the distance from the object recognition system 1 of the irradiation target of the dot pattern light.
  • the distance to the subject that is, the distance between the subject and the event detection sensor 20
  • the lower limit threshold value and the upper limit threshold value for detecting the true event are changed according to the distance to the subject.
  • the lower limit threshold value and the upper limit threshold value can be said to be filter conditions in the filtering process in the signal processing unit 60.
  • the functional unit of the signal processing unit 60 for executing the signal processing according to the third embodiment includes a distance measuring unit 61, a filter condition setting unit 62, and a filtering processing unit 63. ..
  • the distance measuring unit 61 is composed of a distance measuring function of the object recognition system 1 or a proximity sensor such as a ToF sensor, and measures the distance to the subject, that is, the distance between the subject and the event detection sensor 20.
  • the filter condition setting unit 62 detects the filter condition, that is, the event information derived from the dot pattern light applied to the subject as a true event based on the measurement result of the distance measurement unit 61, and removes the noise event. Set the lower limit threshold and the upper limit threshold.
  • the filtering processing unit 63 reads the event information derived from the dot pattern light as a true event based on the filter condition set by the filter condition setting unit 62, and performs a filtering process for removing the other information as a noise event.
  • the lower limit threshold value and the upper limit threshold value for detecting the true event are set according to the distance to the subject (that is, the distance between the subject and the event detection sensor 20). change. As a result, even if the distance to the subject changes, the event information derived from the dot pattern light can be reliably read out as a true event, and the other events can be reliably removed as noise events.
  • the distance to the subject is measured by using the distance measurement function of the object recognition system 1 or a proximity sensor such as a ToF sensor.
  • a proximity sensor such as a ToF sensor.
  • the distance is directly measured. Even if you do not do this, you can know the approximate distance to the face from the size of the average size of the human face.
  • the fourth embodiment is a processing example for face authentication when the object recognition system 1 is applied to, for example, face authentication.
  • FIG. 18 is a flowchart showing an example of signal processing according to the fourth embodiment, that is, processing for face recognition. This process is executed in the signal processing unit 60 under the control of the processor constituting the system control unit 100 in the case where the function of the system control unit 100 shown in FIG. 1B is realized by the processor.
  • the processor constituting the system control unit 100 uses the vertical resonator type surface emitting laser 10 and the event detection sensor 20 to detect an object at a specific position, in this example. Detects a human face (step S11).
  • the vertical resonator type surface emitting laser 10 is operated only by the point light source 11 in a specific area of the pixel array.
  • the event detection sensor 20 only the pixel 30 including the light receiving element 311 in the specific region of the pixel array is operated.
  • the low power consumption operation of the event detection sensor 20 can be realized by turning on / off the power supply in units of pixels 30.
  • Object detection using the vertical resonator type surface emitting laser 10 and the event detection sensor 20 can be realized, for example, by using a well-known triangulation method that measures the distance to the subject using a triangulation method. it can.
  • the processor performs the recognition process of the facial features that have detected the object (step S12).
  • the vertical resonator type surface emitting laser 10 is operated with a point light source 11 in a wide-angle region instead of partial irradiation.
  • the pixel 30 including the light receiving element 311 in the specific region of interest, that is, the ROI (Region Of Interest) region is operated.
  • the event detection sensor 20 is subjected to a gradation reading operation using the pixel signal generation unit 32 shown in FIG. A high-resolution image can be acquired by this gradation reading operation.
  • a high-resolution image of the face detected by the object is acquired by the wide-angle irradiation by the vertical resonator type surface emitting laser 10 and the gradation reading operation by the event detection sensor 20. Is done. Then, based on the high-resolution image, facial feature points and the like are extracted for face recognition.
  • a pattern recognition technique by machine learning such as a neural network
  • a technique for performing recognition processing by comparing the feature points of the face given as teacher data with the feature points of the captured face image is used. be able to.
  • the processor performs shape recognition on the recognized face (step S13).
  • shape recognition process the shape of the face is recognized by a distance measuring system using the structured light method. Specifically, in the vertical resonator type surface emitting laser 10 capable of controlling light emission / non-light emission on a pixel-by-pixel basis, the recognized face is irradiated with time-series pattern light by dot irradiation or line irradiation. It is said.
  • the event data includes a time stamp, which is time information indicating the relative time when the event occurred. Based on this time stamp (time information), the location where the event occurs can be specified.
  • the vertical resonator type surface emitting laser 10 capable of controlling light emission / non-light emission on a pixel-by-pixel basis, and event detection for reading out the event occurrence location by the time stamp (time information). Face shape recognition is performed by high-precision matching in the time series and spatial direction by the sensor 20.
  • the processor authenticates the shape-recognized face using a well-known face recognition technique (step S14).
  • a well-known face recognition technique for example, a technique for performing face recognition by extracting a plurality of feature points of a face-recognized face image and collating them with pre-registered feature points can be exemplified.
  • the signal processing according to the fourth embodiment described above comprises a combination of the vertical resonator type surface emitting laser 10 and the event detection sensor 20, and is used for face recognition by the object recognition system 1 using the structured light method technology. It is a process. In the object recognition system 1, noise events can be removed and only event information derived from the dot pattern light applied to the face can be read out. Therefore, according to the signal processing according to the fourth embodiment, the face recognition processing can be performed more reliably.
  • the object recognition system of the present disclosure described above can be used as, for example, a face recognition system mounted on various electronic devices having a face recognition function.
  • electronic devices having a face recognition function include mobile devices such as smartphones, tablets, and personal computers.
  • the device (system) that can use the object recognition system of the present disclosure as a face recognition system is not limited to a mobile device, and is not limited to a mobile device, for example, a security system that unlocks a door by face recognition.
  • automobiles can be exemplified.
  • FIG. 19 shows an external view of a smartphone equipped with the object recognition system according to the above-described embodiment as a face recognition system as viewed from the front side.
  • the smartphone 300 according to this example is provided with a display unit 320 on the front side of the housing 310.
  • the smartphone 300 equipped with the object recognition system according to the above-described embodiment as a face recognition system includes a light emitting unit 330 and a light receiving unit 340 in the upper portion on the front side of the housing 310.
  • the arrangement example of the light emitting unit 330 and the light receiving unit 340 shown in FIG. 19 is an example, and is not limited to this arrangement example.
  • the vertical resonator type surface emitting laser (VCSEL) 10 in the object recognition system 1 described above is used as the light emitting unit 330, and the object recognition system 1 is used as the light receiving unit 340.
  • the event detection sensor (DVS) 30 in the above can be used. That is, the smartphone 300 according to this example is manufactured as a smartphone having a face authentication function by using the object recognition system 1 according to the above-described embodiment.
  • the present disclosure may also have the following configuration.
  • a light source unit that irradiates a subject with a predetermined pattern of dot light.
  • An event detection sensor that receives a predetermined pattern of dot light reflected by the subject and detects as an event that the change in pixel brightness exceeds a predetermined threshold value, and
  • a signal processing unit that performs processing to remove an event as noise when a plurality of consecutive pixels having a predetermined number of pixels or more detect the occurrence of an event within a certain period of time in the pixel array unit of the event detection sensor.
  • the plurality of pixels are a group of pixels that are continuous in at least one direction in the row direction, the column direction, and the diagonal direction in the pixel array portion of the event detection sensor.
  • the object recognition system according to the above [A-1].
  • the signal processing unit detects the occurrence of an event within a certain period of time when each of the adjacent pixels having the first pixel count or more and the second pixel count or less detects the occurrence of an event, the signal processing unit receives the event information derived from the dot light of a predetermined pattern.
  • [A-4] When the signal processing unit detects the occurrence of an event in a number of pixels smaller than the number of first pixels, the signal processing unit removes this event as noise.
  • [A-5] The signal processing unit changes the number of pixels of the lower limit threshold value and the upper limit threshold value according to the distance to the subject.
  • the signal processing unit has a distance measuring function for measuring the distance to the subject, and the distance to the subject is measured by this distance measuring function.
  • [A-7] The distance to the subject is measured using the proximity sensor.
  • the light source unit is composed of a surface emitting semiconductor laser.
  • the surface emitting semiconductor laser is a vertical resonator type surface emitting laser.
  • [A-10] Used for face recognition when the subject is a human face, The object recognition system according to any one of the above [A-1] to the above [A-9].
  • a light source unit that irradiates a subject with a predetermined pattern of dot light.
  • An event detection sensor that receives a predetermined pattern of dot light reflected by the subject and detects as an event that the change in pixel brightness exceeds a predetermined threshold value, and
  • a signal processing unit that performs processing to remove an event as noise when a plurality of consecutive pixels having a predetermined number of pixels or more detect the occurrence of an event within a certain period of time in the pixel array unit of the event detection sensor.
  • An electronic device having an object recognition system comprising.
  • the plurality of pixels are a group of pixels that are continuous in at least one direction in the row direction, the column direction, and the diagonal direction in the pixel array portion of the event detection sensor.
  • the electronic device according to the above [B-1].
  • the signal processing unit detects the occurrence of an event within a certain period of time when each of the adjacent pixels having the first pixel count or more and the second pixel count or less detects the occurrence of an event, the signal processing unit receives the event information derived from the dot light of a predetermined pattern.
  • the light source unit is composed of a surface emitting semiconductor laser.
  • the surface emitting semiconductor laser is a vertical resonator type surface emitting laser.
  • [B-10] Used for face recognition when the subject is a human face, The electronic device according to any one of the above [B-1] to the above [B-9].
  • Object recognition system 10 ... Vertical resonator type surface emitting laser (VCSEL), 11 ... Point light source, 20 ... Event detection sensor (DVS), 21 ... Pixel array unit, 22 ... Drive unit, 23 ... Arbiter unit (arbitration unit), 24 ... Column processing unit, 25 ... Signal processing unit, 30 ... Pixels, 40 ... Light source drive unit, 50 ... -Sensor control unit, 60 ... signal processing unit, 61 ... distance measurement unit, 62 ... filter condition setting unit, 63 ... filtering processing unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Input (AREA)
  • Optical Radar Systems And Details Thereof (AREA)

Abstract

本開示の物体認識システムは、被写体に所定のパターンのドット光を照射する光源部、被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、を備える。

Description

物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器
 本開示は、物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器に関する。
 三次元(3D)画像(物体表面の奥行き情報/深度情報)を取得したり、被写体までの距離を測定したりするシステムとして、動的プロジェクタ及び動的視覚カメラを用いるストラクチャード・ライト方式の技術が提案されている(例えば、特許文献1参照)。ストラクチャード・ライト方式では、あらかじめ定められたパターンのドット光を、動的プロジェクタから測定対象物/被写体に投影し、動的視覚カメラによる撮像結果を基に、パターンのひずみ具合を解析して奥行き情報/距離情報を取得することになる。
 上記の特許文献1には、光源部である動的プロジェクタとして、垂直共振器型面発光レーザ(VCSEL:Vertical Cavity Surface Emitting Laser)を用い、受光部である動的視覚カメラとして、DVS(Dynamic Vision Sensor)と呼ばれるイベント検出センサを用いる技術が開示されている。イベント検出センサは、入射光を光電変換する画素の輝度変化が所定の閾値を超えたことをイベントとして検出するセンサである。
US 2019/0045173 A1
 ところで、例えば、太陽が背景に入る場合など、高照度の光の下では、フレア等の不具合が起こり易い。その結果、フレア等に起因して、特定の領域や広範な領域に、ノイズがでる場合がある。そのため、イベント検出センサから出力される、被写体に照射された所定のパターンのドット光に由来するイベント情報以外の情報、即ち、フレア等に起因するノイズを、ノイズイベントとして除去する処理が必要となる。
 本開示は、高照度の光の下で発生するフレア等に起因するノイズを除去し、後段での信号処理の負担を軽減できる物体認識システム及び物体認識システムの信号処理方法、並びに、当該物体認識システムを有する電子機器を提供することを目的とする。
 上記の目的を達成するための本開示の物体認識システムは、
 被写体に所定のパターンのドット光を照射する光源部、
 被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、
 イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、
 を備える。
 また、上記の目的を達成するための本開示の物体認識システムの信号処理方法は、
 被写体に所定のパターンのドット光を照射する光源部、及び、
 被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、
 を備える物体認識システムの信号処理に当たって、
 イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う。
 また、上記の目的を達成するための本開示の電子機器は、上記の構成の物体認識システムを有する。
図1Aは、本開示に係る技術が適用される物体認識システムのシステム構成の一例を示す概略図であり、図1Bは、当該物体認識システムの回路構成の一例を示すブロック図である。 図2Aは、本開示の物体認識システムにおける垂直共振器型面発光レーザの光源のアレイドット配置を示す図であり、図2Bは、アレイドット配置と対比するランダムドット配置を示す図である。 図3は、本開示に係る技術が適用される物体認識システムにおける第1構成例に係るイベント検出センサの構成の一例を示すブロック図である。 図4は、第1構成例に係るイベント検出センサにおける画素アレイ部の構成の一例を示すブロック図である。 図5は、第1構成例に係るイベント検出センサにおける画素の回路構成の一例を示す回路図である。 図6は、第1構成例に係るイベント検出センサにおけるアドレスイベント検出部の第1構成例を示すブロック図である。 図7は、第1構成例に係るアドレスイベント検出部における電流電圧変換部の構成の一例を示す回路図である。 図8は、第1構成例に係るアドレスイベント検出部における減算器及び量子化器の構成の一例を示す回路図である。 図9は、第1構成例に係るイベント検出センサにおけるアドレスイベント検出部の第2構成例を示すブロック図である。 図10は、本開示に係る技術が適用される物体認識システムにおける第2構成例に係るイベント検出センサの構成の一例を示すブロック図である。 図11は、物体認識システムにおけるイベント検出センサの積層型のチップ構造の概略を示す分解斜視図である。 図12は、実施例1に係る信号処理を実現するための回路構成の一例を示すブロック図であり、ノイズイベントとして検出する単位を行方向で連続する5画素とした構成を図示している。 図13は、ノイズイベントとして検出する単位を列方向で連続する5画素とした構成を示すブロック図である。 図14は、ノイズイベントとして検出する単位を斜め方向で連続する5画素とした構成を示すブロック図である。 図15Aは、太陽が背景に入る場合に、フレア等に起因するノイズイベントN1~N3を模式的に示す図であり、図15Bは、本開示の物体認識システムの信号処理方法の一例を示すフローチャートである。 図16は、センサノイズ等の微小なノイズイベントN11や、顔の後方の背景で反射された光スポットに基づくサイズの大きなノイズイベントN12を模式的に示す図である。 図17Aは、実施例3に係る信号処理を実現するための信号処理部の機能ブロック図であり、図17Bは、被写体までの距離の違いに伴う、イベント検出センサに入射するスポット光のサイズの違いを表す概念図である。 図18は、実施例4に係る信号処理の一例を示すフローチャートである。 図19は、本開示の電子機器の一例であるスマートフォンの正面側から見た外観図である。
 以下、本開示に係る技術を実施するための形態(以下、「実施形態」と記述する)について図面を用いて詳細に説明する。本開示の技術は実施形態に限定されるものではない。以下の説明において、同一要素又は同一機能を有する要素には同一符号を用いることとし、重複する説明は省略する。尚、説明は以下の順序で行う。
1.本開示の物体認識システム及び電子機器、全般に関する説明
2.本開示に係る技術が適用される物体認識システム
 2-1.システム構成例
 2-2.垂直共振器型面発光レーザ(VCSEL)
 2-3.第1構成例に係るイベント検出センサ(アービタ方式)
  2-3-1.画素アレイ部の構成例
  2-3-2.画素の回路構成例
  2-3-3.アドレスイベント検出部の第1例
  2-3-4.電流電圧変換部の構成例
  2-3-5.減算器及び量子化器の構成例
  2-3-6.アドレスイベント検出部の第2構成例
 2-4.第2構成例に係るイベント検出センサ(スキャン方式)
 2-5.チップ構造の構成例
 2-6.カラム処理部の構成例
 2-7.ノイズイベントについて
3.本開示の実施形態に係る物体認識システム
 3-1.実施例1(フレア等に起因するノイズをノイズイベントとして除去する例)
 3-2.実施例2(真イベントを検出するための下限閾値及び上限閾値を設定する例)
 3-3.実施例3(被写体までの距離に応じて、真イベントを検出するための下限閾値及び上限閾値の画素数を変更する例)
 3-4.実施例4(顔認証に適用する場合における顔認証のための処理例)
4.変形例
5.応用例
6.本開示の電子機器(スマートフォンの例)
7.本開示がとることができる構成
<本開示の物体認識システム及び電子機器、全般に関する説明>
 本開示の物体認識システム及び電子機器にあっては、複数の画素について、イベント検出センサの画素アレイ部において、行方向、列方向、及び、斜め方向の少なくとも一方向で連続する画素群である構成とすることができる。
 上述した好ましい構成を含む本開示の物体認識システム及び電子機器にあっては、イベント検出センサにおいて、互いに隣接する第1の画素数を下限閾値とし、第1の画素数よりも多い、互いに隣接する第2の画素数を上限閾値とするとき、信号処理部について、第1の画素数以上、第2の画素数以下の互いに隣接する各画素が、一定期間内にイベントの発生を検出したとき、所定のパターンのドット光に由来するイベント情報として読み出す構成とすることができる。また、信号処理部について、第1の画素数よりも少ない数の画素がイベントの発生を検出したとき、このイベントをノイズとして除去する構成とすることができる。
 また、上述した好ましい構成を含む本開示の物体認識システム及び電子機器にあっては、信号処理部について、被写体までの距離に応じて、下限閾値(第1の画素数)及び上限閾値(第2の画素数)の各画素数を変更する構成とすることができる。また、信号処理部について、被写体までの距離を測定する距離測定機能を有し、この距離測定機能によって被写体までの距離を測定する、あるいはまた、近接センサを用いて、被写体までの距離を測定する構成とすることができる。
 また、上述した好ましい構成を含む本開示の物体認識システム及び電子機器にあっては、光源部について、面発光半導体レーザから成る構成とし、面発光半導体レーザが垂直共振器型面発光レーザである構成とすることが好ましい。
 また、上述した好ましい構成を含む本開示の物体認識システム及び電子機器にあっては、被写体が人間の顔であるとき、顔認証に用いられる構成とすることができる。そして、顔認証の処理では、光源部である垂直共振器型面発光レーザ及びイベント検出センサを用いて、特定の位置の顔の検知を行い、次いで、検知した顔の特徴の認識処理を行い、次いで、認識した顔について形状認識を行い、最後に、形状認識した顔の認証処理を行う構成とすることができる。
<本開示に係る技術が適用される物体認識システム>
 本開示に係る技術が適用される物体認識システムは、点光源の集合から成り、点光源単位での発光/非発光の制御可能な光源部と、イベントを検出するイベント検出センサとの組み合わせから成り、ストラクチャード・ライト方式の技術を用いている。そして、本開示に係る技術が適用される物体認識システムは、三次元(3D)画像を取得する機能や、被写体までの距離を測定する機能を有している。ストラクチャード・ライト方式では、点像(スポット光)の座標とその点像が、どの点光源から投影されたものであるかをパターンマッチングで同定することによって三次元画像の取得が行われる。
 本開示に係る技術が適用される物体認識システムは、三次元画像を取得する機能を有することから、三次元画像取得システムということができるし、被写体までの距離を測定する機能を有することから、測距システムということができる。また、本開示に係る技術が適用される物体認識システムは、被写体が例えば人間の顔の場合には、顔の認証も可能であることから、顔認証システムということができる。
[システム構成例]
 図1Aは、本開示に係る技術が適用される物体認識システムのシステム構成の一例を示す概略図であり、図1Bは、当該物体認識システムの回路構成の一例を示すブロック図である。
 本開示に係る技術が適用される物体認識システム1は、点光源の集合から成り、被写体に所定のパターンのドット光を照射する光源部として、面発光半導体レーザ、例えば垂直共振器型面発光レーザ(VCSEL:Vertical Cavity Surface Emitting Laser)10を用い、受光部として、DVS(Dynamic Vision Sensor)と呼ばれるイベント検出センサ20を用いている。尚、被写体に所定のパターンのドット光を照射する光源部としては、垂直共振器型面発光レーザ(VCSEL)以外に、通常の端面発光半導体レーザ(LD)等を例示することができる。
 垂直共振器型面発光レーザ10は、点光源単位での発光/非発光の制御が可能であり、被写体200に対して、例えば所定のパターンのドット光を投影する。イベント検出センサ20は、IR(赤外光)感度を持ち、被写体200で反射されたドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出する。イベント検出センサ20は、輝度変化がある画素の信号のみ読み出すことて、高速化、省データ化、及び、低消費電力化を実現できるセンサである。
 本開示に係る技術が適用される物体認識システム1は、垂直共振器型面発光レーザ(VCSEL)10及びイベント検出センサ(DVS)20の他に、システム制御部100、光源駆動部40、センサ制御部50、信号処理部60、光源側光学系70、及び、カメラ側光学系80を備えている。垂直共振器型面発光レーザ10及びイベント検出センサ20の詳細については後述する。
 システム制御部100は、例えばプロセッサ(CPU)によって構成されており、光源駆動部40を介して垂直共振器型面発光レーザ10を駆動し、センサ制御部50を介してイベント検出センサ20を駆動する。垂直共振器型面発光レーザ10及びイベント検出センサ20の駆動に当たっては、システム制御部100は、両者を同期させて制御するようにすることが好ましい。
[垂直共振器型面発光レーザ(VCSEL)]
 垂直共振器型面発光レーザ10の点光源(ドット)11の配置について説明する。本開示に係る技術が適用される物体認識システム1では、垂直共振器型面発光レーザ10の点光源11の配置を、図2Aに示すように、点光源11を一定のピッチでアレイ状(行列状)に2次元配置した、所謂、アレイドット配置としている。
 垂直共振器型面発光レーザ10及びイベント検出センサ20の組み合わせから成る物体認識システム1では、垂直共振器型面発光レーザ10の点光源11を順次点灯させてイベント検出センサ20で記録したイベントのタイムスタンプ、即ち、イベントが発生した相対的な時刻を表す時刻情報(時間情報)を見れば、どの点光源11から投影された像であるかを容易に同定できる。
 また、アレイドット配置の場合、図2Bに示すように、点光源11を繰り返しのない特異な配置とし、空間方向に特徴を持たせた、所謂、ランダムドット配置の場合よりも、点光源11の数を増やすことができるため、点光源11の数で決まる距離画像の解像度を上げることができる利点がある。ここで、「距離画像」とは、被写体までの距離情報を得るための画像である。
 因みに、ランダムドット配置の場合、点光源11の配置パターンの特異性を維持したまま、点光源11の数を増やすことが困難であるために、点光源11の数で決まる距離画像の解像度を上げることができない。但し、本開示に係る技術が適用される物体認識システム1における垂直共振器型面発光レーザ10の点光源11の配置としては、アレイドット配置に限られるものではなく、ランダムドット配置とすることもできる。
 垂直共振器型面発光レーザ10は、システム制御部100による制御の下に、点光源11の単位での発光/非発光の制御可能な面発光光源である。従って、垂直共振器型面発光レーザ10は、被写体に対して、光を全面的に照射することができる他に、点光源単位でのドット照射や、画素列単位でのライン照射などによって、所望のパターンのドット光を部分的に照射することができる。
 因みに、ストラクチャード・ライト方式では、複数の点光源11から異なる角度で被写体(測距対象物)に光を照射し、被写体からの反射光を読み取ることにより、被写体の形状を認識することができる。
 続いて、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ20について説明する。
[第1構成例に係るイベント検出センサ(アービタ方式)]
 図3は、物体認識システム1におけるイベント検出センサ20として用いることができる、第1構成例に係るイベント検出センサの構成の一例を示すブロック図である。
 図3に示すように、第1構成例に係るイベント検出センサ20は、DVSと呼ばれる非同期型のイベント検出センサであり、画素アレイ部21、駆動部22、アービタ部(調停部)23、カラム処理部24、及び、信号処理部25を備える構成となっている。
 上記の構成のイベント検出センサ20において、画素アレイ部21には、複数の画素30が行列状(アレイ状)に2次元配列されている。この行列状の画素配列に対して、画素列毎に、後述する垂直信号線VSLが配線される。
 複数の画素30のそれぞれは、光電流に応じた電圧のアナログ信号を画素信号として生成する。また、複数の画素30のそれぞれは、光電流の変化量が所定の閾値を超えたか否かにより、アドレスイベントの有無を検出する。そして、アドレスイベントが生じた際に画素30は、リクエストをアービタ部23に出力する。
 駆動部22は、複数の画素30のそれぞれを駆動して、各画素30で生成された画素信号をカラム処理部24に出力させる。
 アービタ部23は、複数の画素30のそれぞれからのリクエストを調停し、調停結果に基づく応答を画素30に送信する。アービタ部23からの応答を受け取った画素30は、検出結果を示す検出信号(アドレスイベントの検出信号)を駆動部22及び信号処理部25に供給する。画素30からの検出信号の読出しについては、複数行読出しとすることも可能である。
 カラム処理部24は、例えば、アナログ-デジタル変換器から成り、画素アレイ部21の画素列毎に、その列の画素30から出力されるアナログの画素信号をデジタル信号に変換する処理を行う。そして、カラム処理部24は、アナログ-デジタル変換後のデジタル信号を信号処理部25に供給する。
 信号処理部25は、カラム処理部24から供給されるデジタル信号に対して、CDS(Correlated Double Sampling)処理や画像認識処理などの所定の信号処理を実行する。そして、信号処理部25は、処理結果を示すデータと、アービタ部23から供給される検出信号とを信号線14を介して記録部12(図1参照)に供給する。
(画素アレイ部の構成例)
 図4は、第1構成例に係るイベント検出センサ20における画素アレイ部21の構成の一例を示すブロック図である。
 複数の画素30が行列状に2次元配列されて成る画素アレイ部21において、複数の画素30のそれぞれは、受光部31、画素信号生成部32、及び、アドレスイベント検出部33を有する構成となっている。
 上記の構成の画素30において、受光部31は、入射光を光電変換して光電流を生成する。そして、受光部31は、駆動部22(図3参照)の制御に従って、画素信号生成部32及びアドレスイベント検出部33のいずれかに、光電変換して生成した光電流を供給する。
 画素信号生成部32は、受光部31から供給される光電流に応じた電圧の信号を画素信号SIGとして生成し、この生成した画素信号SIGを垂直信号線VSLを介してカラム処理部24(図3参照)に供給する。
 アドレスイベント検出部33は、受光部31のそれぞれからの光電流の変化量が所定の閾値を超えたか否かにより、アドレスイベントの有無を検出する。アドレスイベントは、例えば、光電流の変化量が上限の閾値を超えた旨を示すオンイベント、及び、その変化量が下限の閾値を下回った旨を示すオフイベントから成る。また、アドレスイベントの検出信号は、例えば、オンイベントの検出結果を示す1ビット、及び、オフイベントの検出結果を示す1ビットから成る。なお、アドレスイベント検出部33については、オンイベントのみを検出する構成とすることもできる。
 アドレスイベントが発生した際に、アドレスイベント検出部33は、アドレスイベントの検出信号の送信を要求するリクエストをアービタ部23(図3参照)に供給する。そして、アドレスイベント検出部33は、リクエストに対する応答をアービタ部23から受け取ると、アドレスイベントの検出信号を駆動部22及び信号処理部25に供給する。
(画素の回路構成例)
 図5は、第1構成例に係るイベント検出センサ20における画素30の回路構成の一例を示す回路図である。上述したように、複数の画素30のそれぞれは、受光部31、画素信号生成部32、及び、アドレスイベント検出部33を有する構成となっている。
 上記の構成の画素30において、受光部31は、受光素子(光電変換素子)311、転送トランジスタ312、及び、OFG(Over Flow Gate)トランジスタ313を有する構成となっている。転送トランジスタ312及びOFGトランジスタ313としては、例えば、N型のMOS(Metal Oxide Semiconductor)トランジスタが用いられる。転送トランジスタ312及びOFGトランジスタ313は、互いに直列に接続されている。
 受光素子311は、転送トランジスタ312とOFGトランジスタ313との共通接続ノードN1とグランドとの間に接続されており、入射光を光電変換して入射光の光量に応じた電荷量の電荷を生成する。
 転送トランジスタ312のゲート電極には、図3に示す駆動部22から転送信号TRGが供給される。転送トランジスタ312は、転送信号TRGに応答して、受光素子311で光電変換された電荷を画素信号生成部32に供給する。
 OFGトランジスタ313のゲート電極には、駆動部22から制御信号OFGが供給される。OFGトランジスタ313は、制御信号OFGに応答して、受光素子311で生成された電気信号をアドレスイベント検出部33に供給する。アドレスイベント検出部33に供給される電気信号は、電荷からなる光電流である。
 画素信号生成部32は、リセットトランジスタ321、増幅トランジスタ322、選択トランジスタ323、及び、浮遊拡散層324を有する構成となっている。リセットトランジスタ321、増幅トランジスタ322、及び、選択トランジスタ323としては、例えば、N型のMOSトランジスタが用いられる。
 画素信号生成部32には、受光部31から転送トランジスタ312によって、受光素子311で光電変換された電荷が供給される。受光部31から供給される電荷は、浮遊拡散層324に蓄積される。浮遊拡散層324は、蓄積した電荷の量に応じた電圧値の電圧信号を生成する。すなわち、浮遊拡散層324は、電荷を電圧に変換する。
 リセットトランジスタ321は、電源電圧VDDの電源ラインと浮遊拡散層324との間に接続されている。リセットトランジスタ321のゲート電極には、駆動部22からリセット信号RSTが供給される。リセットトランジスタ321は、リセット信号RSTに応答して、浮遊拡散層324の電荷量を初期化(リセット)する。
 増幅トランジスタ322は、電源電圧VDDの電源ラインと垂直信号線VSLとの間に、選択トランジスタ323と直列に接続されている。増幅トランジスタ322は、浮遊拡散層324で電荷電圧変換された電圧信号を増幅する。
 選択トランジスタ323のゲート電極には、駆動部22から選択信号SELが供給される。選択トランジスタ323は、選択信号SELに応答して、増幅トランジスタ322によって増幅された電圧信号を画素信号SIGとして垂直信号線VSLを介してカラム処理部24(図3参照)へ出力する。
 上記の構成の画素30が2次元配置されて成る画素アレイ部21を有する第1構成例に係るイベント検出センサ20において、駆動部22は、図1に示す制御部13によりアドレスイベントの検出開始が指示されると、受光部31のOFGトランジスタ313に制御信号OFGを供給することによって当該OFGトランジスタ313を駆動してアドレスイベント検出部33に光電流を供給させる。
 そして、ある画素30においてアドレスイベントが検出されると、駆動部22は、その画素30のOFGトランジスタ313をオフ状態にしてアドレスイベント検出部33への光電流の供給を停止させる。次いで、駆動部22は、転送トランジスタ312に転送信号TRGを供給することによって当該転送トランジスタ312を駆動して、受光素子311で光電変換された電荷を浮遊拡散層324に転送させる。
 このようにして、上記の構成の画素30が2次元配置されて成る画素アレイ部21を有する第1構成例に係るイベント検出センサ20は、アドレスイベントが検出された画素30の画素信号のみをカラム処理部24に出力する。これにより、アドレスイベントの有無に関わらず、全画素の画素信号を出力する場合と比較して、イベント検出センサ20の消費電力や、画像処理の処理量を低減することができる。
 尚、ここで例示した画素30の構成は一例であって、この構成例に限定されるものではない。例えば、画素信号生成部32を備えない画素構成とすることもできる。この画素構成の場合は、受光部31において、OFGトランジスタ313を省略し、当該OFGトランジスタ313の機能を転送トランジスタ312に持たせるようにすればよい。
(アドレスイベント検出部の第1構成例)
 図6は、第1構成例に係るイベント検出センサ20におけるアドレスイベント検出部33の第1構成例を示すブロック図である。図6に示すように、本構成例に係るアドレスイベント検出部33は、電流電圧変換部331、バッファ332、減算器333、量子化器334、及び、転送部335を有する構成となっている。
 電流電圧変換部331は、画素30の受光部33からの光電流を、その対数の電圧信号に変換する。電流電圧変換部331は、変換した電圧信号をバッファ332に供給する。バッファ332は、電流電圧変換部331から供給される電圧信号をバッファリングし、減算器333に供給する。
 減算器333には、駆動部22から行駆動信号が供給される。減算器333は、行駆動信号に従って、バッファ332から供給される電圧信号のレベルを低下させる。そして、減算器333は、レベル低下後の電圧信号を量子化器334に供給する。量子化器334は、減算器333から供給される電圧信号をデジタル信号に量子化してアドレスイベントの検出信号として転送部335に出力する。
 転送部335は、量子化器334から供給されるアドレスイベントの検出信号をアービタ部23等に転送する。この転送部335は、アドレスイベントが検出された際に、アドレスイベントの検出信号の送信を要求するリクエストをアービタ部23に供給する。そして、転送部335は、リクエストに対する応答をアービタ部23から受け取ると、アドレスイベントの検出信号を駆動部22及び信号処理部25に供給する。
 続いて、アドレスイベント検出部33における電流電圧変換部331、減算器333、及び、量子化器334の構成例について説明する。
(電流電圧変換部の構成例)
 図7は、第1構成例に係るアドレスイベント検出部33における電流電圧変換部331の構成の一例を示す回路図である。図7に示すように、本例に係る電流電圧変換部331は、N型トランジスタ3311、P型トランジスタ3312、及び、N型トランジスタ3313を有する回路構成となっている。これらのトランジスタ3311~3313としては、例えば、MOSトランジスタが用いられる。
 N型トランジスタ3311は、電源電圧VDDの電源ラインと信号入力線3314との間に接続されている。P型トランジスタ3312及びN型トランジスタ3313は、電源電圧VDDの電源ラインとグランドとの間に直列に接続されている。そして、P型トランジスタ3312及びN型トランジスタ3313の共通接続ノードN2には、N型トランジスタ3311のゲート電極と、図6に示すバッファ332の入力端子とが接続されている。
 P型トランジスタ3312のゲート電極には、所定のバイアス電圧Vbiasが印加される。これにより、P型トランジスタ3312は、一定の電流をN型トランジスタ3313に供給する。N型トランジスタ3313のゲート電極には、信号入力線3314を通して、受光部31から光電流が入力される。
 N型トランジスタ3311及びN型トランジスタ3313のドレイン電極は電源側に接続されており、このような回路はソースフォロワと呼ばれる。これらのループ状に接続された2つのソースフォロワにより、受光部31からの光電流は、その対数の電圧信号に変換される。
(減算器及び量子化器の構成例)
 図8は、第1構成例に係るアドレスイベント検出部33における減算器333及び量子化器334の構成の一例を示す回路図である。
 本例に係る減算器333は、容量素子3331、インバータ回路3332、容量素子3333、及び、スイッチ素子3334を有する構成となっている。
 容量素子3331の一端は、図6に示すバッファ332の出力端子に接続され、その他端は、インバータ回路3332の入力端子に接続されている。容量素子3333は、インバータ回路3332に対して並列に接続されている。スイッチ素子3334は、容量素子3333の両端間に接続されている。スイッチ素子3334にはその開閉制御信号として、駆動部22から行駆動信号が供給される。スイッチ素子3334は、行駆動信号に応じて、容量素子3333の両端を接続する経路を開閉する。インバータ回路3332は、容量素子3331を介して入力される電圧信号の極性を反転する。
 上記の構成の減算器333において、スイッチ素子3334をオン(閉)状態とした際に、容量素子3331のバッファ332側の端子に電圧信号Vinitが入力され、その逆側の端子は仮想接地端子となる。この仮想接地端子の電位を、便宜上、ゼロとする。このとき、容量素子3331に蓄積されている電荷Qinitは、容量素子3331の容量値をC1とすると、次式(1)により表される。一方、容量素子3333の両端は、短絡されているため、その蓄積電荷はゼロとなる。
  Qinit=C1×Vinit             ・・・(1)
 次に、スイッチ素子3334がオフ(開)状態となり、容量素子3331のバッファ332側の端子の電圧が変化してVafterになった場合を考えると、容量素子3331に蓄積される電荷Qafterは、次式(2)により表される。
  Qafter=C1×Vafter              ・・・(2)
 一方、容量素子3333に蓄積される電荷Q2は、容量素子3333の容量値をC2とし、出力電圧をVoutとすると、次式(3)により表される。
  Q2=-C2×Vout              ・・・(3)
 このとき、容量素子3331及び容量素子3333の総電荷量は変化しないため、次の式(4)が成立する。
  Qinit=Qafter+Q2              ・・・(4)
 式(4)に式(1)乃至式(3)を代入して変形すると、次式(5)が得られる。
  Vout=-(C1/C2)×(Vafter-Vinit)  ・・・(5)
 式(5)は、電圧信号の減算動作を表し、減算結果の利得はC1/C2となる。通常、利得を最大化することが望まれるため、C1を大きく、C2を小さく設計することが好ましい。一方、C2が小さすぎると、kTCノイズが増大し、ノイズ特性が悪化するおそれがあるため、C2の容量削減は、ノイズを許容することができる範囲に制限される。また、画素30毎に減算器333を含むアドレスイベント検出部33が搭載されるため、容量素子3331や容量素子3333には、面積上の制約がある。これらを考慮して、容量素子3331,3333の容量値C1,C2が決定される。
 図8において、量子化器334は、コンパレータ3341を有する構成となっている。コンパレータ3341は、インバータ回路3332の出力信号、即ち、減算器430からの電圧信号を非反転(+)入力とし、所定の閾値電圧Vthを反転(-)入力としている。そして、コンパレータ3341は、減算器430からの電圧信号と所定の閾値電圧Vthとを比較し、比較結果を示す信号をアドレスイベントの検出信号として転送部335に出力する。
(アドレスイベント検出部の第2構成例)
 図9は、第1構成例に係るイベント検出センサ20におけるアドレスイベント検出部33の第2構成例を示すブロック図である。図9に示すように、第2構成例に係るアドレスイベント検出部33は、電流電圧変換部331、バッファ332、減算器333、量子化器334、及び、転送部335の他に、記憶部336及び制御部337を有する構成となっている。
 記憶部336は、量子化器334と転送部335との間に設けられており、制御部337から供給されるサンプル信号に基づいて、量子化器334の出力、即ち、コンパレータ3341の比較結果を蓄積する。記憶部336は、スイッチ、プラスチック、容量などのサンプリング回路であってもよいし、ラッチやフリップフロップなどのデジタルメモリ回路でもあってもよい。
 制御部337は、コンパレータ3341の反転(-)入力端子に対して所定の閾値電圧Vthを供給する。制御部337からコンパレータ3341に供給される閾値電圧Vthは、時分割で異なる電圧値であってもよい。例えば、制御部337は、光電流の変化量が上限の閾値を超えた旨を示すオンイベントに対応する閾値電圧Vth1、及び、その変化量が下限の閾値を下回った旨を示すオフイベントに対応する閾値電圧Vth2を異なるタイミングで供給することで、1つのコンパレータ3341で複数種類のアドレスイベントの検出が可能になる。
 記憶部336は、例えば、制御部337からコンパレータ3341の反転(-)入力端子に、オフイベントに対応する閾値電圧Vth2が供給されている期間に、オンイベントに対応する閾値電圧Vth1を用いたコンパレータ3341の比較結果を蓄積するようにしてもよい。尚、記憶部336は、画素30の内部にあってもよいし、画素30の外部にあってもよい。また、記憶部336は、アドレスイベント検出部33の必須の構成要素ではない。すなわち、記憶部336は、無くてもよい。
[第2構成例に係るイベント検出センサ(スキャン方式)]
 上述した第1構成例に係るイベント検出センサ20は、非同期型の読出し方式にてイベントを読み出す非同期型のイベント検出センサである。但し、イベントの読出し方式としては、非同期型の読出し方式に限られるものではなく、同期型の読出し方式であってもよい。同期型の読出し方式が適用されるイベント検出センサは、所定のフレームレートで撮像を行う通常の撮像装置と同じ、スキャン方式のイベント検出センサである。
 図10は、本開示に係る技術が適用される物体認識システム1におけるイベント検出センサ20として用いることができる、第2構成例に係るイベント検出センサ、即ち、スキャン方式のイベント検出センサの構成の一例を示すブロック図である。
 図10に示すように、第2構成例に係るイベント検出センサ20は、画素アレイ部21、駆動部22、信号処理部25、読出し領域選択部27、及び、信号生成部28を備える構成となっている。
 画素アレイ部21は、複数の画素30を含む。複数の画素30は、読出し領域選択部27の選択信号に応答して出力信号を出力する。複数の画素30のそれぞれについては、例えば図8に示すように、画素内にコンパレータを持つ構成とすることもできる。複数の画素30は、光の強度の変化量に対応する出力信号を出力する。複数の画素30は、図10に示すように、行列状に2次元配置されていてもよい。
 駆動部22は、複数の画素30のそれぞれを駆動して、各画素30で生成された画素信号を信号処理部25に出力させる。尚、駆動部22及び信号処理部25については、階調情報を取得するための回路部である。従って、イベント情報のみを取得する場合は、駆動部22及び信号処理部25は無くてもよい。
 読出し領域選択部27は、画素アレイ部21に含まれる複数の画素30のうちの一部を選択する。具体的には、読出し領域選択部27は、画素アレイ部21の各画素30からのリクエストに応じて選択領域を決定する。例えば、読出し領域選択部27は、画素アレイ部21に対応する2次元行列の構造に含まれる行のうちのいずれか1つもしくは複数の行を選択する。読出し領域選択部27は、予め設定された周期に応じて1つもしくは複数の行を順次選択する。
 信号生成部28は、読出し領域選択部27によって選択された画素の出力信号に基づいて、選択された画素のうちのイベントを検出した活性画素に対応するイベント信号を生成する。イベントは、光の強度が変化するイベントである。活性画素は、出力信号に対応する光の強度の変化量が予め設定された閾値を超える、又は、下回る画素である。例えば、信号生成部28は、画素の出力信号を基準信号と比較し、基準信号よりも大きい又は小さい場合に出力信号を出力する活性画素を検出し、当該活性画素に対応するイベント信号を生成する。
 信号生成部28については、例えば、信号生成部28に入ってくる信号を調停するような列選択回路を含む構成とすることができる。また、信号生成部28については、イベントを検出した活性画素の情報の出力のみならず、イベントを検出しない非活性画素の情報を出力する構成とすることができる。
 信号生成部28からは、出力線15を通して、イベントを検出した活性画素のアドレス情報及びタイムスタンプ情報(例えば、(X,Y,T))が出力される。但し、信号生成部28から出力されるデータについては、アドレス情報及びタイムスタンプ情報だけでなく、フレーム形式の情報(例えば、(0,0,1,0,・・・))であってもよい。
[チップ構造の構成例]
 上述した第1構成例又は第2構成例に係るイベント検出センサ20のチップ(半導体集積回路)構造としては、例えば、積層型のチップ構造を採ることができる。図11は、イベント検出センサ20の積層型のチップ構造の概略を示す分解斜視図である。
 図11に示すように、積層型のチップ構造、所謂、積層構造は、第1のチップである受光チップ201、及び、第2のチップである検出チップ202の少なくとも2つのチップが積層された構造となっている。そして、図5に示す画素30の回路構成において、受光素子311のそれぞれが受光チップ201上に配置され、受光素子311以外の素子の全てや、画素30の他の回路部分の素子などが検出チップ202上に配置される。受光チップ201と検出チップ202とは、ビア(VIA)、Cu-Cu接合、バンプなどの接続部を介して電気的に接続される。
 尚、ここでは、受光素子311を受光チップ201に配置し、受光素子311以外の素子や画素30の他の回路部分の素子などを検出チップ202に配置する構成例を例示したが、この構成例に限られるものではない。
 例えば、図5に示す画素30の回路構成において、受光部31の各素子を受光チップ201に配置し、受光部31以外の素子や画素30の他の回路部分の素子などを検出チップ202に配置する構成とすることができる。また、受光部31の各素子、及び、画素信号生成部32のリセットトランジスタ321、浮遊拡散層324を受光チップ201に配置し、それ以外の素子を検出チップ202に配置する構成とすることができる。更には、アドレスイベント検出部33を構成する素子の一部を、受光部31の各素子などと共に受光チップ201に配置する構成とすることができる。
[ノイズイベントについて]
 ところで、ストラクチャード・ライト方式の物体認識システム1において、イベント検出センサ20からは、イベント情報として、垂直共振器型面発光レーザ10から被写体に照射された所定のパターンのドット光(以下、「ドットパターン光」と記述する場合がある)に由来するイベント情報(真イベント)のみが出力される訳ではない。
 一例として、太陽の下、イベント会場、野球場など、高照度の光の下では、フレア等の不具合が起こり易く、当該フレア等に起因して、特定の領域や広範な領域に、ノイズがでる場合がある。そのため、イベント検出センサから出力される、光源部から被写体に照射されたドットパターン光に由来するイベント情報以外の情報、即ち、フレア等に起因するノイズを、後段で除去する処理が必要になるために、後段での信号処理に負担をかけることになる。
<本開示の実施形態に係る物体認識システム>
 本開示の実施形態に係る物体認識システム1は、光源部としての面発光半導体レーザ、例えば垂直共振器型面発光レーザ10から被写体に照射されたドットパターン光(所定のパターンのドット光)に由来するイベント情報以外の情報、即ち、高照度の光の下で発生するフレア等に起因するノイズを除去し、後段での信号処理の負担を軽減できるようにする。
 以下に、高照度の光の下で発生するフレア等に起因するノイズをノイズイベントとして除去し、垂直共振器型面発光レーザ10から被写体に照射されたドットパターン光に由来するイベント情報(真イベント)を出力する(読み出す)ための本実施形態の具体的な実施例について説明する。
[実施例1]
 実施例1は、高照度の光の下で発生するフレア等に起因するノイズを、ノイズイベント(偽イベント)として除去する例である。実施例1では、イベント検出センサ20の画素アレイ部21において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズイベント(偽イベント)として除去し、垂直共振器型面発光レーザ10から被写体に照射されたドットパターン光に由来するイベント情報を真イベントとして読み出すようにする。
 実施例1に係る信号処理は、図1Bに示す信号処理部60の信号処理の一つとして実行される。これにより、信号処理部60は、高照度の光の下で発生するフレア等に起因するノイズをノイズイベントとして除去するフィルタリング機能を持つことになる。実施例1に係る信号処理を実現するための回路構成の一例を図12に示す。
 図12に示すように、実施例1に係る信号処理では、イベント検出センサ20の画素アレイ部21、即ち、行列状の画素配列において、例えば行方向で連続する5画素を、高照度の光の下で発生するフレア等に起因するノイズをノイズイベントとして検出する単位とし、この単位毎に演算回路41を有する構成となっている。演算回路41は、同一行で連続する5つの画素30で、一定期間内にイベントが発生したことを検出する。信号処理部60は、演算回路41の検出結果を受けて、行方向で連続する5画素で発生したイベントが、高照度の光の下で発生するフレア等に起因するノイズイベントであるとして除去する処理を行う。
 尚、ここでは、ノイズイベントとして検出する単位を、1つの画素行で連続する5画素としたが、5画素に限られるものではなく、例えば、連続する4画素、あるいは、連続する6画素以上とすることもできるし、又、1つの画素行に限らず、複数行で行方向に連続する画素群とすることもできる。
 また、行列状の画素配列において、行方向で連続する構成に限られるものではなく、図13に示すように、列方向で連続する構成とすることもできる。この場合にも、連続する画素数は5画素に限られるものではなく、又、1つの画素列に限らず、複数列で列方向に連続する画素群とすることもできる。また、図14に示すように、斜め方向で連続する画素群から成る構成とすることもできる。更に、行方向、列方向、及び、斜め方向で連続する画素群から成る構成とすることもできる。すなわち、イベント検出センサ20の画素アレイ部21において、行方向、列方向、及び、斜め方向の少なくとも一方向で連続する画素群から成る構成であればよい。
 上述したように、実施例1に係る信号処理によれば、高照度の光の下で発生するフレア等に起因するノイズイベントを除去し、垂直共振器型面発光レーザ10から被写体に照射されたドットパターン光に由来するイベント情報を真イベントとして読み出すことができるため、後段での信号処理の負担を軽減できる。
 図15Aに、太陽が背景に入る場合に、フレア等に起因するノイズイベントN1~N3を模式的に図示している。行方向に線状に発生するノイズイベントN1については、図12に示す行方向で連続する画素群によって検出することができ、斜め方向に線状に発生するノイズイベントN2については、図14に示す斜め方向で連続する画素群によって検出することができ、列方向に線状に発生するノイズイベントN3については、図13に示す行方向で連続する画素群によって検出することができる。従って、あらゆる方向に線状(線形)に発生するノイズイベントを検出するに当たっては、行方向、列方向、及び、斜め方向で連続する構成とすることが好ましい。
 尚、ここでは、演算回路41を用いてハードウェアにて、イベント情報の真/偽を判定するとしたが、これは一例に過ぎず、演算回路41を用いる信号処理に限られるものではない。例えば、一定期間において、イベント検出センサ20の各画素30から出力されるイベント情報をメモリに記憶し、一定期間の周期でソフトウェアにて、イベント情報の真/偽を判定するようにすることもできる。
 ソフトウェアにて実行する場合の本開示の物体認識システムの信号処理方法の一例を図15Bのフローチャートに示す。信号処理部60において、先ず、同一行で連続する5つの画素30の出力を取得し(ステップS1)、次いで、一定期間内にイベントが発生したか否かを判断する(ステップS2)。そして、一定期間内にイベントが発生したのであれば(S2のYES)、ノイズイベントとして除去し(ステップS3)、そうでなければ(S2のNO)、被写体に照射されたドットパターン光に由来するイベント情報(真イベント)として読み出す(ステップS4)。
 また、実施例1に係る信号処理では、フレア等に起因するノイズイベントN1~N3が線状(線形)に発生するとし、これらを検出する画素群を行方向、列方向、又は、斜め方向に直線状に配置する構成としているが、フレア等に起因するノイズイベントの形状を機械学習で学習させ、その学習結果に対応させて、連続する画素群を配置する構成とすることもできる。
[実施例2]
 実施例2は、被写体に照射されたドットパターン光に由来する真イベントを検出するための下限閾値及び上限閾値を設定する例である。
 ノイズイベントは、例えば、画素毎に単独で発生すると考えられる。これに対し、動物体はある程度の大きさを持っている。従って、垂直共振器型面発光レーザ10から被写体に照射されたドットパターン光に由来するイベント情報は、一定の領域の画素に跨って発生することになる。
 そこで、実施例2では、イベント検出センサ20において、被写体に照射されたドットパターン光に由来する真イベントを検出する閾値として、下限閾値及び上限閾値を設定する。具体的には、被写体までの距離(即ち、被写体とイベント検出センサ20との間の距離)が、所定の距離であるとするとき、例えば、行方向2画素×列方向2画素の、互いに隣接する計4画素(第1の画素数)を、真イベント検出の下限閾値とする。また、第1の画素数よりも多い、例えば、行方向4画素×列方向4画素の、互いに隣接する計16画素(第2の画素数)を、真イベント検出の上限閾値とする。
 ここで、「所定の距離」としては、本実施形態に係る物体認識システム1を、例えば、スマートフォンに搭載される顔認証システムとして用いる場合を想定すると、スマートフォンとそれを手に持つ人間の顔との間の平均的な距離を例示することができる。
 そして、下限閾値(第1の画素数)以上、上限閾値(第2の画素数)以下、例えば、行方向3画素×列方向3画素の、互いに隣接する計9画素の各画素が、一定期間内にイベントを検出したとき、被写体に照射されたドットパターン光に由来するイベント情報、即ち、真イベントとして読み出すようにする。ノイズイベントとしては、フレア等に起因する線状のノイズイベントの他に、図16に示すように、センサノイズ等に起因する微小なノイズイベントN11や、顔の後方の背景で反射された光スポットに基づくサイズの大きなノイズイベントN12を例示することができる。
 実施例2に係る信号処理によれば、被写体に照射されたドットパターン光に由来する真イベントを検出するための下限閾値及び上限閾値を設定することで、下限閾値よりも小さい、例えばセンサノイズ等に起因するノイズイベントN11や、上限閾値よりも大きいノイズイベントN12を確実に除去することができる。そして、下限閾値以上、上限閾値以下のイベント情報については、被写体に照射されたドットパターン光に由来するイベント情報、即ち、真イベントとして読み出すことができる。
[実施例3]
 実施例3は、被写体までの距離(即ち、被写体とイベント検出センサ20との間の距離)に応じて、真イベントを検出するための下限閾値及び上限閾値の各画素数を変更する例である。
 本実施形態に係る物体認識システム1は、ストラクチャード・ライト方式の技術を用いていることから、図1Bに示す信号処理部60は、被写体までの距離を測定する機能を有している。この距離測定機能を用いることで、被写体とイベント検出センサ20との間の距離を測定することができる。
 但し、被写体とイベント検出センサ20との間の距離の測定については、信号処理部60が有する距離測定機能を用いることに限られるものではなく、例えば、ToF(Time of Flight:光飛行時間)センサ等の近接センサを用いるようにすることもできる。
 実施例3に係る信号処理を実現するための信号処理部60の機能ブロック図を図17Aに示し、被写体までの距離の違いに伴う、イベント検出センサ20に入射するスポット光のサイズ(大きさ)の違いを表す概念図を図17Bに示す。
 垂直共振器型面発光レーザ10から被写体に照射したドットパターン光が、被写体で反射され、イベント検出センサ20に入射するスポット光のサイズ(大きさ)については、被写体が近いほど相対的にサイズが小さくなり、被写体が遠いほど相対的にサイズが大きくなる。
 一例として、本実施形態に係る物体認識システム1を、例えば、スマートフォンに搭載される顔認証システムとして用いる場合を想定すると、図17Bに示すように、スマートフォンに近い人間の顔で反射された光スポットのサイズは、相対的にサイズが小さく、顔の後方の背景で反射された光スポットのサイズは、相対的にサイズが大きい。このように、ドットパターン光の照射対象物の物体認識システム1からの距離によって、照射対象物で反射され、イベント検出センサ20に入射する光スポットのサイズが異なる。
 一方で、被写体までの距離、即ち、被写体とイベント検出センサ20との間の距離は、一定の距離であるとは限らず、例えば、スマートフォンを使う人によってその距離は異なってくる。そこで、実施例3に係る信号処理では、被写体までの距離に応じて、真イベントを検出するための下限閾値及び上限閾値を変更するようにする。この下限閾値及び上限閾値については、信号処理部60でのフィルタリング処理におけるフィルタ条件ということができる。
 図17Aに示すように、実施例3に係る信号処理を実行するための信号処理部60の機能部は、距離測定部61、フィルタ条件設定部62、及び、フィルタリング処理部63から構成されている。
 距離測定部61は、物体認識システム1が有する距離測定機能、又は、ToFセンサ等の近接センサによって構成され、被写体までの距離、即ち、被写体とイベント検出センサ20との間の距離を測定する。
 フィルタ条件設定部62は、距離測定部61の測定結果に基づいて、フィルタ条件、即ち、被写体に照射されたドットパターン光に由来するイベント情報を真イベントとして検出し、ノイズイベントを除去するための下限閾値及び上限閾値を設定する。
 フィルタリング処理部63は、フィルタ条件設定部62で設定されたフィルタ条件に基づいて、ドットパターン光に由来するイベント情報を真イベントとして読み出し、それ以外をノイズイベントとして除去するフィルタリング処理を行う。
 上述したように、実施例3に係る信号処理では、被写体までの距離(即ち、被写体とイベント検出センサ20との間の距離)に応じて、真イベントを検出するための下限閾値及び上限閾値を変更する。これにより、被写体までの距離が変化しても、ドットパターン光に由来するイベント情報を真イベントとして確実に読み出し、それ以外をノイズイベントとして確実に除去することができる。
 尚、ここでは、物体認識システム1が有する距離測定機能、又は、ToFセンサ等の近接センサを用いて被写体までの距離を測定するとしたが、例えば、スマートフォンに搭載する場合には、直接距離を測定しなくても、人間の顔の平均的な大きさの大小から、顔までの大まかな距離を知ることができる。
 このことから、イベント検出センサ20の出力に基づいて顔の形状を検出し、その輪郭サイズに基づいてフィルタ条件を設定するようにすることもできる。
[実施例4]
 実施例4は、物体認識システム1を例えば顔認証に適用する場合における顔認証のための処理例である。
 図18は、実施例4に係る信号処理、即ち、顔認証のための処理の一例を示すフローチャートである。本処理は、図1Bに示すシステム制御部100の機能をプロセッサによって実現する構成の場合において、システム制御部100を構成するプロセッサによる制御の下に、信号処理部60において実行される。
 システム制御部100を構成するプロセッサ(以下、単に「プロセッサ」と記述する)は、垂直共振器型面発光レーザ10及びイベント検出センサ20を用いて、特定の位置の物体検知、本例にあっては、人間の顔の検知を行う(ステップS11)。
 この物体検知の処理では、人間の顔は、撮影範囲内の限られた領域に存在することから、垂直共振器型面発光レーザ10について、画素アレイの特定領域の点光源11のみを動作させるようにする。これに対応して、イベント検出センサ20についても、画素アレイの特定領域の受光素子311を含む画素30のみを動作させるようにする。
 このように、垂直共振器型面発光レーザ10及びイベント検出センサ20を部分的に動作させることにより、物体検知に際しての測距を低消費電力にて行うことができる。尚、イベント検出センサ20の低消費電力の動作については、画素30の単位での電源のオン/オフ制御によって実現することができる。
 垂直共振器型面発光レーザ10及びイベント検出センサ20を用いる物体検知については、例えば、三角測量法を使って被写体までの距離を測定する、周知の三角測距方式を用いることによって実現することができる。
 次に、プロセッサは、物体検知した顔の特徴の認識処理を行う(ステップS12)。この顔認識処理では、垂直共振器型面発光レーザ10について、部分照射ではなく、広角領域の点光源11を動作させるようにする。一方、イベント検出センサ20については、特定の関心領域、即ち、ROI(Region Of Interest)領域の受光素子311を含む画素30を動作させるようにする。そして、顔認識処理では、イベント検出センサ20について、図5に示す画素信号生成部32を用いる階調読出し動作を行う。この階調読出し動作により、高解像度な画像を取得することができる。
 上述したように、ステップS12の顔認識処理では、垂直共振器型面発光レーザ10による広角照射、及び、イベント検出センサ20による階調読出し動作によって、物体検知した顔について、高解像度な画像の取得が行われる。そして、高解像度な画像を基に、顔認証用に顔の特徴点などの抽出が行われる。
 この顔認識には、ニューラルネットワーク等の機械学習によるパターン認識技術、例えば、教師データとして与えられる顔の特徴点と、撮影した顔画像の特徴点とを比較することによって認識処理を行う技術を用いることができる。
 次に、プロセッサは、認識した顔について形状認識を行う(ステップS13)。この形状認識処理では、ストラクチャード・ライト方式を用いた測距システムによって顔の形状認識が行われる。具体的には、画素単位で発光/非発光の制御が可能な垂直共振器型面発光レーザ10では、認識した顔に対し、ドット照射やライン照射などによって、時系列のパターン光の照射が行われる。
 一方、イベント検出センサ20については、図6又は図9に示すアドレスイベント検出部33から出力されるイベントデータが用いられる。イベントデータには、イベントが発生した相対的な時刻を表す時刻情報であるタイムスタンプが含まれている。このタイムスタンプ(時刻情報)を基に、イベントの発生個所を特定することができる。
 上述したように、ステップS13の形状認識処理では、画素単位で発光/非発光の制御が可能な垂直共振器型面発光レーザ10、及び、タイムスタンプ(時刻情報)でイベント発生個所を読み出すイベント検出センサ20による時系列、空間方向での高精度マッチングによって顔の形状認識が行われる。
 最後に、プロセッサは、形状認識した顔について、周知の顔認証技術を用いて認証を行う(ステップS14)。周知の顔認証技術としては、例えば、顔認識した顔画像の複数の特徴点を抽出し、あらかじめ登録済みの特徴点と照合することによって顔認証を行う技術を例示することができる。
 以上に説明した実施例4に係る信号処理は、垂直共振器型面発光レーザ10及びイベント検出センサ20の組み合わせから成り、ストラクチャード・ライト方式の技術を用いた物体認識システム1による顔認証のための処理である。本物体認識システム1では、ノイズイベントを除去し、顔に照射されたドットパターン光に由来するイベント情報のみを読み出すことができる。従って、実施例4に係る信号処理によれば、顔認証処理をより確実に行うことができることになる。
<変形例>
 以上、本開示に係る技術について、好ましい実施形態に基づいて説明したが、本開示に係る技術は当該実施形態に限定されるものではない。上記の実施形態において説明した物体認識システムの構成、構造は例示であり、適宜、変更することができる。
<応用例>
 以上に説明した本開示の物体認識システムは、例えば、顔認証機能を備える種々の電子機器に搭載される顔認証システムとして用いることができる。顔認証機能を備える電子機器として、例えば、スマートフォン、タブレット、パーソナルコンピュータ等のモバイル機器を例示することができる。
 但し、本開示の物体認識システムを顔認証システムとして用いることができる装置(システム)としては、モバイル機器に限られるものではなく、モバイル機器の他、例えば、顔認証によってドアロックを解除するセキュリティシステムや自動車などを例示することができる。
<本開示の電子機器>
 ここでは、本開示の物体認識システムを用いることができる本開示の電子機器の一例として、スマートフォンを例示する。先述した実施形態に係る物体認識システムを顔認証システムとして搭載したスマートフォンの正面側から見た外観図を図19に示す。
 本例に係るスマートフォン300は、筐体310の正面側に表示部320を備えている。そして、先述した実施形態に係る物体認識システムを顔認証システムとして搭載するスマートフォン300は、筐体310の正面側の上方部に、発光部330及び受光部340を備えている。尚、図19に示す発光部330及び受光部340の配置例は、一例であって、この配置例に限られるものではない。
 上記の構成のモバイル機器の一例であるスマートフォン300において、発光部330として、先述した物体認識システム1における垂直共振器型面発光レーザ(VCSEL)10を用い、受光部340として、当該物体認識システム1におけるイベント検出センサ(DVS)30を用いることができる。すなわち、本例に係るスマートフォン300は、先述した実施形態に係る物体認識システム1を用いることにより、顔認証機能を備えるスマートフォンとして作製される。
<本開示がとることができる構成>
 尚、本開示は、以下のような構成をとることもできる。
≪A.物体認識システム≫
[A-1]被写体に所定のパターンのドット光を照射する光源部、
 被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、
 イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、
 を備える物体認識システム。
[A-2]複数の画素は、イベント検出センサの画素アレイ部において、行方向、列方向、及び、斜め方向の少なくとも一方向で連続する画素群である、
 上記[A-1]に記載の物体認識システム。
[A-3]イベント検出センサにおいて、互いに隣接する第1の画素数を下限閾値とし、第1の画素数よりも多い、互いに隣接する第2の画素数を上限閾値とするとき、
 信号処理部は、第1の画素数以上、第2の画素数以下の互いに隣接する各画素が、一定期間内にイベントの発生を検出したとき、所定のパターンのドット光に由来するイベント情報として読み出す、
 上記[A-2]に記載の物体認識システム。
[A-4]信号処理部は、第1の画素数よりも少ない数の画素がイベントの発生を検出したとき、このイベントをノイズとして除去する、
 上記[A-3]に記載の物体認識システム。
[A-5]信号処理部は、被写体までの距離に応じて、下限閾値及び上限閾値の各画素数を変更する、
 上記[A-3]又は上記[A-4]に記載の物体認識システム。
[A-6]信号処理部は、被写体までの距離を測定する距離測定機能を有し、この距離測定機能によって被写体までの距離を測定する、
 上記[A-5]に記載の物体認識システム。
[A-7]近接センサを用いて、被写体までの距離を測定する、
 上記[A-5]に記載の物体認識システム。
[A-8]光源部は、面発光半導体レーザから成る、
 上記[A-1]乃至上記[A-7]のいずれかに記載の物体認識システム。
[A-9]面発光半導体レーザは、垂直共振器型面発光レーザである、
 上記[A-8]に記載の物体認識システム。
[A-10]被写体が人間の顔であるとき、顔認証に用いられる、
 上記[A-1]乃至上記[A-9]のいずれかに記載の物体認識システム。
[A-11]顔認証の処理では、
 光源部である垂直共振器型面発光レーザ及びイベント検出センサを用いて、特定の位置の顔の検知を行い、次いで、検知した顔の特徴の認識処理を行い、次いで、認識した顔について形状認識を行い、最後に、形状認識した顔の認証処理を行う、
 上記[A-10]に記載の物体認識システム。
≪B.電子機器≫
[B-1]被写体に所定のパターンのドット光を照射する光源部、
 被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、
 イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、
 を備える物体認識システムを有する電子機器。
[B-2]複数の画素は、イベント検出センサの画素アレイ部において、行方向、列方向、及び、斜め方向の少なくとも一方向で連続する画素群である、
 上記[B-1]に記載の電子機器。
[B-3]イベント検出センサにおいて、互いに隣接する第1の画素数を下限閾値とし、第1の画素数よりも多い、互いに隣接する第2の画素数を上限閾値とするとき、
 信号処理部は、第1の画素数以上、第2の画素数以下の互いに隣接する各画素が、一定期間内にイベントの発生を検出したとき、所定のパターンのドット光に由来するイベント情報として読み出す、
 上記[B-2]に記載の電子機器。
[B-4]信号処理部は、第1の画素数よりも少ない数の画素がイベントの発生を検出したとき、このイベントをノイズとして除去する、
 上記[B-3]に記載の電子機器。
[B-5]信号処理部は、被写体までの距離に応じて、下限閾値及び上限閾値の各画素数を変更する、
 上記[B-3]又は上記[B-4]に記載の電子機器。
[B-6]信号処理部は、被写体までの距離を測定する距離測定機能を有し、この距離測定機能によって被写体までの距離を測定する、
 上記[B-5]に記載の電子機器。
[B-7]近接センサを用いて、被写体までの距離を測定する、
 上記[B-5]に記載の電子機器。
[B-8]光源部は、面発光半導体レーザから成る、
 上記[B-1]乃至上記[B-7]のいずれかに記載の電子機器。
[B-9]面発光半導体レーザは、垂直共振器型面発光レーザである、
 上記[B-8]に記の載電子機器。
[B-10]被写体が人間の顔であるとき、顔認証に用いられる、
 上記[B-1]乃至上記[B-9]のいずれかに記載の電子機器。
[B-11]顔認証の処理では、
 光源部である垂直共振器型面発光レーザ及びイベント検出センサを用いて、特定の位置の顔の検知を行い、次いで、検知した顔の特徴の認識処理を行い、次いで、認識した顔について形状認識を行い、最後に、形状認識した顔の認証処理を行う、
 上記[B-10]に記載の電子機器。
 1・・・物体認識システム、10・・・垂直共振器型面発光レーザ(VCSEL)、11・・・点光源、20・・・イベント検出センサ(DVS)、21・・・画素アレイ部、22・・・駆動部、23・・・アービタ部(調停部)、24・・・カラム処理部、25・・・信号処理部、30・・・画素、40・・・光源駆動部、50・・・センサ制御部、60・・・信号処理部、61・・・距離測定部、62・・・フィルタ条件設定部、63・・・フィルタリング処理部

Claims (13)

  1.  被写体に所定のパターンのドット光を照射する光源部、
     被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、
     イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、
     を備える物体認識システム。
  2.  複数の画素は、イベント検出センサの画素アレイ部において、行方向、列方向、及び、斜め方向の少なくとも一方向で連続する画素群である、
     請求項1に記載の物体認識システム。
  3.  イベント検出センサにおいて、互いに隣接する第1の画素数を下限閾値とし、第1の画素数よりも多い、互いに隣接する第2の画素数を上限閾値とするとき、
     信号処理部は、第1の画素数以上、第2の画素数以下の互いに隣接する各画素が、一定期間内にイベントの発生を検出したとき、所定のパターンのドット光に由来するイベント情報として読み出す、
     請求項2に記載の物体認識システム。
  4.  信号処理部は、第1の画素数よりも少ない数の画素がイベントの発生を検出したとき、このイベントをノイズとして除去する、
     請求項3に記載の物体認識システム。
  5.  信号処理部は、被写体までの距離に応じて、下限閾値及び上限閾値の各画素数を変更する、
     請求項3に記載の物体認識システム。
  6.  信号処理部は、被写体までの距離を測定する距離測定機能を有し、この距離測定機能によって被写体までの距離を測定する、
     請求項5に記載の物体認識システム。
  7.  近接センサを用いて、被写体までの距離を測定する、
     請求項5に記載の物体認識システム。
  8.  光源部は、面発光半導体レーザから成る、
     請求項1に記載の物体認識システム。
  9.  面発光半導体レーザは、垂直共振器型面発光レーザである、
     請求項8に記載の物体認識システム。
  10.  被写体が人間の顔であるとき、顔認証に用いられる、
     請求項1に記載の物体認識システム。
  11.  顔認証の処理では、
     光源部である垂直共振器型面発光レーザ及びイベント検出センサを用いて、特定の位置の顔の検知を行い、次いで、検知した顔の特徴の認識処理を行い、次いで、認識した顔について形状認識を行い、最後に、形状認識した顔の認証処理を行う、
     請求項10に記載の物体認識システム。
  12.  被写体に所定のパターンのドット光を照射する光源部、及び、
     被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、
     を備える物体認識システムの信号処理に当たって、
     イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う、
     物体認識システムの信号処理方法。
  13.  被写体に所定のパターンのドット光を照射する光源部、
     被写体で反射された所定のパターンのドット光を受光し、画素の輝度変化が所定の閾値を超えたことをイベントとして検出するイベント検出センサ、及び、
     イベント検出センサの画素アレイ部において、所定の画素数以上連続する複数の画素が一定期間内にイベントの発生を検出したとき、このイベントをノイズとして除去する処理を行う信号処理部、
     を備える物体認識システムを有する電子機器。
PCT/JP2020/029804 2019-10-30 2020-08-04 物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器 WO2021084833A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202080074125.2A CN114600116A (zh) 2019-10-30 2020-08-04 对象识别系统、对象识别系统的信号处理方法、以及电子装置
US17/771,217 US11869273B2 (en) 2019-10-30 2020-08-04 Object recognition with removal of event as noise when the event is detected for a group of pixels exceeding a threshold
EP20882429.2A EP4053500B1 (en) 2019-10-30 2020-08-04 Object recognition system, signal processing method of object recognition system, and electronic device
JP2021554089A JPWO2021084833A1 (ja) 2019-10-30 2020-08-04

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-197053 2019-10-30
JP2019197053 2019-10-30

Publications (1)

Publication Number Publication Date
WO2021084833A1 true WO2021084833A1 (ja) 2021-05-06

Family

ID=75715062

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/029804 WO2021084833A1 (ja) 2019-10-30 2020-08-04 物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器

Country Status (5)

Country Link
US (1) US11869273B2 (ja)
EP (1) EP4053500B1 (ja)
JP (1) JPWO2021084833A1 (ja)
CN (1) CN114600116A (ja)
WO (1) WO2021084833A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023026880A1 (ja) * 2021-08-26 2023-03-02 ソニーグループ株式会社 測定装置、測定方法、プログラム
WO2023112532A1 (ja) * 2021-12-15 2023-06-22 ソニーグループ株式会社 測定装置、測定方法、プログラム
WO2023189279A1 (ja) * 2022-03-29 2023-10-05 ソニーセミコンダクタソリューションズ株式会社 信号処理装置、撮像装置および信号処理方法
WO2024070523A1 (ja) * 2022-09-30 2024-04-04 ソニーセミコンダクタソリューションズ株式会社 光検出素子及び電子機器

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7489189B2 (ja) * 2019-08-30 2024-05-23 ソニーセミコンダクタソリューションズ株式会社 固体撮像素子、撮像装置、および、固体撮像素子の制御方法
JP2021048554A (ja) * 2019-09-20 2021-03-25 ソニーセミコンダクタソリューションズ株式会社 撮像装置、撮像制御方法、プログラム
US20220196386A1 (en) * 2020-12-22 2022-06-23 Faro Technologies, Inc. Three-dimensional scanner with event camera
US20230055268A1 (en) * 2021-08-18 2023-02-23 Meta Platforms Technologies, Llc Binary-encoded illumination for corneal glint detection
CN117479031A (zh) * 2023-12-22 2024-01-30 珠海燧景科技有限公司 一种事件传感器的像素排列结构及去噪方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014165787A (ja) * 2013-02-27 2014-09-08 Canon Inc 撮像装置およびその制御方法、プログラム、記憶媒体
US20190045173A1 (en) * 2017-12-19 2019-02-07 Intel Corporation Dynamic vision sensor and projector for depth imaging
WO2019135411A1 (ja) * 2018-01-05 2019-07-11 株式会社ニコン 検出装置およびセンサ

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2887009A1 (en) * 2013-12-23 2015-06-24 Universität Zürich Method for reconstructing a surface using spatially structured light and a dynamic vision sensor
WO2016109884A1 (en) * 2015-01-05 2016-07-14 Valorbec Limited Partnership Automated recommendation and virtualization systems and methods for e-commerce
US9961258B2 (en) * 2015-02-23 2018-05-01 Facebook, Inc. Illumination system synchronized with image sensor
US9934557B2 (en) * 2016-03-22 2018-04-03 Samsung Electronics Co., Ltd Method and apparatus of image representation and processing for dynamic vision sensor
CN107147856B (zh) * 2017-03-30 2019-11-22 深圳大学 一种像素单元及其去噪方法、动态视觉传感器、成像装置
US10242294B2 (en) * 2017-05-01 2019-03-26 Intel Corporation Target object classification using three-dimensional geometric filtering
JP7357624B2 (ja) * 2018-01-26 2023-10-06 プロフジー イベントベースセンサからの信号を処理する方法および装置
CN113678435A (zh) * 2019-02-07 2021-11-19 奇跃公司 具有高时间分辨率的轻型低功耗交叉现实设备
WO2021216479A1 (en) * 2020-04-22 2021-10-28 Apple Inc. Event sensor-based depth estimation
KR20220015964A (ko) * 2020-07-31 2022-02-08 삼성전자주식회사 시각적 주행 거리 측정 애플리케이션들을 위한 손실된 이미지 특징 복원을 위한 방법 및 시스템
US11843879B2 (en) * 2020-12-15 2023-12-12 Raytheon BBN Technologies, Corp. Systems, devices, and methods for pixel frequency filtering for an event camera
KR20230070091A (ko) * 2021-11-12 2023-05-22 삼성전자주식회사 다이나믹 비전 센서 시스템의 동작 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014165787A (ja) * 2013-02-27 2014-09-08 Canon Inc 撮像装置およびその制御方法、プログラム、記憶媒体
US20190045173A1 (en) * 2017-12-19 2019-02-07 Intel Corporation Dynamic vision sensor and projector for depth imaging
WO2019135411A1 (ja) * 2018-01-05 2019-07-11 株式会社ニコン 検出装置およびセンサ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4053500A4 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023026880A1 (ja) * 2021-08-26 2023-03-02 ソニーグループ株式会社 測定装置、測定方法、プログラム
WO2023112532A1 (ja) * 2021-12-15 2023-06-22 ソニーグループ株式会社 測定装置、測定方法、プログラム
WO2023189279A1 (ja) * 2022-03-29 2023-10-05 ソニーセミコンダクタソリューションズ株式会社 信号処理装置、撮像装置および信号処理方法
WO2024070523A1 (ja) * 2022-09-30 2024-04-04 ソニーセミコンダクタソリューションズ株式会社 光検出素子及び電子機器

Also Published As

Publication number Publication date
US20220375256A1 (en) 2022-11-24
EP4053500B1 (en) 2024-01-03
US11869273B2 (en) 2024-01-09
JPWO2021084833A1 (ja) 2021-05-06
EP4053500A4 (en) 2022-12-28
EP4053500A1 (en) 2022-09-07
CN114600116A (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
WO2021084833A1 (ja) 物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器
US11165982B1 (en) Spatial derivative pixel array with adaptive quantization
JP7451110B2 (ja) 測距システム及び電子機器
ES2847200T3 (es) Sensor de imágenes para interacción humano-ordenador basada en visión por ordenador
US9100605B2 (en) Global shutter with dual storage
WO2021070445A1 (ja) 顔認証システム及び電子機器
EP3381182A1 (en) Imaging system, distance measuring device, method for operating the imaging system and the distance measuring device
WO2019205217A1 (zh) 像素采集电路及光流传感器
WO2021084832A1 (ja) 物体認識システム及び物体認識システムの信号処理方法、並びに、電子機器
US20220291385A1 (en) Distance measurement system and electronic apparatus
Oike et al. Design and implementation of real-time 3-D image sensor with 640/spl times/480 pixel resolution
US20050281440A1 (en) Iris feature detection and sensor-based edge detection
WO2021210389A1 (ja) 物体認識システム及び電子機器
WO2021157393A1 (ja) 測距装置および測距方法
US20230209216A1 (en) Image sensor with in-pixel background subtraction and motion detection
US20230336883A1 (en) Solid-state imaging device and electronic apparatus
US20220247943A1 (en) Image sensor with in-pixel background subtraction and motion detection
Wu et al. A trapezoid multiresolution CMOS image sensor for traffic monitoring
WO2021256102A1 (ja) センサ装置、制御方法、プログラム
CN114930808A (zh) 固体摄像器件和摄像设备
Zhang Low power feature-extraction smart CMOS image sensor design

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20882429

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021554089

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020882429

Country of ref document: EP

Effective date: 20220530