JP2024000525A - まばたき検出方法及びシステム - Google Patents

まばたき検出方法及びシステム Download PDF

Info

Publication number
JP2024000525A
JP2024000525A JP2023098278A JP2023098278A JP2024000525A JP 2024000525 A JP2024000525 A JP 2024000525A JP 2023098278 A JP2023098278 A JP 2023098278A JP 2023098278 A JP2023098278 A JP 2023098278A JP 2024000525 A JP2024000525 A JP 2024000525A
Authority
JP
Japan
Prior art keywords
dvs
frame
frames
eye
average height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023098278A
Other languages
English (en)
Inventor
シュエリ ファン
Xueli Fan
ハイ リウ
Hai Liu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman International Industries Inc
Original Assignee
Harman International Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman International Industries Inc filed Critical Harman International Industries Inc
Publication of JP2024000525A publication Critical patent/JP2024000525A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/113Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for determining or recording eye movement
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R1/00Optical viewing arrangements; Real-time viewing arrangements for drivers or passengers using optical image capturing systems, e.g. cameras or video systems specially adapted for use in or on vehicles
    • B60R1/20Real-time viewing arrangements for drivers or passengers using optical image capturing systems, e.g. cameras or video systems specially adapted for use in or on vehicles
    • B60R1/29Real-time viewing arrangements for drivers or passengers using optical image capturing systems, e.g. cameras or video systems specially adapted for use in or on vehicles for viewing an area inside the vehicle, e.g. for viewing passengers or cargo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R2300/00Details of viewing arrangements using cameras and displays, specially adapted for use in a vehicle
    • B60R2300/10Details of viewing arrangements using cameras and displays, specially adapted for use in a vehicle characterised by the type of camera system used
    • B60R2300/108Details of viewing arrangements using cameras and displays, specially adapted for use in a vehicle characterised by the type of camera system used using 'non-standard' camera systems, e.g. camera sensor used for additional purposes i.a. rain sensor, camera sensor split in multiple image areas
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R2300/00Details of viewing arrangements using cameras and displays, specially adapted for use in a vehicle
    • B60R2300/80Details of viewing arrangements using cameras and displays, specially adapted for use in a vehicle characterised by the intended use of the viewing arrangement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Ophthalmology & Optometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Mechanical Engineering (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

【課題】まばたき検出方法及びシステムを提供する。【解決手段】方法は、DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップS41と、DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成するステップS42と、を含む。各DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられる。方法はまた、複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップS43を含む。前記判定するステップは、少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む。【選択図】図4

Description

本発明はまばたき検出方法及びシステムに関し、より具体的にはDVSカメラ又はイベントカメラに基づくまばたき検出方法及びシステムに関する。本発明はさらに疲労運転検出方法及びシステム、並びにまばたき検出システム又は疲労運転検出システムを備える車両に関する。
疲労運転とは、運転者が長時間の連続運転又はその他の理由により疲労した状態で車両を運転することをいう。疲労運転は重大な交通事故を引き起こしやすく、従って運転者の疲労状態を検出する必要がある。まばたき持続時間及び/又は頻度などの人のまばたきパターンは、眠気の程度などの人の状態を示すことができる。疲労運転検出方法において、運転者のまばたき検出は非常に重要なプロセスである。
現在、従来のカメラを使用したまばたき検出技術が存在する。しかしながら、眼部は顔全体に占める面積が小さく、且つまばたきは一般的に非常に速く、数分の1秒の時間しか続かない。従来のほとんどのカメラでは、まばたきの頻度だけでなく、まばたきのパターンの詳細を分析することも困難である。例えば、毎秒30フレームの従来のカメラで撮影されたまばたきの画像は不明瞭になるおそれがある。さらに、通常まばたき全体は数フレームしか持続せず、まばたきの正確な持続時間を特定することは困難である。毎秒100フレームを超えるフレームレートの高速カメラを採用することで、より正確にまばたき検出を行うことができる。しかしながら、高速カメラはコスト及びデータ処理量が大幅に増加する。さらに、従来のカメラは、低照度条件下で鮮明なまばたき写真を撮影することが困難である。
DVSカメラ又はイベントカメラは、斬新で、生物から発想を得た非同期ビジョン取得デバイスである。標準的な従来のフレームベースカメラと比較して、DVSカメラの単一ピクセルは光強度変化の「イベント」ストリームを非同期的に報告する。従来のカメラと比較して、DVSカメラは、i) 高い時間分解能(ミリ秒スケール)、ii) 高いダイナミックレンジ(140dB、従来のカメラのダイナミックレンジは60dB)、iii) 低い電力消費といういくつかの利点を有する。しかしながら、現在、DVSカメラに基づきまばたき検出を行う簡単且つ効果的な方法は存在しない。
本発明の目的は、まばたき頻度及びまばたき持続時間等を簡単且つ正確に検出することができる、DVSカメラに基づくまばたき検出方法を提供することである。
本発明の一態様によれば、DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップと、前記DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成し、前記複数のDVSフレームの各DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各前記第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各前記第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられるステップと、前記複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップと、を含み、そのうち、まばたき動作が存在するか否かを判定するステップは、前記少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む、DVSカメラに基づくまばたき検出方法を提供する。
本発明の別の態様によれば、DVSピクセルストリームを取得するために撮影することに用いられるDVSカメラと、前記DVSカメラに接続され、上記まばたき検出方法を実行するように構成されたプロセッサと、を備えるまばたき検出システムを提供する。
本発明の別の態様によれば、車両本体と、前記車両本体に取り付けられた上記まばたき検出システムと、を備える第2ピクセル車両を提供する。
本発明は、例えば、以下を提供する。
(項目1)
DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップと、
前記DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成し、前記複数のDVSフレームの各DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各前記第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各前記第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられるステップと、
前記複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップと、を含み、
まばたき動作が存在するか否かを判定するステップは、前記少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む、DVSカメラに基づくまばたき検出方法。
(項目2)
前記複数のDVSフレームのうち各DVSフレームはさらに複数の第3色ピクセルを含み、前記第3色ピクセルは明化イベントを示すDVSピクセル又は暗化イベントを示すDVSピクセルに関連付けられていない、上記項目に記載のまばたき検出方法。
(項目3)
まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第1色領域が前記第2色領域の上方にある時、目を閉じる動作が進行中であると判定するステップをさらに含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目4)
まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第2色領域が前記第1色領域の上方にある時、目を開ける動作が進行中であると判定するステップをさらに含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目5)
まばたき動作が存在するか否かを判定するステップは、
前記少なくとも1つのDVSフレームのうち各DVSフレームの平均高さの差を計算し、前記平均高さの差は、前記少なくとも1つのDVSフレームの前記眼部領域における第1色ピクセルと第2色ピクセルの平均高さの差であるステップと、
前記平均高さの差の絶対値が閾値よりも大きい時、前記少なくとも1つのDVSフレームの眼部領域に第1色領域と第2色領域が上下に分布するパターンが存在すると判定するステップと、をさらに含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目6)
平均高さの差を計算するステップは、
前記眼部領域における第1色ピクセルの第1平均高さを計算するステップと、
前記眼部領域における第2色ピクセルの第2平均高さを計算するステップと、
第1平均高さから第2平均高さを引いて前記平均高さの差を計算するステップと、を含む上記項目のいずれか一項に記載のまばたき検出方法。
(項目7)
まばたき動作が存在するか否かを判定するステップの後、まばたき持続時間を計算するステップをさらに含み、まばたき持続時間を計算するステップは、
前記複数のDVSフレームから第1組隣接DVSフレームを特定し、第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つその絶対値は第1閾値よりも大きいステップと、
前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つその絶対値は第2閾値よりも大きいステップと、
前記第1組隣接DVSフレームから第1基準DVSフレームを特定するステップと、
前記第2組隣接DVSフレームから第2基準DVSフレームを特定するステップと、
第1基準DVSフレームの撮影時間と第2基准DVSフレームの撮影時間の時間差に基づいてまばたき持続時間を計算するステップと、を含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目8)
前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち時間的に真中のDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち時間的に真中のDVSフレームである、上記項目のいずれか一項に記載のまばたき検出方法。
(項目9)
前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームである、上記項目のいずれか一項に記載のまばたき検出方法。
(項目10)
まばたき動作が存在するか否かを判定するステップの後、1回以上の完全なまばたきを特定するステップをさらに含み、1回以上の完全なまばたきを特定するステップは、
前記複数のDVSフレームから第1組隣接DVSフレームを特定し、前記第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つ第1閾値よりも大きいステップと、
前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つ第2閾値よりも大きいステップと、
特定された第1組隣接DVSフレーム及び特定された第2組隣接DVSフレームに基づき1回以上の完全なまばたきを特定するステップと、を含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目11)
前記1回以上の完全なまばたきに関連するDVSフレームのうち少なくとも一部のDVSフレームの撮影時間を利用してまばたき頻度を計算するステップをさらに含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目12)
まばたき動作が存在するか否かを判定するステップの前に、前記少なくとも1つのDVSフレームの各DVSフレーム内で前記眼部領域を特定するステップをさらに含む、上記項目のいずれか一項に記載のまばたき検出方法。
(項目13)
DVSピクセルストリームを取得するために撮影することに用いられるDVSカメラと、
前記DVSカメラに接続され、上記項目のいずれか一項に記載のまばたき検出方法を実行するように構成されたプロセッサと、を備えるまばたき検出システム。
(項目14)
車両本体と、
前記車両本体に取り付けられた上記項目に記載のまばたき検出システムと、を備える車両。
(摘要)
まばたき検出方法及びシステムを開示する。まばたき検出方法は、DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップと、前記DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成し、各前記DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各前記第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各前記第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられるステップと、前記複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップと、を含み、そのうち、まばたき動作が存在するか否かを判定するステップは、前記少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む。
本発明の1つ又は複数の実施例に係るまばたき検出システムの概略図である。 本発明の1つ又は複数の実施例に係るまばたき検出システムによって取得されたまばたき過程における複数のDVSフレームの図である。 本発明の1つ又は複数の実施例に係るまばたき検出システムによって取得されたまばたき過程における複数のDVSフレームの図である。 本発明の1つ又は複数の実施例に係るまばたき検出システムによって取得されたまばたき過程における複数のDVSフレームの図である。 本発明の1つ又は複数の実施例に係るまばたき検出システムによって取得されたまばたき過程における複数のDVSフレームの図である。 本発明の1つ又は複数の実施例に係るまばたき検出システムによって取得されたまばたき過程における複数のDVSフレームの図である。 図2Bの部分拡大図である。 図2Dの部分拡大図である。 本発明の1つ又は複数の実施例に係るまばたき検出方法である。 本発明のいくつかの実施例に係るまばたき動作を判定(ステップS33)する具体的なステップである。 本発明の1つ又は複数の実施例に係るまばたき検出方法である。 本発明の1つ又は複数の実施例に係るまばたき検出方法である。
以下に本発明の実施例を詳細に説明し、前記実施例の実例は図面に示され、これらの図面において同一又は類似の符号は同一又は類似の要素又は同一又は類似の機能を有する要素を示す。以下に図面を参照して説明する実施例は例示的なものであり、本発明を説明するためのものに過ぎず、本発明を限定するものと理解すべきではない。
本明細書で使用される場合、「DVSカメラ」、「イベントカメラ」、「ダイナミックビジョンセンサ」及び「DVS」という用語は互換可能に使用され、いずれもイベントベースカメラを指す。「DVSピクセル」、「ピクセルイベント」、「イベント」という用語は互換可能に使用され、DVSカメラでキャプチャされた光強度の変化を指すことができる。DVSカメラの「フレーム」又は「DVSフレーム」という用語は、DVSによってタイムスパン内に撮影されたDVSピクセル又はその中に一定数のピクセルが統合された画像又はフレームを指す。DVSフレームの「撮影時間」という用語は、DVSピクセルがキャプチャ又は撮影された時間、例えばDVSフレームのタイムスパンの中間時間、又はDVSフレーム内の全てのDVSピクセルのタイプスタンプの中間時間を指す。
別途定義されない限り、本明細書で使用される技術用語及び科学用語は、本発明の当業者が一般的に理解するものと同じ意味を有する。なお、本発明の説明において、「中心」、「縦方向」、「横方向」、「上」、「下」、「前」、「後」、「左」、「右」、「垂直」、「水平」、「上部」、「底部」、「内」、「外」等の用語が指示する方位又は位置関係は、図面に示す方位又は位置関係に基づき、本発明を説明しやすくし、説明を簡略化するためのものに過ぎず、対象の装置や素子が特定の方位を有し、特定の方位で構成され及び操作されるべきであることを指示又は暗示するものではなく、従って本発明を限定するものと理解すべきではない。さらに、「第1」、「第2」という用語は、説明する目的で用いられるに過ぎず、相対的な重要性を示す又は暗示するものと理解すべきではない。
DVSカメラは光強度の変化のみをキャプチャし、次いで非同期DVSピクセル(ピクセルイベント)を作成する。DVSピクセル又はピクセルイベント又はイベントは、ピクセル又はイベントデータを用いて示されることが可能であり、一般的に[x, y, t, p]の形態が利用され、x及びyは該イベントのx座標及びy座標を表し、tは該イベントを示すタイプスタンプを表し、pはイベントの極性を表し、光強度の変化が明化であるか暗化であるかを示す。1つ又は複数の実施例において、光強度が明化した場合、pは+1であり、光強度が弱くなった場合、pは-1である。従来のカメラと比較して、DVSは、低レイテンシで、モーションブラーがなく、高ダイナミックレンジで、電力消費が少ないなどの利点を有する。
連続するピクセルを含む完全な画像又はフレームを作成する従来のカメラとは異なり、DVSカメラは、空間及び時間上で離散的且つ非連続的である非同期DVSピクセルのみを作成するため、DVSフレームを生成するために、タイムスパン内でDVSカメラによってキャプチャされたDVSピクセル(ピクセルイベント)を統合する必要がある。DVSフレームを作成することができる様々な方法があり、例えば、DVSフレームを形成するために、固定タイムスパン又は可変タイムスパン内のDVSピクセルを統合するか、又は一定数のDVSピクセルを統合するなどである。DVSピクセルをDVSフレームに統合する方法は周知であり、ここでは説明を省略する。
本発明はDVSカメラに基づくまばたき検出方法を提供する。該まばたき検出方法は、DVSフレーム内に固有のパターン特性が存在するか否かを判定することによってまばたき検出を行う。いくつかの実施例において、該まばたき検出方法は、DVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定することにより、まばたき動作が進行中であるか否かを特定する。いくつかの実施例において、該まばたき検出方法は、眼部領域内の第1色ピクセルと第2色ピクセルの平均高さの差を計算し、且つ該平均高さの差の絶対値が閾値よりも大きい場合、前記DVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在すると判定することにより、まばたき動作が進行中であるか否かを特定する。いくつかの実施例において、該まばたき検出方法はさらに、まばたき、目を開ける又は目を閉じる動作を検出する。いくつかの実施例において、該まばたき検出方法はさらに、まばたき頻度及び/又はまばたき持続時間を計算することができる。
本発明に係るいくつかの実施例において、DVSフレームの眼部における第1色ピクセルの平均高さと第2色ピクセルの平均高さ、及び両者の高さの差を計算するだけで、目のまばたき、目を開ける及び目を閉じる動作を正確に判定することができる。本発明の方法は、従来の画像処理方法と比較して計算量が非常に少ない。また、DVSフレームにおいて光強度の変化が発生した位置のみが第1色ピクセル又は第2色ピクセルを有することから、計算量がさらに減少する。従って、本発明の方法は高フレームレート(例えば毎秒200フレーム)の画像処理に特に適しており、それによりまばたき検出の精度を保証する。
図1は、本発明の1つ又は複数の実施例に係るまばたき検出システム100の概略図である。図に示すように、本発明に係るまばたき検出システム100はDVSカメラ102を備える。該DVSカメラ102は人物104の顔106を撮影するために用いられる。まばたき検出システム100はさらに、DVSカメラ102に接続され、且つDVSカメラ102からDVSピクセルストリームを受信し、処理するために用いられるプロセッサ(図示せず)を備える。
図2A-2Eは、本発明に係るまばたき検出システム100によって撮影されたまばたき過程における複数のDVSフレームの図であり、図2Aはまばたきする前のDVSフレームを示し、図2Bはちょうど眼を閉じる時のDVSフレームを示し、図2Cは実質的に眼を完全に閉じている時のDVSフレームを示し、図2D及び図2Eはちょうど眼を開ける時のDVSフレームを示す。2A-2EのDVSフレームにおいて、白色ピクセル点は光強度の明化を示し、黒色ピクセル点は光強度の暗化を示し、灰色ピクセル点は光強度が変化していないことを示す。本発明のDVSフレームのピクセル色は黒色、白色、灰色に限定されなくてもよい。例えば、本発明の別の実施例に係るDVSフレームにおいて、第1色ピクセル点は光強度の明化を示し、第2色ピクセル点は光強度の暗化を示し、第3色ピクセル点は光強度が変化していないことを示す。本発明の別の実施例に係るDVSフレームは、図2A-2Eに示されるような実際の画像ではなく、単にタイムスパンのDVSピクセルを含む仮想フレームの概念であってもよい。この場合、DVSフレームは第1色ピクセル及び第2色ピクセルのみを含み、第3色ピクセルを含まなくてもよい。
当業者であれば、図2A-2Eはまばたき検出システム100によって撮影されたいくつかの例示的なDVSフレームに過ぎず、まばたき検出システム100によって実際に撮影されるDVSフレームの数は、図2A-2Eに示されたものよりもはるかに多くなり得ることを理解されたい。図2A-2Eに示す各DVSフレームは、5msのタイムスパン内でDVSカメラ102によってキャプチャされたDVSピクセルを統合することで形成されたDVSフレームである。当業者であれば、DVSフレームは5ms以外のタイムスパンのDVSピクセルを統合することで形成してもよく、又は一定数のDVSピクセルを統合することで形成してもよいことを理解されたい。
本発明者らは研究の結果、目を閉じる及び目を開ける過程で撮影されたDVSフレームが非常に顕著な特徴を有することを発見した。図2B、図2D及び図2Eに示すように、目を開ける及び目を閉じる過程で、DVSフレームの眼部領域には、白色領域と黒色領域が上下に分布する非常に明快なパターンが存在する。具体的には、図2Bに示すように、目を閉じる過程において、DVSフレームの眼部領域の該パターンにおける白色領域は上部にあり、黒色領域は下部にあり、それに対して図2D及び図2Eに示すように、目を開ける過程において、DVSフレームの眼部領域の該パターンにおける白色領域は下部にあり、黒色領域は上部にある。まばたきを開始する前の図2A及び目を完全に閉じている図Cにおいて、DVSフレームの眼部領域はそのようなパターンを含まない。
図3Aは図2Bの部分拡大図であり、図3Bは図2Dの部分拡大図である。図3Aに示すように、目を閉じる過程で撮影されたDVSフレームの眼部領域302aにおいて、眼部は実質的に上下2つの部分に分割され、眼部の上半分312aが白色で、眼部の下半分314aが黒色である。換言すれば、眼部的上半分312aは実質的に水平な白色ストリップを呈し、眼部の下半分314aは実質的に水平な黒色ストリップを呈する。図3Bに示すように、目を閉じる過程で撮影されたDVSフレームの眼部領域302bにおいて、眼部は実質的に上下2つの部分に分割され、眼部の上半分312bが黒色で、眼部の下半分304bが白色である。換言すれば、眼部の上半分312bは実質的に水平な黒色ストリップを呈し、眼部の下半分314bは実質的に水平な白色ストリップを呈する。
目を開ける及び目を閉じる過程で撮影されたDVSフレームの眼部のパターンは、非常に顕著な特徴(白色領域と黒色領域が上下に分布する)を有するため、本発明者らは、DVSフレームにおける該顕著な特徴を利用して、まばたき又は目を開ける及び目を閉じる動作を識別した。本発明に係る1つ又は複数の実施例において、DVSフレームの眼部領域に黒色領域と白色領域が上下に分布するパターンが存在する時、まばたき動作が進行中であると判定することができる。本発明に係る別の1つ又は複数の実施例において、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し、且つ白色領域が黒色領域の上方にある時、目を閉じる動作が進行中であると判定する。本発明に係る1つ又は複数の実施例において、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し、且つ黒色領域が白色領域の上方にある時、目を閉じる動作が進行中であると判定する。
本発明に係るいくつかの実施例において、いくつかの既知の画像処理技術によって、DVSフレームに黒色領域と白色領域が上下に分布するパターンが存在するか否かを判定し、且つDVSフレームの眼部領域に白色領域と黒色領域が上下に分布するパターンが存在する時、まばたき動作が進行中であると判定することができる。本発明に係る別の実施例において、いくつかの既知の画像処理技術によって、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し且つ白色領域が黒色領域の上方にあるパターンが存在するか否かを判定し、且つそのようなパターンが存在する場合、目を閉じる動作が進行中であると判定することができる。本発明に係る別の実施例において、いくつかの既知の画像処理技術によって、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し且つ黒色領域が白色領域の上方にあるパターンが存在するか否かを判定し、且つそのようなパターンが存在する場合、目を開ける動作が進行中であると判定することができる。本発明に係るいくつかの実施例において、上記の判定前及び/又は判定中に、DVSフレームにおける眼部領域を特定することができる。DVSにおける眼部領域を特定することは、いくつかの既知の画像処理技術によって実現することができる。
本発明の発明者らはさらに、まばたき又は目を開ける及び目を閉じる動作時のDVSフレームにおけるパターン特性に基づき、簡単且つ効果的なまばたき、目を開ける又は目を閉じる動作の判定方法を提供する。図3Aに示すように、DVSフレームの眼部の上半分312aは実質的に水平な白色ストリップを呈し、眼部の下半分314aは実質的に水平な黒色ストリップを呈するため、DVSフレームの眼部の全ての白色ピクセルの平均高さは高く、全ての黒色ピクセルの平均高さは低い。図3Bに示すように、DVSフレームの眼部の上半分312bは実質的に水平な黒色ストリップを呈し、眼部の下半分314bは実質的に水平な白色ストリップを呈するため、DVSフレームの眼部の全ての白色ピクセルの平均高さは低く、全ての黒色ピクセルの平均高さは高い。目を開ける又は目を閉じる以外のDVSフレーム(例えば図2A及び図2Cに示すDVSフレーム)において、DVSフレームの眼部における白色ピクセルと黒色ピクセルの分布は比較的にランダムであり、DVSフレームの眼部における全ての白色ピクセルの平均高さと全ての黒色ピクセルの平均高さは基本的に同じである。すなわち、本発明者らは、DVSフレームの眼部における白色ピクセルの平均高さと黒色ピクセルの平均高さとの関係に基づいて、まばたき動作、目を開ける動作又は目を閉じる動作が進行中であるか否かを判断できることを発見した。DVSフレームの眼部における白色ピクセルの平均高さと黒色ピクセルの平均高さの差の絶対値が閾値よりも大きい時、DVSフレームの眼部に白色領域と黒色領域が上下に分布するパターンが存在し、すなわちまばたき動作が進行中であると判定することができる。DVSフレームの眼部における白色ピクセルの平均高さが黒色ピクセルの平均高さよりも大きく、且つ高さの差の絶対値が閾値よりも大きい時、DVSフレームの眼部に白色領域と黒色領域が上下に分布し且つ白色領域が黒色領域の上方にあるパターンが存在し、すなわち目を閉じる動作が進行中であると判定することができる。DVSフレームの眼部における白色ピクセルの平均高さが黒色ピクセルの平均高さよりも小さく、且つ高さの差の絶対値が閾値よりも大きい時、DVSフレームの眼部に白色領域と黒色領域が上下に分布し且つ白色領域が黒色領域の下方にあるパターンが存在し、すなわち目を開ける動作が進行中であると判定することができる。
本発明に係る実施例において、DVSフレームの眼部における全ての白色ピクセルの平均高さと全ての黒色ピクセルの平均高さ、及び両者の高さの差を計算するだけで、目のまばたき、目を開ける及び目を閉じる動作を正確に判定することができる。本発明の方法は、従来の画像処理方法と比較して計算量が非常に少ない。また、DVSカメラの特性により、DVSフレームにおいて光強度の変化が発生した位置のみが白色ピクセル又は黒色ピクセルを有し、光強度が変化していない位置は灰色ピクセルであり、これにより計算量がさらに減少する。
図2A-2Eに示す実施例において、DVSフレームは5msのタイムスパン内でDVSカメラ102によってキャプチャされたDVSピクセルを統合することで形成されたものである。従って、該実施例において、毎秒200個のDVSフレームを生成することができる。これまで説明したように、本発明の方法はまばたき、目を開ける及び目を閉じる動作を判定する時の計算量が非常に少ないため、高フレームレート(例えば毎秒200フレーム)の画像処理を保証することができる。
本発明の実施例において、フレームレートが高い(例えば毎秒200フレーム)ため、毎回のまばたき過程でより多くのDVSフレームを取得することができ、毎回の目を開ける過程又は毎回の目を閉じる過程でもより多くのDVSフレームを取得することが可能である。従って、本発明のまばたき検出方法は、目のまばたき過程におけるまず目を閉じて、それから目を開けるという完全な過程を明確に判定することができ、まばたき頻度をより正確に計算することができる。また、まばたき過程全体におけるまず目を閉じて、それから目を開けるという過程を分析することにより、まばたき持続時間を比較的に正確に計算することができる。まばたき頻度及びまばたき持続時間という2つの指標は、疲労運転状態にあるか否かなどの人の精神状態を判断するために非常に有用である。
図4は、本発明の1つ又は複数の実施例に係るまばたき検出方法である。ステップS41では、DVSカメラを用いて人物の顔を撮影し、DVSピクセルストリームを取得する。DVSカメラで撮影された顔の部分は、少なくとも眼部を含む。従来のカメラとは異なり、DVSカメラは光強度の変化のみをキャプチャし、次いで非同期DVSピクセル(ピクセルイベント)を作成する。これらのDVSピクセルは、空間及び時間上で離散的且つ非連続的である可能性がある。DVSカメラの撮影過程で連続的に生成され、空間及び時間上で離散的且つ非連続的である可能性があるDVSピクセルを、本明細書ではDVSピクセルストリームと称する。ステップS42では、前記DVSピクセルストリームのDVSピクセルを統合又は組み合わせて複数のDVSフレームを形成する。いくつかの実施例において、固定タイムスパン内でDVSカメラによってキャプチャされたDVSピクセル(ピクセルイベント)を統合又は組み合わせることで1つのDVSフレームを生成してもよい。他の実施例において、可変タイムスパン内のDVSピクセルを統合又は組み合わせることで1つのDVSフレームを生成してもよい。別の実施例において、一定数のDVSピクセルを統合又は組み合わせることで1つのDVSフレームを生成してもよい。ステップS43では、形成されたDVSフレームに基づき、まばたき動作が存在するか否かを判定する。いくつかの実施例において、前記DVSフレームの眼部領域に白色領域と黒色領域が上下に分布するパターンが存在する場合、まばたき動作が存在すると判定する。本発明に係る1つ又は複数の実施例において、まばたき動作を判断するステップは、眼部領域における白色ピクセルの第1平均高さを計算するステップと、眼部領域における黒色ピクセルの第2平均高さを計算するステップと、眼部領域における白色ピクセルの第1平均高さから黒色ピクセルの第2平均高さを引いて平均高さの差を取得するステップと、平均高さの差の絶対値が閾値よりも大きい時、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布するパターンが存在し、すなわちまばたき動作が存在すると判定するステップと、を含む。該閾値は実験により決定することができる。1つ又は複数の実施例において、該閾値は眼部の高さに関連した値、例えば眼部の高さの1/8、1/10、1/15、1/20等であってもよい。
図5は、本発明のいくつかの実施例に係るまばたき動作を判定(ステップS33)する具体的なステップである。図5の実施例において、まばたき動作を判断するステップは、目を閉じる動作を判断するステップS51と、目を開ける動作を判断するステップS52と、を含む。図5の実施例において、DVSカメラのDVSピクセルストリームから生成された複数のDVSフレームにおいて、まず目を閉じる動作を判断し、次いで後続のDVSフレームにおいて目を開ける動作を判断する。これによりまばたき過程全体に対する検出を行い、まばたき過程をより正確に検出することができる。ステップS51では、前記DVSフレームの眼部領域に白色領域と黒色領域が上下に分布するパターンが存在し、且つ白色領域が黒色領域の上方にある場合、目を閉じる動作が進行中であると判定する。ステップS52では、前記DVSフレームの眼部領域に白色領域と黒色領域が上下に分布するパターンが存在し、且つ白色領域が黒色領域の下方にある場合、目を開ける動作が進行中であると判定する。本発明に係る別の1つ又は複数の実施例において、ステップS51では、DVSフレームの眼部領域における白色ピクセルの平均高さと黒色ピクセルの平均高さとの間の平均高さの差の絶対値が閾値よりも大きく、且つ白色ピクセルの平均高さが黒色ピクセルの平均高さよりも大きい時、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し、且つ白色領域が黒色領域の上方にあるパターンが存在し、すなわち目を閉じる動作が進行中であると判定する。ステップS52では、DVSフレームの眼部領域における白色ピクセルの平均高さと黒色ピクセルの平均高さとの間の平均高さの差の絶対値が閾値よりも大きく、且つ白色ピクセルの平均高さが黒色ピクセルの平均高さよりも小さい時、DVSフレームの眼部領域に白色領域と黒色領域が上下に分布し、且つ白色領域が黒色領域の下方にあるパターンが存在し、すなわち目を開ける動作が進行中であると判定する。本発明に係るいくつかの実施例において、目を閉じる動作を判定するための閾値と、目を開ける動作を判定するための閾値は同じであっても異なっていてもよい。
本発明に係る別の1つ又は複数の実施例において、ステップS51では、DVSカメラのDVSピクセルストリームから生成された複数のDVSフレームから、隣接する複数の目を閉じるDVSフレーム(第1組隣接DVSフレーム)を特定し、各目を閉じるDVSフレームの白色ピクセルと黒色ピクセルの平均高さの差は閾値よりも大きく、且つ白色ピクセルの平均高さは黒色ピクセルの平均高さよりも大きい。ステップS52では、複数のDVSフレームの該複数の目を閉じるDVSフレームの後続DVSフレームから、隣接する複数の目を開けるDVSフレーム(第2組隣接DVSフレーム)を特定し、各目を開けるDVSフレームの白色ピクセルと黒色ピクセルの平均高さの差は閾値よりも大きく、且つ白色ピクセルの平均高さは黒色ピクセルの平均高さよりも小さい。これにより、ステップS51及びS52によって、複数の目を閉じるDVSフレーム及び複数の目を開けるDVSフレームを含む1回の完全なまばたきが特定される。
図6は、本発明の1つ又は複数の実施例に係るまばたき検出方法である。図6に示すまばたき検出方法のステップS61、S62及びS63は、図4に示すステップS41、S42及びS43と基本的に同一又は類似しており、ここでは説明を省略する。ステップS64では、ステップS63を繰り返して実行し(又はステップS61~63を繰り返して実行)、複数回のまばたきを特定し、且つ各DVSフレームの撮影時間を組み合わせてまばたき頻度を計算する。
図7は、本発明の1つ又は複数の実施例に係るまばたき検出方法である。図7に示すまばたき検出方法のステップS71、S72及びS73は、図4に示すステップS41、S42及びS43と基本的に同一又は類似しており、ここでは説明を省略する。ステップS74では、ステップS51で特定された複数の目を閉じるDVSフレーム(第1組隣接DVSフレーム)から目を閉じる基準DVSフレーム(第1基準DVSフレーム)を特定し、且つステップS52で特定された複数の目を開けるDVSフレーム(第2組隣接DVSフレーム)から目を開ける基準DVSフレーム(第2基準DVSフレーム)を特定し、次いで目を閉じる基準DVSフレームと目を開ける基準DVSフレームとの間の撮影時間の差に基づいてまばたき持続時間を特定する。実際のまばたき持続時間は、一般的に、目を閉じる基準DVSフレームと目を開ける基準DVSフレームとの間の撮影時間の差よりも長い。本発明に係るいくつかの実施例において、まばたき持続時間と前記撮影時間の差との間の関係は、実験により特定することができる。本発明に係るいくつかの実施例において、まばたき持続時間は、目を閉じる基準DVSフレームと目を開ける基準DVSフレームとの間の撮影時間の差の線型関数であってもよい。
本発明に係るいくつかの実施例において、目を閉じる基準DVSフレーム又は目を開ける基準DVSフレームは、目を閉じる及び目を開ける過程における図3A及び図3Bに示すパターンが最も明確なDVSフレームである。これらの実施例において、目を閉じる基準DVSフレームは、複数の目を閉じるDVSフレームにおける白色ピクセルと黒色ピクセルの平均高さの差の絶対値が最も大きいDVSフレームであり、前記目を開ける基準DVSフレームは、複数の目を開けるDVSフレームにおける白色ピクセルと黒色ピクセルの平均高さの差の絶対値が最も大きいDVSフレームである。
本発明に係る別の実施例において、目を閉じる基準DVSフレームは、複数の目を閉じるDVSフレームのうち撮影時間が真中のDVSフレームであり、目を開ける基準DVSフレームは、複数の目を開けるDVSフレームのうち撮影時間が真中のDVSフレームである。本発明に係る別の実施例において、目を閉じる基準DVSフレームは、複数の目を閉じるDVSフレームのうちの他のDVSフレームであってもよく、目を開ける基準DVSフレームは、複数の目を開けるDVSフレームのうちの他のDVSフレームであってもよい。
本発明に係る1つ又は複数の実施例において、まばたき検出方法は、まばたき動作が存在するか否かを判定するステップの前に、DVSフレーム内で眼部領域を特定するステップをさらに含む。
図6に示すまばたき検出は、まばたき頻度を計算することに用いられ、図7に示すまばたき検出は、まばたき持続時間を計算することに用いられる。当業者であれば、図6と図7の方法は一緒に組み合わされてもよいことを理解されたい。すなわち、本発明に係る1つ又は複数の実施例において、まばたき検出はまばたき頻度を計算することだけでなく、まばたき持続時間を計算することも含む。
本発明の複数の態様は、システム、方法、又はコンピュータプログラム製品として具現化されてもよい。従って、本発明の複数の態様は、ハードウェア一式による実施例、ソフトウェア一式による実施例(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、又はソフトウェアとハードウェアの態様を組み合わせた実施例の形態をとることができる。さらに、本開示の各態様は、コンピュータ読み取り可能なプログラムコードが記憶された1つ又は複数のコンピュータ読み取り可能な媒体に組み込まれたコンピュータプログラム製品の形態をとることができる。
コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体又はコンピュータ読み取り可能な記憶媒体であってもよい。コンピュータ読み取り可能な記憶媒体は、例えば、電子的、磁気的、光学的、電磁的、赤外線又は半導体のシステム、装置又はデバイス又はそれらの任意の好適な組み合わせであってもよいが、これに限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例(非網羅的なリスト)は、ポータブルコンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、書き込み消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、コンパクトディスクリードオンリーメモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、又は上記の任意の適切な組み合わせを含む。本明細書の文脈において、コンピュータ読み取り可能な記憶媒体は、コマンド実行システム、装置、又はデバイスを使用し、又はそれらと一緒に組み合わせて使用するためのプログラムを含むか又は記憶することができる任意の有形媒体であってもよい。
本発明の複数の態様は、本発明の実施例に係る方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して説明されている。なお、フローチャート及び/又はブロック図における各ブロック、及びフローチャート及び/又はブロック図におけるブロックの組み合わせは、コンピュータプログラムコマンドによって実現することができる。これらのコンピュータプログラムコマンドは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサに提供されて、それにより機器が生成され、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサを介して実行されるコマンドが、フローチャート及び/又はブロック図の1つ又は複数のブロックにおける指定された機能/動作の実現を有効化する。このようなプロセッサは汎用プロセッサ、専用プロセッサ、特定用途向けプロセッサ又はフィールドプログラマブルプロセッサ又はゲートアレイであってもよいがこれらに限定されない。
本発明は、以下の方法で実施することができる。
(項目1)DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップと、前記DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成し、前記複数のDVSフレームの各DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各前記第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各前記第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられるステップと、前記複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップと、を含み、そのうち、まばたき動作が存在するか否かを判定するステップは、前記少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む、DVSカメラに基づくまばたき検出方法。
(項目2)前記複数のDVSフレームのうち各DVSフレームはさらに複数の第3色ピクセルを含み、前記第3色ピクセルは明化イベントを示すDVSピクセル又は暗化イベントを示すDVSピクセルに関連付けられていない、項目1に記載のまばたき検出方法。
(項目3)まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第1色領域が前記第2色領域の上方にある時、目を閉じる動作が進行中であると判定するステップをさらに含む、項目1~2のいずれか一項に記載のまばたき検出方法。
(項目4)まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第2色領域が前記第1色領域の上方にある時、目を開ける動作が進行中であると判定するステップをさらに含む、項目1~3のいずれか一項に記載のまばたき検出方法。
(項目5)まばたき動作が存在するか否かを判定するステップは、
前記少なくとも1つのDVSフレームのうち各DVSフレームの平均高さの差を計算し、前記平均高さの差は、対応するDVSフレームの前記眼部領域における第1色ピクセルと第2色ピクセルの平均高さの差であるステップと、
前記平均高さの差の絶対値が閾値よりも大きい時、対応するDVSフレームの眼部領域に第1色領域と第2色領域が上下に分布するパターンが存在すると判定するステップと、をさらに含む、項目1~4のいずれか一項に記載のまばたき検出方法。
(項目6)平均高さの差を計算するステップは、
前記眼部領域における第1色ピクセルの第1平均高さを計算するステップと、
前記眼部領域における第2色ピクセルの第2平均高さを計算するステップと、
第1平均高さと第2平均高さの差を求めて前記平均高さの差を計算するステップと、を含む項目1~5のいずれか一項に記載のまばたき検出方法。
(項目7)まばたき動作が存在するか否かを判定するステップの後、まばたき持続時間を計算するステップをさらに含み、まばたき持続時間を計算するステップは、
前記複数のDVSフレームから第1組隣接DVSフレームを特定し、第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つその絶対値は第1閾値よりも大きいステップと、
前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つその絶対値は第2閾値よりも大きいステップと、
前記第1組隣接DVSフレームから第1基準DVSフレームを特定するステップと、
前記第2組隣接DVSフレームから第2基準DVSフレームを特定するステップと、
第1基準DVSフレームの撮影時間と第2基准DVSフレームの撮影時間の時間差に基づいてまばたき持続時間を計算するステップと、を含む、項目1~6のいずれか一項に記載のまばたき検出方法。
(項目8)前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち時間的に真中のDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち時間的に真中のDVSフレームである、項目1~7のいずれか一項に記載のまばたき検出方法。
(項目9)前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームである、項目1~8のいずれか一項に記載のまばたき検出方法。
(項目10)まばたき動作が存在するか否かを判定するステップの後、複数回の完全なまばたきを特定するステップをさらに含み、複数回の完全なまばたきの各回の完全なまばたきを特定するステップは、
前記複数のDVSフレームから第1組隣接DVSフレームを特定し、前記第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つ第1閾値よりも大きいステップと、
前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つ第2閾値よりも大きいステップと、
特定された第1組隣接DVSフレーム及び特定された第2組隣接DVSフレームに基づき1回の完全なまばたきを特定するステップと、を含む、項目1~9のいずれか一項に記載のまばたき検出方法。
(項目11)前記複数回の完全なまばたきに関連するDVSフレームのうち少なくとも一部のDVSフレームの撮影時間を利用してまばたき頻度を計算するステップをさらに含む、項目1~10のいずれか一項に記載のまばたき検出方法。
(項目12)まばたき動作が存在するか否かを判定するステップの前に、前記少なくとも1つのDVSフレームの各DVSフレーム内で前記眼部領域を特定するステップをさらに含む、項目1~11のいずれか一項に記載のまばたき検出方法。
(項目13)DVSピクセルストリームを取得するために撮影することに用いられるDVSカメラと、前記DVSカメラに接続され、項目1~12のいずれか一項に記載のまばたき検出方法を実行するように構成されたプロセッサと、を備えるまばたき検出システム。
(項目14)車両本体と、前記車両本体に取り付けられた項目13に記載のまばたき検出システムと、を備える車両。
以上の記述は、本発明の原理を説明するための例示的な実施例に過ぎず、本発明の保護範囲を限定するものではない。当業者であれば、本発明の精神及び本質から逸脱することなく、様々な変形及び改良を行うことができ、これらの変形及び改良も本発明の保護範囲内にある。

Claims (14)

  1. DVSカメラを用いて顔を撮影し、それによりDVSピクセルストリームを取得するステップと、
    前記DVSピクセルストリームのDVSピクセルを統合して複数のDVSフレームを形成し、前記複数のDVSフレームの各DVSフレームは複数の第1色ピクセル及び複数の第2色ピクセルを含み、各前記第1色ピクセルは明化イベントを示す1つ又は複数のDVSピクセルに関連付けられ、各前記第2ピクセルは暗化イベントを示す1つ又は複数のDVSピクセルに関連付けられるステップと、
    前記複数のDVSフレームの少なくとも1つのDVSフレームにまばたき動作が存在するか否かを判定するステップと、を含み、
    まばたき動作が存在するか否かを判定するステップは、前記少なくとも1つのDVSフレームの眼部領域内に第1色領域及び第2色領域が上下に分布するパターンが存在するか否かを判定するステップを含む、DVSカメラに基づくまばたき検出方法。
  2. 前記複数のDVSフレームのうち各DVSフレームはさらに複数の第3色ピクセルを含み、前記第3色ピクセルは明化イベントを示すDVSピクセル又は暗化イベントを示すDVSピクセルに関連付けられていない、請求項1に記載のまばたき検出方法。
  3. まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第1色領域が前記第2色領域の上方にある時、目を閉じる動作が進行中であると判定するステップをさらに含む、請求項1に記載のまばたき検出方法。
  4. まばたき動作が存在するか否かを判定するステップは、前記パターンにおいて第2色領域が前記第1色領域の上方にある時、目を開ける動作が進行中であると判定するステップをさらに含む、請求項1に記載のまばたき検出方法。
  5. まばたき動作が存在するか否かを判定するステップは、
    前記少なくとも1つのDVSフレームのうち各DVSフレームの平均高さの差を計算し、前記平均高さの差は、前記少なくとも1つのDVSフレームの前記眼部領域における第1色ピクセルと第2色ピクセルの平均高さの差であるステップと、
    前記平均高さの差の絶対値が閾値よりも大きい時、前記少なくとも1つのDVSフレームの眼部領域に第1色領域と第2色領域が上下に分布するパターンが存在すると判定するステップと、をさらに含む、請求項1~4のいずれか一項に記載のまばたき検出方法。
  6. 平均高さの差を計算するステップは、
    前記眼部領域における第1色ピクセルの第1平均高さを計算するステップと、
    前記眼部領域における第2色ピクセルの第2平均高さを計算するステップと、
    第1平均高さから第2平均高さを引いて前記平均高さの差を計算するステップと、を含む請求項5に記載のまばたき検出方法。
  7. まばたき動作が存在するか否かを判定するステップの後、まばたき持続時間を計算するステップをさらに含み、まばたき持続時間を計算するステップは、
    前記複数のDVSフレームから第1組隣接DVSフレームを特定し、第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つその絶対値は第1閾値よりも大きいステップと、
    前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つその絶対値は第2閾値よりも大きいステップと、
    前記第1組隣接DVSフレームから第1基準DVSフレームを特定するステップと、
    前記第2組隣接DVSフレームから第2基準DVSフレームを特定するステップと、
    第1基準DVSフレームの撮影時間と第2基准DVSフレームの撮影時間の時間差に基づいてまばたき持続時間を計算するステップと、を含む、請求項5に記載のまばたき検出方法。
  8. 前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち時間的に真中のDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち時間的に真中のDVSフレームである、請求項7に記載のまばたき検出方法。
  9. 前記第1基準DVSフレームは、前記第1組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームであり、前記第2基準DVSフレームは、前記第2組隣接DVSフレームのうち前記平均高さの差の絶対値が最も大きいDVSフレームである、請求項7に記載のまばたき検出方法。
  10. まばたき動作が存在するか否かを判定するステップの後、1回以上の完全なまばたきを特定するステップをさらに含み、1回以上の完全なまばたきを特定するステップは、
    前記複数のDVSフレームから第1組隣接DVSフレームを特定し、前記第1組隣接DVSフレームの各DVSフレームの前記平均高さの差は正であり且つ第1閾値よりも大きいステップと、
    前記複数のDVSフレームの前記第1組隣接DVSフレームの後続のDVSフレームから第2組隣接DVSフレームを特定し、前記第2組隣接DVSフレームの各DVSフレームの平均高さの差は負であり且つ第2閾値よりも大きいステップと、
    特定された第1組隣接DVSフレーム及び特定された第2組隣接DVSフレームに基づき1回以上の完全なまばたきを特定するステップと、を含む、請求項5に記載のまばたき検出方法。
  11. 前記1回以上の完全なまばたきに関連するDVSフレームのうち少なくとも一部のDVSフレームの撮影時間を利用してまばたき頻度を計算するステップをさらに含む、請求項10に記載のまばたき検出方法。
  12. まばたき動作が存在するか否かを判定するステップの前に、前記少なくとも1つのDVSフレームの各DVSフレーム内で前記眼部領域を特定するステップをさらに含む、請求項1~4のいずれか一項に記載のまばたき検出方法。
  13. DVSピクセルストリームを取得するために撮影することに用いられるDVSカメラと、
    前記DVSカメラに接続され、請求項1~12のいずれか一項に記載のまばたき検出方法を実行するように構成されたプロセッサと、を備えるまばたき検出システム。
  14. 車両本体と、
    前記車両本体に取り付けられた請求項13に記載のまばたき検出システムと、を備える車両。
JP2023098278A 2022-06-20 2023-06-15 まばたき検出方法及びシステム Pending JP2024000525A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210697571.X 2022-06-20
CN202210697571.XA CN117315629A (zh) 2022-06-20 2022-06-20 眨眼检测方法和系统

Publications (1)

Publication Number Publication Date
JP2024000525A true JP2024000525A (ja) 2024-01-05

Family

ID=86861792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023098278A Pending JP2024000525A (ja) 2022-06-20 2023-06-15 まばたき検出方法及びシステム

Country Status (5)

Country Link
US (1) US20230410554A1 (ja)
EP (1) EP4296980A1 (ja)
JP (1) JP2024000525A (ja)
KR (1) KR20230174192A (ja)
CN (1) CN117315629A (ja)

Also Published As

Publication number Publication date
US20230410554A1 (en) 2023-12-21
KR20230174192A (ko) 2023-12-27
CN117315629A (zh) 2023-12-29
EP4296980A1 (en) 2023-12-27

Similar Documents

Publication Publication Date Title
US10789464B2 (en) Apparatus and method for robust eye/gaze tracking
JP4307496B2 (ja) 顔部位検出装置及びプログラム
US20200334477A1 (en) State estimation apparatus, state estimation method, and state estimation program
JP5109922B2 (ja) ドライバモニタリング装置およびドライバモニタリング装置用のプログラム
US10572008B2 (en) Apparatus and method for robust eye/gaze tracking
US20180249090A1 (en) Image processing apparatus, solid-state imaging device, and electronic apparatus
KR20140111858A (ko) 이미지 처리 장치 및 방법
JP6601351B2 (ja) 視線計測装置
JP2010198313A (ja) 開眼度特定装置
JP2008171108A (ja) 顔状況判定処理装置および撮像装置
CN110231018B (zh) 一种结构光测距方法、装置及计算机可读存储介质
JP2010114752A (ja) 撮像装置及び撮像方法及びプログラム
JP2013135341A5 (ja)
JP2020145536A (ja) 映像処理装置、映像処理方法および映像処理プログラム
JP5362405B2 (ja) 瞳孔計測装置、瞳孔計測方法ならびに瞳孔計測プログラム
CN112949370A (zh) 眼睛事件检测
JP3116638B2 (ja) 覚醒状態検知装置
US9886630B2 (en) Apparatus and method for robust eye/gaze tracking
JP2005049854A (ja) 対象決定装置及び撮像装置
JP7524713B2 (ja) 情報処理装置および情報処理方法
JP2024000525A (ja) まばたき検出方法及びシステム
JP2010108182A (ja) 車両の運転支援装置
JP2009244944A (ja) 画像回復装置および撮影装置
JP2021144150A (ja) 映像処理装置、映像処理方法および映像処理プログラム
JP2014135683A (ja) 撮像制御装置、撮像制御方法および撮像制御プログラム