JP2022169357A - 電子機器、電子機器の制御方法、及びプログラム - Google Patents

電子機器、電子機器の制御方法、及びプログラム Download PDF

Info

Publication number
JP2022169357A
JP2022169357A JP2021075343A JP2021075343A JP2022169357A JP 2022169357 A JP2022169357 A JP 2022169357A JP 2021075343 A JP2021075343 A JP 2021075343A JP 2021075343 A JP2021075343 A JP 2021075343A JP 2022169357 A JP2022169357 A JP 2022169357A
Authority
JP
Japan
Prior art keywords
subject
information
electronic device
internal state
sight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021075343A
Other languages
English (en)
Inventor
淳吾 宮崎
Jungo Miyazaki
裕亮 西井
Yusuke NISHII
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2021075343A priority Critical patent/JP2022169357A/ja
Priority to PCT/JP2022/017279 priority patent/WO2022230629A1/ja
Priority to CN202280030804.9A priority patent/CN117242486A/zh
Priority to EP22795545.7A priority patent/EP4332885A1/en
Publication of JP2022169357A publication Critical patent/JP2022169357A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/113Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for determining or recording eye movement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/77Determining position or orientation of objects or cameras using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/011Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30268Vehicle interior

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Eye Examination Apparatus (AREA)
  • Image Analysis (AREA)

Abstract

【課題】対象者の集中度のような内部状態を合理的に推定する電子機器、電子機器の制御方法、及びプログラムを提供する。【解決手段】電子機器は、エンコーダ及びデコーダを備える。エンコーダは、対象者の画像から抽出される対象者の視線を含む第1生体情報、対象者の属性情報、及び対象者の内部状態を示す情報に基づいて、未知の値を推定する。デコーダは、未知の値、対象者の属性情報、及び対象者の内部状態を示す情報に基づいて、対象者の視線を含む第2生体情報を推定する。電子機器は、第2生体情報による第1生体情報の再現度に基づいて、エンコーダ及びデコーダのパラメータを調整する。【選択図】図1

Description

本発明は、電子機器、電子機器の制御方法、及びプログラムに関する。
移動体の安全な運転には、運転者の注意力が求められる。それゆえ、運転者の注意力を観察して、注意力が低下する場合、運転者への警告を発したり、運転の支援を行ったりすることが検討されている。注意力の観察として、自車の周辺の対向車などの対象物に対する視線の重なり度合いの累積値である累積視認度を算出し、基準値と比較することが提案されている(特許文献1参照)。
また、近年、対象者の集中度又は感情などの内部状態の推定を試みる研究が行われている。例えば、講義中に、教師の発話、学習者の生体情報、及び学習者の動画を記録し、講義後に学習者が各シーンにおける自身の感情を内観報告することにより、学習者の心的状態を推定する試みが報告されている(非特許文献1参照)。さらに、例えば、X線写真を診る読影士の視線データ及び診断結果のデータを収集して、深層学習によって胸部X線写真を診断する試みも報告されている(非特許文献2参照)。
国際公開第2008/029802号
松居 辰則、宇野 達朗、田和辻 可昌、「心的状態の時間遅れと持続モデルを考慮した生体情報からの学習者の心的状態推定の試み」、2018年度人工知能学会全国大会(第32回)、一般社団法人 人工知能学会 井上 大輝、木村 仁星、中山 浩太郎、作花 健也、Rahman Abdul、中島 愛、Patrick Radkohl、岩井 聡、河添 悦昌、大江 和彦、「視線データを活用した深層学習による胸部X線写真の診断的分類」、2019年度人工知能学会全国大会(第33回)、一般社団法人 人工知能学会
特許文献1においては、累積視認度を算出するために、毎時における視認度を、テーブルを用いて算出している。しかしながら、実環境の多様な運転状況に対して適切なテーブルは異なっており、多様な運転状況において、運転者の注意力を正確に観察することは困難であった。
非特許文献1においては、対象者の生体情報と内部状態(感情など)との因果関係は、単純な識別モデルによっては合理的なモデル化が困難になることが懸念される。すなわち、本来、感情など心的状態が原因となって生体反応が生起されるのが合理的な情報処理の流れと考えられる。しかしながら、単純な識別モデルの学習では、逆に、生体情報から心的状態を推論する流れになっている。このため、モデルの構造が真実とは異なり、モデルの学習がうまく進まないことが想定される。また、対象者の生体情報に基づいて内部状態を推定するモデルのふるまいを使用者に説明することが必要な場面もある。このような観点からも、対象者の生体情報に基づいて内部状態を推定するモデルの因果関係について、合理性の更なる検証が望まれる。非特許文献2においても、非特許文献1と同様に、対象者の生体情報(視線データなど)と内部状態(疾患判断など)との因果関係も同様に、単純な識別モデルによっては合理的なモデル化が困難になることが懸念される。また、非特許文献2においても、対象者の生体情報に基づいて内部状態を推定するモデルの因果関係については、合理性の更なる検証が望まれる。以上のように、対象者の生体情報から対象者の集中度又は感情などの内部状態を良好な精度で推定するためには、データ生成の因果関係に関する合理的なモデル化が望ましい。
本開示の目的は、対象者の集中度のような内部状態をデータ生成過程に基づいて合理的に推定する電子機器、電子機器の制御方法、及びプログラムを提供することにある。
一実施形態に係る電子機器は、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコーダと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコーダと、
を備える。
前記電子機器は、前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコーダ及び前記デコーダのパラメータを調整する。
また、一実施形態に係る電子機器は、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコーダと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコーダと、
前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定する推定部と、
を備える。
一実施形態に係る電子機器の制御方法は、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコードステップと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップと、
を含む。
一実施形態に係る電子機器の制御方法は、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコードステップと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定するステップと、
を含む。
一実施形態に係るプログラムは、
電子機器に、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコードステップと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップと、
を実行させる。
一実施形態に係るプログラムは、
電子機器に、
対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコードステップと、
前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定するステップと、
を実行させる。
一実施形態によれば、対象者の集中度のような内部状態を合理的に推定する電子機器、電子機器の制御方法、及びプログラムを提供することができる。
第1実施形態に係る電子機器の概略構成を示すブロック図である。 第1実施形態に係る電子機器によるエンコードの例を説明する概念図である。 第1実施形態に係る電子機器によるデコードの例を説明する概念図である。 第1実施形態に係る電子機器における自己符号化器の動作を説明する概念図である。 第1実施形態に係る電子機器が学習フェーズにおいて行う動作を説明するローチャートである。 第1実施形態に係る電子機器が推定フェーズにおいて行う動作を説明するローチャートである。 第2実施形態に係る電子機器の概略構成を示すブロック図である。
以下、本開示を適用した電子機器の実施形態について、図面を参照して説明する。以下の説明は、本開示を適用した、電子機器の制御方法、及びプログラムの説明を兼ねてもよい。
本開示において、「電子機器」とは、電力により駆動する機器としてよい。一実施形態に係る電子機器は、対象者の例えば集中度のような内部状態を推定する。ここで、「対象者」とは、一実施形態に係る電子機器によって内部状態が推定される対象となる者(典型的には人間)としてよい。また、本開示において、「ユーザ」とは、一実施形態に係る電子機器を使用する者(典型的には人間)としてよい。「ユーザ」は、「対象者」と同じ者としてもよいし、異なる者としてもよい。また、「ユーザ」及び「対象者」は、人間としてもよいし、人間以外の動物としてもよい。
本開示の一実施形態に係る電子機器は、例えば、移動体に設けられる。移動体は、例えば車両、船舶、及び航空機等を含んでよい。車両は、例えば自動車、産業車両、鉄道車両、生活車両、及び滑走路を走行する固定翼機等を含んでよい。自動車は、例えば乗用車、トラック、バス、二輪車、及びトロリーバス等を含んでよい。産業車両は、例えば農業及び建設向けの産業車両等を含んでよい。産業車両は、例えばフォークリフト及びゴルフカート等を含んでよい。農業向けの産業車両は、例えばトラクター、耕耘機、移植機、バインダー、コンバイン、及び芝刈り機等を含んでよい。建設向けの産業車両は、例えばブルドーザー、スクレーバー、ショベルカー、クレーン車、ダンプカー、及びロードローラ等を含んでよい。車両は、人力で走行するものを含んでよい。車両の分類は、上述した例に限られない。例えば、自動車は、道路を走行可能な産業車両を含んでよい。複数の分類に同じ車両が含まれてよい。船舶は、例えばマリンジェット(personal watercraft(PWC))、ボート、及びタンカー等を含んでよい。航空機は、例えば固定翼機及び回転翼機等を含んでよい。また、本開示の「ユーザ」及び「対象者」は、車両などの移動体を運転している者でもよいし、車両なの移動体を運転していない車両の同乗者でもよい。
一実施形態に係る電子機器1は、各種の機器としてよい。例えば、一実施形態に係る電子機器は、専用に設計された端末の他、汎用のスマートフォン、タブレット、ファブレット、ノートパソコン(ノートPC)、コンピュータ、又はサーバなどのように、任意の機器としてよい。また、一実施形態に係る電子機器は、例えば携帯電話又はスマートフォンのように、他の電子機器と通信を行う機能を有してもよい。ここで、上述の「他の電子機器」とは、例えば携帯電話又はスマートフォンのような電子機器としてもよいし、例えば基地局、サーバ、専用端末、又はコンピュータのように、任意の機器としてもよい。また、本開示における「他の電子機器」も、電力によって駆動される機器又は装置などとしてよい。一実施形態に係る電子機器が、他の電子機器と通信を行う際には、有線及び/又は無線による通信を行うものとしてよい。
以下、一例として、一実施形態に係る電子機器1は、例えば乗用車のような移動体に設けられるものとして説明する。この場合、一実施形態に係る電子機器1は、乗用車のような移動体に搭乗している者(運転者又は非運転者)の所定の内部状態(例えば所定の心理状態)を推定することができる。以下、一実施形態に係る電子機器1が、乗用車のような移動体を運転する運転者の内部状態として、運転者の運転時の集中度を推定する例について説明する。この場合、一実施形態に係る電子機器1は、例えば運転中に撮像された運転者の画像などに基づいて、運転者の運転時の集中度を推定することができる。
図1は、一実施形態に係る電子機器の機能的な概略構成を示すブロック図である。
図1に示すように、一実施形態に係る電子機器1は、制御部10、撮像部20、記憶部30、及び報知部40を含んで構成されてよい。また、制御部10、図1に示すように、抽出部12、推定部14、及び判定部16を含んで構成されてよい。一実施形態に係る電子機器1は、図1に示す全ての機能部を含んでもよいし、図1に示す機能部の少なくとも一部を含まなくてもよい。例えば、一実施形態に係る電子機器1は、図1に示す制御部10のみを備えてもよい。この場合、一実施形態に係る電子機器1は、外部機器として用意される、撮像部20、記憶部30、及び報知部40などに接続されるようにしてもよい。また、以下に説明するエンコーダENN及びデコーダDNNの機能は、制御部10、推定部14、及び記憶部30の少なくともいずれか1つの機能により実現される。入力した情報やデータは、例えば、抽出部12、エンコーダENN、デコーダDNN、判定部16の順に送信されるとしてよい。また、エンコーダENNから、以下に説明する潜在変数Zが出力されてもよい。この場合、出力された潜在変数Zは、デコーダDNNに入力されてもよい。
制御部10は、電子機器1を構成する各機能部をはじめとして、電子機器1の全体を制御及び/又は管理する。制御部10は、種々の機能を実行するための制御及び処理能力を提供するために、例えばCPU(Central Processing Unit)又はDSP(Digital Signal Processor)のような、少なくとも1つのプロセッサを含んでよい。制御部10は、まとめて1つのプロセッサで実現してもよいし、いくつかのプロセッサで実現してもよいし、それぞれ個別のプロセッサで実現してもよい。プロセッサは、単一の集積回路として実現されてよい。集積回路は、IC(Integrated Circuit)ともいう。プロセッサは、複数の通信可能に接続された集積回路及びディスクリート回路として実現されてよい。プロセッサは、他の種々の既知の技術に基づいて実現されてよい。
制御部10は、1以上のプロセッサ及びメモリを含んでもよい。プロセッサは、特定のプログラムを読み込ませて特定の機能を実行する汎用のプロセッサ、及び特定の処理に特化した専用のプロセッサを含んでよい。専用のプロセッサは、特定用途向けIC(ASIC;Application Specific Integrated Circuit)を含んでよい。プロセッサは、プログラマブルロジックデバイス(PLD;Programmable Logic Device)を含んでよい。PLDは、FPGA(Field-Programmable Gate Array)を含んでよい。制御部10は、1つ又は複数のプロセッサが協働するSoC(System-on-a-Chip)、及びSiP(System In a Package)のいずれかであってもよい。制御部10は、電子機器1の各構成要素の動作を制御する。
制御部10は、例えば、ソフトウェア及びハードウェア資源の少なくとも一方を含んで構成されてよい。また、一実施形態に係る電子機器1において、制御部10は、ソフトウェアとハードウェア資源とが協働した具体的手段によって構成されてもよい。制御部10に含まれる抽出部12、推定部14、及び判定部16の少なくともいずれかは、ソフトウェア及びハードウェア資源の少なくとも一方を含んで構成されてよい。また、一実施形態に係る電子機器1において、抽出部12、推定部14、及び判定部16の少なくともいずれかは、ソフトウェアとハードウェア資源とが協働した具体的手段によって構成されてもよい。
抽出部12は、撮像部20によって撮像された対象者の画像から、対象者の視線を抽出する。推定部14は、例えば対象者の集中度のような内部状態を推定する。判定部16は、推定部14によって推定された対象者の内部状態が所定の条件を満たすか否か判定する。判定部16は、対象者の内部状態が所定の条件を満たす場合(例えば対象者の集中度が所定以下に低下した場合など)、所定の警報信号を報知部40に出力する。本開示において、対象者の視線がデータとして抽出される視線のデータは、注視点の座標値(x,y)として扱ってよい。また、本開示において、視線のデータは、対象者の注視点の座標のみならず、例えば瞳孔径及び/又は眼球の回転情報などを視線の特徴量として用いてもよい。
制御部10の動作、並びに、制御部10に含まれる抽出部12、推定部14、及び判定部16の動作については、さらに後述する。
撮像部20は、例えばデジタルカメラのような、電子的に画像を撮像するイメージセンサを含んで構成されてよい。撮像部20は、CCD(Charge Coupled Device Image Sensor)又はCMOS(Complementary Metal Oxide Semiconductor)センサ等のように、光電変換を行う撮像素子を含んで構成されてよい。例えば、撮像部20は、撮像した画像に基づく信号を、制御部10などに供給してよい。このため、図1に示すように、撮像部20は、制御部10に有線及び/又は無線で接続されてよい。撮像部20は、対象者の画像を撮像するものであれば、デジタルカメラのような撮像デバイスに限定されず、任意の撮像デバイスとしてよい。例えば、撮像部20は、近赤外線カメラを採用することで、光を反射する特徴の差異、及び/又は、光を吸収する特徴の差異などを、画像として撮像することができる。
撮像部20は、対象者の画像を撮像する。以下、対象者の例として、乗用車のような移動体を運転する運転者を想定して説明する。すなわち、一実施形態において、撮像部20は、乗用車のような移動体を運転する運転者を撮像する。一実施形態において、撮像部20は、例えば対象者を所定時間ごと(例えば秒間30フレーム)の静止画として撮像してもよい。また、一実施形態において、撮像部20は、例えば対象者を連続した動画として撮像してもよい。撮像部20は、RGBデータ、及び/又は、赤外線データなどの各種のデータ形態で対象者の画像を撮像するものとしてよい。
撮像部20は、運転者を撮像するために、例えば乗用車のような移動体の内部前方において、運転者に向けて設置されてよい。撮像部20によって撮像された対象者の画像は、制御部10に供給される。後述のように、制御部10において、抽出部12は、対象者の画像から、対象者の視線を含む生体情報を抽出する。このため、撮像部20は、運転者の視線を含む画像を撮像するのに適した箇所に設置されてよい。
記憶部30は、各種の情報を記憶するメモリとしての機能を有してよい。記憶部30は、例えば制御部10において実行されるプログラム、及び、制御部10において実行された処理の結果などを記憶してよい。また、記憶部30は、制御部10のワークメモリとして機能してよい。このため、図1に示すように、記憶部30は、制御部10に有線及び/又は無線で接続されてよい。記憶部30は、例えば、RAM(Random Access Memory)及びROM(Read Only Memory)の少なくとも一方を含んでもよい。記憶部30は、例えば半導体メモリ等により構成することができるが、これに限定されず、任意の記憶装置とすることができる。例えば、記憶部30は、一実施形態に係る電子機器1に挿入されたメモリカードのような記憶媒体としてもよい。また、記憶部30は、制御部10として用いられるCPUの内部メモリであってもよいし、制御部10に別体として接続されるものとしてもよい。
記憶部30は、例えば機械学習データを記憶してもよい。ここで、機械学習データは、機械学習によって生成されるデータとしてよい。機械学習データは、機械学習によって生成されるパラメータを含むものとしてよい。また、機械学習とは、特定のタスクをトレーニングによって実行可能になるAI(Artificial Intelligence)の技術に基づくものとしてよい。より具体的には、機械学習とは、コンピュータのような情報処理装置が多くのデータを学習し、分類及び/又は予測などのタスクを遂行するアルゴリズム又はモデルを自動的に構築する技術としてよい。本明細書において、AIの一部には、機械学習が含まれるとしてもよい。本明細書において、機械学習には、正解データをもとに入力データの特徴又はルールを学習する教師あり学習が含まれるものとしてよい。また、機械学習には、正解データがない状態で入力データの特徴又はルールを学習する教師なし学習が含まれるものとしてもよい。さらに、機械学習には、報酬又は罰などを与えて入力データの特徴又はルールを学習する強化学習などが含まれるものとしてもよい。また、本明細書において、機械学習は、教師あり学習、教師なし学習、及び強化学習を任意に組み合わせたものとしてもよい。
本実施形態の機械学習データの概念は、入力データに対して学習されたアルゴリズムを用いて所定の推論(推定)結果を出力するアルゴリズムを含むとしてもよい。本実施形態は、このアルゴリズムとして、例えば、従属変数と独立変数との関係を予測する線形回帰、人の脳神経系ニューロンを数理モデル化したニューラルネットワーク(NN)、誤差を二乗して算出する最小二乗法、問題解決を木構造にする決定木、及びデータを所定の方法で変形する正則化などその他適宜なアルゴリズムを用いることができる。本実施形態は、ニューラルネットワークの一種であるディープニューラルネットワークを利用するとしてよい。ディープニューラルネットワークは、ニューラルネットワークの一種であり、一般にネットワークの中間層が1層以上の深い構造のものを意味する。ディープラーニングは、AIを構成するアルゴリズムとして多用されている。
一実施形態において、記憶部30に記憶される情報は、例えば工場出荷時などまでに予め記憶された情報としてもよいし、制御部10などが適宜取得する情報としてもよい。一実施形態において、記憶部30は、制御部10又は電子機器1などに接続された通信部(通信インタフェース)から受信する情報を記憶してもよい。この場合、通信部は、例えば外部の電子機器又は基地局などと無線又は有線の少なくとも一方で通信することにより、各種の情報を受信してよい。また、一実施形態において、記憶部30は、制御部10又は電子機器1に接続された入力部(入力インタフェース)などに入力された情報を記憶してもよい。この場合、電子機器1のユーザ又はその他の者は、入力部を操作することにより、各種の情報を入力してよい。
報知部40は、制御部10から出力される所定の信号(例えば警報信号など)に基づいて、電子機器1のユーザなどに注意を促すための所定の警報を出力してよい。このため、図1に示すように、報知部40は、制御部10に有線及び/又は無線で接続されてよい。報知部40は、所定の警報として、例えば音、音声、光、文字、映像、及び振動など、ユーザの聴覚、視覚、及び触覚の少なくともいずれかを刺激する任意の機能部としてよい。具体的には、報知部40は、例えばブザー又はスピーカのような音声出力部、LEDのような発光部、LCDのような表示部、及びバイブレータのような触感呈示部などの少なくともいずれかを含んで構成されてよい。このように、報知部40は、制御部10から出力される所定の信号に基づいて、所定の警報を出力してよい。一実施形態において、報知部40は、所定の警報を、人間などの生物の聴覚、視覚、及び触覚の少なくともいずれかに作用する情報として出力してもよい。
一実施形態において、報知部40は、例えば対象者の内部状態として当該対象者の集中度が所定の閾値以下に低下と推定されると、対象者の集中力が低下した旨の警報を出力してよい。例えば、一実施形態において、視覚情報を出力する報知部40は、例えば運転者の集中度が所定の閾値以下に低下と推定されると、その旨を発光又は所定の表示などによって運転者及び/又は他のユーザなどに報知してよい。また、一実施形態において、聴覚情報を出力する報知部40は、例えば運転者の集中度が所定の閾値以下に低下と推定されると、その旨を所定の音又は音声などによって運転者及び/又は他のユーザなどに報知してよい。また、一実施形態において、触覚情報を出力する報知部40は、例えば運転者の集中度が所定の閾値以下に低下と推定されると、その旨を所定の振動などによって運転者及び/又は他のユーザなどに報知してよい。このようにして、運転者及び/又は他のユーザなどは、例えば運転者の集中度が低下している旨を知ることができる。
次に、一実施形態に係る電子機器1による、対象者の内部情報の推定について説明する。
一実施形態に係る電子機器1は、自己符号化器(auto encoder)を用いて、運転者の運転中の画像などに基づく機械学習を行うことにより、運転者の集中度などのような内部状態を推定する。自己符号化器は、ニューラルネットワークのアーキテクチャの1つである。自己符号化器は、エンコーダ(以下、符号ENNを対応させることがある)及びデコーダ(以下、符号DNNを対応させることがある)を含むニューラルネットワークである。一実施形態に係る電子機器1において、制御部10は、自己符号化器としての機能を含んでよい。すなわち、一実施形態に係る電子機器1の制御部10は、エンコーダENN及びデコーダDNNとしての機能を備える。
図2及び図3は、一実施形態に係る電子機器1において自己符号化器として機能するニューラルネットワークを概念的に示す図である。図2は、エンコーダを概念的に示す図である。すなわち、図2は、一実施形態に係る電子機器1において自己符号化器として機能するニューラルネットワークのエンコーダENNを概念的に示す図である。また、図3は、デコーダを概念的に示す図である。まず、一実施形態に係る電子機器1が対象者(運転者)の画像に基づいて、対象者の集中度のような内部状態を推定する原理について説明する。すなわち、図3は、一実施形態に係る電子機器1において自己符号化器として機能するニューラルネットワークのデコーダDNNを概念的に示す図である。
一実施形態に係る電子機器1によって対象者の内部状態を推定するに際し、図3に示すように、対象者の画像に関連する第2生体情報X’は、内部状態を示す情報Yと、未知の値Zと、属性情報Dが原因となって生じる、という生成プロセスを仮定する。ここで、対象者の画像に関連する第2生体情報X’は、対象者(例えば運転者)の視線の画像を含む情報としてよい。また、内部状態を示す情報Yは、対象者の例えば集中度のような内部状態を示す情報を含むものとしてよい。また、未知の値Zは、観測できない潜在変数を含むものとしてよい。さらに、属性情報Dは、対象者の例えば年齢及び/又は性別などの属性を示す情報を含むものとしてよい。
一実施形態に係る電子機器1による機械学習時においては、まず、図2に示すように、ニューラルネットワークのエンコーダENNを用いて、対象者の画像に関連する第1生体情報Xと、内部状態を示す情報Yと、属性情報Dとから、未知の値Zを推論する。ここで、対象者の画像に関連する第1生体情報Xは、対象者(例えば運転者)の視線の画像を含む情報としてよい。この第1生体情報Xに含まれる対象者の視線の画像は、撮像部20によって撮像される対象者の画像から、抽出部12によって抽出されるものとしてよい。また、内部状態を示す情報Yは、上述のように、対象者の例えば集中度のような内部状態を示す情報を含むものとしてよい。また、属性情報Dは、上述のように、対象者の例えば年齢及び/又は性別などの属性を示す情報を含むものとしてよい。さらに、未知の値Zは、上述のように、観測できない潜在変数を含むものとしてよい。以下、対象者の内部状態を推定するための学習を行うフェーズを、単に「学習フェーズ」と記すことがある。
上述のように未知の値Zが推論されると、図3に示すニューラルネットワークのデコーダDNNを用いて、推論された未知の値Zと、内部状態を示す情報Yと、属性情報Dとから、対象者の画像に関連する第2生体情報X’を生成することができる。ここで、対象者の画像に関連する第2生体情報X’は、対象者の画像に関連する第1生体情報Xを再構成したものとなる。一実施形態に係る電子機器1において、この第2生体情報X’が、元の第1生体情報Xから変化した度合いを損失関数とし、誤差逆伝搬によってニューラルネットワークの重みパラメータを更新してよい。また、この損失関数に、未知の値Zの従う確率分布が所定の確率分布からどの程度逸脱したかを表す正則化項を含んでもよい。この所定の確率分布は、例えば正規分布であってもよい。この所定の確率分布と未知の値Zが従う分布との逸脱度合いを表す項として、カルバック・ライブラダイバージェンスを用いてもよい。
図4は、一実施形態に係る電子機器1における自己符号化器による実装を概念的に示す図である。まず、一実施形態に係る電子機器1による学習フェーズについて説明する。
図4に示すように、一実施形態に係る電子機器1において、最下段に示す第1生体情報Xが与えられ、さらに内部状態を示す情報Y及び属性情報Dが与えられると、図4の中段に示す未知の値Zが推論される。そして、一実施形態に係る電子機器1において、未知の値Zが推論され、さらに内部状態を示す情報Y及び属性情報Dが与えられると、最上段に示す第2生体情報X’が得られる。
一実施形態に係る電子機器1において、第1生体情報X及び属性情報Dのみが与えられることにより、内部状態を示す情報Y及び未知の値Zが推定されるようにしてもよい。また、対象者の例えば年齢及び/又は性別などの属性を示す情報を含む属性情報Dは、予め記憶部30に記憶されてもよいし、入力部から入力されてもよいし、通信部から受信してもよい。また、属性情報Dは、撮像部20によって撮像される対象者の画像から、制御部10などによって推定されるものとしてもよい。
図4に示すように、一実施形態に係る電子機器1において、自己符号化器は、対象者の画像に関連する第1生体情報X、内部状態を示す情報Y、及び属性情報Dから、未知の値Zを介して、対象者の画像に関連する第2生体情報X’を再現する。すなわち、一実施形態に係る電子機器1において、自己符号化器は、対象者の視線の画像及び視線の特徴量(第1生体情報X)の少なくとも一方に基づいて、対象者の視線の画像及び視線の特徴量(第2生体情報X’)の少なくとも一方を再構成する機能を備える。本開示において、対象者の視線の画像及び視線の特徴量の少なくとも一方には、注視点の座標値(x,y)を含むとしてよい。また、本開示において、対象者の視線の画像及び視線の特徴量には、注視点の座標だけでなく、例えば瞳孔径若しくは眼球の回転情報、又はこれらの組み合わせなどの視線の特徴量が含まれるとしてもよい。本開示において、対象者の視線の画像及び視線の特徴量の少なくとも一方を抽出することを、単に「視線を抽出する」又は「視線を取得する」等と表記することがある。本開示において、対象者の視線の画像及び視線の特徴量の少なくとも一方を推定することを、単に「視線を推定する」又は「視線を算出する」等と表記することもある。また、本開示において、対象者の視線の画像及び視線の特徴量の少なくとも一方は、眼球領域を含む画像を含むとしてもよい。また、以下の説明において、ニューラルネットワークに入力される情報は、画像を処理した後に得られる生体情報であるため、上記眼球領域を含む画像を有する視線情報と定義してもよい。
一実施形態に係る電子機器1において、内部状態を示す情報Yを推定するために、例えば集中度とする内部状態の種々の場合について、対象者の視線の画像又は視線の特徴量(第2生体情報X’)を再構成してよい。例えば、対象者が移動体の運転のみに完全に集中している状態を意図的に作り出し、その時の内部状態を示す情報Yに対応する対象者の視線の画像又は視線の特徴量(第2生体情報X’)を、一実施形態に係る電子機器1の自己符号化器によって再構成してよい。また、例えば、対象者が移動体の運転に完全には集中していない状態を意図的に作り出し、その時の内部状態を示す情報Yに対応する対象者の視線の画像又は視線の特徴量(第2生体情報X’)を、一実施形態に係る電子機器1の自己符号化器によって再構成してよい。ここで、対象者が移動体の運転に完全には集中していない状態とは、運転者が運転以外のタスクに注意を奪われている状態であるとしてよい。例えば、運転者が移動体の運転中に、運転以外のタスクとして所定の暗算などを同時に行う状態としてもよい。そして、所定の暗算のレベル(比較的簡単な暗算又は比較的複雑な暗算など)に応じて、対象者が移動体の運転に完全には集中していない状態の度合いを段階的に調節してもよい。例えば、運転者が移動体の運転中に非常に簡単な暗算を同時に行う状態は、対象者が移動体の運転に完全には集中していないが比較的集中している状態としてもよい。また、運転者が移動体の運転中に相当複雑な暗算を同時に行う状態は、対象者が移動体の運転に比較的集中していない状態としてもよい。
上述のようにして、一実施形態に係る電子機器1において、内部状態を示す情報Yの種々の場合について、対象者の視線の画像又は視線の特徴量(第2生体情報X’)を再構成してよい。内部状態を示す情報Yは、例えば集中している状態においてY=0とし、例えば集中していない状態においてY=1などとしてよい。そして、種々の内部状態を示す情報Yに基づいて再構成される対象者の視線の画像(第2生体情報X’)が、元の対象者の視線の画像(第1生体情報X)を再現した度合いに応じて、内部状態を示す情報Yの妥当性を判断してよい。例えば、ある内部状態を示す情報Y1に基づいて再構成された対象者の視線の画像(第2生体情報X’)が、元の対象者の視線の画像又は視線の特徴量(第1生体情報X)を再現する度合いが高い場合、内部状態を示す情報Y1の妥当性は高い(すなわち正解に近い)と判断してよい。一方、ある内部状態を示す情報Y2に基づいて再構成された対象者の視線の画像又は視線の特徴量(第2生体情報X’)が、元の対象者の視線の画像又は視線の特徴量(第1生体情報X)を再現する度合いが低い場合、内部状態を示す情報Y2の妥当性は低い(すなわち正解から遠い)と判断してよい。このようにして、一実施形態に係る電子機器1は、第2生体情報X’による第1生体情報Xの再現度に基づいて、エンコーダENN及びデコーダDNNのパラメータを調整してよい。また、この再現度に加えて、エンコーダENNによって推定された未知の値Zの従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度も含めた損失関数に基づいて、エンコーダENN及びデコーダDNNのパラメータを調整してよい。この場合、所定の確率分布は、正規分布であってもよい。また、前述の場合、分布逸脱度はカルバック・ライブラダイバージェンスであってもよい。
図5は、一実施形態に係る電子機器1による学習フェーズを説明するフローチャートである。以下、図5を参照して、一実施形態に係る電子機器1による学習フェーズを説明する。
図5に示す学習フェーズの動作が開始するに際し、対象者(運転者)は移動体を運転しているものとする。ここで、対象者は、乗用車のような移動体を現実に運転していてもよいし、例えばドライブシミュレータを用いて仮想的に移動体を運転していてもよい。また、図5に示す動作が開始するに際し、撮像部20は対象者の画像を撮像しているものとする。ここで、撮像部20は、対象者の画像から対象者の視線の画像及び視線の特徴量の少なくとも一方が抽出できるように、対象者の視線を含む画像を撮像するものとしてよい。
また、図5に示す動作が開始するに際し、記憶部30は、対象者の所定の属性情報を記憶しているものとする。ここで、対象者の所定の属性情報とは、例えば、対象者の性別、年齢、及び年齢の区分(20代、30代、40代など)の少なくともいずれかを含むものとしてよいが、運転者の運転歴など他の属性情報であってもよい。記憶部30は、上述のような対象者の所定の属性情報を予め記憶していてもよいし、必要に応じて対象者などに入力部などから入力を求めてもよいし、必要に応じて通信部などから受信してもよい。
図5に示す動作が開始すると、一実施形態に係る電子機器1の制御部10は、撮像部20によって撮像された対象者の画像を取得する(ステップS11)。ステップS11において取得される対象者の画像とは、上述のように、対象者の視線の画像及び視線の特徴量の少なくとも一方が抽出できるように、対象者の視線を含む画像としてよい。
ステップS11において対象者の画像を取得したら、制御部10の抽出部12は、対象者の画像から対象者の注視点の位置の座標など、視線の画像及び視線の特徴量の少なくとも一方を抽出する(ステップS12)。ステップS12において、対象者の画像から対象者の視線を抽出する技術は、例えば画像認識などの任意の技術を採用してよい。このようにして、一実施形態に係る電子機器1の制御部10は、ステップS12において、対象者の画像から抽出される対象者の視線を含む第1生体情報Xを取得する。
ステップS12において対象者の視線が抽出されたら、制御部10は、対象者の所定の属性情報を取得する(ステップS13)。ステップS13において、制御部10は、対象者の所定の属性情報を例えば記憶部30から取得してよい。また、上述のように、対象者の所定の属性情報とは、例えば、対象者の性別、年齢、年齢の区分(20代、30代、40代など)、及び運転歴の少なくともいずれかを含むものとしてよい。このようにして、一実施形態に係る電子機器1の制御部10は、ステップS13において、対象者の属性情報Dを取得する。本開示における運転歴は、運転期間、事故履歴、免許取得時期、免許保持期間、運転講習受講履歴、及び運転可能な車種情報などのうちの少なくとも1つを含むとしてよい。
ステップS13において対象者の属性情報を取得したら、制御部10の推定部14は、未知の値を推定する(ステップS14)。ステップS14において、推定部14は、自己符号化器のエンコーダENNによって、対象者の視線を含む第1生体情報X、対象者の属性情報D、及び対象者の内部状態を示す情報Yに基づいて、未知の値Zを推定してよい(図2参照)。ここで、対象者の内部状態を示す情報Yは、上述のように、外的に作り出した対象者の集中度に対応する値としてよい。
ステップS14において未知の値が推定されたら、制御部10の推定部14は、対象者の視線を含む第2生体情報を推定する(ステップS15)。ステップS14において、推定部14は、自己符号化器のデコーダDNNによって、対象者の内部状態を示す情報Y、未知の値Z、及び対象者の属性情報Dに基づいて、対象者の視線を含む第2生体情報X’を推定してよい(図3参照)。
ステップS15において第2生体情報X’が推定されたら、制御部10は、エンコーダENN及びデコーダDNNのパラメータを調整する(ステップS16)。ステップS16において、制御部10は、対象者の視線を含む第2生体情報X’によって、対象者の視線を含む第1生体情報Xが再現される度合いに基づいて、エンコーダENN及びデコーダDNNのパラメータを調整してよい。また、前述のように、この再現の度合いに加えて、エンコーダENNによって推論された未知の値Zの従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度も含めた損失関数に基づいて、エンコーダENN及びデコーダDNNのパラメータを調整してよい。以上のような学習フェーズにおける動作によって、一実施形態に係る電子機器1は学習を行うことができる。
このように、一実施形態に係る電子機器1において、制御部10のエンコーダENNは、対象者の画像から抽出される対象者の視線を含む第1生体情報X、対象者の属性情報D、及び対象者の内部状態を示す情報Yに基づいて、未知の値Zを推定する。また、一実施形態に係る電子機器1において、制御部10のデコーダDNNは、未知の値Z、対象者の属性情報D、及び対象者の内部状態を示す情報Yに基づいて、対象者の視線を含む第2生体情報X’を推定する。そして、一実施形態に係る電子機器1は、第2生体情報X’による第1生体情報Xの再現度、及び当該再現度と未知の値Zの分布逸脱度のうちの少なくとも一方に基づいて、エンコーダENN及びデコーダDNNのパラメータを調整する。
一実施形態において、対象者の内部状態を示す情報Yは、対象者の集中度を示す情報を含んでもよい。特に、一実施形態において、対象者の内部状態を示す情報Yは、対象者が乗り物を運転している最中の集中度を示す情報を含んでもよい。
また、一実施形態において、対象者の属性情報Dは、対象者の性別を含んでもよい。また、一実施形態において、対象者の属性情報Dは、対象者の年齢又は年齢の区分を含んでもよい。また、一実施形態において、対象者の属性情報Dは、対象者の運転歴などを含んでもよい。
一方、一実施形態において、対象者の性別、対象者の年齢、対象者の年齢の区分、及び対象者の運転歴の少なくともいずれかのような対象者の属性は、対象者の画像から推定されてもよい。例えば、一実施形態に係る電子機器1において、制御部10(又は推定部14)は、撮像部20によって撮像された対象者の画像から、対象者の性別、対象者の年齢、対象者の年齢の区分、及び対象者の運転歴の少なくともいずれかのような対象者の属性を推定してもよい。ここで、対象者の属性は、対象者の画像から画像認識などの任意の技術によって推定されてよい。また、対象者の属性は、機械学習などによって、対象者の画像から推定される精度を向上させてもよい。すなわち、一実施形態において、対象者の属性情報Dは、対象者の画像に基づいて推定されてもよい。また、この画像から属性情報を推定する部分のみを事前に機械学習してもよい。その際、内部状態の推定に使用する学習データとは別のデータをつかって学習を行ってもよい。
上述のようにして、一実施形態に係る電子機器1は、学習フェーズを実行することにより、対象者の内部状態を推定することができる。以下、対象者の内部状態を推定するフェーズを、単に「推定フェーズ」と記すことがある。
図6は、一実施形態に係る電子機器1による推定フェーズを説明するフローチャートである。以下、図6を参照して、一実施形態に係る電子機器1による推定フェーズを説明する。
図6に示す推定フェーズの動作が開始するに際し、対象者(運転者)は移動体を運転しているものとする。ここで、対象者は、乗用車のような移動体を現実に運転しているものとする。また、検証実験のようなテストにおいては、対象者は、例えばドライブシミュレータを用いて仮想的に移動体を運転していてもよい。また、図6に示す動作が開始するに際し、撮像部20は対象者の画像を撮像しているものとする。ここで、撮像部20は、対象者の画像から対象者の視線が抽出できるように、対象者の視線を含む画像を撮像するものとしてよい。
また、図6に示す動作が開始するに際し、記憶部30は、対象者の所定の属性情報を記憶しているものとする。ここで、対象者の所定の属性情報とは、例えば、対象者の性別、年齢、年齢の区分(20代、30代、40代など)、及び運転歴の少なくともいずれかを含むものとしてよい。記憶部30は、上述のような対象者の所定の属性情報を予め記憶していてもよいし、必要に応じて対象者などに入力部などから入力を求めてもよいし、必要に応じて通信部などから受信してもよい。
図6に示す動作が開始すると、一実施形態に係る電子機器1の制御部10は、撮像部20によって撮像された対象者の画像を取得する(ステップS21)。ステップS21において取得される対象者の画像とは、上述のように、対象者の視線が抽出できるように、対象者の視線を含む画像としてよい。ステップS21の動作は、図5に示したステップS11の動作と同様に行ってよい。
ステップS21において対象者の画像を取得したら、制御部10の抽出部12は、対象者の画像から対象者の視線及び視線の特徴量のうちの少なくとも一方を抽出する(ステップS22)。ステップS22の動作は、図5に示したステップS12の動作と同様に行ってよい。このようにして、一実施形態に係る電子機器1の制御部10は、ステップS22において、対象者の画像から抽出される対象者の視線を含む第1生体情報Xを取得する。
ステップS22において対象者の視線が抽出されたら、制御部10の推定部14は、対象者の内部状態を示す情報Yを推定する(ステップS23)。ステップS23において推定される対象者の内部状態を示す情報Yは、例えば対象者の集中度を示す情報としてよい。特に、一実施形態において、対象者の内部状態を示す情報Yは、例えば対象者が乗用車のような乗り物(移動体)を運転している最中の集中度を示す情報を含んでよい。
ステップS23において、一実施形態に係る電子機器1は、例えば以下のようにして、対象者の内部状態を示す情報Yを推定してよい。すなわち、例えば、一実施形態に係る電子機器1の制御部10は、例えば集中している状態における内部状態を示す情報Yを0とし、例えば集中していない状態における内部状態を示す情報Yを1とするなどとして、複数の内部状態を示す情報Yを仮定する。同様に、一実施形態において、制御部10は、例えば内部状態を示す情報Yを0から1の間で複数仮定してもよい。
そして、制御部10は、このように仮定した複数の内部状態を示す情報Yのそれぞれについて、再構成された対象者の視線及び視線の特徴量のうちの少なくとも一方(第2生体情報X’)が、元の対象者の視線の画像(第1生体情報X)を再現する度合いを検証する。そして、推定部14は、再構成された対象者の視線及び視線の特徴量のうちの少なくとも一方(第2生体情報X’)が、元の対象者の視線及び視線の特徴量のうちの少なくとも一方(第1生体情報X)を再現する度合い(再現度)を最も高くする内部状態を示す情報Yを、その時の対象者の内部状態(集中度)と推定する。例えば、対象者の内部状態を示す情報Yが0の時に、上述の再現度が最も高くなる場合、推定部14は、対象者が集中している状態と推定してよい。一方、例えば、対象者の内部状態を示す情報Yが1の時に、上述の再現度が最も高くなる場合、推定部14は、対象者が集中していない状態と推定してよい。また、例えば、対象者の内部状態を示す情報Yが0から1の間の値の時に、上述の再現度が最も高くなる場合、推定部14は、対象者が当該値に対応する集中度である状態と推定してよい。また、推定部14は、エンコーダENNが推定した未知の値Zの従う確率分布が所定の確率分布からどれくらい逸脱しているかを表す分布逸脱度を用いて対象者の内部状態を推定してもよい。当該所定の確率分布は正規分布であってもよい。当該分野逸脱度はカルバック・ライブラダイバージェンスを用いてもよい。
ステップS23において対象者の内部状態を示す情報Yが推定されたら、判定部16は、推定された集中度が所定の閾値以下であるか否かを判定する(ステップS24)。ステップS24の処理を行うに際し、対象者の集中度について警報を出す基準となる所定の閾値を予め設定しておいてよい。このようにして設定された所定の閾値は、例えば記憶部30に記憶してもよい。ステップS24において、判定部16は、推定された集中度が所定の閾値以下であるか否かのように、推定された集中度が所定の条件を満たすか否かを判定してよい。
ステップS24において集中度が所定の閾値以下である(集中度が低下した)場合、判定部16は、所定の警報を報知部40から出力して(ステップS25)、図6に示す動作を終了してよい。一方、ステップS24において集中度が所定の閾値以下でない(集中度が低下していない)場合、判定部16は、図6に示す動作を終了してよい。図6に示す動作が終了すると、制御部10は、適宜、図6に示す処理を再び開始してもよい。
このように、一実施形態に係る電子機器1において、制御部10のエンコーダENNは、対象者の画像から抽出される対象者の視線を含む第1生体情報X、対象者の属性情報D、及び対象者の内部状態を示す情報Yとして仮定される値に基づいて、未知の値Zを推定する。また、一実施形態に係る電子機器1において、制御部10のデコーダDNNは、未知の値Z、対象者の属性情報D、及び対象者の内部状態を示す情報Yとして仮定される値に基づいて、対象者の視線を含む第2生体情報X’を推定する。そして、一実施形態に係る電子機器1は、対象者の内部状態を示す情報Yとして複数の値を仮定して、その複数の値のうち第2生体情報X’による第1生体情報Xの再現度が最も高くなる値を、対象者の内部状態を示す情報Yと推定する。また、一実施形態に係る電子機器1において、当該再現度に加えて、エンコーダENNが推定した未知の値Zの従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度も考慮して、対象者の内部状態を示す情報Yと推定するとしてもよい。当該所定の確率分布は正規分布であってもよい。当該分野逸脱度はカルバック・ライブラダイバージェンスを用いてもよい。
一実施形態に係る電子機器1は、対象者の内部状態を示す情報Yとして仮定される複数の値のうち第2生体情報X’による第1生体情報Xの再現度が最も高くなる値が所定の条件を満たす場合、所定の警報を出力してもよい。また、当該再現度に加えて、エンコーダENNが推定した未知の値Zの従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度も考慮して所定の警報を出力するかを決定してもよい。当該所定の確率分布は正規分布であってもよい。当該分野逸脱度はカルバック・ライブラダイバージェンスを用いてもよい。
以上のように、一実施形態に係る電子機器1は、対象者の内部状態を原因として、対象者の視線を含む生体情報が生成されるというモデルに基づいて、対象者の内部状態を推定することができる。したがって、一実施形態に係る電子機器1は、自然な因果関係によって、対象者の集中度のような内部状態を合理的に推定することができる。また、一実施形態に係る電子機器1は、例えば移動体を運転中の対象者の集中度が低下したら、所定の警報を出力することができる。したがって、一実施形態に係る電子機器1によれば、例えば移動体を運転中の対象者の安全性を高めることができる。
一般的に、人間の視線及び/又は注意行動などは、本来個体差が大きいものである。例えば、高齢者は若年者より視線の可動域が狭いなどの例を挙げることができる。したがって、対象者の内部状態を推定する際には、例えば上述のような個体差を適切に考慮しないと、良好な精度の結果が得られないことが懸念される。また、対象者の内部状態を推定する際には、推定結果がどのようなモデルに基づくものなのか、ユーザに客観的に説明可能であることが望ましい。
例えば、対象者を撮像した画像から、対象者の集中度のような内部状態を推定する場合、従来の機械学習のように、両者の因果関係とは逆に、すなわち対象者の視線などの生体反応データから内部状態を推定するように学習を行うことも想定される。しかしながら、このような場合、因果関係が逆のモデル構造であるがゆえにそのモデル内部のデータ構造がブラックボックス化されてしまうため、要因を特定できずに誤った構造を学習してしまうおそれがある。また、因果関係がブラックボックス化されるため、因果関係のモデルをユーザに客観的に説明することは困難になる。
一実施形態に係る電子機器1において対象者の内部状態を推定するアルゴリズムは、一般の認識モデル又は回帰モデルとは異なる生成モデルに基づくものである。電子機器1における生成モデルは、対象者の内部状態及び対象者の属性(年齢・性別など)を原因として、対象者の視線が生成されるという過程を、データから学習する。このため、一実施形態に係る電子機器1によれば、対象者の個体の属性を考慮して推定精度を向上させることが期待できる。また、一実施形態に係る電子機器1によれば、データ生成過程を踏まえたメカニズムをユーザに客観的に説明することができる。一実施形態によれば、対象者の集中度のような内部状態を、データ生成過程に基づいて合理的に推定することができる。
以下、他の実施形態について説明する。
図7は、他の実施形態に係る電子機器の機能的な概略構成を示すブロック図である。
図7に示すように、他の実施形態に係る電子機器2は、図1に示した電子機器1と異なり、第1撮像部21及び第2撮像部22を備えている。
図7に示す第1撮像部21は、図1に示した撮像部20と同様に機能するものとしてよい。すなわち、図7に示す第1撮像部21は、対象者の画像を撮像するものとしてよい。このため、図7に示す第1撮像部21は、図1に示した撮像部20と同様に、例えば乗用車のような移動体の内部前方において、運転者に向けて設置されてよい。
一方、図7に示す第2撮像部22は、対象者が見得る風景の画像を撮像するものとしてよい。すなわち、第2撮像部22は、対象者の視線の先の風景を含む画像(例えば周辺画像)を撮像するものとしてよい。このため、図7に示す第2撮像部22は、第1撮像部21とは異なり、例えば乗用車のような移動体の前方を向くように、すなわち運転者の視線と同じ方向に向くように設置されてよい。
図7に示すように、第2撮像部22によって撮像された画像のデータは、制御部10の視線予測部18に供給される。視線予測部18は、対象者が見得る風景の画像において、対象者の視線を予測する。一実施形態において、視線予測部18は、対象者の視線の先の風景を含む画像(例えば周辺画像)から、対象者の視線が向けられると予測されるマップ(視線予測マップ)を推定するものとしてよい。対象者が見得る風景の画像に基づいて視線予測マップを生成する技術は、既存の任意の技術を採用してよい。
図7に示すように、視線予測部18によって推定された視線予測マップのデータは、推定部14に供給されてよい。推定部14は、対象者の内部状態を推定するに際し、学習フェーズ及び/又は推定フェーズにおいて、上述の動作に視線予測マップのデータを加味してよい。具体的には、例えば、上述した対使用者の属性情報Dの一部として、視線予測マップのデータを含ませてもよい。
このように、一実施形態に係る電子機器2において、対象者の属性情報Dは、対象者の視線を予測する情報を含んでもよい。また、この場合、対象者の視線を予測する情報は、対象者の前方の風景画像から予測される情報としてもよい。
図7に示す電子機器2は、図1に示した電子機器1において、さらに対象者の視線予測マップのデータにも基づいて対象者の内部状態を推定することができる。したがって、図7に示す電子機器2は、環境によっては図1に示した電子機器1よりも高い推定精度が期待できる。
図7においては、第2撮像部22は、第1撮像部21とは別の部材として示した。しかしながら、例えば、360°撮像可能なドライブレコーダのように1つの撮像部によって撮像された画像から、第1撮像部21及び第2撮像部22がそれぞれ使用する画像のデータを抽出してもよい。
次に、上述した実施形態の変形例について説明する。
上述した実施形態において、対象者の内部状態を示す情報Yは、(乗用車のような移動体を運転している)対象者の集中度を示す情報を含むものとして説明した。一実施形態に係る電子機器において、推定部14は、対象者の内部状態を示す情報Yとして、対象者の感情又は気分を示す情報を含んで推定してもよい。ここで、対象者の感情又は気分を示す情報とは、例えば、対象者のストレスの度合いを示す情報、対象者の苛つき又は怒りの感情を示す情報、対象者の疲れ、不安又は心配事を抱えた感情を示す情報など、種々の情報としてよい。
対象者の内部状態を示す情報Yとして、対象者の感情又は気分を示す情報を含んで推定することにより、一実施形態に係る電子機器は、例えば対象者の集中度が低下した場合に、対象者の感情又は気分に応じた警報を出力することができる。例えば、一実施形態に係る電子機器の推定部14は、図6のステップS23において、対象者の内部状態を推定する際に、対象者の感情又は気分を示す情報も含んで推定してよい。そして、一実施形態に係る電子機器の制御部10は、図6のステップS25において、対象者の感情又は気分に応じて、所定の警報を出力してよい。具体的には、対象者の集中度が低下した際に、対象者の苛つき又は怒りの感情が示される場合、一実施形態に係る電子機器の制御部10は、例えば対象者をなだめるような口調及び/又は言葉遣いの警報を出力してもよい。
このように、一実施形態に係る電子機器において、対象者の内部状態を示す情報Yは、対象者の感情又は気分を示す情報を含んでもよい。また、一実施形態に係る電子機器は、例えば対象者の集中度が所定以下に低下した場合、所定の警報として、対象者の感情又は気分に応じた警報を出力してもよい。
上述した実施形態の変形例に係る電子機器1は、対象者の感情又は気分に応じた警報を出力することができる。したがって、上述した実施形態の変形例に係る電子機器1は、例えば移動体を運転中の対象者の安全性を一層高めることが期待できる。
本開示の内容は、当業者であれば本開示に基づき種々の変形及び修正を行うことができる。したがって、これらの変形及び修正は本開示の範囲に含まれる。例えば、各実施形態において、各機能部、各手段、各ステップなどは論理的に矛盾しないように他の実施形態に追加し、若しくは、他の実施形態の各機能部、各手段、各ステップなどと置き換えることが可能である。また、各実施形態において、複数の各機能部、各手段、各ステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。また、上述した本開示の各実施形態は、それぞれ説明した各実施形態に忠実に実施することに限定されるものではなく、適宜、各特徴を組み合わせたり、一部を省略したりして実施することもできる。
1,2 電子機器
10 制御部
12 抽出部
14 推定部
16 判定部
18 視線予測部
20 撮像部
21 第1撮像部
22 第2撮像部
30 記憶部
40 報知部
ENN エンコーダ
DNN デコーダ

Claims (22)

  1. 対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコーダと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコーダと、
    を備え、
    前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコーダ及び前記デコーダのパラメータを調整する、電子機器。
  2. 対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコーダと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコーダと、
    前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定する推定部と、を備える電子機器。
  3. 前記複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値が所定の条件を満たす場合、所定の警報を出力する、請求項2に記載の電子機器。
  4. 前記対象者の内部状態を示す情報は、前記対象者の集中度を示す情報を含む、請求項1から3のいずれかに記載の電子機器。
  5. 前記対象者の内部状態を示す情報は、前記対象者が乗り物を運転している最中の集中度を示す情報を含む、請求項4に記載の電子機器。
  6. 前記エンコーダ及び前記デコーダのパラメータの調整は、
    前記再現度に加えて、前記エンコーダが推定した前記未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて行われる、請求項1に記載の電子機器。
  7. 前記推定部は、
    前記エンコーダが推定した前記未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて推定を行う、請求項2に記載の電子機器。
  8. 前記対象者の内部状態を示す情報は、前記対象者の感情又は気分を示す情報を含む、請求項1から7のいずれかに記載の電子機器。
  9. 前記所定の警報として、前記対象者の感情又は気分に応じた警報を出力する、請求項3を引用する請求項8に記載の電子機器。
  10. 前記対象者の属性情報は、前記対象者の性別を含む、請求項1から9のいずれかに記載の電子機器。
  11. 前記対象者の属性情報は、前記対象者の年齢又は年齢の区分を含む、請求項1から10のいずれかに記載の電子機器。
  12. 前記対象者の属性情報は、前記対象者の画像に基づいて推定される、請求項1から11のいずれかに記載の電子機器。
  13. 前記対象者の属性情報は、前記対象者の視線を予測する情報を含む、請求項1から12のいずれかに記載の電子機器。
  14. 前記対象者の視線を予測する情報は、前記対象者の前方の風景画像から予測される情報である、請求項13に記載の電子機器。
  15. 対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコードステップと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
    前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップと、
    を含む、電子機器の制御方法。
  16. 対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコードステップと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
    前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定するステップと、
    を含む、電子機器の制御方法。
  17. 前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップは、
    前記エンコーダが推定した前記未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて行われる、請求項15に記載の電子機器の制御方法。
  18. 前記対象者の内部状態を示す情報を推定するステップは、
    前記エンコードステップにて推定した前記未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて行われる、請求項16に記載の電子機器の制御方法。
  19. 電子機器に、
    対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、未知の値を推定するエンコードステップと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
    前記第2生体情報による前記第1生体情報の再現度に基づいて、前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップと、
    を実行させる、プログラム。
  20. 電子機器に、
    対象者の画像から抽出される前記対象者の視線を含む第1生体情報、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、未知の値を推定するエンコードステップと、
    前記未知の値、前記対象者の属性情報、及び前記対象者の内部状態を示す情報として仮定される値に基づいて、前記対象者の視線を含む第2生体情報を推定するデコードステップと、
    前記対象者の内部状態を示す情報として複数の値を仮定して、当該複数の値のうち前記第2生体情報による前記第1生体情報の再現度が最も高くなる値を、前記対象者の内部状態を示す情報と推定するステップと、
    を実行させる、プログラム。
  21. 前記エンコードステップ及び前記デコードステップにおけるパラメータを調整するステップは、
    前記エンコーダが推定した未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて行われる、請求項19に記載したプログラム。
  22. 前記対象者の内部状態を示す情報を推定するステップは、
    前記エンコードステップにて推定した前記未知の値の従う確率分布が所定の確率分布からどのくらい逸脱しているかを表す分布逸脱度に基づいて行われる、請求項20に記載のプログラム。
JP2021075343A 2021-04-27 2021-04-27 電子機器、電子機器の制御方法、及びプログラム Pending JP2022169357A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021075343A JP2022169357A (ja) 2021-04-27 2021-04-27 電子機器、電子機器の制御方法、及びプログラム
PCT/JP2022/017279 WO2022230629A1 (ja) 2021-04-27 2022-04-07 電子機器、電子機器の制御方法、及びプログラム
CN202280030804.9A CN117242486A (zh) 2021-04-27 2022-04-07 电子设备、电子设备的控制方法以及程序
EP22795545.7A EP4332885A1 (en) 2021-04-27 2022-04-07 Electronic device, control method for electronic device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021075343A JP2022169357A (ja) 2021-04-27 2021-04-27 電子機器、電子機器の制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2022169357A true JP2022169357A (ja) 2022-11-09

Family

ID=83848092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021075343A Pending JP2022169357A (ja) 2021-04-27 2021-04-27 電子機器、電子機器の制御方法、及びプログラム

Country Status (4)

Country Link
EP (1) EP4332885A1 (ja)
JP (1) JP2022169357A (ja)
CN (1) CN117242486A (ja)
WO (1) WO2022230629A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101512617B (zh) 2006-09-04 2012-02-01 松下电器产业株式会社 行驶信息提供装置
WO2016132468A1 (ja) * 2015-02-18 2016-08-25 株式会社日立製作所 データ評価方法および装置、故障診断方法および装置
CN113532464A (zh) * 2015-10-08 2021-10-22 松下电器(美国)知识产权公司 控制方法、个人认证装置和记录介质
JP7020156B2 (ja) * 2018-02-06 2022-02-16 オムロン株式会社 評価装置、動作制御装置、評価方法、及び評価プログラム

Also Published As

Publication number Publication date
WO2022230629A1 (ja) 2022-11-03
CN117242486A (zh) 2023-12-15
EP4332885A1 (en) 2024-03-06

Similar Documents

Publication Publication Date Title
US11067405B2 (en) Cognitive state vehicle navigation based on image processing
JP7020156B2 (ja) 評価装置、動作制御装置、評価方法、及び評価プログラム
US10627817B2 (en) Vehicle manipulation using occupant image analysis
US10922567B2 (en) Cognitive state based vehicle manipulation using near-infrared image processing
US11769056B2 (en) Synthetic data for neural network training using vectors
US11017250B2 (en) Vehicle manipulation using convolutional image processing
US10867197B2 (en) Drowsiness mental state analysis using blink rate
US20190370580A1 (en) Driver monitoring apparatus, driver monitoring method, learning apparatus, and learning method
US11292477B2 (en) Vehicle manipulation using cognitive state engineering
CN112673378B (zh) 推断器生成装置、监视装置、推断器生成方法以及推断器生成程序
US20210339759A1 (en) Cognitive state vehicle navigation based on image processing and modes
JP7303901B2 (ja) 複数の候補からドライバーを選択する提案システム
US20210279514A1 (en) Vehicle manipulation with convolutional image processing
Sharara et al. A real-time automotive safety system based on advanced ai facial detection algorithms
WO2022230629A1 (ja) 電子機器、電子機器の制御方法、及びプログラム
WO2022230630A1 (ja) 電子機器、電子機器の制御方法、及びプログラム
US20240220011A1 (en) Electronic device, method for controlling electronic device, and program
JP2023066304A (ja) 電子機器、電子機器の制御方法、及びプログラム
WO2023243468A1 (ja) 電子機器、電子機器の制御方法及び制御プログラム
Shibli et al. Developing a vision-based driving assistance system
WO2023243469A1 (ja) 電子機器、電子機器の制御方法及び制御プログラム
EP4325905A1 (en) Method and system for evaluating a subject's experience
KR102557799B1 (ko) 주의력 결핍 과잉 행동 장애 진단 장치 및 방법
JP7334415B2 (ja) 画像処理装置
Hengyi et al. Driver Safety System for Agricultural Machinery Operations Using Deep Learning Algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231117