JP2019175210A - 口形状検出装置 - Google Patents

口形状検出装置 Download PDF

Info

Publication number
JP2019175210A
JP2019175210A JP2018063571A JP2018063571A JP2019175210A JP 2019175210 A JP2019175210 A JP 2019175210A JP 2018063571 A JP2018063571 A JP 2018063571A JP 2018063571 A JP2018063571 A JP 2018063571A JP 2019175210 A JP2019175210 A JP 2019175210A
Authority
JP
Japan
Prior art keywords
reliability
feature point
mouth shape
unit
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018063571A
Other languages
English (en)
Inventor
和久 永石
Kazuhisa Nagaishi
和久 永石
博幸 森▲崎▼
Hiroyuki Morisaki
博幸 森▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin Corp
Original Assignee
Aisin Seiki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin Seiki Co Ltd filed Critical Aisin Seiki Co Ltd
Priority to JP2018063571A priority Critical patent/JP2019175210A/ja
Publication of JP2019175210A publication Critical patent/JP2019175210A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Image Analysis (AREA)

Abstract

【課題】一例として、顔の向きによらず、歪みが少ない口形状を精度良く検出することのできる口形状検出装置を提供する。【解決手段】実施形態に係る口形状検出装置は、一例として、角度算出部と、特徴点抽出部と、信頼度設定部と、フィッティング部とを備える。角度算出部は、人物の顔を撮像した顔画像から顔向きの角度を算出する。特徴点抽出部は、顔画像から口形状を示す複数の特徴点を抽出する。信頼度設定部は、角度算出部によって算出された顔向きの角度に基づき、特徴点抽出部によって抽出された特徴点ごとに信頼度を設定する。フィッティング部は、特徴点抽出部によって抽出された複数の特徴点と、信頼度設定部によって特徴点ごとに設定された信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行う。【選択図】図5

Description

本発明の実施形態は、口形状検出装置に関する。
従来、人物の顔を撮像した画像からその人物の口形状を検出する技術が知られている。特許文献1には、顔向きの角度ごとに複数の口形状モデルを用意しておくことで、顔向きによる検出精度の低下を抑制する技術が開示されている。
また、特許文献2には、頭部の動きによって引き起こされる口形状の歪みを除去する技術が開示されている。かかる特許文献2には、人物が撮像装置に対して左方または右方を向いている場合には、その人物はコンピュータと意思の疎通をはかる意思がないものとみなし、口形状の歪みの除去を行わないことが記載されている。このように特許文献2の技術では、人物が撮像装置に対して左方または右方を向いている場合に生じる口形状の奥行き方向の歪みについては考慮されていない。
特開2002−91466号公報 特開2006−277022号公報
本発明は、一例として、顔の向きによらず、歪みが少ない口形状を精度良く検出することのできる口形状検出装置を提供する。
実施形態に係る口形状検出装置は、一例として、人物の顔を撮像した顔画像から顔向きの角度を算出する角度算出部と、顔画像から口形状を示す複数の特徴点を抽出する特徴点抽出部と、角度算出部によって算出された顔向きの角度に基づき、特徴点抽出部によって抽出された特徴点ごとに信頼度を設定する信頼度設定部と、特徴点抽出部によって抽出された複数の特徴点と、信頼度設定部によって特徴点ごとに設定された信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行うフィッティング部と、を備える。よって、実施形態に係る口形状検出装置によれば、各特徴点に対して設定された信頼度を加味して、正面向きの口形状モデルを用いたモデルフィッティングを行うため、一例としては、顔の向きによらず、歪みが少ない口形状を精度良く検出することができる。
上記口形状検出装置では、一例として、信頼度設定部は、顔向きの角度に基づく第1信頼度を設定する第1設定部と、複数の特徴点のフレーム間における距離差分に基づく第2信頼度を設定する第2設定部と、第1信頼度と第2信頼度とに基づき、特徴点抽出部によって抽出された複数の特徴点の信頼度を算出する信頼度算出部とを備える。よって、実施形態に係る口形状検出装置によれば、一例としては、顔向きによる影響だけでなく、光や影などの環境変化、顔のしわ等の外乱による影響を低くすることができるため、口形状をより精度良く検出することができる。
上記口形状検出装置では、一例として、角度算出部は、少なくとも奥行き方向の角度を含む顔向きの角度を算出し、第1設定部は、奥行き方向の奥側に位置する特徴点の第1信頼度を、この特徴点よりも奥行き方向の手前側に位置する特徴点の第1信頼度よりも低くする。よって、実施形態に係る口形状検出装置によれば、一例としては、奥行き方向の歪みが大きい特徴点のモデルフィッティング処理に与える影響を低くすることができる。
上記口形状検出装置では、一例として、第2設定部は、距離差分が大きい特徴点の第2信頼度を、この特徴点よりも距離差分が小さい特徴点の第2信頼度よりも低くする。よって、実施形態に係る口形状検出装置によれば、一例としては、光や影などの環境変化、顔のしわ等の外乱がモデルフィッティングに与える影響を低くすることができる。
上記口形状検出装置では、一例として、複数の特徴点のうち、モデルフィッティングに用いる少なくとも2以上の特徴点を、信頼度設定部によって設定された信頼度に応じて選択する特徴点選択部を備え、フィッティング部は、複数の特徴点のうち、特徴点選択部によって選択された特徴点を用いてモデルフィッティングを行う。よって、実施形態に係る口形状検出装置によれば、正面向きの口形状モデルを用いたモデルフィッティングを行う際に、信頼度の低い、つまり、歪みが大きい特徴点の影響を排除するため、一例としては、顔画像中の口形状が歪んでいる場合でも、正面向きの口形状を精度良く検出することができる。
図1Aは、本実施形態に係る口形状検出処理の一例を示す図である。 図1Bは、本実施形態に係る口形状検出処理の一例を示す図である。 図2は、本実施形態に係る口形状検出装置を適用した車両の車室の一部が透視された状態の一例を示す斜視図である。 図3は、本実施形態に係る撮像装置の配置の一例を示す図である。 図4は、本実施形態に係る制御システムの構成の一例を示すブロック図である。 図5は、本実施形態に係るECUの機能的構成の一例を示すブロック図である。 図6は、奥行き方向の顔向き角度の説明図である。 図7は、特徴点抽出部によって抽出される複数の特徴点の一例を示す図である。 図8は、信頼度テーブルの一例を示す図である。 図9は、発話判定処理の一例を説明するための図である。 図10は、ECUが実行する処理の手順の一例を示すフローチャートである。
まず、本実施形態に係る口形状検出処理の一例について図1Aおよび図1Bを参照して説明する。図1Aおよび図1Bは、本実施形態に係る口形状検出処理の一例を示す図である。
なお、以下に示される実施形態の構成、ならびに当該構成によってもたらされる作用、結果、および効果は、一例である。本発明は、以下の実施形態に開示される構成以外によって実現可能であるとともに、基本的な構成に基づく種々の効果や、派生的な効果のうち、少なくとも1つを得ることが可能である。
本実施形態に係る口形状検出処理は、人物の顔を撮像した顔画像に対してモデルフィッティングを行うことにより、その人物の口形状を検出する。モデルフィッティングとは、対象物の形状を模したモデル画像を用い、モデル画像の特徴点を、撮像画像から抽出された対象物の特徴点に合わせ込むことにより対象物の形状を取得する手法である。
検出された口形状の情報は、たとえば発話区間の検出に利用される。発話区間の検出を精度良く行うためには、口形状を精度良く検出することが望ましい。しかし、口形状は顔の向きによって見え方が変化するため、単一のモデル画像だけを用いて口形状を精度良く検出することは困難である。
顔向きによる口形状の検出精度の低下を抑制する技術として、特許文献1には、顔向きの角度ごとに複数の口形状のモデル画像を用意しておくことが記載されている。しかしながら、事前に複数のモデル画像を用意するためには、時間、コストがかかる。また、演算負荷が高く、多くのハードリソースが必要となるという問題もある。
一方、特許文献2には、頭部の動きによって引き起こされる口形状の歪みを除去する技術が開示されている。しかしながら、特許文献2の技術では、人物が撮像装置に対して左方または右方を向いている場合には、その人物はコンピュータと意思の疎通をはかる意思がないものとみなし、口形状の歪みの除去を行わないことが記載されている。このように、特許文献2の技術は、人物が撮像装置に対して左方または右方を向いている場合に生じる口形状の奥行き方向の歪みについては考慮しないため、利用用途が限られてしまう。
本実施形態に係る口形状検出処理は、単一の口形状モデル、具体的には、正面向きの口形状モデルを用いてモデルフィッティングを行う。この際、本実施形態に係る口形状検出処理では、顔画像から抽出される口形状の特徴点ごとに顔向きの角度に基づく信頼度を設定し、設定した信頼度を加味したモデルフィッティングを行う。
たとえば、図1Aに示すように、人物が撮像装置201の光軸に対して左右方向(ここでは、左方)を向いている場合、撮像装置201によって撮像される口形状は、撮像画像の奥行き方向に歪んだ形状となる。
本実施形態に係る口形状検出処理では、まず、撮像装置201によって撮像された顔画像から顔向きの角度を算出する(角度算出処理)。また、本実施形態に係る口形状検出処理では、顔画像から口形状を示す複数の特徴点を抽出する(特徴点抽出処理)。
抽出される特徴点の数は予め設定されている。たとえば本例では、図1Aにおいて黒丸で示すように、18個の特徴点が抽出される。
つづいて、本実施形態に係る口形状検出処理では、角度算出処理によって算出された奥行き方向の角度に基づき、特徴点抽出処理によって抽出された特徴点ごとに信頼度を設定する(信頼度設定処理)。
ここで、口形状が奥行き方向に歪んでいる場合、口形状の歪みは、顔画像における奥行き方向の奥側ほど大きくなる。このため、信頼度設定処理では、奥行き方向の奥側に位置する特徴点の信頼度を、この特徴点よりも奥行き方向の手前側に位置する特徴点の信頼度よりも低くする。
そして、本実施形態に係る口形状検出処理では、特徴点抽出処理によって抽出された複数の特徴点と、信頼度設定処理によって特徴点ごとに設定された信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行う(フィッティング処理)。
たとえば、図1Bに示すように、フィッティング処理では、特徴点抽出処理によって抽出された18個の特徴点のうち、フィッティング処理に用いる2以上(ここでは、11個)の特徴点を、信頼度が高い特徴点から順に選択する。なお、図1Bにおいて「×」で示された特徴点は、フィッティング処理に用いる特徴点として選択されなかった特徴点を示している。
信頼度設定処理において、奥行き方向の奥側に位置する特徴点ほど信頼度が低く設定される。このため、奥行き方向の奥側に位置する特徴点は、フィッティング処理に用いる特徴点から除外される。
フィッティング処理では、選択された11個の特徴点を用いてモデルフィッティングを行う。なお、正面向きの口は一般的には左右対称な形状を有しており、この形状を模した正面向きの口形状モデルも左右対称な形状を有する。このため、フィッティング処理では、選択された11個の特徴点を用いて、選択されなかった特徴点を補間することが可能である。
このように、本実施形態に係る口形状検出処理では、正面向きの口形状モデルを用いたモデルフィッティングを行う際に、信頼度の低い、つまり、顔向きによる歪みが大きい特徴点の影響を低くすることとした。これにより、顔画像中の口形状が歪んでいる場合でも、正面向きの口形状を精度良く検出することができる。したがって、本実施形態に係る口形状検出処理によれば、顔の向きによらず、歪みが少ない口形状を精度良く検出することができる。また、本実施形態に係る口形状検出処理によれば、単一の口形状モデルを用いるため、顔向きの角度ごとに複数のモデル画像を用意する場合と比較して、開発コストを削減できるとともに、演算負荷およびハードリソースを削減することができる。
以下、このような口形状検出処理を実現する口形状検出装置について図2以降を参照して詳細に説明する。
図2は、本実施形態に係る口形状検出装置を適用した車両の車室の一部が透視された状態の一例を示す斜視図である。また、図3は、本実施形態に係る撮像装置の配置の一例を示す図である。
車両1は、内燃機関(エンジン)を駆動源とする自動車(内燃機関自動車)であっても良いし、電動機(モータ)を駆動源とする自動車(電気自動車、燃料電池自動車等)であっても良いし、それらの双方を駆動源とする自動車(ハイブリッド自動車)であっても良い。また、車両1は、種々の変速装置、内燃機関や電動機の駆動に必要な種々の装置(システム、部品等)を搭載可能である。また、車両1における車輪3の駆動に関わる装置の方式、個数、レイアウト等は、種々に設定可能である。
図2に示すように、車両1の車体2は、運転者(不図示)が乗車する車室2aを構成している。車室2a内には、乗員としての運転者の座席2bに臨む状態で、操舵部4等が設けられている。本実施形態では、一例として、操舵部4は、ダッシュボード(インストルメントパネル)12から突出したステアリングホイールである。
また、図2に示すように、本実施形態では、一例として、車両1は、四輪車(四輪自動車)であり、左右二つの前輪3Fと、左右二つの後輪3Rとを有する。さらに、本実施形態では、これら四つの車輪3は、いずれも操舵されうるように(転舵可能に)構成されている。
車室2a内のダッシュボード12の車幅方向すなわち左右方向の中央部には、モニタ装置11が設けられている。モニタ装置11には、表示装置や音声出力装置が設けられている。表示装置は、例えば、LCD(Liquid Crystal Display)や、OELD(Organic Electroluminescent Display)等である。音声出力装置は、例えば、スピーカである。また、表示装置は、例えば、タッチパネル等、透明な操作入力部で覆われている。乗員は、操作入力部を介して表示装置の表示画面に表示される画像を視認することができる。また、乗員は、表示装置の表示画面に表示される画像に対応した位置において手指等で操作入力部を触れたり押したり動かしたりして操作することで、操作入力を実行することができる。
図3に示すように、ステアリングコラム202には、撮像装置201が設置されている。撮像装置201は、例えば、CCD(Charge Coupled Device)カメラ等である。撮像装置201は、座席2bに着座する運転者302の顔が、視野中心に位置するように、視野角及び姿勢が調整されている。撮像装置201は、運転者302の顔を予め設定されたフレームレートにて順次撮像し、撮像により得られた画像の画像データを順次出力する。
なお、撮像装置201は、必ずしもステアリングコラム202に設置されることを要しない。撮像装置201は、運転者302の顔を正面から撮像することのできる場所であれば、ステアリングコラム202以外の他の場所に設置されてもよい。
車両1には、本実施形態に係る口形状検出装置を含む制御システムが設けられる。かかる制御システムの構成について図4を参照して説明する。図4は、本実施形態に係る制御システムの構成の一例を示すブロック図である。
図4に示すように、制御システム100では、ECU(Electronic Control Unit)14や、モニタ装置11、操舵システム13等の他、ブレーキシステム18、舵角センサ19、アクセルセンサ20、シフトセンサ21、車輪速センサ22等が、電気通信回線としての車内ネットワーク23を介して電気的に接続されている。
モニタ装置11は、表示装置8と、音声出力装置9と、操作入力部10と、を有する。操舵システム13は、アクチュエータ13aと、トルクセンサ13bと、を有する。操舵システム13は、ECU14の制御のもとでアクチュエータ13aを動作させることで、車輪3の一部または全部を転舵する。トルクセンサ13bは、運転者による操舵部4の操作に応じて発生するトルクを検出し、検出結果をECU14に出力する。
ブレーキシステム18は、アクチュエータ18aと、ブレーキセンサ18bと、を有する。ブレーキシステム18は、ECU14の制御のもとでアクチュエータ18aを動作させることで、車輪3に制動力を付与する。ブレーキセンサ18bは、制動操作部6における可動部としてのブレーキペダルの位置(変位)を検出し、検出結果をECU14に出力する。
車内ネットワーク23は、例えば、CAN(Controller Area Network)として構成されている。ECU14は、車内ネットワーク23を通じて制御信号を送ることで、操舵システム13、ブレーキシステム18等を制御することができる。また、ECU14は、車内ネットワーク23を介して、トルクセンサ13b、ブレーキセンサ18b、舵角センサ19、アクセルセンサ20、シフトセンサ21、車輪速センサ22等の検出結果や、操作入力部10等の操作信号等を、受け取ることができる。ECU14は、口形状検出装置の一例である。
ECU14は、例えば、CPU(Central Processing Unit)14aや、ROM(Read Only Memory)14b、RAM(Random Access Memory)14c、表示制御部14d、音声制御部14e、SSD(Solid State Drive)14f等を有する。
CPU14aは、車両1全体の制御を行う。CPU14aは、ROM14b等の不揮発性の記憶装置にインストールされ、記憶されたプログラムを読み出し、当該プログラムにしたがって演算処理を実行できる。RAM14cは、CPU14aでの演算で用いられる各種のデータを一時的に記憶する。表示制御部14dは、ECU14での演算処理のうち、たとえば、撮像装置201で得られた画像データを用いた画像処理や、表示装置8に対する表示制御処理を行う。音声制御部14eは、ECU14での演算処理のうち、たとえば、音声出力装置9で出力される音声データの処理を実行する。SSD14fは、書き換え可能な不揮発性の記憶部であって、ECU14の電源がオフされた場合であってもデータを記憶することができる。CPU14aや、ROM14b、RAM14c等は、同一パッケージ内に集積されうる。ECU14は、CPU14aに替えて、DSP(Digital Signal Processor)等の他の論理演算プロセッサや論理回路等が用いられる構成であってもよい。また、SSD14fに替えてHDD(Hard Disk Drive)が設けられてもよいし、SSD14fやHDDは、ECU14とは別に設けられてもよい。
なお、上述した各種センサやアクチュエータの構成、配置、電気的な接続形態等は、一例であって、種々に設定(変更)することができる。
次に、ECU14の機能的構成について図5を参照して説明する。図5は、本実施形態に係るECU14の機能的構成の一例を示すブロック図である。
図5に示すように、ECU14は、取得部101と、モデル生成部102と、角度算出部103と、特徴点抽出部104と、信頼度設定部105と、特徴点選択部106と、フィッティング部107と、判定部108とを備える。信頼度設定部105は、第1設定部151と、第2設定部152と、信頼度算出部153とを備える。また、ECU14は、正面向きの口形状モデル110と、信頼度テーブル111と、過去フレーム情報112とを記憶する。これらのうち、口形状モデル110、信頼度テーブル111および過去フレーム情報112を除く構成は、ECU14として構成されたCPU14aが、ROM14b内に格納されたプログラムを実行することで実現される。なお、これらの構成をハードウェアで実現するように構成しても良い。
口形状モデル110、信頼度テーブル111および過去フレーム情報112は、SSD14f等の記憶媒体に記憶される。
口形状モデル110は、正面向きの口形状を模したモデル画像である。口形状モデル110には、複数(ここでは、18個)の特徴点が設定されている。口形状モデル110は、後述するモデル生成部102によって生成される。
信頼度テーブル111は、顔向き角度と第1信頼度とを対応付ける情報である。顔向き角度、第1信頼度および信頼度テーブル111の内容については、後述する。
過去フレーム情報112は、過去のフレームにおいて抽出された口形状の各特徴点の位置を示す情報であり、後述する特徴点抽出部104によってフレームごとに記憶される。なお、過去フレーム情報112は、少なくとも前回フレームの情報を含んでいればよい。
取得部101は、運転者302の顔を撮像した顔画像を撮像装置201からフレームごとに取得する。取得部101によって取得された顔画像は、モデル生成部102、角度算出部103および特徴点抽出部104に入力される。
モデル生成部102は、SSD14f等の記憶媒体に予め記憶された正面向きの口形状モデルの初期データと、取得部101から取得した顔画像に含まれる口形状とを用いたモデルフィッティングを行うことにより、運転者302に固有の口形状モデル110を生成する。この処理は、たとえば、車両1のイグニッションスイッチがオンされた場合に実行される。
角度算出部103は、取得部101から顔画像が入力されるごとに、顔画像に含まれる運転者302の顔の奥行き方向の角度を算出する。角度算出部103は、顔画像に含まれる運転者302の顔、鼻、目などの2次元の形状および位置関係から、運転者302の顔の奥行き方向の角度を算出することができる。角度算出部103によって算出された運転者302の顔向き角度は、信頼度設定部105の第1設定部151に入力される。
図6は、奥行き方向の顔向き角度の説明図である。図6に示すように、本実施形態において、奥行き方向の顔向き角度は、運転者302が撮像装置201の光軸を向いているとき、すなわち正面向きを基準(0度)とし、運転者302が撮像装置201の光軸に対して右方向を向いているときを「−X度(0<X≦90)」、左方向を向いているときを「+X度」で表す。
特徴点抽出部104は、取得部101から運転者302の顔画像が入力されるごとに、顔画像から口形状を示す複数の特徴点を抽出する。図7は、特徴点抽出部104によって抽出される複数の特徴点の一例を示す図である。図7に示すように、口形状からは、P1〜P18の18個の特徴点が抽出される。
特徴点抽出処理は、たとえばHaar−Like特徴等の既知のアルゴリズムを用いて行うことができる。Haar−Like特徴は、輝度情報に基づく特徴である。なお、特徴点抽出処理は、Haar−Like特徴以外のアルゴリズムを用いて行ってもよい。たとえば、輝度情報に基づく特徴としては、Haar−Like特徴以外に、ピクセル差分特徴を用いることができる。また、HOG(Histograms of Oriented Gradients)、EOH(Edge of Orientation Histograms)などのエッジ情報に基づく特徴を用いてもよい。
特徴点抽出部104によって抽出された特徴点の情報は、信頼度設定部105の第2設定部152に入力される。また、特徴点抽出部104によって抽出された特徴点の情報は、過去フレーム情報112としてSSD14f等の記憶媒体に記憶される。
第1設定部151は、角度算出部103によって算出された顔向き角度と、信頼度テーブル111とに基づき、第1信頼度を設定する。
図8は、信頼度テーブル111の一例を示す図である。図8に示すように、信頼度テーブル111は、顔向き角度と、特徴点ごとの第1信頼度とを対応付けた情報である。たとえば、顔向き角度が0度である場合、すなわち、運転者302が撮像装置201に対して正面を向いている場合、第1設定部151は、特徴点P1〜P18の第1信頼度を全て「1」に設定する。
また、顔向き角度が−90度である場合、すなわち、運転者302が撮像装置201に対し、運転者302から見て右方向真横を向いている場合、第1設定部151は、特徴点P18の第1信頼度を「1」に設定し、特徴点P1の第1信頼度を「0」に設定する。その他の特徴点P2〜P17については図示を省略するが、第1設定部151は、奥行き方向の奥側に位置する特徴点ほど第1信頼度を低く設定する。
また、顔向き角度が+90度である場合、すなわち、運転者302が撮像装置201に対し、運転者302から見て左方向真横を向いている場合、第1設定部151は、特徴点P1の第1信頼度を「1」に設定し、特徴点P18の第1信頼度を「0」に設定する。その他の特徴点P2〜P17については図示を省略するが、第1設定部151は、奥行き方向の奥側に位置する特徴点ほど第1信頼度を低く設定する。
このように、第1設定部151は、奥行き方向の奥側に位置する特徴点の第1信頼度を、この特徴点よりも奥行き方向の手前側に位置する特徴点の第1信頼度よりも低くする。これにより、奥行き方向の歪みが大きい特徴点が後述するフィッティング処理に与える影響を低くすることができる。
なお、ここでは、図6に示すように奥行き方向の顔向き角度(ヨー角)のみを顔向き角度として用いる場合の例を示すが、ヨー角だけでなくピッチ角およびロール角を顔向き角度として用いてもよい。ピッチ角は、上下方向の角度であり、ロール角は、撮像装置201の光軸周りの回転角度である。この場合、角度算出部103は、取得部101から取得した顔画像から運転者302の顔のヨー角、ピッチ角およびロール角を算出する。また、信頼度テーブル111には、ヨー角、ピッチ角およびロール角の組合せごとに、各特徴点P1〜P18の第1信頼度が対応付けられる。そして、第1設定部151は、角度算出部103によって算出されたヨー角、ピッチ角およびロール角の組合せに対応する第1信頼度を各特徴点P1〜P18の第1信頼度として設定する。
第2設定部152は、複数の特徴点のフレーム間における距離差分に基づく第2信頼度を設定する。
具体的には、第2設定部152は、特徴点P1〜P18ごとに、今回のフレームにおける位置と前回のフレームにおける位置との距離であるフレーム間距離を算出する。なお、前回のフレームから大きく移動した特徴点ほどフレーム間距離は大きくなる。
つづいて、第2設定部152は、算出した全てのフレーム間距離の平均値を算出する。また、第2設定部152は、特徴点P1〜P18ごとに、フレーム間距離の偏差、すなわち、フレーム間距離と平均値との差である距離差分を算出する。そして、第2設定部152は、特徴点P1〜P18ごとに、距離差分に応じた第2信頼度を設定する。具体的には、第2設定部152は、距離差分が大きい特徴点の第2信頼度を、この特徴点よりも距離差分が小さい特徴点の第2信頼度よりも低くする。なお、第2設定部152は、距離差分に反比例するように第2信頼度を設定してもよいし、距離差分が閾値を超える特徴点の第2信頼度を「0」に設定し、距離差分が閾値以下である特徴点の第2信頼度を「1」に設定してもよい。
このように、第2設定部152は、距離差分が大きい特徴点の第2信頼度を、この特徴点よりも距離差分が小さい特徴点の第2信頼度よりも低くする。これにより、発話における口の動きを極端に超える速さで口形状が変化した場合に、その変化を外乱と捉えて排除することができる。したがって、たとえば、光や影などの環境変化、顔のしわ等の外乱がフィッティング処理に与える影響を低くすることができる。
信頼度算出部153は、第1設定部151によって算出される第1信頼度と、第2設定部152によって算出される第2信頼度とに基づき、特徴点抽出部104によって抽出された複数の特徴点P1〜P18の各信頼度を算出する。
たとえば、信頼度算出部153は、第1信頼度と第2信頼度とを乗じることにより、各特徴点P1〜P18の信頼度を算出する。なお、各特徴点P1〜P18の信頼度は、第1信頼度と第2信頼度とを加味したものであればよく、必ずしも第1信頼度と第2信頼度とを乗じたものであることを要しない。たとえば、信頼度算出部153は、第1信頼度と第2信頼度とを足し合わせることにより、各特徴点P1〜P18の信頼度を算出してもよい。
信頼度設定部105は、特徴点抽出部104から抽出された複数の特徴点P1〜P18の情報と、信頼度算出部153によって算出された特徴点P1〜P18ごとの信頼度の情報とを特徴点選択部106に出力する。
特徴点選択部106は、特徴点抽出部104によって抽出された複数の特徴点P1〜P18のうち、モデルフィッティングに用いる少なくとも2以上の特徴点を、信頼度設定部105によって設定された信頼度が高い順に選択する。たとえば、特徴点選択部106は、全ての特徴点P1〜P18の半分である9個の特徴点を信頼度の高いものから順に選択する。
なお、特徴点選択部106によって選択される特徴点の数は、9個に限定されない。特徴点選択部106によって選択される特徴点の数は、2個以上18個未満、好ましくは9個以上18個未満の数であればよい。
また、特徴点選択部106は、たとえば、選択する特徴点の数を、角度算出部103によって算出された奥行き方向の顔向き角度(ヨー角)に応じて変更してもよい。すなわち、運転者302の顔が正面向きに近いほど奥行き方向の歪みは少なくなるため、各特徴点P1〜P18の信頼度は全体的に高くなる。そこで、角度算出部103は、角度算出部103によって算出された奥行き方向の角度(絶対値)が小さいほど、モデルフィッティングに用いる特徴点として選択する特徴点の数を多くしてもよい。
その他、特徴点選択部106は、特徴点抽出部104によって抽出された複数の特徴点P1〜P18のうち、信頼度設定部105によって設定された信頼度が閾値を超える特徴点を、モデルフィッティングに用いる特徴点として選択してもよい。
フィッティング部107は、特徴点抽出部104によって抽出された複数の特徴点P1〜P18と、信頼度設定部105によって特徴点P1〜P18ごとに設定された信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行う。
具体的には、フィッティング部107は、複数の特徴点P1〜P18のうち、特徴点選択部106によって選択された少なくとも2以上の特徴点を基準として、正面向きの口形状モデル110を用いたモデルフィッティングを行う。これにより、仮想平面上に正面向きの口形状が生成される。フィッティング部107は、生成した正面向きの口形状の情報を判定部108へ出力する。
判定部108は、フィッティング部107から入力された正面向きの口形状の情報を用いて、運転者302が発話を行っているか否かを判定する。
ここで、判定部108による発話判定処理の一例について図9を参照して説明する。図9は、発話判定処理の一例を説明するための図である。
図9に示すように、判定部108は、たとえば、今回のフレームを含む過去複数フレーム分(たとえば5フレーム分)の口形状について、開口部分の横幅Wならびに縦幅Hおよび口形状全体のアスペクト比AR(長辺と短辺の比率)を算出し、これらの情報に基づいて発話の有無を判定する。判定部108は、歪みのない正面向きの口形状にて発話判定処理を行うため、発話の有無を精度良く判定することができる。
このようにして、発話の有無をフレームごとに判定することで、ECU14は発話区間を検出することができる。
発話区間の検出結果は、たとえば音声認識処理に利用される。この場合、ECU14は、図示しない音声認識部を備える。音声認識部は、マイク等の音声入力部に入力された音声に対して音声認識処理を行い、命令の内容を特定する。
音声認識処理は、騒音などの影響によって発話の開始タイミングを判別することが難しい場合があり、たとえば発話の出だし部分が認識されないことで、発話者は正しく発話しているにもかかわらず誤認識が生じるおそれがある。ECU14は、判定部108によって検出された発話区間内において音声認識処理を行うことで、音声認識処理の精度を向上させることができる。
次に、ECU14の具体的動作について図10を参照して説明する。図10は、ECU14が実行する処理の手順の一例を示すフローチャートである。なお、モデル生成部102によるモデル生成処理については、既に実行されたものとして省略する。
図10に示すように、ECU14は、撮像装置201から運転者302の顔を撮像した顔撮像を取得し(ステップS101)、取得した顔画像から顔向き角度を算出する(ステップS102)。そして、ECU14は、信頼度テーブル111を参照して、ステップS104において抽出される各特徴点P1〜P18について、顔向き角度に基づく第1信頼度を設定する(ステップS103)。
つづいて、ECU14は、ステップS101において取得した顔画像から口形状の特徴点P1〜P18を抽出し(ステップS104)、特徴点P1〜P18ごとに、前回フレームと今回フレームとのフレーム間における距離差分に基づく第2信頼度を設定する(ステップS105)。そして、ECU14は、特徴点P1〜P18ごとに、ステップS103において設定した第1信頼度とステップS105において設定した第2信頼度とに基づく信頼度を算出する(ステップS106)。たとえば、ECU14は、第1信頼度と第2信頼度とを乗じることにより、各特徴点P1〜P18の信頼度を算出する。
つづいて、ECU14は、ステップS106において算出した信頼度に基づき、特徴点P1〜P18のうち、モデルフィッティングに用いる特徴点を選択する(ステップS107)。たとえば、ECU14は、信頼度設定部105によって設定された信頼度が高い順に9個の特徴点を選択する。
つづいて、ECU14は、ステップS107において選択した特徴点と、正面向きの口形状モデル110とを用いてモデルフィッティングを行う(ステップS108)。これにより、正面向きの口形状が生成される。そして、ECU14は、ステップS108において生成した正面向きの口形状を用いて発話の有無を判定する(ステップS109)。
つづいて、ECU14は、最終フレームか否かを判定する(ステップS110)。たとえば、ECU14は、イグニッションスイッチがオフされた場合に、最終フレームと判定し(ステップS110,Yes)、一連の処理を終える。一方、最終フレームではない場合(ステップS110,No)、ECU14は、処理をステップS101へ戻し、ステップS101からの処理を繰り返す。
上述してきたように、本実施形態に係る口形状検出装置(ECU14)は、角度算出部103と、特徴点抽出部104と、信頼度設定部105と、フィッティング部107とを備える。角度算出部103は、人物の顔を撮像した顔画像から顔向きの角度を算出する。特徴点抽出部104は、顔画像から口形状を示す複数の特徴点P1〜P18を抽出する。信頼度設定部105は、角度算出部103によって算出された顔向きの角度に基づき、特徴点抽出部104によって抽出された特徴点P1〜P18ごとに信頼度を設定する。フィッティング部107は、特徴点抽出部104によって抽出された複数の特徴点P1〜P18と、信頼度設定部105によって特徴点ごとに設定された信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行う。
本実施形態に係る口形状検出装置によれば、各特徴点P1〜P18に対して設定された信頼度を加味して、正面向きの口形状モデル110を用いたモデルフィッティングを行うため、一例としては、顔の向きによらず、歪みが少ない口形状を精度良く検出することができる。
また、本実施形態に係る口形状検出装置において、信頼度設定部105は、顔向きの角度に基づく第1信頼度を設定する第1設定部151と、複数の特徴点P1〜P18のフレーム間における距離差分に基づく第2信頼度を設定する第2設定部152と、第1信頼度と第2信頼度とに基づき、特徴点抽出部104によって抽出された複数の特徴点P1〜P18の信頼度を算出する信頼度算出部153とを備える。これにより、顔向きによる影響だけでなく、光や影などの環境変化、顔のしわ等の外乱による影響を低くすることができるため、口形状をより精度良く検出することができる。
また、本実施形態に係る口形状検出装置において、角度算出部103は、少なくとも奥行き方向の角度を含む顔向きの角度を算出する。そして、第1設定部151は、奥行き方向の奥側に位置する特徴点の第1信頼度を、この特徴点よりも奥行き方向の手前側に位置する特徴点の第1信頼度よりも低くする。これにより、奥行き方向の歪みが大きい特徴点のモデルフィッティング処理に与える影響を低くすることができる。
また、本実施形態に係る口形状検出装置において、第2設定部152は、距離差分が大きい特徴点の第2信頼度を、この特徴点よりも距離差分が小さい特徴点の第2信頼度よりも低くする。これにより、光や影などの環境変化、顔のしわ等の外乱がモデルフィッティングに与える影響を低くすることができる。
また、本実施形態に係る口形状検出装置は、複数の特徴点P1〜P18のうち、モデルフィッティングに用いる少なくとも2以上の特徴点を、信頼度設定部105によって設定された信頼度に応じて選択する特徴点選択部106を備える。そして、フィッティング部107は、複数の特徴点P1〜P18のうち、特徴点選択部106によって選択された特徴点を用いてモデルフィッティングを行う。このように、正面向きの口形状モデルを用いたモデルフィッティングを行う際に、信頼度の低い、つまり、奥行き方向への歪みが大きい特徴点の影響を排除することで、顔画像中の口形状が奥行き方向に歪んでいる場合でも、正面向きの口形状を精度良く検出することができる。
(変形例)
上述した実施形態では、特徴点選択部106により、複数の特徴点P1〜P18のうちフィッティング処理に用いる2以上の特徴点を信頼度に基づいて選択することとした。すなわち、信頼度が低い特徴点については、フィッティング処理に使用しないこととした。しかし、これに限らず、ECU14は、全ての特徴点P1〜P18を用いてモデルフィッティングを行ってもよい。たとえば、ECU14は、フィッティング処理における各特徴点P1〜P18の影響度(重み付け)を信頼度に応じて異ならせることとしてもよい。これにより、全ての特徴点P1〜P18を使用しつつ、信頼度の低い特徴点のフィッティング処理に与える影響を小さくすることができる。
また、上述した実施形態では、第1信頼度と第2信頼度とに基づいて各特徴点P1〜P18の信頼度を設定することとした。しかし、これに限らず、ECU14は、各特徴点P1〜P18の信頼度として第1信頼度をそのまま使用してもよい。
以上、本発明の実施形態を例示したが、上記実施形態および変形例はあくまで一例であって、発明の範囲を限定することは意図していない。上記実施形態や変形例は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、組み合わせ、変更を行うことができる。また、各実施形態や各変形例の構成や形状は、部分的に入れ替えて実施することも可能である。
P1〜P18…特徴点、1…車両、14…ECU、3…車輪、101…取得部、102…モデル生成部、103…角度算出部、104…特徴点抽出部、105…信頼度設定部、106…特徴点選択部、107…フィッティング部、108…判定部、110…口形状モデル、111…信頼度テーブル、112…過去フレーム情報、201…撮像装置。

Claims (5)

  1. 人物の顔を撮像した顔画像から顔向きの角度を算出する角度算出部と、
    前記顔画像から口形状を示す複数の特徴点を抽出する特徴点抽出部と、
    前記角度算出部によって算出された前記顔向きの角度に基づき、前記特徴点抽出部によって抽出された前記特徴点ごとに信頼度を設定する信頼度設定部と、
    前記特徴点抽出部によって抽出された前記複数の特徴点と、前記信頼度設定部によって前記特徴点ごとに設定された前記信頼度とに基づき、正面向きの口形状モデルを用いたモデルフィッティングを行うフィッティング部と、
    を備える、口形状検出装置。
  2. 前記信頼度設定部は、
    前記顔向きの角度に基づく第1信頼度を設定する第1設定部と、
    前記複数の特徴点のフレーム間における距離差分に基づく第2信頼度を設定する第2設定部と、
    前記第1信頼度と前記第2信頼度とに基づき、前記特徴点抽出部によって抽出された前記複数の特徴点の信頼度を算出する信頼度算出部と
    を備える、請求項1に記載の口形状検出装置。
  3. 前記角度算出部は、
    少なくとも奥行き方向の角度を含む前記顔向きの角度を算出し、
    前記第1設定部は、
    前記奥行き方向の奥側に位置する前記特徴点の前記第1信頼度を、該特徴点よりも前記奥行き方向の手前側に位置する前記特徴点の前記第1信頼度よりも低くする、
    請求項2に記載の口形状検出装置。
  4. 前記第2設定部は、
    前記距離差分が大きい前記特徴点の前記第2信頼度を、該特徴点よりも前記距離差分が小さい前記特徴点の前記第2信頼度よりも低くする、
    請求項2または3に記載の口形状検出装置。
  5. 前記複数の特徴点のうち、前記モデルフィッティングに用いる少なくとも2以上の前記特徴点を、前記信頼度設定部によって設定された前記信頼度に応じて選択する特徴点選択部
    を備え、
    前記フィッティング部は、
    前記複数の特徴点のうち、前記特徴点選択部によって選択された特徴点を用いて前記モデルフィッティングを行う、
    請求項1〜4のいずれか一つに記載の口形状検出装置。
JP2018063571A 2018-03-29 2018-03-29 口形状検出装置 Pending JP2019175210A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018063571A JP2019175210A (ja) 2018-03-29 2018-03-29 口形状検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018063571A JP2019175210A (ja) 2018-03-29 2018-03-29 口形状検出装置

Publications (1)

Publication Number Publication Date
JP2019175210A true JP2019175210A (ja) 2019-10-10

Family

ID=68168955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018063571A Pending JP2019175210A (ja) 2018-03-29 2018-03-29 口形状検出装置

Country Status (1)

Country Link
JP (1) JP2019175210A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021117049A (ja) * 2020-01-23 2021-08-10 国立大学法人電気通信大学 口腔認識装置
KR102603425B1 (ko) * 2022-06-23 2023-11-20 주식회사 노타 이미지의 헤드 포즈를 결정하는 장치 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021117049A (ja) * 2020-01-23 2021-08-10 国立大学法人電気通信大学 口腔認識装置
JP7414262B2 (ja) 2020-01-23 2024-01-16 国立大学法人電気通信大学 口腔認識装置
KR102603425B1 (ko) * 2022-06-23 2023-11-20 주식회사 노타 이미지의 헤드 포즈를 결정하는 장치 및 방법

Similar Documents

Publication Publication Date Title
EP3033999B1 (en) Apparatus and method for determining the state of a driver
CN104015659B (zh) 停车支援装置、停车支援方法
CN103854260B (zh) 车辆的控制装置及控制方法
CN105383384B (zh) 车辆控制装置
CN105644438B (zh) 车辆周边监视装置
US10467789B2 (en) Image processing device for vehicle
JP7222254B2 (ja) 周辺表示制御装置
US11040739B2 (en) Parking assist device, parking assist method, and driving assist device
CN107074247B (zh) 驾驶辅助装置及驾驶辅助系统
JP7222216B2 (ja) 運転支援装置
CN110997409B (zh) 周边监控装置
JP2016115117A (ja) 判定装置および判定方法
JP2018133712A (ja) 周辺監視装置
JP2020104680A (ja) 室内監視装置
JP2016189576A (ja) 画像表示制御装置
JP2019175210A (ja) 口形状検出装置
CN109691089A (zh) 显示控制装置
JP7263734B2 (ja) 視認対象判定装置
WO2018042976A1 (ja) 画像生成装置、画像生成方法、記録媒体、および画像表示システム
JP7311257B2 (ja) 眼球情報検出装置、眼球情報検出方法、および乗員モニタリング装置
JP2016115120A (ja) 開閉眼判定装置および開閉眼判定方法
JP6572538B2 (ja) 下方視判定装置および下方視判定方法
WO2017217044A1 (ja) 視認方向推定装置
JP6930202B2 (ja) 表示制御装置
JP7056034B2 (ja) 周辺監視装置