WO2021171538A1

WO2021171538A1 - 表情認識装置及び表情認識方法

Info

Publication number: WO2021171538A1
Application number: PCT/JP2020/008247
Authority: WO
Inventors: 篤松本; 信太郎渡邉
Original assignee: 三菱電機株式会社
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2021-09-02

Abstract

顔検出部（１１）は、撮像画像から対象者の顔領域及び顔の各部位を検出する。特徴抽出部（１２）は、顔検出部（１１）が検出した顔領域及び顔の各部位に基づき、表情筋ごとの特徴量を抽出する。表情筋識別部（１３）は、特徴抽出部（１２）が抽出した表情筋ごとの特徴量と各識別用データ（１５）とを比較することによって、表情筋ごとの動作有無を識別する。表情認識部（１４）は、表情筋識別部（１３）が動作していると識別した表情筋の組み合わせに基づいて対象者の表情を認識する。較正部（１６）は、対象者が基準表情をしているときの表情筋ごとの特徴量である各較正用データ（１７）を用いて、各識別用データ（１５）を較正する。

Description

表情認識装置及び表情認識方法

　本開示は、表情認識装置及び表情認識方法に関するものである。

　従来、対象者の表情を認識する技術が提案されている。例えば特許文献１に記載されている表情認識装置は、怒り及び驚き等の各表情カテゴリについて、特段の表情が表出していない基準表情から当該表情カテゴリへ変化したときの参照用の時系列データに基づいて、当該表情カテゴリであるか否かを識別する識別器を学習させる。そして、この表情認識装置は、対象者の基準表情からの表情の変化を示す時系列データを、各表情カテゴリの識別器に入力することによって、当該対象者の表情カテゴリを識別する。

　特許文献１に記載されているような従来の表情認識装置は、識別器に入力された対象者のデータが、識別器の学習に使用された平均的な基準表情のデータから算出された閾値以内であれば、当該対象者が基準表情をしていると判定していた。つまり、従来は、対象者の表情が平均的な基準表情に近いかどうかで、対象者が基準表情をしているか否かを判定していた。

特開２０１３－３７０６号公報

　基準表情及び表情表出の仕方には個人差があるため、平均的なデータを使って対象者の表情を認識する従来の方法では、対象者の表情を誤認識するという課題があった。例えば、通常眉間にしわをよせて目を細める傾向のある人（言い換えると基準表情が怖い顔の人）の表情は、怒っている表情であると誤認識されてしまう。逆に、表情が表に出にくい人は、本人が笑っているつもりでも、平均的な基準表情との差がないために笑っている表情と認識されない。

　本開示は、上記のような課題を解決するためになされたもので、個人差を考慮して表情を認識することを目的とする。

　本開示に係る表情認識装置は、撮像画像から対象者の顔領域及び顔の各部位を検出する顔検出部と、顔検出部が検出した顔領域及び顔の各部位に基づき、表情筋ごとの特徴量を抽出する特徴抽出部と、特徴抽出部が抽出した表情筋ごとの特徴量と各識別用データとを比較することによって、表情筋ごとの動作有無を識別する表情筋識別部と、表情筋識別部が動作していると識別した表情筋の組み合わせに基づいて対象者の表情を認識する表情認識部と、対象者が基準表情をしているときの表情筋ごとの特徴量を用いて各識別用データを較正する較正部とを備えるものである。

　本開示によれば、対象者が基準表情をしているときの特徴量を用いて、表情筋識別用の識別用データを較正するようにしたので、個人差を考慮して表情を認識できる。

実施の形態１に係る表情認識装置の構成例を示すブロック図である。２次元の場合のＳＶＭ（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）の一例を示すグラフである。実施の形態１に係る表情認識装置の動作例を示すフローチャートである。実施の形態２に係る表情認識装置の構成例を示すブロック図である。実施の形態２に係る表情認識装置の動作例を示すフローチャートである。実施の形態３に係る表情認識装置の構成例を示すブロック図である。各実施の形態に係る表情認識装置のハードウェア構成の一例を示す図である。各実施の形態に係る表情認識装置のハードウェア構成の別の例を示す図である。

　以下、本開示をより詳細に説明するために、本開示を実施するための形態について、添付の図面に従って説明する。
実施の形態１．
　図１は、実施の形態１に係る表情認識装置１０の構成例を示すブロック図である。表情認識装置１０は、対象者の表情を認識するものである。実施の形態１では、表情認識装置１０が車両の乗員（例えば、運転者）の表情を認識する例を説明する。この車両には、表情認識装置１０、カメラ１、覚醒度推定装置２、及び警告装置３が搭載されている。

　カメラ１は、対象者（以下、対象者を運転者とする）の顔を含む車内を、時系列で撮像する。例えば、ダッシュボード上かつ運転席と助手席との間にカメラ１が設置され、カメラ１の光軸が運転席の方向に設定されている。または、カメラ１が運転者と助手席乗員の両方を撮像できるように、カメラ１の光軸が運転席と助手席との間に向いていてもよい。または、カメラ１がステアリングコラム付近に設置され、運転者を正面から撮像する構成でもよい。カメラ１が撮像した画像は、顔検出部１１に入力される。

　表情認識装置１０は、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、識別用データ１５、較正部１６、及び較正用データ１７を備える。
　ここでは、表情認識装置１０がＦＡＣＳ（Ｆａｃｉａｌ　Ａｃｔｉｏｎ　Ｃｏｄｉｎｇ　Ｓｙｓｔｅｍ）を用いて対象者の表情を認識する例を説明する。ＦＡＣＳとは、表情が表出するときに作用する表情筋の動きをＡＵ（Ａｃｔｉｏｎ　Ｕｎｉｔ）として体系的に分類したものであり、ＡＵを組み合わせることで様々な表情を表現するものである。例えば、「ＡＵ１」は「内眉が上がる」という表情筋の動作であり、「ＡＵ２」は「外眉が上がる」という表情筋の動作である。動作していると識別されたＡＵの組み合わせが、例えば「ＡＵ１」、「ＡＵ２」、「ＡＵ５」、及び「ＡＵ２６」である場合、この組み合わせに対応する表情は「驚き」である。

　顔検出部１１は、撮像画像をカメラ１から取得し、撮像画像に対する画像処理を行って運転者の顔領域、並びに、目、鼻及び口等の各部位を検出する。顔検出部１１は、検出した顔領域の画像と、当該画像における各部位の位置とを、特徴抽出部１２へ出力する。

　特徴抽出部１２は、顔検出部１１が検出した顔の各部位の位置に基づいて、顔検出部１１が検出した顔領域の画像の中から、表情筋の動作有無識別のために注目すべき領域を特定し、特定した領域の特徴量を抽出する。ＦＡＣＳにおいては、特徴抽出部１２は、各ＡＵに対応する各領域を特定し、特定した領域それぞれについての特徴量を抽出する。例えば「ＡＵ１」に関して、特徴抽出部１２は、顔の各部位の位置に基づいて顔領域の中から目周辺の領域を特定し、特定した領域の画像からＬＢＰ（Ｌｏｃａｌ　Ｂｉｎａｒｙ　Ｐａｔｔｅｒｎ）特徴量等の特徴量を抽出する。特徴抽出部１２は、「ＡＵ１」と同様に、残りのＡＵそれぞれに関しても、ＡＵに対応する領域を特定し、特定した領域の画像から特徴量を抽出する。そして、特徴抽出部１２は、ＡＵごとの特徴量、つまり表情筋ごとの特徴量を、表情筋識別部１３へ出力する。

　表情筋識別部１３は、特徴抽出部１２が抽出した表情筋ごとの特徴量と、表情筋ごとの識別用データ１５ａ（図２参照）とを比較することによって、表情筋ごとの動作有無を識別する。詳細は後述する。表情筋識別部１３は、表情筋ごとの動作有無の識別結果を表情認識部１４へ出力する。

　ＦＡＣＳにおいては、表情認識装置１０は、ＡＵごとの識別用データ１５を保持している。識別用データ１５の学習及びＡＵの動作有無の識別は、ＳＶＭ（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）等の方法を用いて行われる。

　図２は、２次元の場合のＳＶＭの一例を示すグラフである。ここでは、「ＡＵ１」について、説明を簡単にするために２次元空間を例に挙げて説明する。グラフの縦軸及び横軸は、種類の異なる特徴量である。図２の２次元空間には、複数の被験者の顔画像から抽出された特徴量（白丸（○）及び黒丸（●））を用いて学習された識別用データ１５が、設定されている。白丸（〇）は「ＡＵ１」が動作しているときの顔画像から抽出された特徴量であり、黒丸（●）は「ＡＵ１」が動作していない基本表情のときの顔画像から抽出された特徴量である。

　先立って説明したように、基準表情及び表情表出の仕方には個人差があり、基準表情が無表情の人もいれば怒っているような表情の人等もいる。図２において、白三角（△）及び黒三角（▲）は、特徴抽出部１２が抽出した、対象者である運転者の「ＡＵ１」の特徴量である。白三角（△）は「ＡＵ１」が動作しているときの特徴量であり、黒三角（▲）は「ＡＵ１」が動作していない基本表情のときの特徴量である。図２に示されるように、運転者の基準表情及び「ＡＵ１」動作の仕方は、複数の被験者に基づく平均的な基本表情及び「ＡＵ１」動作の仕方と異なっている。そのため、表情筋識別部１３は、平均的な識別用データ１５を用いてこの運転者の「ＡＵ１」の動作有無を識別すると、「ＡＵ１」が動作しているにもかかわらず、「ＡＵ１」の動作無しと誤識別する場合がある。

　そこで、実施の形態１の表情認識装置１０においては、較正部１６が、対象者である運転者が基準表情をしているときの「ＡＵ１」の特徴量である較正用データ１７を用いて、「ＡＵ１」の識別用データ１５を、この運転者の「ＡＵ１」動作有無を識別するための識別用データ１５ａ（図２参照）に較正する。例えば、較正用データ１７は、対象者である運転者が基準表情をしているときにカメラ１により撮像された時系列の画像群から抽出された、運転者の「ＡＵ１」の特徴量の時系列データである。較正部１６は、この運転者の「ＡＵ１」の特徴量の時系列データについて平均値及び標準偏差等の統計値を求め、求めた統計値を用いて、平均的な「ＡＵ１」の識別用データ１５を較正することによって、運転者の「ＡＵ１」の識別用データ１５ａを得る。較正部１６は、「ＡＵ１」以外のＡＵについても、各ＡＵの較正用データ１７を用いて各ＡＵの識別用データ１５を較正し、各ＡＵの識別用データ１５ａを得る。

　表情筋識別部１３は、特徴抽出部１２が抽出したＡＵのそれぞれについて、ＡＵの特徴量とこのＡＵの識別用データ１５とを比較することによってこのＡＵの動作有無を識別する。図２の例においては、表情筋識別部１３は、較正部１６が較正した「ＡＵ１」の識別用データ１５ａと、特徴抽出部１２が抽出した「ＡＵ１」の特徴量とを比較することによって、運転者の「ＡＵ１」の動作有無を識別する。表情筋識別部１３は、「ＡＵ１」以外のＡＵについても、較正部１６が較正した各ＡＵの識別用データ１５ａと、特徴抽出部１２が抽出した各ＡＵの特徴量とを比較することによって、運転者の各ＡＵの動作有無を識別する。表情筋識別部１３は、ＡＵごとの動作有無、つまり表情筋ごとの動作有無を、表情認識部１４へ出力する。

　表情認識部１４は、表情筋識別部１３が動作していると識別した表情筋の組み合わせに基づいて、運転者の表情を認識する。ＦＡＣＳにおいては、表情認識部１４は、全ＡＵのうち、表情筋識別部１３が動作していると識別したＡＵの組み合わせに基づいて、運転者の表情を認識する。表情認識部１４は、認識した表情の情報を、覚醒度推定装置２へ出力する。

　覚醒度推定装置２は、表情認識部１４が認識した運転者の表情に基づき、運転者の覚醒度を推定する。警告装置３は、覚醒度推定装置２が推定した運転者の覚醒度に基づき、運転者に対して警告を行う。例えば、警告装置３は、運転者の覚醒度が予め定められた覚醒度より低い場合、音又は表示の少なくとも一方により、運転者に対して警告を行う。

　なお、図１の例では、表情認識装置１０が認識した対象者の表情を警告の要否判定に用いたが、表情認識装置１０の用途はこの例に限定されない。

　図３は、実施の形態１に係る表情認識装置１０の動作例を示すフローチャートである。表情認識装置１０は、例えば、電源が供給されると図３のフローチャートに示される動作を開始し、電源供給が停止されると図３のフローチャートに示される動作を終了する。

　ステップＳＴ１において、較正部１６は、対象者が基準表情をしているときの表情筋ごとの特徴量である較正用データ１７を用いて、表情筋ごとの平均的な識別用データ１５を較正する。識別用データ１５及び較正用データ１７は、表情認識装置１０に対して予め与えられているものとする。

　ステップＳＴ２において、顔検出部１１は、カメラ１が撮像した画像から、対象者の顔領域及び顔の各部位を検出する。ステップＳＴ３において、特徴抽出部１２は、顔検出部１１が検出した対象者の顔領域及び顔の各部位に基づき、対象者の表情筋ごとの特徴量を抽出する。

　ステップＳＴ４において、表情筋識別部１３は、特徴抽出部１２が抽出した対象者の表情筋ごとの特徴量と、較正部１６がステップＳＴ１で較正した表情筋ごとの識別用データ１５ａとを比較することによって、対象者の表情筋ごとの動作有無を識別する。ステップＳＴ５において、表情認識部１４は、表情筋識別部１３が動作していると識別した表情筋の組み合わせに基づいて対象者の表情を認識し、認識した表情の情報を覚醒度推定装置２へ出力する。

　以上のように、実施の形態１に係る表情認識装置１０は、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、及び較正部１６を備える。顔検出部１１は、撮像画像から対象者の顔領域及び顔の各部位を検出する。特徴抽出部１２は、顔検出部１１が検出した顔領域及び顔の各部位に基づき、表情筋ごとの特徴量を抽出する。表情筋識別部１３は、特徴抽出部１２が抽出した表情筋ごとの特徴量と各識別用データ１５とを比較することによって、表情筋ごとの動作有無を識別する。表情認識部１４は、表情筋識別部１３が動作していると識別した表情筋の組み合わせに基づいて対象者の表情を認識する。較正部１６は、対象者が基準表情をしているときの表情筋ごとの特徴量（較正用データ１７）を用いて、各識別用データ１５を較正する。このように、表情認識装置１０は、対象者が基準表情をしているときの特徴量を用いて、表情筋識別用の識別用データ１５を較正するようにしたので、個人差を考慮して表情を認識できる。

実施の形態２．
　実施の形態１では、表情認識装置１０に対して、対象者が基準表情をしているときの表情筋ごとの較正用データ１７が予め与えられていた。実施の形態２では、表情認識装置１０が、対象者が基準表情をしているタイミングで、表情筋ごとの較正用データ１７を取得して蓄積する。

　図４は、実施の形態２に係る表情認識装置１０の構成例を示すブロック図である。実施の形態２に係る表情認識装置１０は、図１に示された実施の形態１の表情認識装置１０に対して、蓄積部１８、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、及び車両情報取得部２４が追加された構成である。また、実施の形態２でも、実施の形態１と同様に、表情認識装置１０が車両の乗員（例えば、運転者）の表情を認識する例を説明する。車両には、覚醒度推定装置２、及び警告装置３に加え、マイク３１、ナビゲーション装置３２、車外カメラ３３、及び車載器３４が搭載されている。図４において図１と同一又は相当する部分は、同一の符号を付し説明を省略する。以下では、対象者を、車両の運転者とする。

　蓄積部１８は、運転者が基準表情をしているときの表情筋ごとの特徴量を、表情筋ごとの較正用データ１７として蓄積する。

　蓄積タイミング調整部１９は、特徴抽出部１２が抽出した運転者の表情筋ごとの特徴量を、較正用データ１７として蓄積部１８に蓄積させる蓄積タイミングを調整する。蓄積タイミング調整部１９は、蓄積タイミングであるか否かを、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、及び車両情報取得部２４のうちの少なくとも１つからの情報に基づいて判定する。

　マイク３１は、対象者が発する音声を取得する。マイク３１が取得した音声情報は、会話判定部２２に入力される。

　ナビゲーション装置３２は、車両周辺の渋滞情報をストレス判定部２３に入力する。

　車外カメラ３３は、車両周辺を撮像し、撮像した画像をストレス判定部２３に入力する。

　車載器３４は、操舵角、車速、加速度、ブレーキ、及びクラクション等の運転者が運転している車両の情報を、車両情報として車両情報取得部２４へ入力する。

　外光判定部２０は、顔検出部１１から顔領域の画像を取得し、取得した画像の輝度情報に基づいて、運転者の顔に照射される外光の有無を判定する。車両の場合、外光は、直射日光及び対向車のハイビーム等である。外光判定部２０は、外光の有無の判定結果を蓄積タイミング調整部１９へ出力する。

　開眼度取得部２１は、顔検出部１１から顔領域の画像を取得し、取得した画像から、運転者の目の開き度合を示す開眼度を取得する。開眼度取得部２１は、取得した開眼度を蓄積タイミング調整部１９へ出力する。

　会話判定部２２は、下記の方法によって運転者が会話しているか否かを判定する。会話判定部２２は、会話の有無の判定結果を蓄積タイミング調整部１９へ出力する。
　例えば、会話判定部２２は、顔検出部１１から顔領域の画像を取得し、取得した画像から、運転者の口の開き度合を取得し、口の開き度合に基づいて運転者が会話しているか否かを判定する。
　また、例えば、会話判定部２２は、マイク３１から音声情報を取得し、取得した音声情報に基づいて、運転者が会話しているか否かを判定する。
　なお、会話判定部２２は、口の開き度合又は音声情報のいずれか一方を用いて会話の有無を判定してもよいし、口の開き度合及び音声情報の両方を用いて会話の有無を判定してもよい。

　ストレス判定部２３は、下記の方法によって運転者がストレス状態であるか否かを判定する。ストレス判定部２３は、ストレス状態の判定結果を蓄積タイミング調整部１９へ出力する。
　例えば、ストレス判定部２３は、ナビゲーション装置３２から車両周辺の渋滞情報を取得し、車両が渋滞に巻き込まれている場合に運転者にストレスが発生していると判定する。ストレス判定部２３は、車外カメラ３３から車両周辺の撮像画像を取得し、取得した撮像画像に基づいて車両が渋滞に巻き込まれているか否かを判定してもよい。
　また、例えば、ストレス判定部２３は、車両情報取得部２４から車両情報を取得し、取得した車両情報に含まれるクラクション操作情報、操舵角情報、又はブレーキ操作情報のうちの少なくとも１つの情報に基づいて運転者が車両を運転しにくい交通状況であるか否かを判定する。ストレス判定部２３は、例えば、クラクションが操作された場合、操舵角が短時間に大きく変化した場合、又はブレーキが頻繁に操作された場合に、運転者が車両を運転しにくい交通状況であると判定する。そして、ストレス判定部２３は、運転者が車両を運転しにくい交通状況であると判定した場合、運転者にストレスが発生していると判定する。
　なお、ストレス判定部２３は、渋滞情報、撮像画像、又は車両情報のうちのいずれか１つを用いてストレス発生の有無を判定してもよいし、渋滞情報、撮像画像、及び車両情報の全てを用いてストレス発生の有無を判定してもよい。

　車両情報取得部２４は、車載器３４から車両情報を取得し、取得した車両情報を蓄積タイミング調整部１９及びストレス判定部２３へ出力する。

　図５は、実施の形態２に係る表情認識装置１０の動作例を示すフローチャートである。

　ステップＳＴ１１において、蓄積タイミング調整部１９は、蓄積タイミングであるか否かを判定する。

　例えば、蓄積タイミング調整部１９は、顔検出部１１が顔領域の検出を開始した時点から予め定められた時間（例えば、２０秒）が経過した時点までを、蓄積タイミングとする。顔検出部１１が顔領域の検出を開始した時点は、対象者である運転者が車両に搭乗した時点であり、運転開始前は運転者が基準表情をしている可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、車両情報取得部２４から取得した車両情報に基づき、車両の速度が予め定められた範囲内である場合、車両の加速度が予め定められた範囲内である場合、又は操舵角が予め定められた範囲内である場合のうちの少なくとも１つを、蓄積タイミングとする。例えば、車両が法定速度でまっすぐ走行している場合、運転者が車両を運転しやすい交通状況であるため、運転者が基準表情をしている可能性が高い。一方、車両が車線変更等している場合、又は車両が急加速若しくは急減速している場合、運転者が車両を運転しにくい交通状況であるため、運転者が基準表情をしていない可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、外光判定部２０から取得した外光の有無の判定結果に基づき、運転者の顔に外光が照射されている場合を、蓄積タイミングから除外する。運転者の顔に直射日光又は対向車のハイビーム等が照射されている場合、運転者は目を細める等して基準表情をしていない可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、開眼度取得部２１から取得した開眼度に基づき、運転者が閉眼している場合を、蓄積タイミングから除外する。運転者が閉眼している場合、運転者が眠気を感じている等して基準表情をしていない可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、会話判定部２２から取得した会話の有無の判定結果に基づき、運転者が会話している場合を、蓄積タイミングから除外する。運転者は、会話している最中は基準表情をしていない可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、ストレス判定部２３から取得したストレス状態の判定結果に基づき、運転者がストレス状態にある場合を、蓄積タイミングから除外する。運転者は、ストレスを感じている最中は基準表情をしていない可能性が高い。

　また、例えば、蓄積タイミング調整部１９は、カメラ１が撮像した画像から同乗者の有無を判定し、同乗者がいる場合を、蓄積タイミングから除外する。車内に同乗者がいる場合、運転者は、同乗者と会話している等して基準表情をしていない可能性が高い。

　蓄積タイミングである場合（ステップＳＴ１１“ＹＥＳ”）、蓄積タイミング調整部１９は、図３のフローチャートにおけるステップＳＴ３で特徴抽出部１２が抽出する表情筋ごとの特徴量を、較正用データ１７として蓄積部１８に蓄積させる（ステップＳＴ１２）。一方、蓄積タイミングでない場合（ステップＳＴ１１“ＮＯ”）、蓄積タイミング調整部１９は、ステップＳＴ１１の動作を繰り返す。

　実施の形態２の較正部１６は、図３のフローチャートに示されるステップＳＴ１において、蓄積部１８に蓄積されている較正用データ１７を用いて、予め定められている識別用データ１５を運転者用の識別用データ１５ａに較正する。

　なお、蓄積タイミング調整部１９は、蓄積部１８に較正用データ１７が蓄積されているか否かにかかわらず、運転者が車両に乗車する都度、乗車中つねに、蓄積タイミングにおいて特徴抽出部１２が抽出した表情筋ごとの特徴量を、運転者が基準表情をしているときの較正用データ１７として蓄積部１８に蓄積させてもよい。これにより、較正部１６は、運転者が車両に乗車してすぐに、運転者が過去に車両に乗車したときに蓄積部１８に蓄積された較正用データ１７を用いて、識別用データ１５を較正することができる。したがって、表情筋識別部１３は、運転者が車両に乗車してすぐに、較正後の識別用データ１５ａを用いて表情筋の動作有無を識別することができる。また、較正部１６は、蓄積部１８に蓄積された大量の較正用データ１７を用いて、識別用データ１５を較正することができるため、表情筋識別部１３の識別精度が向上する。

　以上のように、実施の形態２に係る表情認識装置１０は、蓄積部１８と、蓄積タイミング調整部１９とを備える。蓄積部１８は、対象者が基準表情をしているときの表情筋ごとの特徴量を蓄積する。蓄積タイミング調整部１９は、特徴抽出部１２が抽出した表情筋ごとの特徴量を、対象者が基準表情をしているときの表情筋ごとの特徴量（較正用データ１７）として蓄積部１８に蓄積させる蓄積タイミングを調整する。これにより、表情認識装置１０は、基準表情をしているときの表情筋ごとの較正用データ１７を蓄積することができ、事前に較正用データ１７を用意する必要がない。

実施の形態３．
　実施の形態３に係る表情認識装置１０は、表情認識の対象者が複数存在する場合を想定し、対象者ごとに較正用データ１７を蓄積する。表情認識の対象者が複数存在する場合とは、家族で１台の車両を共有する場合のように車両の運転席に座る乗員が複数人いる場合、及び、運転席の乗員と助手席の乗員の２人の表情を一度に認識する場合等である。

　図６は、実施の形態３に係る表情認識装置１０の構成例を示すブロック図である。実施の形態３に係る表情認識装置１０は、図４に示された実施の形態２の表情認識装置１０に対して個人認識部２５が追加された構成である。図６において図４と同一又は相当する部分は、同一の符号を付し説明を省略する。

　個人認識部２５は、顔検出部１１から顔領域の画像を取得し、取得した画像から対象者を認識する。個人認識部２５は、認識した対象者の情報を、較正部１６及び蓄積タイミング調整部１９へ出力する。

　蓄積タイミング調整部１９は、蓄積タイミングにおいて特徴抽出部１２が抽出する表情筋ごとの特徴量である較正用データ１７を、個人認識部２５が認識した対象者の情報と紐付けて、蓄積部１８に蓄積させる。

　較正部１６は、個人認識部２５が認識した対象者の情報に一致する対象者の情報が紐付けられている較正用データ１７を、蓄積部１８から取得し、蓄積部１８から取得した較正用データ１７を用いて識別用データ１５を較正する。

　以上のように、実施の形態３に係る表情認識装置１０は、対象者を認識する個人認識部２５を備える。蓄積部１８は、個人認識部２５が認識した対象者ごとに、対象者が基準表情をしているときの表情筋ごとの特徴量（較正用データ１７）を蓄積する。これにより、表情認識装置１０は、表情認識の対象者が複数存在する場合にも、個人差を考慮して対象者の表情を認識することができる。

　最後に、各実施の形態に係る表情認識装置１０のハードウェア構成を説明する。
　図７及び図８は、各実施の形態に係る表情認識装置１０のハードウェア構成例を示す図である。表情認識装置１０における識別用データ１５及び較正用データ１７は、メモリ１０２に記憶されている。表情認識装置１０における蓄積部１８の機能は、メモリ１０２により実現される。表情認識装置１０における顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、較正部１６、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の機能は、処理回路により実現される。即ち、表情認識装置１０は、上記機能を実現するための処理回路を備える。処理回路は、専用のハードウェアとしての処理回路１００であってもよいし、メモリ１０２に格納されるプログラムを実行するプロセッサ１０１であってもよい。

　図７に示されるように、処理回路が専用のハードウェアである場合、処理回路１００は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、又はこれらを組み合わせたものが該当する。顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、較正部１６、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の機能を複数の処理回路１００で実現してもよいし、各部の機能をまとめて１つの処理回路１００で実現してもよい。また、識別用データ１５及び較正用データ１７が、メモリ１０２ではなく、処理回路１００に記憶されていてもよい。

　図８に示されるように、処理回路がプロセッサ１０１である場合、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、較正部１６、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェア又はファームウェアはプログラムとして記述され、メモリ１０２に格納される。プロセッサ１０１は、メモリ１０２に格納されたプログラムを読みだして実行することにより、各部の機能を実現する。即ち、表情認識装置１０は、プロセッサ１０１により実行されるときに、図３等のフローチャートで示されるステップが結果的に実行されることになるプログラムを格納するためのメモリ１０２を備える。また、このプログラムは、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、較正部１６、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の手順又は方法をコンピュータに実行させるものであるとも言える。

　ここで、プロセッサ１０１とは、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、処理装置、演算装置、又はマイクロプロセッサ等のことである。
　メモリ１０２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ）、又はフラッシュメモリ等の不揮発性もしくは揮発性の半導体メモリであってもよいし、ハードディスク又はフレキシブルディスク等の磁気ディスクであってもよいし、ＣＤ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ）又はＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）等の光ディスクであってもよい。

　なお、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、較正部１６、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の機能について、一部を専用のハードウェアで実現し、一部をソフトウェア又はファームウェアで実現するようにしてもよい。このように、表情認識装置１０における処理回路は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって、上述の機能を実現することができる。

　なお、上記例では、顔検出部１１、特徴抽出部１２、表情筋識別部１３、表情認識部１４、識別用データ１５、較正部１６、較正用データ１７、蓄積部１８、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５の機能が、車両に搭載される表情認識装置１０に集約された構成であったが、ネットワーク上のサーバ装置、スマートフォン等の携帯端末、及び車載装置等に分散されていてもよい。例えば、無線通信を行う車載装置とサーバ装置とにより表情認識システムが構築される場合に、車載装置が、顔検出部１１、特徴抽出部１２、蓄積タイミング調整部１９、外光判定部２０、開眼度取得部２１、会話判定部２２、ストレス判定部２３、車両情報取得部２４、及び個人認識部２５を備え、サーバ装置が、表情筋識別部１３、表情認識部１４、識別用データ１５、較正部１６、較正用データ１７、及び蓄積部１８を備える。

　また、上記例では、表情認識装置１０が車両の乗員の表情を認識する用途を説明したが、この用途に限定されない。
　また、上記例では、対象者の表情認識のためにＦＡＣＳを用いたが、他の方法を用いてもよい。

　なお、本開示はその開示の範囲内において、各実施の形態の自由な組み合わせ、各実施の形態の任意の構成要素の変形、又は各実施の形態の任意の構成要素の省略が可能である。

　本開示に係る表情認識装置は、表情表出の個人差を考慮するようにしたので、対象者の表情を認識する表情認識装置に用いるのに適している。

　１　カメラ、２　覚醒度推定装置、３　警告装置、１０　表情認識装置、１１　顔検出部、１２　特徴抽出部、１３　表情筋識別部、１４　表情認識部、１５，１５ａ　識別用データ、１６　較正部、１７　較正用データ、１８　蓄積部、１９　蓄積タイミング調整部、２０　外光判定部、２１　開眼度取得部、２２　会話判定部、２３　ストレス判定部、２４　車両情報取得部、２５　個人認識部、３１　マイク、３２　ナビゲーション装置、３３　車外カメラ、３４　車載器、１００　処理回路、１０１　プロセッサ、１０２　メモリ。

Claims

　撮像画像から対象者の顔領域及び顔の各部位を検出する顔検出部と、
　前記顔検出部が検出した前記顔領域及び顔の各部位に基づき、表情筋ごとの特徴量を抽出する特徴抽出部と、
　前記特徴抽出部が抽出した前記表情筋ごとの特徴量と各識別用データとを比較することによって、前記表情筋ごとの動作有無を識別する表情筋識別部と、
　前記表情筋識別部が動作していると識別した表情筋の組み合わせに基づいて前記対象者の表情を認識する表情認識部と、
　前記対象者が基準表情をしているときの表情筋ごとの特徴量を用いて前記各識別用データを較正する較正部とを備える表情認識装置。
　前記対象者が基準表情をしているときの表情筋ごとの特徴量を蓄積する蓄積部と、
　前記特徴抽出部が抽出した前記表情筋ごとの特徴量を前記対象者が基準表情をしているときの表情筋ごとの特徴量として前記蓄積部に蓄積させる蓄積タイミングを調整する蓄積タイミング調整部とを備えることを特徴とする請求項１記載の表情認識装置。
　前記蓄積タイミング調整部は、前記顔検出部が前記顔領域の検出を開始した時点から予め定められた時間が経過した時点までを、前記蓄積タイミングとすることを特徴とする請求項２記載の表情認識装置。
　前記対象者が運転している車両の情報を取得する車両情報取得部を備え、
　前記蓄積タイミング調整部は、前記車両情報取得部が取得した前記車両の情報に基づき、前記車両の速度が予め定められた範囲内である場合、前記車両の加速度が予め定められた範囲内である場合、又は操舵角が予め定められた範囲内である場合のうちの少なくとも１つを、前記蓄積タイミングとすることを特徴とする請求項２記載の表情認識装置。
　前記対象者の顔に照射される外光の有無を判定する外光判定部を備え、
　前記蓄積タイミング調整部は、前記対象者の顔に外光が照射されている場合を、前記蓄積タイミングから除外することを特徴とする請求項２記載の表情認識装置。
　前記対象者の開眼度を取得する開眼度取得部を備え、
　前記蓄積タイミング調整部は、前記開眼度取得部が取得した前記開眼度に基づいて、前記対象者が閉眼している場合を、前記蓄積タイミングから除外することを特徴とする請求項２記載の表情認識装置。
　前記対象者が会話しているか否かを判定する会話判定部を備え、
　前記蓄積タイミング調整部は、前記対象者が会話している場合を、前記蓄積タイミングから除外することを特徴とする請求項２記載の表情認識装置。
　前記対象者のストレス状態であるか否かを判定するストレス判定部を備え、
　前記蓄積タイミング調整部は、前記対象者がストレス状態にある場合を、前記蓄積タイミングから除外することを特徴とする請求項２記載の表情認識装置。
　前記蓄積タイミング調整部は、前記対象者が車両に乗車する都度、前記蓄積タイミングにおいて前記特徴抽出部が抽出した前記表情筋ごとの特徴量を、前記対象者が基準表情をしているときの表情筋ごとの特徴量として前記蓄積部に蓄積させることを特徴とする請求項２記載の表情認識装置。
　前記対象者を認識する個人認識部を備え、
　前記蓄積部は、前記個人認識部が認識した対象者ごとに、対象者が基準表情をしているときの表情筋ごとの特徴量を蓄積することを特徴とする請求項９記載の表情認識装置。
　顔検出部が、撮像画像から対象者の顔領域及び顔の各部位を検出し、
　特徴抽出部が、前記顔検出部が検出した前記顔領域及び顔の各部位に基づき、表情筋ごとの特徴量を抽出し、
　表情筋識別部が、前記特徴抽出部が抽出した前記表情筋ごとの特徴量と各識別用データとを比較することによって、前記表情筋ごとの動作有無を識別し、
　表情認識部が、前記表情筋識別部が動作していると識別した前記表情筋の組み合わせに基づいて前記対象者の表情を認識する表情認識方法であって、
　較正部が、前記対象者が基準表情をしているときの表情筋ごとの特徴量を用いて前記各識別用データを較正することを特徴とする表情認識方法。