JP2007200127A - Expression image recording and retrieving device - Google Patents

Expression image recording and retrieving device Download PDF

Info

Publication number
JP2007200127A
JP2007200127A JP2006019408A JP2006019408A JP2007200127A JP 2007200127 A JP2007200127 A JP 2007200127A JP 2006019408 A JP2006019408 A JP 2006019408A JP 2006019408 A JP2006019408 A JP 2006019408A JP 2007200127 A JP2007200127 A JP 2007200127A
Authority
JP
Japan
Prior art keywords
face
information
image
facial expression
optical flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006019408A
Other languages
Japanese (ja)
Other versions
JP4774532B2 (en
Inventor
Lyons Michael
ライオンズ マイケル
Dominique Diegmann
ディークマン ドミニク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2006019408A priority Critical patent/JP4774532B2/en
Publication of JP2007200127A publication Critical patent/JP2007200127A/en
Application granted granted Critical
Publication of JP4774532B2 publication Critical patent/JP4774532B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an expression image recording and retrieving device capable of easily retrieving feelings of a human recorded for a long period of time. <P>SOLUTION: A video module program 1200 includes a face detection section 1208 which extracts a face area from a moving picture stored on a hard disk 1110 and an optical flow calculation section 1400 which calculates information for specifying movements of inner parts of the detected and extracted face on the image on the basis of an optical flow. An optical flow calculation section 1206 stores the moving picture of a face image together with calculated movement property data. Further, information on skin electric reflection is also stored. A retrieving module program 1400, on the other hand, includes a retrieval processing section 1404 which retrieves data on the basis of input information from a user 2 and a display control section 1402 which performs processing for displaying a face image corresponding to a specified frame in the moving picture of the face image of the retrieved person 4 to be examined on a display section 108. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この発明は、対象者の表情画像を長期にわたって記録し、かつ事後に検索するための表情画像記録検索装置の構成に関する。   The present invention relates to a configuration of a facial expression image recording / retrieval device for recording a facial expression image of a subject over a long period of time and retrieving it afterwards.

多くの国において、老齢人口の割合が増加しており、もはや自分のことを自分だけでできるという生活様式が困難になる人の割合も増加している。   In many countries, the proportion of the elderly population is increasing, and the proportion of people who have a lifestyle that makes it possible for them to do their own things is also increasing.

日本においては、そのような老人はしばしば家族とともに生活しており、毎日かなりの時間にわたって家族が注意を払うことを要している。このことは、介護者にとって、被介護者から目を離せない状態が継続することになり、介護者の大きな精神的・肉体的な負担となる。   In Japan, such elderly people often live with their families and require the family to pay attention for a considerable amount of time every day. This means that the caregiver will continue to be in a state of being able to keep an eye on the care recipient, which will be a great mental and physical burden on the caregiver.

最終的には、このような介護者の負担を軽減し、被介護者に向ける注意の一部を肩代わりしてくれるようなシステムが開発されることが望ましい。   Eventually, it is desirable to develop a system that reduces the burden on such caregivers and takes over some of the attention directed to the caregivers.

しかしながら、そもそも長期間にわたって被介護者の状態、たとえば、表情を記録し、この被介護者の表情の変化と、それに伴って向けられるべき注意との間の相関のデータを蓄積しない限り、上記のようなシステムの開発はむずかしい。   However, unless the caregiver's condition, for example, the facial expression is recorded over a long period of time and the data of the correlation between the change in the caregiver's facial expression and the attention that should be accompanied with it is accumulated, Development of such a system is difficult.

一方で、近年、撮像装置で撮影された画像から、撮像装置の周囲の物体の動き等を把握する方法が提案されている。その方法は、動画像のフレーム間でオプティカルフローを測定することにより、写っている物体の動きを把握するものである。   On the other hand, in recent years, a method for grasping the movement of an object around the imaging device from an image taken with the imaging device has been proposed. In this method, the movement of an object being captured is grasped by measuring an optical flow between frames of a moving image.

このような「オプティカルフロー」は、画像の各フレームに特徴照合法(パターンマッチング)や、時空間勾配法等を用いることにより求められる(たとえば、特許文献1、非特許文献1を参照)。   Such an “optical flow” is obtained by using a feature matching method (pattern matching), a spatiotemporal gradient method, or the like for each frame of an image (see, for example, Patent Document 1 and Non-Patent Document 1).

また、撮影された画像内での動き検出だけでなく、オプティカルフローを用いて、人間の表情と関連づける試みも報告されている(たとえば、非特許文献2を参照)。
特開2004−355082号公報 Barrron, J. L., Fleet, D. J., Beauchemin, S.S.: Performance of optical flow techniques. The International Journal of Computer Vision, 12(1994)pp.43-77 Lyons, M.J., Funk, M., Kuwabara, K. : Segment and Browse: A Strategy for Supporting Human Monitoring of Facial Expression Behaviour, INTERACT 2005 (LNCS 3585), pp. 1120-1123 (2005).
In addition to motion detection in a photographed image, attempts have been reported to relate to human facial expressions using optical flow (see, for example, Non-Patent Document 2).
JP 2004-355082 A Barrron, JL, Fleet, DJ, Beauchemin, SS: Performance of optical flow techniques.The International Journal of Computer Vision, 12 (1994) pp.43-77 Lyons, MJ, Funk, M., Kuwabara, K .: Segment and Browse: A Strategy for Supporting Human Monitoring of Facial Expression Behavior, INTERACT 2005 (LNCS 3585), pp. 1120-1123 (2005).

しかしながら、顔画像の変化をより客観的に被験者の心理状態と結びつけて観測するための方法は、必ずしも明らかではなかった。   However, a method for observing a change in face image more objectively in connection with the psychological state of the subject has not always been clear.

しかも、上述したようなシステムを開発するのであれば、長期間にわたって記録した人間の表情を、いかにして簡単に検索できるようにするかが問題となる。つまり、より開発を進めるには、上記のような介護を受けている人の感情の状態を評価することを助ける方法を開発することが必要である。   Moreover, if the system as described above is developed, there is a problem of how to easily search for human facial expressions recorded over a long period of time. In other words, in order to proceed with further development, it is necessary to develop a method for helping to evaluate the emotional state of the person receiving care as described above.

本発明は、このような問題点を解決するためになされたものであって、その目的は、長期間にわたって記録された人間の表情を容易に検索することが可能な表情画像記録検索装置を提供することである。   The present invention has been made to solve such problems, and an object thereof is to provide a facial expression image recording / retrieval device capable of easily retrieving a human facial expression recorded over a long period of time. It is to be.

この発明のある局面に従うと、表情画像記録検索装置であって、被験者の顔画像を含む対象画像領域についての動画像データを獲得する撮影手段と、被験者の皮膚電気反射を測定するための測定手段と、動画像データを格納するための記憶装置と、対象画像領域内において、顔を検出する顔検出手段と、検出された顔に対応する検出領域において、単位領域ごとに動きベクトルを検出し、動きベクトルと検出領域に対応する顔画像データと顔画像データを時間軸上で特定するための識別情報とを関連づけて記憶装置に格納する動き検出手段と、顔画像データと動きベクトルに関連する情報と皮膚電気反射に対応する情報を一覧表示する表示制御手段とを備え、表示制御手段は、画像特定情報により特定される識別情報に応じて、対応する顔画像データと動きベクトルに関連する情報と皮膚電気反射に対応する情報に、一覧表示を更新する。   According to one aspect of the present invention, a facial expression image recording / retrieval device, which is a photographing unit that acquires moving image data for a target image area including a face image of a subject, and a measuring unit that measures the skin electrical reflection of the subject A motion vector for each unit region in a storage device for storing moving image data, face detection means for detecting a face in the target image region, and a detection region corresponding to the detected face, Motion detection means for associating the face vector data corresponding to the motion vector and the detection area and identification information for specifying the face image data on the time axis and storing them in the storage device, and information relating to the face image data and the motion vector And display control means for displaying a list of information corresponding to the skin electroreflection, the display control means corresponding to the identification information specified by the image specifying information, The information corresponding to the information and electrodermal reflections associated with the data and the motion vector, and updates the list.

好ましくは、ユーザからの画像特定情報を受ける入力手段をさらに備える。
好ましくは、動き検出手段は、検出領域に対応する顔画像データにおいて格子点上の各点についてのオプティカルフローを、異なる複数の速度レベルで算出するオプティカルフロー算出手段を含み、表情画像記録検索装置は、異なる複数の速度レベルに対応したオプティカルフローに基づいて、動きベクトルに関連する情報として、被験者の頭の運動に相当する情報と、被験者の表情の動きに相当する情報とを抽出する演算手段をさらに備える。
Preferably, an input means for receiving image specifying information from the user is further provided.
Preferably, the motion detection means includes optical flow calculation means for calculating the optical flow for each point on the grid point in the face image data corresponding to the detection area at a plurality of different speed levels, and the facial expression image record search device includes: Calculating means for extracting information corresponding to the motion of the subject's head and information corresponding to the movement of the facial expression of the subject as information related to the motion vector based on optical flows corresponding to a plurality of different speed levels; Further prepare.

好ましくは、演算手段は、さらに、被験者の頭の運動の大きさと被験者の表情の動きの大きさと皮膚電気反射の大きさの少なくとも1に応じて単調に増加する重要性指標を算出し、表示制御手段は、重要性指標を一覧表示において表示する。   Preferably, the calculation means further calculates an importance index that monotonously increases in accordance with at least one of the magnitude of the subject's head movement, the magnitude of the subject's facial expression, and the magnitude of the skin electrical reflection, and performs display control. The means displays the importance index in a list display.

(本発明の概要)
表情は人間の心的な状態の重要な情報を提供するものである。以下に説明するように、本発明は、被験者(被介護者)の感情を判断するという点において、表情のデータを文脈上の情報と組合せることにより、表情から人間の感情を判断するという人間の能力を補強するようなシステムである。
(Outline of the present invention)
Facial expressions provide important information about human mental state. As described below, the present invention is a human who judges human emotions from facial expressions by combining facial expression data with contextual information in terms of judging the emotions of subjects (caregivers). It is a system that reinforces the ability of

つまり、本発明の表情画像記録検索装置は、画像入力インタフェースを有するパーソナルコンピュータまたはワークステーション等のコンピュータと、このコンピュータ上で実行されるソフトウェアと、カメラなどの撮像装置と、検索情報を入力するための入力装置と、検索結果を表示するための表示装置により実現されるものであって、人物の顔の映像から、顔部分を抽出するとともに、この顔の内部の動きを検出し、さらに、人間の皮膚抵抗の変化も併せて検出して、この動き情報と皮膚抵抗の変化と適宜入力された注釈情報とを関連づけて保存すると共に、この動き情報や注釈情報を手がかりとして、対応する顔画像を検索することを可能とするものである。   That is, the facial expression image recording / retrieval apparatus of the present invention is for inputting a search information, a computer such as a personal computer or a workstation having an image input interface, software executed on the computer, an imaging apparatus such as a camera, and the like. And a display device for displaying a search result. The face portion is extracted from the image of the face of the person, and the movement of the face is detected. The change in skin resistance is also detected, and the movement information, the change in skin resistance and the input annotation information are stored in association with each other, and the corresponding face image is obtained using the movement information and the annotation information as a clue. It is possible to search.

なお、検索情報については、ユーザと対話的に検索を進めるために、上述のとおり入力装置からその都度入力される構成としてもよいし、検索情報自体は所定のものであって、必ずしもその都度入力される情報でなくてもよい。あるいは、表情画像記録検索装置が他のシステムからの照会に応じて検索結果を出力するのであれば、表情画像記録検索装置自体には、ユーザからの検索情報を受け付ける入力装置が設けられていなくてもよい。   The search information may be input each time from the input device as described above in order to proceed with the search interactively with the user. The search information itself is predetermined and is not necessarily input each time. It does not have to be information to be made. Alternatively, if the facial expression image recording / retrieval device outputs a retrieval result in response to an inquiry from another system, the facial expression image recording / retrieval device itself is not provided with an input device that accepts retrieval information from the user. Also good.

なお、コンピュータについては、上述のような汎用コンピュータのみならず、専用機器に組み込まれた組込型のコンピュータであってもかまわない。   The computer is not limited to the general-purpose computer as described above, but may be a built-in computer incorporated in a dedicated device.

[ハードウェア構成]
以下、本発明の実施の形態にかかる表情画像記録検索装置について説明する。
[Hardware configuration]
Hereinafter, a facial expression image recording / retrieval device according to an embodiment of the present invention will be described.

図1は、本発明の表情画像記録検索装置100の構成を示す概略ブロック図である。
図1を参照して、この表情画像記録検索装置100は、パーソナルコンピュータなどのコンピュータ110と、コンピュータ110に接続され、ユーザ2への情報を表示するための表示装置としてのディスプレイ108と、同じくコンピュータ110に接続され、ユーザ2からの指示や情報を入力するための入力装置としてのキーボード106と、被験者4の顔を含む画像を取込むためのカメラ102と、被験者4の皮膚抵抗の変化を検出し皮膚電気反射(Galvanic Skin Response(GSR))を検知するために被験者4の皮膚表面に接触された電極104とを含む。なお、入力装置として、マウスや、タブレットとペンなどをさらに備える構成としてもよい。
FIG. 1 is a schematic block diagram showing the configuration of a facial expression image recording / retrieval apparatus 100 according to the present invention.
Referring to FIG. 1, a facial expression image recording / retrieval device 100 includes a computer 110 such as a personal computer, a display 108 as a display device connected to the computer 110 and displaying information to the user 2, and the computer. 110, a keyboard 106 as an input device for inputting instructions and information from the user 2, a camera 102 for capturing an image including the face of the subject 4, and a change in skin resistance of the subject 4 are detected. And an electrode 104 in contact with the skin surface of the subject 4 in order to detect Galvanic Skin Response (GSR). The input device may further include a mouse, a tablet, and a pen.

また、この実施の形態のシステムでは、カメラ102としては、たとえば、CCD(固体撮像素子)を含むビデオカメラを用いて、画像データをデジタルデータとしてキャプチャする。   In the system of this embodiment, for example, a video camera including a CCD (solid-state imaging device) is used as the camera 102 to capture image data as digital data.

なお、図示しないが、コンピュータ110には、CD−ROM(Compact Disc Read-Only Memory)ドライブなど、外部の記録媒体からのデータを取り込むための装置が設けられているものとする。   Although not shown, it is assumed that the computer 110 is provided with a device for taking in data from an external recording medium such as a CD-ROM (Compact Disc Read-Only Memory) drive.

さらに、図1を参照して、コンピュータ110は、バスBSそれぞれに接続された、CPU(Central Processing Unit)1104と、ROM(Read Only Memory)1106と、RAM(Random Access Memory)1108と、ハードディスク1110と、カメラ102からの画像を取り込み、電極104により被験者4の皮膚抵抗を測定し、あるいは入力装置106からの信号を受け取るなどデータを授受するためのインタフェース部1102とを含んでいる。   Further, referring to FIG. 1, a computer 110 includes a CPU (Central Processing Unit) 1104, a ROM (Read Only Memory) 1106, a RAM (Random Access Memory) 1108, and a hard disk 1110 connected to each bus BS. And an interface unit 1102 for transferring data such as capturing an image from the camera 102, measuring the skin resistance of the subject 4 with the electrode 104, or receiving a signal from the input device 106.

既に述べたように、表情画像記録検索装置100として機能する部分の主要部は、コンピュータハードウェアと、CPU1104により実行されるソフトウェアとにより実現される。一般的にこうしたソフトウェアはCD−ROM等の記憶媒体に格納されて流通し、CD−ROMドライブ等により記憶媒体から読取られてハードディスク1110に一旦格納される。または、当該装置がネットワークに接続されている場合には、ネットワーク上のサーバから一旦ハードディスク1110にコピーされる。そうしてさらにハードディスク1110からRAM1108に読出されてCPU1104により実行される。なお、ネットワーク接続されている場合には、たとえば、ハードディスク1110に格納することなくRAM1108に直接ロードして実行するようにしてもよい。   As described above, the main part of the part that functions as the facial expression image recording / retrieval device 100 is realized by computer hardware and software executed by the CPU 1104. Generally, such software is stored and distributed in a storage medium such as a CD-ROM, read from the storage medium by a CD-ROM drive or the like, and temporarily stored in the hard disk 1110. Alternatively, when the device is connected to the network, it is temporarily copied from the server on the network to the hard disk 1110. Then, it is further read from the hard disk 1110 to the RAM 1108 and executed by the CPU 1104. In the case of being connected to a network, for example, the program may be directly loaded into the RAM 1108 without being stored in the hard disk 1110 and executed.

図1に示したコンピュータのハードウェア自体およびその動作原理は一般的なものである。したがって、本発明の最も本質的な部分は、CD−ROMや、ハードディスク1110等の記憶媒体に記憶されたソフトウェアである。   The computer hardware itself shown in FIG. 1 and its operating principle are general. Therefore, the most essential part of the present invention is software stored in a storage medium such as a CD-ROM or a hard disk 1110.

なお、最近の一般的傾向として、コンピュータのオペレーティングシステムの一部として様々なプログラムモジュールを用意しておき、アプリケーションプログラムはこれらモジュールを所定の配列で必要な時に呼び出して処理を進める方式が一般的である。そうした場合、当該表情画像記録検索装置を実現するためのソフトウェア自体にはそうしたモジュールは含まれず、当該コンピュータでオペレーティングシステムと協働してはじめて表情画像記録検索装置が実現することになる。しかし、一般的なプラットフォームを使用する限り、そうしたモジュールまで含ませたソフトウェアを流通させる必要はなく、それらモジュールを含まないソフトウェア自体およびそれらソフトウェアを記録した記録媒体(およびそれらソフトウェアがネットワーク上を流通する場合のデータ信号)が実施の形態を構成すると考えることができる。   As a recent general trend, various program modules are prepared as part of a computer operating system, and an application program generally calls a module in a predetermined arrangement to advance processing when necessary. is there. In such a case, the software itself for realizing the facial expression image recording / retrieval apparatus does not include such a module, and the facial expression image recording / retrieval apparatus is implemented only in cooperation with the operating system on the computer. However, as long as a general platform is used, it is not necessary to distribute software including such modules. The software itself that does not include these modules and the recording medium that records the software (and the software distributes on the network). Data signal) can be considered to constitute the embodiment.

[ソフトウェア構成]
図2は、図1に示した表情画像記録検索装置100上で動作するソフトウェアの構成を説明するための機能ブロック図である。
Software configuration
FIG. 2 is a functional block diagram for explaining the configuration of software that operates on the facial expression image recording / retrieval apparatus 100 shown in FIG.

図2においては、コンピュータ110上で動作するプログラムは、映像モジュールプログラム1200と、キャプチャされてハードディスク1110に格納された動画像から所望の顔画像を検索するための検索モジュールプログラム1400とを含む。なお、この検索モジュールプログラム1400は、ブラウザベースのプログラムとすることができる。   In FIG. 2, the programs operating on the computer 110 include a video module program 1200 and a search module program 1400 for searching for a desired face image from moving images captured and stored in the hard disk 1110. The search module program 1400 can be a browser-based program.

以下に説明するとおり、表情画像記録検索装置100は、表情を介した人間の心的状態の長期的なモニタを容易にするための支援システムとして機能する。動画像が実時間で処理されて、顔の領域が分離され、表情が記録される。顔の動きを解釈するために、オプティカルフロー法が使用される。   As will be described below, the facial expression image recording / retrieval apparatus 100 functions as a support system for facilitating long-term monitoring of a human mental state via facial expressions. The moving image is processed in real time to separate the facial region and record the facial expression. An optical flow method is used to interpret the movement of the face.

映像モジュールプログラム1200は、対象となる人物とその周りの環境も含めた動画像をカメラ102から獲得する画像キャプチャ部1202と、キャプチャされた動画像をハードディスク1110に格納するための画像データ記録処理部1204とを含む。画像キャプチャ部1202は、必要に応じて、カメラ102から入力されるデジタル動画像データを保存に適した画像フォーマットへとフォーマット変換を行なう。   The video module program 1200 includes an image capture unit 1202 that acquires a moving image including a target person and surrounding environment from the camera 102, and an image data recording processing unit that stores the captured moving image in the hard disk 1110. 1204. The image capture unit 1202 converts the digital moving image data input from the camera 102 into an image format suitable for storage as necessary.

映像モジュールプログラム1200は、さらに、ハードディスク1110に格納された動画像から顔領域を抽出する顔検出部1208と、オプティカルフローに基づいて、抽出された顔自体または顔の内部の画像上の動きを特定するための情報(たとえば、画像内の動きベクトルの分布)の計算を行なうオプティカルフロー算出部1206とを含み、オプティカルフロー算出部1206は、顔画像の動画像データを算出された動きの属性データとともにハードディスク1110に格納する。   The video module program 1200 further identifies a face detection unit 1208 that extracts a face area from a moving image stored in the hard disk 1110, and a motion on the extracted face itself or an image inside the face based on the optical flow. And an optical flow calculation unit 1206 for calculating information (for example, distribution of motion vectors in the image). The optical flow calculation unit 1206 includes moving image data of a face image together with calculated motion attribute data. Store in hard disk 1110.

さらに、GSRデータ記録処理部1304は、電極104を介してインタフェース部1102において測定された皮膚抵抗に相当するGSRのデータを、動画像データとともに、ハードディスク1110に格納する。GSRのデータは、ゆっくりと変化する背景信号を除去するために、GSRデータ記録処理部1304においてフィルタ処理される。このGSRデータの変化は、被験者4が、ストレスを感じたり、何かに興味を感じたり、何かに興奮したりというような心理状態の変化したタイミングを示している。   Further, the GSR data recording processing unit 1304 stores GSR data corresponding to the skin resistance measured by the interface unit 1102 via the electrode 104 in the hard disk 1110 together with the moving image data. The GSR data is filtered in the GSR data recording processing unit 1304 in order to remove the slowly changing background signal. This change in the GSR data indicates the timing at which the subject 4 has changed psychological state such as feeling stress, being interested in something, or being excited about something.

すなわち、顔画像の動画像データは、後により詳しく説明するようにして得られる、以下の3つの属性データと時間的に関連づけられながら、ハードディスク1110に格納される。   That is, the moving image data of the face image is stored in the hard disk 1110 while being temporally correlated with the following three attribute data obtained as described in detail later.

1)頭の剛体的な動きの指標(動きの方向、大きさ)
2)表情や発話に起因する顔内部の動きの指標
3)GSRデータ
一方、検索モジュールプログラム1400は、ユーザ(たとえば、介護者)2からの入力情報に基づいて、ハードディスク1110内の顔画像データを検索する検索処理部1404と、検索された被験者(たとえば、被介護者)4の顔画像の動画像のうち特定のフレームに対応する顔画像を表示部108に表示させる処理を行なう表示制御部1402とを含む。
1) Index of rigid head movement (direction and size of movement)
2) Index of movement inside the face due to facial expression or speech 3) GSR data On the other hand, the search module program 1400 obtains facial image data in the hard disk 1110 based on input information from the user (for example, caregiver) 2. A search processing unit 1404 for searching, and a display control unit 1402 for performing a process of causing the display unit 108 to display a face image corresponding to a specific frame among the moving images of the face image of the searched subject (for example, a cared person) 4. Including.

なお、後に説明するように、表示制御部1402に対して入力部106から入力された被験者4の心的な状態を表す注釈(コメント情報)を顔画像の動画像と関連づけて、ハードディスク1110に格納させることもできる。ここで、「心的な状態」とは、たとえば、「笑っている状態」「落ち込んでいる状態」「怒っている状態」「興奮状態」などのように、被験者4の感情の状態を表す情報である。   As will be described later, annotations (comment information) indicating the mental state of the subject 4 input from the input unit 106 to the display control unit 1402 are stored in the hard disk 1110 in association with the moving image of the face image. It can also be made. Here, the “mental state” is information representing the emotional state of the subject 4 such as “smiling state”, “depressed state”, “angry state”, “excited state”, and the like. It is.

(映像モジュールプログラム1200)
カメラ102からの動画像データの入力は、オプティカルフロー処理の演算量の削減や、ハードディスク1110へ格納するためのデータ容量の削減のために、たとえば、640×480画素から320×240画素に間引かれる。
(Video module program 1200)
Moving image data input from the camera 102 is thinned from, for example, 640 × 480 pixels to 320 × 240 pixels in order to reduce the amount of calculation for optical flow processing and the data capacity for storage in the hard disk 1110. It is burned.

周知の顔の検出アルゴリズムにより顔検出部1208が、カメラ102の視野の中に顔が存在するかどうかを決定し、それがどこに存在しているかも決定する。特に限定されないが、この顔検出のアルゴリズムは、頭の画像の中心の位置にくるように、顔に固定されたアスペクト比の矩形領域を登録する。たとえば、約30°まで平面から回転している顔も正確に検出することができ、同様に、画像平面内において約30°傾いた状態の顔も正確に検出することができる。顔画像はスケールされ、30フレーム/秒までのレートで、各フレームに対応する顔画像が、タイムスタンプとともに保存される。顔のサイズおよび位置を正規化し、複雑な背景から顔を分離することで、顔のデータをより容易にブラウズすることが可能となる。なお、ここではタイムスタンプを用いることとしたが、動画像中の顔画像に対応するフレームを時系列中で特定可能な識別情報であれば、タイムスタンプには、かならずしも限定されない。   A face detection unit 1208 determines whether or not a face exists in the field of view of the camera 102 using a well-known face detection algorithm, and also determines where it exists. Although not particularly limited, this face detection algorithm registers a rectangular area having an aspect ratio fixed to the face so as to be positioned at the center of the head image. For example, a face rotating from a plane up to about 30 ° can be accurately detected, and similarly, a face inclined at about 30 ° in the image plane can also be accurately detected. The face image is scaled and the face image corresponding to each frame is stored with a time stamp at a rate of up to 30 frames / second. By normalizing the size and position of the face and separating the face from complex backgrounds, it is possible to more easily browse face data. Although the time stamp is used here, the time stamp is not necessarily limited as long as it is identification information that can identify the frame corresponding to the face image in the moving image in the time series.

オプティカルフロー算出部1206において、画像のオプティカルフロー領域が、さまざまなビデオフレーム間での動きを検出する。検出された動きベクトルは、顔の内部領域全体にわたる動きベクトルの平均とともに、顔画像の動画像データと関連づけてハードディスク1110に保存される。   In the optical flow calculation unit 1206, the optical flow region of the image detects motion between various video frames. The detected motion vector is stored in the hard disk 1110 in association with the moving image data of the face image together with the average of the motion vectors over the entire internal area of the face.

オプティカルフローは、視覚的なシーンにおいて、動きにより、画像領域がずれることを測定する。固定されたカメラと近似的に一定な照明に対しては、オプティカルフローのフィールドは、局所的な速度を計っていることになる。オプティカルフローを計算するために用いる方法としては、特に限定されないが、非特許文献1に記載されている、ブロックマッチングあるいはブロック相関として知られているものを使用することが可能である。   Optical flow measures the shift in image area due to motion in a visual scene. For a fixed camera and approximately constant illumination, the field of optical flow will be local. The method used for calculating the optical flow is not particularly limited, but a method known as block matching or block correlation described in Non-Patent Document 1 can be used.

ブロック相関技術を用いることで、ある画像フレームの領域が、それに続くフレーム中の全く同じサイズの領域にマッチングされる。このようなマッチングは、画像間の距離(たとえば、各画素の輝度の差の絶対和または自乗和など)の大きさを最小化することによって決定される。たとえば、15fpsのフレームレートのオプティカルフローフィールドにおいては、顔の内部の動作による特徴量の変位は、各時間ステップに対して数ピクセル程度になる。   By using block correlation techniques, a region of an image frame is matched to a region of exactly the same size in the following frame. Such matching is determined by minimizing the size of the distance between images (for example, the absolute sum or the sum of squares of the luminance difference of each pixel). For example, in an optical flow field with a frame rate of 15 fps, the displacement of the feature amount due to the motion inside the face is about several pixels for each time step.

速度として動きを計測するために、たとえば、1、3、5、7および10ビデオフレームだけ離れたフレーム間でのオプティカルフローフィールドを計算する。オプティカルフローの値は、さらに、顔検知モジュールによって検出された顔の内部部分に対応している各領域について、対応するフレーム間について平均処理がされる。   In order to measure motion as velocity, for example, the optical flow field between frames separated by 1, 3, 5, 7 and 10 video frames is calculated. The optical flow value is further averaged between corresponding frames for each area corresponding to the internal part of the face detected by the face detection module.

図3は、顔画像について検出されたオプティカルフローのフィールドの例を示す図である。   FIG. 3 is a diagram illustrating an example of an optical flow field detected for a face image.

顔の片側をこわばらせる動きをした場合に、顔画像上の格子点(これをフィールドと呼ぶ)の各々において、動きベクトルが白い矢印で示されている。   In the case of a movement that stiffens one side of the face, the motion vector is indicated by a white arrow at each of the lattice points (referred to as a field) on the face image.

顔のこわばりの途中や、表情を緩める途中のように動きのある場合には、顔の各部の動きに応じて、動きベクトルが現れているのがわかる。   It can be seen that a motion vector appears in accordance with the movement of each part of the face when there is movement such as during the stiffness of the face or during the relaxation of the facial expression.

(検索モジュールプログラム1400)
図4は、検索モジュールプログラム1400のブラウザ表示のスクリーンショットを示す図である。
(Search module program 1400)
FIG. 4 is a view showing a screen shot of the browser display of the search module program 1400.

このモジュールの表示の構成要素は、選択された時間における顔画像の位置と大きさについて正規化された表示200と、時・分・秒を表示するための時計表示202と、ある特定の日の画像を選択するためのカレンダー204と、タイムラインの領域を選択するための時間解像度のズームコントロール表示206と、時間をマウスからの操作によりスクロールするためのタイムライン208と、表情や発話に起因する顔内部の動きの指標の要素(所定速度のオプティカルフローの大きさに対応:non-rigid motion:指標1)を表示する領域210と、頭の剛体的な動きの指標の要素(動きの大きさ:rigid motion:指標2)を表示する領域212と、皮膚導電率(指標3)を表示する領域214と、これら3つの指標から得られる重要性指標とを表示する領域216と、GSR波形を表示する領域218と、ユーザの注釈(コメント)を追加して表示するための表示領域220とである。なお、ここで、「重要性指標」とは、指標1、指標2、指標3のうちの少なくとも1つについて単調増加する関数で定義され、CPU1104により算出される指標である。さらに、ここで、「少なくとも1つについて単調増加する関数」の意味は、たとえば、指標1、指標2、指標3の全ての指標についての関数である必要はないものの、たとえば、指標1、指標2、指標3のうちの指標2および指標3に依存する関数として重要性指標が定義されるときには、この指標2および指標3のいずれの一方に注目した場合にも単調増加する関数である、ということである。そして、たとえば、指標1、指標2および指標3の線形結合を重要性指標として定義する場合には、この値が所定のしきい値を超えたときには、検索モジュールプログラム1400は、被験者4に重要な変化があったものと判断することが可能である。また、ユーザ2は、重要性指標が、あるしきい値以上である時刻に対応する顔画像を検索することもできる。   The display components of this module include a display 200 normalized for the position and size of the face image at a selected time, a clock display 202 for displaying hours, minutes and seconds, and a specific day A calendar 204 for selecting an image, a time-resolution zoom control display 206 for selecting a timeline area, a timeline 208 for scrolling time by an operation from a mouse, and an expression or utterance An area 210 for displaying a movement index element (corresponding to the magnitude of an optical flow at a predetermined speed: non-rigid motion: index 1) and a rigid head movement index element (motion magnitude) : Rigid motion: area 212 for displaying index 2), area 214 for displaying skin conductivity (index 3), and importance index obtained from these three indices are displayed. An area 216 for displaying a GSR waveform, and a display area 220 for adding and displaying user comments (comments). Here, the “importance index” is an index that is defined by a function that monotonically increases for at least one of index 1, index 2, and index 3, and is calculated by the CPU 1104. Further, here, the meaning of “a function that increases monotonously for at least one” does not have to be a function for all the indices of index 1, index 2, and index 3, for example, index 1, index 2, and the like. When the importance index is defined as a function that depends on index 2 and index 3 of index 3, it is a function that monotonically increases when attention is paid to either index 2 or index 3. It is. For example, when the linear combination of the index 1, the index 2, and the index 3 is defined as the importance index, when this value exceeds a predetermined threshold, the search module program 1400 is important for the subject 4. It can be determined that there has been a change. The user 2 can also search for a face image corresponding to a time when the importance index is greater than or equal to a certain threshold value.

ユーザは日付を選択しそれから、時間範囲をズームして、タイムラインの範囲を選択する。タイムラインをスクロールすることで、各時点の顔画像が表示される。このとき、タイムラインのスクロールに応じて、一覧表示される領域210〜220の表示内容も対応する時点のデータの表示に切り替わる。たとえば、重要性指標をその値についての所定の段階に応じて色分けして表示しておき、また、他の指標1〜3についても同様に個別の色分け表示をしておくこととすれば、ユーザ2は、タイムラインを移動させながら、現在表示されている時点で、被験者4の心理状態の変化が起こったか否かを容易に判断できる。   The user selects a date, then zooms in on the time range and selects a timeline range. By scrolling the timeline, face images at each time point are displayed. At this time, in accordance with the scrolling of the timeline, the display contents of the areas 210 to 220 displayed in a list are also switched to the display of the data at the corresponding time. For example, if the importance index is color-coded according to a predetermined stage for its value, and the other indices 1 to 3 are also individually color-coded and displayed, 2 can easily determine whether or not a change in the psychological state of the subject 4 has occurred at the time of the current display while moving the timeline.

オプティカルフロー算出部1206において算出されるオプティカルフロー値の平均において、上述した1、3、5、7および10ビデオフレームの間隔において平均処理により求められた動きベクトルの大きさである5つの速度レベルについて、動作速度の分布が求められる。このため、そのような動きが大きく顔全体(頭)が剛体的に動いたことによる動作に対応しているものなのか、あるいは表情や会話に対応するもっと微妙な動作に対応しているものであるかが検知できる。つまり、顔全体が動いているときは、5つの動きベクトルのいずれにもピークが現れるのに対し、顔の内部の動きであれば、ビデオフレーム間隔に依存して、ピークの存在する速度レベルと存在しない速度レベルとが混在するというように、顔の動きの解釈をCPU1104が行なうことができる。   Regarding the average of the optical flow values calculated by the optical flow calculation unit 1206, five velocity levels that are the magnitudes of the motion vectors obtained by the averaging process at the intervals of the above-described 1, 3, 5, 7, and 10 video frames. The distribution of operating speed is required. For this reason, it may correspond to the movement due to such a large movement and the whole face (head) moving rigidly, or it corresponds to a more subtle movement corresponding to facial expressions and conversation. It can be detected. In other words, when the entire face is moving, a peak appears in any of the five motion vectors, whereas if it is a movement inside the face, the speed level at which the peak exists depends on the video frame interval. The CPU 1104 can interpret the movement of the face so that a speed level that does not exist is mixed.

さらに、ユーザ2は、入力装置106から、簡単な文字による注釈を表示中の顔画像データに対して加えることができ、このような注釈のデータも顔画像データと関連付けられてハードディスク1110に格納される。   Further, the user 2 can add a simple text annotation to the displayed face image data from the input device 106, and the annotation data is also stored in the hard disk 1110 in association with the face image data. The

以上のとおり、本発明によれば、長期間にわたって記録された人間の表情を容易に検索することが可能となる。   As described above, according to the present invention, it is possible to easily search for human facial expressions recorded over a long period of time.

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

本発明の表情画像記録検索装置100の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the facial expression image record search apparatus 100 of this invention. 表情画像記録検索装置100上で動作するソフトウェアの構成を説明するための機能ブロック図である。4 is a functional block diagram for explaining a configuration of software that operates on the facial expression image recording / retrieval apparatus 100. FIG. 顔画像について検出されたオプティカルフローのフィールドの例を示す図である。It is a figure which shows the example of the field of the optical flow detected about the face image. 検索モジュールプログラム1400のブラウザ表示のスクリーンショットを示す図である。It is a figure which shows the screen shot of the browser display of the search module program 1400. FIG.

符号の説明Explanation of symbols

2 ユーザ、4 被験者、100 表情画像記録検索装置、102 カメラ、106 キーボード、108 ディスプレイ、110 コンピュータ、1102 インタフェース部、1104 CPU、1106 ROM、1108 RAM、1110 ハードディスク、1200 映像モジュールプログラム、1202 キャプチャ部、1204 画像データ記録処理部、1206 オプティカルフロー算出部、1208 顔検出部、1400 検索モジュールプログラム、1402 表示制御部、1404 検索処理部。   2 users, 4 subjects, 100 facial expression image record retrieval device, 102 camera, 106 keyboard, 108 display, 110 computer, 1102 interface unit, 1104 CPU, 1106 ROM, 1108 RAM, 1110 hard disk, 1200 video module program, 1202 capture unit, 1204 Image data recording processing unit, 1206 Optical flow calculation unit, 1208 Face detection unit, 1400 Search module program, 1402 Display control unit, 1404 Search processing unit

Claims (4)

被験者の顔画像を含む対象画像領域についての動画像データを獲得する撮影手段と、
前記被験者の皮膚電気反射を測定するための測定手段と、
前記動画像データを格納するための記憶装置と、
前記対象画像領域内において、顔を検出する顔検出手段と、
前記検出された顔に対応する検出領域において、単位領域ごとに動きベクトルを検出し、前記動きベクトルと前記検出領域に対応する顔画像データと前記顔画像データを時間軸上で特定するための識別情報とを関連づけて前記記憶装置に格納する動き検出手段と、
前記顔画像データと前記動きベクトルに関連する情報と前記皮膚電気反射に対応する情報を一覧表示する表示制御手段とを備え、
前記表示制御手段は、画像特定情報により特定される前記識別情報に応じて、対応する前記顔画像データと前記動きベクトルに関連する情報と前記皮膚電気反射に対応する情報に、前記一覧表示を更新する、表情画像記録検索装置。
Photographing means for acquiring moving image data about a target image area including a face image of a subject;
Measuring means for measuring the skin electrical reflex of the subject;
A storage device for storing the moving image data;
Face detection means for detecting a face in the target image region;
Identification for detecting a motion vector for each unit region in the detection region corresponding to the detected face, and specifying the motion vector, the face image data corresponding to the detection region, and the face image data on the time axis Motion detection means for associating information and storing the information in the storage device;
Display control means for displaying a list of information relating to the face image data, the motion vector, and information corresponding to the electrodermal reflection,
The display control means updates the list display to the corresponding face image data, information related to the motion vector, and information corresponding to the skin electrical reflection according to the identification information specified by the image specifying information. A facial expression image record retrieval device.
ユーザからの前記画像特定情報を受ける入力手段をさらに備える、請求項1記載の表情画像記録検索装置。   The facial expression image recording / retrieval apparatus according to claim 1, further comprising input means for receiving the image specifying information from a user. 前記動き検出手段は、前記検出領域に対応する顔画像データにおいて格子点上の各点についてのオプティカルフローを、異なる複数の速度レベルで算出するオプティカルフロー算出手段を含み、
前記異なる複数の速度レベルに対応した前記オプティカルフローに基づいて、前記動きベクトルに関連する情報として、前記被験者の頭の運動に相当する情報と、前記被験者の表情の動きに相当する情報とを抽出する演算手段をさらに備える、請求項1記載の表情画像記録検索装置。
The motion detection means includes optical flow calculation means for calculating an optical flow for each point on a lattice point in the face image data corresponding to the detection area at a plurality of different speed levels,
Based on the optical flow corresponding to the plurality of different speed levels, as information related to the motion vector, information corresponding to the motion of the subject's head and information corresponding to the motion of the subject's facial expression are extracted. The facial expression image recording / retrieval apparatus according to claim 1, further comprising an arithmetic unit that performs the operation.
前記演算手段は、さらに、前記被験者の頭の運動の大きさと前記被験者の表情の動きの大きさと前記皮膚電気反射の大きさの少なくとも1に応じて単調に増加する重要性指標を算出し、
前記表示制御手段は、前記重要性指標を前記一覧表示において表示する、請求項3記載の表情画像記録検索装置。
The calculation means further calculates an importance index that monotonously increases according to at least one of the magnitude of the movement of the subject's head, the magnitude of the movement of the facial expression of the subject, and the magnitude of the electrical skin reflex,
4. The facial expression image recording / retrieval device according to claim 3, wherein the display control means displays the importance index in the list display.
JP2006019408A 2006-01-27 2006-01-27 Facial expression image record retrieval device Expired - Fee Related JP4774532B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006019408A JP4774532B2 (en) 2006-01-27 2006-01-27 Facial expression image record retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006019408A JP4774532B2 (en) 2006-01-27 2006-01-27 Facial expression image record retrieval device

Publications (2)

Publication Number Publication Date
JP2007200127A true JP2007200127A (en) 2007-08-09
JP4774532B2 JP4774532B2 (en) 2011-09-14

Family

ID=38454668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006019408A Expired - Fee Related JP4774532B2 (en) 2006-01-27 2006-01-27 Facial expression image record retrieval device

Country Status (1)

Country Link
JP (1) JP4774532B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166969A (en) * 2009-01-20 2010-08-05 Kazuko Seyama Action observation measurement control system using gardening therapy
CN102385691A (en) * 2010-08-31 2012-03-21 财团法人资讯工业策进会 Facial expression identification system, identification device and identification method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH061055A (en) * 1992-06-19 1994-01-11 Tokyo Electric Co Ltd Ink ribbon feed device
JPH0743679A (en) * 1993-07-29 1995-02-14 Sharp Corp Automatic adjusting device for liquid crystal display density
JP2006085440A (en) * 2004-09-16 2006-03-30 Fuji Xerox Co Ltd Information processing system, information processing method and computer program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH061055A (en) * 1992-06-19 1994-01-11 Tokyo Electric Co Ltd Ink ribbon feed device
JPH0743679A (en) * 1993-07-29 1995-02-14 Sharp Corp Automatic adjusting device for liquid crystal display density
JP2006085440A (en) * 2004-09-16 2006-03-30 Fuji Xerox Co Ltd Information processing system, information processing method and computer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166969A (en) * 2009-01-20 2010-08-05 Kazuko Seyama Action observation measurement control system using gardening therapy
CN102385691A (en) * 2010-08-31 2012-03-21 财团法人资讯工业策进会 Facial expression identification system, identification device and identification method

Also Published As

Publication number Publication date
JP4774532B2 (en) 2011-09-14

Similar Documents

Publication Publication Date Title
US11948401B2 (en) AI-based physical function assessment system
JP6811837B2 (en) Pathology data acquisition
JP4622702B2 (en) Video surveillance device
Coimbra et al. MPEG-7 visual descriptors—contributions for automated feature extraction in capsule endoscopy
US8687925B2 (en) Image storage processing apparatus, image search apparatus, image storage processing method, image search method and program
JP5227911B2 (en) Surveillance video retrieval device and surveillance system
EP2413597B1 (en) Thumbnail generation device and method of generating thumbnail
US9646046B2 (en) Mental state data tagging for data collected from multiple sources
WO2006100808A1 (en) Capsule endoscope image display controller
AU2011308650A1 (en) Measuring affective data for web-enabled applications
KR20070102404A (en) Image display control device, control method and program thereof
JP2007068620A (en) Psychological condition measuring apparatus
KR20170099066A (en) Method and system for tongue diagnosis based on image of tongue
JP2007289656A (en) Image recording apparatus, image recording method and image recording program
US20050251741A1 (en) Methods and apparatus for capturing images
JP2007289657A (en) Image recording apparatus, image recording method, and image recording program
JP4774532B2 (en) Facial expression image record retrieval device
TWI397024B (en) Method for image auto-selection and computer system
JP4701365B2 (en) Emotion information notification device
JP6198530B2 (en) Image processing device
CN111448589A (en) Device, system and method for detecting body movement of a patient
TWI478099B (en) Learning-based visual attention prediction system and mathod thereof
JP6709868B1 (en) Analysis method, analysis system, and analysis program
JP5272797B2 (en) Digital camera
JP4268606B2 (en) Facial expression image record retrieval device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110606

R150 Certificate of patent or registration of utility model

Ref document number: 4774532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140708

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees