JP2010022649A - 指標選択装置及び方法ならびにコンピュータプログラム - Google Patents

指標選択装置及び方法ならびにコンピュータプログラム Download PDF

Info

Publication number
JP2010022649A
JP2010022649A JP2008188721A JP2008188721A JP2010022649A JP 2010022649 A JP2010022649 A JP 2010022649A JP 2008188721 A JP2008188721 A JP 2008188721A JP 2008188721 A JP2008188721 A JP 2008188721A JP 2010022649 A JP2010022649 A JP 2010022649A
Authority
JP
Japan
Prior art keywords
index
label
unit
distribution
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008188721A
Other languages
English (en)
Inventor
Takahiro Hata
崇洋 秦
Takashi Kanbayashi
隆 神林
Mitsuo Teramoto
光生 寺元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008188721A priority Critical patent/JP2010022649A/ja
Publication of JP2010022649A publication Critical patent/JP2010022649A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

【課題】知的活動評価のために好適な主指標を選択する。
【解決手段】分布推定部11は、生理指標や観測指標である複数の指標の値と、人間の知的活動を示すラベルとの時系列データの入力を受け、指標または指標の組とラベルとの分布を示す関数を作成する。情報量計算部12は、分布推定部11により生成された分布を示す関数から、指標または指標の組とラベルとの情報量を計算する。指標選択部13は、所望のラベルを最もよく反映し、当該ラベルの推定に最適な主指標として、複数の指標または指標の組の中から、最大の情報量を示す指標または指標の組を選択し、出力する。
【選択図】図1

Description

本発明は、人の知的活動の推定を行うために最適な指標又は指標の組を選択する指標選択装置及び方法ならびにコンピュータプログラムに関する。
知的活動とは、興味、感情、あるいは印象等の人間の心理的な活動や、認知、記憶あるいは追想等の人間の情報処理活動などを差す。
一方、人間の生理反応は、脳波、心拍変動、血圧、血流、発汗、皮膚電気反応、呼吸、血中酸素飽和度、顔面温度、又は唾液分泌成分等として数値化できる。この数値化された値を総じて生理指標と呼ぶ。
また、人間の行動は、声の調子、非言語表現(溜息等)、視線停留時間、表情変化、又は歩行パターン等として数値化できる。この数値化された値を総じて観測指標と呼ぶ。
このような生理指標、観測指標を算出する測定器は小型で携帯することができるものもある。
従来、人間の知的活動に関するアンケート調査については、十分なテストを行った世界的標準試験法が提案されている。例えば、精神的作業負荷の検査法として、NASA−TLX(Task Load Index)と呼ばれる試験が広く利用されており、このテストによって、知的・知覚的要求、身体的要求、タイムプレッシャー、作業成績、努力、フラストレーションの6つの尺度が得られる(例えば、非特許文献1参照)。
ある信号が得られた時、その分布関数を推定することができる。最も単純には、得られた信号の長さをNとした時、信号の最小の値から最大の値までを定義域にもつ関数F(x)を、信号の中でxよりも小さいものの数を信号の長さNで除算した値を取るように決めることで得られる。
そこで、ある指標や信号の分布と、生理指標や観測指標の分布とを用いて計算可能な情報量(例えば、非特許文献2参照)を用いることにより、当該指標や信号を最もよく反映する生理指標又は観測指標を知ることができる。
また、シャノンの条件付情報エントロピやフィッシャー情報量により、各指標による知的活動評価の誤り率や二乗誤差の下限値が与えられる(例えば、非特許文献3参照)。
また、指標とラベルの組である標本を機械的に学習器へ入力することにより、指標とラベルの関係を自動分類するルールを自動学習することができる場合がある。このルールを判別ルールと呼ぶ。無関係な指標とラベルの組により標本を構成した場合はこの限りではなく、入力する標本を増やしても判別ルールが定まらない場合がある。
このラベルとして知的活動の状態を示すラベルを用いることにより、知的活動の評価を行う判別ルールを学習することができる。
判別ルールを用いて任意の指標へラベルを付与することができる。このような装置を判別器と呼ぶ。
そして、学習に用いる指標として複数の異なる指標を組み合わせて標本を構成し学習することによって、判別器の精度を向上させることができる場合がある。しかし、全く意味のない指標を組み合わせることで精度が悪化する場合もある。そのような学習器のアルゴリズムとして決定木を自動構築するCART(classification and regression trees:識別・回帰木)等がある(例えば、非特許文献4参照)。
中園 薫、秦 崇洋、安宅 恵理、田中 久弥、長崎 祐二,「ゲーム課題の遂行時における作用負荷の生理指標および心理指標による評価」,信学技報,HIP2007-163(2008-03),pp.25−30,2007年 Takahiro HADA、Toyonori MUNAKATA,"Filtering for Simple Threshold Systems: Self-Tuning, Mutual Information and Applications" ,IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences,Vol. E89-A, No.10,pp. 2566-2574,2006 村田昇,"情報理論の基礎",サイエンス社,日本,2005年 Richard O. Duda、Peter E. Hart、David G. Stork,尾上守夫(監訳),"パターン識別",第2版,新技術コミュニケ一ションズ,日本,2001年
ある知的活動をよく反映する指標(主指標)が分かっている場合、情報量を利用することで、当該指標を最もよく反映する生理指標又は観測指標(副指標)を調べることができ、主指標に代わり副指標をもって知的評価を行うことができる(先願発明:特願2008−046014)。
しかしながら、知的活動をよく反映する指標が不明の場合は、主指標を決定することができなかった。
また主指標が分かっていたとしても、生理指標や観測指標のようにノイズや誤りが多く含まれる指標間の学習を行う場合には、CARTのようなアルゴリズムでは過学習してしまう可能性があり、適切な学習を行うためには人間の判断やチューンが必要であるため手間が非常に大きかった。
更に、個人差のある生理指標や観測指標の学習結果がどの程度妥当であるかを判断することが難しかった。そのため、当該人が知的活動をどの程度、生理指標や観測指標に表出しているかが分からず、よって、学習することで知的活動が判別可能であるのかそうでないのかも分からなかった。
本発明は、このような事情を考慮してなされたもので、その目的は、知的活動評価のために好適な指標等を選択するための定量的な尺度を与えることにより、主指標として何を用いるべきかを選択することを可能とする指標選択装置及び方法ならびにコンピュータプログラムを提供することにある。
本発明は、人間の生理反応または行動を数値化した複数の種類の指標の中から、人間の知的活動を示す所望のラベルを最もよく反映する主指標を選択する指標選択装置であって、複数の指標の時系列の値と、当該指標が観測されたときのラベルとの情報から、当該指標又は当該指標の組みと当該ラベルとの分布を得る分布推定部と、前記分布推定部により得られた前記指標又は前記指標の組みと前記ラベルとの分布から、当該指標または当該指標の組みと、当該ラベルとの組み合わせについての情報量を算出する情報量計算部と、前記情報量計算部により算出された情報量に応じて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する指標選択部と、を備えることを特徴とする指標選択装置である。
また、本発明は、上述した指標選択装置において、前記指標または前記指標の組みによって知的活動を評価した場合に期待される誤差を算出する誤差見積部をさらに備え、前記指標選択部は、前記誤差見積部により算出された誤差に基づいて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する、ことを特徴とする。
また、本発明は、上述した指標選択装置において、前記情報量計算部によって算出された情報量に基づいて、知的活動の評価の難易度が所定より高い前記指標または前記指標の組みを特定する難易度判定部をさらに備え、前記指標選択部は、前記難易度判定部により難易度が所定より高いと判断された前記指標または前記指標の組みを除いた前記指標または前記指標の組みを主指標として選択する、ことを特徴とする。
また、本発明は、上述した指標選択装置において、指標の時系列の値と、当該指標が観測されたときのラベルとの情報を記憶する記憶部と、前記難易度判定部において、現在の前記指標または前記指標の組み全てについて、知的活動の評価の難易度が所定より高いと判断された場合に新たな前記指標の組みを生成し、前記分布推定部に出力する指標組合せ部とをさらに備え、前記分布推定部は、前記指標組合せ部から新たな前記指標の組みの入力を受け、前記記憶部内の指標の時系列の値と、当該指標が観測されたときのラベルとの情報を参照して、当該新たな指標の組みと当該ラベルとの分布を算出する、ことを特徴とする。
また、本発明は、人間の生理反応または行動を数値化した複数の種類の指標の中から、人間の知的活動を示す所望のラベルを最もよく反映する主指標を選択する指標選択装置に用いられる指標選択方法であって、分布推定部が、複数の指標の時系列の値と、当該指標が観測されたときのラベルとの情報から、当該指標又は当該指標の組みと当該ラベルとの分布を得る分布推定過程と、情報量計算部が、前記分布推定過程において得られた前記指標又は前記指標の組みと前記ラベルとの分布から、当該指標または当該指標の組みと、当該ラベルとの組み合わせについての情報量を算出する情報量計算過程と、前記情報量計算過程において算出された情報量に応じて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する指標選択過程と、を有することを特徴とする指標選択方法である。
また、本発明は、上述した指標選択方法において、誤差見積部が、前記指標または前記指標の組みによって知的活動を評価した場合に期待される誤差を算出する誤差見積過程をさらに有し、前記指標選択過程では、前記誤差見積過程において算出された誤差に基づいて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する、ことを特徴とする。
また、本発明は、上述した指標選択方法において、難易度判定部が、前記情報量計算過程において算出された情報量に基づいて、知的活動の評価の難易度が所定より高い前記指標または前記指標の組みを特定する難易度判定過程をさらに有し、前記指標選択過程においては、前記難易度判定過程において難易度が所定より高いと判断された前記指標または前記指標の組みを除いた前記指標または前記指標の組みを主指標として選択する、ことを特徴とする。
また、本発明は、上述した指標選択方法において、指標組合せ部が、前記難易度判定過程において、現在の前記指標または前記指標の組み全てについて、知的活動の評価の難易度が所定より高いと判断された場合に新たな前記指標の組みを生成し、前記分布推定部に出力する指標組合せ過程と、前記分布推定部が、前記指標組合せ過程において生成された新たな前記指標の組みの入力を受け、記憶部内の指標の時系列の値と、当該指標が観測されたときのラベルとの情報を参照して、新たな前記指標の組みと当該ラベルとの分布を算出する分布再推定過程とをさらに有し、前記情報量計算過程においては、前記分布再推定過程において得られた新たな前記指標の組みと前記ラベルとの分布から、新たな前記指標の組みと、当該ラベルとの組み合わせについての情報量を算出し、前記指標選択過程においては、前記情報量計算過程において算出された情報量に応じて前記ラベルの主指標となる新たな前記指標の組みを選択する、ことを特徴とする。
また、本発明は、指標選択装置としてコンピュータを動作させることを特徴とするコンピュータプログラムである。
本発明によれば、人の知的活動などの所望のラベルの評価を行なうにあたって、定量的な尺度に基づいた最適な指標(例えば、生理指標)を選択することができる。また、本発明によれば、期待される学習誤差を学習の前に見積もることが可能である。加えて、人の知的活動評価の難易度を見積もることを可能とする。
以下、本発明の実施形態を、図面を参照して説明する。
[第1の実施形態]
図1は、本発明の一実施形態による指標選択装置1の構成を示すブロック図である。図1に示すように、本発明の実施形態の指標選択装置1は、分布推定部11と、情報量計算部12と、指標選択部13とから構成される。
分布推定部11は、指標または指標の組のそれぞれとラベルとの分布関数、又は確率関数、あるいは確率密度関数を推定する。確率変数Xがx以下の値をとる確率を確率変数Xの分布関数という。また、確率関数は、確率変数Xに対応した確率を示す関数である。確率密度関数は、分布関数の導関数である。本実施形態では、確率変数として、指標または指標の組みと、1つのラベルとの組み合わせについての確率変数を用いる。
以下、指標または指標の組みを「指標等」と記載する。ここで指標とは、脳波、心拍変動、血圧、血流、発汗、皮膚電気反応、呼吸、血中酸素飽和度、顔面温度、又は唾液分泌成分等として人間の生理反応を数値化した生理指標や、声の調子、非言語表現(溜息等)、視線停留時間、表情変化、又は歩行パターン等として人間の行動を数値化した観測指標である。また、ラベルとは、興味、感情、あるいは印象等の人間の心理的な活動や、認知、記憶あるいは追想等の人間の情報処理活動など、人の知的活動の状態を示すものである。
情報量計算部12は、分布推定部11により推定された関数により示される分布に従って、情報量を計算する。情報量とは、ある事象の起こりにくさを示す尺度であり、例えば相互情報量や、シャノンの条件付情報エントロピやフィッシャー情報量等である。相互情報量とは、複数の確率変数についての相互依存の尺度を表す量である。また、条件付情報エントロピとは、ある事象が生じているという条件下における、他の事象の情報量であり、フィッシャー情報量とは、スコアの分布である。
指標選択部13は、予め与えられた条件から最適な指標等を選択する。
図2は、図1に示す指標選択装置1の処理フローを示す図である。同図において、同一試行中に、複数の指標等の数値とラベルの情報(INF1)が分布推定部11へ入力される(ステップS110)。このとき、観測された指標等の数値と、その数値が観測されたときのラベルとが対応可能な情報として入力される。例えば、時系列の各指標等の値と、時系列のラベルが入力される。分布推定部11は、入力された指標等の値とラベルの情報に基づいて、各指標等とラベルとの結合累積分布関数を計算し、その分布関数をそのまま情報量計算部12に出力するか、あるいは計算された結合累積分布関数に対して適当に補間を行なった結合累積分布関数を生成し、これを分布関数の情報(INF2)として情報量計算部12に出力する(ステップS120)。
ここで、まず、累積分布関数について説明する。例えば、x={40、40.5、41,41、39、40.5}というデータ列が与えられた場合、x≦38なるデータは0個、x≦39なるデータは1個、x≦40なるデータは2個、x≦40.5なるデータは4個、x≦41なるデータは6個であり、これらの数を標本数(xの個数)6で除算した値を累積分布関数の値とする。
上記のように、累積分布関数は1つの変数について表したものであるが、本実施形態では、複数の変数についての累積分布関数を使用するため、これを結合累積分布関数と定義する。結合累積分布関数の複数の変数としては、指標等とラベルとが含まれることになる。そこで、まず、分布推定部11は、指標等の各値が観測された時間、または、所定の周期的な時間における各指標等の値と、対応するラベルとの組み合わせを生成する。そして、例えば、この組み合わせが指標y,ラベルzである場合、(指標y,ラベルz)={(y,z)、(y,z)、…、(y,z)}が生成される。このとき、結合累積分布関数は、(a,b)については、y≦aかつz≦bを満たす(指標y,ラベルz)の個数を、標本数nで除算した値をとるような関数となる。また、各指標等の値と、対応するラベルとの組み合わせが、指標yと指標wの組み,ラベルzである場合、(指標y,指標w,ラベルz)={(y,w,z)、(y,w,z)、…、(y,w,z)}が生成される。このとき、結合累積分布関数は、(a,c,b)については、y≦aかつw≦cかつz≦bを満たす(指標y,指標w,ラベルz)の個数を、標本数nで除算した値をとるような関数となる。
なお、この処理によって得られる分布関数は階段関数であるが、最も単純な例としては、そのまま階段関数として用いてもよい。あるいは、得られた階段関数に平滑化の処理を施して滑らかな関数として用いてもよい。
情報量計算部12は、分布推定部11から出力された複数の指標等についての結合累積分布関数から、目的に応じてシャノンの情報エントロピ、条件付情報エントロピ、相互情報量、又はフィッシャー情報量を算出し、それぞれの指標等とその指標等に対応した当該情報量と(INF3)を指標選択部13に出力する(ステップS130)。例えば、情報量計算部12は、分布関数F(x)の差分関数であるf(x)=F(x)−F(x−Δx)を用いて、エントロピ−f(x)×logf(x)をxの全範囲で積分することによって情報エントロピを算出し、情報量として出力する。ただし、実際には、条件付分布関数を用いて計算する。
指標選択部13は、情報量計算部12から入力された指標等と情報量の尺度を元に、所望のラベルついて最も情報量の高い指標等を、そのラベルの主指標として選択し、選択した指標等とその情報量(INF4)をディスプレイに表示したり、印刷したり、あるいは、コンピュータ読み書き可能な記録媒体に書き込むなどして出力する(ステップS140)。
図3は、図1に示した構成において、図2の処理を行うときに用いられる各情報INF1〜4の具体例を示すものである。各情報INF1〜4は、以下を示している。なお、ここでは、指標を複数の生理指標、知的活動ラベルを興味の有無とした場合を例にしている。
INF1:指標選択装置1ヘ入力される指標の値とラベルである。
INF2:分布推定部11により推定された指標等とラベルの分布である。
INF3:情報量計算部12により計算された各指標等とラベルの情報量である。
INF4:指標選択部13により選択された指標等である。
図2のステップS110において、分布推定部11は、入力された時系列の指標の値及びラベルから、各指標等及びラベルについてのヒストグラムを作成し、このヒストグラムから結合累積分布関数を作成する。図3(a)は、分布推定部11へ入力された時系列の指標の値とラベル(INF1)である。
指標の時系列の入力データとしては、例えば、被験者に装着した生理センサ等を用いて人間の生理現象を測定することによって得られた時系列のデータを用いることができる。具体例としては、1kHz(キロヘルツ)のサンプリングレートでサンプリングされている心電図の電圧値の時系列データなどが挙げられる。
また、ラベルの時系列データとしては、例えば、生理センサを装着した前記被験者に、ボタンなどの入力装置を持たせて外的な刺激等を与え、所定の知的活動の感覚を得たときに、その入力装置を操作するなどして時系列データを取得することができる。具体的には、ある映像を被験者に見せ、怖いと思ったときや、面白いと思ったときにそのラベル(怖い、面白い)に応じたボタンを押し続ける、などである。ここでは、例えば、被験者が興味をもったときに入力装置を操作し続けるようにし、入力装置が操作されているときには興味有のラベル、操作されていないときには興味無のラベルとしている。あるいは、予めその映像が面白いものである、怖いものである、などという情報を入力することでもよい。この場合、ラベル時系列データとしては、実験の最初から最後まで一定してラベルが付与されたものとなる。なお、これに限らず、任意の方法によりラベルの時系列データを入力することが可能である。
図3(a)に示す入力データINF1の数値(単位:個)は、実際の観測値ではなく、サンプル数を示している。例えば、1kHzのサンプリングレートで1分間データを収集した場合、指標値は60000点でサンプリングされるため、60000個のデータとなる。実際には、データは観測された時点で逐次入力し、処理に必要な数の入力データが蓄積された時点で(例えば、5分間分の入力データが蓄積された時点で)処理を開始するようにすればよい。
なお、心拍間隔(RRI)については、データ数が、センサのサンプリングレートによってではなく、利用者の心拍数によって決まるため、数値に「約」をつけている。
分布推定部11は、図2のステップS120における処理結果として、図3(b)に示すような、推定された各指標等とラベルの結合累積分布関数(INF2)を情報量計算部12へ出力する。
図2のステップS130において、情報量計算部12では、INF2により示される結合累積分布関数F(X,L)それぞれから、指標等の周辺分布関数P(X)とラベルの周辺分布関数P(L)を算出し、相互情報量I(X;L)を計算する(Xは指標等、Lはラベル)。図7(c)は、情報量計算部12により計算された相互情報量(INF3)であり、指標選択部13へ入力される。
図2のステップS140において、指標選択部13は、ラベルの推定に最適な指標等である主指標として、最大の相互情報量を示す指標等である「血流量」を選択し、出力する。図7(d)は、指標選択部13により出力される、選択された指標等(INF4)である。
上述するように、本実施形態による指標選択装置1と、先願発明との大きな差異は、主指標が与えられなくても適当な数の入力から作成された分布関数によって、指標等の善し悪しを判定することが可能になることにある。
[第2の実施形態]
図4は、本発明の第2の実施形態による指標選択装置1aの構成を示すブロック図である。同図に示すように、本実施形態の指標選択装置1aは、分布推定部11と、情報量計算部12と、誤差見積部14と、指標選択部13とから構成される。分布推定部11と、情報量計算部12と、指標選択部13は第1の実施形態による指標選択装置1と同様であるため、説明を省略する。誤差見積部14は、与えられた情報量の種類と値から、誤り率や推定値の分散を計算するものである。
図5は、図4に示す指標選択装置1aの処理フローを示す図である。同図において、ステップS210〜S230までの処理は、図2に示す第1の実施形態のステップS110〜S130と同様の処理を行う。また、INF1〜INF3は第1の実施形態と同様の情報である。
誤差見積部14は、ステップS230において情報量計算部12により計算された情報量に応じて、誤り率や推定値の分散を計算し、指標選択部13へ出力する(ステップS240)。例えば、誤差見積部14は、エントロピの計算式−f(x)×logf(x)の逆演算を行なうことによって誤り率を計算し、誤差情報として出力する。相互情報量やシャノンの条件付エントロピの場合、誤差見積部14は、入力された指標等の値とラベルとから、当該指標等によるラベル推定の誤り率を計算し、指標選択部13に出力する。また、フィッシャー情報量の場合、誤差見積部14は、ラベルが何らかの連続値で表現できるならば、当該指標等によるラベルを表現する連続値の推定値の分散を計算し、指標等とそれらに期待される誤差情報とを指標選択部13に出力する。
指標選択部13は、誤差見積部14から入力された指標等と、それらに期待される誤差情報とを元に、所望のラベルついて最も誤差が小さいと期待される指標等を、そのラベルの主指標として選択し、選択した指標等を誤差情報と共に出力する(ステップS250)。
図6は、図4に示した構成において、図5の処理を行うときに用いられる各情報INF1〜3、5、6の具体例を示すものである。各情報INF1〜3、5、6は、以下を示している。なお、ここでは、指標を複数の生理指標、知的活動ラベルを興味の有無とした場合を例にしている。
INF1:指標選択装置1aヘ入力される指標の値とラベルである。
INF2:分布推定部11により推定された指標等とラベルの分布である。
INF3:情報量計算部12により計算された各指標等とラベルの情報量である。
INF5:誤差見積部14により計算された、指標等からラベルを推定する際の最低誤り率である。
INF6:指標選択部13により選択された指標等とその最低誤り率である。
図5のステップS220において、分布推定部11は、ステップS210において入力された時系列の指標の値及びラベルから、各指標等及びラベルについてのヒストグラムを作成し、これを指標等とラベルとの結合確率関数とする。図6(a)は、分布推定部11に入力された時系列の指標の値とラベル(INF1)であり、第1の実施形態におけるINF1と同様の方法により収集されたものである。図6(b)は、分布推定部11により推定され、情報量計算部12へ入力される結合確率関数(INF2)である。
図5のステップS230において、情報量計算部12は、INF2で示される結合確率関数P(X,L)それぞれから指標等の周辺確率関数P(X)を算出し、これらから条件付確率関数P(L|X)を算出する(Lはラベル、Xは指標等)。図6(c)は、情報量計算部12により計算された条件付情報エントロピ(INF3)であり、誤差見積部14へ入力される。
図5のステップS240において、誤差見積部14は、条件付情報エントロピから最低誤り率として、最適な推定をした時のビット誤り率を計算する。図6(d)は、誤差見積部により計算された最低誤り率(INF5)であり、指標選択部13へ入力される。図5のステップS250において、指標選択部13は、ラベルの推定に最適な指標等である主指標として、最低誤り率の最も小さい「血流量」を選択し、出力する。図6(e)は、指標選択部13により出力される、選択された指標等と誤差見積(INF6)である。
上述するように、本実施形態による利点は、第1の実施形態による先願発明との差異に加えて、指標等とラベルとの学習を行う前に、その指標等の理論的に達成可能な誤り率の下限や分散の小ささを、入力から近似的に与えられることにある。
[第3の実施形態]
図7は、本発明の第3の実施形態による指標選択装置1bの構成を示すブロック図である。同図に示すように、本実施形態の指標選択装置1bは、分布推定部11と、情報量計算部12と、難易度判定部15と、指標選択部13とから構成される。分布推定部11と、情報量計算部12と、指標選択部13は第1の実施形態による指標選択装置1と同様であるため、説明を省略する。難易度判定部15は、与えられた情報量の種類と値から、当該人の知的活動評価の難易度を判定するものである。
図8は、図7に示す指標選択装置1bの処理フローを示す図である。同図において、ステップS310〜S330までの処理は、図2に示す第1の実施形態のステップS110〜S130と同様の処理を行う。また、INF1〜INF3は第1の実施形態と同様の情報である。
難易度判定部15は、ステップS330において情報量計算部12により計算された情報量に応じて、指標等による当該人の知的活動評価の難易度を判定する。例えば、ある指標等について、相互情報量が所定の要求される情報量よりも小さい場合は難易度が高いと判断し、その指標等を情報量計算部12より入力された情報から排除した結果(INF7)を指標選択部13へ出力する(ステップ340)。要求を満たす指標等がある場合は、その要求を満たす指標等の全てを出力し、要求を満たす指標等がない場合は、要求を満たす指標等がない旨を示す情報(INF7)を指標選択部13へ出力する。
指標選択部13は、要求を満たす指標等があった場合、その要求を満たす指標等を全てと、その指標等の情報量(INF8)を出力する(ステップS350)。当該指標等がなかった場合、その旨を示す情報(INF8)を出力する。
図9は、図7に示した構成において、図8の処理を行うときに用いられる各情報INF1〜3、7、8の具体例を示すものである。各情報INF1〜3、7、8は、以下を示している。なお、ここでは、指標を複数の生理指標、知的活動ラベルを興味の有無とした場合を例にしている。
INF1:指標選択装置1bヘ入力される指標の値とラベルである。
INF2:分布推定部11により推定された指標等とラベルの分布である。
INF3:情報量計算部12により計算された各指標等とラベルの情報量である。
INF7:難易度判定部15により判定された難易度である。
INF8:指標選択部13により選択された指標等である。
図8のステップS320において、分布推定部11は、ステップS310において入力された時系列の指標の値及びラベルから、各指標等及びラベルについてのヒストグラムを作成し、このヒストグラムから結合累積分布関数を作成する。図9(a)は、分布推定部11に入力された時系列の指標の値とラベル(INF1)であり、第1の実施形態におけるINF1と同様の方法により収集されたものである。図9(b)は、分布推定部11により推定され、情報量計算部12へ入力される結合累積分布関数(INF2)である。
図8のステップS330において、情報量計算部12は、INF2で示される結合累積分布関数F(X,L)それぞれから各指標等の周辺分布関数P(X)とラベルの周辺分布関数P(L)を算出して、相互情報量I(X;L)を計算する(Xは指標等、Lはラベル)。図9(c)は、情報量計算部12により計算された相互情報量(INF3)であり、難易度判定部15へ入力される。
図8のステップS340において、難易度判定部15は、各指標等について、入力された相互情報量の値と事前に定義された相互情報量の閾値とを比較し、当該閾値、すなわち、要求される相互情報量を上回るものを「易」、下回るものを「難」と難易度を判定する。図9(d)は、難易度判定部15により判定された各指標等の難易度(INF7)であり、指標選択部13へ入力される。
図8のステップS350において、指標選択部13は、ラベルの推定に最適な指標等として難易度が「易」である指標等を全て出力するが、難易度が「易」である指標等がない場合は「なし」を出力する。図9(e)が指標選択部13により出力される指標等の情報(INF8)である。
上述するように、本実施形態による利点は、第1の実施形態による先願発明との差異に加えて、指標等の使用可否を決定する閾値を事前に設定しておくことで、人手を用いずに不要な指標等を全て排除できる点にある。
[第4の実施形態]
図10は、本発明の第4の実施形態による指標選択装置1cの構成を示すブロック図である。図10に示すように、本実施形態による指標選択装置1cは、分布推定部11と、情報量計算部12と、難易度判定部15と、記憶部16と、指標組合せ部17と、指標選択部13とから構成される。分布推定部11と、情報量計算部12と、難易度判定部15と、指標選択部13とは第3の実施形態による指標選択装置1bと同様であるため、説明を省略する。記憶部16は、入力された情報を記憶し、いつでも当該情報の読み出しが可能な記憶領域である。指標組合せ部17は、所定の難易度を満たす指標等がない場合に、指標の組みを新たに生成するものである。
図11は、図10に示す指標選択装置1cの処理フローを示す図である。同図において、ステップS410〜S440までの処理は、図8に示す第3の実施形態のステップS310〜S340と同様の処理を行う。また、INF1〜INF3、INF7、INF8は第3の実施形態と同様の情報である。ただし、ステップS420において、分布推定部11は、分布の推定を終了した後に、ステップS410において入力された指標等の値と、ラベルの情報と、推定した分布の情報を記憶部16へ書き込む。記憶部16は、書き込まれた情報を蓄積し、情報の読み出し指示を待つ。また、ステップS440において、難易度判定部15は、難易度が高いと判断した指標等を、情報量計算部12より入力された情報から排除した結果(INF7)を指標選択部13へ出力するとともに、指標組合せ部17へ出力する。要求を満たす指標等がない場合は、要求を満たす指標等がない旨を示す情報(INF7)を指標選択部13及び指標組合せ部17へ出力する。
難易度判定部15から要求を満たす指標等がない旨を示す情報が指標選択部13及び指標組合せ部17に出力された場合(ステップS450:NO)、指標選択部13は、要求を満たす指標等がない旨を示す情報(INF8)を出力する。さらに、指標組合せ部17は、1つの指標、及び、現在の指標の組みでは、所望のラベルの判定が不可能と判断し、ランダムに指標を選択して2つ以上の指標の新たな組みを生成して分布推定部11へ出力する(ステップS460)。
分布推定部11は、指標組合せ部17から新たな指標の組みの入力を受けると、指標選択装置1cへの入力の有無に関わらず、記憶部16内の情報を読み出して、ステップS420と同様に指標等とラベルの分布の関数を推定する。つまり、分布推定部11は、指標組合せ部17が生成した新たな指標の組みについて各指標の値域を複数に分割し、分割した値域の各範囲に含まれるサンプル数をカウントして、ステップS420からの処理を繰り返し、新たな指標の組みについて、第1の実施形態と同様に、分布関数の推定、生成を行ない、情報量計算部12へ出力する。
そして、ステップS450において、難易度判定部15から要求を満たす指標等が指標選択部13及び指標組合せ部17に出力された場合(ステップS450:YES)、指標選択部13は、難易度判定部15から入力された、要求を満たす指標等の全てと、その情報量と(INF8)を出力する(ステップS470)。
図12は、図10に示した構成において、図11の処理を行うときに用いられる各情報各情報INF1〜3、7〜9、11の具体例を示すものである。各情報INF1〜3、7〜9、11は、以下を示している。ここでは、指標を複数の生理指標、知的活動ラベルを興味の有無とした場合を例にしている。
INF1:指標選択装置1aヘ入力される指標の値とラベルである。
INF2:分布推定部11により推定された指標等とラベルの分布である。
INF3:情報量計算部12により計算された各指標等とラベルの情報量である。
INF7:難易度判定部15により判定された難易度である。
INF8:指標選択部13により選択された指標等である。
INF9:記憶部16の蓄積情報である。
INF11:分布推定部11により生成された指標の組みの情報である。
図11のステップS420において、分布推定部11は、ステップS410において入力された時系列の指標の値及びラベルから、各指標等及びラベルについてのヒストグラムを作成し、このヒストグラムから結合累積分布関数を作成する。図12(a)は、分布推定部11に入力された時系列の指標とラベルの情報(INF1)であり、第1の実施形態におけるINF1と同様の方法により収集されたものである。図12(b)は、分布推定部11により推定され、情報量計算部12へ入力される結合累積分布関数の情報(INF2)である。
図12(c)に示すように、記憶部16へは、分布推定部11へ入力された時系列の指標とラベルの情報が書き込まれる。記憶部16は、情報の読み出しの指示を受けるまで入力された情報を保存し、読み出しの指示を受けると、保持していた情報を出力する。
図11のステップS430において、情報量計算部12は、INF2で示される結合累積分布関数F(X,L)それぞれから指標等の周辺分布関数P(X)とラベルの周辺分布関数P(L)を算出して、相互情報量I(X;L)を計算する(Xは指標等、Lはラベル)。図12(d)は、情報量計算部12により計算された相互情報量(INF3)であり、難易度判定部15へ入力される。
図11のステップS440において、難易度判定部15は、各指標等について、入力された相互情報量の値と事前に定義された相互情報量の閾値とを比較し、当該閾値、すなわち、要求される相互情報量を上回るものを「易」、下回るものを「難」と難易度を判定する。図11(e)は、難易度判定部15により判定された各指標等の難易度(INF7)であり、指標組合せ部17及び指標選択部13へ入力される。
指標選択部13は、図11のステップS470において、ラベルの推定に最適な指標等として難易度が「易」である指標等全てを出力し、全ての指標等の難易度が「難」であり、最適な指標等がない場合は、図11のステップS460において「なし」を示す情報を出力する。図12(f)は、最適な指標等がない場合に出力される指標等の情報(INF8)である。
指標組合せ部17は、全ての指標等の難易度が「難」である場合、図11のステップS460において、指標等を組み合わせた新たな組みを生成し、指標選択装置1へ出力する。ただし、既に生成済みの指標の組みは作成せず、また組み合わせはランダムに生成する。図12(g)は、指標組合せ部17により生成され、出力される指標の組みを示す情報(INF11)である。
分布推定部11は、指標組合せ部17から新たな指標の組みの情報(INF11)を受けとった場合、図11のステップS420に戻り、新しい指標の組みそれぞれとラベルの結合累積分布関数を作成するため、記憶部16より蓄積情報(INF9)を読み出し、結合累積分布関数を再推定し、情報量計算部12へ入力する。図12(h)が再推定されて出力される結合累積分布関数(INF2)である。
情報量計算部12は、1回目の入力を受けた時と全く同様に動作し、相互情報量を計算する。図12(i)は、情報量計算部12により計算された相互情報量を示す情報(INF3)であり、難易度判定部15へ入力される。難易度判定部15は、1回目の入力を受けた時と全く同様に動作し、難易度を判定する。図12(j)は、難易度判定部15により判定された難易度(INF7)であり、指標選択部13及び指標組合せ部17へ入力される。指標選択部13は、1回目の入力を受けた時と全く同様に動作する。ここでは、難易度が「易」と判定される指標の組があるため、図12(k)のような指標の組(INF8)が出力される。また、指標組合せ部17は、1回目の入力を受けた時と全く同様に動作するが、ここでは、難易度が「易」と判定される指標の組があるため、何もせずに停止する。
本実施形態の長所は、上述した第3の実施形態の利点に加えて、単純な指標の組だけでは知的活動評価が推定できない場合であっても、自律的に当該評価の推定が可能な指標の組みを探索し、要求を満たす組が存在すれば、適切な結果を出力する点にある。
以上説明した本発明の実施形態によれば、知的活動評価のための主指標が不明の状況でも、知的活動評価に好適な指標等を示すことができ、更に学習前にその指標の誤差を見積もることができ、加えて当該人の知的活動評価の難易度を見積もることができる。
なお、上述の指標選択装置1、1a、1b、1cは、内部にコンピュータシステムを有している。そして、上述した分布推定部11、情報量計算部12、指標選択部13、誤差見積部、難易度判定部15、指標組合せ部17の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本発明の第1の実施形態による指標選択装置の構成を示すブロック図である。 同実施形態における指標選択装置の処理フローを示す図である。 同実施形態における機能ブロック間のインタフェース例を示す図である。 本発明の第2の実施形態による指標選択装置の構成を示すブロック図である。 同実施形態における指標選択装置の処理フローを示す図である。 同実施形態における機能ブロック間のインタフェース例を示す図である。 本発明の第3の実施形態による指標選択装置の構成を示すブロック図である。 同実施形態における指標選択装置の処理フローを示す図である。 同実施形態における機能ブロック間のインタフェース例を示す図である。 本発明の第4の実施形態による指標選択装置の構成を示すブロック図である。 同実施形態における指標選択装置の処理フローを示す図である。 同実施形態における機能ブロック間のインタフェース例を示す図である。
符号の説明
1、1a、1b、1c…指標選択装置
11…分布推定部
12…情報量計算部
13…指標選択部
14…誤差見積部
15…難易度判定部
16…記憶部
17…指標組合せ部

Claims (9)

  1. 人間の生理反応または行動を数値化した複数の種類の指標の中から、人間の知的活動を示す所望のラベルを最もよく反映する主指標を選択する指標選択装置であって、
    複数の指標の時系列の値と、当該指標が観測されたときのラベルとの情報から、当該指標又は当該指標の組みと当該ラベルとの分布を得る分布推定部と、
    前記分布推定部により得られた前記指標又は前記指標の組みと前記ラベルとの分布から、当該指標または当該指標の組みと、当該ラベルとの組み合わせについての情報量を算出する情報量計算部と、
    前記情報量計算部により算出された情報量に応じて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する指標選択部と、
    を備えることを特徴とする指標選択装置。
  2. 前記指標または前記指標の組みによって知的活動を評価した場合に期待される誤差を算出する誤差見積部をさらに備え、
    前記指標選択部は、前記誤差見積部により算出された誤差に基づいて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する、
    ことを特徴とする請求項1に記載の指標選択装置。
  3. 前記情報量計算部によって算出された情報量に基づいて、知的活動の評価の難易度が所定より高い前記指標または前記指標の組みを特定する難易度判定部をさらに備え、
    前記指標選択部は、前記難易度判定部により難易度が所定より高いと判断された前記指標または前記指標の組みを除いた前記指標または前記指標の組みを主指標として選択する、
    ことを特徴とする請求項1に記載の指標選択装置。
  4. 指標の時系列の値と、当該指標が観測されたときのラベルとの情報を記憶する記憶部と、
    前記難易度判定部において、現在の前記指標または前記指標の組み全てについて、知的活動の評価の難易度が所定より高いと判断された場合に新たな前記指標の組みを生成し、前記分布推定部に出力する指標組合せ部とをさらに備え、
    前記分布推定部は、前記指標組合せ部から新たな前記指標の組みの入力を受け、前記記憶部内の指標の時系列の値と、当該指標が観測されたときのラベルとの情報を参照して、当該新たな指標の組みと当該ラベルとの分布を算出する、
    ことを特徴とする請求項3に記載の指標選択装置。
  5. 人間の生理反応または行動を数値化した複数の種類の指標の中から、人間の知的活動を示す所望のラベルを最もよく反映する主指標を選択する指標選択装置に用いられる指標選択方法であって、
    分布推定部が、複数の指標の時系列の値と、当該指標が観測されたときのラベルとの情報から、当該指標又は当該指標の組みと当該ラベルとの分布を得る分布推定過程と、
    情報量計算部が、前記分布推定過程において得られた前記指標又は前記指標の組みと前記ラベルとの分布から、当該指標または当該指標の組みと、当該ラベルとの組み合わせについての情報量を算出する情報量計算過程と、
    前記情報量計算過程において算出された情報量に応じて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する指標選択過程と、
    を有することを特徴とする指標選択方法。
  6. 誤差見積部が、前記指標または前記指標の組みによって知的活動を評価した場合に期待される誤差を算出する誤差見積過程をさらに有し、
    前記指標選択過程では、前記誤差見積過程において算出された誤差に基づいて前記ラベルの主指標となる前記指標又は前記指標の組みを選択する、
    ことを特徴とする請求項5に記載の指標選択方法。
  7. 難易度判定部が、前記情報量計算過程において算出された情報量に基づいて、知的活動の評価の難易度が所定より高い前記指標または前記指標の組みを特定する難易度判定過程をさらに有し、
    前記指標選択過程においては、前記難易度判定過程において難易度が所定より高いと判断された前記指標または前記指標の組みを除いた前記指標または前記指標の組みを主指標として選択する、
    ことを特徴とする請求項5に記載の指標選択方法。
  8. 指標組合せ部が、前記難易度判定過程において、現在の前記指標または前記指標の組み全てについて、知的活動の評価の難易度が所定より高いと判断された場合に新たな前記指標の組みを生成し、前記分布推定部に出力する指標組合せ過程と、
    前記分布推定部が、前記指標組合せ過程において生成された新たな前記指標の組みの入力を受け、記憶部内の指標の時系列の値と、当該指標が観測されたときのラベルとの情報を参照して、新たな前記指標の組みと当該ラベルとの分布を算出する分布再推定過程とをさらに有し、
    前記情報量計算過程においては、前記分布再推定過程において得られた新たな前記指標の組みと前記ラベルとの分布から、新たな前記指標の組みと、当該ラベルとの組み合わせについての情報量を算出し、
    前記指標選択過程においては、前記情報量計算過程において算出された情報量に応じて前記ラベルの主指標となる新たな前記指標の組みを選択する、
    ことを特徴とする請求項7に記載の指標選択方法。
  9. 請求項1から請求項4のいずれかの項に記載の指標選択装置としてコンピュータを動作させることを特徴とするコンピュータプログラム。
JP2008188721A 2008-07-22 2008-07-22 指標選択装置及び方法ならびにコンピュータプログラム Pending JP2010022649A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008188721A JP2010022649A (ja) 2008-07-22 2008-07-22 指標選択装置及び方法ならびにコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008188721A JP2010022649A (ja) 2008-07-22 2008-07-22 指標選択装置及び方法ならびにコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2010022649A true JP2010022649A (ja) 2010-02-04

Family

ID=41729055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008188721A Pending JP2010022649A (ja) 2008-07-22 2008-07-22 指標選択装置及び方法ならびにコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2010022649A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012239887A (ja) * 2011-05-13 2012-12-10 Fujitsu Ltd 腎臓のドップラ超音波法を使用した個人向けストレスプロファイルの作成
WO2014091766A1 (ja) 2012-12-15 2014-06-19 国立大学法人東京工業大学 人間の心的状態の評価装置
JPWO2017145226A1 (ja) * 2016-02-22 2018-06-07 株式会社日立製作所 心的活動状態評価支援装置、心的活動状態評価支援システム、及び心的活動状態評価支援方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012239887A (ja) * 2011-05-13 2012-12-10 Fujitsu Ltd 腎臓のドップラ超音波法を使用した個人向けストレスプロファイルの作成
WO2014091766A1 (ja) 2012-12-15 2014-06-19 国立大学法人東京工業大学 人間の心的状態の評価装置
JPWO2017145226A1 (ja) * 2016-02-22 2018-06-07 株式会社日立製作所 心的活動状態評価支援装置、心的活動状態評価支援システム、及び心的活動状態評価支援方法

Similar Documents

Publication Publication Date Title
JP7293050B2 (ja) 軽度認知障害判定システム
US9861308B2 (en) Method and system for monitoring stress conditions
US20180242907A1 (en) Determining metabolic parameters using wearables
US20090292770A1 (en) Determination of extent of congruity between observation of authoring user and observation of receiving user
JP6122884B2 (ja) 作業覚醒度推定装置、方法およびプログラム
WO2023112384A1 (ja) 計算機システム及び情動推定方法
US20240194346A1 (en) Improved Health Management Through Causal Relationship Based Feedback on Behavior and Health Metrics Captured by IOT
JP2010022649A (ja) 指標選択装置及び方法ならびにコンピュータプログラム
JP6767318B2 (ja) 心拍間隔モデリング装置、および異常状態判定方法
US20170220525A1 (en) Method and apparatus for hierarchical data analysis based on mutual correlations
JP2009201653A (ja) 知的活動評価システム、並びにその学習方法及びラベル付与方法
US11436205B2 (en) Method and apparatus for predicting parameter values of data entries in data set
JP2016513297A (ja) 視聴者の反応を分析する方法及び装置
JP6818701B2 (ja) 状態遷移予測モデル学習装置、方法およびプログラム
JP2018082765A (ja) 診断装置、診断方法、プログラム
WO2023021612A1 (ja) 目的変数推定装置、方法およびプログラム
Khan et al. Personal productivity monitoring through smartphones
JP7507984B1 (ja) 体調検出装置、体調検出システム、体調検出方法、及び体調検出プログラム
JP2014144052A (ja) 感情推定方法、装置及びプログラム
WO2022157872A1 (ja) 情報処理装置、特徴量選択方法、教師データ生成方法、推定モデル生成方法、ストレス度の推定方法、およびプログラム
WO2024171269A1 (ja) 幸福度モデル生成装置、幸福度計算装置、幸福度計算システム、幸福度モデル生成方法、幸福度計算方法、幸福度モデル生成プログラム、及び幸福度計算プログラム
Punnoose et al. Comparative evaluation of two systems for integrating biometric data from self-quantification
Sujatha et al. DECTECTION OF STRESS LEVEL FOR IT EMPLOYEES USING MACHINE LEARNING ALGORITHM
CN118551051A (zh) 网络内容价值预测的人工智能治理方法和机器人
Polikarpova et al. Development of a System for Calculating the Correlation between Blink Attributes and Attention Characteristics

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100526