JP2013190214A - 要因解析装置及び要因解析方法 - Google Patents

要因解析装置及び要因解析方法 Download PDF

Info

Publication number
JP2013190214A
JP2013190214A JP2012054522A JP2012054522A JP2013190214A JP 2013190214 A JP2013190214 A JP 2013190214A JP 2012054522 A JP2012054522 A JP 2012054522A JP 2012054522 A JP2012054522 A JP 2012054522A JP 2013190214 A JP2013190214 A JP 2013190214A
Authority
JP
Japan
Prior art keywords
variable
samples
class
vehicle
exception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012054522A
Other languages
English (en)
Other versions
JP5817600B2 (ja
Inventor
Akira Neyama
亮 根山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2012054522A priority Critical patent/JP5817600B2/ja
Publication of JP2013190214A publication Critical patent/JP2013190214A/ja
Application granted granted Critical
Publication of JP5817600B2 publication Critical patent/JP5817600B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】出力結果に多数の要素が影響を与えるシステムに対して、出力結果に影響を与えた要素をより容易に、しかも高い精度で解析、推定することのできる要因解析装置、及び要因解析方法を提供する。
【解決手段】要因解析装置は、複数の変数S1〜S30を含む複数のサンプルD1〜D210がそれぞれ複数の分類クラスの1つが割り当てられて記憶されている記憶装置と、複数のサンプルD1〜D210を「例外クラスB」のばらつきが小さくなるように変数S1〜S30を順に選択しつつ変数別のサンプルD1〜D210に順次分類していくことで分類に影響を及ぼす複数の変数からなる変数群を得る決定木作成部とを備える。要因解析装置は、変数群に含まれている複数の変数S1〜S30を、それぞれの変数S1〜S30によって分類された複数のサンプルに設定されている「例外クラスB」の割合に基づいて絞り込む変数絞り込み部を備える。
【選択図】図3

Description

本発明は、多数の要素からなるシステムに生じた事象について、当該事象の要因である要素を解析、推定する要因解析装置、及び要因解析方法に関する。
一般に、車両や生産設備など多数の要素からなるシステムにあっては、システムの出力結果、例えば車両の走行状態や生産された製品などから、それら走行状態や生産された製品の良否などに影響を及ぼしている要素を特定したり、解析、推定したりすることは容易ではない。さらに、上記出力の結果への影響が複数の要素によるものであるとなると、それら要素の組み合わせを解析、推定することはより難しくなる。例えば、車両の特定の動作に影響する要素を推定しようとする場合、車両の要素としての、機関、ドライバ操作、車両環境など、どの要素の組み合わせが、当該特定の動作に影響したのかを解析することは容易ではない。しかも、こうした解析は、システムの出力結果に不都合が生じたときに行われることが多いものの、影響を及ぼす要素が十分に絞り込めていないと、複数の要素からなる多数の組み合わせを試すことにもなりかねず、解析に要する時間、労力、コストなどが無視できない。また、そればかりか、当該不都合に対する満足な解析結果さえ得られないおそれもある。そこで従来は、例えば特許文献1に記載の装置を用いるなどして、システムの出力結果に影響した要素を解析、推定するようにしている。
特許文献1に記載の装置は、生産設備の異常を推定する装置であって、同装置には、製品の履歴情報を記憶する履歴DB(データベース)と品質情報を記憶する品質DBとからデータを検索し加工して解析データを作成する解析データ作成部と、解析データを使用して異常な設備を解析、推定するデータ解析部とが設けられている。そして、データ解析部には、決定木分析を用いて解析データを製造設備ごとに分類する異常事象分類部と、この分類結果に基づいて、製品の品質低下の原因となる製造設備を推定する異常設備評価部とが設けられている。特許文献1に記載の装置ではこのように、決定木分析を用いた解析によって、製品の品質低下の原因となっている製造設備を推定するようにしている。
特開2006−319220号公報
ところで、特許文献1に記載の装置は、生産設備を解析対象としているため、決定木による要因解析に際しては、各生産設備による処理の良否が分類の条件として採用されることが多い。つまり、同装置による解析では、製品の品質の低下の原因となっている設備の組み合わせが、設備間の干渉が抑えられている生産設備による処理の良否に基づいて推定されるため、解析結果が比較的絞り込まれやすい傾向にある。
一方、車両など、解析対象となる要素(例えば、速度、アクセル操作、等々)の相互干渉を抑えることが困難なシステムに対する決定木による要因解析では、要素間の干渉が分類の条件を曖昧にすることが多い。また、車両などは、一つの結果に対して各要素が複数の状態を取り得ることも多く、このことも決定木における分類の条件を曖昧にする一因となっている。しかも、こうした分類条件の曖昧さは、決定木による要因解析において、結果を切り分ける要因を増加させる傾向にもある。また、決定木による要因解析の解析精度を高めようとすると、要因の切り分けも自ずと細分化されるため、上述のような生産設備に対してであれ、結果を切り分ける要因は増加する。そして、こうした切り分ける要因の増加は、解析結果に含まれる要因そのものを増加させることにもなるため、そうした解析結果に基づいて行われるシステムの検証等に要する時間や手間なども無視できないものとなる。
なお、こうした課題は、車両に搭載された要因解析装置のみならず、多数の構成要素より構成される製造設備など、いわゆる多変数系のシステムに対する要因解析においては概ね共通した課題となっている。
本発明は、上述のような実情に鑑みなされたものであって、その目的は、出力結果に多数の要素が影響を与えるシステムに対して、出力結果に影響を与えた要素をより容易に、しかも高い精度で解析、推定することのできる要因解析装置、及び要因解析方法を提供することにある。
以下、上記課題を解決するための手段及びその作用効果について記載する。
上記課題を解決するため、請求項1に記載の発明は、複数の変数を含む複数のサンプルが、それらサンプルの別に複数の分類クラスの1つが割り当てられて記憶されている記憶部と、前記複数のサンプルを各変数の別に分類したときに、前記複数の分類クラスのうちの選択された特定の分類クラスのばらつきが小さくなるように前記変数を順に選択しつつ前記複数のサンプルを変数別のサンプルに順次分類していくことで分類に影響を及ぼす複数の変数からなる変数群を得る解析部と、を備える要因解析装置であって、前記変数群に含まれている複数の変数を、それぞれの変数によって分類された複数のサンプルに設定されている前記特定の分類クラスの割合に基づいて絞り込む変数絞り込み部を備えることを要旨とする。
上記課題を解決するため、請求項7に記載の発明は、要因解析方法であって、複数の変数を含む複数のサンプルを、それらサンプルの別に複数の分類クラスの1つの分類クラスが割り当てられるように記憶部に記憶する記憶工程と、前記複数のサンプルを各変数の別に分類したときに、前記複数の分類クラスのうちの選択された特定の分類クラスのばらつきが小さくなるように前記変数を順に選択しつつ前記複数のサンプルを変数別のサンプルに順次分類していくことで分類に影響を及ぼす複数の変数からなる変数群を得る解析工程と、前記変数群に含まれている複数の変数を、それぞれの変数によって分類された複数のサンプルに設定されている前記特定の分類クラスの割合に基づいて絞り込む変数絞り込み工程を備えることを要旨とする。
このような構成もしくは方法によれば、特定の分類クラスのばらつきを小さくする、つまり、特定の分類クラスを良好に分割する複数の変数として求められた変数群が、当該変数群に含まれている複数の変数のそれぞれについて、その変数により分類された1又は複数のサンプルに割り当てられている特定の分類クラスの割合に基づいて絞り込まれる。つまり、変数群に含まれる変数が更に絞り込まれ、こうして絞り込まれた1又は複数の変数に基づく変数の組み合わせ数も減少し、それら組み合わせ毎に行われる特定の分類クラスに関する検証等に要する時間や手間などが軽減されるようになる。また、変数群から更に絞り込まれた変数によっても適切な解析、推定が行われるように変数群に含まれる変数を絞り込めば、従来よりも推定精度が向上することにもなる。すなわち、特定の分類クラス(出力結果)に多数の変数(要素)が影響を与えるシステムに対し、この要因解析装置は、特定の分類クラスに影響を与えた変数をより容易に、しかも高い精度で解析、推定することができる。
請求項2に記載の発明は、請求項1に記載の要因解析装置において、前記解析部では、前記分類クラスを、複数のサンプルを分類するための目的変数とし、前記サンプルを、分類クラスにより分類される説明変数とする決定木による解析によって前記変数群を得ることを要旨とする。
請求項8に記載の発明は、請求項7に記載の要因解析方法において、前記解析工程では、前記分類クラスを、複数のサンプルを分類するための目的変数とし、前記サンプルを、分類クラスにより分類される説明変数とする決定木による解析によって前記変数群を得ることを要旨とする。
このような構成もしくは方法によれば、変数群が決定木のアルゴリズムに基づいて求められるため、決定木のアルゴリズムを適用される要因解析装置において求められる変数群に含まれる変数を適切に絞り込むことができるようになる。
請求項3に記載の発明は、請求項2に記載の要因解析装置において、前記解析部は、前記決定木を、全てのサンプルを含む1つの根ノードと、順次分類した結果、分類不可能になった1又は複数のサンプルからなる複数の葉ノードを有するものとして得るとともに、前記変数群に含まれる複数の変数を、前記1つの根ノードから前記複数の葉ノードのうちの一つまでの経路に含まれる変数から構成し、前記変数絞り込み部は、前記変数群に含まれている複数の変数の絞り込みを、前記変数群に含まれる複数の変数により分類される複数のサンプルに対応付けられる特定の分類クラスの割合が、前記経路にあって葉ノード側で分類された1又は複数のサンプルに対応付けられる特定の分類クラスの割合よりも大きいとき、前記変数群から前記変数を除外することを再帰的に実行することにより行うことを要旨とする。
請求項9に記載の発明は、請求項8に記載の要因解析方法において、前記解析工程では、前記決定木を、全てのサンプルを含む1つの根ノードと、順次分類した結果、分類不可能になった1又は複数のサンプルからなる複数の葉ノードを有するものとして得るとともに、前記変数群に含まれる複数の変数を、前記1つの根ノードから前記複数の葉ノードのうちの一つまでの経路に含まれる変数から構成し、前記変数絞り込み工程では、前記変数群に含まれている複数の変数の絞り込みを、前記変数群に含まれる複数の変数により分類される複数のサンプルに対応付けられる特定の分類クラスの割合が、前記経路にあって葉ノード側で分類された1又は複数のサンプルに対応付けられる特定の分類クラスの割合よりも大きいとき、前記変数群から前記変数を除外することを再帰的に実行することにより行うことを要旨とする。
このような構成もしくは方法によれば、葉ノード側のサンプルに含まれる特定の分類クラスの割合よりも、根ノード側のサンプルに含まれる特定の分類クラスの割合が大きいとき、当該根ノード側の変数が変数群から除外される。これにより、変数群に含まれる変数から複数のサンプルの分類に対する貢献が小さい変数が除外されるようになるため、変数が絞り込まれた変数群としも複数のサンプルを特定の分類クラスによる分類を好適に維持することができる。
請求項4に記載の発明は、請求項3に記載の要因解析装置において、前記変数絞り込み部は、前記変数により分類された1又は複数のサンプルによって複数の葉ノードが生成されたとき、それら複数の葉ノードの各葉ノードのサンプルに対応付けられる特定の分類クラスの割合が大きい方の葉ノードにおける特定の分類クラスの割合を前記変数群の絞り込みに用いることを要旨とする。
請求項10に記載の発明は、請求項9に記載の要因解析方法において、前記変数絞り込み工程では、前記変数により分類された1又は複数のサンプルによって複数の葉ノードが生成されたとき、それら複数の葉ノードの各葉ノードのサンプルに対応付けられる特定の分類クラスの割合が大きい方の葉ノードにおける特定の分類クラスの割合を前記変数群の絞り込みに用いることを要旨とする。
このような構成もしくは方法によれば、変数の絞り込みに適している葉ノードが選択され、該選択された葉ノードのサンプルに含まれる特定の分類クラスの割合が変数群に含まれる複数の変数の絞り込みに用いられるようになる。すなわち、変数群に含まれる変数の絞り込みが好適になされるようになる。
請求項5に記載の発明は、請求項1〜4のいずれか一項に記載の要因解析装置において、前記複数の分類クラスは、通常事例を示す通常クラスと例外事例を示す例外クラスとの2つのクラスからなり、前記特定の分類クラスが前記例外クラスであることを要旨とする。
請求項11に記載の発明は、請求項7〜10のいずれか一項に記載の要因解析方法において、前記複数の分類クラスは、通常事例を示す通常クラスと例外事例を示す例外クラスとの2つのクラスからなり、前記特定の分類クラスを前記例外クラスとすることを要旨とする。
このような構成もしくは方法によれば、複数のサンプルから例外クラスの発生に影響があると思われる変数が取得できるようになる。例外事例がシステムにとって好ましくない事例であるとすると、当該例外事例に影響を与える変数の取得により、システムにとって好ましくない事例に関する検証が好適に実行できるようになれば、システムに生じる例外事例へ適切に対応することができるようになることが期待される。
請求項6に記載の発明は、請求項5に記載の要因解析装置において、前記変数が車両状態又は車両環境を示す情報であり、前記サンプルが1つの車両から同時刻に得られる複数の車両状態又は車両環境からなるとともに、前記複数のサンプルが時刻及び車両の少なくとも一方が相互に異なるサンプルからなり、前記例外クラスとして、特定の車両状態が設定され、前記変数絞り込み部では、前記特定の車両状態が設定された割合に基づいて、前記変数群に含まれている複数の車両状態又は車両環境の絞り込みを実行することを要旨とする。
請求項12に記載の発明は、請求項11に記載の要因解析方法において、前記変数として車両状態を示す情報を用い、前記サンプルを1つの車両から同時刻に得られた複数の車両状態又は車両環境とするとともに、前記複数のサンプルを時刻及び車両の少なくとも一方が相互に異なるサンプルとし、前記例外クラスとして、特定の車両状態を設定し、前記変数絞り込み工程では、前記特定の車両状態の設定された割合に基づいて、前記変数群に含まれている複数の車両状態又は車両環境の絞り込みを実行することを要旨とする。
車両においては、速度や加速度などの車両状態に相関があったり、ステアリング操作や道路状況などの車両状態と車両環境との間に相関があったり、各車両状態や車両環境等の各要素間に相関がある、つまり各要素間の独立性が低く相互に干渉がある場合が多い。こうした、干渉の多い複数の要素から、目的とする特定の車両状態、いわゆる例外事例を生じさせている要素の組み合わせを推定することは容易ではない。また、干渉の多い要素から、目的とする特定の車両状態を好適に切り分ける要素を選択することも容易でなく、解析によって、特定の車両状態に影響を及ぼすものとして選択される要素の数が多くなる傾向にある。そのため、選択された要素の組み合わせに基づいて、特定の車両状態を検証する際、それら要素の組み合わせを多数検証することとなり、検証に要する時間や手間が無視できない。
これに対し、上記構成もしくは方法によれば、車両から取得された車両状態又は車両環境から、特定の車両状態に影響を与えるものとして得られた車両状態又は車両環境が、その車両状態又は車両環境により分類された1又は複数のサンプルに割り当てられている例外クラスの割合に基づいて絞り込まれる。つまり、車両のように特定の車両状態に影響を及ぼすものとして選択される要素の数が多い傾向にあるシステムであれ、選択される車両状態又は車両環境の数を絞り込むことができるようになる。これにより、絞り込まれた車両状態又は車両環境の組み合わせに基づいて、例外クラスを生じる車両状態を検証することができるようになるため、それら車両状態又は車両環境の組み合わせ数に対応する検証数が減ることとなり、例外クラスの検証に要する時間や手間などが軽減されるようになる。
本発明にかかる要因解析装置を備えるシステムを具体化した一の実施形態について、そのシステム構成を示すブロック図。 同実施形態の要因解析装置が解析対象にするサンプルを取得する車両について、その構成を示すブロック図。 同実施形態の要因解析装置が解析対象にするサンプルを格納するデータベースの内容の一例を示す図。 同実施形態の要因解析装置が要因解析にて作成した決定木を模式的に示す模式図。 同実施形態の要因解析装置が決定木より算出した例外率を表形式で示す図。 同実施形態の要因解析装置が決定木からノードを選択する例を示す模式図。 同実施形態の要因解析装置が例外率に基づいてノードを絞り込む例を示す模式図。
以下、本発明にかかる要因解析装置を備えるシステムを具体化した一の実施形態について、図に従って説明する。
本実施形態のシステムは、情報処理センタ10に複数の車両20から集められたサンプルに基づいて、情報処理センタ10にて車両20に生じる特定の例外的事象に対して関連性のある車両状態や車両環境を推定するシステムである。
まず、本実施形態のシステムについて、図1及び図2を参照して説明する。
図1に示すように、情報処理センタ10には、複数の車両20、具体的には4台の車両20a〜20dが無線接続されている。各車両20a〜20dは、同一の車種からなり、それぞれが同一の種類からなる車両状態や車両環境のデータを収集することができる。なお、車両状態とは、車両そのものの状態に関するものであり、車両状態としては、例えば、速度、加速度、エンジン回転数、ステアリング操作、ライトの点灯/消灯、ドアの開閉などが挙げられる。また、車両環境は、車両の周囲環境に関するものであり、車両環境としては、例えば、時刻、位置、天候、明暗(照度)、道路形状などの道路に関する情報、ユーザに関する情報などが挙げられる。
図2に示すように、車両20には、車両に対する各種制御を行う車両制御装置21と、データの入出力可能に車両制御装置21に接続されている記憶装置22と、データの入出力可能に車両制御装置21に接続されている通信部23とが設けられている。
また、車両制御装置21には、検出等した情報をデータとして出力する情報出力装置が複数接続されている。情報出力装置として、時計30と、位置センサとしてのGPS31と、照度センサとしての照度計32と、速度センサとしての速度計33と、加速度センサとしての第1の加速度計34及び第2の加速度計35とが車両制御装置21に接続されている。
時計30は、現在の時刻Taを車両制御装置21に出力する。GPS31は、いわゆる全地球測位システム(GPS:Global Positioning System)であって、受信したGPS衛星信号に基づいて検出された現在位置Paを車両制御装置21に出力する。照度計32は、車両20の走行環境において検出された照度値Laを車両制御装置21に出力する。速度計33は、車両20から検出された速度Vaを車両制御装置21に出力する。第1の加速度計34は、車両20の進行方向に対して検出された第1の加速度Aaを車両制御装置21に出力する。第2の加速度計35は、路面に交差する方向に対して検出された加速度Abを車両制御装置21に出力する。
通信部23は、車両制御装置21から情報処理センタ10への無線通信を可能にさせる装置であって、車両制御装置21から入力された送信データを無線通信用の信号に変換して情報処理センタ10に対して送信する。なお、通信部23は、情報処理センタ10からの無線通信用の信号を受信して車両制御装置21へ出力してもよい。
記憶装置22は、例えばフラッシュメモリーやHDD(Hard Disk Drive)などの不揮発性の記憶装置から構成されているとともに、車両制御装置21からの読み出し及び書き込みが可能になっている。
車両制御装置21は、各種演算処理を実行するCPU、各種制御プログラムを格納するROM、データ格納やプログラム実行のためのワークエリアとして利用されるRAM、入出力インターフェース、メモリ等を備えたマイクロコンピュータを中心に構成されている。車両制御装置21には、各種制御に要する各種プログラムや各種パラメータなどが予め記憶されている。また、本実施形態では、車両制御装置21には、各種情報出力装置から出力された情報を収集して記録させるプログラムが設けられている。このプログラムは、時刻や位置などをサンプリング条件にして、複数の情報出力装置から出力された複数の情報を同時に取得するとともに、それら取得した複数の情報を1つの目的変数としてのサンプル、例えばサンプルD1として記憶装置22に記憶させる。なお、このサンプルの取得と記憶装置22への記憶は、時刻や位置などのサンプリング条件が成立する都度実行されることで、記憶装置22には少なくとも時刻の異なるサンプルが記憶される。さらに、本実施形態では、所定の条件に基づいて記憶装置22に記憶されたサンプルD1を情報処理センタ10に送信するプログラムも設けられている。所定の条件は、送信周期や、通信状況や、記憶されたサンプルの数などに基づいて定められる。
これにより、車両制御装置21は、サンプリング条件が成立すると、現在の時刻Ta、現在位置Pa、照度値La、速度Va、第1の加速度Aa、第2の加速度Abなどを同時に取得して1つのサンプルD1として記憶装置22に記憶させる。同様に、車両制御装置21は、サンプリング条件の成立に伴って取得された値を有する各サンプルD2,D3,…を記憶装置22に記憶させる。また、車両制御装置21は、記憶装置22に記憶された1つ又は複数のサンプル(D1,D2,D3,…)を、無線通信を介して情報処理センタ10に送信する。
図1に示すように、情報処理センタ10には、各種情報を処理する情報処理部11と、データの入出力可能に情報処理部11に接続されている記憶部としての記憶装置12と、データの入出力可能に情報処理部11に接続されている通信部13とが設けられている。
通信部13は、車両制御装置21から送信された無線信号を受信するための装置であって、受信した無線信号をデータに変換して情報処理部11へ出力する。つまり、情報処理部11は、通信部13を介して、車両20から送信された各サンプルD1,D2,D3,…を取得することができる。なお、通信部13は、情報処理部11から入力されたデータを無線通信用の信号に変換して車両制御装置21へ送信してもよい。
記憶装置12は、HDD(Hard Disk Drive)などの不揮発性の記憶装置から構成されているとともに、情報処理部11からの読み出し及び書き込みが可能になっている。例えば、情報処理部11は、車両20から取得した各サンプルD1,D2,D3,…を記憶装置12にそれぞれ書き込んだり、記憶装置12からそれぞれ読み出したりできる。
記憶装置12には、車両20から取得した各サンプルD1,D2,D3,…を登録させることのできるデータベース121が設けられている。図3に示すように、データベース121には、車両20(20a〜20d)から取得した複数のサンプルD1,D2,D3,…から構成される210個のサンプルD1〜D210と、各サンプルD1〜D210にそれぞれ説明変数としての分類クラスX1が割付けられている。各サンプルD1〜D210には、車両20の各情報出力装置に対応する30個の変数S1〜S30の値dn,m(なお、nは1〜210の整数、mは1〜30の整数)が含まれている。各変数S1〜S30は、車両20に設けられている複数の情報出力装置のいずれか1つに対応している。例えば、本実施形態では、変数S1は車両20の時計30に対応し、変数S2は車両20のGPS31に対応し、変数S3は車両20の照度計32に対応している。また、変数S4は車両20の速度計33に対応し、変数S5は車両20の第1の加速度計34に対応している。すなわち、データベース121のサンプルD1には、変数S1の値d1,1として現在の時刻Taが記憶され、変数S2に対応する値d2,1として現在位置Paが記憶され、変数S3に対応する値d3,1として照度値Laが記憶されている。また、データベース121のサンプルD1には、変数S4に対応する値d4,1として速度Vaが記憶され、変数S5に対応する値d5,1として第1の加速度Aaが記憶されている。
分類クラスX1は、車両20に生じる事例であって、要因解析の目的とする事例への対応の有無を各サンプルD1〜D210に設定するものである。分類クラスX1には、目的とする事例が車両20に生じていたのか否かのそれぞれに対応する2つの分類クラスとして「通常クラスA」と「例外クラスB」とが設けられている。「例外クラスB」は、車両20に生じる例外的な事例として特定の車両状態を示しており、当該特定の車両状態としては、例えば、急加速、急減速、上下振動などが挙げられる。本実施形態では、車両20に生じる例外的な事例を要因解析の目的としているため、車両20に例外事例が生じたときのサンプルには特定の分類クラスとしての「例外クラスB」が設定される一方、車両20に例外事例が生じていないときのサンプルには「通常クラスA」が設定される。つまり、「通常クラスA」が設定されたサンプルは例外事例に対応していないサンプルである一方、「例外クラスB」が設定されたサンプルは例外事例に対応しているサンプルである。例えば、データベース121に登録されている各サンプルD1,D2,Dnなどは分類クラスX1に「例外クラスB」が設定されている一方、各サンプルD3,D210などは分類クラスX1に「通常クラスA」が設定されている。なお、分類クラスX1は、所定の条件に基づいて自動的に付与してもよいし、解析者が与えるものであってもよい。また、分類クラスX1は、サンプル取得時に車両20にて付与されるものでもよいし、サンプルがデータベース121に登録されるときや登録されたあとに付与されるものでもよい。
つまり、記憶装置12には、複数の変数S1〜S30を含む複数のサンプルD1〜D210が、それらサンプルD1〜D210の別に複数の分類クラスの1つの分類クラスである「通常クラスA」又は「例外クラスB」が割り当てられて記憶される(記憶工程)。
情報処理部11は、各種演算処理を実行するCPU、各種制御プログラムを格納するROM、データ格納やプログラム実行のためのワークエリアとして利用されるRAM、入出力インターフェース、メモリ等を備えたマイクロコンピュータを中心に構成されている。情報処理部11には、各種車両診断に関する情報処理などに要する各種プログラムや各種パラメータなどが予め記憶されている。また本実施形態では、情報処理部11には、決定木分析によって要因解析を行う決定木分析プログラム及びパラメータと、決定木分析により解析された変数について更に絞り込む絞り込みプログラム及びパラメータとが設けられている。そして情報処理部11には、決定木分析プログラムの実行処理に基づいて決定木作成部111が設けられるとともに、絞り込みプログラムの実行処理に基づいて変数絞り込み部113が設けられる。なお、決定木分析プログラムや絞り込みプログラムは、常時実行処理されていてもよいし、必要に応じて実行処理されていてもよい。
決定木作成部111は、決定木分析に基づいてデータベース121に格納されているサンプルから決定木112を生成する。決定木112は、情報処理方法の一種である決定木分析によって生成される樹形状のモデルに基づく樹形図である。
図3に示すように、決定木作成部111は、要因解析の目的とする事例、例えば2つの分類クラスのうちから選択された1つの特定の分類クラスである「例外クラスB」を複数のサンプルD1〜D210から好適に分類することを繰り返すことで決定木112を生成する(解析工程)。好適な分類とは、決定木作成部111は、複数のサンプルD1〜D210を、「例外クラスB」のばらつきが小さくなるように選択した変数(S1など)で分類することである。なお、図4に示すように、決定木112では、上述した「分類」が「分岐」で図示される。
図4に示すように、決定木112は、分類(分岐)が開始される1つの「根ノードN1」と、「根ノードN1」以外の分岐点である4つの「中間ノードN2〜N5」と、これ以上分岐されない端点である6つの「葉ノードLP1〜LP3,LN1〜LN3」とを有する。つまり、1つの「根ノードN1」から複数の分岐が生じ、その分岐の先にそれぞれ1つの「中間ノードN2〜N5」が設けられる。また、そうした分岐先において分岐が生じない端点として「葉ノードLP1〜LP3,LN1〜LN3」が設けられる。これにより、1つの「根ノードN1」に対して、複数の「中間ノードN2〜N5」及び複数の「葉ノードLP1〜LP3,LN1〜LN3」が設けられる。なお、「根ノード」から1回の分岐で「葉ノード」が設けられるような場合、「中間ノード」は設けられない。こうした決定木112から、各「葉ノードLP1〜LP3,LN1〜LN3」から「根ノードN1」までに至る経路としての「ルート」がそれぞれの「葉ノードLP1〜LP3,LN1〜LN3」毎に得られる。こうして得られる「ルート」には、当該「ルート」の端点である「葉ノード」と、「葉ノード」から「根ノード」までの経路に含まれる「中間ノード」と、そして「根ノード」との各情報が含まれる。
本実施形態では、「根ノードN1」には、全サンプルD1〜D210が情報として含まれる。そして、この全サンプルD1〜D210が分類によって2つの「中間ノードN2」及び「中間ノードN3」に分けられる。つまり各「中間ノードN2」及び「中間ノードN3」は、全サンプルD1〜D210のうちの一部のサンプルを含む。また、各「中間ノードN2」及び「中間ノードN3」は、それぞれに含まれるサンプルが、各別に2つの「中間ノード」もしくは「葉ノード」に分類される。そして、こうした分類が繰り返され、分類されたノードに含まれるサンプルの数が1つになるか、分類されたノードに含まれるサンプルが分類不可能になったとき、それらノードが「葉ノード」となるとともに、分類が終了する。
ここで、図4を参照して、決定木作成部111がデータベース121に設定されたサンプルD1〜D210に基づいて作成した決定木112について説明する。なお、決定木作成部111は、要因解析の目的とする事例を複数の分類クラスのうちの1つである「例外クラスB」とする。また、「根ノードN1」に含まれる210個のサンプルD1〜D210は、「通常クラスA」が設定されているサンプルが60個、「例外クラスB」が設定されているサンプルが150個あるものとする。さらに、各サンプルD1〜D210には30個の変数S1〜S30に対応する値dn,1〜dn,30が含まれているが、説明の便宜上、サンプルD1〜D210を5つの変数S1〜S5の値dn,1〜dn,5のみを分類に用いる、つまり切り分けに用いる場合について説明する。
決定木作成部111は、210個のサンプルD1〜D210を有する「根ノードN1」から分類(切り分け)を開始する。なお、決定木作成部111は、「根ノードN1」に対して決定木分析のアルゴリズムを適用することで、「根ノードN1」から「例外クラスB」を好適に分類(切り分ける)するには変数S1を変数として選択するとともに変数S1の値d1,mを評価する閾値の値を閾値C1とすることが良好であることを定める。そして決定木作成部111は、「根ノードN1」から、値d1,mが閾値C1より大きい(d1>C1)サンプルを含む「中間ノードN2」と、値d1,mが閾値C1以下(d1≦C1)であるサンプルを含む「中間ノードN3」とを分類する(切り分ける)。なお、d1は、値d1,mの添え字「m」を略して記載したものである。これにより、「中間ノードN2」には100個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが50個、「例外クラスB」が設定されているサンプルが50個含まれるものとする。一方、「中間ノードN3」には110個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが10個、「例外クラスB」が設定されているサンプルが100個含まれるものとする。
続いて、決定木作成部111は、「中間ノードN2」に対して決定木分析のアルゴリズムを適用することで、「中間ノードN2」から「例外クラスB」を好適に分類するには変数S2を変数として選択するとともに変数S2の値d2,mを評価する閾値の値を閾値C2とすることが好適であることを定める。そして決定木作成部111は、「中間ノードN2」から、値d2,mが閾値C2より大きい(d2>C2)サンプルを含む「葉ノードLP1」と、値d2,mが閾値C2以下(d2≦C2)であるサンプルを含む「葉ノードLN1」とを分類する。これにより、「葉ノードLP1」には60個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが50個、「例外クラスB」が設定されているサンプルが10個含まれるものとする。一方、「葉ノードLN1」には40個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが0個、「例外クラスB」が設定されているサンプルが40個含まれるものとする。
また、決定木作成部111は、「中間ノードN3」に対して決定木分析のアルゴリズムを適用することで、「中間ノードN3」から「例外クラスB」を好適に分類するには変数S3を変数として選択するとともに変数S3の値d3,mを評価する閾値の値を閾値C3とすることが好適であることを定める。そして決定木作成部111は、「中間ノードN3」から、値d3,mが閾値C3より大きい(d3>C3)サンプルを含む「中間ノードN4」と、値d3,mが閾値C3以下(d3≦C3)であるサンプルを含む「中間ノードN5」とを分類する。これにより、「中間ノードN4」には68個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが8個、「例外クラスB」が設定されているサンプルが60個含まれるものとする。一方、「中間ノードN5」には42個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが2個、「例外クラスB」が設定されているサンプルが40個含まれるものとする。
さらに、決定木作成部111は、「中間ノードN4」に対して決定木分析のアルゴリズムを適用することで、「中間ノードN4」から「例外クラスB」を好適に分類するには変数S4を変数として選択するとともに変数S4の値d4,mを評価する閾値の値を閾値C4とすることが良好であることを定める。そして決定木作成部111は、「中間ノードN4」から、値d4,mが閾値C4より大きい(d4>C4)サンプルを含む「葉ノードLP2」と、値d4,mが閾値C4以下(d4≦C4)であるサンプルを含む「葉ノードLN2」とを分類する。これにより、「葉ノードLP2」には8個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが7個、「例外クラスB」が設定されているサンプルが1個含まれるものとする。一方、「葉ノードLN2」には60個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが1個、「例外クラスB」が設定されているサンプルが59個含まれるものとする。
続いて、決定木作成部111は、「中間ノードN5」に対して決定木分析のアルゴリズムを適用することで、「中間ノードN5」から「例外クラスB」を好適に分類するには変数S5を変数として選択するとともに変数S5の値d5,mを評価する閾値の値を閾値C5とすることが良好であることを定める。そして決定木作成部111は、「中間ノードN5」から、値d5が閾値C5より大きい(d5>C5)サンプルを含む「葉ノードLP3」と、値d5が閾値C5以下(d5≦C5)であるサンプルを含む「葉ノードLN3」とを分類する。これにより、「葉ノードLP3」には2個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが2個含まれ、「例外クラスB」が設定されているサンプルが0個含まれるものとする。一方、「葉ノードLN3」には40個のサンプルが含まれ、それらサンプルには、「通常クラスA」が設定されているサンプルが0個、「例外クラスB」が設定されているサンプルが40個含まれるものとする。
こうして、決定木作成部111により決定木112が生成される。なお、この決定木112からは、「例外クラスB」を好適に分類することのできるルートとして、「中間ノードN2」と「根ノードN1」とからなるルート、「中間ノードN4」と「中間ノードN3」と「根ノードN1」とからなるルート、「中間ノードN5」と「中間ノードN3」と「根ノードN1」とからなるルートが得られる。つまり、「中間ノードN2」と「根ノードN1」とからなるルートからは、変数S2と変数S1とからなる変数群としての第1の変数群が得られる。また、「中間ノードN4」と「中間ノードN3」と「根ノードN1」とからなるルートからは、変数S4と変数S3と変数S1とからなる変数群としての第2の変数群が得られる。さらに、「中間ノードN5」と「中間ノードN3」と「根ノードN1」とからなるルートからは、変数S5と変数S3と変数S1とからなる変数群としての第3の変数群が得られる。
そして従来、各変数群についてその変数群から得られる組み合わせに基づいて要因解析や推定が行われる。つまり、第1の変数群からは、「変数S2と変数S1」、「変数S2」及び「変数S1」の3つの組み合わせを得る。また、第2の変数群からは、「変数S4と変数S3と変数S1」、「変数S4と変数S3」、「変数S4と変数S1」、「変数S3と変数S1」、「変数S4」、「変数S3」及び「変数S1」の7つの組み合わせを得る。さらに、第3の変数群からは、「変数S5と変数S3と変数S1」、「変数S5と変数S3」、「変数S5と変数S1」、「変数S3と変数S1」、「変数S5」、「変数S3」及び「変数S1」の7つの組み合わせを得る。つまり決定木112から変数の組み合わせを17種類、重複を除くと13種類得ることができる。
変数絞り込み部113は、各ノードに含まれているサンプルに設定されている「例外クラスB」の割合に基づいて、決定木作成部111が生成した決定木112から「例外クラスB」に影響を及ぼす変数(要因)を絞り込む。
まず、図5に示すように、変数絞り込み部113は、決定木112に設けられている各ノードに対する例外率を算出する。例外率は、ノードに含まれる複数のサンプルの分類クラスX1に設定されている「例外クラスB」の割合であって、「例外クラスBの数/(通常クラスAの数+例外クラスBの数)」で示される式から算出される。つまり、「根ノードN1」の例外率は、「通常クラスA」が60個、「例外クラスB」が150個であることから、「0.71」(=150/(60+150))と算出される。また、「中間ノードN2」の例外率は、「通常クラスA」が50個、「例外クラスB」が50個であることから、「0.50」(=50/(50+50))と算出される。さらに、「葉ノードLP1」の例外率は、「通常クラスA」が50個、「例外クラスB」が10個であることから、「0.17」(=10/(50+10))と算出される一方、「葉ノードLN1」の例外率は、「通常クラスA」が0個、「例外クラスB」が40個であることから、「1.00」(=40/(0+40))と算出される。また、「中間ノードN3」の例外率は、「通常クラスA」が10個、「例外クラスB」が100個であることから、「0.91」(=100/(10+100))と算出されるとともに、「中間ノードN4」の例外率は、「通常クラスA」が8個、「例外クラスB」が60個であることから、「0.88」(=60/(8+60))と算出される。さらに、「葉ノードLP2」の例外率は、「通常クラスA」が7個、「例外クラスB」が1個であることから、「0.13」(=1/(7+1))と算出される一方、「葉ノードLN2」の例外率は、「通常クラスA」が1個、「例外クラスB」が59個であることから、「0.98」(=59/(1+59))と算出される。また、「中間ノードN5」の例外率は、「通常クラスA」が2個、「例外クラスB」が40個であることから、「0.95」(=40/(2+40))と算出される。さらに、「葉ノードLP3」の例外率は、「通常クラスA」が2個、「例外クラスB」が0個であることから、「0.00」(=0/(2+0))と算出される一方、「葉ノードLN3」の例外率は、「通常クラスA」が0個、「例外クラスB」が40個であることから、「1.00」(=40/(0+40))と算出される。
また、変数絞り込み部113は、決定木112から「例外クラスB」が好適に分類されるとして選択されたルートに含まれる要素を絞り込む。このとき、ルートには、中間ノードから分類された2つの「葉ノードLP1,LN1(LP2,LN2又はLP3,LN3)」のうち、「例外クラスB」の割合が大きい方の「葉ノードLN1(LN2,LN3)」が含まれるようになっている。図6に示すように、決定木112からは、「ルートR1」と、「ルートR2」と、「ルートR3」とが選択される。つまり、「ルートR1」は、「中間ノードN2」と「根ノードN1」との順の経路からなるルートであって、変数S2と変数S1とからなる組み合わせを有する。また、「ルートR2」は、「中間ノードN4」と「中間ノードN3」と「根ノードN1」との順の経路からなるルートであって、変数S4と変数S3と変数S1とからなる組み合わせを有する。さらに、「ルートR3」は、「中間ノードN5」と「中間ノードN3」と「根ノードN1」との順の経路からなるルートであって、変数S5と変数S3と変数S1とからなる組み合わせを有する。
つまり、変数絞り込み部113は、この選択された各ルートR1,R2,R3に含まれるノード(変数)を絞り込む。絞り込みはルート毎に行われるとともに、絞り込みには中間ノードから分類された2つの葉ノードのうち「例外クラスB」の割合が大きい方の葉ノードにおける「例外クラスB」の割合を用いる。具体的には、絞り込み対象とするルートにおいて、1つのノード(例えば、中間ノードN3)の例外率が、その1つのノードから分類された他のノード(例えば、中間ノードN4)の例外率よりも大きいとき、当該1つのノード(中間ノードN3)を当該ルートから除外することを再帰的に実行することにより行う。なお、上述の絞り込みによって除外された1つのノード(中間ノードN3)が、元のノード(例えば、根ノードN1)から分類されたノードであるとする。この場合、当該元のノード(根ノードN1)の絞り込みでは、その元のノード(根ノードN1)の例外率と、除外された1つのノード(中間ノードN3)からさらに分類された他のノード(中間ノードN4)の例外率とを比較する。つまり、除外された1つのノード(中間ノードN3)からさらに分類された他のノード(中間ノードN4)であれ、元のノード(根ノードN1)から分類されたノードであるため、他のノード(中間ノードN4)の例外率と元のノード(根ノードN1)の例外率を比較することにしている。
続いて、変数絞り込み部113の作用について、図7を参照して説明する。
変数絞り込み部113は、「ルートR1」において、「中間ノードN2」の例外率「0.50」が、「中間ノードN2」から分類された「葉ノードLN1」の例外率「1.00」より大きいとき、「中間ノードN2」を「ルートR1」から除外する。しかしながら、「中間ノードN2」の例外率「0.50」は、「葉ノードLN1」の例外率「1.00」より小さい(YES)ことから「中間ノードN2」は「ルートR1」から除外されない。また、変数絞り込み部113は、「ルートR1」において、「根ノードN1」の例外率「0.71」が、「根ノードN1」から分類された「中間ノードN2」の例外率「0.50」より大きいとき、「根ノードN1」を「ルートR1」から除外する。その通り、「根ノードN1」の例外率「0.71」は、「中間ノードN2」の例外率「0.50」より大きい(NO)ことから「根ノードN1」は「ルートR1」から除外される。
これにより、「ルートR1」に含まれる2つの要素、「中間ノードN2」及び「根ノードN1」が絞り込まれ、「ルートR1」に対して「中間ノードN2」からなる要素の組み合わせが選択される。
また、変数絞り込み部113は、「ルートR2」において、「中間ノードN4」の例外率「0.88」が、「中間ノードN4」から分類された「葉ノードLN2」の例外率「0.98」より大きいとき、「中間ノードN4」を「ルートR2」から除外する。しかしながら、「中間ノードN4」の例外率「0.88」は、「葉ノードLN2」の例外率「0.98」より小さい(YES)ことから「中間ノードN4」は「ルートR2」から除外されない。次に、変数絞り込み部113は、「ルートR2」において、「中間ノードN3」の例外率「0.91」が、「中間ノードN3」から分類された「中間ノードN4」の例外率「0.88」より大きいとき、「中間ノードN3」を「ルートR2」から除外する。その通り、「中間ノードN3」の例外率「0.91」は、「中間ノードN4」の例外率「0.88」より大きい(NO)ことから「中間ノードN3」は「ルートR2」から除外される。続いて、変数絞り込み部113は、「ルートR2」において、「根ノードN1」の例外率を、「根ノードN1」から分類された「中間ノードN3」の例外率と比較しようとするが、「中間ノードN3」は除外されたノードであるため、さらに「中間ノードN3」から分類された「中間ノードN4」を比較対象とする。つまり、変数絞り込み部113は、「ルートR2」において、「根ノードN1」の例外率「0.71」が、「根ノードN1」から「中間ノードN3」を介して分類された「中間ノードN4」の例外率「0.88」より大きいとき、「根ノードN1」を「ルートR2」が除外する。しかしながら、「根ノードN1」の例外率「0.71」は、「中間ノードN4」の例外率「0.88」より小さい(YES)ことから「根ノードN1」は「ルートR2」から除外されない。
このように変数絞り込み部113は、根ノード側のノードの例外率と葉ノード側のノードの例外率とを再帰的に比較することにより、各ルートにおいて選択されるノードの例外率が、どのノード間の比較であっても「葉ノード側のノードの例外率」>「根ノード側のノードの例外率」となるようにしている。
これにより、「ルートR2」に含まれる3つの要素、「中間ノードN4」、「中間ノードN3」及び「根ノードN1」が絞り込まれ、「ルートR2」に対して「中間ノードN4」と「根ノードN1」からなる要素の組み合わせが選択される。
さらに、変数絞り込み部113は、「ルートR3」において、「中間ノードN5」の例外率「0.95」が、「中間ノードN5」から分類された「葉ノードLN3」の例外率「1.00」より大きいとき、「中間ノードN5」を「ルートR3」から除外する。しかしながら、「中間ノードN5」の例外率「0.95」は、「葉ノードLN3」の例外率「1.00」より小さい(YES)ことから「中間ノードN5」は「ルートR3」から除外されない。次に、変数絞り込み部113は、「ルートR3」において、「中間ノードN3」の例外率「0.91」が、「中間ノードN3」から分類された「中間ノードN5」の例外率「0.95」より大きいとき、「中間ノードN3」を「ルートR3」から除外する。しかしながら、「中間ノードN3」の例外率「0.91」は、「中間ノードN5」の例外率「0.95」より小さい(YES)ことから「中間ノードN3」は「ルートR3」から除外されない。続いて、変数絞り込み部113は、「ルートR3」において、「根ノードN1」の例外率「0.71」が、「根ノードN1」から分類された「中間ノードN3」の例外率「0.91」より大きいとき、「根ノードN1」を「ルートR3」から除外する。しかしながら、「根ノードN1」の例外率「0.71」は、「中間ノードN3」の例外率「0.91」より小さい(YES)ことから「根ノードN1」は「ルートR3」から除外されない。
これにより、「ルートR3」に含まれる3つの要素、「中間ノードN5」、「中間ノードN3」及び「根ノードN1」が絞り込まれるものの、「ルートR3」からはいずれのノードも取り除かれず、「ルートR3」に対して「中間ノードN5」と「中間ノードN3」と「根ノードN1」とからなる要素の組み合わせが選択される。
このようにして、「ルートR1」からは要素として「中間ノードN2」が選択され、「ルートR2」からは要素として「中間ノードN4」と「根ノードN1」とが選択され、「ルートR3」からは要素として「中間ノードN5」と「中間ノードN3」と「根ノードN1」とが選択される(変数絞り込み工程)。
ところで各ノードは、分類判定に用いた変数を介して車両20の各情報出力装置に対応している。具体的には、「中間ノードN2」は「変数S2」を介して車両20の「GPS31」に対応付けられている。また、「中間ノードN4」は「変数S4」を介して車両20の「速度計33」に対応付けられているとともに、「根ノードN1」は「変数S1」を介して車両20の「時計30」に対応付けられている。さらに、「中間ノードN5」は「変数S5」を介して車両20の「第1の加速度計34」に対応付けられている。つまり、「例外クラスB」の分類に適した車両20の情報出力装置として、「ルートR1」に基づいて車両20の「GPS31」が選択され、「ルートR2」に基づいて車両20の「速度計33」と「時計30」とが選択され、「ルートR3」に基づいて車両20の「第1の加速度計34」と「照度計32」と「時計30」とが選択される。
これにより、「ルートR1」からは、GPS31(変数S2)の1つの組み合わせを得る。また、「ルートR2」からは、速度計33(変数S4)と時計30(変数S1)、速度計33、及び、時計30の3つの組み合わせを得る。さらに、「ルートR3」からは、第1の加速度計34(変数S5)と照度計32(変数S3)と時計30(変数S1)、第1の加速度計34と照度計32、第1の加速度計34と時計30、照度計32と時計30、第1の加速度計34、照度計32、及び、時計30の7つの組み合わせを得る。つまり変数絞り込み部113により決定木112から変数の組み合わせを11種類、重複を除いて10種類得ることができる。
このように各ルートから選択された車両20の情報出力装置(要素)の組み合わせが、「例外クラスB」を好適に分類できる組み合わせとして、変数絞り込み部113から車両診断装置などに提供される。そして、車両診断装置などでは、変数絞り込み部113から提供された絞り込まれた要素からなる組み合わせに基づいて「例外クラスB」の発生に関する検証などが行われる。このとき、変数の組み合わせが絞り込まれているため、車両診断装置などによる処理負荷の軽減や、処理速度の向上が図られるようになる。
例えば、車両診断装置は、「例外クラスB」に対応する事例の発生を、GPS31から得られた現在位置Paに基づいて検証することができる。また、車両診断装置は、「例外クラスB」に対応する事例の発生を、速度計33から得られた速度Vaと、時計30から得られた時刻Taとからなる組み合わせに基づいて検証することができる。さらに、車両診断装置は、「例外クラスB」に対応する事例の発生を、第1の加速度計34から得られた加速度Aaと、速度計33から得られた速度Vaと、時計30から得られた時刻Taとからなる組み合わせに基づいて検証することができる。
以上説明したように、本実施形態の要因解析装置によれば、以下に列記するような効果が得られるようになる。
(1)決定木112から、「例外クラスB」のばらつきを小さくする、つまり、「例外クラスB」を良好に分割する複数の変数(S1〜S30)として変数群が求められる。そして当該変数群に含まれている複数の変数がそれぞれ、その変数により分類された1又は複数のサンプルを有する各ノード(N1〜N5,LN1〜LN3)に割り当てられている「例外クラスB」の割合に基づいて絞り込まれる。つまり、変数群に含まれる変数が更に絞り込まれ、こうして絞り込まれた1又は複数の変数に基づく変数の組み合わせ数も減少し、それら組み合わせ毎に行われる「例外クラスB」に関する検証等に要する時間や手間などが軽減されるようになる。また、変数から更に絞り込まれた変数によっても適切な解析、推定が行われるように変数群に含まれる変数を絞り込めば、従来よりも推定精度が向上することにもなる。すなわち、「例外クラスB」(出力結果)に多数の変数(要素)が影響を与えるシステムに対し、この要因解析装置は、「例外クラスB」に影響を与えた変数をより容易に、しかも高い精度で解析、推定することができる。
(2)変数群が決定木112のアルゴリズムに基づいて求められるため、決定木112のアルゴリズムを適用する各種の解析装置において求められる変数群から、その変数群に含まれる変数が適切に絞り込まれるようになる。
(3)葉ノード(LN1〜LN3)側のサンプル(D1〜D210)に含まれる「例外クラスB」の割合よりも、根ノード(N1)側のサンプル(D1〜D210)に含まれる「例外クラスB」の割合が大きいとき、当該根ノード(N1)側の変数(S1〜S30)が変数群から除外される。これにより、変数群に含まれる変数から複数のサンプルの分類に対する貢献が小さい変数が除外されるようになるため、変数が絞り込まれた変数群としも複数のサンプルを「例外クラスB」による分類を好適に維持することができる。
(4)変数の絞り込みに適している葉ノード(LN1〜LN3)が選択され、該選択された葉ノード(LN1〜LN3)のサンプルに含まれる「例外クラスB」の割合が変数群に含まれる複数の変数(S1〜S30)の絞り込みに用いられるようになる。すなわち、変数群に含まれる変数の絞り込みが好適になされるようになる。
(5)複数のサンプルD1〜D210から「例外クラスB」の発生に影響があると思われる変数(S1〜S30)が取得できるようになる。例外事例を車両20にとって好ましくない事例である「例外クラスB」としている。このことから、当該例外事例に影響を与える変数の取得により、車両20にとって好ましくない事例に関する検証が好適に実行できるため、車両20に生じる例外事例へ適切に対応することができるようになることが期待される。
(6)車両20においては、速度Vaや加速度Aaなどの車両状態に相関があったり、ステアリング操作や道路状況などの車両状態と車両環境との間に相関があったり、各車両状態や車両環境等の各要素(変数)間に相関がある、つまり各要素間の独立性が低く相互に干渉がある場合が多い。こうした、干渉の多い複数の要素から、目的とする特定の車両状態、いわゆる例外事例(例えば、「例外クラスB」)を生じさせている要素の組み合わせを推定することは容易ではない。また、干渉の多い要素から、目的とする特定の車両状態を好適に切り分ける要素を選択することも容易でなく、解析によって、特定の車両状態に影響を及ぼすものとして選択される要素の数が多くなる傾向にある。そのため、選択された要素の組み合わせに基づいて、特定の車両状態を検証する際、それら要素の組み合わせを多数検証することとなり、検証に要する時間や手間が無視できない。
これに対し、本実施形態によれば、車両20から取得された車両状態又は車両環境から、「例外クラスB」に影響を与えるものとして得られた車両状態又は車両環境が、その車両状態又は車両環境により分類された1又は複数のサンプル(D1〜D210)に割り当てられている「例外クラスB」の割合に基づいて絞り込まれる。つまり、車両20のように特定の車両状態に影響を及ぼすものとして選択される変数の数が多い傾向にあるシステムであれ、選択される車両状態又は車両環境の数を絞り込むことができるようになる。これにより、絞り込まれた車両状態又は車両環境の組み合わせに基づいて、「例外クラスB」を生じる車両状態を検証することができるようになるため、それら車両状態又は車両環境の組み合わせ数に対応する検証数が減ることになり、「例外クラスB」の検証に要する時間や手間などが軽減されるようになる。
(その他の実施形態)
なお、上記実施形態は、例えば以下のような態様にて実施することもできる。
・上記実施形態では、各車両20a〜20dが同一の車種からなる場合について例示した。しかしこれに限らず、解析、推定対象とする例外事例が車種による影響が無い、もしくは小さい例外事例であれば、各車両が同一の車種ではなく、それぞれ異なる車種であってもよい。これにより、要因解析装置の適用可能性の向上が図られる。
・上記実施形態では、各車両20a〜20dが同一の種類からなるデータを収集する場合について例示した。しかしこれに限らず、解析、推定対象とする例外事例に影響を及ぼさないデータ、例えば、解析に利用しないデータであれば、各車両は利用されないデータを各車両の状況に応じて収集しても、逆に、収集しなくてもよい。これにより、要因解析装置の適用される車両の構成の自由度が向上するようになる。
・上記実施形態では、車両20の記憶装置22に記憶されたサンプルD1が情報処理センタ10に送信される場合について例示した。しかしこれに限らず、車両は取得したサンプルを直ちに情報処理センタに送信してもよい。これにより、要因解析を適用することができるシステムの設計自由度が向上されるようになる。
・上記実施形態では、情報処理センタ10と複数の車両20とが無線接続されている場合について例示した。しかしこれに限らず、情報センタに車両のデータを集めることができるのであれば、停止した車両を情報センタに有線接続させて車両から情報センタにデータを転送してもよいし、USBメモリや、HDDや、CD−ROMなどの記憶媒体にデータを記憶させたのちに当該記憶媒体から情報センタにデータを転送してもよい。これにより、システム構成の設計自由度の向上が図られる。
・上記実施形態では、同時に取得された時刻Ta、現在位置Pa、照度値La、速度Va、第1の加速度Aa及び第2の加速度Abなどが1つのサンプルD1(D2〜D210)に含まれている場合について例示した。しかしこれに限らず、サンプルに含まれる時刻、現在位置、照度値、走行速度、第1の加速度及び第2の加速度などの値は、要因解析に用いることが可能であるならば、同時に取得されたものでなくてもよい。例えば、値を後から追加してもよいし、時間差のある値を1つのサンプルにしてもよい。これにより、この要因解析装置を適用することがシステムの可能性が拡大される。
・上記実施形態では、複数のサンプルが210個のサンプルD1〜D210からなる場合について例示した。しかしこれに限らず、複数のサンプルの数は、210個未満であっても、210個より多くてもよい。サンプルの数がいくつであれ、サンプル数に応じた解析結果を得ることができる。これにより、要因解析装置の設計自由度を高めることができる。
・上記実施形態では、各サンプルD1〜D210には30種類の変数S1〜S30に対応する30個の値dn,mが含まれている場合について例示した。しかしこれに限らず、各サンプルに含まれている変数の数、つまり情報出力装置から取得された値の数は、それぞれ30個未満であっても、30個より多くてもよい。情報出力装置の数がいくつであれ、情報出力装置からの値に基づく解析結果を得ることができる。これにより、要因解析装置の設計自由度を高めることができる。
・上記実施形態では、各サンプルD1〜D210には30種類の変数S1〜S30に対応する値dn,mがそれぞれ含まれている場合について例示した。しかしこれに限らず、サンプルは、一部の情報出力装置の値が含まれていなくてもよい。値が欠落したサンプルであれ、欠落が影響しない要因解析に用いることができる、一方、欠落が影響する要因解析には当該サンプルを用いないようにすることもできる。これにより、この要因解析装置を適用することのできるシステムの可能性が拡大される。
・上記実施形態では、分類クラスには「通常クラスA」と「例外クラスB」との2つのクラスが設けられている場合について例示した。しかしこれに限らず、分類クラスには、2つよりも多いクラスが設けられていてもよい。この場合であれ、対象とするクラスに影響を及ぼす変数を好適に絞り込むことができるようになる。これにより、この要因解析装置を、様々な決定木分析に対して適用することができるようになる。
・上記実施形態では、サンプルD1〜D210を5つの変数S1〜S5で切り分けて決定木112を作成する場合について例示した。しかしこれに限らず、要因解析に必要となる変数の数は5より少なくとも、5より多くてもよくてもよい。これにより、種々の状態に対する要因解析をすることができるようになる。
・上記実施形態では、変数絞り込み部113は、葉ノードLP1〜LP3に対しても例外率を算出する場合について例示したが、これに限らず、変数絞り込み部は、絞り込みに用いられない葉ノードLP1〜LP3の例外率を算出しなくてもよい。これにより、要因解析にかかる設計の自由度が向上されるようになる。
・上記実施形態では、情報処理センタ10が車両20外にある場合について例示した。しかしこれに限らず、情報処理センタにおける機能の全部もしくは一部が車両に設けられてもよい。例えば、1台の車両で、サンプルの取得をして当該車両に対する要因解析を実行してもよいし、1台の車両が、他車両の情報を情報処理センタや車車間通信によって他車両から取得して当該車両に対する要因解析を実行してもよい。また、情報処理センタにおける機能の全部もしくは一部が他車両に設けられてもよい。
これにより、こうした要因解析装置の設計自由度や採用可能性などが向上するようになる。
・上記実施形態では、「葉ノード側のノードの例外率」>「根ノード側のノードの例外率」となるノードを選択する場合について例示した。しかしこれに限らず、「葉ノード側のノードの例外率」≧「根ノード側のノードの例外率」となるノードを選択してもよいし、少なくとも一方に所定の係数を乗じて比較するようにしてもよい。これにより、要因解析装置の解析結果を好適に調整することも可能になる。
・上記実施形態では、根ノード側のノードの「例外クラスB」の割合が、葉ノード側のノードの「例外クラスB」の割合より大きい場合、根ノード側のノードの変数を除外することを再帰的に繰り返す場合について例示した。しかしこれに限らず、ノード(変数)の除外を再帰的に繰り返さず、途中で中断してもよい。中断した場合であれ、除外された変数に応じて組み合わせ数を減らすことができる。これにより、要因解析装置の設計自由度の向上が図られるようになる。
・上記実施形態では、「例外クラスB」の要因を解析する場合について例示した。しかしこれに限らず、通常クラスの要因を解析してもよい。このとき、変数絞り込み部は、例えば、通常率に基づいて変数を絞り込むようにすれば、変数群に含まれている変数を絞り込むことができる。これにより、要因解析装置の適用範囲の拡大が図られるようになる。
・上記実施形態では、車両20の要因解析を行う場合について例示した。しかしこれに限らず、同様の種類の変数を含むサンプルを複数取得可能であれば、鉄道、船舶、飛行機などの移動体や、製造ライン、プラントなどの製造装置、道路情報などのデータ処理などにも適用することができる。これにより、こうした要因解析装置の適用範囲の拡大が図られるようになる。
10…情報処理センタ、11…情報処理部、12…記憶装置、13…通信部、20…車両、20a〜20d…車両、21…車両制御装置、22…記憶装置、23…通信部、30…時計、31…GPS、32…照度計、33…速度計、34…第1の加速度計、35…第2の加速度計、111…決定木作成部、112…決定木、113…変数絞り込み部、121…データベース、C1〜C5…閾値、D1〜D210…サンプル、LN1〜LN3…葉ノード、LP1〜LP3…葉ノード、N1…根ノード、N2〜N5…中間ノード、R1〜R3…ルート、X1…分類クラス。

Claims (12)

  1. 複数の変数を含む複数のサンプルが、それらサンプルの別に複数の分類クラスの1つが割り当てられて記憶されている記憶部と、
    前記複数のサンプルを各変数の別に分類したときに、前記複数の分類クラスのうちの選択された特定の分類クラスのばらつきが小さくなるように前記変数を順に選択しつつ前記複数のサンプルを変数別のサンプルに順次分類していくことで分類に影響を及ぼす複数の変数からなる変数群を得る解析部と、
    を備える要因解析装置であって、
    前記変数群に含まれている複数の変数を、それぞれの変数によって分類された複数のサンプルに設定されている前記特定の分類クラスの割合に基づいて絞り込む変数絞り込み部を備える
    ことを特徴とする要因解析装置。
  2. 前記解析部では、前記分類クラスを、複数のサンプルを分類するための目的変数とし、前記サンプルを、分類クラスにより分類される説明変数とする決定木による解析によって前記変数群を得る
    請求項1に記載の要因解析装置。
  3. 前記解析部は、前記決定木を、全てのサンプルを含む1つの根ノードと、順次分類した結果、分類不可能になった1又は複数のサンプルからなる複数の葉ノードを有するものとして得るとともに、前記変数群に含まれる複数の変数を、前記1つの根ノードから前記複数の葉ノードのうちの一つまでの経路に含まれる変数から構成し、
    前記変数絞り込み部は、前記変数群に含まれている複数の変数の絞り込みを、前記変数群に含まれる複数の変数により分類される複数のサンプルに対応付けられる特定の分類クラスの割合が、前記経路にあって葉ノード側で分類された1又は複数のサンプルに対応付けられる特定の分類クラスの割合よりも大きいとき、前記変数群から前記変数を除外することを再帰的に実行することにより行う
    請求項2に記載の要因解析装置。
  4. 前記変数絞り込み部は、前記変数により分類された1又は複数のサンプルによって複数の葉ノードが生成されたとき、それら複数の葉ノードの各葉ノードのサンプルに対応付けられる特定の分類クラスの割合が大きい方の葉ノードにおける特定の分類クラスの割合を前記変数群の絞り込みに用いる
    請求項3に記載の要因解析装置。
  5. 前記複数の分類クラスは、通常事例を示す通常クラスと例外事例を示す例外クラスとの2つのクラスからなり、
    前記特定の分類クラスが前記例外クラスである
    請求項1〜4のいずれか一項に記載の要因解析装置。
  6. 前記変数が車両状態又は車両環境を示す情報であり、
    前記サンプルが1つの車両から同時刻に得られる複数の車両状態又は車両環境からなるとともに、前記複数のサンプルが時刻及び車両の少なくとも一方が相互に異なるサンプルからなり、
    前記例外クラスとして、特定の車両状態が設定され、
    前記変数絞り込み部では、前記特定の車両状態が設定された割合に基づいて、前記変数群に含まれている複数の車両状態又は車両環境の絞り込みを実行する
    請求項5に記載の要因解析装置。
  7. 複数の変数を含む複数のサンプルを、それらサンプルの別に複数の分類クラスの1つの分類クラスが割り当てられるように記憶部に記憶する記憶工程と、
    前記複数のサンプルを各変数の別に分類したときに、前記複数の分類クラスのうちの選択された特定の分類クラスのばらつきが小さくなるように前記変数を順に選択しつつ前記複数のサンプルを変数別のサンプルに順次分類していくことで分類に影響を及ぼす複数の変数からなる変数群を得る解析工程と、
    前記変数群に含まれている複数の変数を、それぞれの変数によって分類された複数のサンプルに設定されている前記特定の分類クラスの割合に基づいて絞り込む変数絞り込み工程を備える
    ことを特徴とする要因解析方法。
  8. 前記解析工程では、前記分類クラスを、複数のサンプルを分類するための目的変数とし、前記サンプルを、分類クラスにより分類される説明変数とする決定木による解析によって前記変数群を得る
    請求項7に記載の要因解析方法。
  9. 前記解析工程では、前記決定木を、全てのサンプルを含む1つの根ノードと、順次分類した結果、分類不可能になった1又は複数のサンプルからなる複数の葉ノードを有するものとして得るとともに、前記変数群に含まれる複数の変数を、前記1つの根ノードから前記複数の葉ノードのうちの一つまでの経路に含まれる変数から構成し、
    前記変数絞り込み工程では、前記変数群に含まれている複数の変数の絞り込みを、前記変数群に含まれる複数の変数により分類される複数のサンプルに対応付けられる特定の分類クラスの割合が、前記経路にあって葉ノード側で分類された1又は複数のサンプルに対応付けられる特定の分類クラスの割合よりも大きいとき、前記変数群から前記変数を除外することを再帰的に実行することにより行う
    請求項8に記載の要因解析方法。
  10. 前記変数絞り込み工程では、前記変数により分類された1又は複数のサンプルによって複数の葉ノードが生成されたとき、それら複数の葉ノードの各葉ノードのサンプルに対応付けられる特定の分類クラスの割合が大きい方の葉ノードにおける特定の分類クラスの割合を前記変数群の絞り込みに用いる
    請求項9に記載の要因解析方法。
  11. 前記複数の分類クラスは、通常事例を示す通常クラスと例外事例を示す例外クラスとの2つのクラスからなり、
    前記特定の分類クラスを前記例外クラスとする
    請求項7〜10のいずれか一項に記載の要因解析方法。
  12. 前記変数として車両状態を示す情報を用い、
    前記サンプルを1つの車両から同時刻に得られた複数の車両状態又は車両環境とするとともに、前記複数のサンプルを時刻及び車両の少なくとも一方が相互に異なるサンプルとし、
    前記例外クラスとして、特定の車両状態を設定し、
    前記変数絞り込み工程では、前記特定の車両状態の設定された割合に基づいて、前記変数群に含まれている複数の車両状態又は車両環境の絞り込みを実行する
    請求項11に記載の要因解析方法。
JP2012054522A 2012-03-12 2012-03-12 要因解析装置及び要因解析方法 Expired - Fee Related JP5817600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012054522A JP5817600B2 (ja) 2012-03-12 2012-03-12 要因解析装置及び要因解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012054522A JP5817600B2 (ja) 2012-03-12 2012-03-12 要因解析装置及び要因解析方法

Publications (2)

Publication Number Publication Date
JP2013190214A true JP2013190214A (ja) 2013-09-26
JP5817600B2 JP5817600B2 (ja) 2015-11-18

Family

ID=49390652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012054522A Expired - Fee Related JP5817600B2 (ja) 2012-03-12 2012-03-12 要因解析装置及び要因解析方法

Country Status (1)

Country Link
JP (1) JP5817600B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002324206A (ja) * 2001-04-25 2002-11-08 Fujitsu Ltd データ解析方法及び装置
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002324206A (ja) * 2001-04-25 2002-11-08 Fujitsu Ltd データ解析方法及び装置
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP5817600B2 (ja) 2015-11-18

Similar Documents

Publication Publication Date Title
US11113903B2 (en) Vehicle monitoring
JP5573743B2 (ja) 車両データ解析装置、車両データ解析方法、及び故障診断装置
JP7228151B2 (ja) 渋滞予測システム、渋滞予測方法、学習装置、予測装置、プログラム、および学習済みモデル
US20160203560A1 (en) Driver assessment and recommendation system in a vehicle
US20170132117A1 (en) Method and device for generating test cases for autonomous vehicles
US11455203B2 (en) Abnormality detection support device, abnormality detection support method, and program
CN109033966B (zh) 绕路检测模型训练方法和装置,以及绕路检测方法和装置
WO2016122591A1 (en) Performance testing based on variable length segmentation and clustering of time series data
US20230283617A1 (en) Attack analysis device, attack analysis method, and non-transitory computer-readable recording medium
US20180130271A1 (en) Vehicle Operation Data Collection Apparatus, Vehicle Operation Data Collection System, and Vehicle Operation Data Collection Method
US9805523B2 (en) Diagnostic procedures and method of collecting vehicles
US9032518B2 (en) Internet monitoring and alerting system
JP2013196698A (ja) システム監視
US9104199B2 (en) Engine monitoring
JP6627765B2 (ja) 監視装置及びその監視方法、監視システム、並びにコンピュータ・プログラム
CN116257663A (zh) 面向无人地面车辆的异常检测与关联分析方法及相关设备
JP5817600B2 (ja) 要因解析装置及び要因解析方法
US20210179120A1 (en) Vehicle data classifying method and vehicle data classifying device
WO2017178550A1 (fr) Procédé de contrôle d&#39;intégrité de l&#39;avionique d&#39;un aéronef, dispositif et produit programme d&#39;ordinateur associés
JP2010205089A (ja) 道路交通情報作成装置および道路交通情報作成方法
JP6677074B2 (ja) 運転診断装置
JP2020107248A (ja) 異常判定装置および異常判定方法
JP2020021305A (ja) 情報処理方法、サーバ及びプログラム
WO2017223108A1 (en) Machine monitoring
FR2908384A1 (fr) Systeme de surveillance et d&#39;alarme pour aeronef

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150914

R151 Written notification of patent or utility model registration

Ref document number: 5817600

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees