JP2004246622A - Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device - Google Patents
Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device Download PDFInfo
- Publication number
- JP2004246622A JP2004246622A JP2003035637A JP2003035637A JP2004246622A JP 2004246622 A JP2004246622 A JP 2004246622A JP 2003035637 A JP2003035637 A JP 2003035637A JP 2003035637 A JP2003035637 A JP 2003035637A JP 2004246622 A JP2004246622 A JP 2004246622A
- Authority
- JP
- Japan
- Prior art keywords
- data
- outlier
- data set
- identifier
- visualized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、データ集合からの外れ値の検出を支援するための外れ値検出支援プログラム、外れ値検出支援方法および外れ値検出支援装置に関するものであり、特に、外れ値の検出や削除にかかる効率を高めることができる外れ値検出支援プログラム、外れ値検出支援方法および外れ値検出支援装置に関するものである。
【0002】
【従来の技術】
従来より、データマイニング、データ解析、パターン認識の分野においては、解析に悪影響を及ぼす異常な値を持ったデータ、すなわち、外れ値を検出することが非常に重要である。例えば、ただ1個の外れ値が存在しただけで、識別や予測の精度の低下を引き起こす場合があるため、主として統計学の分野においては、外れ値を検出する技術が開発されている。
【0003】
図12は、従来のデータテーブル10を示す図である。このデータテーブル10には、属性1(例えば、気温)および属性2(例えば、長さ)の各データが格納されている。
【0004】
データテーブル10において、レコード番号は、各レコードに対応付けられた番号である。属性1は、例えば、気温のデータである。属性2は、例えば、長さのデータである。すなわち、データテーブル10では、気温と長さとの対応関係が表現されている。
【0005】
図13は、図12に示したデータテーブル10における各レコードのデータ(属性1:気温、属性2:長さ)をプロットした散布図20である。この散布図20において、横軸が属性1(気温)に対応しており、縦軸が属性2(長さ)に対応している。この散布図20においては、例えば、丸枠21内のプロットが外れ値とされる。
【0006】
従って、オペレータは、丸枠21内のプロット(データ)を外れ値として検出し、除去するために、散布図20から同プロットのデータ(属性1および属性2)を読みとる。つぎに、オペレータは、図12に示したデータテーブル10から、読みとったデータ(属性1および属性2)に対応するレコードを検索した後、同レコード(外れ値)を削除する。
【0007】
これにより、散布図20からは、外れ値(丸枠21内のプロット)が除去される。以後、上記動作が繰り返されることにより、外れ値の検出、除去が行われる。
【0008】
【非特許文献1】
末永高志、佐藤新、坂野鋭著、「クラスタ構造に着目した特徴空間の可視化−クラスタ判別法−」、「電子情報通信学会論文誌 D−II、Vol.J85−D−II No.5」、(社)電子情報通信学会発行、2002年5月、pp785−795
【0009】
【発明が解決しようとする課題】
ところで、前述したように、従来においては、図13に示した散布図20を一見しただけでは各プロットとデータテーブル10(図12参照)の各レコードとの対応関係が判らないため、散布図20で読みとったプロット(外れ値)のデータをキーとして、データテーブル10から外れ値に対応するレコードを検索、削除しなければならない。
【0010】
このように、従来では、外れ値の検出や除去にかかる時間や手間が非常にかかり効率が悪いという問題があった。
【0011】
本発明は、上記に鑑みてなされたもので、外れ値の検出や除去にかかる効率を高めることができる外れ値検出支援プログラム、外れ値検出支援方法および外れ値検出支援装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
上記目的を達成するために、請求項1にかかる発明は、コンピュータを、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段、前記データ集合を可視化する可視化手段、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段、前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定手段、として機能させるための外れ値検出支援プログラムである。
【0013】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定することとしたので、外れ値の検出にかかる効率を高めることができる。
【0014】
また、請求項2にかかる発明は、請求項1に記載の外れ値検出支援プログラムにおいて、前記コンピュータを、前記可視化されたデータ集合においてデータの重なりがある部分を拡大表示させる拡大表示手段、として機能させることを特徴とする。
【0015】
この発明によれば、可視化されたデータ集合においてデータの重なりがある部分を拡大表示させることとしたので、データの重なりがある場合であっても、外れ値の検出にかかる効率を高めることができる。
【0016】
また、請求項3にかかる発明は、請求項1または2に記載の外れ値検出支援プログラムにおいて、前記可視化手段は、前記可視化されたデータ集合において、所定の条件を満たす外れ値の候補としてのデータを色分けにて可視化することを特徴とする。
【0017】
この発明によれば、可視化されたデータ集合において、所定の条件を満たす外れ値の候補としてのデータを色分けにて可視化することとしたので、外れ値の検出にかかる効率をさらに高めることができる。
【0018】
また、請求項4にかかる発明は、請求項1〜3のいずれか一つに記載の外れ値検出支援プログラムにおいて、前記コンピュータを、前記外れ値指定手段により指定されたデータ識別子に対応するデータを外れ値として除去する除去手段、として機能させることを特徴とする。
【0019】
この発明によれば、指定されたデータ識別子に対応するデータを外れ値として除去することとしたので、外れ値の除去にかかる効率を高めることができる。
【0020】
また、請求項5にかかる発明は、コンピュータを、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段、前記データ集合を可視化する可視化手段、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段、前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去手段、として機能させるための外れ値検出支援プログラムである。
【0021】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去することとしたので、外れ値の検出や除去にかかる効率を高めることができる。
【0022】
また、請求項6にかかる発明は、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定工程と、前記データ集合を可視化する可視化工程と、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示工程と、前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定工程と、を含むことを特徴とする。
【0023】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定することとしたので、外れ値の検出にかかる効率を高めることができる。
【0024】
また、請求項7にかかる発明は、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定工程と、前記データ集合を可視化する可視化工程と、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示工程と、前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去工程と、を含むことを特徴とする。
【0025】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去することとしたので、外れ値の検出や除去にかかる効率を高めることができる。
【0026】
また、請求項8にかかる発明は、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段と、前記データ集合を可視化する可視化手段と、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段と、前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定手段と、を備えたことを特徴とする。
【0027】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定することとしたので、外れ値の検出にかかる効率を高めることができる。
【0028】
また、請求項9にかかる発明は、外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段と、前記データ集合を可視化する可視化手段と、前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段と、前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去手段と、を備えたことを特徴とする。
【0029】
この発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去することとしたので、外れ値の検出や除去にかかる効率を高めることができる。
【0030】
【発明の実施の形態】
以下、図面を参照して本発明にかかる外れ値検出支援プログラム、外れ値検出支援方法および外れ値検出支援装置の一実施の形態について詳細に説明する。
【0031】
図1は、本発明にかかる一実施の形態の構成を示すブロック図である。この図において、外れ値検出支援装置100は、データ集合からの外れ値の検出や削除を支援する装置である。外れ値検出支援装置100において、入力部101は、キーボード、マウス、データ入力装置等である。表示部102は、各種データ散布図(図4〜図8参照)を表示する。
【0032】
制御部103は、各種制御(散布図の表示制御、外れ値の検出支援制御等)を行う。この制御部103の動作の詳細については、後述する。記憶部104は、制御部103の制御により各種データを記憶する。
【0033】
オリジナルデータベース110は、外れ値を検出するための外れ値検出処理が施される前のオリジナルデータをファイル単位で格納するデータベースである。図2(a)に示したオリジナルデータテーブル200は、オリジナルデータベース110に格納されている複数のファイルのうち、ある一つのファイルを開いたものである。
【0034】
オリジナルデータテーブル200において、レコード番号は、各レコードに対応付けられた番号である。ここで、オリジナルデータテーブル200においては、レコードが削除された場合、削除されたレコードより下のレコードに対応するレコード番号が1つずつ繰り上げられ、最上位レコードから最下位レコードまで連番とされる。属性1〜属性nは、n個の属性を有するデータである。例えば、属性1が血圧のデータ、属性2が身長のデータ、・・・、属性nが血糖値のデータである。
【0035】
図1に戻り、処理済みデータベース120は、上述した外れ値検出が施され、オリジナルデータから外れ値が除外された処理済みデータをファイル単位で格納するデータベースである。
【0036】
(動作例1)
つぎに、一実施の形態の動作例1について、図3〜図8を参照しつつ説明する。図3は、一実施の形態の動作例1を説明するフローチャートである。同図に示したステップSA1では、制御部103は、オリジナルデータベース110から外れ値検出対象のファイルを開き、図2(a)に示した初期のオリジナルデータテーブル200を記憶部104上に展開する。
【0037】
ステップSA2では、制御部103は、図2(a)に示した初期のオリジナルデータテーブル200の各レコードに対応させて、識別番号テーブル210を作成する。この識別番号テーブル210は、オリジナルデータテーブル200における各データを識別するための識別番号を格納するテーブルである。
【0038】
初期のオリジナルデータテーブル200に対応する識別番号テーブル210では、レコード番号と同一の識別番号が付与されている。ここで、識別番号テーブル210においては、図2(b)に示したようにオリジナルデータテーブル200のレコード200aが削除された場合、当該レコード200aに対応するレコード210aが削除され、識別番号2が欠番となるが、その他の識別番号1、3〜mが不変とされる。これにより、図2(c)に示したた識別番号テーブル210’が作成される。
【0039】
これに対して、オリジナルデータテーブル200においては、図2(b)に示したようにレコード200aが削除された場合、当該レコード200aに対応するレコードが削除され、その他の識別番号3〜mが一つずつ繰り上げられ、識別番号2〜m−1とされる。これにより、図2(c)に示したオリジナルデータテーブル200’が作成される。
【0040】
ステップSA3およびステップSA4では、周知のクラスタ判別法により、高次元(この場合、属性1〜nであるためn次元)のデータを低次元(この場合、2次元)のデータに圧縮する処理が実行される。クラスタ判別法は、高次元空間でクラスタリングを行い、求められたクラスタに属するデータを独立したカテゴリとみなして、判別分析を用いて低次元空間への写像を求める、データの可視化手法である。
【0041】
すなわち、高次元のデータは、散布図にプロットし、データを可視化することが困難である。そこで、高次元のデータを低次元(2次元)のデータに圧縮することで、二次元のデータを散布図にプロットし、データの可視化が可能となる。
【0042】
ステップSA3では、制御部103は、クラスタ数を指定する。ステップSA4では、制御部103は、クラスタ判別法の判別分析により、図2(a)に示したオリジナルデータテーブル200に格納された高次元(n次元)のオリジナルデータを、低次元(2次元)のデータに圧縮する。これにより、属性1〜属性nは、1次元の属性および2次元の属性に圧縮される。
【0043】
なお、オリジナルデータテーブル200に2次元(属性1および属性2)のオリジナルデータのみが既に格納されている場合には、ステップSA3およびステップSA4の処理がスキップされる。
【0044】
ステップSA5では、制御部103は、オリジナルデータテーブル200の各レコード(但し、n次元から2次元に圧縮されたデータ(1次元の属性および2次元の属性)を各プロットとして図4に示した散布図300を表示部102に表示させる。この散布図300において、横軸が1次元(属性)に対応しており、縦軸が2次元(属性)に対応している。
【0045】
ステップSA6では、制御部103は、図4に示した散布図300の各プロット(各レコード)の近傍に、図2(a)に示した識別番号テーブル210の各識別番号を表示させ、散布図300を図5に示した散布図310とする。例えば、図5に示した散布図310の「14」は、図2(a)に示した識別番号テーブル210の識別番号(=14)に対応している。
【0046】
ステップSA7では、制御部103は、図5に示した散布図310においてプロットが重複しており、識別番号が見にくい部分があるか否かを判断する。この場合、図6に示した枠311内に存在する複数のプロットが重複しているため、制御部103は、ステップSA7の判断結果を「Yes」とする。なお、ステップSA7の判断結果が「No」である場合、制御部103は、ステップSA8の判断を行う。
【0047】
ステップSA12では、制御部103は、図6に示した枠311(重複部分)を拡大し、図7に示した拡大散布図320を、散布図310(図6参照)とともに表示部102に並列的に表示させる。これにより、識別番号やプロットが見易くなる。
【0048】
ステップSA8では、制御部103は、オペレータにより、散布図310(図6参照)および拡大散布図320(図7参照)において外れ値が存在していることを指示されたか否かを判断する。
【0049】
この場合、オペレータは、図8に示した散布図310の「14」(丸枠312)に対応するプロット(データ)を外れ値として認識し、入力部101を用いて、外れ値が存在しているという指示を出す。
【0050】
これにより、制御部103は、ステップSA8の判断結果を「Yes」とする。ステップSA9では、オペレータは、入力部101を用いて、当該外れ値に対応する識別番号「14」を指定する。
【0051】
ステップSA10では、制御部103は、指定された上記識別番号「14」に対応するレコードをオリジナルデータテーブル200および識別番号テーブル210から削除する。ここで、当該識別番号「14」は欠番となる。以後、ステップSA8の判断結果が「No」になるまで、ステップSA3〜ステップSA10が繰り返される。
【0052】
そして、ステップSA8の判断結果が「No」になると、ステップSA11では、制御部103は、外れ値に対応するレコードが削除されたオリジナルデータテーブル200を処理済みデータとして処理済みデータベース120に格納する。
【0053】
(動作例2)
さて、一実施の形態においては、散布図で外れ値の候補を色分け表示させ、オペレータによる外れ値の検出支援を行ってもよい。以下では、この場合を動作例2として説明する。図9は、一実施の形態の動作例2を説明するフローチャートである。
【0054】
同図に示したステップSB1〜ステップSB4では、前述したステップSA1〜ステップSA4(図3参照)と同様の処理が実行される。
【0055】
ステップSB5では、制御部103は、オリジナルデータテーブル200の各レコード(但し、n次元から2次元に圧縮されたデータ(1次元の属性および2次元の属性))を各プロットとして図4に示した散布図300を表示部102に表示させる。
【0056】
ステップSB6では、制御部103は、図4に示した散布図300の各プロット(各レコード)の近傍に、図2(a)に示した識別番号テーブル210の各識別番号を表示させ、散布図300を図5に示した散布図310とする。
【0057】
ステップSB7では、制御部103は、外れ値の候補として、クラスタ数が1のプロット(識別番号)を赤色で表示させる。この場合、例えば、識別番号「14」およびこれに対応するプロットが赤色で表示されたとする。
【0058】
ステップSB8では、制御部103は、図5に示した散布図310においてプロットが重複しており、識別番号が見にくい部分があるか否かを判断し、この場合、判断結果を「Yes」とする。なお、ステップSB8の判断結果が「No」である場合、制御部103は、ステップSB9の判断を行う。
【0059】
ステップSB13では、制御部103は、図6に示した枠311(重複部分)を拡大し、図7に示した拡大散布図320を、散布図310(図6参照)とともに表示部102に並列的に表示させる。
【0060】
ステップSB9では、制御部103は、オペレータにより、散布図310(図6参照)および拡大散布図320(図7参照)において除去したいプロットが存在していることを指示されたか否かを判断する。
【0061】
この場合、オペレータは、図8に示した散布図310において、赤色表示された「14」(丸枠312)に対応するプロット(データ)を外れ値として認識し、入力部101を用いて、除去したいプロットが存在しているという指示を出す。
【0062】
これにより、制御部103は、ステップSB9の判断結果を「Yes」とする。ステップSB10では、オペレータは、入力部101を用いて、当該外れ値に対応する除去プロットの識別番号「14」を指定する。
【0063】
ステップSB11では、制御部103は、指定された上記識別番号「14」に対応するレコードをオリジナルデータテーブル200および識別番号テーブル210から削除する。ここで、当該識別番号「14」は欠番となる。以後、ステップSB9の判断結果が「No」になるまで、ステップSB3〜ステップSB11が繰り返される。
【0064】
そして、ステップSB9の判断結果が「No」になると、ステップSB12では、制御部103は、外れ値に対応するレコードが削除されたオリジナルデータテーブル200を処理済みデータとして処理済みデータベース120に格納する。
【0065】
(動作例3)
さて、一実施の形態の動作例2においては、散布図で外れ値の候補を色分け表示させ、オペレータの指示に従って、外れ値を検出し、除去する場合について説明したが、オペレータを介入させずに、色分け表示されたプロットを外れ値として自動的に除去してもよい。以下では、この場合を動作例3として説明する。図10は、一実施の形態の動作例3を説明するフローチャートである。
【0066】
同図に示したステップSC1〜ステップSC4では、前述したステップSA1〜ステップSA4(図3参照)と同様の処理が実行される。
【0067】
ステップSC5では、制御部103は、オリジナルデータテーブル200の各レコード(但し、n次元から2次元に圧縮されたデータ(1次元の属性および2次元の属性))を各プロットとして図4に示した散布図300を表示部102に表示させる。
【0068】
ステップSC6では、制御部103は、図4に示した散布図300の各プロット(各レコード)の近傍に、図2(a)に示した識別番号テーブル210の各識別番号を表示させ、散布図300を図5に示した散布図310とする。
【0069】
ステップSC7では、制御部103は、外れ値の候補として、クラスタ数が1のプロット(識別番号)を赤色で表示させる。この場合、例えば、識別番号「14」およびこれに対応するプロットが赤色で表示されたとする。
【0070】
ステップSC8では、制御部103は、図5に示した散布図310においてプロットが重複しており、識別番号が見にくい部分があるか否かを判断し、この場合、判断結果を「Yes」とする。なお、ステップSC8の判断結果が「No」である場合、制御部103は、ステップSC9の判断を行う。
【0071】
ステップSC12では、制御部103は、図6に示した枠311(重複部分)を拡大し、図7に示した拡大散布図320を、散布図310(図6参照)とともに表示部102に並列的に表示させる。
【0072】
ステップSC9では、制御部103は、散布図310(図6参照)および拡大散布図320(図7参照)において、外れ値としての赤色プロットが存在するか否かを判断する。この場合、制御部103は、図8に示した散布図310において、赤色表示された「14」(丸枠312)に対応するプロット(データ)が存在しているため、ステップSC9の判断結果を「Yes」とする。
【0073】
ステップSC10では、制御部103は、指定された上記識別番号「14」に対応するレコードをオリジナルデータテーブル200および識別番号テーブル210から削除する。ここで、当該識別番号「14」は欠番となる。以後、ステップSC9の判断結果が「No」になるまで、ステップSC3〜ステップSC10が繰り返される。
【0074】
そして、ステップSC9の判断結果が「No」になると、ステップSC12では、制御部103は、外れ値に対応するレコードが削除されたオリジナルデータテーブル200を処理済みデータとして処理済みデータベース120に格納する。
【0075】
以上説明したように、一実施の形態(動作例1)によれば、図6に示したように、散布図310で可視化されたデータ集合における各データ(プロット)に対応させて、各データを識別するための識別番号を表示し、可視化されたデータ集合において外れ値のデータに対応する識別番号を入力部101で指定することとしたので、外れ値の検出にかかる効率を高めることができる。
【0076】
また、一実施の形態(動作例1)によれば、指定された識別番号に対応するデータを外れ値として除去することとしたので、外れ値の除去にかかる効率を高めることができる。
【0077】
また、一実施の形態(動作例1)によれば、図6および図7に示したように、可視化されたデータ集合においてデータ(プロット)の重なりがある部分(枠311の部分)を拡大表示させることとしたので、データ(プロット)の重なりがある場合であっても、外れ値の検出にかかる効率を高めることができる。
【0078】
また、一実施の形態(動作例2)によれば、図9を参照して説明したように、可視化されたデータ集合において、所定の条件を満たす外れ値の候補としてのデータ(プロット、識別番号)を色分けにて可視化することとしたので、外れ値の検出にかかる効率をさらに高めることができる。
【0079】
また、一実施の形態(動作例3)によれば、図10を参照して説明したように、可視化されたデータ集合における各データに対応させて、各データを識別するための識別番号を表示し、可視化されたデータ集合において、所定の条件(クラスタ数が1)を満たす外れ値のデータを除去することとしたので、外れ値の検出や除去にかかる効率を高めることができる。
【0080】
以上本発明にかかる一実施の形態について図面を参照して詳述してきたが、具体的な構成例はこの一実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等があっても本発明に含まれる。
【0081】
例えば、前述した一実施の形態においては、図1に示した外れ値検出支援装置100の機能を実現するためのプログラムを図11に示したコンピュータ読み取り可能な記録媒体500に記録して、この記録媒体500に記録されたプログラムを同図に示したコンピュータ400に読み込ませ、実行することにより各機能を実現してもよい。
【0082】
同図に示したコンピュータ400は、上記プログラムを実行するCPU(Central Processing Unit)410と、キーボード、マウス等の入力装置420と、各種データを記憶するROM(Read Only Memory)430と、演算パラメータ等を記憶するRAM(Random Access Memory)440と、記録媒体500からプログラムを読み取る読取装置450と、ディスプレイ、プリンタ等の出力装置460とから構成されている。
【0083】
CPU410は、読取装置450を経由して記録媒体500に記録されているプログラムを読み込んだ後、プログラムを実行することにより、前述した機能を実現する。なお、記録媒体500としては、光ディスク、フレキシブルディスク、ハードディスク等が挙げられる。
【0084】
【発明の効果】
以上説明したように、請求項1、6、8にかかる発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定することとしたので、外れ値の検出にかかる効率を高めることができるという効果を奏する。
【0085】
また、請求項2にかかる発明によれば、可視化されたデータ集合においてデータの重なりがある部分を拡大表示させることとしたので、データの重なりがある場合であっても、外れ値の検出にかかる効率を高めることができるという効果を奏する。
【0086】
また、請求項3にかかる発明によれば、可視化されたデータ集合において、所定の条件を満たす外れ値の候補としてのデータを色分けにて可視化することとしたので、外れ値の検出にかかる効率をさらに高めることができるという効果を奏する。
【0087】
また、請求項4にかかる発明によれば、指定されたデータ識別子に対応するデータを外れ値として除去することとしたので、外れ値の除去にかかる効率を高めることができるという効果を奏する。
【0088】
また、請求項5、7、9にかかる発明によれば、可視化されたデータ集合における各データに対応させて、各データを識別するためのデータ識別子を表示し、可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去することとしたので、外れ値の検出や除去にかかる効率を高めることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明にかかる一実施の形態の構成を示すブロック図である。
【図2】同一実施の形態における各種テーブルを示す図である。
【図3】同一実施の形態の動作例1を説明するフローチャートである。
【図4】同一実施の形態における散布図300である。
【図5】図4に示した各プロットに対応する識別番号が付された散布図310である。
【図6】図5に示した散布図310における枠311を示す図である。
【図7】図6に示した枠311に対応する拡大散布図320である。
【図8】図5に示した散布図310における丸枠312を示す図である。
【図9】同一実施の形態の動作例2を説明するフローチャートである。
【図10】同一実施の形態の動作例3を説明するフローチャートである。
【図11】同一実施の形態の変形例の構成を示すブロック図である。
【図12】従来のデータテーブル10を示す図である。
【図13】図12に示したデータテーブル10の各レコードをプロットした散布図20である。
【符号の説明】
100 外れ値検出支援装置
101 入力部
102 表示部
103 制御部
104 記憶部
110 オリジナルデータベース
120 処理済みデータベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an outlier detection support program, an outlier detection support method, and an outlier detection support device for supporting detection of an outlier from a data set, and particularly to an efficiency related to outlier detection and deletion. The present invention relates to an outlier detection support program, an outlier detection support method, and an outlier detection support device that can enhance the outlier.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, in the fields of data mining, data analysis, and pattern recognition, it is very important to detect data having abnormal values that adversely affect analysis, that is, outliers. For example, a technique for detecting outliers has been developed mainly in the field of statistics, because the presence of only one outlier may cause a decrease in the accuracy of identification or prediction.
[0003]
FIG. 12 is a diagram showing a conventional data table 10. The data table 10 stores data of attribute 1 (for example, temperature) and attribute 2 (for example, length).
[0004]
In the data table 10, the record number is a number associated with each record.
[0005]
FIG. 13 is a scatter diagram 20 in which data (attribute 1: temperature, attribute 2: length) of each record in the data table 10 shown in FIG. 12 is plotted. In the scatter diagram 20, the horizontal axis corresponds to attribute 1 (temperature), and the vertical axis corresponds to attribute 2 (length). In the scatter diagram 20, for example, a plot in a
[0006]
Accordingly, the operator reads the data (
[0007]
Thereby, outliers (plots in the circle 21) are removed from the scatter diagram 20. Thereafter, the above operation is repeated to detect and remove outliers.
[0008]
[Non-patent document 1]
Takashi Suenaga, Arata Sato, Akira Sakano, "Visualization of Feature Space Focusing on Cluster Structure-Cluster Discrimination Method", "Transactions of the Institute of Electronics, Information and Communication Engineers D-II, Vol. J85-D-II No. 5," Published by The Institute of Electronics, Information and Communication Engineers, May 2002, pp785-795
[0009]
[Problems to be solved by the invention]
By the way, as described above, in the related art, since the correspondence between each plot and each record of the data table 10 (see FIG. 12) cannot be understood only by looking at the scatter diagram 20 shown in FIG. The record corresponding to the outlier must be searched and deleted from the data table 10 using the data of the plot (outlier) read in the above as a key.
[0010]
As described above, conventionally, there has been a problem that the time and labor required for detecting and removing outliers are extremely long and the efficiency is low.
[0011]
The present invention has been made in view of the above, and an object of the present invention is to provide an outlier detection support program, an outlier detection support method, and an outlier detection support apparatus that can increase the efficiency of detecting and removing outliers. And
[0012]
[Means for Solving the Problems]
In order to achieve the above object, the invention according to
[0013]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and a data identifier corresponding to outlier data is specified in the visualized data set. Therefore, it is possible to increase the efficiency of detecting an outlier.
[0014]
According to a second aspect of the present invention, in the outlier detection support program according to the first aspect, the computer functions as enlargement display means for enlarging and displaying a portion where data overlaps in the visualized data set. It is characterized by making it.
[0015]
According to the present invention, a portion where data is overlapped in the visualized data set is enlarged and displayed. Therefore, even when data overlaps, the efficiency of detecting an outlier can be increased. .
[0016]
According to a third aspect of the present invention, in the outlier detection support program according to the first or second aspect, the visualization means includes a data as an outlier candidate satisfying a predetermined condition in the visualized data set. Are visualized by color coding.
[0017]
According to the present invention, in the visualized data set, data as an outlier candidate that satisfies a predetermined condition is visualized by color coding, so that the efficiency of outlier detection can be further increased.
[0018]
According to a fourth aspect of the present invention, in the outlier detection support program according to any one of the first to third aspects, the computer is configured to store data corresponding to a data identifier specified by the outlier specifying means. It is characterized by functioning as a removing means for removing as an outlier.
[0019]
According to the present invention, since the data corresponding to the specified data identifier is removed as an outlier, the efficiency of removing the outlier can be increased.
[0020]
Further, the invention according to
[0021]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and outlier data satisfying a predetermined condition is removed from the visualized data set. Therefore, the efficiency of detecting and removing outliers can be increased.
[0022]
The invention according to
[0023]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and a data identifier corresponding to outlier data is specified in the visualized data set. Therefore, it is possible to increase the efficiency of detecting an outlier.
[0024]
The invention according to claim 7 is a data identifier setting step of setting a data identifier for identifying each data in a data set to be detected as an outlier, a visualization step of visualizing the data set, A data identifier display step of displaying the data identifier in association with each data in the data set, and a removing step of removing outlier data satisfying a predetermined condition in the visualized data set. Features.
[0025]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and outlier data satisfying a predetermined condition is removed from the visualized data set. Therefore, the efficiency of detecting and removing outliers can be increased.
[0026]
The invention according to
[0027]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and a data identifier corresponding to outlier data is specified in the visualized data set. Therefore, it is possible to increase the efficiency of detecting an outlier.
[0028]
The invention according to claim 9 is a data identifier setting means for setting a data identifier for identifying each data in a data set to be detected as an outlier, a visualization means for visualizing the data set, Data identifier display means for displaying the data identifier in association with each data in the data set, and removing means for removing outlier data satisfying a predetermined condition in the visualized data set. It is characterized by.
[0029]
According to the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and outlier data satisfying a predetermined condition is removed from the visualized data set. Therefore, the efficiency of detecting and removing outliers can be increased.
[0030]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of an outlier detection support program, an outlier detection support method, and an outlier detection support apparatus according to the present invention will be described in detail with reference to the drawings.
[0031]
FIG. 1 is a block diagram showing a configuration of an embodiment according to the present invention. In this figure, an outlier
[0032]
The
[0033]
The
[0034]
In the original data table 200, the record number is a number associated with each record. Here, in the original data table 200, when a record is deleted, the record numbers corresponding to the records below the deleted record are incremented by one, and are serialized from the highest record to the lowest record. .
[0035]
Returning to FIG. 1, the processed
[0036]
(Operation example 1)
Next, an operation example 1 of the embodiment will be described with reference to FIGS. FIG. 3 is a flowchart illustrating an operation example 1 of the embodiment. In step SA1 shown in the figure, the
[0037]
In step SA2, the
[0038]
In the identification number table 210 corresponding to the initial original data table 200, the same identification number as the record number is assigned. Here, in the identification number table 210, when the
[0039]
On the other hand, in the original data table 200, when the
[0040]
In step SA3 and step SA4, a process of compressing high-dimensional (in this case, n-dimensional in this case, attributes 1 to n) into low-dimensional (in this case, two-dimensional) data is performed by a well-known cluster discriminating method. Is done. The cluster discrimination method is a data visualization method that performs clustering in a high-dimensional space, regards the data belonging to the obtained cluster as an independent category, and obtains a mapping to a low-dimensional space using discriminant analysis.
[0041]
That is, it is difficult to plot high-dimensional data on a scatter diagram and visualize the data. Therefore, by compressing high-dimensional data into low-dimensional (two-dimensional) data, two-dimensional data can be plotted on a scatter diagram to visualize the data.
[0042]
In step SA3, the
[0043]
If only two-dimensional (
[0044]
In step SA5, the
[0045]
In step SA6, the
[0046]
In step SA7, the
[0047]
In step SA12, the
[0048]
In step SA8, the
[0049]
In this case, the operator recognizes a plot (data) corresponding to “14” (circle frame 312) in the scatter diagram 310 shown in FIG. Give an indication that you are.
[0050]
Thereby, the
[0051]
In step SA10, the
[0052]
Then, when the result of the determination in step SA8 is “No”, in step SA11, the
[0053]
(Operation example 2)
Now, in one embodiment, outlier candidates may be displayed in different colors in a scatter diagram to assist the operator in detecting outliers. Hereinafter, this case will be described as Operation Example 2. FIG. 9 is a flowchart illustrating Operation Example 2 of the embodiment.
[0054]
In steps SB1 to SB4 shown in the same drawing, the same processing as the above-described steps SA1 to SA4 (see FIG. 3) is executed.
[0055]
In step SB5, the
[0056]
In step SB6, the
[0057]
In step SB7, the
[0058]
In step SB8, the
[0059]
In step SB13, the
[0060]
In step SB9, the
[0061]
In this case, the operator recognizes a plot (data) corresponding to “14” (circled frame 312) displayed in red as an outlier in the scatter diagram 310 shown in FIG. Give an indication that the plot you want exists.
[0062]
Thereby, the
[0063]
In step SB11, the
[0064]
Then, when the result of the determination in step SB9 is “No”, in step SB12, the
[0065]
(Operation example 3)
By the way, in the operation example 2 of the embodiment, a case has been described where outlier candidates are displayed in different colors on a scatter diagram, and outliers are detected and removed in accordance with an operator's instruction. Alternatively, the color-coded plot may be automatically removed as an outlier. Hereinafter, this case will be described as Operation Example 3. FIG. 10 is a flowchart illustrating an operation example 3 of the embodiment.
[0066]
In steps SC1 to SC4 shown in the same drawing, the same processing as the above-described steps SA1 to SA4 (see FIG. 3) is executed.
[0067]
In step SC5, the
[0068]
In step SC6, the
[0069]
In step SC7, the
[0070]
In step SC8, the
[0071]
In step SC12, the
[0072]
In step SC9, the
[0073]
In step SC10, the
[0074]
Then, when the result of the determination in step SC9 is “No”, in step SC12, the
[0075]
As described above, according to one embodiment (Operation Example 1), as shown in FIG. 6, each data (plot) in the data set visualized by the scatter diagram 310 is associated with each data (plot). Since the identification number for identification is displayed and the identification number corresponding to the outlier data is specified by the
[0076]
Further, according to the embodiment (Operation Example 1), since the data corresponding to the specified identification number is removed as an outlier, the efficiency of removing the outlier can be increased.
[0077]
According to one embodiment (operation example 1), as shown in FIGS. 6 and 7, a portion (frame 311) where data (plot) overlaps in the visualized data set is enlarged and displayed. Therefore, even when data (plots) overlap, the efficiency of detecting outliers can be increased.
[0078]
According to one embodiment (Operation Example 2), as described with reference to FIG. 9, in the visualized data set, data (plot, identification number) as an outlier candidate satisfying a predetermined condition ) Is visualized by color coding, so that the efficiency of detecting outliers can be further increased.
[0079]
Further, according to one embodiment (Operation Example 3), as described with reference to FIG. 10, an identification number for identifying each data is displayed in association with each data in the visualized data set. Since outlier data that satisfies a predetermined condition (the number of clusters is 1) is removed from the visualized data set, the efficiency of detection and removal of outliers can be increased.
[0080]
An embodiment according to the present invention has been described in detail with reference to the drawings. However, a specific configuration example is not limited to the embodiment, and a design change within a range not departing from the gist of the present invention. The present invention is also included in the present invention.
[0081]
For example, in one embodiment described above, a program for realizing the function of the outlier
[0082]
The
[0083]
The
[0084]
【The invention's effect】
As described above, according to the first, sixth, and eighth aspects of the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and the visualized data is displayed. Since the data identifier corresponding to the outlier data is specified in the set, there is an effect that the efficiency of detecting the outlier can be increased.
[0085]
According to the second aspect of the present invention, a portion where data overlaps in the visualized data set is enlarged and displayed, so that even when there is data overlap, detection of outliers is required. The effect that efficiency can be raised is produced.
[0086]
According to the third aspect of the invention, in the visualized data set, data as an outlier candidate that satisfies a predetermined condition is visualized by color coding. There is an effect that it can be further increased.
[0087]
According to the fourth aspect of the present invention, since the data corresponding to the specified data identifier is removed as an outlier, the effect of removing outliers can be improved.
[0088]
According to the fifth, seventh, and ninth aspects of the present invention, a data identifier for identifying each data is displayed in association with each data in the visualized data set, and a predetermined identifier is displayed in the visualized data set. Since the outlier data satisfying the condition (1) is removed, the effect of detecting and removing outliers can be improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment according to the present invention.
FIG. 2 is a diagram showing various tables in the same embodiment.
FIG. 3 is a flowchart illustrating an operation example 1 of the same embodiment.
FIG. 4 is a scatter diagram 300 in the same embodiment.
FIG. 5 is a scatter diagram 310 in which identification numbers corresponding to the respective plots shown in FIG. 4 are assigned.
6 is a diagram showing a
FIG. 7 is an enlarged scatter diagram 320 corresponding to the
FIG. 8 is a diagram showing a
FIG. 9 is a flowchart illustrating an operation example 2 of the same embodiment.
FIG. 10 is a flowchart illustrating an operation example 3 of the same embodiment.
FIG. 11 is a block diagram showing a configuration of a modification of the same embodiment.
FIG. 12 is a diagram showing a conventional data table 10.
FIG. 13 is a scatter diagram 20 in which each record of the data table 10 shown in FIG. 12 is plotted.
[Explanation of symbols]
100 Outlier detection support device
101 Input unit
102 Display
103 control unit
104 storage unit
110 Original Database
120 Processed database
Claims (9)
外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段、
前記データ集合を可視化する可視化手段、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段、
前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定手段、
として機能させるための外れ値検出支援プログラム。Computer
Data identifier setting means for setting a data identifier for identifying each data in a data set which is an outlier detection target,
Visualization means for visualizing the data set,
Data identifier display means for displaying the data identifier in association with each data in the visualized data set,
Outlier specifying means for specifying a data identifier corresponding to outlier data in the visualized data set,
Outlier detection support program to function as a function.
外れ値検出対象であるデータ集合における各データを識別するためのデータ識別子を設定するデータ識別子設定手段、
前記データ集合を可視化する可視化手段、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段、
前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去手段、
として機能させるための外れ値検出支援プログラム。Computer
Data identifier setting means for setting a data identifier for identifying each data in a data set which is an outlier detection target,
Visualization means for visualizing the data set,
Data identifier display means for displaying the data identifier in association with each data in the visualized data set,
Removing means for removing outlier data satisfying a predetermined condition in the visualized data set;
Outlier detection support program to function as a function.
前記データ集合を可視化する可視化工程と、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示工程と、
前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定工程と、
を含むことを特徴とする外れ値検出支援方法。A data identifier setting step of setting a data identifier for identifying each data in a data set that is an outlier detection target,
A visualization step of visualizing the data set;
A data identifier display step of displaying the data identifier in association with each data in the visualized data set,
An outlier specifying step for specifying a data identifier corresponding to outlier data in the visualized data set,
An outlier detection support method, comprising:
前記データ集合を可視化する可視化工程と、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示工程と、
前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去工程と、
を含むことを特徴とする外れ値検出支援方法。A data identifier setting step of setting a data identifier for identifying each data in a data set that is an outlier detection target,
A visualization step of visualizing the data set;
A data identifier display step of displaying the data identifier in association with each data in the visualized data set,
A removing step of removing outlier data that satisfies a predetermined condition in the visualized data set;
An outlier detection support method, comprising:
前記データ集合を可視化する可視化手段と、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段と、
前記可視化されたデータ集合において外れ値のデータに対応するデータ識別子を指定するための外れ値指定手段と、
を備えたことを特徴とする外れ値検出支援装置。Data identifier setting means for setting a data identifier for identifying each data in a data set that is an outlier detection target,
Visualization means for visualizing the data set,
Data identifier display means for displaying the data identifier corresponding to each data in the visualized data set,
Outlier specifying means for specifying a data identifier corresponding to outlier data in the visualized data set,
An outlier detection support device comprising:
前記データ集合を可視化する可視化手段と、
前記可視化されたデータ集合における各データに対応させて前記データ識別子を表示するデータ識別子表示手段と、
前記可視化されたデータ集合において、所定の条件を満たす外れ値のデータを除去する除去手段と、
を備えたことを特徴とする外れ値検出支援装置。Data identifier setting means for setting a data identifier for identifying each data in a data set that is an outlier detection target,
Visualization means for visualizing the data set,
Data identifier display means for displaying the data identifier corresponding to each data in the visualized data set,
Removing means for removing outlier data that satisfies a predetermined condition in the visualized data set;
An outlier detection support device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035637A JP2004246622A (en) | 2003-02-13 | 2003-02-13 | Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003035637A JP2004246622A (en) | 2003-02-13 | 2003-02-13 | Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004246622A true JP2004246622A (en) | 2004-09-02 |
Family
ID=33021006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003035637A Pending JP2004246622A (en) | 2003-02-13 | 2003-02-13 | Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004246622A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202874A (en) * | 2016-06-28 | 2016-12-07 | 黑龙江工程学院 | A kind of suspicious points method of discrimination based on measured data |
CN106326642A (en) * | 2016-08-16 | 2017-01-11 | 成都中医药大学 | Method for establishing medical consultation fee lattice model based on big data analysis |
JP2019174960A (en) * | 2018-03-27 | 2019-10-10 | 西日本電信電話株式会社 | Data preprocessing apparatus, data preprocessing method and data preprocessing program |
JP2020154712A (en) * | 2019-03-20 | 2020-09-24 | 株式会社リコー | System, arithmetic device and program |
-
2003
- 2003-02-13 JP JP2003035637A patent/JP2004246622A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202874A (en) * | 2016-06-28 | 2016-12-07 | 黑龙江工程学院 | A kind of suspicious points method of discrimination based on measured data |
CN106202874B (en) * | 2016-06-28 | 2018-11-02 | 黑龙江工程学院 | A kind of suspicious point judging method based on measured data |
CN106326642A (en) * | 2016-08-16 | 2017-01-11 | 成都中医药大学 | Method for establishing medical consultation fee lattice model based on big data analysis |
JP2019174960A (en) * | 2018-03-27 | 2019-10-10 | 西日本電信電話株式会社 | Data preprocessing apparatus, data preprocessing method and data preprocessing program |
JP2020154712A (en) * | 2019-03-20 | 2020-09-24 | 株式会社リコー | System, arithmetic device and program |
JP7225984B2 (en) | 2019-03-20 | 2023-02-21 | 株式会社リコー | System, Arithmetic Unit, and Program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100708067B1 (en) | Digital video searching device and method thereof | |
JP6646395B2 (en) | Information processing apparatus and method, information processing system, computer program | |
TW569114B (en) | Computer automated system for management of engineering drawings | |
JP2008242543A (en) | Image retrieval device, image retrieval method for image retrieval device and control program for image retrieval device | |
JP4591229B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5539555B2 (en) | Image processing apparatus, image processing method, and program | |
JP4179510B2 (en) | Inspection support device and inspection support program | |
JP4333350B2 (en) | Image management apparatus, image management method, and program | |
JP2002183166A (en) | System and method for filing document | |
JP2004246622A (en) | Outlier detection supporting program, outlier detection supporting method, and outlier detection supporting device | |
JP2007043506A (en) | Image processing apparatus, image processing method thereof, program, and storage medium | |
JP2007011996A (en) | Analysis method for expression information and system therefor | |
JP4692615B2 (en) | Printing apparatus and program | |
JP5197328B2 (en) | Image processing apparatus, image processing method, and program | |
US11036352B2 (en) | Information processing apparatus and information processing method with display of relationship icon | |
JP2006155344A (en) | Data analyzer, data analysis program, and data analysis method | |
US8824856B2 (en) | Moving image processing apparatus, moving image processing method, and program | |
JP5083676B2 (en) | Reading system and optical information reading apparatus | |
JP2004234399A (en) | Component standardization supporting device | |
JP7006272B2 (en) | Log analysis system, method and program | |
JP4823049B2 (en) | Document image retrieval apparatus and program | |
JP6719259B2 (en) | Medical report creation support device, control method thereof, and program | |
JP4693167B2 (en) | Form search device, form search method, program, and computer-readable storage medium | |
JP2009086762A (en) | Similarity calculation device and similarity display device | |
JP7021401B1 (en) | Logging support device, logging system, logging support method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060704 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061128 |