JP4560117B2 - 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム - Google Patents

散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム Download PDF

Info

Publication number
JP4560117B2
JP4560117B2 JP2008279466A JP2008279466A JP4560117B2 JP 4560117 B2 JP4560117 B2 JP 4560117B2 JP 2008279466 A JP2008279466 A JP 2008279466A JP 2008279466 A JP2008279466 A JP 2008279466A JP 4560117 B2 JP4560117 B2 JP 4560117B2
Authority
JP
Japan
Prior art keywords
point
distribution
representative
data
distribution area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008279466A
Other languages
English (en)
Other versions
JP2010108236A (ja
Inventor
裕和 柳井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008279466A priority Critical patent/JP4560117B2/ja
Priority to US12/607,461 priority patent/US20100110078A1/en
Publication of JP2010108236A publication Critical patent/JP2010108236A/ja
Application granted granted Critical
Publication of JP4560117B2 publication Critical patent/JP4560117B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)

Description

本発明は、散布図におけるデータ点の分布領域描画方法及びそれをコンピュータに実行させるためのプログラムに関するものである。
散布図は、2つの変数が対になった複数のデータの関係を表すことを目的としてよく用いられている。また、2つの変数が対になった複数のデータについて回帰直線や回帰曲線を求めてそれらのデータの関係を数値化することもできる。散布図におけるデータ点の特徴を表現する方法として、例えば特許文献1〜3に開示されているものがある。
また、散布図において、各データ点を層別する情報がある場合などは、データ点を表す印の色や形を変えて表現することで、1つの散布図に複数の層のデータ点の分布を表現することもできる。
特許第3639636号公報 特許第3944439号公報 特開2007−248198号公報 特許第3888938号公報
上述のように、散布図は2つの変数が対になった複数のデータの相関関係を表すのに適している。
しかし、1つの散布図に表示する層の数が多く、データ点も多い場合、データ点を表す印は重なり合い、各層における分布の特徴の認識が困難であった。
また、複数の層を表示した散布図ではなくても、図自体が小さくなるとデータ点を表す印も小さくなり、分布の特徴の認識が困難になる。
このような不具合を克服するために層ごとに確率楕円を描画する方法もあるが、確率楕円は実際の分布を精度よく表現するものではない。
本発明の目的は、確率楕円とは異なる方法でデータ点の分布領域を描画できる散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラムを提供することである。
本発明は、対になった2つの変数をもつ複数のデータに対して、その散布図の領域を任意の点である領域の分割中心点から放射線状に2つ以上の領域に分割し、分割領域ごとに上記分割中心点から最大距離にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、上記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法である。
ここで、散布図とは、対になった2つの変数をもつデータを用い、2つの変数の値を平面上の座標の縦軸と横軸にとり、2つ以上のデータを点として表したものを言う。散布図は相関図とも呼ばれる。
本発明の分布領域描画方法において、上記分布領域描画ステップは、上記代表点を上記分布領域表示線が交差しない順番に結線して上記分布領域表示線を描画する例を挙げることができる。ただし、分布領域描画ステップは、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
上記分布代表点選定ステップにおける上記分割中心点として、上記複数のデータ点の分布領域の中心又は重心を挙げることができる。
ここで、複数のデータ点の分布領域の中心とは、2つの変数が対になった複数のデータに対して変数ごとに最大値と最小値を足して2で割って求めた値の点を言う。また、複数のデータ点の分布領域の重心とは、2つの変数が対になった複数のデータに対して変数ごとに平均値を求めた値の点を言う。
また、上記分布代表点選定ステップは、上記分割領域のうちデータ点のない分割領域がある場合に、上記分割中心点を上記代表点として選定するようにしてもよい。ただし、分割領域のうちデータ点のない分割領域がある場合であっても、分割中心点を代表点とはしなくてもよい。
また、上記分布代表点選定ステップは、上記複数のデータ点の回帰直線に対して角度をもつように上記分割領域を画定するための線を設定する例を挙げることができる。
また、上記分布代表点選定ステップは、上記代表点を選定した後、隣り合う2つの上記分割領域を検討領域とし、上記検討領域内において、上記分割中心点を始点とし各データ点を終点とするベクトルの、上記検討領域における2つの上記分割領域が接する線が上記分割中心点を始点として延びる方向の成分の大きさがいずれの上記代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加するようにしてもよい。
さらに、上記検討領域内に上記成分の大きさが最も大きいデータ点が2つ以上ある場合は、上記分割中心点に最も近いデータ点を上記代表点として追加するようにしてもよい。ただし、上記成分の大きさが最も大きい2つ以上のデータ点の全部を代表点としてもよい。
また、代表点を追加で求める方法として、上記分布代表点選定ステップは、上記代表点を選定した後、領域を分割するのに用いた、上記分割中心点を始点とする線が延びる方向ごとに、上記分割中心点を始点とし各データ点を終点とするベクトルの上記方向の成分の大きさがいずれの上記代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加するようにしてもよい。
さらに、領域を分割するのに用いた、上記分割中心点を始点とする上記線が延びる方向に上記成分の大きさが最も大きいデータ点が2つ以上ある場合は、上記分割中心点に最も近いデータ点を上記代表点として追加するようにしてもよい。ただし、上記成分の大きさが最も大きい2つ以上のデータ点の全部を代表点としてもよい。
また、本発明の分布領域描画方法において、上記分布代表点選定ステップは、上記代表点の選定を、上記分割中心点の値を互いに異ならせて複数回行なうようにしてもよい。
この場合、上記分布代表点選定ステップは、最初の上記代表点の選定処理で上記分割領域のうちデータ点のない分割領域がある場合に、最初の上記代表点の選定処理よりも後で行なう上記代表点の選定処理で、最初の上記代表点の選定処理における上記分割中心点に対して上記データ点のない分割領域に対向する分割領域に上記分割中心点を設定して上記代表点を選定する例を挙げることができる。
また、上記分布代表点選定ステップは、複数回の上記代表点の選定処理のうちの1回で上記複数のデータ点の分布領域の中心又は重心を上記分割中心点として用いる例を挙げることができる。
また、本発明の分布領域描画方法において、上記分布代表点選定ステップは、分割領域ごとに上記分割中心点から最小距離にあるデータ点も代表点として選定するようにしてもよい。
また、本発明の分布領域描画方法において、上記分布代表点選定ステップの前に、上記複数のデータ点について相互間距離を求め、予め定められた距離しきい値以下の相互間距離をもつデータ点同士をグループ化するグループ設定ステップを含み、上記グループ設定ステップが設定したグループごとに上記分布代表点選定ステップ及び上記分布領域描画ステップを行なうようにしてもよい。
ここで、上記分布代表点選定ステップ及び上記分布領域描画ステップは、上記グループ設定ステップが設定したグループのうち一番多くのデータ点を含むグループについてのみ処理を行なうようにしてもよい。
また、本発明の分布領域描画方法において、上記分布領域描画ステップは、上記分布領域表示線の輪郭が所定範囲だけ広がる方向に上記代表点に対して仮想代表点を設定し、上記仮想代表点を結線して分布領域表示線を描画するようにしてもよい。
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるためのプログラムである。
本発明の散布図におけるデータ点の分布領域描画方法は、対になった2つの変数をもつ複数のデータに対して、その散布図の領域を任意の点である領域の分割中心点から放射線状に2つ以上の領域に分割し、分割領域ごとに分割中心点から最大距離にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含むようにしたので、対になった2つの変数をもつ複数のデータを散布図に表示した際にデータ点の分布領域の輪郭を分布領域表示線で表すことができ、その相関関係及び分布領域をひと目で判断できる。本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
本発明の分布領域描画方法において、分布領域描画ステップは、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画するようにすれば、データ点の分布領域の輪郭のみを分布領域表示線として描画することができる。ただし、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した場合であっても、データ点の分布領域を表現することができる。
分布代表点選定ステップは、分割中心点として複数のデータ点の分布領域の中心又は重心を用いるようにすれば、本発明の各ステップをコンピュータに実行させる際に、オペレータが分割中心点を設定することなく、複数のデータに適合した分割中心点を自動で設定することができる。
また、分布代表点選定ステップは、分割領域のうちデータ点のない分割領域がある場合に、分割中心点を代表点として選定するようにすれば、分割中心点を代表点として選定しないときに比べて、データ点の分布領域を適切に表現することができる。
本発明の分布領域描画方法において、分布代表点選定ステップで分割領域を画定するための線を設定した際に、分割領域の境界線と複数のデータ点の回帰直線とが重なった場合、不適切な分布代表点が選定される不具合が発生する可能性がある。
そこで、分布代表点選定ステップは、複数のデータ点の回帰直線に対して角度をもつように分割領域を画定するための線を設定するようにすれば、このような不具合の発生を低減することができる。
また、上記分布代表点選定ステップは、上記代表点を選定した後、隣り合う2つの上記分割領域を検討領域とし、上記検討領域内において、上記分割中心点を始点とし各データ点を終点とするベクトルの、上記検討領域における2つの上記分割領域が接する線が上記分割中心点を始点として延びる方向の成分の大きさがいずれの上記代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加するようにすれば、データ点の分布領域をさらに適切に表現することができる。
さらに、検討領域内に上記成分の大きさが最も大きいデータ点が2つ以上ある場合、分割中心点に最も近いデータ点を代表点として追加するようにすれば、上記成分の大きさが最も大きい2つ以上のデータ点のうち、検討領域における2つの分割領域が接する線に最も近いデータ点を採用することができ、データ点の分布領域をより適切に表現することができる。
また、代表点を追加で求める方法として、上記分布代表点選定ステップは、上記代表点を選定した後、領域を分割するのに用いた、上記分割中心点を始点とする線が延びる方向ごとに、上記分割中心点を始点とし各データ点を終点とするベクトルの上記方向の成分の大きさがいずれの上記代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加するようにしても、データ点の分布領域をさらに適切に表現することができる。
さらに、領域を分割するのに用いた、上記分割中心点を始点とする上記線が延びる方向に上記成分の大きさが最も大きいデータ点が2つ以上ある場合、分割中心点に最も近いデータ点を代表点として追加するようにすれば、上記成分の大きさが最も大きい2つ以上のデータ点のうち、検討領域における2つの分割領域が接する線に最も近いデータ点を採用することができ、データ点の分布領域をより適切に表現することができる。
また、本発明の分布領域描画方法において、分布代表点選定ステップは、代表点の選定を、分割中心点の値を互いに異ならせて複数回行なうようにすれば、分布領域描画ステップでさらに適切な分布領域表示線を描画できる。
特に、分布代表点選定ステップの最初の代表点の選定処理で分割領域のうちデータ点のない分割領域がある場合に有効である。この場合、分布代表点選定ステップは、最初の代表点の選定処理よりも後で行なう代表点の選定処理で、最初の代表点の選定処理における分割中心点に対してデータ点のない分割領域に対向する分割領域に分割中心点を設定して代表点を選定するようにすればよい。
ここでも、分布代表点選定ステップは、複数回の代表点の選定処理のうちの1回で複数のデータ点の分布領域の中心又は重心を分割中心点として用いるようにすれば、本発明の各ステップをコンピュータに実行させる際に、オペレータが分割中心点を設定することなく、複数のデータに適合した分割中心点を自動で設定することができる。
また、本発明の分布領域描画方法において、分布代表点選定ステップは、分割領域ごとに分割中心点から最小距離にあるデータ点も代表点として選定するようにすれば、分割中心点が散布図上で各データ点のすべてを線で結んだときの外周の線よりも外側に設定された場合であっても分布領域描画ステップで適切な分布領域表示線を描画できる。
また、本発明の分布領域描画方法において、分布代表点選定ステップの前に、複数のデータ点について相互間距離を求め、予め定められた距離しきい値以下の相互間距離をもつデータ点同士をグループ化するグループ設定ステップを含み、グループ設定ステップが設定したグループごとに分布代表点選定ステップ及び分布領域描画ステップを行なうようにすれば、データ点のグループ化を行なえるので、グループごとに分布領域表示線を得ることができる。
さらに、上記分布代表点選定ステップ及び上記分布領域描画ステップは、上記グループ設定ステップが設定したグループのうち一番多くのデータ点を含むグループについてのみ処理を行なうようにすれば、全体のデータ点分布に対して異常な分布と思われる異常データの点を除いた分布領域表示線を描画することができる。
また、本発明の分布領域描画方法において、分布領域描画ステップは、分布領域表示線の輪郭が所定範囲だけ広がる方向に代表点に対して仮想代表点を設定し、仮想代表点を結線して分布領域表示線を描画するようにすれば、代表点と分布領域表示線が重なって表示されるのを防止できる。例えば、半導体ウエハにマトリクス状に配置された複数のチップ領域のうち問題のあるチップ領域の中心座標を散布図に表示する場合、分布領域表示線の輪郭を所定範囲だけ広げて表示すれば、代表点となるチップ領域全体を分布領域表示線の内側に配置することができ、問題のあるチップ領域を識別しやすくなる。
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるようにしたので、コンピュータを用いて本発明の分布領域描画方法を実施することができる。
図1は、本発明の一実施例を説明するためのフローチャートである。図2はこの実施例で用いたデータの一部を表す図表である。図3は、図2のデータを点として表した散布図に、この実施例で領域を4分割するための線を図示した図である。図4は、図2のデータを点として表した散布図に、この実施例で領域を4分割するための線と分布領域表示線を図示した図である。図1から図4を参照してこの実施例を説明する。
ステップS1:グラフ化の対象となる関連する2種類の数値データを選択する。ここでは、図2に示す表の数値データAと数値データBを選択するとして説明を進める。なお、ここではデータの属性は無視した。
ステップS2:数値データAをX軸に数値データBをY軸に展開した際の分布領域を分割するための分割中心点を設定する。この実施例ではデータ点分布の重心を分割中心点とした。
ステップS3:分割中心点より放射線状に領域を分割する。ここでは、領域を分割するための線として、分割中心点を通り、X軸に平行な線とY軸に平行な線を用い、領域を4分割した(図3参照)。
ステップS4:各分割領域において分割中心点から最も離れた位置のデータ点を代表点として求める(分布代表点選定ステップ)。図3及び図4では、代表点となるデータ点を白抜きの丸印で図示し、代表点以外のデータ点を黒塗りの丸印で図示している。
各分割領域における代表点の求め方は種々の方法が考えられる。
例えば、まず、第1のデータ点の分割中心点からの距離の算出し、そのデータ点が属する分割領域を求める。そのデータ点の座標と分割中心点からの距離を代表点候補として記憶する。次のデータ点の分割中心点からの距離の算出し、そのデータ点が属する分割領域を求める。そのデータ点が属する分割領域に既に代表点候補がある場合は、そのデータ点の分割中心点からの距離と、代表点候補の分割中心点からの距離とを比較する。そのデータ点の分割中心点からの距離が代表点候補の分割中心点からの距離よりも大きいときは、そのデータ点の座標と分割中心点からの距離を新たな代表点候補として記憶する。また、そのデータ点の分割中心点からの距離が代表点候補の分割中心点からの距離よりも小さいときは、代表点候補の情報はそのままにしておく。また、そのデータ点の分割中心点からの距離が代表点候補の分割中心点からの距離と等しいときは、そのデータ点の座標と分割中心点からの距離を代表点候補として記憶し、もとの代表点候補の情報もそのまま記憶しておく。そのデータ点が属する分割領域に代表点候補がまだない場合は、そのデータ点座標と分割中心点からの距離を代表点候補として記憶する。その後、すべてのデータ点について上記と同様の処理を繰り返し、各分割領域における代表点候補を求める。すべてのデータ点について処理が終わった後、各分割領域における代表点候補を代表点として記憶する。
ただし、各分割領域における代表点の求め方はこれに限定されるものではない。例えば、各データ点について分割中心点からの距離を求めた後、各データ点を分割領域に基づいてグループ分けして、分割領域ごとに各データ点の分割中心点からの距離を比較してその距離が最も大きいデータ点を代表点とするようにしてもよい。また、各データ点を分割領域に基づいてグループ分けした後、分割領域ごとに各データ点について分割中心点からの距離を求めてその距離が最も大きいデータ点を代表点とするようにしてもよい。
ここで、データ点のない分割領域は代表点がないものとして以後の処理を行なってもよい。なお、データ点分布の重心を分割中心点とし、分布領域を放射線状に均等に4分割し、データ点のない分割領域がある場合、分割中心点座標をその分割領域の代表点とする方法もある。
ステップS5:各代表点を通過する線を描画することにより分布領域表示線を描画する(分布領域描画ステップ)。分布領域表示線を描画する際は、始点となる代表点から時計周り又は反時計周りに順次隣の領域の代表点を通過するように描画することにより線が交差しない分布領域表示線を描画できる(図4参照)。分布領域表示線は代表点を直線で結線したものでもよいが、図4に示すように代表点を通る滑らかな曲線を描画することが好ましい。このような曲線は、例えば、Visual BasicのDrawClosedCurve関数等を用いることにより指定した点を通る滑らかな曲線を描画することができる。
このように本発明の分布領域描画方法はデータ点分布領域を線で囲んで表現することができる。
図5は、図2のデータを点として表した散布図に、他の実施例で領域を8分割するための線を図示した図である。図6は、図2のデータを点として表した散布図に、他の実施例で領域を8分割するための線と分布領域表示線を図示した図である。
他の実施例を図1、図5及び図6を参照して説明する。
上記の実施例で説明したステップS1及びS2と同様にして、データの選択及び分割中心点の設定をする。
ステップS3で、分割中心点より放射線状に領域を8分割する。ここでは、領域を分割するための線として、分割中心点を通り、X軸に平行な線とY軸に平行な線とその線に斜め45度の線とを用いた(図5参照)。
ステップS4で、各分割領域において分割中心点から最も離れた位置のデータ点を代表点として求める。図5及び図6では、代表点となるデータ点を白抜きの丸印で図示し、代表点以外のデータ点を黒塗りの丸印で図示している。
ステップS5で、各代表点を通過する線を描画することにより分布領域表示線を描画する。始点となる代表点から時計周り又は反時計周りに順次隣の領域の代表点を通過するように線を描画することにより線が交差しない分布領域表示線を描画できる(図6参照)。
なお、領域を分割するための線の角度が広い場合、分布によっては、先に述べたステップだけでは、十分に分布を表現できないことがある。例えば図7に示すような分布である。図7に示すような分布を分布の重心を分割中心点とし、分布領域を放射線状に4分割し、各分割領域において代表点を求め、代表点を通る滑らかな曲線からなる分布領域表示線を描画した状態を図8に示す。
図8中の白抜きの丸印は各分割領域の代表点である。図8に示すように分布領域表示線から大幅にはみ出すデータ点が発生する。
1つの対策としては、分割領域を画定するための線の角度を狭める、つまり領域の分割数を増やす方法がある。例として、分布領域を放射線状に8分割し、図8より分割領域を画定するための線の角度を狭めて代表点を求めた結果を図9に示す。図9中の白抜きの丸印は各分割領域の代表点である。図9では、図8での不具合はなく分布領域表示線を上手く表現できている。
また、別の対策としては、回帰直線に対して分割の線がある程度角度をもつように領域を分割する方法がある。図8では回帰直線と領域分割の線の1つがほぼ平行な状態になっている。これに対し、図10に示すように回帰直線に対して分割領域を画定するための線が角度をもつように領域の分割を行なうと、代表点は図10に白抜きの丸印で示す通りになる。図10では大半のデータ点を分布領域表示線で囲むことができる。
また、さらに別の対策として、適切な分布領域表示線を描画するのに必要な代表点を追加する方法がある。追加すべき代表点の求め方は、次の通りである。
隣り合う2つの分割領域を検討領域と定義する。追加すべき代表点の求める際、分割中心点を始点とし各データ点を終点とするベクトルの、検討領域における2つの分割領域が接する線が分割中心点を始点として延びる方向の成分の大きさを指標とする。そして、検討領域内において、上記成分の大きさがいずれの代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加する。仮に、検討領域にこの条件にあうデータ点が2つ以上ある場合は、分割中心点に最も近い座標をもつデータ点を追加する代表点として採用する。
上記成分の大きさを求める方法として、例えば、検討領域における2つの分割領域が接する線に直交し、かつ分割中心点を通る線を検討用線として用いる方法を挙げることができる。この方法によれば、データ点と検討用線の最短距離が上記成分の大きさになる。ただし、上記成分の大きさを求める方法はこれに限定されるものではない。
また、検討領域内での代表点のうち上記成分の大きさが最も大きい代表点を比較代表点として用いるようにしてもよい。この場合、検討領域内において比較代表点よりも上記成分の大きさが大きいデータ点のうち上記成分の大きさが最も大きいデータ点を代表点として追加する。
図11を参照して、検討用線及び比較代表点を用いた、分布領域を表すのに追加すべき代表点の求め方を説明する。
図11において、4つの分割領域をA1〜A4とし、分割領域A1〜A4における代表点をT1〜T4とする。
まず、図11中の分割領域A1と分割領域2を検討領域として考える。この場合、検討用線は線L1である。線L1は領域を分割するための線と同じ線である。代表点T2は代表点T1よりも検討用線L1から離れている、すなわち、分割中心点を始点とし代表点T1又はT2を終点とするベクトルの、検討領域における2つの分割領域A1,A2が接する線が分割中心点を始点として延びる方向の成分の大きさに関し、代表点T2の方が代表点T1よりも大きいので、代表点T2が比較代表点になる。分割領域A1,A2からなる検討領域内で比較代表点T2以上に検討用線L1から離れているデータ点、すなわち上記成分の大きさが比較代表点T2よりも大きいデータ点は、2つの代表点T1,T2を除く全てのデータ点である。その中で最も検討用線L1から離れているデータ点、すなわち上記成分の大きさが最も大きいデータ点T5が追加代表点となる。
次に、分割領域A2,A3を検討領域として同様の処理を行なう。この場合、検討用線は線L2である。線L2は領域を分割するための線と同じ線である。分割領域A2,A3において、検討用線L2から最も離れているデータ点は代表点T3である。したがって、追加する代表点はない。
次に、分割領域A3,A4を検討領域として同様の処理を行なう。この場合、検討用線は線L1である。代表点T4は代表点T3よりも検討用線L1から離れているので比較代表点になる。比較代表点としての代表点T4よりも検討用線L1から離れているデータ点のうち検討用線L1から最も離れているデータ点T6が追加代表点となる。
次に、分割領域A1,A4を検討領域として同様の処理を行なう。この場合、検討用線は線L2である。分割領域A1,A4において、検討用線L2から最も離れているデータ点は代表点T4である。したがって、追加する代表点はない。
この実施例では最終的に2つの代表点を追加することとなった。追加した代表点T5,T6を含め、いずれか1つの代表点を始点として時計回り又は反時計回りに代表点T1〜T6を通る滑らかな曲線からなる分布領域表示線を描画した結果を図12に示す。このように大半のデータ点を分布領域表示線で囲むことができる。
上記の実施例では、2つの分割領域からなる検討領域内の2つの代表点のうち、検討用線から離れている方の代表点を比較代表点として用いているが、本発明の分布領域描画方法において、比較代表点は必ずしも求めなくてもよい。比較代表点を求めない場合は、検討領域内の各データ点について、検討用線からの距離を、各代表点の検討用線からの距離と比較することにより、いずれの代表点よりも検討用線から離れているデータ点を求めることができる。
なお、上記の実施例で用いた適切な分布領域表示線を描画するのに必要な代表点を追加する方法は、データ点の分布領域を4分割した場合に限るものではない。データ点の分布領域を3分割した場合を例にこれを説明する。
図13は、図2のデータを点として表した散布図に、領域を3分割するための線と分布領域表示線を図示した図である。図13では、データ点分布の重心を分割中心点とし、分布領域を放射線状に均等に分割領域A11〜A13に3分割し、分割領域A11〜A13ごとに代表点を求めた。
図13に示すように、分割領域A11〜A13ごとに求めた3つの代表点を線で結んだ分布領域表示線はデータ点分布を表しているが、より適切な分布領域表示線を描画するには追加で代表点を求めることが好ましい。
追加で代表点を求める方法として、隣り合う2つの分割領域を検討領域と定義し、分割中心点を始点とし各データ点を終点とするベクトルの、検討領域における2つの分割領域が接する線が分割中心点を始点として延びる方向の成分の大きさを指標とした上記実施例と同様の方法を用いることができる。ここで、上記成分の大きさを求める方法として、上記に述べた検討用線を用いてよい。
しかし、各データ点における分割領域A11と分割領域A13が接する線が分割中心点を始点として延びる方向の上記成分の算出は、各データ点の座標情報や分割中心点の座標情報を用いた加減算だけでは求めることができない。
このような場合、上記成分の算出に三角関数を用いる例を挙げることができる。図14は図13の分割領域A11のデータ点を1点だけ示した図である。図14を用いて三角関数を用いた上記成分の算出方法を説明する。
分割中心点を始点としデータ点を終点とするベクトルの、分割領域A11と分割領域A13が接する線が分割中心点を始点として延びる方向の成分は、分割中心点を始点とし、データ点から分割領域A11と分割領域A13が接する線に垂線を引いたときの交点を終点とするベクトルに相当する。分割領域A11〜A13は予め定められたものであり、データ点と座標軸がなす角度はデータ点の座標情報から求まる。したがって、分割領域A11と分割領域A13が接する線と、分割中心点を始点としデータ点を終点とするベクトルがなす角度θを求めることができる。よって、上記成分は、分割中心点とデータ点との距離と角度θを用いて三角関数を用いて求まる。
(上記成分の大きさ)=(分割中心点とデータ点との距離)×cosθ
このように検討領域における各データの上記成分の大きさを求め、検討領域内のいずれの代表点の上記成分の大きさよりも上記成分が大きいデータ点のうち上記成分の大きさが最も大きいデータ点を代表点として追加する。
図15は図13のデータ点分布に対して追加で代表点を求めた結果を示す。図16は図15の代表点を用いて分布領域表示線の描画を行なった結果を示す図である。
分割領域A11と分割領域A12からなる検討領域には追加すべき代表点はない。また、分割領域A12と分割領域A13からなる検討領域にも追加すべき代表点はない。分割領域A11と分割領域A13からなる検討領域ではデータ点T11が追加すべき代表点となる。始点となる代表点から時計周り又は反時計周りに、図15に白抜き丸印で示した4つの代表点を通過するように線を描画すると、図16に示す分布領域表示線が得られる。これにより、より適切な分布領域表示線を描画できる。
また、上記の実施例では、検討領域内において、分割中心点を始点とし各データ点を終点とするベクトルの、検討領域における2つの分割領域が接する線が分割中心点を始点として延びる方向の成分の大きさを求める際に検討用線を用いているが、本発明の分布領域描画方法において、検討用線は必ずしも用いなくてもよい。上記成分の大きさを求める方法は、種々の方法が考えられる。例えば、図11に示したように、領域を分割するための線がX軸方向とY軸方向に設定されている場合、検討領域における2つの分割領域が接する線が伸びる方向の座標軸の、各データ点及び分割中心点の座標成分を用いることにより、上記成分の大きさを求めることができる。なお、上記成分の大きさを求める方法は、ここで説明したものに限定されるものではなく、どのような方法であってもよい。
また、追加すべき代表点の求め方は他にもある。
追加すべき代表点の求め方の第2の方法は、次の通りである。
追加すべき代表点の求める際、分割中心点を始点とし各データ点を終点とするベクトルの、領域を分割するのに用いた、分割中心点を始点とする線が延びる方向の成分の大きさを指標とする。この場合、上記検討領域の概念は必要ない。そして、上記成分の大きさがいずれの代表点の上記成分の大きさよりも大きいデータ点のうち、上記成分の大きさが最も大きいデータ点を代表点として追加する。また、分割するのに用いた、分割中心点を始点とする線が延びる方向は複数あるので、その方向ごとに各データ点の上記成分の大きさを指標とし代表点を追加する。仮に、各方向においてこの条件にあうデータ点が2つ以上ある場合は、分割中心点に最も近い座標をもつデータ点を追加する代表点として採用する。
図17は、図2のデータを点として表した散布図に、領域を2分割するための線を図示した図である。
図17に示すように、2つの分割領域ごとに求めた2つの代表点を線で結んだ分布領域表示線はデータ点分布を表しているが、より適切な分布領域表示線を描画するには追加で代表点を求めることが好ましい。
図18は、図17のデータ点分布に対して追加で代表点を求め、それらの代表点を用いて分布領域表示線の描画を行なった結果を示す図である。
この実施例では追加すべき代表点の求め方の第2の方法を用いた。具体的には、分割するのに用いた、分割中心点を始点とする線が延びる方向、ここでは図18に示す方向B,Cごとに追加で代表点を求めた。
追加すべき代表点の求め方の第2の方法でも、上記に述べた追加すべき代表点の求め方と同様に検討用線を用いてよい。
しかし、図17及び図18のように、領域を分割するための線が座標軸に対して直交又は平行でない場合、上記成分の大きさの算出は各データ点の座標情報や分割中心点の座標情報を用いた加減算だけでは求めることができない。
このような場合の上記成分の大きさの算出は、上記3分割の場合で説明した三角関数を用いるのが好ましい。
上記三角関数を用いた上記成分の大きさの算出方法により、方向Bの追加すべき代表点はデータ点Tbとなる。また、方向Cの追加すべき代表点はデータ点Tcとなる。始点となる代表点から時計周り又は反時計周りに、図17に示した2つの代表点と図18に示す代表点Tb,Tcの4つの代表点を通過するように線を描画すると、図18に示す分布領域表示線が得られる。これにより、より適切な分布領域表示線を描画できる。
なお、追加すべき代表点の求め方の第2の方法は、データ点の分布領域を2分割した場合に限るものではなく、データ点の分布領域を3つ以上の領域に分割する場合であっても用いることができる。
なお、ステップS4の説明で、データ点のない領域は代表点がないものとするか、又は分割中心点座標をその領域の代表点とすると説明したが、第2の分割中心点を設定し、その分割中心点に対してもステップS3及びステップS4を行なってもよい。
基本的に任意の点を第2の分割中心点としてよい。好ましくは、最初の代表点の選定処理における分割中心点に対してデータ点のなかった分割領域に対向する分割領域に第2の分割中心点を設定する。
図19は、散布図のさらに他の例を示す図である。
図19のデータ点に対して、図1のステップS1〜S5を行なった結果を図20に示す。図20では領域を8分割して分割領域A21〜A28とした。
図20では、分割領域A21,A22にデータ点がないので代表点はない。このように、データ点のない分割領域が設定される場合には分布領域表示線が必要以上に大きく描画される。
図21は、図20の代表点に分割中心点を代表点として追加したときの分布領域表示線を示す図である。
分割領域A21,A22にデータ点がないことに対して、分割中心点を代表点として追加することにより、適切な分布領域表示線を描画できる。
図19、図20、図22及び図23を用いて第2の分割中心点を設定する例を説明する。
図19のデータ点分布に対してデータ点分布の重心を分割中心点とし、図1を参照して説明したステップS1からステップS4を行なうと、図20に示す代表点(白抜きの丸印)が得られる。分割領域A21,A22にデータ点がないので、分割中心点に対して分割領域A21,A22に対向する分割領域A26,A27内に第2の分割中心点を設定する。ここでは、図22に示すように、図20の分割領域A26,A27の境界線上に第2の分割中心点を設定した。第2の分割中心点に対して、図1を参照して説明したステップS3及びS4を行なうと、図22に示す白抜きの代表点が得られる。ここでは、第2の分割中心点からX軸のマイナス方向とY軸のプラス方向に線を引き、それらの線の間の領域を4つの分割領域に等分割した。
2回の代表点選定処理で重複する代表点は1つの代表点と考え、ステップS5を行なって分布領域表示線を描画すると図23に示す結果が得られる。
このように、データ点のない分割領域がある場合には、分割中心点を代表点とするか、第2の分割中心点を設定して処理を行なうことにより、より適切な分布領域表示線の描画を行なうことができる。
図24は、本発明のさらに他の実施例を説明するためのフローチャートである。図25は、図2のデータを点として表した散布図に、この実施例で領域を分割するための線を図示した図である。図26は、図2のデータを点として表した散布図に、この実施例で領域を分割するための線と分布領域表示線を図示した図である。図24から図26を参照してこの実施例を説明する。
ステップS11:グラフ化の対象となる関連する2種類の数値データを選択する。ここでは、図2に示す表の数値データAと数値データBを選択するとして説明を進める。なお、ここではデータの属性は無視した。
ステップS12:数値データAをX軸に数値データBをY軸に展開した際の分布領域を分割するための分割中心点を設定する。分割中心点は基本的にXY座標上の任意の点で構わない。好ましくは、分割中心点は、散布図上で各データ点のすべてを線で結んだときの外周の線よりも外側に設定される。この実施例では、数値データAの最大値と数値データBの最小値によって表される点を分割中心点として説明を進める。
ステップS13:分割中心点より放射線状に領域を分割する。この実施例では、数値データAと数値データBの散布図において、分割中心点からX軸のマイナス方向に延ばした線と、分割中心点からY軸のプラス方向に延ばした線との間の90度の領域を分割中心点から放射線状に4分割した(図25参照。)。4つの分割領域をA31〜A34とする。
ステップS14:各分割領域A31〜A34において、分割中心点から最も離れた位置のデータ点と、分割中心点に最も近い位置のデータ点を代表点として求める(分布代表点選定ステップ)。図25及び図26では、代表点となるデータ点を白抜きの丸印で図示し、代表点以外のデータ点を黒塗りの丸印で図示している。代表点には、代表点T31a,T32a,T33a,T34aのように各分割領域A31〜A34内で分割中心点から最も離れた位置のデータ点である代表点と、代表点T31b,T32b,T33b,T34bのように各分割領域A31〜A34内で分割中心点に最も近い位置のデータ点である代表点の2種類がある。
ステップS15:各代表点を通過する線を描画することにより分布領域表示線を描画する(分布領域描画ステップ)。分布領域表示線を描画する際は、始点となる代表点から時計周り又は反時計周りに順次隣の領域の代表点を通過するように描画することにより線が交差しない分布領域表示線を描画できる(図26参照。)。線の交差を防ぐ一例としては、代表点T31a、代表点T32a、代表点T33a、代表点T34a、代表点T34b、代表点T33b、代表点T32b、代表点T31b、代表点T31aの順で通過する線を描画する等がある。分布領域表示線を描画する線は直線でもよいが、図26に示すように代表点を通る滑らかな曲線を描画することが好ましい。
このように本発明の分布領域描画方法はデータ点分布領域を線で囲んで表現することができる。
なお、この実施例においても、図11を参照して説明した代表点を追加する方法を用いることができる。
また、データ点分布状態と領域の分割方法によっては、分割領域内のデータ点が1つしか存在しない場合がある。この場合、その分割領域が端の分割領域であれば、そのデータ点を分割中心点から最も離れた位置の代表点として用いても、分割中心点に最も近い位置の代表点として用いても、どちらでもよい。しかし、データ点が1つしか存在しない分割領域が端の分割領域でなければ、その分割領域の代表点はないものとしてその後の処理を行なうことが好ましい。
また、図24から図26を参照して説明した実施例においても、第2の分割中心点を設定し、第2の分割中心に対する代表点も加えて、分布領域表示線を描画してもよい。例えば、図25に示した散布図において、図2の数値データAの最小値と数値データBの最大値によって表される点を第2の分割中心点とする例を挙げることができる。
本発明において、実際のデータの座標を代表点の座標とすると、散布図において、分布の輪郭を表す分布領域表示線とデータ点を表す印が重なってしまう。これが好ましくない場合は、分布領域表示線の輪郭が所定範囲だけ広がる方向に代表点に対して仮想代表点を設定し、仮想代表点を結線して分布領域表示線を描画するようにすればよい。上記の実施例では、ステップS5又はステップS15でこの処理を行なう。
仮想代表点を設ける方向は、例えば図27に示すように分割中心点から代表点を通過する線を引いた方向を挙げることができる。図28に図27の四角で囲われた部分の拡大図を示す。代表点と仮想代表点の距離は予め定めておいてもよいが、グラフの縮尺に依存して可変にしておくことが好ましい。
また、仮想代表点を設ける方向は、データ点の分布領域の中心又は重心から代表点を通過する線を引いた方向でなくても、分布領域表示線の輪郭が所定範囲だけ広がる方向であればよい。例えば、図29に示すように各代表点から斜め45度の方向に仮想代表点を設定してもよい。データ点の分布領域の中心や重心を求めない実施例の場合は、それぞれの分割領域ごとに代表点に対して仮想代表点を設ける方向を定義しておけばよい。
仮想代表点を設ける具体的な実施例として半導体装置製造プロセスにおけるウエハテスト工程のテスト結果の不良チップ集中分布の表現が挙げられる。
半導体装置製造プロセスではウエハと呼ばれるシリコン基板上にマトリックス状にチップと呼ばれる半導体装置が形成される。半導体装置製造プロセスにおけるウエハテスト工程は、ウエハ上の各チップに対して電気的な検査を行ない、予め定めた電気的基準を満たしているチップと満たしていないチップを分別する工程である。一般的に、予め定めた電気的基準を満たしているチップは良品チップと呼ばれ、基準を満たしていないチップは不良チップと呼ばれる。
図30は、ウエハテスト結果の一例を示す図である。
ウエハ1にチップがマトリクス状に配列されている。各チップはX座標情報とY座標情報によってウエハ1上での位置が明確になっている。良品チップ3は無印で示されている。不良チップ5は斜線で示されている。
半導体装置製造プロセスにおいて不良チップが少ないことが好ましい。よって、半導体装置製造プロセスに従事する組織において、常に不良チップを減少させる活動が行われている。
不良チップを減少するための活動として、まず、不良チップの分布状況の把握を行なう。特に不良チップが集中的に分布している場合、不良チップ減少対策の糸口を見つけられることが多い。
ウエハ上の不良チップの分布状況に基づいて不良チップをグループに分類する方法がある。例えば、隣接する不良チップの存在を確認することにより、ウエハ上の不良チップをいくつかのグループに分類し、グループに属する不良チップの数で不良チップが集中的に分布しているかどうかを判断する方法が特許文献4で述べられている。これによると、図30の不良チップ5は3つのグループに分類することができる。
不良チップの分布状況に基づいて同一のグループと判断された不良チップのX座標情報とY座標情報を本発明の分布領域描画方法で表現することにより、その不良チップのグループの分布を表現することができる。この際、用いる座標情報は1チップを1としたチップ配列の座標情報を用いてよいが、チップの平面形状は縦方向の長さと横方向の長さが等しいとは限らない。そこで、チップの座標情報は、メートル法など、チップ形状に依存しない座標が好ましい。例えば、ウエハの中心を原点とし、各チップの中心のXY座標をメートル法の長さで表した座標情報を用いる。
図30での不良グループ7に属する不良チップ5のチップ中心の座標情報を用い、本発明の分布領域描画方法により代表点を求め、不良グループ7に属する不良チップ5の分布を表現した図を図31に示した。図31で代表点は白抜き丸印で示されている。代表点を結んだ腺が分布領域表示線である。
また、代表点が存在する不良チップ5内で、不良グループ7に属する不良チップ5の分布の重心から代表点を通過する線が最長となる点を仮想代表点とし、不良チップ5の分布を表現した図を図32に示した。図32で仮想代表点も白抜き丸印で示されている。仮想代表点を結んだ腺が分布領域表示線である。
また、代表点が存在する不良チップ5内で、不良グループ7に属する不良チップ5の分布の重心から最も遠い点を仮想代表点とし、不良チップ5の分布を表現した図を図33に示した。図33で仮想代表点も白抜き丸印で示されている。仮想代表点を結んだ腺が分布領域表示線である。
図31を見てわかるように、仮想代表点を用いなかった場合、不良グループ7に属する不良チップ5を十分に囲い込むことができないことがある。これに対し、図32及び図33に示すように、分布領域表示線が所定範囲だけ広がる方向に代表点に対して仮想代表点を定義し、仮想代表点を通る線で分布領域表示線を描画すれば、不良グループ7に属する不良チップ5を十分に囲い込むことができる。
このように表現する分布によっては、仮想代表点を定義し、仮想代表点を通る曲線でデータ点の分布を表現したほうが好ましい場合もある。
また、半導体装置製造プロセスには、ウエハ上の異物や欠陥を測定する工程がある。これらの工程の情報もXY座標情報で表されるものであり、本発明の分布領域描画方法を用いて異物や欠陥の分布を表現することが可能である。
また、図34に示すようなデータ点の分布においては、上記の実施例のいずれの方法を用いても、分布の輪郭を表す分布領域表示線は特異な3点のデータ点を囲む形となる。一例として、図34に示したデータ点の分布に対して図1から図4を参照して説明した実施例を用いて描画した分布領域表示線を図35に示す。
仮に、特異なデータの点を除いた分布領域表示線を描画したい場合は、分布代表点選定ステップの前に、複数のデータ点について相互間距離を求め、予め定められた距離しきい値以下の相互間距離をもつデータ点同士をグループ化するグループ設定ステップを含み、グループ設定ステップが設定したグループごとに分布代表点選定ステップ及び分布領域描画ステップを行ない、データ点の最も多いグループのデータ点に絞り込んで、分布領域表示線を描画すればよい。ここで、距離しきい値は、予め定められた値でもよいが、データ点分布に依存して変わる値を用いてもよい。例えば、各データ点の相互の最短距離を求め、最短距離の平均+3σ(σは標準偏差)を距離しきい値として用いてもよい。
図34に示したデータ点に対して、データ点のグループ化を行ない、データ点数の最も多いグループに関して図1から図4を参照して説明した実施例を用いて描画した分布領域表示線を図36に示す。また、図34に示したデータ点に対して、データ点のグループ化を行ない、各グループに関して図1から図4を参照して説明した実施例を用いて描画した分布領域表示線を図37に示す。
図38は、図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示したものである。図38中で、属性Z1のデータ点は丸印で示され、属性Z2のデータ点は四角印で示されている。
図38に示すように、属性Z1,Z2のデータ点の分布領域が重なっている場合、属性Z1,Z2のデータ点の分布領域はわかりにくい。
図39は、図38に示したデータ点に対して図1から図4を参照して説明した実施例を用いて属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。実線は属性Z1のデータ点の分布領域表示線を示し、破線は属性Z2のデータ点の分布領域表示線を示している。
図39を見ると分かるように、属性Z1,Z2ごとに分布領域表示線を求めることにより、属性Z1,Z2のデータ点の分布領域が分かりやすくなる。
図40は、図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示したものである。図40中で、数値データBのデータ点は丸印で示され、数値データCのデータ点は四角印で示されている。
図40において、数値データB,Cのデータ点の分布領域が重なっているので、数値データB,Cのデータ点の分布領域はわかりにくい。
図41は、図40に示したデータ点に対して図1から図4を参照して説明した実施例を用いて数値データB,Cごとに分布領域表示線を求めた結果を示す図である。実線は数値データBのデータ点の分布領域表示線を示し、破線は数値データCのデータ点の分布領域表示線を示している。
図41を見ると分かるように、数値データB,Cごとに分布領域表示線を求めることにより、数値データB,Cのデータ点の分布領域が分かりやすくなる。
このように、本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
上記の実施例では、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画しているが、本発明はこれに限定されるものではなく、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
例えば、図5に示した代表点に対して、図42に示すように、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。この場合でも、データ点の分布領域の輪郭を適切に表現することができる。図42では代表点と代表点を直線で結んでいるが、分布領域表示線の輪郭を現す線は図6と同様に曲線であってもよい。
上記で説明した実施例の各ステップは、各ステップを処理するためのプログラムを作製し、コンピュータを用いてそのプログラムを実行させることによって実現できる。
以上、本発明の実施例を説明したが、本発明はこれらに限定されるものではなく、特許請求の範囲に記載された本発明の範囲内で種々の変更が可能である。
例えば、上記の実施例では、分割中心点より放射線状に領域を分割すると表現しているが、分割中心点を中心とする極座標を仮定し、極座標を角度で分割して分割領域を設定した場合も上記の実施例と同様の結果が得られる。
また、各実施例の説明において描画された散布図を用いたが、本発明の各ステップにおいて描画済みの散布図が必要なわけではない。すなわち、対になった2つの変数をもつ複数のデータがあれば各ステップの処理を行なえる。
また、各実施例の説明において、描画された散布図に領域を分割するための線を図示したが、本発明の各ステップにおいて、この線の図示も必ずしも必要ではない。
また、本発明において、分割領域に代表点がない場合は、その分割領域は代表点がないものとしてそれ以後の処理を行なえばよい。
また、本発明において、分割領域の数に限定はない。また、分割領域の大きさは均等でなくてもよい。
一実施例を説明するためのフローチャートである。 同実施例で用いたデータの一部を表す図表である。 図2のデータを点として表した散布図に、同実施例で領域を4分割するための線を図示した図である。 同実施例で求めた分布領域表示線を描画した結果を示す図である。 図2のデータを点として表した散布図に、他の実施例で領域を8分割するための線を図示した図である。 同実施例で求めた分布領域表示線を描画した結果を示す図である。 散布図の他の例を示す図である。 図7の散布図に対して、図1から図4を参照して説明した実施例と同様の工程で描画した分布領域表示線を示す図である。 図7の散布図に対して、図5及び図6を参照して説明した実施例と同様の工程で描画した分布領域表示線を示す図である。 図7の散布図において、データ点の回帰直線に対して分割領域を画定するための線が角度をもつように領域の分割を行なって描画した分布領域表示線を示す図である。 図7の散布図において、分布領域を表すのに追加すべき代表点の求め方を説明するための図である。 図11に示した追加代表点も含めて分布領域表示線を描画した結果を示す図である。 図2のデータを点として表した散布図に、領域を3分割するための線と分布領域表示線を図示した図である。 図13の分割領域A11のデータ点を1点だけ示した図である。 図13のデータ点分布に対して追加で代表点を求めた結果を示す図である。 図15の代表点を用いて分布領域表示線の描画を行なった結果を示す図である。 図2のデータを点として表した散布図に、領域を2分割するための線を図示した図である。 図17のデータ点分布に対して追加で代表点を求め、それらの代表点を用いて分布領域表示線の描画を行なった結果を示す図である。 散布図のさらに他の例を示す図である。 図19のデータ点に対して、領域を8分割して分布領域表示線の描画を行なった結果を示す図である。 図20の代表点に、分割中心点を代表点として追加して分布領域表示線の描画を行なった結果を示す図である。 図19のデータ点に対して、第2の分割中心点を設定して代表点を選定する処理を説明するための図である。 図20の代表点と図22の代表点を用いて分布領域表示線の描画を行なった結果を示す図である。 さらに他の実施例を説明するためのフローチャートである。 図2のデータを点として表した散布図に、同実施例で領域を分割するための線を図示した図である。 同実施例で求めた分布領域表示線を図25に追加で図示した図である。 図3に示した代表点に対して分布領域表示線の輪郭が所定範囲だけ広がる方向に仮想代表点を設定し、仮想代表点を結線して分布領域表示線を描画した状態を示す図である。 図27の四角で囲われた部分の拡大図である。 代表点に対して仮想代表点を設ける方向の他の例を説明するための図である。 ウエハテスト結果の一例を示す図である。 図30での不良グループ7に属する不良チップ5のチップ中心の座標情報を用い、本発明の分布領域描画方法により代表点及び分布領域表示線を求めた結果を示す図である。 図31に示した代表点が存在する不良チップ5内で、不良グループ7に属する不良チップ5の分布の重心から代表点を通過する線が最長となる点を仮想代表点とし、仮想代表点を結線して分布領域表示線を描画した状態を示す図である。 図31に示した代表点が存在する不良チップ5内で、不良グループ7に属する不良チップ5の分布の重心から最も遠い点を仮想代表点とし、仮想代表点を結線して分布領域表示線を描画した状態を示す図である。 散布図のさらに他の例を示す図である。 図35の散布図に対して、図1から図4を参照して説明した実施例と同様の工程で描画した分布領域表示線を示す図である。 図35の散布図に対して、データ点のグループ化を行ない、データ点数の最も多いグループに関して図1から図4を参照して説明した実施例と同様の工程で描画した分布領域表示線を示す図である。 図35の散布図に対して、データ点のグループ化を行ない、各グループに関して図1から図4を参照して説明した実施例と同様の工程で描画した分布領域表示線を示す図である。 図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示した散布図である。 図38に示したデータ点に対して、図1から図4を参照して説明した実施例と同様の工程で属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。 図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示した散布図である。 図40に示したデータ点に対して、図1から図4を参照して説明した実施例と同様の工程で数値データB,Cごとに分布領域表示線を求めた結果を示す図である。 図5に示した代表点に対して、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した結果を示す図である。
符号の説明
A1〜A4,A11〜A13,A21〜A28,A31〜A34 分割領域
T1〜T4,T31a〜T34a,T31b〜T34b 代表点
T5,T6,T11,Tb,Tc 追加の代表点
1 ウエハ
3 良品チップ
5 不良チップ
7 不良グループ

Claims (17)

  1. 対になった2つの変数をもつ複数のデータに対してコンピュータにより実行される方法であって
    前記複数のデータの散布図の領域を任意の点である領域の分割中心点から放射線状に2つ以上の領域に分割し、分割領域ごとに前記分割中心点から最大距離にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、
    前記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法。
  2. 前記分布領域描画ステップは、前記代表点を前記分布領域表示線が交差しない順番に結線して前記分布領域表示線を描画する請求項1に記載の分布領域描画方法。
  3. 前記分布代表点選定ステップは、前記複数のデータ点の分布領域の中心又は重心を前記分割中心点として用いる請求項1又は2に記載の分布領域描画方法。
  4. 前記分布代表点選定ステップは、前記分割領域のうちデータ点のない分割領域がある場合に、前記分割中心点を前記代表点として選定する請求項1から3のいずれか一項に記載の分布領域描画方法。
  5. 前記分布代表点選定ステップは、前記複数のデータ点の回帰直線に対して角度をもつように前記分割領域を画定するための線を設定する請求項1から4のいずれか一項に記載の分布領域描画方法。
  6. 前記分布代表点選定ステップは、前記代表点を選定した後、隣り合う2つの前記分割領域を検討領域とし、前記検討領域内において、前記分割中心点を始点とし各データ点を終点とするベクトルの、前記検討領域における2つの前記分割領域が接する線が前記分割中心点を始点として延びる方向の成分の大きさがいずれの前記代表点の前記成分の大きさよりも大きいデータ点のうち、前記成分の大きさが最も大きいデータ点を代表点として追加する請求項1から5のいずれか一項に記載の分布領域描画方法。
  7. 前記検討領域内に前記成分の大きさが最も大きいデータ点が2つ以上ある場合は、前記分割中心点に最も近いデータ点を前記代表点として追加する請求項6に記載の分布領域描画方法。
  8. 前記分布代表点選定ステップは、前記代表点を選定した後、領域を分割するのに用いた、前記分割中心点を始点とする線が延びる方向ごとに、前記分割中心点を始点とし各データ点を終点とするベクトルの前記方向の成分の大きさがいずれの前記代表点の前記成分の大きさよりも大きいデータ点のうち、前記成分の大きさが最も大きいデータ点を代表点として追加する請求項1から5のいずれか一項に記載の分布領域描画方法。
  9. 領域を分割するのに用いた、前記分割中心点を始点とする前記線が延びる方向に前記成分の大きさが最も大きいデータ点が2つ以上ある場合は、前記分割中心点に最も近いデータ点を前記代表点として追加する請求項8に記載の分布領域描画方法。
  10. 前記分布代表点選定ステップは、前記代表点の選定を、前記分割中心点の値を互いに異ならせて複数回行なう請求項1又は2に記載の分布領域描画方法。
  11. 前記分布代表点選定ステップは、最初の前記代表点の選定処理で前記分割領域のうちデータ点のない分割領域がある場合に、最初の前記代表点の選定処理よりも後で行なう前記代表点の選定処理で、最初の前記代表点の選定処理における前記分割中心点に対して前記データ点のない分割領域に対向する分割領域に前記分割中心点を設定して前記代表点を選定する請求項10に記載の分布領域描画方法。
  12. 前記分布代表点選定ステップは、複数回の前記代表点の選定処理のうちの1回で前記複数のデータ点の分布領域の中心又は重心を前記分割中心点として用いる請求項10又は11に記載の分布領域描画方法。
  13. 前記分布代表点選定ステップは、分割領域ごとに前記分割中心点から最小距離にあるデータ点も代表点として選定する請求項1又は2に記載の分布領域描画方法。
  14. 前記分布代表点選定ステップの前に、前記複数のデータ点について相互間距離を求め、予め定められた距離しきい値以下の相互間距離をもつデータ点同士をグループ化するグループ設定ステップを含み、
    前記グループ設定ステップが設定したグループごとに前記分布代表点選定ステップ及び前記分布領域描画ステップを行なう請求項1から13のいずれか一項に記載の分布領域描画方法。
  15. 前記分布代表点選定ステップ及び前記分布領域描画ステップは、前記グループ設定ステップが設定したグループのうち一番多くのデータ点を含むグループについてのみ処理を行なう請求項14に記載の分布領域描画方法。
  16. 前記分布領域描画ステップは、前記分布領域表示線の輪郭が所定範囲だけ広がる方向に前記代表点に対して仮想代表点を設定し、前記仮想代表点を結線して分布領域表示線を描画する請求項1から15のいずれか一項に記載の分布領域描画方法。
  17. 請求項1から16のいずれか一項に記載の各ステップをコンピュータに実行させるための、散布図におけるデータ点の分布領域描画プログラム。
JP2008279466A 2008-10-30 2008-10-30 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム Expired - Fee Related JP4560117B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008279466A JP4560117B2 (ja) 2008-10-30 2008-10-30 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
US12/607,461 US20100110078A1 (en) 2008-10-30 2009-10-28 Method and computer program product for plotting distribution area of data points in scatter diagram

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008279466A JP4560117B2 (ja) 2008-10-30 2008-10-30 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム

Publications (2)

Publication Number Publication Date
JP2010108236A JP2010108236A (ja) 2010-05-13
JP4560117B2 true JP4560117B2 (ja) 2010-10-13

Family

ID=42130814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008279466A Expired - Fee Related JP4560117B2 (ja) 2008-10-30 2008-10-30 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム

Country Status (2)

Country Link
US (1) US20100110078A1 (ja)
JP (1) JP4560117B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5386945B2 (ja) * 2008-11-25 2014-01-15 株式会社リコー 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
JP5533092B2 (ja) 2010-03-18 2014-06-25 株式会社リコー 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
JP5533091B2 (ja) 2010-03-18 2014-06-25 株式会社リコー 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
JP2011221862A (ja) 2010-04-12 2011-11-04 Ricoh Co Ltd 座標平面におけるデータ点の分布領域描画方法及び座標平面におけるデータ点の分布領域描画プログラム
JP5533196B2 (ja) 2010-04-27 2014-06-25 株式会社リコー 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
US9105035B2 (en) * 2012-06-25 2015-08-11 International Business Machines Corporation Method and apparatus for customer experience segmentation based on a web session event variation
JP6418000B2 (ja) * 2015-02-19 2018-11-07 アイコム株式会社 無線通信システム、無線機、無線通信方法、パケットの生成方法およびパケットからのデータ再生方法
JP6455212B2 (ja) * 2015-02-19 2019-01-23 アイコム株式会社 無線通信システム、無線機、無線通信方法、パケットの生成方法およびパケットからのデータ再生方法
JP6507704B2 (ja) * 2015-02-19 2019-05-08 アイコム株式会社 無線通信システム、無線機、無線通信方法、パケットの生成方法およびパケットからのデータ再生方法
US10991136B1 (en) * 2017-05-30 2021-04-27 Keysight Technologies, Inc. System for visualizing functions that depend on multiple parameters
CN114820869B (zh) * 2022-05-11 2024-05-03 中南大学 一种非完全的散点图去重叠方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01308964A (ja) * 1988-06-07 1989-12-13 Toa Medical Electronics Co Ltd 二次元分布分画方法
JPH0637938U (ja) * 1992-10-19 1994-05-20 鐘紡株式会社 三次元データの簡易表示シート
JP2003016273A (ja) * 2001-06-29 2003-01-17 Daiwa Securities Group Inc 債券利回り表示システム及びその方法、債券利回り計算装置及びその方法、並びにプログラム
JP2008282248A (ja) * 2007-05-11 2008-11-20 Sharp Corp グラフ描画装置および方法、その方法を実行する歩留り解析方法および歩留り向上支援システム、プログラム、並びにコンピュータ読み取り可能な記録媒体

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7659895B2 (en) * 2001-05-18 2010-02-09 International Business Machines Corporation Multidimensional visualization method
US7937252B2 (en) * 2005-10-24 2011-05-03 Kyoto University CMOS model generating apparatus and method, program of the method and recording medium
US7788101B2 (en) * 2005-10-31 2010-08-31 Hitachi, Ltd. Adaptation method for inter-person biometrics variability
JP5399647B2 (ja) * 2008-03-28 2014-01-29 シスメックス株式会社 試料分析装置及びコンピュータプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01308964A (ja) * 1988-06-07 1989-12-13 Toa Medical Electronics Co Ltd 二次元分布分画方法
JPH0637938U (ja) * 1992-10-19 1994-05-20 鐘紡株式会社 三次元データの簡易表示シート
JP2003016273A (ja) * 2001-06-29 2003-01-17 Daiwa Securities Group Inc 債券利回り表示システム及びその方法、債券利回り計算装置及びその方法、並びにプログラム
JP2008282248A (ja) * 2007-05-11 2008-11-20 Sharp Corp グラフ描画装置および方法、その方法を実行する歩留り解析方法および歩留り向上支援システム、プログラム、並びにコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
US20100110078A1 (en) 2010-05-06
JP2010108236A (ja) 2010-05-13

Similar Documents

Publication Publication Date Title
JP4560117B2 (ja) 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
US8560992B2 (en) Method for inspecting a chip layout
US8364437B2 (en) Mark arrangement inspecting method, mask data, and manufacturing method of semiconductor device
JP5533196B2 (ja) 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
JP2011198872A (ja) 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
JP5386945B2 (ja) 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
JP4609481B2 (ja) 形状検査装置および形状検査プログラム
JP5533092B2 (ja) 座標平面におけるデータ点分布領域の識別方法及びその識別プログラム
US8326018B2 (en) Fast pattern matching
CN115690104B (zh) 一种晶圆裂缝检测方法、装置及存储介质
JP5566257B2 (ja) データ生成方法および画像検査方法
JP2023010734A (ja) 温度条件の評価方法
US20180052948A1 (en) Analysis mesh manufacturing equipment and method
US20170039698A1 (en) Pattern outline extraction device, pattern outline extraction method, and computer program product
JP4789651B2 (ja) シミュレーション装置、シミュレーションプログラム及びシミュレーション方法
JP2020088263A (ja) 不良解析装置、不良解析方法、及び不良解析プログラム、並びに教師データ作成装置、教師データ作成方法、及び教師データ作成プログラム
JP2018101347A (ja) 加工プログラム解析装置、加工プログラム解析プログラムおよび加工プログラム解析方法
US8558831B2 (en) Method and program for drawing distribution area of data points on coordinate plane
JP2007086979A (ja) テストパターン編集装置
JP6813826B2 (ja) 三次元物体の形状特定システム、方法及びプログラム
US9632428B2 (en) Method of determining device type and device properties and system of performing the same
US20230306760A1 (en) Information processing apparatus, non-transitory computer readable medium, and method
JP5278236B2 (ja) 散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
JP7392961B2 (ja) 形状データ処理装置、形状データ処理方法及び形状データ処理プログラム
JP5176861B2 (ja) 解析装置、解析方法及び解析プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100414

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20100428

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20100521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100723

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4560117

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees