JP4535811B2 - データ処理方法及びプログラム - Google Patents

データ処理方法及びプログラム Download PDF

Info

Publication number
JP4535811B2
JP4535811B2 JP2004258782A JP2004258782A JP4535811B2 JP 4535811 B2 JP4535811 B2 JP 4535811B2 JP 2004258782 A JP2004258782 A JP 2004258782A JP 2004258782 A JP2004258782 A JP 2004258782A JP 4535811 B2 JP4535811 B2 JP 4535811B2
Authority
JP
Japan
Prior art keywords
data
distance
thinning
curved surface
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004258782A
Other languages
English (en)
Other versions
JP2006072933A (ja
Inventor
長生 綛田
亨 鹿島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Azbil Corp
Original Assignee
Azbil Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Azbil Corp filed Critical Azbil Corp
Priority to JP2004258782A priority Critical patent/JP4535811B2/ja
Publication of JP2006072933A publication Critical patent/JP2006072933A/ja
Application granted granted Critical
Publication of JP4535811B2 publication Critical patent/JP4535811B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Description

本発明は、少ない実験回数のデータを有効活用し、設計効率の向上を図るための応答曲面法(Response Surface Methodology:RSM)などに好適に利用することができるデータ処理方法及びプログラムに関し、特に、離散した複数のデータを補間して連続的な曲線又は曲面を求めるためのデータ処理方法及びプログラムに関する。
近年のユーザニーズの多様化、市場競争の激化、海外の安価な製品参入などにより、製品の品質や納期、コストなどに対する市場要求は益々激しくなり、製品設計、生産設計の高効率化、開発コスト削減が益々要求されてきている。このような問題に対し、実験を多く伴う設計を効率よく行うための技術として応答曲面法が注目されている。
例えば、特許文献1には、実験計画法に基づき収集されたデータを用いて効率よく、製剤設計、材料設計、若しくはシステムの運転条件・製品製造条件を設計又は調整するための応答曲面法に利用される曲面モデルの重調和スプライン補間による同定方法が開示されている。また、この方法におけるスムージングの必要性と一手法が開示されている。
重調和スプライン補間を適用する際にスムージングを行わない場合、収集したデータにノイズや異常値が含まれていると、そのノイズや異常値に合わせるような補間になり、結果的に不適切な補間曲面が生成される。したがって、スムージング処理が必要になる。例えば特許文献1には、データのスムージング(収集した全てのデータを必ずしも通らない関数近似)の方法の一例として、収集したデータを間引いて(サンプリングして)補間関数を求める方法、又は補間曲面の曲率を抑制する方法が開示されている。
ところで、重調和スプライン補間は入力変数が増えて多入力になると、曲面モデル同定演算が発散するという欠点がある。これを回避するためには、薄板スプライン(Thin Plate Spline:TPS)補間を適用することが有効である。薄板スプライン補間については、スムージング効果を得るための機能が本質的に含まれており、この機能は、補間曲面の曲率を抑制する方法に相当する。また、薄板スプライン補間においても、スムージング処理としてデータを間引くことも有効である。
このように、曲面モデルの同定には、スムージング処理が必要であり、その方法としては
1.補間曲面の曲率を抑制する方法
2.データを間引く方法
が有効である。
特開2002−183111号公報
しかしながら、補間曲面の曲率を抑制する方法の場合、曲率の抑制程度を何らかの手段で決定する必要があるが、この決定には以下の問題点がある。
すなわち、抑制程度を決定する手段として、一般化クロスバリデーション(Generalized cross-validation:GCV)が用いられることが多いが、GCVでは、決定した曲率の抑制程度では有効なスムージングが行えない場合がある(Wahba, "Spline Models for Observational Data", Society for Industrial and Applied Mathematics, 1990)。この文献によれば、統計量を利用したスムージング手法は、信号とノイズとを切り分けられるだけのデータ数が充分にない場合には有効なスムージングとはならない。
また、収集したデータと補間曲面とを人間が目でチェックしながら曲率の抑制程度を決定する手段もあるが、試行錯誤が必要であり、曲面モデルの推定に時間及び労力がかかるという問題点がある。更に、ノイズの大きさやデータ密度に偏りがある場合に、補間曲面の曲率を抑制する方法では所望の曲面が得られない場合がある。
また、データを間引く方法の場合、入力空間が多入力のものになるとデータの間引き方は複雑になり、例えばある特定の入力軸からみれば間引き方に偏りがなくても入力空間全体からみれば間引き方が偏ってしまうことが発生する。
本発明は、このような問題点を解決するためになされたものであり、曲線又は曲面モデルを同定する際に的確なスムージングを行うためのデータ間引き処理を行うことができるデータ処理方法及びプログラムを提供することを目的とする。
上述した目的を達成するために、本発明にかかるデータ処理方法は、離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離データ対を抽出し、当該最小距離データ対と当該最小距離データ対の代表値とを置き換えてデータを間引き処理する工程と、前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するものである
本発明においては、データの分布状態が一様になる方向にデータを間引き処理した後、間引き済データ群を補間して連続的な曲線又は曲面モデルを同定するため、データが密の領域から例えば粗の領域と同程度になるようデータを間引き処理すればデータ分布が一様な間引き済データを得ることができ、スムージングされた所望の曲線又は曲面モデルを生成することができる。また、前記データ群における各データ間の距離又は各データ間の類似度などの距離指標に基づき間引き処理をすることができるため、簡単な方法にてデータの分布の粗密を判定して間引き処理を実行することができる。更にまた、前記間引き処理では、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離データ対を抽出し、当該最小距離データ対と当該最小距離データ対の代表値とを置き換えることができ、間引き処理対象となる最小距離データ対のデータを例えば最小距離データ対のうちのいずれか一方又は最小距離データ対の平均値などの代表値とすることで、間引き処理を行うことができる。
本発明にかかる他のデータ処理方法は、離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる側から前記距離又は距離指標が大きくなる順に所定数のデータを抽出し、前記所定数のデータと当該所定数データの代表値とを置き換えてデータを間引き処理する工程と、
前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するものである。
本発明においては、前記間引き処理では、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる側から距離又は距離指標が大きくなる順に所定数のデータを抽出し、前記所定数のデータと当該所定数データの代表値とを置き換えることができ、所定数のデータからなるクラスタを抽出してそれらを当該クラスタの代表値と置き換えることで間引き処理を実行することができる。
更に、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離を評価指標とし、前記評価指標が所定の値より大きい場合には打ち切り手段により、前記間引き処理を打ち切る打ち切り工程を更に有し前記打ち切り工程では、前記間引き処理後のデータ群を前記間引き済データ群とすることができ、所望の間引き度合いで間引き処理を停止することができる。
更にまた、モデル同定手段により、前記間引き処理後の間引き済データ群をスプライン補間することにより連続的な曲線又は曲面モデルを同定する工程を更に有することができる。
本発明にかかるプログラムは、所定の動作をコンピュータに実行させるためのプログラムであって、離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離データ対を抽出し、当該最小距離データ対と当該最小距離データ対の代表値とを置き換えてデータを間引き処理する工程と、前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するものである
本発明にかかる他のプログラムは、所定の動作をコンピュータに実行させるためのプログラムであって、離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる側から前記距離又は距離指標が大きくなる順に所定数のデータを抽出し、前記所定数のデータと当該所定数データの代表値とを置き換えてデータを間引き処理する工程と、前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するものである。
本発明に係るデータ処理方法によれば、曲線又は曲面モデルを同定する際に的確なスムージングを行うためのデータ間引き処理を行うことができる。
また、本発明に係るプログラムによれば、上述した間引き処理及び曲線及び曲面モデルの同定処理をソフトウェアにより実現することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、曲面モデルの同定という本質的目的に合う適切なデータの間引き方を与え結果として適切なスムージング処理を実現することができる曲線又は曲面モデルの同定方法としてのデータ処理方法に適用したものである。
曲面モデルの同定にはスムージング処理が必要であり、またそのための一手法であるデータの間引き方自体にも適切な手順が必要である。本実施の形態におけるデータの間引き処理に従ってデータを適切に間引くことにより、適切なスムージング処理を可能とするのみならず、曲面モデルの同定の精度を劣化させることなく無駄な演算処理量の増加を回避することができる。
具体的には、収集した複数のデータ(収集データ)からなるデータ群の入力空間内での相互の距離に着目し、他の収集データとの距離又は距離指標が小さいデータを優先的に間引く。このことにより、間引き処理後に残されたデータ群(間引き済データ群)の相互の距離が均一化される方向に向かう。すなわち、データ間距離に着目し、入力空間内のデータ密度が高い領域に存在するデータを優先的に間引くことにより、データの配置が偏ることを回避することで、適切なスムージング処理を実現するものである。ここで、間引くとは、単純にデータを削除するのみならず、データを合成することによりデータ数を削減することを含む広義の間引きに相当する。
実施の形態1.
先ず、本発明の実施の形態1について説明する。図1は、本実施の形態におけるデータ処理装置を示す機能ブロック図である。図1に示すように、データ処理装置としての曲面モデル同定装置300は、例えば実験計画法等により収集された複数の実験データ等からなるデータ群のデータの分布状態に基づき間引き処理をする間引き処理部100と、間引き処理された間引き済みデータ群を補間して連続的な曲面モデルを同定する補間処理部200とを有する。なお、本実施の形態においては、曲面モデルを同定するものとして説明するが、同様の方法を曲線モデルの同定に適用できることはいうまでもない。
実験データは、例えば直交表、球形中心二次複合計画などにより収集された実験計画データ等を使用することができる。また、過去に収集した実験計画データに新たに数回行った再実験データを追加した場合、又は実験計画配置で収集しようとしたがデータの欠落があった場合などの非実験計画データであってもよい。このように収集された複数のデータからなるデータ群は、一般的にはその分布に偏りがある離散的なデータである。データは、n種類の変量によって特徴づけられるn次元のデータ(ベクトル)である。後述する補間処理部200は、例えば、各データのうち、(n−1)種類の変量を解の要因となる変量、残りの一の変量を解となる変量とし、(n−1)次元のデータを入力変数、残りの一のデータを出力変数として曲面モデルを同定することができる。
間引き処理部100は、入力される離散的なデータ群の分布の偏りをなくすようにデータの間引き処理を行う。データ群に含まれるデータには、データが属する次元空間においてそのデータ数が少ない粗の領域と、データ数が多い密の領域とが存在する。間引き処理部100は、データ群におけるデータが粗の領域と例えば同程度の分布状態(密度)となるよう、密の領域からデータを削除又は複数のデータを統合するなどする間引き処理を実行し、間引き済のデータ(間引き済データ群)を補間処理部200に出力する。
補間処理部200は、間引き済データ群から、補間により応答曲面モデルを同定する。この補間としては、例えば後述する多変数スプライン(薄板スプライン、重調和スプライン)を利用することができる。多変数スプラインの場合、ランダム分布したデータでも補間可能であり、多変数にも容易に応用することができる。これにより、一意にデータを通る滑らかな応答曲面が定まる。
次に、本実施の形態の曲面モデル同定装置における間引き処理部100について詳細に説明する。図2は、間引き処理部100の機能を示すブロック図である。図2に示すように、間引き処理部100は、入力データ群における各データ間の距離を算出するデータ間距離算出部101と、算出されたデータ間距離に基づきデータ対を抽出し、間引き処理を実行するデータ抽出部102と、データ抽出部102にて間引き処理された後のデータのデータ間距離に基づき当該間引き処理後のデータの評価指標を算出し、間引き処理を打ち切るか否かを決定する評価指標算出部103とを有する。評価指標算出部103にて間引き処理後のデータが所定の評価基準に達したと判断された場合は、当該間引き処理後のデータが間引き済データ群として出力される。
なお、本実施の形態における曲面モデル同定装置300における任意の処理は、ハードウェアにより実行させても、CPU(Central Processing Unit)にコンピュータプログラムを実行させてもよい。ソフトウェアにて実行させる場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
データ間距離算出部101は、処理開始時点では、実験データなどの入力データ群が入力され、それ以降は評価指標算出部103による間引き処理の打ち切り決定までデータ抽出部102にて間引き処理された間引き処理後のデータ群が入力され、これらのデータ群に含まれる一のデータとそれ以外のデータとの距離を算出する。すなわち、k個のデータが入力された場合、一のデータに対して残りの(k−1)のデータとの距離が算出され(k−1)個のデータ間距離を得る。
ここで、データ間距離とは、2つのデータ間の空間的な距離の他、クラスタ分析に使用される類似度(非類似度)などとして使用される距離又は距離指標などであってもよい。具体的には、データ間距離算出部101は、データ間距離として、データを構成する各変数(出力変数を含む)を正規化し、ユークリッド平方距離、ミンコフスキー距離、マハラノビス汎距離等の距離を算出することができる。いずれの距離又は距離指標を算出するかは、収集されたデータの性質等に応じて適宜選択するようにすればよい。以下の説明では、これらの距離又は距離指標をまとめて距離ということとする。
データ抽出部102は、例えばデータ間距離算出部101にk個のデータが入力された場合、一のデータについて、(k−1)個のデータ間距離を受け取る。すなわち、k個のデータがある場合は、k×(k−1)/2個のデータ間距離を受け取る。データ抽出部102は、これらの全データ間距離のうち最小のデータ間距離Lminとなるデータ対を、間引き処理対象のデータ対として抽出する。こうして抽出された間引き処理対象のデータ対は、距離的に入力データ群の中で最も密なデータ対である。間引き処理は、この間引き対象のデータ対のうち、いずれか一方を削除することで行う。削除しなかった方のデータと共に残りのデータを間引き処理後のデータとして評価指標算出部103に出力する。
また、間引き処理は、間引き処理対象データ対のいずれか一方を削除するものとしてもよいが、例えばデータの入力順に番号を付し、間引き処理対象データ対のうち、上記番号の小さいものを削除するようにしてもよい。また、いずれか一方を削除するのではなく、間引き処理対象データ対の平均値を求め、間引き処理対象データ対のデータを削除し、当該平均値を代表値とし、データ対に換えて挿入するようにしてもよい。更に、本実施の形態においては、最小データ間距離のデータ対を抽出して一のデータを削除するものとしたが、後述するように最小データ間距離からデータ間距離が大きくなる順に複数のデータ対を抽出して、複数個のデータを一度に削除するような間引き処理を行ってもよい。
評価指標算出部103は、間引き処理後のデータを受け取って間引き処理後のデータの評価指標を算出し、この評価指標に基づき間引き処理の打ち切りを決定する。打ち切りを決定した場合には、間引き処理後のデータを間引き済データとして後段の補間処理部200に出力する。
間引き処理後のデータの評価指標は、以下のような方法があるが、これに限らず、後段の補間処理部200にて生成される曲面モデルが滑らかな曲面となるような間引き済データが得られるような指標であればよい。補間により滑らかな曲面モデルを生成するには、入力データとして与えられる間引き済データ群のデータの分布に偏りがないことが好ましい。すなわち、データの分布に粗密がある場合、密の領域のデータに合わせて曲面モデルを生成すれば滑らかな曲面を得られず、密の領域のデータに合わせて滑らかな曲面モデルを生成すると、粗の領域の曲面モデルが線形となり所望の曲面モデルを得ることができない。
これを回避するため、本実施の形態において、データ抽出部102にて入力データ群のうち最も密であるデータ対を抽出して間引き処理するが、評価指標として最も単純には、間引き処理後のデータ数を使用することができる。この場合、評価指標算出部103は、間引き処理後のデータ数をカウントする又は間引き処理の回数をカウントするのみでよい。そして、例えば入力データ群がk個の場合、その数〜数十%のデータを間引き処理により削減するまで間引き処理を繰り返す。間引き処理を打ち切るデータ数は、収集した実験データの分布等に応じて適宜設定するものとすればよい。また、ある程度間引き処理をした後、補間処理部200にて曲面モデルを同定し、所望の曲面モデルが得られない場合は、再度間引き処理を続行するようにしてもよい。
また、間引き処理後のデータにおける最小データ間距離が所定の閾値以上である場合に間引き処理を打ち切るようにしてもよい。上記閾値は、外部から入力手段等により指定するようにしてもよく、また間引き処理後のデータにおける最大データ間距離等を基に評価指標算出部103等にて決定するようにしてもよい。
更に、所定回数間引き処理をした後、間引き処理後のデータを補間処理部200に出力し、曲面モデルを生成し、評価指標算出部103がこれを暫定曲面モデルとして受け取って標準偏差を求め、この標準偏差と、間引き処理前のデータの標準偏差とを比較し、暫定曲面モデルの標準偏差が間引き処理前のデータの標準偏差より小さくなった時点で間引き処理の打ち切りを決定し、このときの暫定曲面モデルを曲面モデルとし、暫定曲面モデルを生成する際に使用した間引き処理後のデータを間引き済データ群とするなどしてもよい。又は、暫定曲面モデルの標準偏差が所定の値以下となった時点で同様に間引き処理を打ち切るようにしてもよい。
以上のような間引き処理部の処理手順について説明する。図3は、本実施の形態における間引き処理方法を示すフローチャートである。図3に示すように、先ず、入力される例えばk個のデータの各変数(出力変数を含む)を正規化し、各データ間におけるユークリッド平方距離等のデータ間距離を算出する(ステップS1)。一のデータについて(k−1)個のデータ間距離を求め、これにより、k(k−1)/2のデータ間距離が求まる。なお、上述したように、ユークリッド平方距離の他、ミンコフスキー距離、マハラノビス汎距離等、クラスタ分析の類似度又は非類似度として用いられる距離を使用してもよい。
次に、前記データ間距離の最小値を選択し、この最小データ間距離を与えるデータ対を抽出し(ステップS2)、抽出したデータ対の一方を削除して間引き処理を実行する(ステップS3)。間引き処理としては、一方のデータを削除する他、データ対の平均値等の代表値とデータ対とを入れ換えるようにしてもよい。
そして、間引き処理後に残ったデータの配置具合の評価指標を算出する(ステップS4)。評価指標としては、上述したように、間引き処理後のデータ群のデータ数、間引き処理後のデータ群の標準偏差、間引き処理後のデータ群の最小データ間距離等を使用することができる。この評価指標に基づき、間引き処理を継続するか、間引き処理を打ち切り、続く曲面モデルの生成を実行するかを決定する。例えば間引き処理後のデータ群のデータ数が所定の値以下である場合、間引き処理後のデータ群の最小データ間距離が所定の値以上である場合、又は間引き処理後のデータ群から得られる暫定曲面モデルの標準偏差が間引き処理前のデータ群の標準偏差より小さい場合などには、間引き処理を打ち切り、曲面モデルの同定を行う。
本実施の形態においては、曲面モデルの同定に必要なスムージング処理としてデータの間引き処理を、データの分布状態に基づき行い、例えば、データの分布が密の領域に属するデータの数を粗の領域に属するデータの数と同程度となるまで間引き処理をすることで、データの空間的な配置の偏りをなくし、適切なスムージングを実行することができる。
また、従来の重調和スプライン、薄板スプライン補間では、補間曲面数式の作成に使用するデータの数の2乗のオーダーで演算処理と必要な記憶量が増える。曲面モデル同定の精度を向上させるためにはデータ数が増えることが好ましいが冗長なデータが含まれている場合には、無駄な演算処理量の増加を回避することは困難である。これに対し、本実施の形態においては、間引き処理により入力データ群から冗長と見なせるデータを削除するなどの処理を行うことで、補間処理に使用するデータ数を削減することができる。これにより、無駄な演算処理量を削減し、演算処理の高速化を実現することができる。
実施の形態2.
次に、本発明における実施の形態2について説明する。実施の形態1は、データ間距離が最小のデータ対を抽出して間引き処理をしたのに対し、本実施の形態においては、データ間距離が最小なものから大きくなる順に複数個抽出し、これらの複数個のデータからなるクラスタについて間引き処理するものである。
本実施の形態におけるデータ処理装置としての曲面モデル同定装置も図1及び図2と同様の構成とすることができる。ただし、図2に示すデータ抽出部102における処理が異なる。
本実施の形態におけるデータ抽出部102は、実施の形態1と同様、データ間距離算出部101から各データにおけるデータ間距離を受け取る。そして、データ間距離が最小側からm個のデータ(以下、間引き処理対象クラスタともいう。)を抽出する。通常のクラスタ分析の場合は、m=2である。そして、このm個のデータからなる間引き処理対象クラスタを代表する代表値を算出する。代表値は、m個のデータの平均値とすることができる他、例えばデータの信頼度が判断できる場合には信頼度で重み付けした重み付き平均値としてもよい。これを間引き処理対象クラスタの代表値とし、間引き処理対象クラスタに属するデータを全て削除し、この代表値を追加することで間引き処理を行う。すなわち、mが2より大きい場合には、1度の間引き処理で2以上のデータ数を削減することができる。
その後、評価指標算出部が上述の間引き処理後のデータの評価指標に基づき間引き処理を打ち切るか否かを決定する点などは実施の形態1と同様である。図4は、本実施の形態における間引き処理方法を示すフローチャートである。
図4に示すように、先ず、実施の形態1と同様に、入力される例えばk個のデータの各変数(出力変数を含む)を正規化し、各データ間におけるユークリッド平方距離等のデータ間距離を算出する(ステップS11)。次に、前記データ間距離が最小なものから順にm個のデータを抽出し(ステップS12)、抽出したm個のデータ(間引き処理対象クラスタ)の平均値を求める(ステップS13)。そして、間引き処理対象クラスタに属するデータをすべて削除し、ステップS13にて求めた平均値を追加する(ステップS14)。
その後、間引き処理後に残ったデータの評価指標を算出し(ステップS15)、間引き処理を打ち切るか否かを決定する(ステップS16)点は実施の形態1と同様である。すなわち、上述したように、間引き処理後のデータ群のデータ数、間引き処理後のデータ群の標準偏差、間引き処理後のデータ群の最小データ間距離等を評価指標とし、例えば間引き処理後のデータ群のデータ数が所定の値以下である場合、間引き処理後のデータ群の最小データ間距離が所定の値以上である場合、又は間引き処理後のデータ群から得られる暫定曲面モデルの標準偏差が間引き処理前のデータ群の標準偏差より小さい場合などには、間引き処理を打ち切り、曲面モデルの同定を行う。
本実施の形態においては、間引き処理対象クラスタの平均値を代表値とし、間引き処理対象クラスタのデータと平均値とを入れ換える間引き処理によりスムージングをおこなう。このことにより、実施の形態1と同様の効果、すなわち適切な間引きによりデータの偏りをなくして滑らかな曲面モデルを得ることができると共に、間引き処理により演算処理量を低減することができる。さらに、クラスタとして抽出するデータ数を多くすることで間引き処理を高速化することができる。また、削除するクラスタの代わりにその平均値を入れるため、更にデータの偏りをなくし、データの分布状態を一様にすることができる。
次に、補間処理部200の処理の一具体例について説明しておく。本実施の形態における補間処理としては、間引き処理後の間引き済データ群をスプライン補間する方法、ラグランジェ補間する方法、間引き済データ群から重回帰式を求める方法などにより連続的な曲線又は曲面モデルを同定するものである。
このうち、スプライン補間について具体的に説明する。スプラインによる曲面生成問題は、梁又は板のような弾性体の変形問題に置き換えることができる。すなわち、収集された実験データ(サンプル点)を弾性体のある部位に与えられた変位とみなせば、最も滑らかなスプライン曲面を求めることはある弾性体にいくつかの変位が与えられた場合に発生する下記式(1)に示す内部歪エネルギーEを最小化する問題とみなすことができる。
Figure 0004535811
上記式(1)を解く方法のうち、多変数データ、ランダムデータへの適用が容易なものとして特許文献1に記載のグリーン関数を用いた解法があり、これにて導かれたものが下記式(2)に示す重調和スプラインである。
Figure 0004535811
ここで、nは与えられたデータ点数、dは、与えられたデータiのX座標と任意のX座標とのユークリッド距離、g(d)は、dを変数とするグリーン関数であり、関数定義は、入力変数Xの次元数により異なる。例えば、2次元X=(x,x)の場合、上記式(2)におけるグリーン関数は、下記式(3)となる。また、αは、係数であり、与えられたデータから線形マトリクス演算で計算することができる。
Figure 0004535811
また、スムージング機能を有する薄板スプラインの場合は、最も滑らかなスプライン曲面を求めることは、下記式(4)のエネルギーE’式を最小化する問題とみなすことができる。
Figure 0004535811
上記式(4)から下記式(5)の薄板スプラインが導かれる。ここで、λはスムージングパラメータ、cは係数、pは入力変数の次元数を示す。
Figure 0004535811
次に、本実施の形態を適用した曲線モデルを例にとって本発明の効果について説明する。図5は、与えられたデータ点に対し、上述の実施の形態2を適用して曲線モデルを求めた実施例であり、図6は、間引き処理を行わず、同一のデータ点から従来の曲率を抑制する方法(薄板スプライン)にて曲線モデルを求めた比較例を示すグラフ図である。
図5に示すように、データ間最小距離に基づきクラスタを抽出し、クラスタのデータと平均値とを入れ換える処理を繰り返してスムージングを行うことにより、サンプル点の特性を表現しつつ滑らかな曲線モデルが生成されている。
図6に示す比較例は、薄板スプラインを使用して求めた曲線モデルであって、λは、上述したスムージングパラメータで、抑制程度の大きさを示すもので、λが大きいものほど曲線モデルは直線に近づく。図5に示す曲線モデルに対し、図6に示すように、外部からの指示により手動にて曲率の抑制程度(スムージングパラメータλ)を変化させた場合には、スムージングパラメータλを大きくするとサンプル点が粗の領域(x=10〜40)では曲線がほぼ直線となってしまう。また、スムージングパラメータλが小さいもののみならず、大きくしてもサンプル点が密の領域(x=0近傍、50近傍)においては曲線モデルが密の領域のサンプル点を補間しきれず、不要な極小・極大点が生じてしまい、滑らかな曲線モデルを得ることができない。すなわち、データの分布状態に粗密がある場合は、スムージングパラメータλをどのように変化させても所望の曲線モデルを得ることが困難である。
また、同様に、間引き処理を行わず、スムージングパラメータλを変化させてノイズを含む3次元データの曲面モデルを求めた比較例を図7に示す。サンプル点にノイズを含む場合、例えば与えられたサンプル点全てをつなぐ曲面を求めると、λ=0に示すように、小さい凹凸が多数発生する。これに対し、スムージングパラメータλを徐々に大きくしていくことで生成される曲面モデルが滑らからになり、重回帰式(線形多項式)に近づくようスムージングしてしまい、λ=200では線形式(平面)に近づき、データの分布に偏りがある場合には、スムージングパラメータλの調整のみでは滑らかな曲面モデルを生成することはできない。
以上のことから、データの分布に偏りがある離散データから連続的な曲線モデル又は曲面モデルを同定するためには、曲線モデル又は曲面モデルの生成の前に、入力データ群におけるデータの分布の偏りをなくすようデータの間引き処理をすることが極めて有効である。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
本発明の実施の形態1におけるデータ処理装置を示す機能ブロック図である。 本発明の実施の形態1におけるデータ処理装置の間引き処理部の機能を示すブロック図である。 本発明の実施の形態1のデータ処理装置における間引き処理方法を示すフローチャートである。 本発明の実施の形態2のデータ処理装置における間引き処理方法を示すフローチャートである。 与えられたでデータ点に対し、上述の実施の形態2を適用して曲線モデルを求めた実施例を示すグラフ図である。 間引き処理を行わず、同一のデータ点から従来の曲率を抑制する方法(薄板スプライン)にて曲線モデルを求めた比較例を示すグラフ図である。 間引き処理を行わず、ノイズを含む3次元データの曲面モデルをスムージングパラメータλを変化させて求めた比較例を示すグラフ図である。
符号の説明
101 データ間距離算出部
102 データ抽出部
103 評価指標算出部
200 補間処理部
300 曲面モデル同定装置

Claims (6)

  1. 離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離データ対を抽出し、当該最小距離データ対と当該最小距離データ対の代表値とを置き換えてデータを間引き処理する工程と、
    前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するデータ処理方法。
  2. 離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる側から前記距離又は距離指標が大きくなる順に所定数のデータを抽出し、前記所定数のデータと当該所定数データの代表値とを置き換えてデータを間引き処理する工程と、
    前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するデータ処理方法。
  3. 前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離を評価指標とし、前記評価指標が所定の値より大きい場合には打ち切り手段により、前記間引き処理を打ち切る打ち切り工程を更に有し、前記打ち切り工程では、前記間引き処理後のデータ群を前記間引き済データ群とする
    ことを特徴とする請求項1又は2記載のデータ処理方法。
  4. モデル同定手段により、前記間引き処理後の間引き済データ群をスプライン補間することにより連続的な曲線又は曲面モデルを同定する工程を更に有する
    ことを特徴とする請求項1又は2記載のデータ処理方法。
  5. 所定の動作をコンピュータに実行させるためのプログラムであって、
    離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる最小距離データ対を抽出し、当該最小距離データ対と当該最小距離データ対の代表値とを置き換えてデータを間引き処理する工程と、
    前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するプログラム。
  6. 所定の動作をコンピュータに実行させるためのプログラムであって、
    離散した複数のデータからなるデータ群におけるデータの分布状態が一様になるよう前記分布状態が密の領域から間引き手段により、前記データ群に含まれる一のデータとその他のデータとの距離又は距離指標が最小となる側から前記距離又は距離指標が大きくなる順に所定数のデータを抽出し、前記所定数のデータと当該所定数データの代表値とを置き換えてデータを間引き処理する工程と、
    前記間引き処理後の間引き済データ群を補間手段により補間して連続的な曲線又は曲面モデルを同定する工程とを有するプログラム。
JP2004258782A 2004-09-06 2004-09-06 データ処理方法及びプログラム Active JP4535811B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004258782A JP4535811B2 (ja) 2004-09-06 2004-09-06 データ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004258782A JP4535811B2 (ja) 2004-09-06 2004-09-06 データ処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006072933A JP2006072933A (ja) 2006-03-16
JP4535811B2 true JP4535811B2 (ja) 2010-09-01

Family

ID=36153461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004258782A Active JP4535811B2 (ja) 2004-09-06 2004-09-06 データ処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4535811B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4929041B2 (ja) * 2007-05-10 2012-05-09 パイオニア株式会社 ノイズ除去装置、その方法、ノイズ除去プログラム及びその記録媒体
JP2009080076A (ja) * 2007-09-27 2009-04-16 Nippon Steel Corp 成形品の形状評価方法及び装置
JP5412829B2 (ja) * 2008-12-27 2014-02-12 Jfeスチール株式会社 鋼板の形状矯正装置
JP5320128B2 (ja) * 2009-03-31 2013-10-23 アズビル株式会社 送水温度制御装置および方法
JP5610129B2 (ja) 2010-03-26 2014-10-22 富士通株式会社 3次元テンプレート変形方法、装置及びプログラム
US10918307B2 (en) * 2011-09-13 2021-02-16 St. Jude Medical, Atrial Fibrillation Division, Inc. Catheter navigation using impedance and magnetic field measurements
US10362963B2 (en) 2011-04-14 2019-07-30 St. Jude Medical, Atrial Fibrillation Division, Inc. Correction of shift and drift in impedance-based medical device navigation using magnetic field information
US9901303B2 (en) 2011-04-14 2018-02-27 St. Jude Medical, Atrial Fibrillation Division, Inc. System and method for registration of multiple navigation systems to a common coordinate frame
JP2020135526A (ja) * 2019-02-21 2020-08-31 株式会社豊田自動織機 移動体の障害物検知装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03156631A (ja) * 1989-11-15 1991-07-04 Nec Corp デジタイザ入力装置におけるデータ間隔均一化処理方法
JP2000194416A (ja) * 1998-12-28 2000-07-14 Canon Inc デ―タ表示装置及び方法
JP2001307130A (ja) * 2000-02-17 2001-11-02 Matsushita Electric Ind Co Ltd アニメーションデータ圧縮装置、アニメーションデータ圧縮方法、ネットワークサーバ、及びプログラム記録媒体
JP2001330445A (ja) * 2000-05-24 2001-11-30 Nissan Motor Co Ltd 曲路検出装置
JP2002015338A (ja) * 2000-06-30 2002-01-18 Minolta Co Ltd モデルの変形方法およびモデリング装置
JP2002183111A (ja) * 2000-12-13 2002-06-28 Yamatake Corp 曲面モデルの同定方法及びプログラム
JP2002259998A (ja) * 2001-02-28 2002-09-13 Toshiba Corp 数値解析を支援するための装置、方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03156631A (ja) * 1989-11-15 1991-07-04 Nec Corp デジタイザ入力装置におけるデータ間隔均一化処理方法
JP2000194416A (ja) * 1998-12-28 2000-07-14 Canon Inc デ―タ表示装置及び方法
JP2001307130A (ja) * 2000-02-17 2001-11-02 Matsushita Electric Ind Co Ltd アニメーションデータ圧縮装置、アニメーションデータ圧縮方法、ネットワークサーバ、及びプログラム記録媒体
JP2001330445A (ja) * 2000-05-24 2001-11-30 Nissan Motor Co Ltd 曲路検出装置
JP2002015338A (ja) * 2000-06-30 2002-01-18 Minolta Co Ltd モデルの変形方法およびモデリング装置
JP2002183111A (ja) * 2000-12-13 2002-06-28 Yamatake Corp 曲面モデルの同定方法及びプログラム
JP2002259998A (ja) * 2001-02-28 2002-09-13 Toshiba Corp 数値解析を支援するための装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2006072933A (ja) 2006-03-16

Similar Documents

Publication Publication Date Title
KR102068576B1 (ko) 합성곱 신경망 기반 이미지 처리 시스템 및 방법
JP4535811B2 (ja) データ処理方法及びプログラム
WO2018068421A1 (zh) 一种神经网络的优化方法及装置
JP2006268558A (ja) データ処理方法及びプログラム
JP2005234810A (ja) 画像処理装置
WO2007088926A1 (ja) 画像処理、画像特徴抽出、および画像照合の装置、方法、およびプログラム並びに画像照合システム
CN109033309A (zh) 数据处理方法、装置、设备及存储介质
CN111259312B (zh) 多目标流水车间调度方法、装置、计算机设备及存储介质
CN110941542A (zh) 基于弹性网络的序列集成高维数据异常检测系统及方法
CN111898493B (zh) 基于二进制量化三维特征描述子的物体识别方法
US20210303987A1 (en) Power reduction for machine learning accelerator background
JP7302229B2 (ja) データ管理システム、データ管理方法、およびデータ管理プログラム
JP7169768B2 (ja) 画像処理装置、画像処理方法
CN112949841A (zh) 一种基于Attention的CNN神经网络的训练方法
CN111429232A (zh) 产品推荐方法、装置和电子设备及计算机可读存储介质
KR101811135B1 (ko) 최적 정밀도 결정을 통한 모델 단순화 장치 및 방법
TWI552580B (zh) 影像壓縮方法
US20200134360A1 (en) Methods for Decreasing Computation Time Via Dimensionality
Enwere et al. A Comparative Approach on Bridge and Elastic Net Regressions
KR102623109B1 (ko) 합성곱 신경망 모델을 이용한 3차원 의료 영상 분석 시스템 및 방법
JP6217205B2 (ja) デジタル−アナログ・フィッティング装置、デジタル−アナログ・フィッティング方法、及びプログラム
WO2020211037A1 (zh) 加速器的检测方法和验证平台
US20230401036A1 (en) Methods and systems for quantum computing
JP2004192584A (ja) 遺伝的アルゴリズムを用いた、ネットワーク型情報処理システムとその学習装置、学習方法及び学習方法のプログラムを記録した記録媒体
WO2019009912A1 (en) METHODS FOR REDUCING CALCULATION TIME THROUGH DIMENSIONALITY REDUCTION

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100615

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4535811

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140625

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250