JP2008546996A - 分類学習のための測定データの変換 - Google Patents

分類学習のための測定データの変換 Download PDF

Info

Publication number
JP2008546996A
JP2008546996A JP2008516491A JP2008516491A JP2008546996A JP 2008546996 A JP2008546996 A JP 2008546996A JP 2008516491 A JP2008516491 A JP 2008516491A JP 2008516491 A JP2008516491 A JP 2008516491A JP 2008546996 A JP2008546996 A JP 2008546996A
Authority
JP
Japan
Prior art keywords
data
conversion
measurement
measurement data
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008516491A
Other languages
English (en)
Inventor
デヴィッド シャッファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008546996A publication Critical patent/JP2008546996A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)

Abstract

変換データがパターン分類学習方法による入力に適しているように、測定データの結合変換のためのシステム600、装置500及び方法が提供される。変換されたデータの感度は信頼性の低い領域において減らされる。一方、他の領域での感度は、大部分変化がないままであるか、又は強化される。感度減少を実現するため装置500及びシステム600において結合変換モジュール502を用いて、ガウシアン変換がシグモイド関数と組み合わされる。ユーザは、システム600のユーザ制御サブシステム604を介して、及び装置500に入力されるユーザ解析入力508を提供することにより、処理を命令することができる。

Description

本発明は、所望される領域におけるデータの感度を強化しつつ信頼性の低い領域における全体の感度を減らすため、元の測定データを変換するシステム、装置及び方法に関する。
大きな又は小さなダイナミックレンジが原因で、特定のパターン分類学習法による使用にはあまり適さない分布を測定データが持つ可能性がある。例えば、ガラススライドが単一のストランドされた(stranded)DNAを伴い装着されるようなマイクロアレイを考える。サンプルに存在するRNAがDNAストランドに選択的にバインドすることになるよう、サンプルは斯かるスライドの上を洗い流される。これはしばしば、対照とターゲットとの間を区別するのに使用される異なるタイプの蛍光性分子へのバインドを伴う対照に対して行われる。その後、第1の色強度と第2の色強度の比の対数であるような測定データを用いてそのターゲットがどのように表されるかを決定するのに、光の色及び強度が読み出される。
通常の実験において、1つのタイプのマイクロアレイデータの読み出しは、試験組織及び対照組織における遺伝子発現レベルの比の対数としてエンコードされる。結果として生じる数の数値的範囲は、非常に大きい可能性があるが、通常はずっと狭い範囲(例えば+2から−2)に収まることになる。
一般的なパターン認識学習方法は、フィードフォワード・ニューラルネットワークとも呼ばれる、マルチレイヤ・パーセプトロン(MLP)である。これらの機械は、その入力データが[0,1]の範囲における数値であることを必要とする。従って、これらのマイクロアレイデータをMLPに与えるには、この入力データ範囲の要請に適合するよう、元のデータを変換しなければならない。
所望の変換を実行することができる関数は、逆正接関数のようなシグモイド関数である。これらの関数は、非常に大きい又は非常に小さい測定値が常に要求範囲[0,1]にマップされることを確実にすることができるが、その犠牲として、大きな値間の差が非常に小さくされる可能性がある。これを大きな値の範囲における「減じられた感度」と呼ぶことにする。通常予想される範囲における感度がほぼ線形であるよう、ある者はシグモイド関数に対する適切なパラメタを選択することができる。ほぼ線形の範囲における勾配が45度を超える場合、感度は強化されることになり、45度未満である場合、感度は減じられることになる。ちょうど45度の場合には、変化がないままである。
しかしながら、まだ困難が生じる可能性がある。上述の例示において、変換されたデータの感度はゼロの近傍で最大となる(即ち、変換されたシグモイド関数は最大差分を持つ)であろうことになる。これは、測定値の比が1.0の近傍にあるような領域であり、残念ながらその信頼度が最低である。信頼性がないような場合、小さな差が学習機械により採用されることにならないよう、ある者はここで変換の感度が非常に低くなるよう希望するであろう。
本発明のシステム、装置及び方法は、信頼性の低い領域における全体の変換の感度を減らしつつ、その他の領域においては大部分感度が変更のないよう、又は強化されるようにする、元のデータを変換するための実効的で効率的な方法を提供する。
本発明は、変換の幅を、使用される用途に対して必要とされる幅に調整することを可能にするパラメタを含む追加的なガウシアン変換を提供することにより、従来の課題を解決する。
当業者であれば、以下の説明は説明目的で与えられ、本発明を限定するものでないことを理解されるであろう。当業者は、本発明の精神及び添付された特許請求の範囲の範囲に含まれる多くの変形が存在することも理解されるであろう。本発明をあいまいにしないよう、知られた機能及び処理に関する不必要な説明は、本書から省略されることができる。
測定データにおいて、測定の分布は、変換を示唆することができる。例えば、測定のセットが非常に歪んでいる場合、対数、平方根又は他の指数(-1と+1との間)が適用されることができる。測定のセットが非常に尖っているが、歪みは少ない場合、極値の影響を減らすため逆正接関数が使用される。しかしながら、逆正接関数の使用は、本ガウシアン変換が修正することになる、ゼロでの急な勾配を生み出す。即ち、本発明のシステム、装置及び方法は、信頼性の低い領域における変換の感度を減らしつつ、それ以外の領域では大部分変更がないままであるようデータを変換する方法を提供する。信頼性の低い領域における全体の変換の感度を減らしつつ、その他の領域では感度を強化するか又は大部分変更がないままにするような態様で、元のデータを変形させる第2の変換が追加される。
好ましい実施形態において、自身のパラメタを持つ追加のガウシアン変換が与えられる。そのパラメタp1は、ガウシアン変換の幅を、その用途に必要とされる幅に調整することを可能にする。図1を参照すると、幅パラメタp1を変化させた結果が図示される。図2に拡大表示される、この水平域101は、中間における入力データ値の感度を大幅に減少させ、p1(水平域の幅)を変化させることにより、データのサンプルセットからの値間での望ましくない差を大幅に減らすことが可能になる。
ニューラルネット(又は他のパターン認識方法)へのデータの入力に対する結合変換の好ましい実施形態が、以下のコンピュータプログラムに示される。あるタスクがある特性を必要とし、他の特性を必要としない場合、あるものが他のものとは独立していずれかの変換を実行することができることは、当業者であれば明らかであろう。
本発明の結合変換は、パラメタp1〜p3に対する値と元の入力値とを受け入れて、変換された値を返すソフトウェア及びファームウェアモジュールの少なくとも一方として、解析装置に組み込まれることができる。以下のメインプログラムは、斯かる実施形態の挙動を説明する。メインプログラムは、ユーザからのp1〜p3に対する入力を要請し、入力データに対する本発明による変換後の値を、[-20,20]の範囲にわたり0.1刻みで増加する値として表示する。実際には、実際のサンプルデータが入力されることになり、その組み合わせにより変換されることになる。
図3を参照すると、そこではp2が変換の一番上の端を0とp2との間で変化させるのに使用される。図4を参照すると、p3は、最も多くのデータが予想される数値範囲を覆うようS曲線のすそを近づける又は遠ざけるよう押すことにより、S曲線の勾配を変化させるのに使用される。p1対p3を変化させることにより、どの外れ値がどれだけの量(by how much)引っ張りこまれるか(pulled-in)、及びこれらの値の差が強調されるか又は減少されるかを決定することができる。
図5を参照すると、本発明に基づき修正された解析装置500の好ましい実施形態が示される。測定データは入力され(501)、パラメタp1、p2及びp3(504)並びに許容及び決定規則を含む。許容及び決定規則は、例えば停止条件といった、所定の特性を持つ変換データを実現するためp1〜p3を変化させる処理を命令するものである。測定データ入力501は、パラメタ504、許容及び決定規則505並びに変換された出力データ507と共にメモリ510に格納される。好ましい実施形態において、ユーザは、変換データ入力509のユーザ解析に基づく入力508を与えることにより、変換データ解析モジュールと対話する。
図6は、図5の装置のように修正された少なくとも1つのデバイス500を組み込む解析システム600を示す。解析システムは、測定収集サブシステム601を用いて、パラメタ、許容規則、決定規則といった測定データを収集し、それを、変換データ入力509を計算するため(本発明により修正された)測定変換サブシステム500により使用される測定データ入力501として提供する。そのシステムは、所定の要求に基づきp1〜p3に対するいずれかの変更を決定する自動化された許容試験部と、変換データ入力509の反復的なユーザ評価に基づきp1〜p3の決定を命令するユーザ制御サブシステムとの少なくとも一方を有することができる。変換データ入力は、ユーザ制御サブシステム604によりユーザ解析入力508として提供されるp1〜p3のユーザ提供値から得られる。
ユーザは、変換データ自身に基づき決定を行うことができるが、変換データが直接解析システム603に渡され、これらの出力を用いて決定が行われることの方が多く起こり得る。初期解析は、単に変換データの分布を計算及び表示するにすぎないであろうが、パターン発見法の適用と、実用又は合理性に関するある基準に基づき、発見されたパターンを検査することとを含む場合の方が多いであろう。
パーシステントメモリ及びデータベース500は、測定変換サブシステム500による測定変換のための入力、出力及び中間結果の短期及び長期記憶を提供する。解析システム600は、本発明の装置及び方法を用いて、利用可能なパラメタ、許容規則、決定規則、元の測定データ及び元の測定データの変換結果の長期履歴を保持し作成するパーシステントメモリ及びデータベース510に接続される測定解析アルゴリズム603を更に含む。
図7は、図6のシステムのための処理フローの好ましい実施形態を、そこに含まれる図5の装置に対するフローと共に示す。ステップ701において、パラメタ、許容及び決定規則に対するユーザ入力が、データベース/メモリ510に入力及び格納される。ステップ702で測定データ値が入力され、測定サブシステム601により収集されたデータベース/メモリ510に格納される。ステップ703において、測定データは本発明を用いて、測定変換サブシステム500により変換される。ステップ704において、完全な手動調整から完全な自動調整にまで変動するユーザ制御サブシステム604は、変換値をチェックし、ステップ705において、パラメタ、許容及び決定規則のいずれかをユーザにより又は自動で命令されるように調整する。ステップ704において、ユーザ制御サブシステム604に基づき変換データが受け入れ可能である場合、ステップ707で変換データが出力され、データベース/メモリ510に格納される。その後、測定解析アルゴリズム603が、上述されたように、データベース/メモリ510から変換データを取得及び解析し、解析結果をデータベース/メモリ510に格納する。
本発明の好ましい実施形態が図示され及び説明されてきたが、当業者であれば、本書に説明されるシステム、装置構造及び方法が説明目的であるに過ぎず、種々の変更及び修正がなされることができる点、及び本発明の真の範囲から逸脱することなく均等物によりその構成要素を置き換えられることができる点は理解されるであろう。更に、その中心範囲から逸脱することなく特定の状況に対する本発明の教示を適合させるべく多くの修正がなされることができる。従って、本発明は、本発明を実行することを想定してのベストモードとして開示される特定の実施形態に限定されるものではなく、本発明は、添付された請求項の範囲に含まれるすべての実施形態を含むものと意図されるものでる。
本発明による変換のガウス部分の幅を変化させつつ、範囲[0,1]にサンプルデータを変換することを示す図である。 図1の変換の中間水平域のみを示す図である。 本発明による組み合わされた変換のシグモイド変換要素のシーリングを変化させることを示す図である。 距離を縮めるよう及び遠くへ離すように勾配のすそを押すことにより、S曲線の勾配を変化させることを示す図である。 本発明による修正された解析装置を示す図である。 本発明による装置を含むニューラルネット解析装置を示す図である。 図6のシステムに対する処理フローの好ましい実施形態を示す図である。

Claims (13)

  1. 所与の分類学習タイプの機械学習による入力のため、測定データを受け入れ可能な範囲に変換する方法において、
    信頼性の低さ及び望ましくなさに対する所定の基準を満たす差分が前記機械学習により使用されないよう、信頼性の低いデータが高い感度を持つ領域における感度を低くして前記受け入れ可能な範囲へ変換する、少なくとも1つの所定のパラメタにより決定される変換を伴うパラメタ付き変換を作成するステップと、
    前記作成された変換を用いて前記測定データのセットを前記受け入れ可能な範囲に変換するステップと、
    前記変換された測定データが所定の基準を満たさないかどうかを検査するステップであって、停止基準が満たされるまで、
    前記作成されたパラメタ付き変換の少なくとも1つのパラメタを調整するサブステップと、
    前記変換ステップ及び前記検査ステップを実行するサブステップとを繰り返し実行する、ステップと、
    前記変換された測定データが所定の基準及び所定の停止条件のグループから選択される1つの条件を満たす場合、前記変換された測定データを出力するステップとを有する、方法。
  2. 前記少なくとも1つの所定のパラメタ付き変換が、
    変換後のx = x
    であるような恒等変換と、パラメタp2及びp3を持ち、
    p2がシグモイドシーリングであり、
    p3はシグモイドストレッチであり、
    変換後のx = p2/(1-exp(-p3*x))
    が成立するようなシグモイド変換とを有するグループから選択される、請求項1に記載の方法。
  3. 前記作成ステップが、前記測定データxのパラメタp1を持つパラメタ付きガウシアン変形を最初に実行するステップを更に有し、
    p1がガウシアン幅パラメタであり、
    x = x - (x*exp(-x*x/p1))
    が成立するような、請求項2に記載の方法。
  4. 前記分類学習タイプがマルチレイヤ・パーセプトロンであり、前記範囲が[0,1]である、請求項3に記載の方法。
  5. 所与の分類学習タイプの機械学習による入力のため、測定データを変換する装置であって、
    前記測定データを解析し、前記解析に基づき、少なくとも1つの所定のパラメタを持つ少なくとも1つのパラメタにより決定される変換を用いて、パラメタ付き変換を作成し、作成された変換で前記測定データを前記分類学習タイプにとって受け入れ可能な範囲に変換する結合変換モジュールと、
    前記所定のパラメタ、変換されることになる前記測定データ、及び結果として生じる変換データ出力を格納する前記結合変換モジュールに接続されるメモリと、
    前記変換されたデータが所定の満足基準を満たすかどうかを決定し、前記所定のパラメタを調整し、停止基準及び前記所定の満足基準を有するグループからの1つの基準が満たされるまで、前記調整されたパラメタで前記測定データを再変換する変換データ処理モジュールとを有し、前記変換データ入力が、出力されるか、又は前記メモリに格納されるかのいずれかとされる、装置。
  6. 前記少なくとも1つの所定のパラメタ付き変換が、
    x = 測定データとするとき、
    変換後のx = x
    が成立するような恒等変換と、パラメタp2及びp3を持ち、
    p2がシグモイドシーリングであり、
    p3はシグモイドストレッチであり、
    変換後のx = p2/(1-exp(-p3*x))
    が成立するようなシグモイド変換とを有するグループから選択される、請求項5に記載の装置。
  7. 前記結合変換モジュールが、前記測定データxのパラメタp1を持つパラメタ付きガウシアン変形を最初に実行するよう更に構成され、
    p1がガウシアン幅パラメタであり、
    x = x - (x*exp(-x*x/p1))
    が成立するような、請求項6に記載の装置。
  8. 前記分類学習タイプがマルチレイヤ・パーセプトロンであり、前記範囲が[0,1]である、請求項7に記載の装置。
  9. 所与の分類学習タイプの機械学習による入力のため、測定データを変換するシステムであって、
    前記測定データの収集及び出力のための測定収集サブシステムと、
    測定変換サブシステムと測定解析アルゴリズムサブシステムとを有する測定解析サブシステムであって、前記測定収集サブシステムによる前記測定データ出力を受信し、前記受信データをデータベース/メモリに格納し、前記測定変換サブシステムを用いて前記受信データを前記機械学習による入力として受け入れ可能な範囲に変換し、前記測定解析アルゴリズムサブシステムを用いて前記測定データを解析し、並びに前記変換されたデータ及び該データの解析を前記データベース/メモリに格納するよう構成される測定解析サブシステムとを有する、システム。
  10. 前記測定変換サブシステムが、更に、少なくとも1つの設定可能なパラメタを持つ少なくとも1つの結合パラメタ付き変換を使用するよう構成され、並びに、前記変換測定データの品質を決定するのに、及び前記少なくとも1つの設定可能なパラメタに対する所定の値を与えることにより、前記測定を変換/再変換するよう前記測定変換サブシステムに命令するのに、ユーザが前記測定解析アルゴリズムサブシステムを使用するためのユーザ制御サブシステムを含むよう構成される、請求項9に記載のシステム。
  11. 前記少なくとも1つの結合パラメタ付き変換が、
    x = 測定データとするとき、
    変換後のx = x
    が成立するような恒等変換と、パラメタp2及びp3を持ち、
    p2がシグモイドシーリングであり、
    p3はシグモイドストレッチであり、
    変換後のx = p2/(1-exp(-p3*x))
    が成立するようなシグモイド変換とを有するグループから選択される、請求項10に記載のシステム。
  12. 前記少なくとも1つの結合パラメタ付き変換が、前記測定データxのパラメタp1を持つパラメタ付きガウシアン変形を最初に含み、
    p1がガウシアン幅パラメタであり、
    x = x - (x*exp(-x*x/p1))
    が成立するような、請求項11に記載のシステム。
  13. 前記分類学習タイプがマルチレイヤ・パーセプトロンであり、前記範囲が[0,1]である、請求項12に記載のシステム。
JP2008516491A 2005-06-16 2006-06-14 分類学習のための測定データの変換 Pending JP2008546996A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US69113105P 2005-06-16 2005-06-16
PCT/IB2006/051915 WO2006134570A2 (en) 2005-06-16 2006-06-14 Transforming measurement data for classification learning

Publications (1)

Publication Number Publication Date
JP2008546996A true JP2008546996A (ja) 2008-12-25

Family

ID=37532690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008516491A Pending JP2008546996A (ja) 2005-06-16 2006-06-14 分類学習のための測定データの変換

Country Status (5)

Country Link
US (1) US20090316982A1 (ja)
EP (1) EP1917630A2 (ja)
JP (1) JP2008546996A (ja)
CN (1) CN101278305A (ja)
WO (1) WO2006134570A2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8811748B2 (en) * 2011-05-20 2014-08-19 Autodesk, Inc. Collaborative feature extraction system for three dimensional datasets

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232244A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd ニューラルネットワーク、その学習方法およびニューロ・ファジィ制御装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3645023B2 (ja) * 1996-01-09 2005-05-11 富士写真フイルム株式会社 試料分析方法、検量線の作成方法及びそれを用いる分析装置
DE10201804C1 (de) * 2002-01-18 2003-10-09 Perceptron Gmbh Verfahren und System zum Vergleichen von Messdaten
US7373403B2 (en) * 2002-08-22 2008-05-13 Agilent Technologies, Inc. Method and apparatus for displaying measurement data from heterogeneous measurement sources
WO2007129233A2 (en) * 2006-05-10 2007-11-15 Koninklijke Philips Electronics N.V. Transforming measurement data for classification learning

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232244A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd ニューラルネットワーク、その学習方法およびニューロ・ファジィ制御装置

Also Published As

Publication number Publication date
EP1917630A2 (en) 2008-05-07
CN101278305A (zh) 2008-10-01
US20090316982A1 (en) 2009-12-24
WO2006134570A3 (en) 2008-06-19
WO2006134570A2 (en) 2006-12-21

Similar Documents

Publication Publication Date Title
US8492156B2 (en) Methods of chromogen separation-based image analysis
US9128055B2 (en) Information processing apparatus, information processing method, program, and method of correcting intensity of fluorescence spectrum
CN107004123A (zh) 迭代式缺陷滤除工艺
JP2015087903A (ja) 情報処理装置及び情報処理方法
CN108510004B (zh) 一种基于深度残差网络的细胞分类方法及系统
WO2021153633A1 (ja) 金属組織の相の分類方法、金属組織の相の分類装置、金属組織の相の学習方法、金属組織の相の学習装置、金属材料の材料特性予測方法および金属材料の材料特性予測装置
JP2006266872A (ja) 外観検査方法及びその装置
US20210286972A1 (en) Determination method, elimination method and apparatus for electron microscope aberration
Liland et al. Customized baseline correction
CN104483292B (zh) 一种采用多谱线比值法提高激光探针分析精确度的方法
CN112184667A (zh) 缺陷检测、修复方法、装置以及存储介质
JP2008546996A (ja) 分類学習のための測定データの変換
CN110785709A (zh) 从低分辨率图像产生高分辨率图像以用于半导体应用
CN117216558A (zh) 一种煤质分析模型训练方法、装置、电子设备和存储介质
CN114830242A (zh) 用于基于分析数据进行表征的机器视觉
JP2009536386A (ja) 分類学習のための測定データの変換
WO2019166196A1 (en) Method and device for testing a marine transmission
US7020309B2 (en) Method of recognizing fingerprints by coloring and computer system for implementing the said method
Dawid et al. Smart products: liability, timing of market introduction, and investments in product safety
Jung et al. Estimation of Average Grain Size from Microstructure Image Using a Convolutional Neural Network. Materials 2022, 15, 6954
Badain et al. AMEBaS: Automatic Midline Extraction and Background Subtraction of Ratiometric Fluorescence Time-Lapses of Polarized Single Cells
CN117853817B (zh) 一种基于图像识别的智慧社区垃圾分类报警管理方法
EP4227865A1 (en) Output control program, output control method, and information processing device
JP6960356B2 (ja) 教師データ作成支援方法および教師データ作成支援装置
Yu The Implementation of Support Vector Machine into Pairs Trading Strategy

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120223

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120814