JP4414419B2 - 可変クラスタ終点を用いるクラスタ分析によるct測定 - Google Patents

可変クラスタ終点を用いるクラスタ分析によるct測定 Download PDF

Info

Publication number
JP4414419B2
JP4414419B2 JP2006262485A JP2006262485A JP4414419B2 JP 4414419 B2 JP4414419 B2 JP 4414419B2 JP 2006262485 A JP2006262485 A JP 2006262485A JP 2006262485 A JP2006262485 A JP 2006262485A JP 4414419 B2 JP4414419 B2 JP 4414419B2
Authority
JP
Japan
Prior art keywords
data
data set
cluster
value
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006262485A
Other languages
English (en)
Other versions
JP2007095070A (ja
Inventor
クルニク ロナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/241,772 external-priority patent/US7991558B2/en
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2007095070A publication Critical patent/JP2007095070A/ja
Application granted granted Critical
Publication of JP4414419B2 publication Critical patent/JP4414419B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

本発明は、大別して、S字型曲線または成長曲線を表すデータを処理するためのシステム及び方法に関し、より詳細には、リアルタイムPCR増幅曲線における特徴的なサイクル値(Ct)またはエルボー値を決定するためのシステム及び方法に関する。
ポリメラーゼ連鎖反応(PCR)は、特定の核酸配列を酵素により合成または増幅するためのインビトロ法(体外的方法)である。この反応は、通常、相対するストランドに交雑しかつ増幅対象の鋳型または標的DNA配列と側面を接する二つのオリゴヌクレオチドプライマーを使用する。プライマーの伸長は耐熱性DNAポリメラーゼの触媒作用によってなされる。鋳型変性、プライマーアニーリング及びアニーリングされたプライマーのポリメラーゼによる延長を含む一連の反復的サイクルの結果として、特定のDNA断片を指数的に蓄積させる。リアルタイムPCRまたは動的PCRでは、一般に、増幅プロセスの検出及び定量化を容易にするために、蛍光プローブまたはマーカー(標識)が使用される。
典型的な動的PCR曲線が図1に示されており、この図において蛍光強度値が典型的なPCR法についてのサイクル数(サイクル番号)に対してプロットされている。この場合、PCR生成物の形成はPCR法の各サイクルにおいて監視される。増幅は、通常、増幅反応中に蛍光信号を測定するためのコンポーネント及び装置を含むサーモサイクラにおいて測定される。この種のサーモサイクラの一例はRoche Diagnostics LightCycler(Cat.No.20110468)である。増幅生成物は、例えば、標的核酸配列に結合されその後DNAポリメラーゼの5’から3’のヌクレアーゼ活性により劣化した後は蛍光信号しか発しない蛍光消光標識交雑プローブによって検出される。他の例としては、核酸増幅中に生成される蛍光信号があり、この場合、蛍光染料は二本鎖DNAに結合して、その蛍光量子収率を増加させる。
典型的な動的PCR成長曲線の場合、一般にエルボー値またはサイクル値(Ct)と呼称される遷移点を特定することは、PCR増幅プロセスの特徴を理解する上で非常に有益である。Ct値は、PCR法の効率の尺度として使用することができる。例えば、ある特定の信号閾値が分析対象の全ての反応について定められる。次に、その信号閾値に達するために必要とされるサイクル数(Ct)が、標的核酸について、並びに、標準またはハウスキーピング遺伝子のような基準核酸について定められる。標的分子の絶対的または相対的な複製数は、標的核酸及び基準核酸について得られるCt値に基づいて定められ得る(Gibsonら、Genome Research 6:995-1001;Biecheら、Cancer Research 59:2759-2765,1999;WO97/46707;WO97/46712;WO97/46714)。図1では、符号20によってほぼ35のエルボー値が示されている。
動的PCR曲線におけるより正確なエルボー値は、いくつかの既存の方法を用いて定めることができる。例えば、様々な方法が、蛍光がAFL(任意蛍光値)と呼称される予め定められた信号レベルに達する値としてエルボーの実効値(Ct)を決定する。他の方法は、蛍光対サイクル番号の二次導関数が最大値に達するサイクル番号(サイクル数)を使用する。これらの方法は全て欠点を有する。例えば、微分法は異常値データ(ノイズデータ)に対して敏感であり、AFL法はプレエルボーPCRサイクルにおける平均ベースライン蛍光レベルの変化に対して敏感である。データの標準化も問題を追加する。さらに、これらのアルゴリズムは、一般に、最適化することが多くの場合困難である多数のパラメータを有する。その結果、感度と偽陽性の間の二律背反となり、これらのアルゴリズムの効果を減じざせることになる。
したがって、これら及びその他の欠点を克服する、S字型曲線及び特に動的PCR曲線におけるエルボー値を決定するための新規のシステム及び方法を提供することが望まれる。
本発明は、S字型曲線または成長曲線におけるエルボー値など特徴的遷移値を決定するための新規の効率的な方法を提供する。一つの実施形態において、本発明の方法は、特に動的PCR増幅曲線におけるサイクル値(Ct)を決定するために有益である。
本発明の一つの態様によれば、曲線のある領域における特定の関心点を決定するためのコンピュータで実行される方法であって、
−曲線を表すデータセットを受け取るステップであって、データセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、二次座標系において見るとこのデータセットが関心領域を含む、ステップと、
−少なくとも関心領域を含むデータセットの部分に変換を加えて、変換データセットを生成するステップであって、変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点のy’座標値が対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値が後続の第一のデータ点のy座標値である、ステップと
−変換データセットにおいて第二のデータ点の複数のクラスタを特定するステップと、
−クラスタの各々の線形勾配を決定するステップと、
−各クラスタについてこのクラスタの勾配と隣接するクラスタの勾配との比率を決定するステップと、
−比率を比較するステップと、
を含み、最大または最小比率を有するクラスタの終点がデータ曲線の特定の関心点を表すようになっている方法が提供される。
本発明の他の態様によれば、動的PCR増幅曲線におけるサイクル値(Ct)を決定するためにプロセッサを制御するためのコードを含むコンピュータ読み取り可能な媒体が提供される。このコードは、
−データ曲線を表すデータセットを受け取るための命令であって、データセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、二次座標系で見るとデータセットが関心領域を有する、命令と、
−少なくとも関心領域を含むデータセットの部分に変換を加えて、変換データセットを生成するための命令であって、変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点のy’座標値が対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値が後続の第一のデータ点のy座標値である、命令と
−変換データセットにおいて第二のデータ点の複数のクラスタを特定するための命令と、
−各クラスタの線形勾配を決定するための命令と、
−各クラスタについてこのクラスタの勾配と隣接するクラスタの勾配の比率を決定するための命令と、
−比率を比較するための命令と、
を含み、最大または最小比率を有するクラスタの終点はデータ曲線における特定の関心点を表している。
本発明のさらに別の態様によれば、動的PCRシステムが提供される。このシステムは、
−動的PCR増幅曲線を表すPCRデータセットを生成するPCR分析モジュールであって、データセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、データセットがサイクル値(Ct)を含む関心領域においてデータ点を含む、PCR分析モジュールと、
−PCRデータセットを処理してCt値を決定するように構成されているインテリジェントモジュールであって、
少なくとも関心領域を含むPCRデータセットの部分に変換を加えて、変換データセットを生成するステップであって、変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点のy’座標値が対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値が後続の第一のデータ点のy座標値であるステップと、
変換データセットにおいて第二のデータ点の複数のクラスタを特定するステップと、
各クラスタの線形勾配を決定するステップと、
各クラスタについてこのクラスタの勾配と隣接するクラスタの勾配の比率を決定するステップと、
比率を比較するステップと、
によってCt値を決定する、インテリジェントモジュールと、
を含み、最大または最小比率を有するクラスタの終点はPCR増幅曲線におけるCt値を表す。
図面及び特許請求の範囲を含めて明細書の残りの部分を参照することによって、本発明の他の特徴及び利点が判るであろう。本発明のさらなる特徴及び利点並びに本発明の様々な実施形態の構造及び作用については、添付図面を参照しながら以下に詳しく説明する。図面において、同様の参照番号は同じまたは機能的に類似する要素を指す。
本発明は、ベースライン領域の終端または動的PCR増幅曲線のエルボー値またはCt値のようなS字型曲線または成長曲線における遷移値を決定するためのシステム及び方法を提供する。本発明のシステム及び方法は、データ信号がノイズ信号であるか否かについての表示も提供する。一部の態様においては、信号における複数のデータクラスタを特定するためにクラスタ分析アルゴリズムがデータ信号に適用される。クラスタのうち一つの終点はCt値を表す。すなわち、このシステム及び方法は、その終点がCt値を表す特定のクラスタを特定するためのロバスト技法(エラーに強い技法)を提供する。Ct値は返されて、表示されるか、さもなくば、その後の処理のために使用され得る。ある態様においては、リーベンベルグ−マルクワルト(LM)回帰法によって決定されるパラメータを持つ二重シグモイド関数が曲線の近似を見つけるために使用される。ある態様においては、曲線近似及びパラメータは、データ信号の前処理のため、例えばデータ信号を標準化しかつ/またはデータ信号に存在する可能性のあるスパイク部すなわち異常データ点を除去するために使用される。
本発明に従った動的PCR増幅曲線データセットにおいてエルボーまたはCt値を決定するための特定の方法において、PCRデータセットは蛍光強度(y軸)対サイクル数(x軸)の二次元プロットにおいて視覚化することができる。データセットは、第一のカラムがサイクルnの蛍光すなわちy(n)を含みかつ第二のカラムがサイクル(n+i)の蛍光すなわちy(n+i)を含む、データ点のパーティションテーブルを生成するように変換される。ここで、iは典型的には1またはこれより大きい数である。クラスタ分析プロセス(クラスタ分析処理)は、パーティションテーブルデータセットにおいて複数のクラスタを決定するために、パーティションテーブルデータセットに適用される。クラスタ分析は、異なる対象、例えばデータ点またはベクトルを、二つの対象が同じグループに属する場合には二つの対象間の関連度が極大になりそうでなければ極小になるように、グループに仕分けるための分析ツールである。一つの態様において、使用されるクラスタ化プロセス(クラスタ化処理)は、k平均クラスタ化アルゴリズムを含む。ここで、特定されるクラスタの数kは3以上の整数である。他の態様においては、3個またはそれ以上のクラスタを特定するためにメドイド周辺分割(PAM:Partitioning Around Medoids)アルゴリズムが使用される。特定されたクラスタを用いて、各クラスタの線形勾配が決定される。例えば、あるクラスタの勾配は、そのクラスタの各点についてのy(n+1)対nに基づいて決定される。各クラスタについて、そのクラスタの勾配と隣接するクラスタの勾配の比率が決定される。次に、比率が比較される。最大または最小比率を有するクラスタの終点がデータ曲線の特定の関心点を表す。PCR曲線のエルボーまたはCt値を表すデータ点は特定されたクラスタのうちの一つの終点として特定され、このデータ点に対応するサイクル数が返されるか、表示される。
動的PCR法における増幅曲線10の一例が図1に示されている。示されているように、曲線10は、誘導期領域15と,対数期領域25とを含む。このような曲線は、誘導期と対数期を結びつける関心遷移領域20を含む。関心遷移領域20は、一般に、エルボーまたはエルボー領域と呼称される。エルボー領域20は、典型的には、基礎となるプロセスの成長または増幅速度の過渡期を形成し、エルボー領域20における特定の遷移点の特定は、基礎となるプロセスの挙動を分析するために有益である。典型的なPCR曲線において、エルボー値またはサイクル値(Ct)と呼称される遷移点を特定することは、PCR法の効率特性を理解するうえで非常に有益である。同様のS字型曲線または成長曲線を示すその他のプロセスとしては、細菌増幅プロセス(細菌増幅処理)、酵素増幅プロセス(酵素増幅処理)及び結合プロセス(結合処理)がある。例えば細菌増幅曲線においては、関心遷移点は誘導期における時間λとして言及されてきた。したがって、本明細書の残りにおいてPCR曲線への適用に関して本発明を説明するが、本発明は他のプロセスに関するデータ曲線に適用できることが判るであろう。
本発明に従って分析され得るデータ曲線を生じるその他の特定のプロセスには、ストランド変位増幅(SDA)プロセス(ストランド変位増幅処理)、核酸配列ベース増幅(NASBA)プロセス(核酸配列ベース増幅処理)及び転写媒介増幅(TMA)プロセス(転写媒介増幅処理)が含まれる。SDA及びNASBAプロセス及びデータ曲線の例は、それぞれWang,Sha-Shaらの「BD ProbeTec ETシステムにおけるストランド変位増殖による単一ヌクレオチド多形現象の均質リアルタイム検出」、Clin Chem 2003 49(10):1599、及びWeusten,Jos J.A.Mらの「分子ビーコンを用いる均質検出と組み合わせた核酸配列ベース増幅を用いるウィルス負荷の計量の原理」、Nucleic Acids Research,2002 30(6):26において見ることができる。
図1に示されているように、典型的なPCR成長曲線のデータは、例えばPCRサイクル数をx軸とし、累積ポリヌクレオチド増幅の指数をy軸とする二次元座標系に表すことができる。典型的には、図1に示されているように、蛍光マーカーが最も広範に使用される標識方式なので、累積増幅の指標は蛍光強度である。ただし、使用される特定の標識及び/または検出方式に応じて他の指標を使用することができることが判るはずである。累積信号増幅の他の有益な指標の例としては、発光強度、化学発光強度、生体発光強度、燐光強度、電荷移動、電圧、電流、電力、エネルギー、温度、粘度、光拡散、放射能強度、反射率、透過度及び吸収度がある。サイクルの定義は、時間、処理周期、単位操作周期及び生殖周期も含むことができる。
クラスタ分析プロセス及び変形
本発明によれば、動的PCR増幅曲線のエルボー値またはCt値のようなS字型曲線における遷移値を決定するためのプロセスの一つの実施形態は、簡単に以下のように記載することができる。典型的には、PCRデータは図1に示されているようにプロットされ、蛍光がサイクル数との対比でプロットされる。この表示は重要な情報を与えるが、連続的な点が相互にどの程度近いかについての情報を与えない。その代わりに、サイクル(n+1)における蛍光がサイクル(n)における蛍光に対比してプロットされれば、図2に示されているグラフが得られる。データがこのようにプロットされると、データのクラスタがあることが明白となる。3個のクラスタが異なる標識を付された領域によって示されている。すなわち、低蛍光値の領域35はベースライン領域を表し、高蛍光値の領域45はプラトー領域を表し、領域40は対数領域を表している。明らかなように、データで表される様々な領域のさらに正確な区分(カットオフ)を示すために、付加的なクラスタによってデータを表すこともできる。これらのクラスタはPCR増幅曲線のCt値を特定するために有利に使用することができる。ある態様においては、5個のクラスタが定められる。
動的PCR曲線におけるエルボー値を決定するためのプロセス100の一つの実施形態が図3に示されている。ステップ110において、データセットが取得される。本発明の例示の実施形態では、この方法は、キーボード、マウスなどのようなデータセットを入力するための入力装置、モニタのような曲線のある領域における特定の関心点を表すためのディスプレイ装置、CPUのようなこの方法の各ステップを実行するために必要な処理装置、モデムのようなネットワークインテーフェイス、データセットを記憶するためのデータ記憶装置、プロセッサ上で実行されるコンピュータコードなどを含む(しかしながら、これに限定されるものではない)従来のパソコンシステムを用いて実行することができる。さらに、この方法はPCR装置において実行することもできる。プロセス100がサーモサイクラのようなPCRデータ取得装置に内蔵されるインテリジェントモジュール(例えば,命令を実行するプロセッサ)において実行される場合、データが収集されると、データセットがリアルタイムでインテリジェントモジュールに提供されてもよく、メモリユニットまたはバッファにこれを記憶して、実験が完了した後にこれをインテリジェントモジュールに提供してもよい。同様に、データセットは、ネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)通じてまたは取得装置への直接接続(例えば、UBSまたはその他の直接配線または無線接続)を通じてデスクトップコンピュータのような別個のシステムに提供されてもよく、また、CD、DVD、フロッピー(登録商標)ディスクのような携帯可能な媒体で提供されてもよい。インテリジェントモジュールは、動的PCR分析モジュールに接続されたまたはこれと別個のコンピュータシステムのプロセッサを含むこともできるし、あるいは動的PCR分析モジュールに直接結合されるプロセッサを含むことができる。例えば、両方のコンポーネントが動的PCRサーモサイクラを構成してもよい。ある態様においては、データセットはサイクル数及び蛍光強度値を表す1対の座標値(または二次元ベクトル)を有するデータ点を含む。
データセットがステップ110において受け取られるか取得された後、クラスタ分析を用いてデータセットが分析され得る。データセットにおいて取得されたデータ点の数に応じて、プロセス100によって決定されるCt値の解像度を改良するためにデータ点の数を増大することが望ましいであろう。したがって、一つの実施形態では、ステップ120において、既存のデータ点の間で補間を行うことによって追加のデータ点が定められる。ステップ120では、線形補間関数、三次スプライン関数または最小二乗適合関数のような関数がデータ点に適している。これは、ソフトウェアアプリケーションMathematica(登録商標)またはその他のアプリケーションを用いて行うことができる。例えば、一つの態様では、データ点は、例えば線形補間関数を用いてまたは三次スプライン関数または最小二乗適合関数を用いて、1.0またはこれより小さいサイクル数間隔、例えば0.05または0.01サイクル数間隔で、既存のデータ点の間で補間される。一つの態様では、データ値を補間するためにリーベンベルグ−マルクワルト回帰法が使用される。より詳細には、リーベンベルグ−マルクワルト回帰法によって決定されるパラメータを持つ二重シグモイド関数のような適合関数は、データ曲線の近似を見つけるために使用される。曲線の近似が決定されたら、所望の補間間隔でデータ値を補間することができる。リーベンベルグ−マルクワルト回帰法を用いて曲線近似及び適合パラメータを決定するための有益なシステム及び方法は当該技術分野において公知である。
ステップ120では、補間データ点も実データ点とともに記憶されて、サイクル数及び蛍光強度を表すより大きなデータ点のテーブルまたはマトリクスを形成する。図4は増幅曲線のデータセットの一例を示し、図5は0.1の増分でデータが補間された図4のデータセットの例を示している。このデータセット(または、補間が行われない当初に取得されたデータセット)、またはその一部は、次に、ステップ130において、座標(y’、y*)を有するデータ点の組を生成するように処理される。ここで、y’座標値はテーブルにおいて対応するデータ点のy座標値であり、y*座標値はテーブルの次のデータ点のy座標値である。例えばMathematica(登録商標)では、これはパーティションテーブルを生成するためのパーティション関数を用いて行うことができる。一つの態様では、次の点は、サイクル(n+1)における蛍光及びサイクル(n)における蛍光を表すベクトル値を有するパーティションテーブルが生成されるように、連続する一連のデータ点のすぐ次のデータ点となっている。図4及び図5は、それぞれ、非補間データセット及び補間データセットと、各ベクトルが[y(n),y(n+1)]を表すように変換されたこれらのデータセットの対応するパーティションテーブルの例を示しており、yはサイクル数である。別の態様では、ベクトル値[y(n),y(n+i)](ここで、i≧2)を持つパーティションテーブルが生成されるように、後続のデータ点は対応するデータ点のすぐ次ではないデータ点を含む。一般的に言うと、ステップ130においては、ベクトル値[y(n),y(n+i)](ここで、i≧1)を持つパーティションテーブルが生成される。
図3に戻ると、ステップ140では、パーティションテーブルデータセットにおいて複数のクラスタを特定するためにクラスタ分析アルゴリズムがパーティションテーブルに適用される。ある態様においては、3個またはそれ以上のデータのクラスタを特定するために、クラスタ化アルゴリズムがパーティションテーブルに適用される。例えば、一つの態様では、k平均クラスタ化アルゴリズムがパーティションテーブルに適用される。ここで、kは3かそれ以上である。他の態様では、3個またはそれ以上のクラスタを特定または決定するために、PAMアルゴリズムがパーティションテーブルに適用される。ステップ150において、増幅曲線のCt値が特定される。一つの態様において、Ct値はステップ140において特定されたクラスタにおける始点または終点として特定される。一つの態様においては、PCR増幅データの場合、パーティションテーブルデータセットにおいて5個のデータクラスタ(例えば、k=5)を決定すると有利である。この場合、Ct値は最初のクラスタ(例えば最も小さい蛍光値を有するクラスタ)の最終データ点によって特定される。一つの態様において、ステップ120からの補間データが使用される場合、Ct値は最初のクラスタの最終値を(1/増分値)で割って0.9を足すことによって特定される。例えば、最初のクラスタの最終値の指数が352に等しく、補間増分0.1サイクルが使用されると、Ct値は(352/(1/0.1))+0.9=352/10+0.9=35.2+0.9=36.1と演算される。この演算は0.9以外の数を加算(または減算)するように変えることができることが判るはずである。ステップ160において、Ct値は例えばモニタ、プリントアウト、LCD画面などに表示されるか、またはその他の方法でシステムのオペレータへ与えられる。Ct値は、終点以外のクラスタの点、例えば終点の次の点(終点−1)、終点から2つ目の点(終点−2)などを用いて得ることができることが判るはずである。付加データ点を得るために補間(ステップ120)が使用されるとき、補間増分が充分に小さければ、終点−1、−2などを使用して、「充分に正確な」Ct値を得ることができる。例えば、0.01の増分で補間し、終点−1を使用したとすると、Ctは0.01だけ「はずれる」ことになり、これはほとんど問題にならない。
図6及び図7は、図1のデータセットに適用されたプロセス100の例を示している。図6は、0.1の増分の線形補間を含む図1のデータを示しており、サイクル数(サイクル番号)は10倍になっている。図7は、x値がサイクル(n)のときの蛍光を表し且つy値がサイクル(n+1)のときの蛍光を表すようにプロットされた図6の補間データの蛍光値を示している。5個のクラスタが異なる色で示されている。このデータのCt値は、プロセス100を用いてCt=35.9と求められた。
Ct決定プロセス100またはその一部は、コンピュータシステムのプロセッサ上で実行されるコンピュータコードにおいて実行されることが判るはずである。コードは決定プロセス100の様々な態様及びステップを実施するようにプロセッサを制御するための命令を含む。コードは、典型的には、ハードディスク、RAMまたはCD、DVDなどのような携帯可能な媒体に記憶される。同様に、プロセス100またはその一部は、プロセッサに結合される記憶ユニットに記憶される命令を実行するプロセッサを含むサーモサイクラのようなPCR装置において実行されてもよい。このような命令を含むコードは、ネットワーク接続を通じてまたはコードソースへの直接接続によりまたは周知の携帯可能な媒体を用いてPCR装置記憶ユニットにダウンロードすることができる。
蛍光値のベクトルydに対してプロセス100の演算を実行するように構成されたMathematica(登録商標)コードの一例を以下に示す。
ClustMod[yd_] : = Module[{ },
IntF = Interpolation[yd, InterpolationOrder → 1];
IntTable = Table[IntF[x], {x, 1, Length[yd], 0.1}];
ParYd = Partition[IntTable, 2, 1];
fc = FindClusters[ParYd -> Range[Length[ParYd]], 5];
N[Last[fc[[1]]] / 10] + 0.9]
k平均クラスタ化アルゴリズムに加えて、他のクラスタ化アルゴリズムを使用できることが当業者には判るであろう。一般的に、クラスタ分析は、多様なアルゴリズムタイプを含み、その各々が、二つの対象が同じグループに属する場合には、二つの対象の間の関連度が極大になりそうでなければ極小になるように様々な対象、例えばデータ点またはベクトルを、グループに仕分けすることを目標とする。クラスタ化アルゴリズムは、距離測定(例えばユークリッド距離)のような定義された類似性規則に従って対象を各クラスタに入れる。得られるクラスタグループの数が演繹的に決定されるk平均クラスタ化は、公知のクラスタ化アルゴリズムのうちの一つに過ぎない。PAMとして知られる別のタイプのクラスタ化アルゴリズムは、残りのデータのクラスタ化の中心となるデータ点(medoids)を探す。ユーザーはクラスタの数を指定するか、あるいはいくつのクラスタがあるのかアルゴリズムに決定させることができる。さらに別のタイプのクラスタ化アルゴリズムである集塊的階層クラスタ化(AHC)は、自身のクラスタにおけるセットの各要素から初めて、k個が残るまで最も近いクラスタを融合する集塊的階層法を用いる。その他のクラスタ化アルゴリズムのタイプには、結合またはツリークラスタ化アルゴリズム及び期待値最大化クラスタ化アルゴリズムが含まれる。当業者には理解できるであろうこれらの及びその他のクラスタ化アルゴリズムに関してさらに詳しくは、「クラスタ分析、第四版」Brain S.Everitt、Sabine Landau及びMorven Leese著、Arnold Publishers,London,2001に示されている。
本明細書において開示されるクラスタ分析プロセスは、特に、分析物がベースラインより著しく蛍光信号を増大させるPCR成長曲線を分析するために有益である。これは一般的なケースであるが、信号の増大が極小である場合、例えば分析物が緩慢増幅のものであるすなわち強度信号がベースライン値より実質的に増大しない場合があるかも知れない。このような状況においては、第一のクラスタの終点以外のサイクル数でCt値を決定することが望ましいかもしれない。一つの実施形態によれば、決定されたクラスタ例えば5個のクラスタが決定される場合、クラスタ1−5の各々におけるデータ点の線形勾配が演算される。例えば、クラスタの勾配は、そのクラスタの各点について、y(n+1)対nに基づいて決定される。したがって、隣接し合う勾配の比率、例えば勾配2/勾配1、勾配3/勾配2、勾配4/勾配3、勾配5/勾配4が演算される。次に、比率が比較され、最大の比率により、どのクラスタの終点が使用されるかが決定される。例えば、勾配2/勾配1が最大比率である場合にはクラスタ1の終点が使用され、勾配3/勾配2が最大である場合にはクラスタ2の終点が使用される。あるいはまた、比率を下記の通りに決定することができる。勾配1/勾配2、勾配2/勾配3、勾配3/勾配4及び勾配4/勾配5。この場合、最も小さい比率がどれかにより、どのクラスタの終点が使用されるかが決定される。例えば、勾配1/勾配2が最も小さい場合、クラスタ1の終点が使用され、勾配2/勾配3が最も小さい場合にはクラスタ2の終点が使用される。
さらに、本発明のクラスタ分析法を用いて決定された情報を用いて、二つの診断値を演算すると有利である。これらの値は、相対的蛍光増加(RFI)及び絶対的蛍光増加(AFI)である。一つの実施形態によれば、RFI及びAFI値は、最初及び最後のクラスタ、例えば5個のクラスタが決定される場合にはクラスタ1及びクラスタ5、におけるデータの平均蛍光値を演算することによって決定される。RFI及びAFIは下記のように演算される。
RFI=(クラスタ5平均蛍光値)/(クラスタ1平均蛍光値)
AFI=(クラスタ5平均蛍光値)−(クラスタ1平均蛍光値)
検定(アッセイ)開発者は、一般に、データセットの合否を決定するためにRFI及びAFIの特定の最小カットオフ値を使用する。
一つの実施形態によれば、ステップ110において取得されたデータセット(例えばPCRデータセット)が多くのノイズを含むかあるいはある傾向を示すかを決定するためのプロセスが提供される。まず、ステップ1において、本データセット(例えば補間データを含まないもの)がパーティションテーブルに分配され、図3のステップ130と同様に、第一のカラムがサイクル(n)のときの蛍光を含み、第二のカラムがサイクル(n+1)のときの蛍光を含むようにされる。次に、ステップ2において、k平均クラスタ化アルゴリズムのようなクラスタ分析アルゴリズムを用いて、3個またはそれ以上のクラスタがこの分配されたデータセットについて決定される。この分析の結果は本データの指標である。その後、ステップ3において、決定されたクラスタ結果が増加指標順に仕分けられ、ステップ2及び3の結果が同一であるか否かが決定される。同一であれば、これはデータにはっきりとした傾向があることを示す。結果が等しくなければ、データは実質的に純粋のノイズであり、データが実質的にノイズデータであることを示すために所定の値、例えば−1がCt値として返される。データが一つの傾向を示す場合、上述の通りCt値を決定するためにデータの分析が継続される。そうでなければ分析は停止されて、−1のCt値が与えられる。
傾向データ対ノイズデータを決定するためのコードの一例は、下記のMathematica(登録商標)コードに示される。
ClustModSM[yd_] : = Module[{ },
ParYd = Partition[yd, 2, 1];
Fc = FindClusters[ParYd -> Range[Length[ParYd]], 3];
Last[fc[[1]]]
ClustModT[yd_] : = Module[{ },
ClustModSM[yd];
fcSM = Flatten[fc];
fcSMSort = Sort[fcSM];
If[fcSM == fcSMSort, ClustMod[yd], -1]]
ある態様においては、データセットが実質的にノイズであり有効な信号ではないか否かを特定することが望ましい。一つの実施形態によれば、ノイズの存在を決定するためにいくつかのチェックを使用することができる。
一つの態様によれば、ノイズの存在を決定するために使用される一つのチェックは、サイクル数間に蛍光信号を補間することなく3個(またはそれ以上)のクラスタを決定するステップを含む。これらのクラスタの各々に対して線形回帰が行われ、蛍光信号対サイクル数の相関係数(R2)が各々のケースについて演算される。各R2の相関係数が0.1より小さい場合には、エラーメッセージが生成される。
別のノイズ決定プロセスによれば、各クラスタの最終終点に対応するサイクル数が決定される。その後、pt1<pt2<pt3<pt4<pt5<(ここで、pt1は第一のクラスタの終点であり、pt2は第二のクラスタの終点であり、以下同様である)であるか否かがチェックされる。これに当てはまらない場合、エラーメッセージが生成される。
別のテストによれば、蛍光信号対サイクル数のデータ点の全てが線形であるか否かを決定するためにチェックが行われる。したがって、一つの態様によれば、相関係数(R2)が全てのデータ点を用いて演算される。値R2>0.99である場合、データは線形であると決定され、適切なエラーメッセージが生成される。
本発明のクラスタ分析方法は、正常データも「問題」データも含めて多様なデータセットについてテストされ、非常にロバストであること(エラーに強いこと)が判明した。さらに、緩慢増幅のものが簡単に特定される。要するに、本発明のクラスタ分析の利点は下記のことを含む。
(1)このアプローチにはパラメータは必要とされず、そのまま機能する。
(2)データセットのドリフトに敏感でない。勾配ベースラインが影響を及ぼさない。
(3)ノイズ、ベースライン傾斜及びスパイクが結果に影響を及ぼさない。
(4)システムが簡単に緩慢増幅か多ノイズデータかを特定できる。
(5)高いベースラインが結果に影響を及ぼさない。
(6)データの標準化が必要とされない。
本発明は、導関数を得る必要を排除する点で有利である。このことは、エルボー値を決定する際にしばしば使用される一次導関数及び特に二次導関数が多ノイズデータに対して非常に敏感なので、利点となる。
したがって、本発明は、先行のアルゴリズムに見られた問題、例えば(1)多ノイズのスパイクデータ、(2)可変的なベースライン、(3)高いベースライン、(4)微分法の感度、及び(5)多数のパラメータの必要性を排除する点で有利である。
本発明の態様(例えば、クラスタ決定、勾配決定、RFI及びAFI決定など)を実施するMathematica(登録商標)コンピュータプログラムの例を以下に示す。

ClustMod2[yd_] : = Module[{ },

Res = 0;
ParYd = Partition[yd, 2, 1];
fc = FindClusters[ParYd -> Range[Length[ParYd]], 3];

If[Length[fc[1]]] > 2,
{regress1 = Regress[yd[[fc[[1]]]], {1,x}, x];
Rsq1 = RSquared /. regress1;},
res = -3];
If[Length[fc[[2]]] > 2,
{regress2 = Regress[yd[[fc[[2]]]], {1,x}, x];
Rsq2 = RSquared /. regress2;},
res = -3];
If[Length[fc[[3]]] > 2,
{regress3 = Regress[yd[[fc[[3]]]], {1,x}, x];
Rsq3 = RSquared /. regress3;},
res = -3];

If[Rsq1 < 0.1 && Rsq2 < 0.1 && Rsq3 < 0.1, Noise = 1, Noise = 0];
If[Noise == 1, res = -3];

data = Table[{i, yd[[i]]}, {i, 6, Length[yd]}];
regress = Regress[data, {1,x}, x];
Rsq = RSquared /. regress;
If[Rsq ≧ 0.99, res = "L"];

IntF = Interpolation[yd, InterpolationOrder → 1];
IntTable = Table[IntF[x], {x, 1, Length[yd], 0.1}];
ParYd = Partition[IntTabel, 2, 1];
fc = FindClusters[ParYd -> Range[Length[ParYd]], 5];

pt1 = N[Last[fc[[1]]] / 10];
pt2 = N[Last[fc[[2]]] / 10];
pt3 = N[Last[fc[[3]]] / 10];
pt4 = N[Last[fc[[4]]] / 10];
pt5 = N[Last[fc[[5]]] / 10];

If[pt5 > pt4 > pt3 > pt2 > pt1, pt1 = pt1 * 1, res = -3];

data1 = IntTabel[[fc[[1]]]];
data2 = IntTabel[[fc[[2]]]];
data3 = IntTabel[[fc[[3]]]];
data4 = IntTabel[[fc[[4]]]];
data5 = IntTabel[[fc[[5]]]];

regdata1 = Regress[data1, {1,x}, x];
regdata2 = Regress[data2, {1,x}, x];
regdata3 = Regress[data3, {1,x}, x];
regdata4 = Regress[data4, {1,x}, x];
regdata5 = Regress[data5, {1,x}, x];

slope1 = (ParameterTable /. regdata1)[[1, 2]][[1]];
slope2 = (ParameterTabel /. regdata2)[[1, 2]][[1]];
slope3 = (ParameterTabel /. regdata3)[[1, 2]][[1]];
slope4 = (ParameterTabel /. regdata4)[[1, 2]][[1]];
slope5 = (ParameterTabel /. regdata5)[[1, 2]][[1]];

slopeRatio = {slope2 / slope1, slope3 / slope2, slope4 / slope3, slope5 / slope4};
MaxRatio = Max[slopeRatio];
EndPoint = Flatten[Position[slopeRatio, MaxRatio]][[1]];

RFI = Mean[IntTable[[fc[[5]]]]] / Mean[IntTable[[fc[[1]]]]];
AFI = Mean[IntTable[[fc[[5]]]]] - Mean[IntTable[[fc[[1]]]]];

If[ (yd[[Length[yd]]] > yd[[1]] && res ≠ -3 && res! = "L",
{If[EndPoint == 1, res = pt1 + 0.9];
If[EndPoint == 2, res = pt2 + 0.9];
If[EndPoint == 3, res = pt3 + 0.9];
If[EndPoint == 4, res = pt4 + 0.9];}
];
一つの実施形態によれば、データセットは、これにクラスタ分析プロセスが適用される前に前処理される。前処理は、データ曲線の標準化、スパイク点の除去などを含むことができる。一つの実施形態によれば、例えば後続のベースライン減算による二重シグモイドリーベンベルグ−マルクワルト(DSLM)曲線適合を行うことができる。このような標準化は、PCR曲線が著しいベースライン勾配を有する場合に有利であろう。クラスタ分析プロセスは、ベースライン減算によるDSLMの後に使用される。
別の実施形態によれば、異常値(スパイク)は、DSLMまたはクラスタ分析プロセスを行う前に除去される。DSLMもクラスタ分析プロセスも異常値に対して多少鈍感であるが、この方法を事前に実施することによってCt決定の精度を増すことができる。
要するに、本発明の態様によれば、曲線のある領域における特定の関心点を決定するためのコンピュータで実行される方法が提供される。この方法は、典型的には、曲線を表すデータセットを受け取るステップを含み、データセットは各々一対の座標値(x、y)を有する複数の第一のデータ点を含む。二次元座標系で見ると、このデータセットは関心領域を含む。この方法は、また、一般に、少なくとも関心領域を含むデータセットの部分に変換を加えて、変換データセットを生成するステップを含み、この変換データセットは各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含む。ここで、第二のデータ点のy’座標値は対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値は後続の第一のデータ点のy座標値である。この方法は、典型的には、さらに変換データセットにおいて第二のデータ点の複数のクラスタを特定するステップと、クラスタの各々の線形勾配を決定するステップと、各クラスタについてそのクラスタの勾配と隣接するクラスタの勾配との比率を決定するステップと、それらの比率を比較するステップとを含む。最大比率または最小比率を有するクラスタの終点は、データ曲線における特定の関心点を表す。一つの態様において、隣接するクラスタは後続のクラスタであり、最小比率を有するクラスタの終点が特定の関心点を表す。別の態様において、隣接するクラスタは先行のクラスタであり、最大比率を有するクラスタの終点が特定の関心点を表す。一つの態様において、曲線は動的ポリメラーゼ連鎖反応(PCR)プロセスの増幅曲線であり、特定の関心点は、動的PCR曲線のエルボー値またはサイクル閾値(Ct)を表す。特定されるデータ点の座標は、返されるかまたは表示される。一つの態様において、複数のクラスタを特定するステップは、k平均クラスタ化アルゴリズム(k≧3)のようなクラスタ化アルゴリズムを変換データセットに適用するステップを含む。他の態様において、3個またはそれ以上のクラスタを特定するためにPAMアルゴリズムが使用される。別の実施形態では、この方法はさらにデータセットの線形成長部を決定し、データセットから線形成長部を減算することによってデータセットを標準化するステップを含む。
別の実施形態においては、第一の対の座標値はサイクル数及び増幅ポリヌクレオチドの蓄積を表す。増幅ポリヌクレオチドの蓄積は、蛍光強度値、発光強度値、化学発光強度値、燐光強度値、電荷移動値、生体発光強度値または吸収値のうちの一つによって表すことができる。ここでは、複数のクラスタは3個またはそれ以上のクラスタを含むことができる。一つの態様において、複数のクラスタを特定するステップは、k平均クラスタ化アルゴリズム(k≧3)などクラスタ化アルゴリズムを変換データセットに適用するステップを含む。
ある実施形態では、この方法は、さらに、変換を加える前に、少なくとも関心領域における第一のデータ点を用いて付加的な第一のデータ点を補間するステップを含むことができる。補間は、線形補間法、三次スプライン法、リーベンベルグ−マルクワルト回帰法または最小二乗適合法のうちの一つを用いて行うことができ、前記座標のうちの一つに沿って座標間隔当たり約1.0またはこれ以下の増分で第一のデータ点を生成するように補間を行うことができる。特定の実施形態では、増分は約0.1である。別の実施形態では、補間は、リーベンベルグ−マルクワルト(LM)回帰法を二重シグモイド関数に適用して関数のパラメータを決定することによってデータセットに適合する曲線の近似を演算するステップを含む。特定の実施形態において、二重シグモイド関数は、
Figure 0004414419
となり、演算は、関数のパラメータa、b、c、d、e、f及びgのうちの一つまたはそれ以上を反復法(逐次代入法)により決定するステップを含む。
他の実施形態では、この方法は、さらに、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するステップを含む。特定の実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するステップは、クラスタの各々について相関係数を演算するステップを含み、相関係数が各クラスタについて約0.1未満であれば、データは実質的にノイズである。他の実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するステップは、各クラスタの終点値を演算するステップと、各終点が次の終点値より大きいか小さいかを決定するステップとを含む。さらに別の特定の実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するステップは、そのデータセットについて相関係数を演算するステップを含み、相関係数が約0.99より大きい場合、データは実質的に線形である。
他の実施形態では、この方法は、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値を最初のクラスタの平均値で割る、
ことによって、データ曲線の相対的蛍光増加(RFI)値を演算するステップを含む。
他の実施形態では、この方法は、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値から最初のクラスタの平均値を減算する、
ことによってデータ曲線の絶対的蛍光増加(AFI)値を演算するステップを含む。
この方法は、さらに、前記データセット及び前記変換データセットのうちの一方または両方をディスプレイ装置(表示装置)において二次元座標系に表示するステップを含むことができる。ある実施形態では、この方法は、さらに、ディスプレイ装置に特定の関心点のy’座標値を表示するステップを含む。この方法のデータ曲線は、動的ポリメラーゼ連鎖反応(PCR)プロセス、細菌増幅プロセス、酵素増幅プロセスまたは結合プロセスのうちの一つについての曲線を表すことができ、S字型曲線または成長曲線のうちの一つとすることができる。
この方法のある実施形態では、終点はクラスタの最終点である。特定の実施形態では、後続の第一のデータ点は連続する一連のデータ点における次のデータ点である。さらに別の実施形態では、後続の第一のデータ点は連続する一連のデータ点における次のデータ点ではない。
本発明の別の態様によれば、動的PCR増幅曲線におけるサイクル数(Ct)を決定するためにプロセッサを制御するためのコードを含むコンピュータ読み取り可能な媒体が提供される。このコードは、典型的には、動的PCR増幅曲線を表すデータセットを受け取るための命令を含み、データセットは各々1対の座標値(x、y)を有する複数の第一のデータ点を含む。このデータセットはCt値を含む関心領域にデータ点を含む。コードは、また、典型的には、少なくとも関心領域を含むデータセットの部分に変換を加えて変換データセットを生成するための命令を含む。このコードにおいて、変換データセットは、各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、この第二のデータ点のy’座標値は対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値は後続の第一のデータ点のy座標値である。このコードは、一般に、変換データセットにおいてデータ点の複数のクラスタを特定するための命令と、クラスタの各々の線形勾配を決定するための命令と、各クラスタについてそのクラスタの勾配と隣接するクラスタの勾配との比率を決定するための命令と、比率を比較するための命令とを含む。最大比率または最小比率を有するクラスタの終点は、PCR増幅曲線におけるCt値を表す。一つの態様において、隣接するクラスタは後続クラスタであり、最小比率を有するクラスタの終点が特定の関心点を表す。他の態様において、隣接するクラスタは先行クラスタであり、最大比率を有するクラスタの終点が特定の関心点を表す。一つの態様において、複数のクラスタを特定するための命令は、k平均クラスタ化アルゴリズム(k≧3)のようなクラスタ化アルゴリズムを変換データセットに適用するための命令を含む。ここでは、複数のクラスタは3個またはそれ以上のクラスタを含むことができる。他の態様において、クラスタを特定するためのコードは、3個またはそれ以上のクラスタを特定するためにPAMアルゴリズムを変換データセットに適用するための命令を含む。他の態様において、終点はクラスタの最終点である。特定の実施形態では、後続の第一のデータ点は連続する一連のデータ点における次のデータ点である。他の特定の実施形態では、後続の第一のデータ点は連続する一連のデータ点における次のデータ点ではない。他の実施形態では、コードは、さらに、データセットの線形成長部を決定する命令と、データセットから線形成長部を減算することによってデータセットを標準化するための命令とを含む。
ある実施形態では、第一の対の座標値はサイクル数及び増幅ポリヌクレオチドの蓄積を表す。増幅ポリヌクレオチドの蓄積は、蛍光強度値、発光強度値、化学発光強度値、生体発光強度値、燐光強度値、電荷移動値または吸収値のうちの一つによって表すことができる。
他の実施形態では、コードは、さらに、少なくとも関心領域における第一のデータ点を用いて付加的な第一のデータ点を補間するための命令を含む。補間は、線形補間法、三次スプライン法、リーベンベルグ−マルクワルト回帰法または最小二乗適合法のうちの一つを用いて行うことができる。ある実施形態では、前記座標のうちの一つに沿って座標間隔当たり約1.0またはこれ以下の増分で第一のデータ点を生成するように補間が行われる。特定の実施形態では、増分は約0.1である。
コンピュータ読み取り可能な媒体の他の実施形態では、補間のための命令は、リーベンベルグ−マルクワルト(LM)回帰法を二重シグモイド関数に適業して関数のパラメータを決定することによってデータセットに適合する曲線の近似を演算するための命令を含む。ある実施形態では、二重シグモイド関数は、
Figure 0004414419
の形であり、演算は、関数のパラメータa、b、c、d、e、f及びgのうち一つまたはそれ以上を反復法により決定することを含む。
他の実施形態では、このコードは、さらに、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するための命令を含む。一つの態様では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するための命令は、クラスタの各々について相関係数を演算するための命令を含み、相関係数が各クラスタについて約0.1未満であれば、データは実質的にノイズである。他の態様では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するための命令は、各クラスタの終点値を演算し、各終点が次の終点値より大きいか小さいかを決定するための命令を含む。他の態様では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定するための命令は、データセットについて相関係数を演算するための命令を含み、相関係数が約0.99より大きい場合、データは実質的に線形である。
他の実施形態において、コードは、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値を最初のクラスタの平均値で割る、
ことによってデータ曲線の相対的蛍光増加(RFI)値を演算するための命令を含む。
他の実施形態において、コードは、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値から最初のクラスタの平均値を減算する、
ことによってデータ曲線の絶対的蛍光増加(AFI)値を演算するための命令を含む。
さらに別の実施形態において、コードは、さらに、前記データセット及び前記変換データセットのうちの一方または両方をディスプレイ装置において二次元座標系に表示するための命令を含む。他の態様において、コードは、さらに、ディスプレイ装置に特定の関心点のy’座標値を表示するための命令を含む。
本発明のさらに別の態様によれば、動的PCRシステムが提供される。このシステムは、典型的には、動的増幅曲線を表すPCRデータセットを生成するPCR分析モジュールを含み、データセットは各々1対の座標値(x、y)を有する複数の第一のデータ点を含む。このデータセットはサイクル数(Ct)を含む関心領域においてデータ点を含む。このシステムは、また、典型的には、少なくとも関心領域を含むPCRデータセットの部分に変換を加えて変換データセットを生成することによってCt値を決定するためにPCRデータセットを処理するように構成されたインテリジェントモジュールを含む。この変換データセットは、各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含む。ここで、第二のデータ点のy’座標値は対応する第一のデータ点のy座標値であり、第二のデータ点のy*座標値は後続の第一のデータ点のy座標値である。
インテリジェントモジュールは、典型的には、変換データセットにおいて第二のデータ点の複数のクラスタを特定し、クラスタの各々の線形勾配を決定し、各クラスタについてそのクラスタの勾配と隣接するクラスタの勾配との比率を決定し、比率を比較するように構成されている。最大比率または最小比率を有するクラスタの終点は、PCR増幅曲線におけるCt値を表す。インテリジェントモジュールは、動的PCR分析モジュールに接続されるまたはこれと別個のコンピュータシステムのプロセッサを含むか、動的PCR分析モジュールに直接結合されるプロセッサを含むことができる。例えば両方のコンポーネントは動的PCRサーモサイクラを含むことができる。後者の実施形態においては、動的PCR分析モジュールは動的サーモサイクラ装置に内蔵され、インテリジェントモジュールは分析モジュールに通信可能に結合されるプロセッサを含む。他の態様において、インテリジェントモジュールはネットワーク接続または直接接続のうち一つによって分析モジュールに結合されるコンピュータシステムに内蔵されるプロセッサを含む。さらに別の態様において、インテリジェントモジュールはさらに少なくとも関心領域における第一のデータ点を用いて付加的な第一のデータ点を補間するように構成される。特定の実施形態において、インテリジェントモジュールは、さらに、前記データセット及び前記変換データセットのうちの一方または両方をディスプレイ装置において二次元座標系で表示するように構成される。別の実施形態において、インテリジェントモジュールは、さらに、ディスプレイ装置に特定の関心点のy’座標値を表示するように構成される。別の態様において、インテリジェントモジュールは、さらに、データセットの線形成長部を決定し、データセットから線形成長部を減算することによってデータセットを標準化するように構成される。
このようなシステムが図18に例示されている。この図は、ソフトウェアリソースとハードウェアリソースとの間の関係を説明する全体ブロック図を示す。システムは、サーモサイクラ装置内に配置することができる動的PCR分析モジュールと、コンピュータシステムの一部であるインテリジェントモジュールとを含む。データセット(PCRデータセット)は、ネットワーク接続または直接接続を通じて分析モジュールからインテリジェントモジュールへまたはその逆へ転送される。ある実施形態では、データセットは、プロセッサで実行されインテリジェントモジュールの記憶装置に記憶されるコンピュータコードによって図3に示されるような方法に従って処理され、処理後、分析モジュールの記憶装置に送り返されて、ここで、修正済みデータがディスプレイ装置に表示される。他の実施形態では、コンピュータシステムをサーモサイクラ装置上で実現し、これに統合することができる。
一つの態様において、隣接するクラスタは後続のクラスタであり、最小比率を有するクラスタの終点が特定の関心点を表す。別の態様において、隣接するクラスタは先行のクラスタであり、最大比率を有するクラスタの終点が特定の関心点を表す。一つの態様において、複数のクラスタを特定することは、k平均クラスタ化アルゴリズム(k≧3)などクラスタ化アルゴリズムを変換データセットに適用することを含む。別の態様において、3個またはそれ以上のクラスタを特定するために、PAMアルゴリズムが使用される。
システムのある実施形態において、前記座標のうちの一つに沿って座標間隔当たり約1.0以下の増分でデータ点を生成するように補間が行われる。他の実施形態においては、増分は約0.1である。他の態様において、補間は、線形補間法、三次スプライン法、リーベンベルグ−マルクワルト回帰法または最小二乗適合法のうちの一つを用いて行われる。
システムの他の実施形態において、座標値(x、y)はサイクル数及び増幅ポリヌクレオチドの蓄積を表す。ある態様では、増幅ポリヌクレオチドの蓄積は、蛍光強度値、発光強度値、化学発光強度値、燐光強度値、電荷移動値、生体発光強度値または吸収値のうちの一つによって表わされる。
システムの他の実施形態において、インテリジェントモジュールは、さらに、データセットが一つの傾向を示すかあるいは実質的にノイズデータを表すかを決定するためにPCRデータセットを処理するように構成される。ある実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定することは、クラスタの各々について相関係数を演算することを含み、相関係数が各クラスタについて約0.1未満であれば、データは実質的にノイズである。他の実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定することは、各クラスタの終点値を演算し、各終点が次の終点値より大きいか小さいかを決定することを含む。さらに別の実施形態では、データセットが一つの傾向を示すかあるいは実質的なノイズデータを表すかを決定することは、そのデータセットについて相関係数を演算することを含み、相関係数が約0.99より大きい場合、データは実質的に線形である。
システムの他の実施形態において、インテリジェントモジュールは、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値を最初のクラスタの平均値で割る、
ことによってデータ曲線の相対的蛍光増加(RFI)値を演算するように構成される。
システムのさらに別の実施形態において、インテリジェントモジュールは、さらに、
−最終クラスタの平均値を演算し、
−最初のクラスタの平均値を演算し、
−最終クラスタの平均値から最初のクラスタの平均値を減算する、
ことによってデータ曲線の絶対的蛍光増加(AFI)値を演算するように構成される。
システムの他の態様において、終点はクラス他の最終点である。特定の実施形態において、後続の第一のデータ点は連続する一連のデータ点における次のデータ点である。他の特定の実施形態において、後続の第一のデータ点は連続する一連のデータ点における次のデータ点ではない。
本発明の方法は、PCR結果データの質を大幅に高めるためにサーモサイクラなどPCRシステムにおいて特に有利である。本発明に従って処理されるデータの例について以下に説明する。
図8は、本発明に従って分析されプロットされたデータセットの一例を示している。この特定のデータセットは既存のアルゴリズムを用いて分析することが困難であった。本発明のクラスタCt分析法を用いて処理した場合、Ct値は13.1であると決定された。
図9は、本発明に従って分析されプロットされたデータセットの他の例を示している。このデータセットは、本発明のクラスタCt分析法を用いて処理された場合、Ct値35.9を示した。標準化を伴う従来のアプローチではこのデータセットを処理するのが困難であった。
図10は、サーマルサイクラを通じて処理され本発明に従って分析された10個の同一のサンプルから得られた蛍光信号のプロットの例を示している。このデータの曲線を重ね合わせたものが図10に示されている。クラスタ法を用いてこのデータを処理すると、下記の統計データが得られた。
標準偏差=0.356
平均=35.87
変動係数(Cv)=0.99%
この低いCv値はすばらしい値である。
図11に示されている非常に高いベースライン勾配を持つデータセットについて検討する。クラスタ分析プロセスをこのデータセットに適用すると、返されるCt値はCt=16.5である。しかし、この曲線は変わった形状を持つため、この値は適正ではない。曲線をベースライン減算で修正すると(例えば、二重シグモイドリーベンベルグ−マルクワルト法を用いて)、その結果得られる曲線は図12に示されるようになる。この曲線についてクラスタ分析プロセスによって得られるCt値は、Ct=24.6となり、この値は、このベースライン標準化データセットをよりよく表している。高いベースライン勾配がクラスタ分析によって決定されるCt値に影響を及ぼす理由は、図12aに示されている。曲線は理論的に決定されるシグモイド関数に関するものであり、唯一の変化は、初期値0から0.4へ変わるベースライン勾配の値である。これらの曲線のCt値は、図12bに示されているように、25.1から19.7へ変化する。
クラスタ分析プロセスを図13に示されているデータセットに適用するとCt=25.1というCt値が得られ、この値は適正である。サイクル数(サイクル番号)20にスパイクがある場合、データセットは図14に示されているようになる。このスパイクがあっても、クラスタ分析プロセスによって算出されるCt値はやはりCt=25.1である。これはクラスタ分析のロバスト性(エラーに対する強さ)を示している。しかし、スパイクがCt値において生じる場合(サイクル25に挿入されたスパイク)、その結果のグラフは図15に示されているようになる。この場合、CtはCt=23.4と不正確に算出される。従って、クラスタ分析を適用する前にこのようなスパイクが除去されることが非常に望ましい。図15に示されているデータセットをリーベンベルグ-マルクワルト異常値法(LMOM)で処理すると、このスパイクが除去され、その結果得られるデータセットは図13に示されているものと同じとなり、Ct値は約Ct=25.1と算出される。
データ点間において増分0.1の線形補間を用いてこのデータセット(図16)について算出されるCt値は、Ct=25.1となる。その代わりに二重シグモイドリーベンベルグ−マルクワルト(DSLM)の関数形態が0.1の増分で使用されると、算出されるCtはCt=25.0となる。この場合のCt値の差は小さいが、データ点の曲率の点から見てDSLM法のほうが線形補間よりずっと良い状況があるであろう。
図17に示されているデータセットは、ベースライン値を超える蛍光信号の増加が小さくデータが古典的S字型を持たないので、「緩慢増幅」として分類される。クラスタ分析を用いるとCtはCt=22.9と算出され、これは正確であるようには見えない。その代わりに可変クラスタ終点法を使用すると、CtはCt=37.3と算出され、これは正確である。この場合の勾配比率は、{2.05、3.065、0.895、1.28}なので、Ctはクラスタ2の終点に対応する。上述の手順を用いて算出されるRFI及びAFI値は、それぞれ、1.26及び1.48である。
本発明の方法をC、C++、C#、Fortran、VisualBasicなど多様なプログラミング言語並びにデータの視覚化及び分析に役立つプレパッケージのルーチン、機能及び手順を提供するMathematica(登録商標)と同様のアプリケーションを用いてコード化できることが、当業者には判るはずである。後者の別の例はMATLAB(登録商標)である。
本発明について例として特定の実施形態に関して説明したが、本発明は開示される実施形態に限定されるものではないことは了解されよう。逆に、本発明は、当業者には明白な様々な改変及び同様の構成を包括することを意図したものである。例えば、書類全体を通じて、データセットは二次元グラフを参照しながら説明されている。しかしながら、データセットは任意の次元空間に処理して視覚化できることが判るはずである。例えば、三次元系でデータを視覚化またはプロットして(例えば任意の三次元座標を用いて)、その後クラスタ分析変換を2つまたはそれ以上の座標値の任意のセットについて実施することができる。したがって、添付の特許請求の範囲には、これらの全ての改変及び同様の構成を包含するように広義の解釈が与えられなければならない。
蛍光強度対サイクル数でプロットされた典型的なPCR成長曲線の一例を示している。 サイクル(n+1)のときの蛍光強度対サイクル(n)のときの蛍光強度でプロットされた図1の典型的なPCR成長曲線の一例を示している。 一つの実施形態に従ったPCRプロセスのエルボー値を決定するためのプロセスを示している。 増幅曲線のデータセットの図を表示している。 本発明のクラスタ分析方法に従った対応するパーティションテーブルデータ(分配テーブルデータ)を表示している。 データ点を補間した図4aのデータセットを表示している。 本発明のクラスタ分析方法に従った対応するパーティションテーブルデータを表示している。 0.1の増分の線形補間をした図1のデータを示しており、従ってサイクル数は10倍となる。 x値がサイクル(n)のときの蛍光を表し且つy値がサイクル(n+1)のときの蛍光を表す図6の補間データの蛍光値を示しており、5個のクラスタは異なる色の四角によって示されている。 本発明に従って分析されたプロットされたデータセットの例を示している。 本発明に従って分析されたプロットされたデータセットの別の例を示している。 サーマルサイクラを通して処理され且つ本発明に従って分析された10個の同一のサンプルから得られた蛍光信号のプロットの例である。 高いベースライン勾配を持つPCRデータ曲線を示している。 ベースライン減算により補正された後の図11の曲線を示している。 Ct決定におけるベースライン勾配の影響を例示するために複数の曲線を示している。 図12aの曲線に関するCt対ベースライン勾配のグラフを示している。 データ曲線を示している。 サイクル20にスパイク部(急激に変化している部分)を含む図13のデータ曲線を示している。 サイクル25にスパイク部を含む図13のデータ曲線を示している。 線形補間されたデータセットを示している。 「緩慢増幅」を表すものとして分類できるデータセットを示している。 サーモサイクラ装置及びインテリジェントモジュールを含むコンピュータシステムを含む、本発明に従った例示のシステムを示している。

Claims (9)

  1. データ曲線のある領域における特定の関心点を決定するためのコンピュータで実行される方法であって、
    −データ曲線を表すデータセットを受け取るステップであって、前記データセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、二次座標系において見ると前記データセットが関心領域を有するようになっているステップと、
    −少なくとも前記関心領域を含む前記データセットの部分に変換を加えて、変換データセットを生成するステップであって、前記変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点の前記y’座標値が対応する第一のデータ点の前記y座標値であり、前記第二のデータ点の前記y*座標値が後続の第一のデータ点の前記y座標値となっているステップと、
    −前記変換データセットにおいて第二のデータ点の複数のクラスタを特定するステップと、
    −前記クラスタの各々の線形勾配を決定するステップと、
    −各クラスタについて該クラスタの勾配と隣接するクラスタの勾配との比率を決定するステップと、
    −前記比率を比較するステップと、
    を含み、最大または最小比率を有するクラスタの終点が前記データ曲線の特定の関心点を表すことを特徴とする方法。
  2. 前記変換を加えるステップの前に、少なくとも前記関心領域における前記第一のデータ点を用いて付加的な第一のデータ点を補間するステップをさらに含む、請求項1に記載の方法。
  3. 前記補間するステップが、線形補間法、三次スプライン法、リーベンベルグ-マルクワルト回帰法または最小二乗適合法のうちの一つを用いて行われる、請求項2に記載の方法。
  4. 前記クラスタを特定するステップが、k平均クラスタ化アルゴリズムを前記変換データセットに適用するステップを含み、kが3以上である、請求項1に記載の方法。
  5. 前記クラスタを特定するステップが、3個以上のクラスタを特定するためにPAMアルゴリズムを前記変換データセットに適用するステップを含む、請求項1に記載の方法。
  6. 動的ポリメラーゼ連鎖反応増幅曲線におけるサイクル値を決定するようにプロセッサを制御するためのコードを含むコンピュータ読み取り可能な媒体であって、前記コードが、
    −データ曲線を表すデータセットを受け取るための命令であって、前記データセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、二次座標系で見ると前記データセットが関心領域を有するようになっている命令と、
    −少なくとも前記関心領域を含むデータセットの部分に変換を加えて、変換データセットを生成するための命令であって、前記変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点の前記y’座標値が対応する第一のデータ点の前記y座標値であり、前記第二のデータ点の前記y*座標値が後続の第一のデータ点の前記y座標値となっている命令と、
    −前記変換データセットにおいて第二のデータ点の複数のクラスタを特定するための命令と、
    −前記クラスタの各々の線形勾配を決定するための命令と、
    −各クラスタについて該クラスタの勾配と隣接するクラスタの勾配との比率を決定するための命令と、
    −前記比率を比較するための命令と、
    を含み、最大または最小比率を有するクラスタの終点が前記データ曲線の特定の関心点を表すことを特徴とするコンピュータ読み取り可能な媒体。
  7. −動的PCR増幅曲線を表すPCRデータセットを生成する動的PCR分析モジュールであって、前記PCRデータセットが各々1対の座標値(x、y)を有する複数の第一のデータ点を含み、前記データセットがサイクル値を含む関心領域においてデータ点を含むようになっている動的PCR分析モジュールと、
    −前記PCRデータセットを処理して前記サイクル値を決定するように構成されたインテリジェントモジュールと、
    を備え、該インテリジェントモジュールが、
    −少なくとも前記関心領域を含む前記PCRデータセットの部分に変換を加えて、変換データセットを生成するステップであって、前記変換データセットが各々1対の座標値(y’、y*)を有する複数の第二のデータ点を含み、第二のデータ点の前記y’座標値が対応する第一のデータ点の前記y座標値であり、前記第二のデータ点の前記y*座標値が後続の第一のデータ点の前記y座標値となるようになっているステップと、
    −前記変換データセットにおいて第二のデータ点の複数のクラスタを特定するステップと、
    −前記クラスタの各々の線形勾配を決定するステップと、
    −各クラスタについて該クラスタの勾配と隣接するクラスタの勾配との比率を決定するステップと、
    −前記比率を比較するステップと、
    によってサイクル値を決定し、
    最大または最小比率を有するクラスタの終点が前記PCR増幅曲線における前記サイクル値を表すことを特徴とする動的ポリメラーゼ連鎖反応システム。
  8. 前記クラスタを特定するステップが、k平均クラスタ化アルゴリズムを前記変換データセットに適用するステップを含み、kが3以上である、請求項7に記載の動的ポリメラーゼ連鎖反応システム。
  9. 前記クラスタを特定するステップが、3個以上のクラスタを特定するためにPAMアルゴリズムを前記変換データセットに適用するステップを含む、請求項7に記載の動的ポリメラーゼ連鎖反応システム。
JP2006262485A 2005-09-29 2006-09-27 可変クラスタ終点を用いるクラスタ分析によるct測定 Active JP4414419B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/241,772 US7991558B2 (en) 2005-09-29 2005-09-29 Systems and methods for determining real-time PCR cycle thresholds using cluster analysis
US11/423,377 US7991561B2 (en) 2005-09-29 2006-06-09 Ct determination by cluster analysis with variable cluster endpoint

Publications (2)

Publication Number Publication Date
JP2007095070A JP2007095070A (ja) 2007-04-12
JP4414419B2 true JP4414419B2 (ja) 2010-02-10

Family

ID=37596260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006262485A Active JP4414419B2 (ja) 2005-09-29 2006-09-27 可変クラスタ終点を用いるクラスタ分析によるct測定

Country Status (5)

Country Link
US (1) US7991561B2 (ja)
EP (1) EP1770172B1 (ja)
JP (1) JP4414419B2 (ja)
CA (1) CA2561458A1 (ja)
HK (1) HK1105030A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680868B2 (en) * 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
KR101413659B1 (ko) * 2007-12-06 2014-07-01 삼성전자주식회사 실시간 핵산 증폭 데이터로부터 시료 중의 표적 핵산의초기 농도를 결정하는 방법
US8093020B2 (en) * 2007-12-28 2012-01-10 Abbott Laboratories Allelic discrimination analysis using an efficiency related value (EFR)
US8219324B2 (en) * 2008-09-12 2012-07-10 Roche Molecular Systems, Inc. Real-time PCR elbow calling by equation-less algorithm
US8219366B2 (en) * 2009-08-26 2012-07-10 Roche Molecular Sytems, Inc. Determination of elbow values for PCR for parabolic shaped curves
AU2009352527B2 (en) 2009-09-12 2014-04-03 Azure Vault Ltd. Identifying transition points in chemical reactions
US9043249B2 (en) 2009-11-22 2015-05-26 Azure Vault Ltd. Automatic chemical assay classification using a space enhancing proximity
SG184481A1 (en) * 2010-04-11 2012-11-29 Life Technologies Corp SYSTEMS AND METHODS FOR MODEL-BASED qPCR
US8666673B2 (en) 2010-05-14 2014-03-04 Biomerieux, Inc Identification and/or characterization of a microbial agent using taxonomic hierarchical classification
JPWO2012077748A1 (ja) * 2010-12-09 2014-05-22 三洋電機株式会社 クラスタリング方法、これを利用した最適化方法、電力供給制御装置
US9988675B2 (en) 2011-03-15 2018-06-05 Azure Vault Ltd. Rate based identification of reaction points
US8738303B2 (en) 2011-05-02 2014-05-27 Azure Vault Ltd. Identifying outliers among chemical assays
US8660968B2 (en) 2011-05-25 2014-02-25 Azure Vault Ltd. Remote chemical assay classification
US20130096845A1 (en) 2011-10-14 2013-04-18 Ze'ev Russak Cumulative differential chemical assay identification
JP5950740B2 (ja) * 2012-07-24 2016-07-13 株式会社日立ハイテクノロジーズ 核酸増幅分析装置及び核酸増幅分析方法
US10176293B2 (en) 2012-10-02 2019-01-08 Roche Molecular Systems, Inc. Universal method to determine real-time PCR cycle threshold values
BE1022048B1 (nl) 2014-04-11 2016-02-10 Ugentec Bvba Methoden voor fluorescentie data correctie
CN105957046B (zh) * 2016-05-04 2018-11-13 西北工业大学 用于智能手绘输入的平面立体投影图的端点融合方法
CN106991525B (zh) * 2017-03-22 2021-06-18 浙江工商大学 空气质量与居民出行可视分析方法与系统
DE102018219483A1 (de) * 2018-11-15 2020-05-20 Robert Bosch Gmbh Verfahren und Vorrichtung zur Analyse von biologischem Material
DE102020202361A1 (de) * 2020-02-25 2021-08-26 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur Auswertung einer qPCR-Kurve
DE102020207587A1 (de) * 2020-06-18 2021-12-23 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Steuergerät zum Auswerten eines Lumineszenzsignals in einem Analysegerät zum Analysieren einer Probe biologischen Materials und Analysegerät zum Analysieren einer Probe biologischen Materials
CN112034162B (zh) * 2020-08-31 2023-12-08 成都艾科斯伦医疗科技有限公司 一种光学检测反应曲线优化算法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2354902T3 (es) 1996-06-04 2011-03-21 University Of Utah Research Foundation Aparato para llevar a cabo la pcr y monitorización de la reacción en tiempo real durante ciclos de temperatura.
DK1179600T3 (da) 1996-06-04 2005-09-05 Univ Utah Res Found Overvågning af hybridisering under PCR
US7228237B2 (en) * 2002-02-07 2007-06-05 Applera Corporation Automatic threshold setting and baseline determination for real-time PCR
US7031844B2 (en) * 2002-03-18 2006-04-18 The Board Of Regents Of The University Of Nebraska Cluster analysis of genetic microarray images
ES2497502T3 (es) * 2003-12-06 2014-09-23 Abbott Laboratories Procedimiento y sistema para el análisis de las reacciones usando un sistema de información
US7680603B2 (en) 2005-03-11 2010-03-16 Roche Molecular Systems, Inc. Systems and methods for determining real-time PCR cycle thresholds using a rotation transformation
US7991558B2 (en) 2005-09-29 2011-08-02 Roche Molecular Systems, Inc. Systems and methods for determining real-time PCR cycle thresholds using cluster analysis
US7680868B2 (en) 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
US7668663B2 (en) 2005-12-20 2010-02-23 Roche Molecular Systems, Inc. Levenberg-Marquardt outlier spike removal method

Also Published As

Publication number Publication date
JP2007095070A (ja) 2007-04-12
EP1770172B1 (en) 2020-01-29
HK1105030A1 (en) 2008-02-01
US7991561B2 (en) 2011-08-02
EP1770172A2 (en) 2007-04-04
EP1770172A3 (en) 2017-08-09
US20070073490A1 (en) 2007-03-29
CA2561458A1 (en) 2007-03-29

Similar Documents

Publication Publication Date Title
JP4414419B2 (ja) 可変クラスタ終点を用いるクラスタ分析によるct測定
CN1940949B (zh) 确定动态聚合酶链反应扩增曲线中的周期阈值的方法和设备
US11615863B2 (en) Universal method to determine real-time PCR cycle threshold values
EP1801706B1 (en) PCR elbow determination by use of a double sigmoid function curve fit with the Levenberg-Marquardt algorithm and normalization
EP1804172B1 (en) PCR elbow determination using curvature analysis of a double sigmoid
CN101710363B (zh) 通过无方程算法判定实时pcr拐点
EP1801237B1 (en) Temperature step correction with double sigmoid Levenberg-Marquardt and robust linear regression
EP2107470B1 (en) PCR elbow determination using quadratic test for curvature analysis of a double sigmoid
US7991562B2 (en) PCR elbow determination using curvature analysis of a double sigmoid
CA2691907C (en) Systems and methods for determining cross-talk coefficients in pcr and other data sets
EP3090372B1 (en) Detection and correction of jumps in real-time pcr signals
US7680603B2 (en) Systems and methods for determining real-time PCR cycle thresholds using a rotation transformation
EP2471007B1 (en) Determination of elbow values for pcr for parabolic shaped curves

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4414419

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250