JP6009724B2 - ダブルシグモイドの曲率解析のためのクアドランティック検定を用いたpcrエルボーの決定 - Google Patents

ダブルシグモイドの曲率解析のためのクアドランティック検定を用いたpcrエルボーの決定 Download PDF

Info

Publication number
JP6009724B2
JP6009724B2 JP2008242813A JP2008242813A JP6009724B2 JP 6009724 B2 JP6009724 B2 JP 6009724B2 JP 2008242813 A JP2008242813 A JP 2008242813A JP 2008242813 A JP2008242813 A JP 2008242813A JP 6009724 B2 JP6009724 B2 JP 6009724B2
Authority
JP
Japan
Prior art keywords
data set
curve
pcr
value
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008242813A
Other languages
English (en)
Other versions
JP2009080811A (ja
JP2009080811A5 (ja
Inventor
アディティア セイン
アディティア セイン
ティー.クーニク ロナルド
ティー.クーニク ロナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2009080811A publication Critical patent/JP2009080811A/ja
Publication of JP2009080811A5 publication Critical patent/JP2009080811A5/ja
Application granted granted Critical
Publication of JP6009724B2 publication Critical patent/JP6009724B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Algebra (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Image Analysis (AREA)

Description

本発明は、一般に、シグモイド又は増殖曲線を示すデータを処理するシステム及び方法に関する。特に、本発明は、増殖曲線のデータが、有効又は有意な増殖を表すか又は示すかを決定すること、並びにそのような場合、シグモイド又はポリメラーゼ連鎖反応曲線などの増殖型の曲線におけるエルボー値などの特徴的な転移値(transition value)を決定することに関する。
ポリメラーゼ連鎖反応(PCR)とは、規定の核酸配列を酵素的に合成又は増幅するin vitro法である。この反応は、通常、反対の鎖とハイブリダイズし、そして増幅対象のテンプレート又は標的DNA配列の側面に位置する2つのオリゴヌクレオチドプライマーを使用する。プライマーの伸張は、熱安定DNAポリメラーゼにより触媒される。テンプレートの変性、プライマーのアニーリング、及びポリメラーゼによるアニーリングされたプライマーの伸長を伴う反復的な一連のサイクルにより、結果的に、特定のDNA断片の指数的増殖がもたらされる。増幅プロセスの検出と定量化を促進するために、蛍光プローブ又はマーカーが一般的にこのプロセスにおいて使用されている。
代表的なリアルタイムPCR曲線が図1に示されており、ここで、通常のPCRプロセスについて蛍光強度値がサイクル数に対してプロットされている。この場合、PCR産物の形成が、PCRプロセスの各サイクルにおいてモニタリングされる。増幅は、通常、増幅反応の間に蛍光シグナルを計測する構成及び装置を含むサーモサイクラーで計測される。このようなサーモサイクラーの一例が、Roche Diagnostics LightCycler(カタログ番号:20110468)である。増幅産物は、例えば、標的核酸に結合した場合にのみ蛍光シグナルを発する蛍光標識されたハイブリダイゼーションプローブを用いて検出されるか、又はある場合、二本鎖DNAに結合する蛍光色素を用いて検出される。
一般的なPCR曲線では、エルボー値又はサイクル閾値(Ct)と一般的に呼ばれるベースライン領域の末端で転移点を同定することは、PCR増幅プロセスの特徴を理解するためにかなり有用である。Ct値は、PCRプロセスの効率の尺度として使用することができる。例えば、一般的に、解析対象のすべての反応について、規定のシグナル閾値を決定し、この閾値に到達するのに必要とされるサイクル数(Ct)が、標的核酸、並びに標準又はハウスキーピング遺伝子などの参照核酸について決定される。標的核酸及び参照核酸について得られたCt値に基づいて、標的分子の絶対数又は相対的なコピー数を決定できる(Gibsonら、Genome Research 6: 995-1001; Biecheら、Cancer Research 59:2759-2765, 1999; WO 97/46707; WO 97/46712; WO 97/46714)。図1におけるベースライン領域の末端における領域20のエルボー値は、サイクル数が30の領域内に位置することになろう。
PCR曲線におけるエルボー値は、いくつかの既存の方法を使用することにより決定することができる。例えば、様々な最新の方法は、エルボーの実際の値を、AFL(任意の蛍光値)と呼ばれる既定のレベルに蛍光強度が到達する値として決定する。その他の最新の方法は、サイクル数に対する蛍光の2次導関数が最大値に達するサイクル数を使用することができよう。しかしながら、これらの方法は、いずれも欠点を有している。例えば、いくつかの方法は、異常値(ノイズ)データに対してかなり影響を受け易く、そして当該AFL値のアプローチは、ベースラインが高いデータセットについて上手く機能しない。図1に示される増殖曲線についてのベースラインストップ(又はベースラインの末端)を決定する従来の方法は、特に高タイターの状況下では上手く機能しないことがある。さらに、これらのアルゴリズムは、通常、多数の(例えば、50以上)のパラメータを具備しており、これらのパラメータは、明確に定義されておらず、線形依存性を有しており、そして多くの場合に、最適化が不可能であるまではいかなくとも非常に困難である。
従って、上記問題及び他の問題を克服するシグモイド型の曲線、及びPCR曲線などの曲線におけるエルボー値を決定するシステム及び方法を提供することが望ましい。曲線が有効な増殖を示しているか、又は処理資源を消費する前に、データを破棄すべきかを最初のうちに決定することも望ましい。
本発明は、増殖曲線についてのデータが、有効又は有意な増殖を表すか又は示すかを決定し、そしてそのような場合、シグモイド又は増殖型の曲線におけるエルボー値などの特徴的な転移値を決定する新規の効率的なシステム及び方法を提供する。ある実施においては、本発明のシステム及び方法は、PCR増幅曲線におけるサイクル閾値(Ct)を決定するのに特に有用である。
本発明の特定の態様では、シグモイド又は増殖型曲線を示すデータセットを処理して、当該データが有意又は有効な増殖を示すかを決定するために処理される。ある態様では、当該データにフィットする一次又は二次の多項式曲線を決定し、そして近似された曲線について統計的に有意な値が測定される。有意な値が、有意閾値(significance threshold)を超える場合、当該データは、有意又は有効ではない増殖を表していないとみなされる。当該データが、有意又は有効な増殖を表さない場合、当該データセットは破棄されてもよい。当該有意な値が、有意閾値を超えない場合、当該データは、有意又は有効な増殖を表すとみなされる。当該データセットが正確な増殖を表すと決定される場合、当該データはさらに処理されて、シグモイド又は増殖曲線における転移値、例えばベースライン領域の末端又はPCR増幅曲線のCt値若しくはエルボー値を決定する。ある態様では、増殖プロセスを表すデータ曲線が有意閾値を超え、かつ有効な増殖を表すと判断されるように決定される場合、Levenberg-Marquardt(LM)回帰プロセスにより決定されるパラメーターを有するダブルシグモイド関数を用いて、当該データセットにフィットする曲線への近似を発見した。パラメーターを決定すると、当該曲線は、決定されたパラメーターのうちの1以上を用いて正規化することができる。正規化した後に、正規化された曲線を処理して、曲線に沿った幾つか又は全ての点で曲線の曲率を決定し、例えばPCRデータセットについてサイクル数に対する曲率を表すデータセット又はプロットをもたらした。最大曲率が生じるサイクル数は、PCRデータセットのCt値に対応する。次に曲率及び/又はCt値が返され、そして表示されるか又はそうでない場合さらなる処理に用いられることもある。
本発明の1の態様では、コンピューターにより実行される方法が、増殖プロセスのデータが有意な増殖を示すかの決定を提供する。当該方法は典型的に、増殖プロセスを表すデータセットを受容することを含み、ここで、当該データセットは複数のデータポイントを含み、各データポイントが座標値を有し、そして当該データセットにフィットする曲線を計算し、当該曲線が一次又は二次多項式のうちの1つを含む。当該方法は、一般的に、当該曲線についての統計的に有意な値を決定し、当該有意な値が閾値を超えるかを決定し、そして閾値を超えない場合、当該データセットをさらに処理し、そして閾値を超える場合、当該データセットが有意な増殖を有さないということを示し、及び/又は当該データセットを破棄することを含む。1の態様では、当該増殖プロセスは、ポリメラーゼ連鎖反応(PCR)プロセスである。ここで、当該データセットを処理することは、さらに、PCRデータセットのサイクル閾値(Ct)を決定することを含んでもよい。ある態様では、当該曲線は、動的ポリメラーゼ連鎖反応(kinetic polymerase chain reaction)( PCR)プロセスの増幅曲線であり、そしてベースライン領域の末端での点は、動的PCR曲線のエルボー又はサイクル閾値(Ct)を表すベースライン領域の末端の位置である。1の態様では、当該曲線を処理して、曲線に沿った幾つか又は全ての点で曲率を決定するように処理され、ここで最大曲率を有する点は、Ct値を表す。ある態様では、受容されたデータセットは、1以上の異常値又はスパイクポイントを除くように処理されたデータセットを含む。ある態様では、統計的に有意な値はR2値であり、そしてその閾値は、約0.90よりも高い。1の態様では、統計的に有意な値は、R2値であり、そしてその閾値は約0.99である。ある実施態様では、当該方法はさらに、データセットにフィットする曲線を計算する前に、データセットを正規化することを含む。さらに別の実施態様では、Ct値を決定する方法は、Levenberg-Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して、関数のパラメーターを測定し、規定のパラメーターを用いて当該曲線を正規化して正規化曲線をもたらし、そして当該正規化曲線を処理して、最大曲率の点を決定することによって、データセットにフィットする曲線の近似を計算することを含み、ここで当該最大曲率の点は、PCR曲線のCt値を表す。
本発明の別の態様によると、増殖プロセスについてのデータが有意な増殖を示すかを決定するためにプロセッサーを制御するためのコードを含むコンピューターが読み取り可能な媒体が提供される。当該コードは、一般的に、増殖プロセスを表すデータセットであって、当該データセットが複数のデータポイントを含み、各データポイントが座標値の対を有する、上記データセットを受容し、そして当該データセットにフィットする曲線であって、当該曲線が一次又は二次の多項式のうちの一つを含む、上記曲線を計算する指示を含む。当該コードは、また一般的に、当該曲線について統計的に有意な値を決定し、当該有意な値が閾値を超えるかを決定し、そして当該閾値を超えない場合、当該データセットをさらに処理し、そして当該閾値を超える場合、当該データセットが有意な増殖を有さないということを示し、及び/又は当該データセットを破棄する指示を含む。1の態様では、当該増殖プロセスは、ポリメラーゼ連鎖反応(PCR)プロセスである。ここで、コンピューターが読み取り可能な媒体は、さらに、PCRデータセットのサイクル閾値(Ct)を決定する指示をさらに含むことがある。別の態様では、当該曲線は動的ポリメラーゼ連鎖反応(PCR)プロセスの増幅曲線であり、そしてベースライン領域の末端でのポイントは、動的PCR曲線のサイクル閾値(Ct)又はエルボー値を表す。1の態様では、当該曲線を処理して、当該曲線に沿った幾つか又は全てのポイントで曲率を計算し、ここで最大曲率を有する点が、Ct値を表す。ある態様では、当該統計的に有意な値は、R2値であり、そして閾値は、約0.90よりも大きい。1の態様では、統計的に有意な値はR2値であり、そして当該閾値は、約0.99である。コンピューターが読み取り可能な媒体のある実施態様では、Ct値を決定するための指示は、Levenberg-Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して、関数のパラメーターを決定することにより、データセットにフィットする曲線の近似を計算し;当該決定されたパラメーターを用いて関数を正規化して正規化された曲線をもたらし;そして正規化された曲線を処理して、最大曲率の点(当該最大曲率の点が、PCR曲線のCt値を表す)を決定する指示を含む。当該コンピューターが読み取り可能な媒体の別の実施態様において、当該コードはさらに、当該データセットにフィットする曲線を計算する前にデータセットを正規化する指示をさらに含む。さらに別の実施態様では、当該コードは、増殖プロセスがPCRプロセスである場合、Ct値を表すデータを出力する指示をさらに含む。
本発明のさらに別の態様では、動的ポリメラーゼ連鎖反応(PCR)システムが提供される。当該システムは、一般的に、動的PCR増幅曲線を示すPCRデータセットを作成する動的PCR分析モジュール(ここで、当該データセットが複数のデータポイントを含み、その各々が座標値の対を有し、ここで当該データセットがサイクル閾値(Ct)を含む目的の領域においてデータポイントを含む)、並びにPCRデータセットが有意な増殖を示すかを決定するために適用されるインテリジェンス・モジュールを含む。インテリジェンス・モジュールは、一般的に、PCRデータセットにフィットし、そして一次又は二次多項式のうちの一つを含む曲線を計算し、そして当該曲線について統計的に有意な値を決定することにより、PCRデータセットを処理する。インテリジェンス・モジュールはまた、当該有意な値が閾値を超えるかを決定し、そして当該閾値を超えない場合、当該PCRデータセットをさらに処理し、そして当該閾値を超える場合、当該PCRデータセットが有意な増殖を有さないということを示すか及び/又は当該PCRデータセットを破棄することにより、PCRデータセットを処理する。1の態様では、当該データセットを処理することはさらに、PCRデータセットのサイクル閾値(Ct)値を決定することをさらに含む。ある態様では、当該曲線は、それにより処理されて、曲線に沿った幾つか又は全ての点で曲率を決定し、ここで最大曲率を有する点はCt値を表す。特定の実施態様では、Ct値を決定するPCRシステムは、Levenberg-Marquardt(LM)回帰プロセスを、ダブルシグモイド関数に適用して関数のパラメーターを決定することにより、データセットにフィットする曲線の近似を計算し;決定されたパラメーターを用いて曲線を正規化して、正規化曲線をもたらし;そして正規化された曲線を処理して最大曲率の点(ここで、当該最大曲率の点は、PCR曲線のCt値を表す)を決定することを含む。ある態様では、統計的に有意な値は、R2値であり、そして閾値は約0.90よりも大きい。1の態様では、統計的に有意な値は、R2値であり、そして閾値は約0.99である。ある態様では、当該インテリジェンス・モジュールは、さらにデータセットにフィットする曲線を計算する前に、データセットを正規化するためにさらに適用される。PCRシステムの特定の実施態様では、動的PCR分析モジュールは、動的サーモサイクラー装置に組み込まれており、そして分析モジュールに通信可能なように結合されたプロセッサーを含む。PCRシステムのある実施態様では、インテリジェンス・モジュールは、ネットワーク接続又は直接接続の内の一つにより、分析モジュールにつながれたコンピューターシステム内に存在するプロセッサーを含む。
図面及び特許請求の範囲を含めて、本明細書の残りの部分を参照すれば、本発明の他の特徴及び利点が認識できよう。本発明のさらなる特徴及び利点、並びに本発明の様々な実施態様の構造及び操作が、添付の図面に関して以下に詳細に記載されている。図面において、参照番号は、同一又は機能的に類似した要素を指す。
本発明は、シグモイド又は増殖型曲線を示すデータが、有意な増殖を示しているかを決定するシステム及び方法を提供する。ある態様では、当該データにフィットする一次又は二次多項式曲線が決定され、そしてフィットされた曲線について統計的に有意な値が決定される。当該有意な値が、有意な閾値を超える場合、当該データは、有意又は有効な増殖を示さないとみなされる。当該データが有意又は有効な増殖を示さない場合、当該データセットは、破棄されてもよい。有意な値が有意な閾値を超えることがない場合、当該データは有意又は有効な増殖を示すとみなされる。当該データセットが有効な増殖を示すと決定されたならば、データをさらに処理して、シグモイド又は増殖曲線における転移値、例えばベースライン領域の末端又はPCR増殖曲線のエルボー値若しくはCt値を決定する。ある態様では、Levenberg-Marquardt(LM)回帰プロセスにより決定されるパラメーターを有するダブルシグモイド関数を用いて、当該曲線の近似を発見した。パラメーターが決定されると、決定されたパラメーターの1以上を用いて当該曲線を正規化することができる。正規化後、正規化された曲線を処理して、曲線に沿って幾つか又は全ての点で曲線の曲率を決定し、例えば曲率 対 サイクル数を表すデータセット又はプロットをもたらす。最大曲率が生じるサイクル数は、Ct値に一致する。当該Ct値は次に返され、そして表示されるか又はそうでない場合さらなる処理に用いられることがある。
本発明の代表的な実施態様では、当該方法は、非限定的にデータセットを入力する入力装置、例えばキーボード、マウスなど;曲線領域の目的の特異的点を表示する表示装置、例えばモニター;当該方法の各ステップを実施するために必須の処理装置、例えばCPU;モデムなどのネットワークインターフェース、データセットを格納するデータ貯蔵装置、プロセッサー上で作動するコンピューターコードなどを含む慣用されているパーソナルコンピューターシステムを用いることによって、実行され得る。さらに、本方法は、PCR装置中で実行されることもある。
図24は、ソフトウェア資源とハードウェア資源との間の関係を説明する一般的なブロック図を示す。当該システムは、サーモサイクラー装置内に位置する動的PCR分析モジュール、並びにコンピューターシステムの一部であるインテリジェンス・モジュールを含むことがある。ここでは、当該データセット(PCRデータセット)は、ネットワーク接続又は直接接続を介して分析モジュールからインテリジェンス・モジュールへと移されるか、又はその逆である。図2又は9に表示されるように当該方法に従って、プロセッサー上で作動するコンピューターコードにより、当該データセットが処理され、そしてインテリジェンス・モジュールの貯蔵装置上に格納され、そして処理後に分析モジュールの貯蔵装置に戻され、ここで当該改変データは、表示装置上にディスプレーされてもよい。
有効な増殖を示すPCRデータについてのCt決定
PCRプロセスの点で、増殖又は増幅曲線10の一例が図1に示される。示されるように、曲線10は、ラグフェーズ領域15、及び指数フェーズ領域25を含む。ラグフェーズ領域15は、一般的にベースライン又はベースライン領域と呼ばれる。このような曲線10は、ラグフェーズ領域と指数フェーズ領域を繋ぐ目的の遷移領域20を含む。領域20は、一般的に、エルボー又はエルボー領域と呼ばれる。当該エルボー領域は、一般的に、ベースラインの末端、並びに基礎プロセス(underlying process)の増殖又は増幅率の変化を定義する。一般的なPCR曲線において、エルボー値又はサイクル閾値(Ct)値と呼ばれる遷移点を同定することは、PCRプロセスの効率特徴を理解するのに有用である。
同様のシグモイド又は増殖曲線を提供し得る他のプロセスは、細菌プロセス、酵素プロセス、及び結合プロセスを含む。細菌増殖曲線では、例えば、目的の転移点が、ラグフェーズ領域における時間、シータと呼ばれた。本発明に従って分析され得るデータ曲線をもたらす他の具体的プロセスは、標準置換増幅(SDA)プロセス、核酸配列に基づく増幅(NASBA)プロセス及び遷移媒介性増幅(TMA)プロセスを含む。SDA及びNASBAプロセスの例及びデータ曲線は、Wang, Sha-Shaら、「Homogeneous Real Time Detection of Single Nucleotide Polymorphisms by Standard Displacement Amplification on the BD ProbeTec ET System」Clin Chem 2003 49 (10): 1599, 及びWeusten, Jos J. A. M.ら、「Principles of Quantitation of viral loads Using Nucleic Acid Sequence-Based Amplification in Combination With Homogeneous Detection Using Molecular Beacons」, Nucleic Acids Research, 2002 30 (6): 26に見出すことができる。こうして、本明細書の残りは、本発明の実施態様及び態様を、PCR曲線への適用の点で論じるが、本発明が他のプロセスに関するデータ曲線に適用され得るということが認められるべきである。
図1に示される様に、一般的なPCR増殖曲線についてのデータは、例えばPCRサイクル数をx軸とし、そして増幅されたポリヌクレオチドの指標をy軸とした二次元座標系で表すことができる。一般的に、蛍光マーカーの使用が恐らく最も広く使用される標識スキームであるので、図1に示される様に増幅の指標は蛍光強度値である。しかしながら、使用される特定の標識及び/又は検出スキームに応じて、他の指標を使用することも可能であることを理解されたい。増幅されたシグナルの他の有用な指標の例として、発光強度、化学発光強度、生物発光強度、リン光強度、荷電移動、電圧、電流、電力、エネルギー、温度、粘度、光散乱、放射活性強度、反射性、透過率、及び吸光度が上げられる。サイクルの定義には、時間、プロセスサイクル、単位動作サイクル、及び再生サイクルを含めることも可能である。
一般的プロセスの概説
本発明に従って、単一のシグモイド曲線における転移値、例えば動的PCR増幅曲線のエルボー値又はCt値などの決定するためのプロセス100の1の実施態様は、図2を参照して簡潔に記載することができる。ステップ110では、曲線を表す実験データセットを受容し、またはそうでない場合取得する。プロットされたPCRデータセットを図1に示し、ここでy軸及びx軸は、それぞれPCR曲線についての蛍光強度とサイクル数を表す。ある態様では、当該データセットは、連続的であり、そして軸に沿って均等に配置されたデータを含むべきである。
プロセス100が、PCRデータ取得装置、例えばサーモサイクラー内に位置するインテリジェンス・モジュール(例えば、指示を実行するプロセッサー)で実行される場合、データセットは、データが取得されるとリアルタイムでインテリジェンス・モジュールに提供されるか、又はデータセットは記憶ユニット又はバッファーに格納され、そして実験が完了した後にインテリジェンス・モジュールに提供されることもある。同様に、当該データセットは、取得装置に対するネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接接続(例えば、USB又は他のダイレクトワイヤー又はワイヤレス接続)を介して、デスクトップコンピュータシステム又は他のコンピューターシステムなどの分離したシステムに提供されるか、又はCD、DVD、フロッピー(登録商標)ディスクなどのポータブルメディアで提供されることがある。
ある態様では、データは、座標値の対を有するデータポイント(又は2次元ベクトル)を含む。PCRデータでは、座標値の対は、一般的に、サイクル数及び蛍光強度値を一般的に表す。ステップ110でデータセットを受容するか又は取得した後に、データセットを分析して、ベースライン領域の末端を決定することもできる。
ステップ120では、近似曲線が計算される。このステップの間に、1の実施態様では、Levenberg-Marquardt(LM)回帰プロセス又は他の回帰プロセスにより決定されたパラメーターを有するダブルシグモイド関数を使用して、当該データセットを表す近似曲線を見出した。異常値又はスパイクポイントが曲線フィットの品質に最小の効果しか与えないので、近似は「強健(robust)」であると言われる。以下に論じられる図13は、受容されたデータセットのプロットと、Levenberg-Marquardt回帰プロセスを用いて本発明に従ったダブルシグモイド関数のパラメーターを決定することにより決定されたデータセットの強健な近似のプロットの例を示す。
ある態様では、データセット中の異常値又はスパイクポイントが取り除かれるか、又はデータセットを処理する前に置換して、ベースライン領域の末端を決定した。スパイクの除去は、データセットをステップ110で取得する前又は後で行なわれる。図3は、PCR又は他の増殖曲線を表すデータセットにおいてスパイクポイントを同定しそして置換するための処理の流れを示す。スパイクポイントを決定し、そして除去又は置換するためのプロセスのより詳細な記載は、US2007-0148632に見出すことができる。
ステップ130では、ステップ120で決定されたパラメーターは、例えばベースラインの傾きを取り除くために、曲線を正規化するために使用される。この様式における正規化は、曲線のベースライン領域の末端又はベースラインストップ位置を決定又は特定する必要なく、Ct値を決定することを可能にする。ステップ140では、当該正規化された曲線を処理して、以下により詳細に記載されるように、Ct値を決定した。
LM回帰プロセス
以下に論じられるように、図3のステップ502〜524は、データセットの曲線を近似し、そしてフィット関数のパラメーターを決定するためのプロセスフローを説明する(ステップ120)。これらのパラメーターは、曲線を正規化するのに、例えば本発明の1の実施態様に従って、シグモイド又はPCR曲線などの増殖型の曲線を表すデータセットのベースライン傾きを変更又は除去するのに使用することができる(ステップ130)。当該データセットが、スパイクポイントを除去又は取り除いて、変更済みデータセットを得るように処理された場合、変更されたスパイクを伴わないデータセットは、ステップ502〜524に従って処理されて、フィット関数のパラメーターを同定することができる。
示される様に1の実施態様では、データセットの強健な曲線近似を計算するために、Levenberg-Marquardt(LM)法が用いられる。LM法は、非線形回帰プロセスであり;非線形関数とデータセット間の距離を最小化する反復的な技法である。当該プロセスは、最急降下法とガウス-ニュートン法の組み合わせたもののように動作する(現在の近似が良好にフィットしていない場合には、最急降下法のように動作し(低速であるが、信頼性の高い収束)、現在の近似が正確性を増すに伴って、Gauss-Newtonプロセスのように動作することになる(高速であるが、信頼性の低い収束))。LM回帰法は、非線形の回帰問題を解決するために広く使用されている。
一般に、LM回帰法は、様々な入力を必要とし、且つ、出力を提供するアルゴリズムを含んでいる。ある態様においては、入力は、処理対象のデータセット、データのフィットに使用する関数、及び関数のパラメータ又は変数の初期推定値を含んでいる。出力は、関数とデータセット間の距離を最小化する関数のパラメータの組を含んでいる。
ある態様によれば、フィット関数は、次のような形態のダブルシグモイドである:
Figure 0006009724
この式は、一般的なPCR曲線及びその他の増殖曲線が取り得る様々な曲線形状にフィットするその柔軟性及び能力に基づいて、フィット関数として選択されたものである。当業者であれば、必要に応じて、その他のフィット関数を使用可能であることを理解するであろう。
ダブルシグモイド式(1)は、(a)、(b)、(c)、(d)、(e)、(f)及び(g)という7つのパラメータを具備している。この式は、定数、傾き、及びダブルシグモイドの集まりに分けることが可能である。ダブルシグモイド自体は、2つのシグモイドの乗算(multiplication)である。図4は、ダブルシグモイド式(1)を分解したものを示している。パラメータ(d)、(e)、(f)、及び(g)が2つのシグモイドの形状を決定している。最終的な曲線に対するこれらの影響を示すために、次の単一のシグモイドを検討する:
Figure 0006009724
式中、パラメータ(d)は、曲線の「鋭さ」を決定しており、パラメータ(e)は、変曲点のx値を決定している。図5は、曲線に対するパラメータ(d)の影響と変曲点のx値の位置に対するパラメータ(e)の影響を示している。以下の表1は、ダブルシグモイド曲線に対するパラメータの影響を説明している。
Figure 0006009724
ある態様においては、曲線が非現実的な形状になることを防止するべく、ダブルシグモイド式の「鋭さ」パラメータ(d)及び(f)を制約する必要がある。このため、ある態様においては、d<-1又はd>1.1或いは、f<-1又はf>1.1の反復を不成功であると見なしている。その他の態様においては、パラメータ(d)及び(f)に対して異なる制約を使用可能である。
Levenberg-Marquardtアルゴリズムは、反復的なアルゴリズムであるため、通常、フィットのために関数のパラメータの初期推定値が必要である。初期推定値が良好なものであるほど、近似も良好なものになり、アルゴリズムが局所的な最小値に収束する可能性が低くなる。ダブルシグモイド関数の複雑性とPCR曲線又はその他の増殖曲線の様々な形状に起因し、すべてのパラメータに1つの初期推定値を付与する方法は、アルゴリズムが頻繁に局所的な最小値に収束することを防止するのに十分ではないであろう。従って、ある態様においては、多数の(例えば、3つ以上)初期パラメータの組を入力し、最良の結果を保持している。ある態様においては、使用する多数のパラメータの組にわたって大部分のパラメータを一定に維持しており、多数のパラメータの組のそれぞれについて異なることができるのは、パラメータ(c)、(d)、及び(f)のみである。図6は、異なるパラメータの組の3つの曲線形状の例を示している。これらの3つのパラメータの組の選択は、PCRデータを表す曲線の3つの可能な異なる形状を示している。尚、3つを上回る数のパラメータの組を処理して最良の結果を保持することも可能であることを理解されたい。
図3に示されているように、ステップ510において、LM法の初期入力パラメータが同定されている。これらのパラメータは、操作者が入力するか、或いは、算出することも可能である。態様によっては、パラメータは、後述するように、段階502、504、及び506に従って決定又は設定される。
初期パラメータ(a)の算出:
パラメータ(a)は、ベースラインの高さであり、この値は、初期バラメータのすべての組について同一である。ある態様においては、ステップ504において、例えば、蛍光値などの3番目に小さなy軸値がデータセットからパラメータaに割り当てられる。この結果、強健な計算が得られる。当然のことながら、その他の態様においては、必要に応じて、最小のy軸値や2番目に小さな値などの任意のその他の蛍光値をパラメータaに割り当て可能である。
初期パラメータ(b)の算出
パラメータ(b)は、ベースラインとプラトーの傾きである。この値は、すべての初期パラメータの組について同一である。全く傾きが存在しないことが理想的であるため、ある態様においては、ステップ502において、0.01の静的な値が(b)に割り当てられる。その他の態様においては、パラメータ(b)には、例えば、0〜約0.5の範囲の値などの異なる値を割り当て可能である。
初期パラメータ(c)の算出
パラメータ(c)は、「プラトーの高さ」 - 「ベースラインの高さ」を表しており、これは絶対蛍光強度、つまりAFIを指す。1の態様では、パラメーターの第一セットでは、c=AFI+2であり、一方最後の2つのパラメーターについては、c=AFIである。これは、図6に示されており、ここでパラメーターの最後の2つのセットでは、c=AFIである。パラメーターの第一セットでは、c=AFI+2である。この変化は、第一セットのパラメーターによりモデル化された曲線の形状に起因しており、この曲線形状は、プラトーを具備していない。
パラメータ(d)及び(f)の算出
パラメータ(d)及び(f)は、2つのシグモイドの鋭さを定義している。曲線に基づいてこれらのパラメータの近似を付与する方法は存在しないため、ある態様においては、3つの静的な代表値をステップ502において使用する。その他の静的な又は非静的な値をパラメータ(d)及び/又は(f)に使用することも可能であることを理解されたい。これらのペアは、遭遇するPCR曲線の最も共通的な形状をモデル化している。次の表2は、図6に示されている異なるパラメータの異なるセットについて(d)及び(f)の値を示している。
Figure 0006009724
パラメータ(e)及び(g)の算出
ステップ506において、パラメータ(e)及び(g)を決定する。パラメータ(e)及び(g)は、2つのシグモイドの変曲点を定義している。1の態様においては、これらは、いずれも、すべての初期パラメータセットにおいて同一の値を取っている。パラメータ(e)及び(g)は、同一の又は異なる値を具備可能である。近似を見出すべく、ある態様においては、例えば、蛍光などの強度の平均値を上回る最初の点のx値を使用している(これは、スパイクではない)。この態様に従って(e)及び(g)の値を決定するプロセスが図7に示されており、これについては後述する。パラメータ(e)及び(g)並びにその他のパラメーターの値を決定するプロセスの更に詳細な説明は、US2007-0148632に見出すことができる。
図7を参照すれば、まず、曲線(例えば、蛍光強度)の平均値が決定される。次に、平均値を上回る最初のデータ点を同定する。次いで、
(a)その点が、曲線の開始点の近傍、例えば最初の5つのサイクル内に位置していないかどうか、
(b)その点が、曲線の終了点の近傍、例えば最後の5つのサイクル内に位置していないかどうか、及び
(c)その点の周辺(例えば、その周囲の2点の範囲における)導関数が符号の変化を示していないかどうか(示している場合には、その点は、スパイクである可能性が高く、従って、取り除く必要がある)、
が決定される。
次の表3は、1の態様に従って図6において使用されている初期パラメータの例を示す。
Figure 0006009724
図3を再度参照すれば、ステップ510においてすべてのパラメータの設定が完了したら、入力されたデータセット、関数、及びパラメータを使用して、LMプロセス520を実行する。伝統的に、Levenberg-Marquardt法は、非線形の最小二乗問題を解決するべく使用されている。従来のLM法においては、近似曲線とデータセット間の誤差の二乗の合計として定義された距離の尺度を算出している。しかしながら、二乗の合計を最小化する場合には、異常値の距離が非スパイクデータ点の距離よりも大きいため、異常値に対して大きな重みが付与され、この結果、しばしば、不適切な曲線又は望ましくない曲線が得られることになる。従って、本発明の1の態様によれば、絶対誤差の合計を極小化することにより、近似とデータセット間の距離を演算している(この場合には、異常値に対して、それほど大きな重みが付与されない)。この態様においては、近似とデータ間の距離は、次式によって与えられる:
Figure 0006009724
前述のように、1の態様においては、多数(例えば、3つの)の初期パラメータのセットの各々を入力及び処理し、そしてステップ522及び524に示されるように最良の結果が保持される。ここで、最良の結果とは、式(3)において、最も小さい又は最小の距離を提供するパラメータである。1の態様においては、パラメータの多くは、パラメーターの複数のセットにわたって一定に保持しいる。(c)、(d)、及び(f)のみが、パラメータの各セットについて異なってもよい。任意の数の初期パラメータセットが使用可能であることを理解されたい。
図8は、本発明によるパラメータのセットについてのLMプロセス520のプロセスフローを示している。前述のように、Levenberg-Marquardt法は、最急降下法又はGauss-Newton法のように動作可能である。この動作は、減衰係数λによって左右される。λが大きいほど、Levenberg-Marquardtアルゴリズムは、最急降下プロセスのように動作することになる。一方、λが小さいほど、Levenberg-Marquardtアルゴリズムは、Gauss-Newtonプロセスのように動作することになる。1の態様においては、0.001でλが開始している。λが、約0.000001〜約1.0などのその他の値において開始することも可能であることを理解されたい。
前述のように、Levenberg-Marquardt法は反復的な技法である。図8に示されているように、1の態様によれば、各反復において以下の内容が実行される。
1.先行する近似のヘッセ行列(H)を算出する。
2.先行する近似の転置ヤコビ行列(JT)を算出する。
3.先行する近似の距離ベクトル(d)を算出する。
4.現在の減衰係数λによりヘッセ行列の対角を拡大させる:
Figure 0006009724
5.拡大した式を解く:
Figure 0006009724
6.拡大した式の解xを関数のパラメータに加算する。
7.新しい近似と曲線間の距離を算出する。
8.この新しいパラメータセットとの距離が、以前のパラメータセットとの距離を下回っている場合には:
・その反復を成功であると見なし、
・新しいパラメータの組を保持又は保存し、
・例えば、係数10だけ減衰係数λを低減し、
この新しいパラメータセットとの距離が、以前のパラメータセットとの距離を上回っている場合には、
・その反復を不成功であると見なし、
・新しいパラメータの組を破棄し、
・例えば、係数10だけ、減衰係数λを増大させる。
1の態様においては、図8のLMプロセスは、次の基準の中の1つが実現されるまで反復される:
1.指定の反復回数Nだけ既に反復されている。この第1の基準により、アルゴリズムが無限に反復されることを防止している。例えば、図10に示されているある態様においては、既定の反復値Nは100である。収束が可能な場合には、100回の反復は、アルゴリズムが収束するのに十分なものであろう。一般に、Nは、10未満〜100超の範囲をとることができる。
2.2つの成功した反復の間の距離の差が、閾値(例えば、0.0001)を下回っている。差が非常に小さくなっている場合には、既に望ましい精度が実現された状態にあり、解は、それ以上、大幅に良好なものにはならないため、反復を継続するのは無意味である。
3.減衰係数λが、指定の値を上回っている(例えば、1020を上回っている)。λが非常に大きくなった場合には、アルゴリズムは、現在の解よりも良好には収束せず、従って、反復を継続するのは無意味である。一般に、指定値は、1020よりも十分に小さい又は大きいものであってもよい。
正規化
パラメーターを決定した後に、1の実施態様では、曲線は、1以上の決定されたパラメーターを用いて正規化される(ステップ130)。例えば、1の態様では、曲線は、正規化されるか、又は曲線の線形増殖部分を減算することにより、ゼロベースラインの傾きを有するように調節される。数学的には、これは以下のように示される:
Figure 0006009724
式中、dataNew(BLS)は、ベースラインを引いた後に正規化されたシグナル、例えば線形増殖又はベースラインの傾きが引き算されるか又は除かれたデータセット(データ)である。パラメーターa及びbの値は、曲線に回帰させるためにLM式を用いることにより決定された値であり、そしてxはサイクル数である。こうして、x軸にそった各データ値について、定数a+傾きb×x値が、当該データから引かれて、ゼロベースラインの傾きを具備したデータ曲線をもたらす。ある態様では、スパイク点は、LM回帰プロセスをデータセットに適用して正規化パラメーターを決定する前に、データセットから取り除かれる。
別の態様では、曲線は、以下の式に従ったゼロ傾きとなるように正規化又は調節されてもよい:
Figure 0006009724
式中、dataNEW(BLSD)は、ベースラインを引いた後の正規化されたシグナルを割ったものであり、例えば、線形増殖又はベースラインの傾きを引き算するか又は取り除き、そして結果をaで割ったデータセット(データ)である。パラメーターa及びbの値は、LM式を用いて曲線を回帰させることにより決定される値であり、そしてxはサイクル数である。こうして、x軸にそった全てのデータ値について、定数a及び傾きb×x値が当該データから引き算され、そして結果をパラメーターaの値で割って、ゼロベースライン傾きを具備するデータ曲線をもたらした。1の態様では、式(7a)は、パラメーター「a」≧1の場合妥当であり;パラメーター「a」<1の場合、以下の式を用いる:
Figure 0006009724
ある態様では、データセットにLM回帰プロセスを適用して、正規化パラメーターを決定する前に、スパイクポイントはデータから取り除かれる。
さらに別の態様では、曲線は、以下の式:
Figure 0006009724
にしたがって正規化又は調節することもできる。式中、dataNEW(BLD)は、ベースラインで割り算した後の正規化シグナル、例えばパラメーターaで割られたデータセット(データ)である。パラメーターa及びbの値は、LM式を用いて曲線へと回帰させることにより決定され値であり、そしてxはサイクル数である。1の態様では、式(8a)は、パラメーター「a」≧1の場合妥当であり、パラメーター「a」<1の場合以下の式:
Figure 0006009724
を使用する。
ある態様では、LM回帰プロセスをデータセットに適用して、正規化パラメーターを決定する前に、データセットからスパイクポイントを取り除く。
さらにべつの態様では、曲線は、以下の式:
Figure 0006009724
に従って正規化又は調節することもできる。式中、dataNew(PGT)は、ベースラインを減算して割算したのちの正規化シグナル、例えば線形増殖又はベースラインの傾きを引き算するか又は取り除き、そして結果をcで割ったデータセット(データ)である。パラメーターa、b及びcの値は、LM式を用いて曲線へと回帰させることにより決定した値であり、そしてxはサイクル数である。こうして、x軸に沿った各データ値について、定数aと傾きb×x値がデータから引き算され、そして結果がパラメータcの値により割られて、ゼロベースラインの傾きを具備するデータ曲線を与えた。1の態様では、式(9a)はパラメータ「c」≧1の場合妥当であり;パラメータ「c」<1及び「c」≧0の場合、以下の式:
Figure 0006009724
を用いる。
ある態様では、LM回帰プロセスをデータセットに適用して正規化パラメータを決定する前に、データセットからスパイクポイントが取り除かれる。
Levenberg-Marquardt又は他の回帰プロセスにより決定されるパラメーターを用いてベースラインを正規化及び/又は変更するために、他の正規化式を使用することができるということが、当業者に認められよう。
曲率決定
式(6)、(7)、(8)、又は(9)のうちの1つ、或いは他の正規化式を用いて、曲線を正規化した後に、Ct値を決定することができる。1の実施態様では、曲率決定プロセス又は方法を、図9を参照して説明される正規化曲線に適用する。図9は、動的PCR曲線におけるエルボー値又はCt値を決定するためのプロセスフローを示す。ステップ910では、当該データセットを取得する。サーモサイクラーなどのPCRデータ取得装置内に配置されたインテリジェンス・モジュール(例えば、指令を実行するプロセッサー)中で決定プロセスが実行する場合、当該データセットは、データを取得するとリアルタイムでインテリジェンス・モジュールにデータセットが提供されるか、又はデータセットはメモリーユニット又はバッファーに格納されて、そして実験が完了した後に当該モジュールへと提供されてもよい。同様に、データセットは、取得装置に対するネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接接続(例えば、USBやその他の直接的な有線又は無線接続)を介して、デスクトップコンピュータシステムなどの別個のシステムに提供することも可能であり、或いは、CD、DVD、フロッピー(登録商標)ディスク、又はこれらに類似したものなどの携帯型の媒体上において提供することも可能であろう。
データセットを受信又は取得した後に、ステップ920において、曲線への近似を決定する。このステップの間、1の実施態様では、Levenberg-Marquardtプロセスにより決定されるパラメーターを有するダブルシグモイド関数を用いて、データセットを表す曲線の近似を発見した。さらに、スパイクポイントは、図3を参照して記載されるように、ステップ920の前に、データセットから取り除くことができる。例えば、ステップ910において取得されるデータセットは、事前にスパイクが除去されているデータセットであってもよい。ステップ930において、曲線を正規化する。ある態様では、上記式(6)、(7)、(8)又は(9)のうちの一つを用いて曲線を正規化する。例えば、上記式(6)に記載されるようにベースライン傾きを引き算するためにステップ920で決定されるダブルシグモイド式のパラメーターを用いて、ベースラインをゼロスロープに設定することができる。ステップ940では、プロセスを正規化曲線へと適用して、正規化曲線に沿った点で曲率を決定する。曲率 対 サイクル数のプロットを返すことができ、及び/又は表示することができる。最大曲率の点は、エルボー又はCt値に対応する。ステップ950では、分析を行なうシステムへと、又は当該分析を要求する別のシステムへと結果を返す。ステップ960では、Ct値が表示される。全体のデータセット又は曲線近似などの追加データを表示することもできる。図9の分析を行なったシステムとつながれたモニター、スクリーン又はプリンターなどの表示装置に、グラフ表示が映されるか、又はデータは、表示装置上に映すための別のシステムへと提供されることもある。
1の実施態様では、この曲線についてCt値を得るために、最大曲率が決定される。1の態様では、曲率は正規化曲線上の幾つか又は全ての点について決定される。曲率対サイクル数のプロットが表示することができる。曲線の曲率は、以下の式:
Figure 0006009724
により与えられる。
円の半径aを考慮すると、以下の式:
Figure 0006009724
により与えられる。
式(11)の曲率は、kappa(x)=-(1/a)である。こうして、曲率の半径は、曲率の逆数の負の値である。円の半径aが定数であるので、その曲率は、-(1/ a)で与えられる。図10aのPCRデータセットのフィットについての曲率のプロットである図10bを検討する。Ct値は、最大曲率の位置で生じるとみなすことができ、これはサイクル数Ct=21.84で生じる。好ましくはこのCt値は、図10aに示されるPCR増殖曲線と比較される。
(21.84のCt値に対応する)最大曲率における曲率の半径は:半径=1/0.2818=3.55サイクルである。図10aのPCR増殖曲線に重ねあわされた半径の円が図11に示される。図11が、最大曲率に対応する半径の円は、PCR曲線の増殖領域の開示時点で重ねあわすことができる一方、曲線への接線が残る。曲率の小さい(最大)半径を有する曲線は、急勾配の増殖曲線を有する一方、曲率の大きい(最大)半径を有する曲線は、緩やかな増殖曲線を有することもある。曲率の半径がかなり大きいならば、明確なシグナルがない曲線、例えば僅かな増殖又は妥当でない増殖を指し示しうる。1の実施態様では、しかしながら、以下に詳細に記載されるように、データセットが有意又は妥当な増殖を示しているかを決定するために、増殖妥当性試験が提供される。データセットが統計的に有意な増殖を有すると発見されるならば、曲率分析アルゴリズムは、Ct値を決定するために適用することができる。そうでない場合、データセットが破棄されてもよく、及び/又は妥当でない増殖の表示が返される。
計算に必要とされる式(1)のダブルシグモイドの一次導関数及び二次導関数は以下に示される:
一次導関数:
Figure 0006009724
式(13)二次導関数:
Figure 0006009724
図12aは、増殖曲線について生データの例を示す。ダブルシグモイド/LM法を図12bに示される生データプロットに適用することは、以下の表4に示される式(1)の7個のパラメーターの値を与える。
Figure 0006009724
図12に示されるデータにフィットされたダブルシグモイドは、図13に示され、データポイントのかなり正確な評価を示す。次に、これらのデータを式(6)(ベースライン引き算)に従って正規化して、図14に示されるグラフをもたらす。図14に示される実線は、式(6)に従って正規化されたデータセットに対する式(I)のダブルシグモイド/LMの適用を示す。図15は、図14の正規化された曲線についての、曲率 対 サイクル数のプロットを示す。曲率の最大値は、曲率0.1378、サイクル数34.42で生じる。こうして、最大曲率でのサイクル数に基づいてCt=34.42であり、そして曲率の半径=1/0.1378=7.25である。当該曲率の半径を有する円と、正規化されたデータセットの重ね合わせを図16に示す。
「緩やかに増加する」データセットの例を図17に示す。このデータセットに対するダブルシグモイドのフィットは及びベースラインの減算(式6)を用いた正規化は、図18に示されるフィットの結果を与えた。対応する曲率プロットを図19に示す。サイクル数25.90、曲率=0.00109274(曲率半径=915に対応する)で最大曲率が生じる。この曲率の大きな半径は、緩やかな増殖データセットであるということを伝える。
別の例では、図20に示されるPCR増殖曲線のセットが考慮される。現在の方法(閾値)を用いて得られるCt値 対 ベースラインを引き算し割算した(BLSD-式7)後の曲率法を用いて取得されたCt値の比較が、以下の表5に示される。
Figure 0006009724
表5は、Ct値を計算する曲率法(この場合、BLSDで正規化した後である)は、現剤の閾値法よりも小さいCv(バリエーション係数)を与える。さらに、曲率法を用いて計算された曲率半径(ROC)は、曲線が線形曲線であるか、又は真の増殖曲線であるかを示唆する単純な方法を提供する。
増殖妥当性試験
曲率が存在するためには、PCRシグナルは、高次多項式(一般的には、上記のように7次以上(a power of 7 or higher))により表すことができなければならない。そうでなければ、シグナルは、以下の式:
Figure 0006009724
の一次又は二次の多項式により表すことができ(例えば、R2≧0.90)、次にこのようなシグナルについて曲率が、1の態様では、以下のように決定される:
(1)式(14)からベースラインの引き算を行い、以下の式(15):
Figure 0006009724
をもたらし:
(2)式(15)についての曲率を、以下の式(16):
Figure 0006009724
として与え;
(3)この曲率関数(式16)は、x=0で最大値を有し、その結果二次関数への優れた曲線フィットを有するPCRシグナルについての規定のエルボー値が存在しないということを示唆する。こうして、1の実施態様では、データセットが、統計的に有意なマージンで1次又は2次多項式にフィットするならば、当該データセットは有意な増殖を欠いていると決定される。
1の実施態様では、増殖プロセスについてのデータセットは、当該データが有意な増殖を示すかを決定するために処理される。最初は、当該データにフィットする1次又は2次多項式曲線が計算され(例えば、式(14))、そして次に統計的に有意な値が曲線フィットについて測定される。ある態様では、統計的に有意な値はR2値である。統計的に有意な値が、閾値を超えない場合、当該データセットは、統計的に有意であるか又は有効な増殖を示すことが判断され、そして当該データセットはさらに処理されて、例えばCt値を決定する。1の態様では、R2閾値は約0.90であり;R2が0.90を超えている場合、当該データセットは、有効ではない(例えば、有意な増殖ではない)と判断される。別の態様では、R2閾値は0.99である。R2閾値が、約0.90〜0.99で設定されるか、又は閾値が0.99を超えるか、又は0.90未満であることがあるということが認められるべきである。統計的に有意な値は、閾値を超える場合、データセットは有意ではなく、又は有効ではない増殖を示すと判断される。当該データセットが有意な増殖を有さないということを示すメッセージが返されてもよいし、及び/又は当該データセットが破棄されてもよい。
図21は、標的を含まないリアルタイムPCRデータシグナルを示し、そしてこれは許容される範囲でベースラインインターセプト、傾き及びAFI値を具備する。式(10)、(12)、及び(13)の曲率アルゴリズムは、当該Ct値が12.94であることを指し、そして(最大)曲率半径(ROC)が481であるということを指す。増殖妥当性試験が適用された場合、当該データは、不十分な増殖又は不十分な曲率を有する決定され、当該シグナルが、統計的に意味ある値が閾値を超える、例えばR2>0.90である1次又は2次多項式にフィットすることを意味する。
図22は、481のROCを有する別のリアルタイムPCRデータシグナルを示す。R2値は、閾値、例えば0.99よりもずっと小さく、当該プロセスはCt値の計算を続ける。式(10)、(12)、及び(13)の曲率アルゴリズムは、曲率の最大半径、及びCt値が、サイクル38.7で生じることを示す。図21を図22と比較すると、ROC値のみについての知識では、曲線が有効な増殖を示すかを同定するには不十分であるということが明らかである。ここで、両方のシグナルは、同じ最大ROCを有しているが、一方は有効な増殖を有するが、もう一方は有効な増殖を有さない。
図23は、別のリアルタイムPCRシグナルを示す。ROCアルゴリズムを適用して、Ct値を決定することにより、サイクル30.3にて(最大)ROC71でCt値を与える。増殖妥当性試験を適用することにより、有意でなく又は有効ではない増殖であるということが示される。こうして、このかなり低い(最大)ROCでシグナルは妥当ではなく、低い(最大)ROCがそれ自身、曲線が有効でないと宣言するために不十分であるということを示す。
曲線フィット及び曲率決定プロセスを含む増殖妥当性試験及びCt決定プロセスが、コンピューターシステムのプロセッサ上で走らされるコンピューターコードで実行されることがある。当該コードは、増殖妥当性Ct決定プロセスのさまざまな態様及びステップを実行するためにプロセッサーを制御する指令を含む。コードは典型的にハードディスク、RAM、又はポータブルメディア、例えばCD、DVDなどに一般的に格納されている。同様に、当該プロセスは、プロセッサーにつながれたメモリーユニットに格納された指令を実行するプロセッサーを含むサーモサイクラーなどのPCR装置中で実行される。このような指令を含むコードは、ネットワーク接続又はコードソースへの直接接続を介して、又は周知のようにポータブルメディアを用いてPCR装置のメモリーユニットにダウンロードされてもよい。
本発明のエルボー決定プロセスが、C、C++、C#、Fortran、VisualBasicなどの様々なプログラミング言語、並びにデータの可視化及び分析に有用なプレパッケージングルーチン、関数、及び分析を提供する数学などの適用を用いてコードすることができる。後者の別の例は、MATLAB(登録商標)である。
本発明が、例示の方法で記載され、そして具体的実施態様の点で記載されてきたが、本発明が開示された実施態様に限定されるものではないということを理解されたい。反対に、当業者に明らかであるさまざまな変更及び同等のアレンジをカバーすることが意図される。その結果、添付の特許請求の範囲は、このような変更及び同等のアレンジのすべてを包含するように、最も広い解釈に従うべきである。
図1は、蛍光強度 対 サイクル数としてプロットされた一般的なPCR増殖曲線の例を指す。 図2は、増殖曲線のベースライン領域の末端、又はPCR曲線のCt値を決定するためのプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図3は、本発明の1の実施態様に従ったスパイク同定及び置換プロセスの詳細なプロセスフローを示す。 図4は、パラメーター(a)-(g)を含むダブルシグモイド方程式の分離を示す。 図5は、曲線についてのパラメーター(d)の影響、及び位置(e)、変曲点のx値を示す。図5の全ての曲線は、パラメーター(d)を除く同じパラメーター値を有する。 図6は、異なるパラメーターセットについての3個の曲線形状の例を示す。 図7は、1の態様に従ったダブルシグモイド方程式パラメーター(e)及び(g)の値を決定するプロセスを示す。 図7は、1の態様に従ったダブルシグモイド方程式パラメーター(e)及び(g)の値を決定するプロセスを示す。 図8は、パラメーターの初期セットについてのLevenberg-Marquardt回帰プロセスのプロセスフローを示す。 図8は、パラメーターの初期セットについてのLevenberg-Marquardt回帰プロセスのプロセスフローを示す。 図8は、パラメーターの初期セットについてのLevenberg-Marquardt回帰プロセスのプロセスフローを示す。 図8は、パラメーターの初期セットについてのLevenberg-Marquardt回帰プロセスのプロセスフローを示す。 図9は、1の実施態様に従ったPCRプロセスについてのエルボー値を決定するためのより詳細なプロセスフローを示す。 図10aは、ダブルシグモイドを用いて実験データにフィットさせた典型的な増殖曲線を示し、図10bは、図10aのダブルシグモイド曲線の曲率のプロットを示す。 図11は、図10aの増殖曲線において重ねあわされた最大曲率点で接する円を示す。 図12aは、増殖曲線について記載されるデータセットの例を示す。 図12bは、図12aのデータセットのプロットを示す。 図13は、図12のデータセットにフィットするダブルシグモイドを示す。 図14は、方程式(6)のベースライン・サブトラクション法を用いて正規化したのちの、図12(図13)のデータセット(及びダブルシグモイドフィット)を示す。 図15は、図14の正規化データセットについての曲率 対 サイクル数のプロットを示す。 図16は、曲率の最大半径を有する円と、図15の正規化されたデータセットの重ね合わせを示す。 図17は、「ゆっくり-増殖(slow glower)」データセットの例を示す。 図18は、図17のデータセット、並びに方程式(6)のベースラインサブトラクション法を用いて正規化した後のダブルシグモイドフィットを示す。 図19は、図18の正規化データセットの曲率 対 サイクル数のプロットを示す。 図20は、複製実行及び陰性サンプルを含む、PCR増殖曲線のセットのプロットを示す。 図21は、標的を含まないリアルタイムPCRデータシグナルを示し、そしてこれは許容される範囲で、ベースラインインターセプト、傾き、及びAFI値を有する。 図22は、図21のシグナルと同じ(最大)半径の曲率を有するリアルタイムPCRデータシグナルを示す。 図23は、小さい(最大)半径の曲率を有するリアルタイムPCRシグナルを示す。 図24は、ソフトウェアとハードウェア資源との間の関係を説明する一般的なブロック図を示す。

Claims (8)

  1. ポリメラーゼ連鎖反応(PCR)プロセスについてのデータが、有意な増幅を示すかを決定する方法であって、当該方法が以下の:
    ポリメラーゼ連鎖反応プロセスを示すデータセットを受容し、ここで当該データセットは複数のデータポイントを含み各データポイントが座標値の対を有し;
    上記データセットを、以下の式:
    Figure 0006009724
    で表される次多項式にフィットさせることにより、曲線を計算し;
    上記曲線について統計的に有意な値を決定し、ここで当該統計的に有意な値が、R2値であり;
    上記有意な値が閾値の約0.90を超えるかを決定し;
    閾値を超えない場合、上記データセットをさらに処理し;そして
    閾値を超える場合、上記データセットが有意な増殖を有しないと示すか、及び/又は当該データセットを破棄する
    を含む、前記方法。
  2. 前記データセットを処理することが、PCRデータセットのサイクル閾値(Ct)を決定することをさらに含む、請求項1に記載の方法。
  3. 前記Ct値の決定が、以下の:
    Levenberg-Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して当該関数のパラメーターを決定することにより、前記データセットにフィットする曲線の近似を計算し;
    上記決定されたパラメータを用いて曲線を正規化して、正規化された曲線をもたらし;そして
    上記正規化された曲線を処理して、最大曲率の点を決定し、ここで当該最大曲率の点が、PCR曲線のCt値を表す
    を含む、請求項2に記載の方法。
  4. 前記データセットにフィットする曲線を計算する前に、当該データセットを正規化することをさらに含む、請求項1〜3のいずれか一項に記載の方法。
  5. ポリメラーゼ連鎖反応(PCR)プロセスについてのデータが、有意な増幅を示すかを決定するためにプロセッサーを制御するコードを含むコンピューターが読み取り可能な媒体であって、当該コードが以下の指令:
    ポリメラーゼ連鎖反応(PCR)プロセスを示すデータセットを受容し、当該データセットは複数のデータポイントを含み、各データポイントが、座標値の対を有し;
    上記データセットを以下の式:
    Figure 0006009724
    で表される次多項式にフィットさせることにより、曲線を計算し;
    上記曲線について統計的に有意な値を決定し、ここで当該統計的に有意な値が、R2値であり;
    上記有意な値が閾値の約0.90を超えるかを決定し;そして
    閾値を超えない場合、上記データセットをさらに処理し;そして
    閾値を超える場合、上記データセットが有意な増殖を有さないということを示すか及び/又は当該データセットを破棄する
    を含む、前記媒体。
  6. 動的ポリメラーゼ連鎖反応(PCR)システムであって、以下の:
    動的PCR増幅曲線を表すPCRデータセットを作成する動的PCR分析モジュール、ここで当該データセットは、複数のデータポイントを含み、各々は座標値の対を有し;及び
    以下の:
    上記PCRデータセットを以下の式:
    Figure 0006009724
    で表される次多項式にフィットさせることにより、曲線を計算し、
    上記曲線について統計的に有意な値を決定し、ここで当該統計的に有意な値が、R2値であり;
    上記値が閾値の約0.90を超えるかを決定し;そして
    閾値を超えない場合、上記PCRデータセットをさらに処理し;そして
    閾値を超える場合、上記PCRデータセットが有意な増殖を有さないということを示すか、及び/又は当該PCRデータセットを破棄する
    ことにより、PCRデータセットを処理して、PCRデータセットが有意な増殖を示すかを決定するように適用されたインテリジェンス・モジュール
    を含む、動的ポリメラーゼ連鎖反応(PCR)システム。
  7. 前記データセットが、PCRデータセットのサイクル閾値(Ct)値を決定することをさらに含む、請求項6に記載のPCRシステム。
  8. 前記Ct値の決定が、以下の:
    Levenberg-Marquardt(LM)回帰プロセスを適用することによりデータセットをダブルシグモイド関数にフィットさせて、当該関数のパラメータを決定する曲線の近似を計算し;
    上記決定されたパラメーターを用いて曲線を正規化して、正規化曲線をもたらし;そして
    上記正規化された曲線を処理して、最大曲率の点を決定し、ここで最大曲率の点が、PCR曲線のCt値を表す
    を含む、請求項7記載のPCRシステム。
JP2008242813A 2007-09-25 2008-09-22 ダブルシグモイドの曲率解析のためのクアドランティック検定を用いたpcrエルボーの決定 Active JP6009724B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/861,188 US20090119020A1 (en) 2007-09-25 2007-09-25 Pcr elbow determination using quadratic test for curvature analysis of a double sigmoid
US11/861,188 2007-09-25

Publications (3)

Publication Number Publication Date
JP2009080811A JP2009080811A (ja) 2009-04-16
JP2009080811A5 JP2009080811A5 (ja) 2011-10-13
JP6009724B2 true JP6009724B2 (ja) 2016-10-19

Family

ID=40475156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008242813A Active JP6009724B2 (ja) 2007-09-25 2008-09-22 ダブルシグモイドの曲率解析のためのクアドランティック検定を用いたpcrエルボーの決定

Country Status (6)

Country Link
US (1) US20090119020A1 (ja)
EP (1) EP2107470B1 (ja)
JP (1) JP6009724B2 (ja)
CN (1) CN101526476B (ja)
CA (1) CA2639714A1 (ja)
HK (1) HK1133697A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374795B2 (en) 2008-05-13 2013-02-12 Roche Molecular Systems, Inc. Systems and methods for step discontinuity removal in real-time PCR fluorescence data
US8219366B2 (en) * 2009-08-26 2012-07-10 Roche Molecular Sytems, Inc. Determination of elbow values for PCR for parabolic shaped curves
US11072821B2 (en) 2009-09-12 2021-07-27 Azure Vault Ltd. Identifying transition points in chemical reactions
US9043249B2 (en) 2009-11-22 2015-05-26 Azure Vault Ltd. Automatic chemical assay classification using a space enhancing proximity
US8666673B2 (en) 2010-05-14 2014-03-04 Biomerieux, Inc Identification and/or characterization of a microbial agent using taxonomic hierarchical classification
US9988675B2 (en) 2011-03-15 2018-06-05 Azure Vault Ltd. Rate based identification of reaction points
US8738303B2 (en) 2011-05-02 2014-05-27 Azure Vault Ltd. Identifying outliers among chemical assays
US8660968B2 (en) 2011-05-25 2014-02-25 Azure Vault Ltd. Remote chemical assay classification
US20130096845A1 (en) 2011-10-14 2013-04-18 Ze'ev Russak Cumulative differential chemical assay identification
US10475527B2 (en) 2012-03-22 2019-11-12 Biomerieux, Inc. Method and system for detection of microbial growth in a specimen container
US10176293B2 (en) 2012-10-02 2019-01-08 Roche Molecular Systems, Inc. Universal method to determine real-time PCR cycle threshold values
US9607128B2 (en) 2013-12-30 2017-03-28 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time PCR signals
US10519759B2 (en) 2014-04-24 2019-12-31 Conocophillips Company Growth functions for modeling oil production
JP7493300B2 (ja) * 2017-06-27 2024-05-31 東洋紡株式会社 解析用プログラムおよび解析装置
JP7012151B2 (ja) * 2017-09-28 2022-01-27 シージーン アイエヌシー 試料内ターゲット分析物を分析する方法及び装置
DE102020202363A1 (de) * 2020-02-25 2021-08-26 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur Durchführung eines qPCR-Verfahrens
EP4421814A1 (en) 2021-10-21 2024-08-28 Seegene, Inc. Device and method for reading positive/negative with respect to target assay substance in sample
CN116473512B (zh) * 2023-03-22 2024-05-03 上海交通大学 一种动物循环系统中外泌体的监测装置及监测方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2257109C (en) 1996-06-04 2009-10-06 University Of Utah Research Foundation Monitoring hybridization during pcr
JP4281877B2 (ja) 1996-06-04 2009-06-17 ユニバーシティ オブ ユタ リサーチ ファウンデーション 生物学的プロセスを実行し且つモニタリングするためのシステムと方法
US7228237B2 (en) * 2002-02-07 2007-06-05 Applera Corporation Automatic threshold setting and baseline determination for real-time PCR
ATE384139T1 (de) * 2002-02-12 2008-02-15 Univ Utah Res Found Multi-test-analyse von echzeit- nukleinsäureamplifikationen
US20060009916A1 (en) * 2004-07-06 2006-01-12 Xitong Li Quantitative PCR data analysis system (QDAS)
CA2603389C (en) * 2005-05-13 2012-07-10 Bio-Rad Laboratories, Inc. Identifying statistically linear data
WO2007035806A2 (en) * 2005-09-20 2007-03-29 University Of Utah Research Foundation Melting curve analysis with exponential background subtraction
EP1798650A1 (en) * 2005-12-19 2007-06-20 Roche Diagnostics GmbH Analytical method and instrument
US7668663B2 (en) * 2005-12-20 2010-02-23 Roche Molecular Systems, Inc. Levenberg-Marquardt outlier spike removal method
US7844403B2 (en) * 2005-12-20 2010-11-30 Roche Molecular Systems, Inc. Temperature step correction with double sigmoid Levenberg-Marquardt and robust linear regression
EP1804172B1 (en) * 2005-12-20 2021-08-11 Roche Diagnostics GmbH PCR elbow determination using curvature analysis of a double sigmoid
US7680868B2 (en) * 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization

Also Published As

Publication number Publication date
CN101526476B (zh) 2013-11-13
CA2639714A1 (en) 2009-03-25
HK1133697A1 (en) 2010-04-01
EP2107470A3 (en) 2017-09-06
EP2107470A2 (en) 2009-10-07
CN101526476A (zh) 2009-09-09
EP2107470B1 (en) 2023-08-30
US20090119020A1 (en) 2009-05-07
JP2009080811A (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
JP6009724B2 (ja) ダブルシグモイドの曲率解析のためのクアドランティック検定を用いたpcrエルボーの決定
JP4634365B2 (ja) ダブルシグモイドの曲率分析を使用したpcrのエルボー決定
JP4718432B2 (ja) Levenberg−Marquardtアルゴリズムと正規化を伴うダブルシグモイド関数の曲線フィットを使用したPCRのエルボー判定
JP4662911B2 (ja) ダブルシグモイドLevenberg−Marquardt及びロバスト線形回帰による温度ステップの補正
US7991562B2 (en) PCR elbow determination using curvature analysis of a double sigmoid
JP5558762B2 (ja) 方程式のないアルゴリズムによるリアルタイムpcrエルボーの呼び出し
JP4354961B2 (ja) 回転変換によるpcrのエルボー決定
US7668663B2 (en) Levenberg-Marquardt outlier spike removal method
JP5599986B2 (ja) リアルタイムpcr蛍光データ内のステップ型不連続部除去用のシステム及び方法
EP2471007B1 (en) Determination of elbow values for pcr for parabolic shaped curves

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110831

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130704

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140325

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160915

R150 Certificate of patent or registration of utility model

Ref document number: 6009724

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250