JP6431076B2 - リアルタイムpcr信号におけるジャンプの検出及び補正 - Google Patents

リアルタイムpcr信号におけるジャンプの検出及び補正 Download PDF

Info

Publication number
JP6431076B2
JP6431076B2 JP2016543190A JP2016543190A JP6431076B2 JP 6431076 B2 JP6431076 B2 JP 6431076B2 JP 2016543190 A JP2016543190 A JP 2016543190A JP 2016543190 A JP2016543190 A JP 2016543190A JP 6431076 B2 JP6431076 B2 JP 6431076B2
Authority
JP
Japan
Prior art keywords
value
data set
jump
amplification
derivative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016543190A
Other languages
English (en)
Other versions
JP2017509040A (ja
Inventor
ティー.カーニック ロナルド
ティー.カーニック ロナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2017509040A publication Critical patent/JP2017509040A/ja
Application granted granted Critical
Publication of JP6431076B2 publication Critical patent/JP6431076B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Signal Processing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

本開示は、一般に、サンプルの増幅プロセス(例えば、PCR又はバクテリア増幅プロセス)から結果的に得られるデータを処理するシステム及び方法に関し、更に詳しくは、ジャンプエラーを検出するシステム及び方法に関する。
ポリメラーゼ連鎖反応(Polymerase Chain Reaction:PCR)は、定義された核酸配列を酵素によって合成又は増幅する体外法である。この反応は、通常、反対側のストランドに交雑すると共に増幅対象のテンプレート又はターゲットDNA配列の側面に位置する2つのオリゴヌクレオチドプライマを使用する。プライマの伸長は、熱安定DNAポリメラーゼの触媒作用による。テンプレート変性、プライマのアニーリング、及びアニーリングされたプライマのポリメラーゼによる伸長を伴う反復的な一連のサイクルは、特定のDNA断片の指数的蓄積を提供する。通常、増幅プロセスの検出及び定量化を促進するためのプロセスにおいて、蛍光プローブ又はマーカーが使用されている。
具体的には、均質であると共に分析のために増幅開始後の試薬の追加や反応の物理的サンプリングを必要としていない蛍光法が魅力的である。例示用の均質な技法は、対象の領域を見出すべくオリゴヌクレオチドプライマを使用し、且つ、信号生成のために蛍光ラベル又は色素を使用している。通常のPCRに基づいた方法は、電子対を共有する蛍光によってラベル付与されたオリゴヌクレオチドプローブの代わりに、2つの相互作用する発色団を有するFRETオリゴヌクレオチドプローブ(隣接交雑プローブ、TaqManプローブ、分子ビーコン、Scorpion)、1つの発蛍光団のみを有する単一オリゴヌクレオチドプローブ(非特許文献1)、及びdsDNA色素を使用する技法(例えば、SYBR Green 1)を使用している。PCRにおいてすべての二本鎖(ds)DNAに結合するDNA結合色素は、結合の際に色素の蛍光発光を生成する。このため、PCRの際のDNA生成物の増大は、従って、蛍光強度の増大をもたらし、且つ、これをそれぞれのサイクルにおいて計測することにより、DNA濃度の定量化が可能となる。但し、潜在的な欠点は、正確な定量化に影響を及ぼすすべてのdsDNAのPCR生成物に対する非特異的な結合である。希釈標準(standard dilution)を参照することにより、PCRにおけるdsDNA濃度を判定することができる。
蛍光レポータプローブは、特定のプローブが結合するDNA配列のみを検出し、且つ、従って、特異性を大幅に増大させる。この結果、非特異的DNA増幅が存在する場合にも、増幅生成物の定量化が可能となる。同一の反応におけるいくつかのターゲットの検出のために、蛍光プローブを複合的な分析において使用することが可能であり、この場合には、異なる色のラベルを有する特定のプローブが、それぞれのターゲットごとに使用される。又、蛍光レポータプローブの特異性は、増幅における望ましくない副産物であるプライマダイマによって生成される計測の干渉をも防止する。大部分の用途は、1つ又は複数のプローブに結合する蛍光レポータ化合物及び蛍光発光のクエンチャの相互作用に基づいている。レポータとクエンチャ化合物が近接した状態にある限り、励起源(例えば、レーザー、LED、及びこれらに類似したもの)による励起の際に、基底蛍光発光のみが検出されうる。増幅が発生したら、レポータとクエンチャ化合物の相互作用は、中断され、これにより、検出可能な蛍光信号がもたらされる。それぞれのPCRサイクルにおいて増幅される生成物の増大は、レポータとクエンチャ化合物の相互作用の減少に起因し、蛍光発光の比例した増大を生成する。一般に、蛍光発光は、それぞれの増幅サイクルにおいて検出及び計測され、且つ、生成物の指数的増大に対応したその幾何学的増大は、それぞれの反応における閾値サイクル(CT)を判定するべく、使用される。
図1Aには、通常の動的PCR曲線が示されており、通常のPCRプロセスの場合には、蛍光強度値がサイクル数に照らしてプロットされる。このケースにおいては、PCR生成物の形成が、PCRプロセスのそれぞれのサイクルにおいて監視される。増幅は、通常、サーモサイクラ内において計測され、サーモサイクラは、増幅反応の際に蛍光信号を計測するコンポーネント及び装置を含む。このようなサーモサイクラの一例は、Roche Diagnostics LightCycler (Cat. No. 20110468)である。増幅生成物は、例えば、ターゲット核酸に結合した際にのみ蛍光信号を放出する蛍光によってラベル付与された交雑プローブにより、検出され、或いは、特定のケースにおいては、二本鎖DNAに結合する蛍光色素によっても、検出される。
但し、データ内においてエラーが発生し、これにより、データの分析における、並びに、分析から結果的に得られる物理的特性(例えば、出発物質の定量化)における、エラーが発生する可能性がある。エラーの1つの特定のタイプが、ジャンプエラーである。これらのジャンプの原因は、気泡、カバーフィルム上の液滴、変化したメニスカス、微粒子、熱、又はその他の問題に起因したものであってもよい。
G−quenching probes, Crockett, A. O. and C. T. Wittwer, Anal. Biochem. 2001; 290: 89−97 and SimpleProbes, Idaho Technology
従って、増幅プロセスからのデータにおいてジャンプエラーを検出し、且つ、これらのジャンプエラーを潜在的に補正するシステム及び方法を提供することが望ましい。
増幅プロセスからのデータにおいてジャンプエラーを検出し、且つ、これらのジャンプエラーを潜在的に無効化又は補正するシステム、方法、及び装置が提供される。実施形態は、データセットの二次導関数を判定し、且つ、二次導関数における反対の符号を有する2つの連続的なサイクルを識別することにより、ジャンプエラーを識別することができる。ジャンプエラーが検出されたら、データセットは、様々な基準に基づいて無効化又は補正することができる。無効化するのか又は補正するのかは、絶対的なジャンプの高さ、相対的なジャンプの高さ(例えば、正味の増幅との関係における又はベースラインとの関係における高さ)、ジャンプの絶対的な場所(サイクル数)、或いは、相対的な場所(例えば、ベースライン又は指数フェーズなどの増幅曲線の領域との関係における場所)に基づいてもよい。一実装形態においては、ジャンプは、ジャンプの高さをジャンプの後のポイントから減算することにより、或いは、ジャンプの高さをジャンプの前のポイントに加算することにより、補正することができる。その他の実施形態は、本明細書において記述されている方法と関連するシステム及びコンピュータ可読媒体を対象としている。
本発明の一態様においては、増幅プロセスの増幅曲線におけるジャンプエラーを検出する方法が提供される。この場合に、方法は、コンピュータシステムにおいて、増幅曲線を表すデータセットを受け取るステップであって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、コンピュータシステムにより、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、を有する。いくつかの実施形態においては、方法は、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているかどうかを判定するステップを更に有し、この場合に、ジャンプエラーが発生したという識別は、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているという判定に基づいている。特定の実施形態においては、閾値は、第1値及び第2値が、二次導関数のその他の値との関係において最大の大きさを有するかどうかを試験している。いくつかの実施形態においては、閾値は、既定の値である。いくつかの実施形態においては、第1値は、正であり、且つ、第2値は、負である。いくつかの実施形態においては、方法は、ジャンプエラーの1つ又は複数の特性を判定するステップと、ジャンプエラーの1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、データセットを無効化するステップと、を更に有する。特定の実施形態においては、1つ又は複数の無効化規準は、第1値及び/又は第2値の大きさとジャンプエラーの場所のうちの少なくとも1つを含む。一実施形態においては、第1値及び/又は第2値の大きさは、データセットのベースライン又は正味の増幅との関係における大きさである。別の実施形態においては、ジャンプエラーの場所は、増幅曲線の領域の場所との関係における場所である。いくつかの実施形態においては、方法は、ジャンプエラーについてデータセットを補正するステップを更に有する。一実施形態においては、方法は、ジャンプエラーの1つ又は複数の特性を判定するステップを更に有し、この場合に、データセットは、ジャンプエラーの1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、補正される。特定の実施形態においては、1つ又は複数の補正基準は、第1値及び/又は第2値の大きさとジャンプエラーのサイクル数のうちの少なくとも1つを含む。別の実施形態においては、方法は、関数を補正済みのデータセットにフィッティングするステップと、フッティングされた関数を分析して増幅プロセスの特性を判定するステップと、を更に有する。更に別の実施形態においては、データセットを補正するステップは、ジャンプエラーの場所Xを識別するステップと、ジャンプエラーの高さを判定するステップと、大きさを使用してジャンプエラーの前のサイクル数の信号強度を補正するか又はジャンプエラーの後のサイクル数のデータセットを補正するステップと、を含む。特定の実施形態においては、データセットを補正するステップは、1つだけ少ないサイクル数に対応するように、X+2を上回るサイクル数の信号強度の値をシフトさせるステップを更に含む。いくつかの実施形態においては、方法は、ジャンプエラーを識別した後に、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するその他の場所についてデータセットをサーチするステップを更に有する。
別の態様においては、本発明は、実行された際に、増幅プロセスの増幅曲線においてジャンプエラーを検出するように、コンピュータシステムを制御する複数の命令を保存した一時的ではないコンピュータ可読媒体を有するコンピュータプロダクトに関し、命令は、増幅曲線を表すデータセットを受け取るステップであって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、を有する。いくつかの実施形態においては、命令は、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているかどうかを判定するステップを更に有し、この場合に、ジャンプエラーが発生したという識別は、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているという判定に基づいている。特定の実施形態においては、閾値は、第1値及び第2値が、二次導関数のその他の値との関係において最大の大きさを有するかどうかを試験している。いくつかの実施形態においては、閾値は、既定の値である。いくつかの実施形態においては、第1値は、正であり、且つ、第2値は、負である。いくつかの実施形態においては、命令は、ジャンプエラーの1つ又は複数の特性を判定するステップと、ジャンプエラーの1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、データセットを無効化するステップと、を更に有する。特定の実施形態においては、1つ又は複数の無効化規準は、第1値及び/又は第2値の大きさとジャンプエラーの場所のうちの少なくとも1つを含む。一実施形態においては、第1値及び/又は第2値の大きさは、データセットのベースライン又は正味の増幅との関係における大きさである。別の実施形態においては、ジャンプエラーの場所は、増幅曲線の領域の場所との関係における場所である。いくつかの実施形態においては、命令は、ジャンプエラーについてデータセットを補正するステップを更に有する。一実施形態においては、命令は、ジャンプエラーの1つ又は複数の特性を判定するステップを更に有し、この場合に、データセットは、ジャンプエラーの1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、補正される。特定の実施形態においては、1つ又は複数の補正基準は、第1値及び/又は第2値の大きさとジャンプエラーのサイクル数のうちの少なくとも1つを含む。別の実施形態においては、命令は、関数を補正済みのデータセットにフィッティングするステップと、フィッティングされた関数を分析して増幅プロセスの特性を判定するステップと、を更に有する。更に別の実施形態においては、データセットを補正するステップは、ジャンプエラーの場所Xを識別するステップと、ジャンプエラーの高さを判定するステップと、大きさを使用してジャンプエラーの前のサイクル数の信号強度を補正するか又はジャンプエラーの後のサイクル数のデータセットを補正するステップと、を含む。特定の実施形態においては、データセットを補正するステップは、1つだけ少ないサイクル数に対応するように、X+2を上回るサイクル数の信号強度の値をシフトさせるステップを更に含む。いくつかの実施形態においては、命令は、ジャンプエラーを識別した後に、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するその他の場所についてデータセットをサーチするステップを更に有する。
別の態様においては、本発明は、ポリメラーゼ連鎖反応(PCR)システムに関し、システムは、PCR増幅曲線を表すPCRデータセットを生成するPCRデータ取得装置であって、前記データセットは、複数のデータポイントを含み、これらのデータポイントのそれぞれは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、装置と、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得し、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別し、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定し、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別することにより、PCRデータセットを処理してジャンプエラーを検出するように適合されたインテリジェントモジュールと、を有する。いくつかの実施形態においては、インテリジェントモジュールは、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているかどうかを判定するように更に適合されており、この場合に、ジャンプエラーが発生したという識別は、第1値及び第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているという判定に基づいている。特定の実施形態においては、閾値は、第1値及び第2値が、二次導関数のその他の値との関係において最大の大きさを有するかどうかを試験している。いくつかの実施形態においては、閾値は、既定の値である。いくつかの実施形態においては、第1値は、正であり、且つ、第2値は、負である。いくつかの実施形態においては、インテリジェントモジュールは、ジャンプエラーの1つ又は複数の特性を判定し、且つ、ジャンプエラーの1つ又は複数の特性が1つ又は複数の無効化規準を充足している際にデータセットを無効化するように更に適合されている。特定の実施形態においては、1つ又は複数の無効化規準は、第1値及び/又は第2値の大きさとジャンプエラーの場所のうちの少なくとも1つを含む。一実施形態においては、第1値及び/又は第2値の大きさは、データセットのベースライン又は正味の増幅との関係における大きさである。別の実施形態においては、ジャンプエラーの場所は、増幅曲線の領域の場所との関係における場所である。いくつかの実施形態においては、インテリジェントモジュールは、ジャンプエラーについてデータセットを補正するように更に適合されている。一実施形態においては、インテリジェントモジュールは、ジャンプエラーの1つ又は複数の特性を判定するように更に適合されており、この場合に、データセットは、ジャンプエラーの1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、補正される。特定の実施形態においては、1つ又は複数の補正基準は、第1値及び/又は第2値の大きさとジャンプエラーのサイクル数のうちの少なくとも1つを含む。別の実施形態においては、インテリジェントモジュールは、関数を補正済みのデータセットにフィッティングし、且つ、フィッティングされた関数を分析して増幅プロセスの特性を判定するように、更に適合されている。更に別の実施形態においては、データベースを補正するステップは、ジャンプエラーの場所Xを識別するステップと、ジャンプエラーの高さを判定するステップと、大きさを使用してジャンプエラーの前のサイクル数の信号強度を補正するか又はジャンプエラーの後のサイクル数のデータセットを補正するステップと、を含む。特定の実施形態においては、データセットを補正するステップは、1つだけ少ないサイクル数に対応するように、X+2を上回るサイクル数について信号強度の値をシフトさせるステップを更に含む。いくつかの実施形態においては、インテリジェントモジュールは、ジャンプエラーの識別の後に、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するその他の場所についてデータセットをサーチするように更に適合されている。
以下の詳細な説明及び添付の図面を参照することにより、本発明の特性及び利点に関する更に十分な理解を得ることができる。
図1Aは蛍光強度対サイクル数としてプロットされた通常のPCR増幅曲線の一例を示す。図1Bは本発明の実施形態による模擬リアルタイムPCR曲線である。 図2Aは増幅プロセスからのデータのプロット200を示しており、この場合に、データは、ジャンプエラーを示している。図2Bは本発明の実施形態による増幅曲線の二次導関数のプロット250を示す。 本発明の実施形態による増幅プロセスの増幅曲線においてジャンプエラーを検出する方法300のフローチャートである。 図4Aはその他の点においてはフラットである信号においてジャンプを有する実際のリアルタイムPCRデータを示す。図4Bは図4Aからのデータの二次導関数を示す。 図5Aは指数フェーズ領域の末尾の近傍においてジャンプを有する実際のリアルタイムPCRデータを示す。図5Bは図5Aからのデータの二次導関数を示す。 図6Aは指数フェーズ領域の末尾の近傍において大きなジャンプを有する実際のリアルタイムPCRデータを示す。図6Bは図6Aからのデータの二次導関数を示す。 図7Aは増幅を示すデータセットのベースライン領域(即ち、指数フェーズ領域の前)においてジャンプを有する実際のリアルタイムPCRデータを示す。図7Bは図7Aからのデータの二次導関数を示す。 図8は本発明の実施形態による、ジャンプエラーが識別された後に、増幅データを無効化するのか又は補正するのかを判定する方法800のフローチャートである。 図9〜12は本発明の実施形態による、ジャンプを有する増幅曲線と、補正済みの曲線と、を示す。 図9〜12は本発明の実施形態による、ジャンプを有する増幅曲線と、補正済みの曲線と、を示す。 図9〜12は本発明の実施形態による、ジャンプを有する増幅曲線と、補正済みの曲線と、を示す。 図9〜12は本発明の実施形態による、ジャンプを有する増幅曲線と、補正済みの曲線と、を示す。 図13は本発明の実施形態による、ジャンプエラーを有する未加工の曲線1310と、高さ補正済みの曲線1320と、シフト及び高さ補正済みの曲線1330と、を示す。 図14は本発明の実施形態によるシステム及び方法と共に使用可能な例示用のコンピュータシステム1300のブロックダイアグラムを示す。 図15は本発明の方法及びシステムを実装するべく使用されうるソフトウェア及びハードウェアリソースの間の関係を示す概略ブロックダイアグラムの一例である。 図16はサーモサイクラ装置とコンピュータシステムの間の関係を示す概略ブロックダイアグラムの一例である。
実施形態は、ランダムなサイクル数において発生するリアルタイムPCR信号において(又は、その他の増幅プロセスからのデータにおいて)ジャンプ(様々な高さを有する)を検出することができる。これらのジャンプの原因は、気泡、カバーフィルム上の液滴、変化したメニスカス、微粒子、熱、生物化学、又はその他の問題に起因したものであってよい。これらのジャンプは、非常に稀であるが、これらは、不正確なサイクル閾値(Ct)を付与する潜在性を有しており、且つ、従って、無効化又は補正することができる。ジャンプエラーの補正のための様々な技法が提供されている。更には、無効化するのか又は補正するのかの決定は、様々な基準に基づいて実施することができる。
I.増幅曲線
図1Aには、動的PCRプロセスの環境における増幅曲線10の一例が示されている。図示のように、曲線10は、ラグフェーズ領域15と、指数フェーズ領域25と、を含む。ラグフェーズ領域15は、ベースライン又はベースライン領域と一般に呼称される。このような曲線は、ラグフェーズと指数フェーズをリンクする遷移領域20を含む。領域20は、エルボー又はエルボー領域と一般に呼称される。エルボー領域は、通常、ベースラインの末尾と、基礎をなすプロセスの成長又は増幅レートにおける遷移と、を定義している。領域20内において特定の遷移ポイントを識別することは、基礎をなすプロセスの振る舞いを分析するために有用であろう。
通常のPCR曲線においては、エルボー値又はサイクル閾値(Ct)値と呼称される遷移ポイントを識別することが、PCRプロセスの効率特性を理解するために極めて有用である。例えば、Ct値は、分析対象のサンプル内に存在するDNAの量の定量化を提供するべく、使用することができる。定量化は、Log(DNA量)対Ct値の較正曲線を実行することにより、取得される。この結果、後のサンプルは、較正曲線と共に、Ct値を使用することにより、サンプル中のDNAの推定値を直接的に取得することができる。又、Ct値は、DNAサンプルに関する定性的な情報を提供するべく、使用することもできる。通常、定義された信号閾値が、分析対象のすべての反応について判定され、且つ、この閾値に到達するために必要とされるサイクルの数(Ct)が、ターゲット核酸のみならず、標準又はハウスキーピング遺伝子などの基準核酸についても判定される。ターゲット核酸及び基準核酸について取得されたCt値に基づいて、ターゲット分子(出発物質)の絶対的又は相対的複写数を判定することができる(Gibson et al., Genome Research 6:995−1001、Bieche et al., Cancer Research 59:2759−2765, 1999、国際特許出願公開第97/46707号、第97/46712号、及び第97/46714号パンフレット)。図1Aのベースライン領域15の末尾におけるエルボー値20は、サイクル数30の領域内に位置することになろう。
RNA又はDNAの量は、結果を、RNA又はDNAの既知の量の段階希釈のリアルタイムPCRによって生成された標準曲線と比較することにより、判定されてもよい。ポリメラーゼ連鎖反応(PCR)増幅におけるターゲット分子の絶対的又は相対的複写数は、サイクル閾値(CT)を標準曲線と、基準核酸のサイクル閾値(Ct)値と、又は絶対的に定量化された標準核酸と、比較することにより、判定することができる。更には、ポリメラーゼ連鎖反応(PCR)増幅の効率は、分析対象のそれぞれの反応のサイクル閾値(Ct)を基準核酸のサイクル閾値(Ct)と比較することにより、判定されてもよい。但し、Ctは、例えば、ジャンプエラーが誤って指数フェーズ領域として識別されることによるなどのように、ジャンプエラーの影響を受ける可能性がある。
(例えば、シグモイド形状の)類似の増幅曲線を提供しうるその他のプロセスは、バクテリアプロセス、酵素プロセス、及び結合プロセスを含む。例えば、バクテリア増殖曲線においては、対象の遷移ポイントは、ラグフェーズにおける時点λと呼称されている。本発明に従って分析されうるデータ曲線を生成するその他の特定のプロセスは、ストランド変位増幅(Strand Displacement Amplification:SDA)プロセス、核酸配列に基づいた増幅(Nucleic Acid Sequence−Based Amplification:NASBA)プロセス、及び転写媒介増幅(Transcription Mediated Amplification:TMA)プロセスを含む。SDA及びNASBAプロセス及びデータ曲線の例は、Wang, Sha−Sha, et al., “Homogeneous Real−Time Detection of Single− Nucleotide Polymorphisms by Strand Displacement Amplification on the BD ProbeTec ET System”, Clin Chem, 2003, 49(10): 1599及びWeusten, Jos J.A.M., et al, “Principles of Quantitation of Viral Loads Using Nucleic Acid Sequence−Based Amplification in Combination With Homogeneous Detection Using Molecular Beacons”, Nucleic Acids Research, 2002, 30(6):26において、それぞれ、見出すことができる。従って、本明細書の残りの部分は、PCR曲線に対するその適用性の観点において、本発明の実施形態及び態様について説明することとするが、本発明は、その他のプロセスに関係したデータ曲線に適用されうることを理解されたい。
図1Aに示されているように、通常のPCR増幅曲線のデータは、例えば、x軸を定義するPCRサイクル数と、y軸を定義する蓄積されたポリヌクレオチド増幅のインジケータと、により、二次元座標系において表すことができる。通常、蓄積された増幅のインジケータは、蛍光強度値であり、その理由は、蛍光マーカーの使用が、恐らくは、最も広く使用されているラベル付与方式であるからである。但し、使用される特定のラベル付与及び/又は検出方式に応じて、その他のインジケータが使用されてもよいことを理解されたい。蓄積された信号増幅のその他の有用なインジケータの例は、ルミネッセンス強度、化学ルミネッセンス強度、生物ルミネッセンス強度、燐光強度、電荷転送、電圧、電流、電力、エネルギー、温度、粘度、光散乱、放射強度、反射率、透過率、及び吸収率を含む。すべてのこのような例が信号強度に分類される。又、サイクルの定義は、時間、プロセスサイクル、単位動作サイクル、及び再生サイクルを含むことができる。
図1Bは、模擬リアルタイムPCR曲線110を有するプロット100を示している。PCR曲線110は、水平(x)軸上のサイクル数と、垂直(y)軸上の強度(例えば、蛍光発光)と、を有する。PCR曲線110は、明確に定義されたベースライン115を有する。図示のように、ベースライン115は、2に等しい強度(y)を有する水平ラインである。提示の容易性を目的として、模擬ベースライン115には、スロープが存在していない。但し、ベースラインは、スロープを有する任意の線形形態を有してもよい。エルボー領域120が、ベースライン115と指数フェーズ領域125の間に位置している。指数フェーズ領域125は、PCR曲線110が、エルボー領域120における上向きのものとは対照的に、下方への湾曲を開始する変曲ポイント128を含む。
PCR増幅曲線110は、模擬的なものであるが、PCR増幅曲線は、それぞれのサイクルにおいて取得された強度のデータポイントから判定することができる。特定の関数の形態を仮定することが可能であり、且つ、特定の関数の形態がデータポイントを近似するように、パラメータを判定することができる。いくつかの実施形態においては、Levenberg−Marquardt(LM)回帰プロセスによって判定されたパラメータを有するダブルシグモイド関数を使用することにより、データポイントに対する近似を見出すことができる。その他の実施形態においては、例えば、有限要素分析において発生しうる連続的な境界条件を有する(例えば、二次導関数まで連続的である)多項式を使用した補間、シングルシグモイド関数、或いは、対象の領域に跨って連続的な二次導関数を有する1つ又は複数の関数の任意の組などのその他の関数の形態が使用されてもよい。一態様においては、曲線近似及びパラメータを使用することにより、例えば、データ信号を正規化すると共に/又はデータ信号内に存在しうるスパイク又は異常値データポイントを除去するべく、データ信号を事前処理することができる。
ジャンプの検出を伴わない場合にも、依然としてデータを(例えば、ダブルシグモイドによって)フィッティングすることができよう。ジャンプのサイズ及びジャンプの場所に応じて、関数フィッティングは、満足できるものになりうると共に、信頼性の高い結果を得ることができるが、特定の状況においては、問題が相対的に顕著になりうる。例えば、問題は、フラットな曲線上に、又はその他の点においては負のスロープを有することになる曲線上に、ジャンプが存在する場合に、相対的に顕著になる。このような状況においては、ジャンプが、正の増幅に対応したものとして検出される場合があり、この結果、偽陽性がもたらされる。別の例として、ジャンプが大きいと共に/又は、ジャンプが増幅領域内において発生した際に、実際の増幅を有するプロセスが、誤った定量値(例えば、Ct値)を有する可能性があろう。従って、データポイントに対する関数の形態のフィッティングは、基礎をなすデータが、例えば、ジャンプエラーなどのエラーを有する際には、エラーを示す可能性がある。ジャンプの検出は、誤ったデータの使用を防止することが可能であり、且つ、増幅プロセスにおいて使用される生物学的サンプルにおける誤った診断又は結論を防止することができる。
II.ジャンプ
ジャンプエラーは、信号強度の非常に大きな増大として表れる。実施形態を使用することにより、ジャンプエラーを検出するプロセスを自動化することができる。従って、実施形態は、コンピュータシステムがジャンプエラーを自動的に検出できるようにするための技法を表すことができる。
図2Aは、増幅プロセスからのデータのプロット200を示しており、この場合に、データは、ジャンプエラーを示している。図1A及び図1Bと同様に、垂直軸は、強度であり、且つ、水平軸は、サイクル数(X)である。プロット200は、X=10においてジャンプを有するフラットなラインを示している。このジャンプが存在しなければ、データセットは、その他の点においては、フラットなものとなろう。従って、関数フィッティングが実行された場合に、フィッティングにおいて、増幅が実際には発生していないにも拘わらず、ランダムジャンプの場所において、増幅(例えば、PCRプロセスにおける増幅)を誤って識別する場合がある。従って、増幅が発生したかどうかを識別するべく、定性的分析が実行された場合に、このような状況においては、定性的分析が不正確なものとなろう。
又、特に、定量的データが取得される際に、増幅が実際に発生したプロセスに対応したデータセットにおいて、問題が生じる可能性もある。定量的データが取得された曲線上において、関数フィッティングが歪曲されることにより、エルボー領域及び指数領域の場所が変化する可能性がある。このような状況においては、Ctが不正確なものになる可能性がある。
III.ジャンプの検出
実施形態は、増幅曲線の二次導関数を使用してジャンプエラーを識別することができる。具体的には、実施形態は、二次導関数値がそれぞれのサイクル数において取得されるように、二次導関数の離散計算を実行することができる。二次導関数は、データセットとの間の二次導関数カーネルの畳込みを介して算出することができる。二次導関数値を分析することにより、ジャンプエラーを表す振る舞いを識別することができる。
図2Bは、本発明の実施形態による増幅曲線の二次導関数のプロット250を示している。垂直軸は、二次導関数の値である。水平軸(x)は、サイクル数−1である。サイクル数Xにおける二次導関数は、中心有限差分法を使用して判定され、この方式は、サイクル数Xの前及び後のサイクル数における値を使用する。以前のサイクル数における値を使用した実施形態においては、二次導関数は、まったく最初のサイクル数については、判定することができず、且つ、従って、プロット250においては、最初のサイクル数が示されていない。従って、水平軸上の9の値は、サイクル10に対応することになろう。いくつかの実装形態においては、最初のサイクル数における二次導関数は、ゼロであるものと仮定することが可能であり、これを二次導関数値の開始点において挿入することにより、水平軸がサイクル数に対応するように、二次導関数値を充填することができる。
プロット250においては、x=9及びx=10における2つの異常値の調査により、ジャンプの検出を判定することができる。x=9において、二次導関数は、最大の正の値を有する。x=10において、二次導関数は、最大の負の値を有する。一実施形態においては、ジャンプ検出の規則は、1つが正であると共に1つが負である2つの連続的なポイントが二次導関数グラフにおいて存在している場合にジャンプが識別されうる、というものである。一実装形態においては、これらのポイントの大きさは、グラフ内のすべてのポイントのうちの最大値及び最小値を有することが必要とされうる。ジャンプは、1+最大ポイントが発生している場所のx値において、発生するものと識別することができる(これは、水平軸がサイクル数−1であることの反映である)。従って、図2Bにおいては、ジャンプが、X=1+9=10において発生したと推定することができる。
A.方法
図3は、本発明の実施形態による増幅プロセスの増幅曲線においてジャンプエラーを検出する方法300のフローチャートである。方法300は、コンピュータシステムによって部分的に又は全体的に実行することができる。方法300の特定のブロックは、省略することができる。例示用の増幅プロセスは、リアルタイムPCR増幅である。その他の増幅プロセスは、バクテリアプロセス、酵素プロセス、及び結合プロセスを含む。増幅プロセスは、一連のポイントによって計測されることが可能であり、それぞれのデータポイントは、サイクル数における信号強度を提供する。
ブロック310において、増幅曲線を表すデータセットが受け取られている。データセットは、複数のデータポイントを含む。それぞれのデータポイントは、{サイクル数,そのサイクル数における増幅プロセスの信号強度}という座標値のペアを有する。例えば、図1Aのそれぞれのデータポイントは、蛍光強度とサイクル数によって表記されている。本明細書においては、その他のタイプの信号強度を含むその他のタイプの信号強度が言及されている。
ブロック320において、データセットの二次導関数が算出されている。例えば、データセットとの間のカーネルの離散畳込みを算出することにより、サイクル数におけるデータセットの二次導関数を取得することができる。カーネルは、データセットに対して適用される値の任意の適切な組であってもよい。例えば、Xにおける二次導関数を判定するべく、カーネルは、3つの値(例えば、1、−2、1)であってもよく、これらは、それぞれ、X−1、X、及びX+1によって乗算され、且つ、次いで、Xにおける二次導関数を取得するべく合計される。その他の実施形態においては、カーネルは、例えば、5及び7などの相対的に大きな奇数の整数などの3つを上回る数の値から構成されうる。カーネルを連続的に適用することにより、先程提供された例における第2サイクル〜最後から2番目のサイクルの二次導関数を判定することができる。
ブロック330において、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかが識別されている。第1サイクル(即ち、2つの連続的なサイクルのうちの第1のサイクル)の二次導関数は、正である第1値を有することが可能であり、且つ、第2サイクルの二次導関数は、負である第2値を有することができる。或いは、この代わりに、第1値が、負であってもよく、且つ、第2値が、正であってもよい。一実施形態においては、識別は、データセットの開始点又は末尾から始まり、順番に実行することができる。いくつかの実装形態においては、異なる符号を有するものとして、連続的なサイクル数の複数のペアを識別することができる。様々な基準を使用することにより、このような連続的なサイクル数のペアのうちのすべて、いくつか、又は1つのみを更に分析する必要があるかどうかを判定することができる。
ブロック340において、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかが判定されている。同一の閾値を第1及び第2値の両方について使用することも可能であり、或いは、異なる閾値を第1及び第2値のそれぞれについて使用することもできる。この閾値に対する比較は、ブロック330における判定の結果として、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、実施することができる。複数のペアが異なる符号を有する際には、例えば、閾値の使用によるなどの基準を使用することにより、異なる符号を有する連続的なサイクルのペアを選択することができる。
一実施形態においては、閾値は、正の値が二次導関数の最大の正の値でり、且つ、負の値が二次導関数の最大の負の値であることを試験している。図2Bにおいて観察することができるように、正の値は、1であり、これは、明らかに、その他の値のすべてのものを上回っている(そのほとんどすべてがゼロに近接している)。そして、負の値は、−1であり、これも、明らかに、すべてのその他の負の値よりも大きな大きさを有する。又、例えば、ジャンプエラーの経験的な証拠及び正確な増幅データと関連したインスタンスに基づいて、閾値の既定の値を使用することもできる。
ブロック350において、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが識別されている。一実施形態においては、第1値及び第2値のうちの両方が閾値を上回ることを必要としうる(閾値は、個々の値ごとに、同一であってもよく、或いは、異なっていてもよい)。大きさが閾値を上回っているいることに加えて、その他の基準を使用することもできる。例えば、ジャンプエラーの場所(即ち、サイクル数)を使用することができる。又、その他の基準を使用することにより、実行するべき任意の更なる動作を判定することもできる。例えば、ジャンプエラーが識別された際に、データセットを無効化又は補正することができる。
方法300が、サーモサイクラなどのPCRデータ取得装置内に存在しているインテリジェントモジュール(例えば、プロセッサ実行命令)において実装されているケースにおいては、データセットは、データの収集に伴って、インテリジェントモジュールにリアルタイムで提供されてもよく、或いは、メモリユニット又はバッファ内において保存されてもよく、且つ、実験が完了した後に、インテリジェントモジュールに提供されてもよい。同様に、データセットは、取得装置に対するネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接的な接続(例えば、USB又はその他の直接的な有線又は無線接続)を介して、デスクトップコンピュータシステム又はその他のコンピュータシステムなどの別個のシステムに提供されてもよく、或いは、CD、DVD、フロッピー(登録商標)ディスク、又はこれらに類似したものなどの携帯型媒体上において提供されてもよい。特定の態様においては、デーセットは、座標値のペア(又は、二次元ベクトル)を有するデータポイントを含む。PCRデータの場合には、座標値のペアは、通常、サイクル数と蛍光強度値を表している。
B.二次導関数(畳込み)
上述のように、二次導関数は、カーネルとデータセットの畳込みとして算出することができる。畳込みは、隣接するサイクルにおける信号値の間の有限な差として実装することができる。当業者には明らかなように、且つ、後述するように、様々なカーネルを利用することができる。
一例として、次式(1)において示されているように、増幅プロセスからのデータセットを表す9メンバリスト{a,b,c,d,e,f,g,h,i}との間におけるカーネル{x,y,z}の畳込みを検討してみよう。
ListConvolve[{x,y,z},{a,b,c,d,e,f,g,h,i}] (1)
この畳込みの結果は、次式(2)において示されている7メンバリストによって付与される。
{az+by+cx,bz+cy+dx,cz+dy+ex,dz+ey+fx,ez+fy+gx,fz+gy+hx,gz+hy+ix} (2)
カーネル{x,y,z}が{1,−2,1}によって置換された場合に、リスト畳込みは、オリジナルのリストの二次導関数を表し、且つ、次式(3)によって付与される。
{a−2b+c,b−2c+d,c−2d+e,d−2e+f,e−2f+g,f−2g+h,g−2h+i} (3)
図2Bは、図2Aの二次導関数を示しており、この場合に、二次導関数は、図2Aのデータとの間のカーネル[1,−2,1]のリスト畳込みによって判定されている。畳込みに起因し、図2Aよりも、図2Bにおいては、2つだけ少ないポイントが存在している。相対的に少ない数のポイントを有するという結果は、開始点において且つ末尾において値を充填することにより、補正することができる。例として、追加される値は、第2のサイクル又は最後から2番目のサイクルのものに等しくてもよく、或いは、補間などのなんからの関数フィッティングの結果として判定することもできる。
その他のカーネルを使用することもできる。例えば、左側(left−sided)有限差分法を使用することが可能であり、この場合には、以前のサイクルと現在のサイクルのみが使用される。例えば、(1,−2,1)の個々の値をX−2、X−1、及びXにおいて使用することにより、サイクルXにおける二次導関数を取得することができる。別の例は、X−3、X−2、X−1、及びXにおける値(−1、4、−5、2)の使用である。類似のカーネルを右側(right−sided)有限差分法において使用することも可能であり、この場合には、後のサイクルと現在のサイクルのみが使用される。式(1)〜式(3)における例は、中心有限差分法のものであり、この場合には、1つ又は複数の以前のサイクル、現在のサイクル、及び1つ又は複数の後のサイクルが使用される。中心有限差分法の別の例は、X−2、X−1、X、X+1、及びX+2における値(−1、16、−30、16、−1)の使用である。更には、例えば、(1.1、−2.05、1.1)などのこれらの値からのわずかな変形を使用することもできる。実施形態は、本明細書において提供されている例に限定されるものではない。
C.結果
図4Aは、その他の点においてはフラットな信号においてジャンプを有する実際のリアルタイムPCRデータを示している。図4Bは、図4Aからのデータの二次導関数を示している。図4Bにおけるデータは、中心有限差分法における畳込みを使用して判定されている。図4Aにおいては、データは、ジャンプの後においてわずかに減少しているが、全体的には、相対的にフラットな状態に留まっている。従って、このデータセットは、増幅を示してはおらず、その理由は、信号における唯一の大きな増大がジャンプに起因するものであるからである。ジャンプが識別されなければ、データセットが、増幅を示しているとして、誤って識別されうるという点において、偽陽性が発生しうるであろう。このような不正確な分析は、生物学的サンプルにおける基礎をなす増幅プロセスの不正確な計測を結果的にもたらしうるであろう。図4Bにおいては、観察することができるように、正の二次導関数及び負の二次導関数を有する連続的なサイクルのペア(9及び10のX値として示されており、これらは、サイクル10及び11に対応している)が存在している。又、これらの値は、その他のサイクルにおける値と比較した場合に、最大の大きさを有している。
図5Aは、指数フェーズ領域の末尾の近傍においてジャンプを有する実際のリアルタイムPCRデータを示している。図5Bは、図5Aからのデータの二次導関数を示している。図5Bのデータは、中心有限差分法における畳込みを使用して判定されている。図5Aは、ほぼサイクル30〜44において、実際の増幅を示している。但し、信号を約6から14超へ増大させるジャンプが、ほぼサイクル45において存在している。この相対的に大きなジャンプは、実際の増幅との比較において、データに対する任意の関数フィッティングを歪曲することになろう。従って、定性的に、関数フィッティングは、基礎をなすプロセスにおいて増幅が発生したことを識別することにはなろうが、すべての定量的データは、関数フィッティングにおけるエラーに起因して、不正確なものとなろう。図5Bにおいては、観察することができるように、正の二次導関数及び負の二次導関数を有する連続的なサイクルのペア(44及び45のX値として示されており、これらは、サイクル45及び46に対応している)が存在している。そして、これらの値は、その他のサイクルにおける値との比較において、最大の大きさを有している。
図6Aは、指数フェーズ領域の末尾の近傍において大きなジャンプを有する実際のリアルタイムPCRデータを示している。図6Bは、図6Aからのデータの二次導関数を示している。図6Bのデータは、中心有限差分法における畳込みを使用して判定されている。図6Aは、ほぼサイクル26〜40において、実際の増幅を示している。但し、信号を約14から約30に増大させるジャンプが、ほぼサイクル40において存在している。又、この相対的に大きなジャンプも、実際の増幅との比較において、データに対する任意の関数フィッティングを歪曲することになろう。従って、定性的には、関数フィッティングは、基礎をなすプロセスにおいて増幅が発生したことを依然として識別することにはなろうが、すべての定量的データは、関数フィッティングにおけるエラーに起因して、不正確なものとなろう。図6Bにおいては、観察することができるように、正の二次導関数及び負の二次導関数を有する連続的なサイクルのペア(39及び40のX値として示されており、これらは、サイクル40及び41に対応している)が存在している。そして、これらの値は、その他のサイクルにおける値との比較において、最大の大きさを有している。
図7Aは、増幅を示すデータセットのベースライン領域(即ち、指数フェーズ領域の前)においてジャンプを有する実際のリアルタイムPCRデータを示している。図7Bは、図7Aからのデータの二次導関数を示している。図7Bにおけるデータは、中心有限差分法における畳込みを使用して判定されている。図7Aは、ほぼサイクル30〜42において、実際の増幅を示している。但し、信号を約2から約4に増大させるジャンプが、ほぼサイクル17において存在している。このジャンプは、指数フェーズの前に発生しているが、指数フェーズとして誤解される可能性があろう。そして、ジャンプは、ベースラインの判定を歪曲する可能性があり、且つ、データに対する任意の関数フィッティングを歪曲する可能性があろう。従って、定性的には、関数フィッティングは、基礎をなすプロセスにおいて増幅が発生したことを依然として識別することにはなろうが、すべての定量的データは、関数フィッティングにおけるエラーに起因し、不正確なものとなろう。
図7Bにおいては、観察することができるように、正の二次導関数及び負の二次導関数を有する連続的なサイクルのペア(16及び17のX値として示されており、これらは、サイクル17及び18に対応している)が存在している。そして、これらの値は、その他のサイクルにおける値との比較において、最大の大きさを有している。ジャンプは、実際の増幅に起因した増大との関係においてそれほど大きくないことから、図7Bは、ジャンプに起因した二次導関数値に多少近接したその他の二次導関数値をも示している。但し、ジャンプに起因した二次導関数値が、依然として、相対的に格段に大きい。
記述されているケースのそれぞれにおいて、ジャンプは、二次導関数グラフにおいて、1つが正であり、且つ、1つが負である2つの連続的なポイントが存在しており、且つ、これらのポイントの大きさが、グラフ内のすべてのポイントのうちで最大及び最小であることを観察することにより、正しく検出されている。ジャンプは、1+最大ポイントのX値において発生している。
D.複数のジャンプ
データセットは、複数のジャンプエラーを有することができよう。このような状況においては、連続的なサイクルの1つのペアが、その他のジャンプエラーのペアよりも、大きな大きさを有することになろう。すべてのジャンプエラーを検出すると共に、恐らくは、それらについて補正するべく、データを通じて複数のパスを実施することができよう。スプリアスノイズが、非常に小さな正の二次導関数値が次のサイクルにおける非常に小さな負の二次導関数値によって後続されている状態をジャンプエラーとして識別させないことを保証するべく、大きさの最小閾値を使用することができよう。
E.負のジャンプ
図示の例は、正のジャンプについてのものであるが、負のジャンプも出現しうるであろう。負のジャンプの場合に、ペアの第1サイクルが、負の二次導関数値を有することになり、且つ、ペアの第2サイクルが、正の二次導関数値を有することになろう。類似の方式により、分析を依然として実装することができる。
IV.無効化及び補正
ジャンプが検出されたら、ジャンプ及びデータセットを分析することにより、データセットを無効化するのか又はデータセットを補正するのか、或いは、恐らくは、これらのいずれをも実施しないのか、を判定することができる。様々な基準を使用することにより、これらの決定を下すことができる。例えば、1つ又は複数の無効化規準の組を使用することにより、データセットを無効化するかどうかを判定することができる。1つ又は複数の補正基準の組を使用することにより、データセットを補正するかどうかを判定することができる。これらの基準は、データを分析するコンピュータシステムに入力することができる。無効化するのか又は補正するのかの判定は、データの収集時点において、或いは、後の事後処理ステップにおいて、実行することができる。
図8は、本発明の実施形態による、ジャンプエラーが識別された後に、増幅データを無効化するのか又は補正するのかを判定する方法800のフローチャートである。方法800のブロックは、様々な順序において実行することができる。例えば、無効化するかどうかに関する決定は、データを補正するかどうかの決定の前又は後において実行することができる。いくつかの実施形態においては、無効化及び/又は補正が常に実行される。
ブロック810において、ジャンプが識別されている。例えば、ジャンプは、方法300を使用して識別することができる。一実施形態においては、ジャンプは、データセットについて識別されており、且つ、ジャンプが検出されたことを通知するべく、データセットと関連付けられたフラグを設定することができる。フラグの存在を使用することにより、データセットを無効化するのか又は補正するのかについてのデータセットの分析を通知することができる。
ブロック820において、ジャンプの1つ又は複数の特性が判定されている。例えば、ジャンプの高さは、ペアの第1サイクルから第2サイクルへの信号値の差を取得することにより、判定することができる。一実装形態においては、高さは、絶対値又は相対値として判定することができる。例えば、ジャンプの高さは、ベースライン切片と、或いは、指数フェーズが存在する場合には、正味の増幅と、比較することができる。正味の増幅は、増幅の後の信号強度−ジャンプとして、且つ、潜在的には、−ベースラインとして、判定することができる。又、ジャンプの場所も、判定することができる。又、場所は、絶対又は相対値として判定することができる。例えば、ジャンプと増幅曲線内の領域の場所の間の相対的な距離を判定することができる。例えば、その他の場所は、エルボー領域の開始点又は末尾、ベースライン領域の開始点又は末尾、或いは、指数領域の開始点又は末尾であってもよい。
ブロック830において、1つ又は複数の特性が1つ又は複数の無効化規準を充足しているかどうかが判定されている。一実施形態において、無効化規準は、ジャンプを有するすべての増幅曲線が無効化されることを規定することができる。このケースにおいては、ジャンプを有するすべての増幅曲線が無効化されることになり、且つ、特性の判定が不要となろう。その他の実施形態においては、増幅曲線は、ジャンプが、特定の高さ及び/又は特定の場所などの特定の特性を有する場合にのみ、無効化されることになろう。
ブロック835において、無効化規準が充足されている場合に、データセットは無効化される。一実装形態においては、増幅曲線が無効化される場合には、補正は実行されないであろう。増幅曲線は、無効化されるものとしてマーキングすることが可能であり、この場合に、このようなマーキングは、ディスプレイ上において表示することができる。更には、増幅曲線が無効化される際には、一般に、更なる分析は、無効化済みの増幅曲線に対して実行されないであろう。
ブロック840において、1つ又は複数の特性が1つ又は複数の補正基準を充足しているかどうかが判定されている。一実施形態においては、補正基準は、ジャンプを有するすべての増幅曲線が補正されることを規定することができる。このケースにおいては、ジャンプを有するすべての増幅曲線が補正されることになり、且つ、特性の判定は不要となろう。増幅曲線は、補正される場合にも、依然として、後の時点において無効化することができよう。その他の実施形態においては、増幅曲線は、ジャンプが特定の高さ及び/又は特定の場所などの特定の特性を有する場合にのみ、補正されることになろう。
ブロック845において、補正基準が充足されている場合に、データセットが補正される。補正に関する更なる詳細は、以下において提供する。データセットは、即座に補正することも可能であり、或いは、後の時点における補正のためにマーキングしておくこともできる。
ブロック848において、補正済みのデータセットが使用されている。例えば、データセット用の関数フィッティングを判定することできる。関数フィッティングの計算の更なる詳細については、米国特許第8,265,879号明細書において見出すことができる。関数フィッティングを使用することにより、増幅が発生したかどうかを判定することができる。別の使用法として、定量値を関数フィッティングから判定することができる。定量値の一例がCt値である。補正済みのデータセットの分析及び使用は、ジャンプがこれまで検出されていない状況と類似した方式によって実行することができる。Ct値の計算の更なる詳細については、米国特許出願第13/633,813号明細書及び米国特許第8,219,366号明細書において見出すことができる。
ブロック850において、特性のいずれもが無効化規準又は補正基準を充足していない場合に、補正済みのデータセットを使用することができる。例えば、ジャンプが非常に小さく、且つ、ベースラインの開始点において位置している場合には、ジャンプに起因したすべてのエラーは、相対的に小さくなりうるであろう。従って、精度の過大な犠牲を伴うことなしに、未補正のデータセットを使用することができよう。
A.無効化及び/又は補正用の基準
上述のように、様々な基準を使用することにより、ジャンプを示す増幅データを無効化するのか又は補正するのかを判定することができる。増幅曲線を無効化又は補正するための決定プロセスにおいては、例えば、ジャンプの高さの大きさ又は正味の増幅との関係における大きさ(例えば、合計増幅−ジャンプの高さ)、ベースライン切片との関係における大きさ、及びジャンプのサイクル数を使用してもよいであろう。
類似の特性を検証及び補正の両方に使用することができるが、異なる基準も使用される。例えば、ジャンプの高さが、無効化閾値を上回っている場合には、増幅データを無効化してもよいであろう。一方、ジャンプの高さが、無効化閾値を下回っているが、補正閾値を上回っている場合には、増幅曲線を補正することができる。
ジャンプの高さは、ベースライン値又は正味の増幅などのその他の値と比較することができる。例えば、ジャンプの高さとその他の値の間において、比率又は差を算出することができる。次いで、比率又は差を閾値と比較することができる。
別の例として、ジャンプの場所を使用することができる。例えば、(予想又は推定Ct値が判明しうる場合に)ジャンプがCt値に過剰に近接している場合には、増幅データを無効化することが可能であり、その理由は、ジャンプの場所が付与された場合に、正確なCt値を取得することが過剰に困難となるからである。但し、場所が、予想Ct値から相対的に遠く離れている場合には、増幅データを補正可能であると識別することが可能であり、且つ、補正手順を実行することができる。
更には、早期のジャンプ(例えば、ベースラインにおけるジャンプ)は、補正可能である可能性が高い。例えば、Ctの実際のケースが、約20以上であると判明しており、且つ、ジャンプがサイクル10に位置している場合には、データセットを補正するという判定を下すことができる。そして、ジャンプが遅い場合には(例えば、プラトー領域におけるジャンプ)、データセットを補正するという判定を下すことができる。
いくつかの実施形態においては、ジャンプが非常に小さい場合には、データセットを無効化又は補正しないという判定を下すことができる。例えば、ジャンプの高さが約0.1(又は、その他の小さな閾値)である場合には、ジャンプエラーは、検出することもできるであろうし、或いは、同じ状況において、ジャンプは、無効化又は補正されない。
B.補正
ジャンプエラーは、様々な方法で補正することができる。ジャンプについてデータを補正する1つの方法は、ジャンプの後のすべてのデータポイントからジャンプの高さを減算するというものである。別の方法は、ジャンプの前のすべてのデータポイントにジャンプの高さを加算するというものである。ジャンプ補正の後の選択肢は、補正済みのジャンプの後のすべての蛍光値を1つのサイクル数だけ左にシフトさせるというものである。これにより、なんらかの不連続性が補正済みのジャンプ曲線内に出現することを防止することができる。このようなシフトは、ジャンプが指数フェーズ(増幅領域)において発生した際に有益であろう。
上述のように、ジャンプの高さは、2つのサイクルの間の強度の差として判定することができる。2つのサイクルの場所は、二次導関数を分析することにより、識別されることから、2つのサイクルにおける強度を使用してジャンプの高さを判定することができる。
使用される技法とは無関係に、補正は、定量値を変更することにはならず、その理由は、定量値は、例えば、ベースラインとの関係におけるものなどのように、相対的な強度値から判定されるからである。例えば、関数フィッティングは、定数を有することが可能であり、定数は、定量値(例えば、Ct値)に影響を及ぼさない。ジャンプの高さの加算又は減算は、事実上、定数の変化をもたらすのみであり、且つ、従って、補正は、定量的な結果に影響を及ぼさない。
C.補正結果
図9〜図12は、本発明の実施形態による、ジャンプを有する増幅曲線と、補正済みの曲線と、を示している。これらの増幅曲線は、図4A、図5A、図6A、及び図7Aに対応している。その他のプロットと同様に、垂直軸は、強度であり、且つ、水平軸は、サイクル数である。
図9は、未加工データ910及び補正済みのデータ920を示している。補正済みのデータ920は、サイクル10〜20におけるわずかな減少を除いて、ほぼフラットである。補正済みのデータ920は、増幅が発生していないことを示しており、且つ、従って、物理的プロセスを正確に反映している。後の処理ステップにおいて、増幅の欠如を識別することができる。又、後の処理ステップは、補正済みのデータを減少を有するものとして識別することも可能であり、この状況は、負の比較標準(control)から発生しうるであろう。
図10は、未加工のデータ1010及び補正済みのデータ1020を示している。補正は、増幅領域の末尾と合致した状態となるように、プラトー領域における全体的な強度を低減している。図9と同様に、ジャンプの後において、減少が両方のデータセットにおいて観察される。1つの増幅曲線における減少の量(例えば、比較標準)をその他の増幅曲線の補正において使用することができる。この結果、補正は、ジャンプに直接的に後続する(即ち、ジャンプの高さが減算された後の)サイクルに対する加算を含むことができる。
図11は、未加工のデータ1110及び補正済みのデータ1120を示している。図10と同様に、補正は、増幅領域の末尾と合致した状態となるように、全体的な強度及びプラトー領域を低減している。又、上述のように、ジャンプの後の減少を補正することもできる。
図12は、未加工のデータ1210及び補正済みのデータ1220を示している。補正は、増幅領域に継続する滑らかなベースラインをもたらしている。従って、正確な関数フィッティングを得ることができる。
図13は、本発明の実施形態による、ジャンプエラーを有する未加工の曲線1310、高さ補正済みの曲線1320、及びシフト及び高さ補正済みの曲線1330を示している。高さ補正済みの曲線320は、不連続性を有しており、その理由は、PCR曲線の増幅においてジャンプが発生しているからである。この不連続性は、ジャンプの後の強度値を1つのサイクルだけ左にシフトさせることにより、除去することができる。これが、シフト及び高さ補正済みの曲線1330によって示されている。
不連続性は、ジャンプの第1サイクルから第2サイクルへの強度値の差が、エラーに起因した1つの寄与分と、発生している実際の増幅に起因した別の寄与分と、を有するという事実から生じている。従って、合計差のすべてがエラーに帰される場合には、第2サイクルが第1サイクルと同一の強度を有することが保証される。シフトさせることにより、補正済みの曲線は、増幅領域と合致した状態に戻る。
その他の実施形態においては、シフトの代わりに、第1サイクルから第2サイクルへの実際の増幅の値に関する推定を実施することができる。例えば、線形補間を使用することにより、ジャンプ近傍のサイクルの信号値に基づいて第2サイクルにおける予想信号値を判定することができる。これにより、実際の増大がどれだけのものであるのかの推定値を提供することができる。次いで、2つのサイクルの間の合計差が減算された後に、実際の増幅に帰されうる増大を加算して戻すことができる。或いは、同じ状況において、増幅の増大をジャンプの高さの合計から減算することにより、実際のジャンプエラーを取得することもできる。
従って、本発明は、一態様においては、ポリメラーゼ連鎖反応(PCR)増幅などの増幅プロセスの増幅曲線においてサイクル閾値Ctを判定する方法を提供している。この場合に、方法は、コンピュータシステムにおいて、増幅曲線を表すデータセットを受け取るステップであって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、コンピュータシステムにより、データセットとの間におけるカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、を有する。
本発明の更なる態様においては、ポリメラーゼ連鎖反応(PCR)増幅の効率を計測する方法が提供され、この方法は、増幅されたポリヌクレオチドの蓄積を表す蛍光強度値、ルミネッセンス強度値、化学ルミネッセンス強度値、燐光強度値、電荷転送値、生物ルミネッセンス強度値、又は吸収値を計測するステップと、定義された信号閾値及びこの閾値に到達するべく必要とされるサイクル数を判定するステップであって、増幅曲線のサイクル閾値(Ct)は、増幅曲線を表すデータセットを受け取る方法ステップによって判定され、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、コンピュータシステムにより、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、ジャンプエラーの1つ又は複数の特性を判定し、且つ、ジャンプエラーの1つ又は複数の特性が1つ又は複数の無効化規準を充足している場合に、データセットを無効化し、或いは、ジャンプエラーについてデータセットを補正するステップと、増幅されたポリヌクレオチドのサイクル閾値(Ct)を基準核酸のサイクル閾値(Ct)と比較することにより、ポリメラーゼ連鎖反応(PCR)増幅の効率を判定するステップと、を有する。
本発明の別の態様においては、ポリメラーゼ連鎖反応(PCR)増幅におけるターゲット分子の絶対的又は相対的複写数を判定する方法が提供され、この方法は、増幅されたポリヌクレオチドの蓄積を表す蛍光強度値、ルミネッセンス強度値、化学ルミネッセンス強度値、燐光強度値、電荷転送値、生物ルミネッセンス強度値、又は吸収値を計測するステップと、コンピュータシステムにおいて、増幅曲線を表すデータセットを受け取る方法ステップにより、増幅曲線のサイクル閾値(Ct)を判定するステップであって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、コンピュータシステムにより、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、ジャンプエラーの1つ又は複数の特性を判定し、且つ、ジャンプエラーの1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、データセットを無効化し、或いは、ジャンプエラーについてデータセットを補正するステップと、Ct値に基づいてターゲット分子の絶対的又は相対的複写数を判定するステップと、を有する。
V.コンピュータシステム及びコンピュータプロダクト
本明細書において言及されているコンピュータシステムの任意のものは、任意の適切な数のサブシステムを利用しうる。図14には、このようなサブシステムの例が、コンピュータ装置1400内において示されている。いくつかの実施形態においては、コンピュータシステムは、単一のコンピュータ装置を含み、この場合には、サブシステムは、コンピュータ装置のコンポーネントであってもよい。その他の実施形態においては、コンピュータシステムは、内部コンポーネントを有する複数のコンピュータ装置を含むことが可能であり、この場合には、コンピュータ装置のそれぞれがサブシステムである。
図14に示されているサブシステムは、システムバス1475を介して相互接続されている。プリンタ1474、キーボード1478、1つ又は複数のストレージ装置1479、ディスプレイアダプタ1482に結合されたモニタ1476、及びその他のものなどの更なるサブシステムが示されている。シリアルポート1477などの当技術分野において既知の任意の数の手段により、周辺装置及びI/Oコントローラ1471に結合する入出力(I/O)装置をコンピュータシステムに接続することができる。例えば、シリアルポート1477又は外部インターフェイス1481(例えば、Ethernet(登録商標)やWi−Fiなど)を使用することにより、コンピュータシステム1400をインターネットなどのワイドエリアネットワーク、マウス入力装置、又はスキャナに接続することができる。システムバス1475を介した相互接続により、中央プロセッサ1473は、それぞれのサブシステムと通信することが可能であり、且つ、システムメモリ1472又は1つ又は複数のストレージ装置1479(例えば、固定ディスク)からの命令の実行のみならず、サブシステムの間における情報の交換をも、制御することができる。システムメモリ1472及び/又は1つ又は複数のストレージ装置1479は、コンピュータ可読媒体を実施してもよい。本明細書において言及されている値の任意のものは、1つのコンポーネントから別のコンポーネントに出力することが可能であり、且つ、ユーザーに出力することができる。
コンピュータシステムは、例えば、外部インターフェイス1481により、或いは、内部インターフェイスにより、1つに接続された複数の同一のコンポーネント又はサブシステムを含むことができる。いくつかの実施形態においては、コンピュータシステム、サブシステム、又は装置は、ネットワーク上において通信することができる。このような例においては、1つのコンピュータをクライアントと見なすことが可能であり、且つ、別のコンピュータをサーバーと見なすことが可能であり、この場合に、これらのそれぞれは、同一のコンピュータシステムの一部分であってもよい。クライアント及びサーバーは、それぞれ、複数のシステム、サブシステム、又はコンポーネントを含むことができる。
本発明の実施形態の任意のものは、ハードウェア(例えば、用途固有の集積回路又はフィールドプログラム可能なゲートアレイなど)を使用すると共に/又はモジュラー型の又は集積された方式によって一般的にプログラム可能であるプロセッサを伴うコンピュータソフトウェアを使用した制御ロジックの形態において実装することができることを理解されたい。本明細書において使用されているプロセッサは、同一の集積チップ上のマルチコアプロセッサを含み、或いは、単一の回路基板上の又はネットワーク接続された複数の処理ユニットを含む。本明細書において提供されている本開示及び教示に基づいて、当業者は、ハードウェア、並びに、ハードウェアとソフトウェアの組合せを使用することにより、本発明の実施形態を実装するためのその他の方式及び/又は方法について認知すると共に理解するであろう。
本出願において記述されているソフトウェアコンポーネント又は機能の任意のものは、例えば、従来の又はオブジェクト指向の技法を使用した、例えば、Java(登録商標)、C++、又はPerlなどの任意の適切なコンピュータ言語を使用した、プロセッサによって実行されるソフトウェアコードとして実装されてもよい。ソフトウェアコードは、保存及び/又は送信のために、コンピュータ可読媒体上において、一連の命令又はコマンドとして保存されてもよく、適切な媒体は、ランダムアクセスメモリ(Random Access Memory:RAM)、読出し専用メモリ(Read Only Memory:ROM)、ハードドライブ又はフロッピー(登録商標)ディスクなどの磁気媒体、或いは、コンパクトディスク(Compact Disk:CD)又はDVD(Digital Versatile Disk)、フラッシュメモリなどの光媒体、並びに、これらに類似したものを含む。コンピュータ可読媒体は、このようなストレージ及び送信装置の任意の組合せであってもよい。
又、このようなプログラムは、インターネットを含む様々なプロトコルに準拠した有線、光、及び/又は無線ネットワークを介した送信のために適合された搬送波信号を使用することにより、エンコード及び送信されてもよい。従って、本発明の一実施形態によるコンピュータ可読媒体は、このようなプログラムによってエンコードされたデータ信号を使用して生成されてもよい。プログラムコードによってエンコードされたコンピュータ可読媒体は、互換性を有する装置と共にパッケージ化されてもよく、或いは、その他の装置とは別個に(例えば、インターネットダウンロードを介して)、提供されてもよい。任意のこのようなコンピュータ可読媒体は、単一のコンピュータプログラムプロダクト(例えば、ハードドライブ、CD、又は全体的なコンピュータシステム)上において又はその内部において存在してもよく、且つ、システム又はネットワーク内の異なるコンピュータプログラムプロダクト上において又はその内部において存在してもよい。コンピュータシステムは、本明細書において言及されている結果のうちの任意のものをユーザーに提供するためのモニタ、プリンタ、又はその他の適切なディスプレイを含んでもよい。
本明細書において記述されている方法の任意のものは、完全に又は部分的に、ステップを実行するように構成された1つ又は複数のプロセッサを含むコンピュータシステムによって実行されてもよい。従って、実施形態は、個々のステップ又は個々のステップのグループを実行する異なるコンポーネントを潜在的に伴って、本明細書において記述されている方法のうちの任意の方法のステップを実行するように構成された1つ又は複数のプロセッサを含むコンピュータシステムを対象としうる。付番されたステップとして提示されているが、本明細書における方法のステップは、同時に又は異なる順序において実行することができる。更には、これらのステップの各部分は、その他の方法からのその他のステップの各部分と共に使用されてもよい。又、ステップのすべて又は各部分は、任意選択であってもよい。更には、方法のうちの任意の方法のステップの任意のものは、これらのステップを実行するためのモジュール、回路、又はその他の手段により、実行することができる。
いくつかの実施形態においては、本発明の方法は、コンピュータプロダクトにおいて実装されている。従って、このようなコンピュータプロダクトは、実行された際に、増幅プロセスの増幅曲線においてサイクル閾値Ctを判定するように、コンピュータシステムを制御する複数の命令を保存した一時的ではないコンピュータ可読媒体を有しており、命令は、増幅曲線を表すデータセットを受け取るステップであって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、ステップと、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得するステップと、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別するステップと、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別するステップと、を有する。
VI.PCRシステム
又、特定の態様においては、本発明は、PCRシステムをも提供している。図15及び図16には、例示用のPCRシステムが表示されている。図15は、本発明の方法及びシステムを実装するべく使用されうるソフトウェア及びハードウェアリソースの間における関係を説明する概略ブロックダイアグラムを示している。図16において示されているシステムは、サーモサイクラ装置内において配置されうる動的PCR分析モジュールと、コンピュータシステムの一部分であるインテリジェントモジュールと、を有する。データセット(PCRデータセット)が、ネットワーク接続又は直接接続を介して、分析モジュールからインテリジェントモジュールに、又はこの逆に、転送される。データセットは、例えば、図3に示されているフローチャートに従って処理されてもよい。このフローチャートは、例えば、図15に示されているフローチャートに従って、コンピュータシステムのハードウェア上に保存されたソフトウェアにより、便利な方式で実装されてもよい。図15を参照すれば、コンピュータシステム(2000)は、例えば、PCR反応の際に取得された蛍光データを受け取る受取り手段(2100)と、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得することにより、前記データを処理する計算手段(2200)と、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別する第1識別手段(2300)と、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定する判定手段(2400)と、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別する第2識別手段(2500)と、を有してもよい。又、特定の実施形態においては、システムは、コンピュータ画面上において結果を表示するための表示手段を有してもよい。図16は、サーモサイクラ装置とコンピュータシステムの間におけるやり取りを示している。システムは、サーモサイクラ内において配置されうる動的PCR分析モジュールと、コンピュータシステムの一部分であるインテリジェントモジュールと、を有する。データセット(PCRデータセット)が、ネットワーク接続又は直接的接続を介して、分析モジュールからインテリジェントモジュールに、又はこの逆に、転送される。データセットは、プロセッサ上において稼働すると共にインテリジェントモジュールのストレージ装置上において保存されているコンピュータコードにより、図15に従って処理されてもよく、且つ、処理の後に、分析装置のストレージ装置に転送して戻されてもよく、そこで、変更済みのデータは、表示装置上において表示されてもよい。又、いくつかの実施形態においては、インテリジェントモジュールは、サーモサイクラ上において実装されてもよい。特定の態様においては、本発明は、ポリメラーゼ連鎖反応(PCR)システムを提供し、システムは、PCR増幅曲線を表すPCRデータセットを生成するPCRデータ取得装置であって、前記データセットは、複数のデータポイントを含み、データポイントのそれぞれは、サイクル数とそのサイクル数における増幅プロセスの信号強度の座標値のペアを有する、装置と、データセットとの間のカーネルの離散畳込みを算出してサイクル数におけるデータセットの二次導関数を取得し、2つの連続的なサイクル数が、異なる符号を有する二次導関数の値を有するかどうかを識別し、第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する二次導関数の第1値及び第2値を有している際に、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定し、第1値及び第2値のうちの少なくとも1つの値の大きさが閾値を上回っているという判定に基づいて、増幅曲線を表すデータセットにおいてジャンプエラーが発生したと識別することにより、PCRデータセットを処理してジャンプエラーを検出するように適合されたインテリジェントモジュールと、を有する。
特定の実施形態の特定の詳細は、本発明の実施形態の精神及び範囲を逸脱することなしに、任意の適切な方式によって組み合わせられてもよい。但し、本発明のその他の実施形態は、それぞれの個々の態様又はこれらの個々の態様の特定の組合せと関係した特定の実施形態を対象としてもよい。
本発明の例示用の実施形態に関する上述の説明は、例示及び説明を目的として提示されたものである。これは、本発明のすべてを網羅するか又は本発明を記述されている形態そのままに限定することを意図したものではなく、且つ、上述の教示内容に鑑み、多数の変更及び変更が可能である。実施形態は、本発明の原理及びその実際的な用途を十分に説明し、これにより、当業者が、様々な実施形態において、且つ、想定される特定の使用法に適した様々な変更を伴って、本発明を最良に利用できるようにするべく、選択及び説明されている。
「1つの(a)」、「1つの(an)」、又は「その(the)」という記述は、具体的にそうではない旨が示されていない限り、「1つ又は複数の」を意味するものと解釈されたい。

Claims (20)

  1. 増幅プロセスの増幅曲線においてジャンプエラーを検出する方法であって、
    −コンピュータシステムにおいて、増幅曲線を表すデータセットを受け取るステップであって、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における前記増幅プロセスの信号強度の座標値のペアを有する、ステップと、
    −前記コンピュータシステムにより、前記データセットとの間のカーネルの離散畳込みを算出して前記サイクル数における前記データセットの二次導関数を取得するステップと、
    −2つの連続的なサイクル数が、異なる符号を有する前記二次導関数の値を有するかどうかを識別するステップと、
    −第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する前記二次導関数の第1の値及び第2の値を有している際に、前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、
    −前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが前記閾値を上回っているという判定に基づいて、前記増幅曲線を表す前記データセットにおいてジャンプエラーが発生したと識別するステップと、
    を有する方法。
  2. −前記第1値及び前記第2値のうちの両方の値の大きさが1つ又は複数の閾値を上回っているかどうかを判定するステップを更に有し、
    ジャンプエラーが発生したという前記識別は、前記第1値及び前記第2値のうちの両方の値の大きさが前記1つ又は複数の閾値を上回っているという判定に基づいている請求項1に記載の方法。
  3. 前記閾値は、前記第1値及び前記第2値が、前記二次導関数のその他の値との関係において最大の大きさを有するかどうかを試験する請求項2に記載の方法。
  4. 前記閾値は、既定の値である請求項1乃至3のいずれか一項に記載の方法。
  5. 前記第1値は、正であり、且つ、前記第2値は、負である請求項1乃至4のいずれか一項に記載の方法。
  6. −前記ジャンプエラーの1つ又は複数の特性を判定するステップと、
    −前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、前記データセットを無効化するステップと、
    を更に有する請求項1乃至5のいずれか一項に記載の方法。
  7. 前記1つ又は複数の無効化規準は、
    −前記第1値及び/又は前記第2値の大きさと、
    −前記ジャンプエラーの場所と、
    のうちの少なくとも1つを含む請求項6に記載の方法。
  8. 前記第1値及び/又は前記第2値の前記大きさは、前記データセット内のベースライン又は正味の増幅との関係における大きさである請求項7に記載の方法。
  9. 前記ジャンプエラーの前記場所は、前記増幅曲線の領域の場所との関係における場所である請求項7に記載の方法。
  10. −前記ジャンプエラーについて前記データセットを補正するステップを更に有する請求項1乃至9のいずれか一項に記載の方法。
  11. 前記ジャンプエラーの1つ又は複数の特性を判定するステップであって、前記データセットは、前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、補正される、ステップを更に有する請求項10に記載の方法。
  12. 前記1つ又は複数の補正基準は、
    前記第1値及び/又は前記第2値の大きさと、
    −前記ジャンプエラーのサイクル数と、
    のうちの少なくとも1つを含む請求項11に記載の方法。
  13. −前記補正済みのデータセットに関数をフィッティングするステップと、
    −前記フィッティングされた関数を分析して前記増幅プロセスの特性を判定するステップと、
    を更に有する請求項10に記載の方法。
  14. 前記データセットを補正するステップは、
    −前記ジャンプエラーの場所Xを識別するステップと、
    −前記ジャンプエラーの高さを判定するステップと、
    −前記大きさを使用して前記ジャンプエラーの前のサイクル数の前記信号強度を補正するか又は前記ジャンプエラーの後のサイクル数について前記データセットを補正するステップと、
    を含む請求項10に記載の方法。
  15. 前記データセットを補正するステップは、
    −1つだけ少ないサイクル数に対応するように、X+2を上回るサイクル数の前記信号強度の値をシフトさせるステップを更に含む請求項14に記載の方法。
  16. −ジャンプエラーを識別した後に、2つの連続的なサイクル数が、異なる符号を有する前記二次導関数の値を有するその他の場所について前記データセットをサーチするステップを更に有する請求項1乃至15のいずれか一項に記載の方法。
  17. 実行された際に、増幅プロセスの増幅曲線においてジャンプエラーを検出するようにコンピュータシステムを制御する複数の命令を保存した一時的ではないコンピュータ可読媒体を有するコンピュータプロダクトであって、
    前記命令は、
    −増幅曲線を表すデータセットを受け取るステップであって、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、サイクル数とそのサイクル数における前記増幅プロセスの信号強度の座標値のペアを有する、ステップと、
    −前記データセットとの間のカーネルの離散畳込みを算出して前記サイクル数における前記データセットの二次導関数を取得するステップと、
    −2つの連続的なサイクル数が、異なる符号を有する前記二次導関数の値を有するかどうかを識別するステップと、
    −第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する前記二次導関数の第1値及び第2値を有している際に、前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定するステップと、
    −前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが前記閾値を上回っているという判定に基づいて、前記増幅曲線を表す前記データセットにおいてジャンプエラーが発生したと識別するステップと、
    を有する、コンピュータプロダクト。
  18. 前記命令は、
    −前記ジャンプエラーの1つ又は複数の特性を判定するステップと、
    −前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、前記データセットを無効化するステップと、
    前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、前記データセットを補正するステップと、
    を更に有する請求項17に記載のコンピュータプロダクト。
  19. ポリメラーゼ連鎖反応(PCR)システムであって、
    −PCR増幅曲線を表すPCRデータセットを生成するPCRデータ取得装置であって、前記データセットは、複数のデータポイントを含み、前記データポイントのそれぞれは、サイクル数とそのサイクル数における前記増幅プロセスの信号強度の座標値のペアを有する、装置と、
    −前記データセットとの間のカーネルの離散畳込みを算出して前記サイクル数における前記データセットの二次導関数を取得し、
    −2つの連続的なサイクル数が、異なる符号を有する前記二次導関数の値を有するかどうかを識別し、
    −第1サイクル数及び第2サイクル数が、それぞれ、異なる符号を有する前記二次導関数の第1値及び第2値を有している際に、前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが閾値を上回っているかどうかを判定し、
    −前記第1値及び前記第2値のうちの少なくとも1つの値の大きさが前記閾値を上回っているという判定に基づいて、前記増幅曲線を表す前記データセットにおいてジャンプエラーが発生したと識別することにより、
    −前記PCRデータセットを処理してジャンプエラーを検出するように適合されたインテリジェントモジュールと、
    を有するPCRシステム。
  20. 前記インテリジェントモジュールは、
    −前記ジャンプエラーの1つ又は複数の特性を判定し、且つ、
    −前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の無効化規準を充足している際に、前記データセットを無効化し、且つ、
    −前記ジャンプエラーの前記1つ又は複数の特性が1つ又は複数の補正基準を充足している際に、前記データセットを補正する、
    ように、更に適合されている請求項19に記載のPCRシステム。
JP2016543190A 2013-12-30 2014-12-29 リアルタイムpcr信号におけるジャンプの検出及び補正 Active JP6431076B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/144,382 US9607128B2 (en) 2013-12-30 2013-12-30 Detection and correction of jumps in real-time PCR signals
US14/144,382 2013-12-30
PCT/EP2014/079356 WO2015101591A1 (en) 2013-12-30 2014-12-29 Detection and correction of jumps in real-time pcr signals

Publications (2)

Publication Number Publication Date
JP2017509040A JP2017509040A (ja) 2017-03-30
JP6431076B2 true JP6431076B2 (ja) 2018-11-28

Family

ID=52232210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016543190A Active JP6431076B2 (ja) 2013-12-30 2014-12-29 リアルタイムpcr信号におけるジャンプの検出及び補正

Country Status (5)

Country Link
US (1) US9607128B2 (ja)
EP (1) EP3090372B1 (ja)
JP (1) JP6431076B2 (ja)
CN (1) CN105849736B (ja)
WO (1) WO2015101591A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102165931B1 (ko) * 2015-09-24 2020-10-14 주식회사 씨젠 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
WO2017171469A1 (en) * 2016-04-01 2017-10-05 Seegene, Inc. . Detection of abnormal signal using two or more datasets
WO2017196112A1 (en) * 2016-05-11 2017-11-16 Seegene, Inc. Detection of abnormal signal in dataset
CN105755159A (zh) * 2016-05-13 2016-07-13 苏州国科闻普生物科技有限公司 自动快速判别荧光定量pcr结果的方法
US20190156920A1 (en) * 2016-06-02 2019-05-23 Seegene, Inc. Method for detecting a target analyte in a sample using a signal change-amount data set
JP2019004814A (ja) * 2017-06-27 2019-01-17 東洋紡株式会社 解析用プログラムおよび解析装置
US11169899B2 (en) 2019-04-15 2021-11-09 Toyota Motor Engineering & Manufacturing North America, Inc. Mitigating data offsets for machine learning
CN113851189B (zh) * 2021-09-24 2022-09-23 中元汇吉生物技术股份有限公司 一种自适应检测pcr荧光基线的方法、装置及其设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2997704A (en) 1958-02-24 1961-08-22 Epsco Inc Signal conversion apparatus
US7680868B2 (en) * 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
US7668663B2 (en) 2005-12-20 2010-02-23 Roche Molecular Systems, Inc. Levenberg-Marquardt outlier spike removal method
US7991562B2 (en) 2005-12-20 2011-08-02 Roche Molecular Systems, Inc. PCR elbow determination using curvature analysis of a double sigmoid
US7587283B2 (en) * 2006-07-01 2009-09-08 Celera Corporation Growth and baseline identification determination for amplification data
WO2008070328A2 (en) * 2006-10-24 2008-06-12 Celera Corporation Systems and methods for baselining and real-time pcr data analysis
US20090119020A1 (en) 2007-09-25 2009-05-07 Roche Molecular Systems, Inc. Pcr elbow determination using quadratic test for curvature analysis of a double sigmoid
US8374795B2 (en) 2008-05-13 2013-02-12 Roche Molecular Systems, Inc. Systems and methods for step discontinuity removal in real-time PCR fluorescence data
CA2736243A1 (en) * 2008-09-09 2010-03-18 Bio-Rad Laboratories, Inc. Multi-stage, regression-based pcr analysis system
US8265879B2 (en) * 2009-04-17 2012-09-11 Roche Molecular Systems, Inc. Determination of single peak melting temperature by PCR analogy and double sigmoid equation
US8219366B2 (en) * 2009-08-26 2012-07-10 Roche Molecular Sytems, Inc. Determination of elbow values for PCR for parabolic shaped curves

Also Published As

Publication number Publication date
EP3090372B1 (en) 2023-06-28
WO2015101591A1 (en) 2015-07-09
CN105849736A (zh) 2016-08-10
US20150186598A1 (en) 2015-07-02
CN105849736B (zh) 2019-08-13
JP2017509040A (ja) 2017-03-30
EP3090372A1 (en) 2016-11-09
US9607128B2 (en) 2017-03-28

Similar Documents

Publication Publication Date Title
JP6431076B2 (ja) リアルタイムpcr信号におけるジャンプの検出及び補正
US11615863B2 (en) Universal method to determine real-time PCR cycle threshold values
US7680868B2 (en) PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
JP5599986B2 (ja) リアルタイムpcr蛍光データ内のステップ型不連続部除去用のシステム及び方法
JP6602374B2 (ja) 試料の分析方法
JP2010081937A (ja) 方程式のないアルゴリズムによるリアルタイムpcrエルボーの呼び出し
KR102385959B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
KR102165933B1 (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
EP2471007B1 (en) Determination of elbow values for pcr for parabolic shaped curves
KR101771402B1 (ko) 핵산 정량 방법
KR102189356B1 (ko) 데이터 세트에서 비정상적인 시그널의 검출
US20180314789A1 (en) Melt curve analysis
JP2017533719A (ja) 出発試料の特性を決定する方法
KR20120097215A (ko) 실시간 중합효소 연쇄 반응의 증폭 프로파일 곡선에 있어서 베이스라인을 결정하는 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181101

R150 Certificate of patent or registration of utility model

Ref document number: 6431076

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250