JP2022050639A - 試料内ターゲット分析物を分析する方法及び装置 - Google Patents

試料内ターゲット分析物を分析する方法及び装置 Download PDF

Info

Publication number
JP2022050639A
JP2022050639A JP2022005073A JP2022005073A JP2022050639A JP 2022050639 A JP2022050639 A JP 2022050639A JP 2022005073 A JP2022005073 A JP 2022005073A JP 2022005073 A JP2022005073 A JP 2022005073A JP 2022050639 A JP2022050639 A JP 2022050639A
Authority
JP
Japan
Prior art keywords
signal
cycle
fitting
data set
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022005073A
Other languages
English (en)
Other versions
JP7379548B2 (ja
Inventor
ウク キム,ヨン
Young Wook Kim
ヤン パク,ヨン
Young Yong Park
ムン コ,サン
Sung Moon Ko
ジョ イ,ヨン
Young Jo Lee
ビッ イ,ハン
Han Bit Lee
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seegene Inc
Original Assignee
Seegene Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seegene Inc filed Critical Seegene Inc
Publication of JP2022050639A publication Critical patent/JP2022050639A/ja
Application granted granted Critical
Publication of JP7379548B2 publication Critical patent/JP7379548B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Organic Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)

Abstract

【課題】試料内ターゲット分析物の存在又は不存在を決定する方法及び装置を提供する。【解決手段】データセットに対する非線形関数のフィッティング正確度をターゲット分析物分析のための直接の指標として用いて、偽陽性及び偽陰性結果、特に偽陽性結果無しでターゲット分析物を分析することができる。【選択図】図3

Description

本発明は、試料内ターゲット分析物を分析する方法及び装置に関する。
核酸増幅のために最も多用されている重合酵素連鎖反応(Polymerse chain reaction:PCR)は、二本鎖DNAの変性、DNA鋳型へのオリゴヌクレオチドプライマーのアニーリング及びDNA重合酵素によるプライマー延長の反復したサイクル過程を含む(Mullis等、米国特許第4,683,195号、第4,683,202号及び第4,800,159号;Saiki et al.,Science230:1350-1354(1985))。
実時間PCR(Real-time PCR)は試料からターゲット核酸分子を実時間で検出するためのPCR基盤技術の一つである。特定ターゲット分析物を検出するために、実時間PCRは、ターゲット分子の量に比例して検出可能な蛍光信号を発生する信号-発生手段を用いる。各測定地点及び当該測定地点における信号値を含むデータセットが得られる。蛍光信号の強度はターゲット分子の量に比例する。データセットから測定地点に対する蛍光信号の強度を表示した増幅曲線(amplification curve)又は増幅プロファイル曲線(amplification profile curve)が得られる。
一般に、実時間PCRによる増幅曲線は、ベースライン(baseline)領域、指数(exponential)領域、停滞(plateau)領域に区分される。指数領域は、PCR増幅産物の増加に比例して放出される蛍光信号が増加する領域であり、停滞領域は、PCR増幅産物の増加及び蛍光信号の放出が飽和状態に達し、それ以上蛍光信号の増加を示さない領域である。ベースライン領域は、PCR初期サイクル中に蛍光信号における変化がほとんどない領域を意味する。ベースライン領域は、PCR反応産物の放出する蛍光信号が検出される程度に十分でないため、反応試料自体のの蛍光信号と測定システム自体の蛍光信号である背景信号(background signal)がベースライン領域の蛍光信号の大部分を占めることがある。
実時間PCRのデータセットからターゲット分析物の増幅が存在するか否かを判断する様々な方法が開発されている。例えば、閾値(threshold value)を用いる方法がある。閾値を用いる方法は、分析すべき全ての反応に対する特定の信号閾値(a
defined signal threshold for all reactions to be analyzed)をあらかじめ決定し、データセットの信号値が前記特定の信号閾値に到達(reach)するか又は渡過(exceed)するかを判断する方法である。しかし、特定の信号閾値を用いて増幅の有無を判断する方法は、次のような判断誤りを有することがある:(i)増幅による信号値ではなく異常信号値又はノイズ信号値が閾値に到達して発生する偽陽性判断;(ii)ベースライニング(baselining)誤りによる偽陰性判断;及び(iii)異常信号値又はノイズ信号値による誤ったCt(Cycle threshold)値の算出。また、閾値を用いる方法は、各反応に適用する特定の信号閾値を導出するために、実反応データセットを最大に収集しなければならないという短所もある。
Jeffrey Lernerは米国登録特許第8,560,247号において、データに対してフィッティングされる関数を得、該関数の勾配(slope)が最大増幅勾配境界(maximum amplification slope bound)を超えるか否かによって、ジャンプエラー(jump error)が存在するか否かを決定する方法を開示する。前記方法は、データにフィッティングされた関数を計算する時に、全データではなくベースライン領域で一部のデータにフィッティングされる関数を計算する。前記方法は、データのベースライン領域にフィッティングされた関数の勾配が最大増幅勾配境界を超えるとジャンプエラーが存在すると決定する。したがって、前記方法は、関数の最大増幅勾配を用いて試料内ターゲット分析物の存在又は不存在を決定することはできず、ジャンプエラーの存在有無だけを決定することができる。
Ronald T.Kurnik等は、米国公開特許第2009-0119020号においてPCRカーブのような成長曲線(growth curve)のデータが有効(valid)又は有意(significant)の成長を示すかを判断する方法を開示した。前記方法は、データと二次関数をフィッティングし、フィッティングされた二次関数を得、二次関数の統計学的に有意な値(例えば、R-square値)を求めた後に、統計学的に有意な値があらかじめ定められた特定閾値(例えば、0.90~0.99)を超えるか否かを判断する。前記方法では統計学的に有意な値があらかじめ定められた閾値を超える場合には、データに有効又は有意な成長(growth)が存在しないと決定する。前記方法は、データが二次関数と正確にフィッティングされるほどターゲット分析物が不存在する確率が高いので、R-square(R)値が閾値よりも大きい場合、データを切り捨てる(discard)構成を開示する。しかし、前記方法は、二次関数のフィッティングを用いてターゲット分析物が不存在することだけを決定するので、ターゲット分析物が存在するか否かを判断するためには、Ct値を求める別の段階を行う必要がある。
実時間PCRから得られたデータに有意のターゲット分析物の増幅が存在するか否かを判断するための方法としてより効果的な方法が要求される。
蛍光信号を用いた試料の分析は次のように行われる。まず、LEDなどの光源を用いて発光体にエネルギーを供給し、供給されたエネルギーによって発光体の電子が励起状態から基底状態に戻りながら発光体が特定波長の光を放出(emit)する。分析機器は光ダイオード(Photodiode)又はCCDなどを用いて特定波長の光を電気的信号に変換し、試料分析に必要な情報を提供する。
同一量の発光体が試料から発生しても、機器間光源(例、LED)の光量の差(uneven illumination)、光-電気変換装置の性能偏差(variation)によって分析機器ごとに異なる信号値を提供する。機器間の信号差を機器間信号偏差という。
機器間信号偏差だけでなく、単一の同一分析機器によって同種、同量のターゲット分析物に対して行われた複数の反応の分析結果は、信号の偏差を有することもある。なぜなら、反応が行われる機器上の反応ウェルの位置差、又は反応混合物組成又は濃度の微細な差のような様々な反応環境における差異のためである。同一機器内で反応中の信号差を機器内信号偏差という。
測定データの正確且つ高信頼度の分析のためには信号偏差のような問題の解決が必要であり、問題を解決するために様々な方法が用いられている。
最も基本的な方法として、ハードウェア補正方法が用いられる。例えば、分析機器の生産に当たり、LED光源の強度のような各分析機器の一部部品の特性は、同一試料に対する機器間信号偏差が減少し、適切な範囲内で維持されるように補正又は調節される。他の方法は、基準染色剤(reference dye)を用いる方法である。一定量の信号を生産する基準染色剤(reference dye;例えば、ROXTM又はフルオレセイン(fluorescein))を反応に共に含め、基準染色剤から発生する信号を用いて試料から発生した信号を補正する。
既存の方法はいくつかの限界を有する。ハードウェア補正は正確度に限界があり、分析機器の老朽化によって発生する偏差を除去するために追加の補正が必要である。しかも、ハードウェア補正は機器間信号偏差を減少できるだけで、機器内信号偏差を減少させることはできない。
基準染色剤を用いた信号の補正は、反応当たりの費用が増加し、また各反応に用いられる基準染色剤における量的及び質的偏差(variation)は他の誤差(error)を引き起こすことがある。また、基準染色剤の利用は、前記基準染色剤と反応混合物においてターゲット分析物の存在を決定するために用いられる他の染色剤(dye)間の干渉現象の可能性を増加させることがある。特に、多数の染色剤が用いられ、それらの蛍光を検出しなければならないマルチプレクスPCRでは、干渉現象が非常に重要な問題である。一方、信号補正のために一つの染色剤及び一つの検出チャネルを割り当てると、同時検出可能なターゲットが1つ減るため、製品競争力の側面においてかなりの短所が発生する。
したがって、ハードウェアに対する直接制御、又は追加の基準染色剤の使用無しにデータセットを補正し、機器間及び機器内信号偏差を減少できる新しい方法の開発が必要である。
一方、実時間PCRデータの正確で再現性(repeatability)ある分析のために得られた増幅曲線の一般化(normalization)過程が重要である。得られた増幅曲線は、ベースライン領域を認識する過程及びベースライン領域の背景信号(background signal)を除去する過程を通じて一般化される。
背景信号(background signal)は、PCR反応時に、反応条件及び環境の変化を反映することから反応ごとに異なり、試料内の核酸量とは関係ないベースライン移動(baseline drift)が頻繁に現れる。ベースライン移動は、反応間増幅曲線の比較を難しくさせ、ターゲット核酸検出において偽陽性、偽陰性の結果を招きやすい。したがって、PCRデータ分析において、ベースライン領域の設定及びベースラインに基づく実験データの修正が必要である。
従来の一方法は、PCR初期サイクルのうち、任意のサイクル領域(例えば、3~15サイクル)をベースラインとして決定するか、或いは増幅曲線を実験者が分析して、任意に、増幅が始まる前の特定サイクル領域をベースラインとして設定した。従来の他の方法は、増幅曲線の二次微分(second derivative)を生成し、特徴を有するポイントをベースラインの端にしてベースライン領域を決定した(米国特許登録公報第8,219,324号)。
既存の方法はいくつかの短所がある。
全てのベースラインを任意サイクル領域として決定する方法は、反応ごとに異なる背景信号の変化を補正することはできるが、ベースライン移動(baseline drift)が発生した場合には適切でない。また、増幅領域の開始は、初期試料に存在するターゲット核酸の量によって変わるので、ベースライン領域があらかじめ決定されている場合、あらかじめ決定されたベースライン領域を様々なサンプルに一律的に適用することは好ましくない。
ベースライン領域を実験者が任意に決定する場合、同一増幅曲線であっても分析する実験者によってベースライン領域設定が変わることがあり、実験者の決定によって実際増幅産物の量が変わり得るので、信頼できる結果が導出し難い。
または、従来の他の方法によれば、ベースラインが複雑なアルゴリズムによって決定されるが、アルゴリズムには明確に定義されない多くのパラメータが必要であり、しばしば最適化し難くなる。
したがって、客観的且つ正確な実験結果を算出するために、サンプル別に客観的なベースライン領域設定による新しい増幅曲線補正方法が必要である。
ターゲット核酸配列の検出のために、実時間方式でターゲット増幅をモニタリングしながらターゲット核酸配列を検出する実時間検出方法が広く用いられている。実時間検出方法は一般に、ターゲット核酸配列と特異的に混成化される標識されたプローブ又はプライマーを使用する。標識されたプローブとターゲット核酸配列間の混成化を用いる方法の例として、ヘアピン構造を有する二重標識されたプローブを用いたMolecular beacon方法(Tyagi et al.,Nature Biotechnology v.14MARCH 1996)、HyBeacon方法(French DJ et al.,Mol.Cell Probes,15(6):363-374(2001))、供与体及び受容体でそれぞれ標識された2個のプローブを用いた混成化プローブ方法(Bernad et al,147-148 Clin Chem 2000;46)及び単一標識されたオリゴヌクレオチドを用いたLux方法(米国特許第7,537,886号)がある。また、二重標識されたプローブとDNAポリメラーゼの5’-ヌクレアーゼの活性による前記プローブの切断を用いたTaqMan方法(米国特許第5,210,015号及び第5,538,848号)が本技術分野で広く用いられている。
標識されたプライマーを用いた方法の例には、Sunriseプライマー方法(Nazarenko et al,2516-2521 Nucleic Acids Research,1997,v.25 no.12、及び米国特許第6,117,635号)、Scorpionプライマー方法(Whitcombe et al,804-807,Nature Biotechnology v.17 AUGUST 1999及び米国特許第6,326,145)及びTSGプライマー方法(WO2011/078441)がある。
代案の方法として、ターゲット核酸配列の存在によって形成される二合体(duplex)を用いた実時間検出方法が提案されてきた:Invader分析(米国特許第5,691,142号、第6,358,691号及び第6,194,149号)、PTOCE(PTO cleavage AND extension)方法(WO2012/096523)、PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization)方法(WO2013/115442)、PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization)方法(PCT/KR2013/012312)。
従来の実時間検出技法はターゲット増幅と関連又は非関連している信号増幅工程において一つの選択された検出温度で蛍光標識から生成された信号を検出する。従来の実時間検出技術によって単一反応容器内で単一類型の標識を用いて多数のターゲット核酸配列を検出するとき、これらのターゲット核酸配列に対して生成された信号は互いに区別されない。したがって、従来の実時間検出技法は一般の多数のターゲット核酸配列を検出するために異なる類型の標識を用いる。Tm差を用いたメルティング分析は、単一類型の標識を用いる場合にも多数のターゲット核酸配列を検出可能にする。しかしながら、メルティング分析は実時間技術に比べて長い時間がかかり、ターゲット配列が増加するほど、異なるTmを有するプローブの設計がさらに難しくなるという深刻な短所がある。
したがって、メルティング分析に依存しない、単一反応容器内で単一類型の標識及び単一類型の検出器を用いて多数のターゲット核酸配列を検出する方法が開発されると、著しく向上した便宜性、費用効果及び効率性をもって多数のターゲット核酸配列を検出可能になるだろう。また、前記方法を他の検出方法(例えば、メルティング分析)と組み合わせると、非常に向上した効率で単一反応容器で単一類型のラベルを用いて多数のターゲット核酸配列を検出可能になるであろう。
本明細書全体を通じて様々な論文及び特許文献が参照され、その引用が表示されている。引用された論文及び特許文献の開示内容はその全体として本明細書に参照として挿入され、本発明の属する技術分野の水準及び本発明の内容がより明確に説明される。
本発明者らは、信号-発生反応から得たデータセットから誤り無しで(特に、偽陽性無しで)ターゲット分析物を分析できる技術を開発しようと努力した。特に、本発明者らは、核酸増幅反応においてCt値を得るための閾値(threshold)の設定による従来の方法における問題点及び短所を克服しようと努力した。その結果、本発明者らは、信号-発生反応から得たデータセット又は加工されたデータセット(processed data set)に対する非線形関数のフィッティング正確度(fitting accuracy)が、試料内ターゲット分析物の存在又は不存在を決定できる指標(indicator)になり得ることを糾明した。本発明者らは、特に、核酸増幅反応においてCt値を得るための閾値の設定なしにもフィッティング正確度を用いてターゲット分析物の存在又は不存在を決定できることを糾明し、上述した従来の問題点を解決できることを糾明した。
したがって、本発明の目的は、試料内ターゲット分析物の分析方法を提供することにある。
本発明の他の目的は、試料内ターゲット分析物の分析装置を提供することにある。
本発明のさらに他の目的は、試料内ターゲット分析物の分析を実行するためのコンピュータ読取り可能な記録媒体を提供することにある。
本発明の他の目的及び利点は、下記の実施例、特許請求の範囲及び図面によってより明確になる。
I.非線形関数を用いて試料内ターゲット分析物を分析する方法
本発明の一態様によれば、本発明は、次の段階を含む試料内ターゲット分析物の分析方法を提供する:
前記ターゲット分析物に対するデータセットを得る段階;前記データセットは、信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
前記データセットを補正する段階;
前記補正されたデータセットに対する非線形関数を生成する段階;
前記補正されたデータセットに対する前記非線形関数のフィッティング正確度を決定する段階;及び
前記フィッティング正確度を用いて前記試料内ターゲット分析物の存在又は不存在を決定する段階。
本発明は“ターゲット分析物を分析する方法”と表現されるが、分析結果が究極的にターゲット分析物の検出に用いられることから、“ターゲット分析物の分析方法”又は“ターゲット分析物の検出方法”と表現されてもよい。
図3は、本発明の方法に対する順序図である。図3を参照して、本発明の方法を各段階別に詳細に説明すると、次の通りである。
ターゲット分析物に対するデータセットを取得(段階310)
本発明によれば、ターゲット分析物に対するデータセットを得る。前記データセットは信号-発生手段を用いる前記ターゲット分析物に対する信号-発生反応から得られ、前記データセットは、サイクル番号及び信号値を含む複数のデータ地点を含む。
本明細書において用語“ターゲット分析物(target analyte)”は、様々な物質(例えば、化合物のような生物学的物質及び非生物学的物質)を含み、具体的に生物学的物質、より具体的に核酸分子(例えば、DNA及びRNA)、タンパク質、ペプチド、炭水化物、脂質、アミノ酸、生物学的化合物、ホルモン、抗体、抗原及び代謝物質である。最も具体的に、ターゲット分析物はターゲット核酸分子である。
本明細書において用語“ターゲット核酸分子”、“ターゲット核酸”、“ターゲット核酸配列”又は“ターゲット配列”は、分析、検出又は定量しようとする核酸配列を意味する。ターゲット核酸配列は、一本鎖又は二本鎖であり得る。ターゲット核酸配列は、試料内に初期に存在する配列だけでなく、反応過程で生成された配列も含む。
ターゲット核酸配列は、DNA(gDNA及びcDNA)、RNA分子及びそれらの混成体(キメラ核酸)を含む。前記配列は、二本鎖又は一本鎖の形態であり得る。出発物質として前記核酸配列が二本鎖である場合、前記二本鎖を一本鎖又は部分的一本鎖に変成させることができる。変性過程は、従来技術によって実施でき、例えば、熱、アルカリ、ホルムアミド、ウレア及びグリコキサル処理、酵素的方法(例えば、ヘリカーゼの作用)及び結合タンパク質を含むが、これに限定されるものではない。例えば、変性は、80~105℃の温度で熱処理して達成され得る。このような処理の一般的な方法は、Joseph Sambrook、等、Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory
Press,Cold Spring Harbor,N.Y.(2001)に開示されている。
ターゲット核酸配列は、いかなる自然(naturally occurring)原核細胞核酸、真核細胞(例えば、原生動物と寄生動物、菌類、酵母、高等植物、下等動物、及び哺乳動物及びヒトを含む高等動物)核酸、ウイルス(例えば、ヘルペスウイルス、HIV、インフルエンザウイルス、エプスタイン-バーウイルス、肝炎ウイルス、ポリオウイルスなど)核酸又はウイロイド核酸をも含む。ターゲット核酸配列は、組換え方法又は化学的合成法で製造された又は製造可能な核酸分子を含む。したがって、ターゲット核酸配列は自然界に存在したり非存在するものであり得る。ターゲット核酸配列は公知又は非公知の配列を含む。
本明細書において用語“試料”とは、生物学的試料(例えば、細胞、組織及び体液)及び非生物学的試料(例えば、食べ物、水及び土壌)を含み、前記生物学的試料は、例えば、ウイルス、細菌、組織、細胞、血液(全血、血漿及び血清を含む)、リンパ、骨髄液、唾液、喀痰(sputum)、スワブ(swab)、吸引液(aspiration)、牛乳、小便(urine)、糞便(stool)、眼球液、精液、脳抽出物、脊髄液、関節液、胸腺液、気管支洗浄液、腹水及び羊水である。ターゲット分析物がターゲット核酸分子である場合、前記試料は核酸抽出(nucleic acid extraction)過程を経ることができる(参照:Sambrook,J.et al.,Molecular Cloning.A Laboratory Manual,3rd ed.Cold Spring Harbor Press(2001))。前記核酸抽出過程は試料の種類によって変わり得る。また、前記抽出された核酸がRNAである場合、cDNAを合成するための逆転写(reverse transcription)過程をさらに経ることができる(参照:Sambrook,J.et al.,Molecular Cloning.A Laboratory Manual,3rd ed.Cold Spring Harbor Press(2001))。
本明細書において用語“信号-発生反応”は、試料内ターゲット分析物の特性(properties)に依存して信号を発生させる反応を意味する。前記特性は、例えばターゲット分析物の活性、量又は存在(又は不存在)であり、具体的に、試料内ターゲット分析物の存在又は不存在である。本発明の信号-発生反応は、生物学的反応及び化学的反応を含む。前記生物学的反応はPCR、実時間PCR、マイクロアレイ及びインベーダー(invader)分析のような遺伝的分析過程、免疫学的分析過程及びバクテリア成長分析を含む。前記化学的反応は、化学物質の生成、変化又は破壊を含む化学的分析過程を含む。本発明の一具現例によれば、信号-発生反応は遺伝的分析過程である。
本発明の一具現例によれば、前記信号-発生反応は、核酸増幅反応、酵素反応又は微生物成長である。
信号-発生反応は信号変化を伴う。本明細書において用語“信号”とは、測定可能なアウトプット(output)を意味する。
信号-発生反応の進行程度は信号を測定して評価される。信号値又は信号変化はターゲット分析物の特性、具体的に存在又は不存在を定性的に又は定量的に示す指示子の役割を担う。前記信号変化は、信号の増加の他に減少も含む。
本明細書において用語“信号-発生手段”は、分析しようとするターゲット分析物の特性、具体的に存在又は不存在を示す信号の発生に用いられる物質を意味する。
様々な信号-発生手段が知られている。信号-発生手段は標識を含む。前記標識は、蛍光標識、発光標識、化学発光標識、電気化学的標識及び金属標識を含む。単一標識、又は供与分子(donor molecule)及び受容分子(acceptor molecule)を含む相互作用的な二重標識が一つ以上のオリゴヌクレオチドに結合した形態で用いられ得る。または、インターカレーティング染料(intercalating dye)自体も信号-発生手段としての役割を担うことができる。前記信号-発生手段は、信号を発生させるために、核酸切断活性を有する酵素(例えば、5’核酸切断活性を有する酵素又は3’核酸切断活性を有する酵素)及びオリゴヌクレオチド(例えば、プライマー及びプローブ)をさらに含むことができる。
信号-発生手段としての役割を担うオリゴヌクレオチドの例には、ターゲット核酸配列に特異的に混成化するオリゴヌクレオチドを含む(例えば、プローブ及びプライマー);ターゲット核酸配列に混成化されたプローブ又はプライマーが切断されて断片を放出した場合、信号-発生手段としての役割を担うオリゴヌクレオチドは、前記断片に特異的に混成化されるキャプチャーオリゴヌクレオチドを含む;前記キャプチャーオリゴヌクレオチドに混成化された断片が延長されて延長鎖を生成する場合に、信号-発生手段としての役割を担うオリゴヌクレオチドは、前記延長鎖に特異的に混成化されるオリゴヌクレオチドを含む;信号-発生手段としての役割を担うオリゴヌクレオチドは、前記キャプチャーオリゴヌクレオチドに特異的に混成化されるオリゴヌクレオチドを含む;そして、信号-発生手段としての役割を担うオリゴヌクレオチドは、その組合せを含む。
本発明の一具現例によれば、前記信号-発生手段は、蛍光標識を含む。より具体的に、前記信号-発生手段は、蛍光単一標識、又は供与分子(donor molecule)及び受容分子(acceptor molecule)を含む相互作用的な二重標識(例えば、蛍光レポーター分子及びクエンチャー分子を含む相互作用的な二重標識)を含む。
前記信号-発生手段を用いてターゲット分析物、特にターゲット核酸分子の存在を示す信号を発生させる様々な方法が知られている。これらの方法は次を含む:TaqManプローブ方法(米国特許第5,210,015号)、分子ビーコン方法(Tyagi等、Nature Biotechnology,14(3):303(1996))、スコルピオン(Scorpion)方法(Whitcombe等、Nature Biotechnology 17:804-807(1999))、サンライズ(Sunrise又はAmplifluor)方法(Nazarenko等、Nucleic Acids Research,25(12):2516-2521(1997)、及び米国特許第6,117,635号)、ルクス(Lux)方法(米国特許第7,537,886号)、CPT(Duck P、等,Biotechniques,9:142-148(1990))、LNA方法(米国特許第6,977,295号)、プレクサー(Plexor)方法(Sherrill CB、等、Journal of the American Chemical Society,126:4550-4556(2004))、Hybeacons方法(D.J.French、等、Molecular and Cellular Probes(2001)13,363-374及び米国特許第7,348,141号)、二重標識された自己-クエンシングされたプローブ方法(Dual-labeled,self-quenched probe;米国特許第5,876,930号)、混成化プローブ方法(Bernard PS,et al.,Clin Chem
2000,46,147-148)、PTOCE(PTO cleavage and
extension)方法(WO2012/096523)、PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization)方法(WO2013/115442)、PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization)方法(PCT/KR2013/012312)及びCER方法(WO2011/037306)。
本発明の一具現例によれば、前記信号-発生反応は、前記ターゲット核酸分子の増幅により又は増幅無しで信号値を増幅する反応である。
本明細書において用語“増幅反応”は、信号を増加又は減少させる反応を意味する。
本発明の一具現例によれば、前記増幅反応は、ターゲット分析物の存在に依存して前記信号-発生手段によって発生する信号の増加(又は増幅)反応を意味する。このような増幅反応はターゲット分析物(例えば、核酸分子)の増幅が伴われても伴われなくてもよい。より具体的に、本発明において増幅反応は、ターゲット分析物の増幅が伴われる信号の増幅反応を意味する。
本発明の一具現例によれば、ターゲット分析物(例えば、ターゲット核酸分子)の存在を示す信号を増幅させるための増幅反応は、ターゲット核酸分子が増幅されながら信号も増幅される方法で実施され得る(例えば、実時間PCR方法)。または、前記増幅反応は、ターゲット分析物が増幅されず、信号だけが増幅される方法で実施されてもよい[例えば、CPT方法(Duck P,et al.,Biotechniques,9:142-148(1990))、インベーダーアッセイ(Invader assay)(米国特許第6,358,691号及び第6,194,149号)]
ターゲット分析物、特にターゲット核酸分子は様々な方法で増幅され得る。例えば、ターゲット分析物の増幅に対する様々な方法が知られており、これらの方法は、重合酵素連鎖反応(polymerase chain reaction(PCR))、リガーゼ連鎖反応(ligase chain reaction(LCR))(米国特許第4,683,195号及び第4,683,202号;PCR Protocols:A Guide to Methods and Applications(Innis et
al.,eds,1990))、鎖置換増幅(strand displacement amplification(SDA))(Walker,et al.Nucleic Acids Res.20(7):1691-6(1992);Walker PCR Methods Appl3(1):1-6(1993))、転写媒介増幅(transcription-mediated amplification)(Phyffer,et al.,J.Clin.Microbiol.34:834-841(1996);Vuorinen,et al.,J.Clin.Microbiol.33:1856-1859(1995))、核酸配列基盤増幅(nucleic acid sequence-based amplification(NASBA))(Compton,Nature350(6313):91-2(1991))、ローリングサークル増幅(rolling circle amplification,RCA)(Lisby,Mol.Biotechnol.12(1):75-99(1999);Hatch et al.,Genet.Anal.15(2):35-40(1999))及びQ-べータレプリカーゼ(Q-Beta Replicase)(Lizardi et al.,BiolTechnology6:1197(1988))を含むが、これに限定されない。
本発明の一具現例によれば、前記増幅反応は、ターゲット分析物(具体的に、ターゲット核酸分子)の増幅が伴われながら信号を増幅する。本発明の一具現例によれば、前記増幅反応はPCR又は実時間PCRによって実施される。
本発明の一具現例によれば、前記信号-発生手段は二合体(duplex)の形成に依存して信号を生成させる。信号-発生手段と共に使われる表現“二合体の形成に依存して信号を生成”は、検出される信号が2つの核酸分子の結合又は分離に依存して提供されることを意味する。具体的に、信号は、前記ターゲット核酸配列に特異的に混成化された媒介オリゴヌクレオチド(mediation oligonucleotide)の切断に依存して形成された二合体によって生成される。本明細書において用語“媒介オリゴヌクレオチド(mediation oligonucleotide)”とは、ターゲット核酸配列を含まない二合体の生成を媒介するオリゴヌクレオチドである。本発明の一具現例によれば、前記媒介オリゴヌクレオチド自体の切断は信号を生成しなく、前記切断によって形成された断片は、前記媒介オリゴヌクレオチドの混成化及び切断後の信号生成のための連続的な反応に関与する。本発明の一具現例によれば、前記媒介オリゴヌクレオチドは、ターゲット核酸配列に混成化して切断されて断片を放出して二合体の生成を媒介するオリゴヌクレオチドを含む。具体的に、前記断片は、キャプチャーオリゴヌクレオチド(capture oligonucleotide)において前記断片の延長によって二合体の生成を媒介する。本発明の一具現例によれば、前記媒介オリゴヌクレオチドは、(i)前記ターゲット核酸配列に相補的な混成化ヌクレオチド配列を含む3’-ターゲッティング部位(targeting portion)及び前記ターゲット核酸配列に非相補的なヌクレオチド配列を含む5’-タギング部位(tagging portion)を含む。本発明の一具現例によれば、媒介オリゴヌクレオチドの切断は、断片を放出し、前記断片はキャプチャーオリゴヌクレオチドに特異的に混成化され、前記キャプチャーオリゴヌクレオチド上で延長される。本発明の一具現例によれば、ターゲット核酸配列に混成化された媒介オリゴヌクレオチドは切断されて断片を放出し、前記断片はキャプチャーオリゴヌクレオチドに特異的に混成化され、前記断片は延長されて延長鎖を形成し、前記延長鎖及び前記キャプチャーオリゴヌクレオチドとの間に延長二合体を形成して、前記ターゲット核酸配列の存在を示す信号を提供する。二合体の形成に依存して信号を発生する信号-発生手段の代表例は、PTOCE方法である(WO2012/096523)。
本発明の一具現例によれば、前記信号-発生手段は、検出オリゴヌクレオチドの切断に依存して信号を生成させる。具体的に、前記信号はターゲット核酸配列に前記検出オリゴヌクレオチドの混成化及び前記検出オリゴヌクレオチドの切断によって生成される。ターゲット核酸配列への前記検出オリゴヌクレオチドの混成化及び前記検出オリゴヌクレオチドの切断による信号は、TaqManプローブ方法(米国特許第5,210,015号及び第5,538,848号)を含む様々な方法で生成され得る。
増幅反応によって得るデータセットには増幅サイクル又はサイクル番号が含まれる。
本明細書において用語“サイクル”は、一定の条件の変化を伴った複数の測定において、前記条件の変化単位を指す。前記一定の条件の変化は、例えば、温度、反応時間、反応回数、濃度、pH及び/又は測定対象(例えば、ターゲット核酸分子)の複製回数などの増加又は減少を意味する。したがって、サイクルは、時間(time)又は過程(process)サイクル、単位運営(unit operation)サイクル及び再生産(reproductive)サイクルであり得る。
一例として、基質の濃度による酵素の基質分解能力を測定する場合、基質濃度を異ならせて数回酵素の基質分解度合を測定した後、それによって酵素の基質分解能力を分析する。このとき、一定の条件の変化は基質濃度の増加であり、用いられた基質濃度増加単位が1サイクルに設定される。
他の例として、核酸の等温増幅反応(isothermal amplification)の場合、一つの試料を反応時間を異ならせて数回測定でき、この場合、反応時間が条件の変化であり、反応時間単位が1サイクルに設定される。
より具体的に、用語“サイクル”は、一定の過程の反応を反復したり一定の時間間隔基準で反応を反復する場合、前記反復の1単位を意味する。
一例として、重合酵素連鎖反応(PCR)の場合、1サイクルは、ターゲット核酸分子の変性段階(denaturation)、前記ターゲット核酸分子及びプライマー間のアニーリング(混成化)段階及びプライマーの延長段階(extension)を含む反応単位を意味する。この場合、一定の条件の変化は反応の反復回数の増加であり、前記一連の段階を含む反応の反復単位が1サイクルに該当する。
信号-発生反応から得たデータセットは、サイクル番号及び信号値を含む複数のデータ地点を含む。
本明細書において用語“信号の値”又は“信号値”は、信号-発生反応のサイクルにおいて実際的に測定された信号の値(例えば、信号の強度)又はその変形値を意味する。前記変形値は、測定された信号値の数学的に加工された値を含むことができる。測定された信号値の数学的に加工された値の例は、測定された信号値のログ値又は導関数値(derivatives)を含むことができる。測定された信号値の導関数値は多重-導関数値を含むことができる。
本明細書において用語“データ地点(data point)”は、サイクル番号及び信号値を含む一つの座標値(a coordinate value)を意味する。用語“データ”とは、データセットを構成する全ての情報を意味する。例えば、増幅反応のサ
イクル及び信号値はそれぞれデータである。
信号-発生反応、特に増幅反応から得られたデータ地点は、二次元直交座標系に表示可能な座標値で表示され得る。前記座標値においてX-軸は増幅反応の当該サイクル数を示し、Y-軸は当該サイクルで測定又は加工された信号値を示す。
本明細書において用語“データセット”とは、前記データ地点の集合を意味する。例えば、データセットは、信号-発生手段を用いる信号-発生反応(例えば、増幅反応)から直接に得られるデータ地点の集合である生データセット(raw data set)を含むことができる。或いは、前記信号-発生反応から直接に得られたデータ地点の集合を含むデータセットの変形によって得られる変形されたデータセットであってもよい。前記データセットは、信号-発生反応から得られるデータ地点又はその変形されたデータ地点の一部又は全体を含むことができる。
データセットはプロットされ得、増幅曲線は前記データセットから得ることができる。
本発明の一具現例によれば、本発明の方法は、データセットを得るための信号-発生反応を行う段階をさらに含む。
データセットを補正(段階320)
データセットを補正する。補正されたデータセットは、データセットを標準化(標準化過程)して生成されるか、データセットに含まれたノイズを除去(ノイズ除去過程)して提供され得る。一具現例によれば、データセットは標準化過程及びノイズ除去過程の両方を用いて補正される。標準化過程はノイズ除去過程の前に行わてもよく後に行われてもよい。
(A)データセットの標準化
データセットは公知の様々な方法で標準化され得る。
一具現例によれば、前記データセットの標準化は、本出願人が既に開発したWO2017/086762に開示されたSBN方法によって実施される。非-線形フィッティング関数を用いる本発明の方法への前記SBN方法の適用は、WO2017/086762及び本特許出願の明細書を参照して当業者にとって容易に実施可能であることが、当業者には理解できよう。前記SBN方法の詳細は後述されるだろう。
一具現例によれば、前記データセットの標準化は、次を含む段階によって実施される:(i)基準サイクルにおける信号値又は(ii)前記基準サイクルにおける前記信号値の変形値を用いて標準化係数を生成する段階;及び前記標準化係数を前記データセットの信号値に適用して前記補正されたデータセットを生成する段階。データセットは第1データセットと表記され、標準化されたデータセットは第2データセットと表記され得る。
(A-1)標準化係数を生成
(i)基準サイクルにおける信号値又は(ii)基準サイクルにおける信号値の変形値を用いて標準化係数が生成される。
基準サイクルにおける信号値が標準化係数になり得る。基準サイクルにおける信号値をデータセットの信号値に適用してデータセットを標準化する。一例において、基準サイクルにおける信号値でデータセットの信号値を割ることであり得る。
基準サイクルにおける信号値の変形値を用いて標準化係数が生成される場合、基準サイクルにおける信号値と基準値との関係を用いて標準化係数が決定され得る。基準サイクルにおける信号値と基準値との関係は、基準サイクルにおける信号値と基準値との差であり得る。具体的に、基準サイクルにおける信号値と基準値との差は、基準サイクルにおける信号値と基準値の比(ratio)である。一具現例によれば、変形値を用いてデータセットを標準化することは、変形値でデータセットの信号値を割ることであり得る。
一具現例によれば、基準サイクルは1サイクル又は複数のサイクルである。具体的に、データセットのサイクル5が基準サイクルとして選択され得る。或いは、サイクル4、5及び6が前記基準サイクルとして選択されてもよい。基準サイクルが複数である場合、複数のサイクルにおける各信号値の平均値が基準サイクルにおける信号値として用いられ得る。
基準サイクルは、信号-発生反応において信号増幅が検出されないサイクルであり得る。例えば、核酸増幅反応から得られたデータセットの場合、基準サイクルはベースライン領域から選択され得る。
本発明の一具現例によれば、信号-発生反応は、ベースライン領域と信号増幅領域を含む反応であり、基準サイクルはベースライン領域に位置する。本発明の基準サイクルは、50、40、30、20、19、18、17、16、15、14、13、12、11、10、9又は8番目のサイクル以下であり得る。具体的に、基準サイクルは、サイクル1~30、サイクル2~30、サイクル2~20、サイクル2~15、サイクル2~10、サイクル2~8、サイクル3~30、サイクル3~20、サイクル3~15、サイクル3~10、サイクル3~9、サイクル3~8、サイクル4~8又はサイクル5~8のいずれかと決定され得る。
本発明の一具現例によれば、前記基準サイクルは1サイクルである。また、前記基準サイクルは2以上のサイクルを含んでもよく、基準サイクルにおける信号値は複数の信号値を含む。
例えば、4、5、及び6番目のサイクルが基準サイクルと指定されてもよく、これら基準サイクルにおける信号値の平均値を、標準化係数を提供するための信号値として用いることができる。
標準化係数として、基準サイクルにおける信号値をそのまま用いてもよいが、また基準サイクルにおける信号値の変形値を用いてもよい。
一具現例によれば、変形値は、基準サイクルにおける信号値と基準値との関係を決定して提供され得る。変形値が基準サイクルにおける信号値と基準値との比(ratio)として決定される場合、変形値は次の式1によって提供され得る。
Figure 2022050639000002

例えば、基準サイクルとして5番目のサイクルであり、5番目のサイクルにおける信号値が13,285RFUであり、基準値が9000RFUであるとき、変形値は1.48になり得る。
基準値は任意に定められ得る。具体的に、基準値は0又は1以外の実数の中から任意に定められた値である。一具現例によれば、基準値は各サイクルにおける信号値の平均値±標準偏差の範囲内で決定される。
本発明の一具現例によれば、基準値は、(i)基準総信号変化値(reference
total signal change value)に対する標準データセットの総信号変化値(total signal change value)の比率;前記標準データセットは、知られた濃度のターゲット分析物に対する信号-発生反応によって得られ、及び(ii)標準データセットによって決定され得る。具体的に、基準総信号変化値に対する標準データセットの総信号変化値の比率を用いて標準データセットの基準サイクルの信号値を補正し、補正された標準データセットの基準サイクルの信号値から基準値を決定する。一例において、補正された標準データセットの基準サイクルの信号値が基準値として決定される。
標準データセットとは、知られた濃度のターゲット分析物に対する信号-発生反応から得られたデータセットを指す。
本発明の一具現例によれば、前記データセットは総信号変化値を用いて補正される。本明細書において用語“総信号変化値(total signal change value)”は、データセットにおいて(増加又は減少された)信号変化量を意味する。データセットの一区間で総信号変化値を決定する場合、データセットの一区間で最初のサイクル及び最後のサイクルにおける信号値の差又はデータセットの一区間における最大信号値と最小信号値の差が総信号変化値として決定され得る。
信号-発生反応が同一の条件下で同一の濃度のターゲット分析物を用いて実施される場合、同一の総信号変化値は、同一又は互いに異なる装備から理論的に算出され得る。したがって、総信号変化値を基準にデータセットを補正する場合、複数のデータセット間の偏差が減少される。
本発明の一具現例によれば、基準総信号変化値は、ターゲット分析物に対するデータセットとは別個の信号発生反応から得られた標準データセットの総信号変化値である。本発明の基準総信号変化値は、知られた濃度のターゲット分析物に対する信号-発生反応から得られたデータセットから決定され得る。
標準化しようとするデータセットにおける基準サイクルの信号値を基準値で割って標準化係数を提供することができる。
(A-2)標準化係数をデータセットに適用
標準化係数をデータセットに適用して標準化されたデータセットを生成する。標準化係数をデータセットに適用する方式は様々である。標準化係数を比(ratio)として決定した場合、標準化係数は次式2のように適用され、標準化されたデータセットを生成する。
Figure 2022050639000003
式2で、第1データセットは標準化以前のデータセットであり、第2データセットは標準化以後のデータセットである。
本発明の一具現例によれば、前記信号-発生反応は、異なる反応環境(reaction environment)で同一ターゲット分析物に対する複数の信号-発生反応を含み;前記データセットは複数のデータセットであり、前記複数のデータセットは前記複数の信号-発生反応の複数のセットから得られ;前記基準サイクル、又は前記基準サイクル及び前記基準値は、前記複数のデータセットに同一に適用される。一具現例によれば、前記複数の信号-発生反応は、それぞれ異なる機器、異なる反応チューブ又はウェル、異なる試料、異なる量のターゲット分析物、又は異なるプライマー又はプローブを含む異なる反応環境で実施される。
一具現例によれば、前記補正されたデータセットは、(i)前記データセットに前記標準化係数を適用して標準化されたデータセットを生成したり、又は(ii)前記データセット又は前記標準化されたデータセットをベースライニングして生成される。
(B)前記データセットにおいてノイズを除去
(B-1)ベースライニング
(B-1-a)従来のベースライニング方法
本発明の一具現例によれば、前記データセット又は標準化されたデータセットは、前記データセット又は標準化されたデータセットから背景信号を除去するためにベースライニングすることができる。ベースライン差し引きされたデータセット(baseline subtracted data set)は、当業界に公知の様々な方法によって得られる(米国特許第8,560,247号及びWO2016/052991)。
(B-1-b)対称軸を有する二次関数を用いてベースライニング
この接近法は、本出願人によって開発された新規のベースライニング方法である。
標準化前データセット及び標準化後データセットを含むデータセットは、対称軸を有する二次関数を用いてベースライニングされ得る。二次関数を用いてデータセットをベースライニングするということは、データセットから二次関数を引くことによってデータセットを補正することを意味する。
二次関数の生成は、二次関数の対称軸を決定し、フィッティング区間を決定し、フィッティング区間内でデータセットと二次関数をフィッティングして行うことができる。
二次関数の対称軸は信号-発生反応の最終サイクルに基づいて決定され得る。二次関数はy=a(x-b)+c形態の関数である。bは二次関数の対称軸である。本発明の一具現例によれば、二次関数の対称軸は最終サイクル±10、最終サイクル±8、最終サイクル±6、最終サイクル±5、最終サイクル±3、最終サイクル±2又は最終サイクル±1の範囲で決定され得る。
二次関数によるフィッティング区間は様々な方法で決定され得る。
まず、フィッティング区間は、あらかじめ設定された開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum Fitting Cycle,MFC)までの区域と決定され得る。開始フィッティングサイクルは、サイクル0、サイクル1、サイクル2、サイクル3、サイクル4、サイクル5、サイクル6、サイクル7、サイクル8又はサイクル9であり得る。最小フィッティングサイクルは、サイクル7、サイクル8、サイクル9、サイクル10、サイクル11、サイクル12、サイクル13、サイクル14、サイクル15、サイクル16、サイクル17、サイクル18、サイクル19、サイクル20又はサイクル21であり得る。
或いは、フィッティング区間を決定するとき、二次関数が用いられてもよい。フィッティング区間の決定に用いられる二次関数は第1二次関数と表記され、データセットの補正に用いられる二次関数は第2二次関数と表記される。第1二次関数は全区間においてデータセットにフィッティングされ、第2二次関数はフィッティング区間においてデータセットにフィッティングされる。また、第1二次関数は対称軸を有しないが、第2二次関数は対称軸を有する。フィッティング区間の最終サイクルは、(i)第1二次関数が最小である時のサイクル(Cmin)及び/又は(ii)最小フィッティングサイクルに基づいて決定される。例えば、フィッティング区間の最終サイクルは、(i)CminからN[Nは0又は正の整数(具体的に、1~5の整数)]を引いたサイクルと(ii)最小フィッティングサイクル(MFC)のうち、大きいサイクルとして決定される。
前記決定されたフィッティング区間内で、データセット又は標準化されたデータセットは対称軸を有する二次関数とフィッティングされ、その次の対称軸を有する二次関数によりベースライン-差し引きされる。
(B-2)陰性対照群差し引き
データセットから陰性対照群(negative control)を差し引いてデータセットからノイズを除去することができる。陰性対照群は、信号-発生反応のための反応物において反応の進行のための必須成分が1個以上ない実験群である。例えば、核酸増幅反応において陰性対照群は、ターゲット分析物、プライマー又は重合酵素がない実験群である。または、陰性対照群は緩衝液のみある実験群である。具体的に、本発明で用いられる陰性対照群は、核酸増幅反応においてターゲット核酸分子以外の核酸増幅のための成分がある実験群である。
陰性対照群の差し引きは、ターゲット分析物に対するデータセットの信号値から陰性対照群の信号値を引いて行うことができる。具体的に、ターゲット分析物に対するデータセットの信号値と陰性対照群の信号値は、同一の反応及び測定環境で得られたものであり、例えば、1つの同一増幅及び分析装置で同一反応ラン(run)で得られた信号値である。
補正されたデータセットに対する非線形関数の生成(段階330)
補正されたデータセットに対する非線形関数(non-linear functionregression fitting curve)がフィッティング関数として生成される。
この段階は非線形回帰分析方法によって実施され得る。様々な従来の非線形回帰分析方法が本発明に用いられ得る(参照:Seber,G.A.F.;Wild,C.J.(1989)。Nonlinear Regression.New York:John Wiley and Sons)。例えば、多項関数、指数関数、ログ関数、三角関数又はシグモイド関数が非線形関数として用いられ得る。
本発明の一具現例によれば、本発明で用いられる非線形関数はシグモイド関数(sigmoid function)である。本明細書において用語“シグモイド関数”とは、シグモイド形態の曲線を表し得る関数を意味し、ロジスティック関数、Gompertz関数又はChapman関数を含む。
補正されたデータセットにフィッティングされた非線形関数を生成する。非線形関数を生成するということは、補正されたデータセットに最も一致する(又は、補正されたデータセットを最もよく表す)非線形関数を決定することを意味できる。この段階は基本的に非線形回帰分析方法によって実施される。
本発明の一具現例において、前記非線形関数は、次の式3で表示される4個のパラメータを含むシグモイド関数であり得る。
Figure 2022050639000004
前記式で、f(x)はフィッティング関数としてシグモイド関数を表し;xは前記信号-発生反応のサイクル番号を表し;そしてa、a、a及びaはそれぞれ独立して前記シグモイド関数のパラメータを表す。
一具現例によれば、前記式3で、aは背景信号値を表し;a-aは、最大信号値と背景信号値との差を表し;aは、シグモイド関数の変曲点(inflection point)のx値を決定するパラメータを表し;aはシグモイド関数の尖度(sharpness)を決定するパラメータを表し;a及びaはシグモイド関数の形態(shape)を総合的に決定するパラメータを表す。
シグモイド関数の生成は反復した計算によってa、a、a及びaを決定する過程を意味できる。
非線形関数の生成は、前記データセットの補正後又は前に行うことができる。具体的に、前記非線形関数の生成は、前記データセットの補正後に行われる。
非線形関数のフィッティング正確度を決定(段階340)
非線形関数が生成された後、補正されたデータセットに対する非線形関数のフィッティング正確度(fitting accuracy)が決定される。
本明細書において用語“フィッティング正確度”は、(a)非線形関数が実際測定値(データセット又は補正されたデータセット)にどれくらい近接するか、すなわちフィッティングの優秀度(goodness of fit)及び(b)原因変数(explanatory variable)が反応変数(response variable)を予測する上でどれくらい有用かを示す値を全て包括する。
フィッティングの優秀度は通常、x値(chi square value)であり、予測有用性値はR値で示す。本発明の一具現例によれば、フィッティング正確度は、補正されたデータセットに対する非線形関数のx値(chi square value)又はR値である。より具体的に、前記フィッティング正確度はR値である。
値は、式4を用いて計算できる。式4は全サイクルに対して適用される。
Figure 2022050639000005
:データセットの各サイクルにおける信号値
:シグモイド関数の各サイクルにおける関数値
:データセットの信号値の平均値
L:フィッティング区間の最後のサイクル
n:全サイクルの数

式4は、データセットの全分散に対する誤差(error)の分散を表す。誤差は、データセットとシグモイド関数との差である。式4でデータセットは標準化されたデータセット又は標準化及びベースライニングされたデータセットであり得る。
フィッティング正確度を用いてターゲット分析物の存在又は不存在を決定(段階350)
補正されたデータセットに対する非線形関数のフィッティング正確度を用いて試料内ターゲット分析物の存在又は不存在を決定する。
本発明の特徴の一つは、非線形関数のフィッティング正確度を、ターゲット分析物の存在又は不存在を決定する時に直接的な指標として用いることである。試料内ターゲット分析物の存在又は不存在は、非線形関数のフィッティング正確度を利用(具体的に、直接に利用)して決定され、これは、ターゲット分析物の存在又は不存在を決定する時に、特にCt値を利用しなく、前記フィッティング正確度だけを利用するか、前記フィッティング正確度と他の基準(具体的に、非線形フィッティング関数に関連したパラメータ)を併せて利用することを意味する。
核酸増幅曲線にシグモイド関数を適用した先行技術は存在するが、非線形関数のフィッティング正確度をターゲット分析物の存在又は不存在を決定するために直接の指標として利用した例はない。
例えば、上述したように、米国公開特許第2009/0119020号は、シグモイド関数のR値を用いてデートセットが有意又は有効な成長を示すかを決定する。米国公開特許第2009/0119020号の教示事項によれば、ターゲット分析物の不存在だけがフィッティング関数のR値を用いて決定され得る。ターゲット分析物が存在することを決定するためには、Ct値を得る更なる段階が米国公開特許第2009/0119020号では必要であり得る。本発明は、非線形関数のフィッティング正確度(例えば、R値)を直接用いて、Ct値の助けを借りずとも試料内ターゲット分析物の存在又は不存在を決定することができる。
また、米国公開特許第2009/0119020号は、R値が有意性閾値(例えば、0.90~0.99)を超える場合に、データセットは有意又は有効な成長を示さないもの、すなわち試料内ターゲット分析物の不存在を示すものと考慮されると教示している。このような接近法は、フィッティング正確度(例えば、R値)が閾値(例えば、0.90~0.99)を超える場合、ターゲット分析物が存在するものと決定される後述する本発明の方法の一具現例と相反する。
本発明の一具現例によれば、前記ターゲット分析物の存在又は不存在を決定する段階は、フィッティング正確度をフィッティング正確度に対する閾値(threshold)と比較して行う。より具体的に、前記ターゲット分析物の存在又は不存在を決定する段階は、前記フィッティング正確度が前記閾値を超えるか否かを評価して行う。フィッティング正確度が閾値を超える場合、ターゲット分析物が試料内に存在すると決定され得る。フィッティング正確度が前記閾値以下である場合には、ターゲット分析物は試料内に存在しないと決定され得る。
フィッティング正確度としてR値を用いる場合、閾値は0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98又は0.99である。
ターゲット分析物の存在又は不存在は非線形関数のフィッティング正確度だけを用いて決定され得る。或いは、ターゲット分析物の存在又は不存在は特にCt値を利用せず、フィッティング正確度に加えて、更なる基準(具体的に、非線形フィッティング関数と関連したパラメータ)を用いて決定されてもよい。
一具現例によれば、前記試料内ターゲット分析物の存在又は不存在の決定は、(i)前記データセット、前記補正されたデータセット又は前記非線形関数の変位(displacement)及び(ii)前記非線形関数の最大勾配で構成された群から選ばれる少なくとも一つのパラメータを更に用いて行う。
一具現例によれば、前記試料内ターゲット分析物の存在又は不存在の決定は、(i)前記データセット、前記補正されたデータセット又は前記4個のパラメータを含むシグモイド関数の変位及び(ii)前記4個のパラメータを含むシグモイド関数の最大勾配及びa4から構成された群から選ばれる少なくとも一つのパラメータを更に用いて行う。
更なる考慮事項(considerations)は試料内ターゲット分析物の不存在を決定することに特に有用である。
非線形関数のフィッティング正確度がターゲット分析物の存在又は不存在を決定する時に唯一の指標として役割するが、更なる考慮事項は、ターゲット分析物を含まない陰性サンプルをより効果的にフィルタリングすることに用いられ得る。また、陰性サンプルに対する信号値は理論的に低いフィッティング正確度を示す。しかし、時には高いフィッティング正確度を有する。したがって、偽陽性結果を招き得る陰性サンプルはフィルタリングする必要がある。
前記データセット、前記補正されたデータセット又は前記非線形関数の変位(displacement)は、試料内ターゲット分析物の不存在を決定する上で有用である。
本明細書において用語“変位”とは、データセットにおいて信号変化程度、具体的に、基準信号値からの信号変化程度を意味する。ここで、基準信号値は、最小の信号値、最初のサイクル信号値、ベースライン領域の平均信号値又は増幅区域開始点での信号値であり得る。変位を計算するに当たり、最終信号値は最大の信号値、最終サイクルの信号値又は停滞(plateau)領域の平均信号値であり得る。
変位を考慮又は利用してターゲット分析物の存在又は不存在を決定することは、様々な方式で行うことができる。例えば、データセットの変位が変位に対する閾値未満である場合、そのデータセットは陰性と判断できる。
信号-発生反応が増幅反応である場合、変位に対する閾値はRFU(relative
fluorescence unit)70、80、90、100、110、120、130、140又は150である。
さらに他の考慮要素は、非線形関数の最大勾配である。
陽性試料に対する増幅曲線は、信号値が急に増加する増幅区間を含み、陰性試料に対する増幅曲線は、信号値が急に増加する増幅区間がない。したがって、非線形関数の最大勾配を考慮して試料に対するターゲット分析物の陽性及び陰性を判定することができる。
本発明の一具現例によれば、本発明の方法は、前記非線形関数の最大勾配を生成する段階;及び前記最大勾配を閾値と比較して、前記試料内前記ターゲット分析物が不存在すると決定する段階を含む。
非線形関数の最大勾配を計算する方法は様々である。例えば、非線形関数を微分し、微分された非線形関数の最大値が最大勾配と決定され得る。
最大勾配に対する閾値は様々な方式で設定され得る。例えば、閾値は多数の試料を分析した結果に基づいて設定され得る。例えば、陽性又は陰性があらかじめ定められた多数の試料における非線形関数の最大勾配を分析し、適切な閾値を選択することができる。例えば、最大勾配に対する閾値は、10~50、20~50、30~50、10~40、20~40又は30~40であり、特に20~40である。
非線形関数の最大勾配が閾値以上である場合には、試料内ターゲット分析物が存在すると決定し、前記最大勾配が閾値未満である場合には、試料内ターゲット分析物が不存在すると決定する。
さらに他の考慮要素は、非線形関数の形態を示すパラメータである。
本発明の一具現例において、非線形関数の形態を示すパラメータを用いてターゲット核酸配列が試料内存在又は不存在するか決定する。具体的に、4個のパラメータを含むシグモイド関数である式3のa4を用いる。
a4が試料内ターゲット分析物の存在又は不存在の決定に用いられる場合、a4に対する閾値は0.07、0.08又は0.09に設定され得る。a4が閾値を超えるとデータセットを異常信号と判断し、ターゲット分析物が試料内不存在すると決定する。
本発明の一具現例によれば、本発明の方法は、前記非線形フィッティング関数に信号閾値(signal threshold)を適用してCt値を得る段階をさらに含む。本発明は、信号閾値(すなわち、Ct値)を利用することなく試料内ターゲット分析物の存在又は不存在を決定できるが、実験者にとってCt値が必要な場合がある。例えば、ターゲット分析物の定量情報が必要な場合、Ct値か通常必要である。本発明方法の分析信頼度を増加させるために、試料内ターゲット分析物の存在又は不存在を決定する時に、非線形関数のフィッティング正確度と共にCt値も用いることができる。例えば、非線形フィッティング関数のフィッティング正確度がフィッティング正確度に対する閾値を超えるとともに、Ct値がCt値に対する閾値を超える場合にのみ、ターゲット分析物が試料内存在すると決定される。
II.非線形関数を用いた試料内ターゲット分析物の分析装置及びコンピュータ読取り可能な記録媒体
本発明の他の態様によれば、本発明は、次のを含む試料内ターゲット分析物の分析装置を提供する:
メモリー;及び
プロセッサ;
前記メモリーは、前記ターゲット分析物に対するデータセットを保存し、前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
前記プロセッサは、前記データセットを補正し、前記補正されたデータセットに対する非線形関数を生成し、前記補正されたデータセットに対する前記非線形関数フィッティング正確度を決定し、前記フィッティング正確度を用いて前記試料内ターゲット分析物の存在又は不存在を決定する。
本発明のさらに他の態様によれば、本発明は、次の段階を含む試料内ターゲット分析物を分析する方法を実行するためのプロセッサを具現する指示を含む非-一時的(non-transitory)コンピュータ読取り可能な記録媒体を提供する:
前記ターゲット分析物に対するデータセットを得る段階;前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
前記データセットを補正する段階;
前記補正されたデータセットに対する非線形関数を生成する段階;
前記補正されたデータセットに対する前記非線形関数のフィッティング正確度を決定する段階;及び
前記フィッティング正確度を用いて前記試料内ターゲット分析物の存在又は不存在を決定する段階。
上述した本発明の記録媒体、装置及びコンピュータプログラムは、上述した本発明の方法をコンピュータで実行可能にしたものであり、これらに共通する内容は、反復記載による本明細書の過度な複雑性を避けるためにその記載を省略する。
プログラム指示は、プロセッサによって実行される時、上述した本発明の方法をプロセッサに実行させる。本発明の方法を実行するプログラム指示は、次の指示を含むことができる:(i)前記データセットを補正するようにする指示;(ii)前記補正されたデータセットに対する非線形関数を生成するようにする指示;(iii)前記補正されたデータセットに対する前記非線形関数のフィッティング正確度を決定するようにする指示;及び(iv)前記フィッティング正確度を用いて前記試料内ターゲット分析物の存在又は不存在を決定するようにする指示。
本発明の方法はプロセッサで実行され、前記プロセッサは独立実行型コンピュータ(stand alone computer)、ネットワーク付着コンピュータ又は実時間PCR装置のようなデータ取得装置にあるプロセッサであり得る。
コンピュータ読取り可能な記録媒体は、当業界に公知の様々な記憶媒体、例えば、CD-R、CD-ROM、DVD、フラッシュメモリー、フロッピーディスク、ハードドライブ、ポータブルHDD、USB、マグネチックテープ、MINIDISC、不揮発性メモリーカード、EEPROM、光学ディスク、光学記憶媒体、RAM、ROM、システムメモリー及びウェブサーバーを含むが、これに限定されるものではない。
データセットは様々な方式で収集され得る。例えば、データセットは、PCRデータ収集装置にあるプロセッサによって収集され得る。データセットは実時間でプロセッサに提供されてもよく、或いはメモリーユニット又はバッファに保存され、実験完了後にプロセッサに提供されてもよい。類似に、データセットは、前記収集装置とのネットワーク連結(例えば、LAN、VPN、インターネット及びイントラネット)又は直接連結(例えば、USB又は他の直接有線連結又は無線連結)によってデスクトップコンピュータシステムのような別途のシステムに提供されてもよく、或いはCD、DVD、フロッピーディスク及びポータブルHDDのようなポータブル媒体上に提供されてもよい。類似に、データセットは、ノートパソコン又はデスクトップコンピュータシステムのようなクライアントにネットワーク連結(例えば、LAN、VPN、インターネット、イントラネット及び無線通信ネットワーク)を通じてサーバーシステムに提供されてもよい。
本発明を実行するプロセッサを具現する指示はロジックシステムに含まれ得る。前記指示は、たとえソフトウェア記録媒体(例えば、ポータブルHDD、USB、フロッピーディスク、CD及びDVD)に提供され得るが、ダウンロード可能であり、メモリーモジュール(例えば、ハードドライブ又はローカル又は付着RAM又はROMのような他のメモリー)に保存され得る。本発明を実行するコンピュータコードは、C、C++、Java、Visual Basic、VBScript、JavaScript、Perl及びXMLのような様々なコーディング言語によって実行され得る。また、様々な言語及びプロトコルは、本発明に係るデータと命令の外部及び内部保存及び伝達に用いられ得る。
本発明の一具現例によれば、本発明の装置は、試料及び信号-発生手段を収容可能な反応容器、前記反応容器の温度を調節する温度調節手段及び/又はサイクル番号における信号を検出する検出器をさらに含むことができる。
コンピュータプロセッサは、一つのプロセッサが上述したパフォーマンスを全て行うように構築するされ得る。或いは、プロセッサユニットはいくつかのプロセッサがそれぞれのパフォーマンスを実行するように構築されてもよい。本発明の一具現例によれば、プロセッサはターゲット分析物(例えば、ターゲット核酸分子)の検出に用いられる従来の装置(例えば、実時間PCR装置)にソフトウェアをインストールして具現させることができる。
III.二次関数を用いて試料内ターゲット分析物を分析する方法
本発明の他の態様によれば、本発明は、次の段階を含む試料内ターゲット分析物の分析方法を提供する:
前記ターゲット分析物に対するデータセットを得る段階;前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
前記データセットのベースライン領域のフィッティング区間で前記データセットにフィッティングされた二次関数を生成する段階;及び
前記データセットから前記二次関数を差し引いて前記データセットを補正する段階。
本発明の最初及び三番目の態様に共通する内容は、反復記載による本明細書の過度な複雑性を避けるためにその記載を省略する。
本発明者らは、上述した従来技術の問題点及び短所、特に核酸増幅反応においてC値を得るための閾値(threshold)設定による従来の問題点を克服しようと努力した。その結果、本発明者らは、信号-発生反応から得たデータセットに対するフィッティング関数の様々なパラメータ(parameter)、具体的にフィッティング二次関数が最小である時のサイクル(Cmin)、xの係数又はフィッティング正確度がターゲット分析物の存在又は不存在を決定できる指標(indicator)になり得ることを糾明した。また、本発明者らは、従来のベースライニング方法を改善しようと努力し、フィッティング区間でデータセットにフィッティングされた二次関数を用いて効率的に且つ容易にベースライニングできることを糾明した。
本発明は、ターゲット分析物を分析する方法と表現されるが、ターゲット分析物に対するデータセットをベースライニングする方法と表現されてもよい。
ターゲット分析物に対するデータセットを取得
この段階は、本発明の最初の態様に記載された内容を参照して説明され得る。
データセットにフィッティングされた二次関数を生成
フィッティング関数としてデータセットに対する二次関数は前記データセットのベースライン領域のフィッティング区間で生成される。フィッティングのために様々な従来の非-線形回帰分析方法が本発明に用いられ得る(参照:Seber,G.A.F.;Wild,C.J.(1989)。Nonlinear Regression.New York:John Wiley and Sons)。
この段階は、上述した対称軸を有する二次関数を用いたベースライニングに対する内容を参照して説明され得る。
補正前及び補正後のデータセットを含むデートセットは二次関数とフィッティングされ得る。
一具現例によれば、前記二次関数は対称軸を有する。一具現例によれば、前記二次関数の対称軸は、信号-発生反応の最終サイクルに基づいて決定される。より具体的に、前記二次関数の対称軸は、最終サイクル±10、最終サイクル±8、最終サイクル±6、最終サイクル±5、最終サイクル±3、最終サイクル±2又は最終サイクル±1の範囲内で決定される。
二次関数の生成は、二次関数の対称軸を決定し、フィッティング区間を決定し、前記フィッティング区間で前記データセットに前記二次関数をフィッティングして行うことができる。二次関数は、y=a(x-b)+cと表現することができる(aはxの係数、bは対称軸、cはy軸切片である)。
フィッティング区間は、データセットのベースライン領域内で決定され得る。前記フィッティング区間は様々な方法で決定され得る。
まず、フィッティング区間はあらかじめ決定され得る。一具現例によれば、フィッティング区間は、開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum Fitting Cycle,MFC)までである。
本発明の一具現例によれば、前記データセットの変位が前記変位に対する閾値を超える場合、前記フィッティング区間は、開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum
Fitting Cycle,MFC)までである。より具体的に、データセットの最大値と最小値との差が所定の閾値(例えば、RFU 100、200、300又は400)よりも大きい場合に、又はデータセットの最終値と初期値との差が所定の閾値(例えば、RFU 0)よりも大きい場合には、前記フィッティング区間は開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum Fitting Cycle,MFC)までの区間と決定される。
開始フィッティングサイクルは、サイクル0、サイクル1、サイクル2、サイクル3、サイクル4、サイクル5、サイクル6、サイクル7、サイクル8又はサイクル9であり得る。最小フィッティングサイクルは、サイクル7、サイクル8、サイクル9、サイクル10、サイクル11、サイクル12、サイクル13、サイクル14、サイクル15、サイクル16、サイクル17、サイクル18、サイクル19、サイクル20又はサイクル21であり得る。
本発明の一具現例によれば、フィッティング区間はデータセットのサイクル1~20、サイクル2~20、サイクル3~20、サイクル4~20、サイクル5~20、サイクル6~20、サイクル1~18、サイクル2~18、サイクル3~18、サイクル4~18、サイクル5~18、サイクル6~18、サイクル1~16、サイクル2~16、サイクル3~16、サイクル4~16、サイクル5~16、サイクル6~16、サイクル1~14、サイクル2~14、サイクル3~14、サイクル4~14、サイクル5~14、サイクル1~12、サイクル2~12、サイクル3~12サイクル又は4~12サイクルである。
第二に、フィッティング区間は二次関数を用いて決定され得る。フィッティング区間を決定するために用いられる二次関数は本明細書で第1二次関数と命名され、補正されたデータセットに用いられる二次関数は本明細書において第2二次関数と命名される。
一具現例によれば、前記方法は、前記フィッティング区間で二次関数を生成する段階の前に、全領域で前記データセットにフィッティングされた第1二次関数を生成する段階をさらに含み;そして前記フィッティング区間(具体的に、前記フィッティング区間の最終サイクル)は、前記第1二次関数が最小信号値を有するサイクル(Cmin)に基づいて決定される。
第1二次関数は対称軸を有しないが、第2二次関数は対称軸を有する。前記フィッティング区間の最終サイクルは、(i)第1二次関数が最小である時のサイクル(Cmin)及び/又は(ii)最小フィッティングサイクルに基づいて決定される。例えば、フィッティング区間の最終サイクルは、(i)CminからN[Nは0又は正の整数(具体的に、1~5の整数)]を引いたサイクルと(ii)最小フィッティングサイクル(MFC)のうち、大きいサイクルと決定される。
データセットから二次関数を差し引いてデータセットを補正
前記データセットは、前記データセットから前記二次関数を差し引いて補正する。
一具現例によれば、前記方法は、前記補正されたデータセットに対する前記二次関数のフィッティング正確度を決定する段階;及び前記フィッティング正確度を用いて試料内ターゲット分析物の存在又は不存在を決定する段階をさらに含む。
前記二次関数に対するフィッティング正確度は前記フィッティング区間で決定され得る。前記データセット及び二次関数間のフィッティング正確度はフィッティング区間における信号値を用いて決定される。本発明の一具現例によれば、前記フィッティング正確度は、前記データセットと前記二次関数に対するx値(chi square value)又はR値であり、より具体的にR値である。
値は式5を用いて計算され得る。
Figure 2022050639000006
式5は、データセットの全分散に対するフィッティング区間における誤差(error)の分散を表す。誤差はデータセットと二次関数との差である。
は、データセットの各サイクルにおける信号値である。
は、二次関数の値である。
は、データセットの平均値である。
Lは、フィッティング区間の最終サイクルである。
Sは、フィッティング区間の開始サイクルである。
L-Sは、フィッティング区間の長さである。
nは、全サイクルの数である。
本発明の特徴の一つは、二次関数のフィッティング正確度をターゲット分析物の分析、特にターゲット分析物の存在又は不存在、特に不存在を決定する時に直接の指標として用いることである。本発明者らの知る限り(To our best knowledge)、フィッティング区間で二次関数のフィッティング正確度をターゲット分析物の不存在するか否かを決定する時に直接の指標として用いた例はない。
本発明の一具現例によれば、試料内ターゲット分析物の存在又は不存在を決定する段階は、フィッティング正確度が閾値未満であると、試料内ターゲット分析物が不存在すると決定する。
上述した通り、フィッティング正確度はターゲット分析物の存在又は不存在、特に不存在を決定する時に直接の指標として利用できるので、閾値とフィッティング正確度を比較することによってターゲット分析物の不存在を簡便に決定することができる。
フィッティング区間におけるフィッティング正確度に対する閾値は、当業界で通常用いる閾値であり得る。例えば、フィッティング正確度としてR値を用いる場合、閾値は0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96又は0.97であり得る。
また、試料内ターゲット分析物の存在又は不存在は、(i)第1二次関数が最小信号値を有するサイクル(Cmin)及び/又は(ii)第1二次関数のxの係数に基づいて決定され得る。
本発明の一具現例によれば、前記決定は、試料内ターゲット分析物の不存在の決定である。
本発明の一具現例によれば、前記ターゲット分析物の不存在を決定する段階は、前記Cminと閾値を比較して行う。前記Cminが前記閾値を超える場合、試料内ターゲット分析物は不存在すると決定される。
本発明の特徴の一つは、前記Cminを、ターゲット分析物が不存在するかを決定する時に直接の指標として用いることである。核酸増幅曲線にフィッティング関数を適用した先行文献はあるが、前記Cminを、ターゲット分析物が不存在するかを決定する時に直接の指標として用いた例はない。
上述した通り、前記Cminがターゲット分析物の不存在を決定することに直接の指標として用いられ得るので、、前記ターゲット分析物の不存在は、前記閾値とCminを比較して容易に決定することができる。
閾値は、例えば、サイクル27、28、29、30、31、32、33、34、35、36、37、38、39又は40である。
或いは、試料内ターゲット分析物の存在又は不存在を決定する段階は、第1二次関数のxの係数が0より小さいかを評価することによって前記試料内ターゲット分析物が不存在するかを決定して行われる。本発明者の知る限り(To our best knowledge)、第1二次関数のxの係数が0より小さいデータセットはいずれも陰性結果として取扱うことができる。
上述した通り、前記Cmin、第1二次関数のxの係数、及び第2二次関数のフィッティング正確度は、試料内ターゲット分析物の不存在を決定する時に指標として用いられ得る。
IV.本発明とMuDT技術との組合せ
本出願人は、単一反応容器で単一類型の検出器を用いて複数のターゲット核酸配列を検出するMuDT技術(WO2015/147412)を開発した。MuDT技術において、相対的低温検出温度を有するターゲット核酸配列の存在は、(i)相対的高温検出温度及び相対的低温検出温度の両方で検出された信号及び(ii)異なる検出温度で信号の変化の関係を示す基準値によって決定される。第1ターゲット核酸配列が相対的高温検出温度を有するターゲット核酸配列であり、第2ターゲット核酸配列が相対的低温検出温度を有するターゲット核酸配列である場合に、第1ターゲット核酸配列に対する基準値を用いて第1ターゲット核酸配列に対する信号を除去することによって、第2ターゲット核酸配列に対する信号は相対的低温検出温度で検出された信号から抽出される。
従来の単一類型の検出器では区別されない、第1ターゲット核酸配列に対する信号及び第2ターゲット核酸配列に対する信号を別個として得る方法により、従来方法に比べてMuDT技術は著しく改善された。特に、相対的高温検出温度を有するターゲット核酸配列及び相対的低温検出温度を有するターゲット核酸配列の両方を含むサンプル(共同-感染サンプル)からターゲット核酸配列に対する信号を抽出するとき、前記方法はかなりの正確度を示す。
非線形フィッティング関数を用いる本発明はMuDT技術とよく組み合わせられ得る。
一具現例によれば、前記データセットは、(i)相対的高温検出温度で検出された信号である第1ターゲット核酸配列に対する信号及び/又は(ii)相対的低温検出温度で検出された信号から抽出された第2ターゲット核酸配列に対する信号を含み、そして前記第1ターゲット核酸配列及び前記第2ターゲット核酸配列は一つの反応容器から検出される。
一具現例によれば、前記第1ターゲット核酸配列に対する信号及び前記第2ターゲット核酸配列に対する信号は、次の段階によって得られる:
(a)前記反応容器で前記第1ターゲット核酸配列に対する信号を発生させ得る第1信号-発生手段及び前記第2ターゲット核酸配列に対する信号を発生させ得る第2信号-発生手段を前記試料と共にインキュベーションし、前記相対的高温検出温度及び前記相対的低温検出温度で信号を検出する段階;前記第1ターゲット核酸配列及び第2ターゲット核酸配列のそれぞれは相応する信号-発生手段によって検出され、前記第1信号-発生手段は、前記第1ターゲット核酸配列が前記試料に存在する場合に、前記相対的高温検出温度及び前記相対的低温検出温度で信号を発生させ、前記第2信号-発生手段は、前記第2ターゲット核酸配列が前記試料に存在する場合に、前記相対的低温検出温度で信号を発生させ、
(b)前記相対的低温検出温度で検出された信号が第1閾値又は第1信号変位によって定義された第1基準を満たすか否かを識別する段階;前記相対的低温検出温度で検出された信号が前記第1基準を満たすとき、次の段階(c)を進行し、前記相対的低温検出温度で検出された信号が前記第1基準を満たさないとき、前記第1ターゲット核酸配列及び前記第2ターゲット核酸配列が前記試料内に存在しないと決定され、次の段階(c)を進行しなく;及び
(c)(i)前記相対的低温検出温度で検出された信号から前記第1ターゲット核酸配列に対する信号を除去するための基準値及び(ii)前記相対的低温検出温度で検出された信号を用いて前記相対的低温検出温度で検出された信号から前記第2ターゲット核酸配列に対する信号を抽出する段階。
一具現例によれば、前記第2ターゲット核酸配列に対する信号は、次の式6によって提供される:
Figure 2022050639000007
本明細書で使われた用語“相対的高温検出温度を有するターゲット核酸配列”は、2個の検出温度のうち相対的高温検出温度で信号を発生でき、相対的低温検出温度でも信号を発生できるターゲット核酸配列を意味する。一方、“相対的低温検出温度を有するターゲット核酸配列”は、2個の検出温度のうち相対的低温検出温度で信号を発生するが、相対的高温検出温度では信号を発生しないターゲット核酸配列を意味する。
相対的高温検出温度は、相対的高温検出温度を有するターゲット核酸配列に対する信号を生成できる温度であり、相対的低温検出温度は、相対的低温検出温度を有するターゲット核酸配列に対する信号及び相対的高温検出温度を有するターゲット核酸配列に対する信号の両方を生成できる温度である。相対的高温検出温度は第1検出温度と表現され、相対的低温検出温度は第2検出温度と表現され得る。
一具現例によれば、検出が行われる相対的高温検出温度と相対的低温検出温度は決定され得る。例えば、相対的高温検出温度及び相対的低温検出温度はそれぞれ72℃及び60℃と決定され、その後、前記検出温度に適した信号-発生手段が構築される。
一具現例によれば、前記信号-発生手段が二合体の形成に依存する方式で信号を発生するとき、前記検出温度は、前記二合体のTm値を調節することによって制御することができる。
信号がターゲット核酸配列の存在に依存して形成される二合体によって生成される場合、前記信号の検出は二合体のTm値を調節することによって決定された温度で成功的に行われる。例えば、信号がPTOCE方法によって生成される場合、信号の検出はCTO上でPTO断片が延長されて形成された延長二合体のTm値を調節することによって、決定された温度で成功的に行われる。
基準値は、相対的低温検出温度で検出された信号から第1ターゲット核酸配列に対する信号を除去するための値である。本発明の一具現例において、基準値は相対的高温検出温度と相対的低温検出温度で試料内第1ターゲット核酸配列が存在するとき、第1信号-発生手段によって提供される信号の変化の関係を示す値である。
本発明によれば、前記非-線形フィッティング関数は第2ターゲット核酸配列に対する抽出された信号に対して生成される。
V.二次関数を用いて試料内ターゲット分析物を分析する方法
本発明の他の態様によれば、本発明は、次を含む試料内ターゲット分析物の分析装置を提供する:
メモリー;及び
プロセッサ;
前記メモリーは、前記ターゲット分析物に対するデータセットを保存し、前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、そして
前記プロセッサは、前記データセットのベースライン領域のフィッティング区間で前記データセットに対してフィッティングされた二次関数を生成し、前記データセットから前記二次関数を差し引いて前記データセットを補正する。
本発明のさらに他の態様によれば、本発明は、次の段階を含む方法を実行するためのプロセッサを具現する指示を含むコンピュータ読取り可能な記録媒体を提供する:
前記ターゲット分析物に対するデータセットを得る段階;前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
前記データセットのベースライン領域のフィッティング区間で前記データセットに対する二次関数を生成する段階;及び
前記データセットから前記二次関数を差し引いて前記データセットを補正する段階。
上述した本発明の記録媒体、装置及びコンピュータプログラムは、上述したセクションIII及びIVの本発明の方法をコンピュータで実施可能にしたものであり、これらに共通する内容は、反復記載による本明細書の過度な複雑性を避けるためにその記載を省略する。
VI.本発明の具体的具現例
本発明の具体的な具現例を詳細に説明すると、次の通りである:
図1は、一実施例に係るターゲット分析物を分析する装置を示す。図1を参照すると、分析システムは、増幅装置110及び分析装置120を含む。分析システムは、試料内ターゲット分析物の存在又は不存在を決定し、ユーザに結果を表示することができる。
増幅装置110は、核酸増幅反応、酵素反応又は微生物成長などを行う装置である。例えば、増幅装置110が核酸増幅反応を行う場合、増幅装置110は試料の温度を増加、減少させる動作を繰り返し行うことができる。増幅装置110は各サイクルごとに試料から発生する信号を測定してデータセットを得ることができる。
増幅装置110は分析装置120とケーブル130で連結されるか、無線で連結され得る。増幅装置110は、得られたデータセットを有線又は無線で分析装置120に伝送する。
分析装置120は増幅装置110からデータセットを得る。分析装置120はデータセットを分析し、試料内ターゲット分析物が存在又は不存在するか決定する。言い換えると、分析装置120は試料に対する陽性又は陰性を決定する。
分析装置120はディスプレイ装置124を含む。ディスプレイ装置120はデータセットを表示するか、フローティングされたデータセットをグラフで表示することができる。ディスプレイ装置124は、シグモイド関数やステップ関数などを表示できる。また、ディスプレイ装置124は、ターゲット分析物が存在するか不存在するかを表示でき、各試料ごとに検出結果を表示できる。
分析装置120は、記録媒体122に含まれたデータセットを読み込む(read)ことができる。記録媒体122は、データセットを保存するか、分析装置120で用いられるプログラムなどを保存することができる。記録媒体122はCD又はUSBなどであり得る。
図2は、一実施例による分析装置を説明するための構成図である。図2を参照すると、分析装置200は、プロセッサ210、メモリー220及びディスプレイ装置230を含む。
メモリー220は、増幅装置110から受信されたデータセットを保存する。メモリー220は、プロセッサ210で処理されたデータを保存することができる。例えば、メモリー220は、データセット、標準化されたデータセット、ベースライニングされたベースセット、補正されたデータセット、非線形関数、フィッティング正確度及び閾値などを保存することができる。図2ではメモリー220がプロセッサ210と別個の構成として示されているが、メモリー220がプロセッサ210と一つの装置として具現されてもよい。例えば、メモリー220はプロセッサ210の内部に含まれたキャッシュのようなストレージであってもよい。
プロセッサ210はデータセットを用いて試料内ターゲット分析物が存在又は不存在するかを決定できる。プロセッサ210は非線形関数を用いて、データセットと非線形関数のフィッティング正確度を計算でき、フィッティング正確度の大きさによってターゲット分析物の存在又は不存在を決定できる。
図2では分析装置200が一つのプロセッサ210を含むとしているが、分析装置200は一つ以上のプロセッサ210を含んでもよい。
ディスプレイ装置230はプロセッサ210の制御によってグラフ、テーブル又はテキストなどを表示することができる。例えば、ディスプレイ装置230は、データセット、非線形関数などをグラフで表示できる。ディスプレイ装置230はウェルの情報をテーブルで表示できる。ディスプレイ装置230はフィッティング正確度、陽性/陰性などをテキストで表示できる。
図4は、一実施例によるターゲット分析物の存在又は不存在を決定する方法を説明するための順序図である。図4を参照すると、分析装置200は、フィッティング正確度と閾値を比較してターゲット分析物の存在又は不存在を決定できる。図4の段階は図3の段階340の後に行われ得る。言い換えると、分析装置200は、段階340でフィッティング正確度を決定し、段階410でフィッティング正確度と閾値を比較できる。
段階410で、分析装置200はフィッティング正確度が閾値を超えるか否か決定する。仮に、フィッティング正確度が閾値を超えると、前記プロセッサは段階420に進行し、フィッティング正確度が閾値を超えないと、前記プロセッサは段階430に進行する。閾値は実験データを用いて決定でき、一例として、閾値は0.9に設定され得る。
段階420で、分析装置200は試料内ターゲット分析物が存在すると決定する。フィッティング正確度が閾値よりも大きいということは、非線形関数が増幅曲線と同一又は類似の形態であることを意味する。増幅曲線とは、試料内ターゲット分析物が存在する時に得られる曲線の一般的な形態であり得る。言い換えると、試料内ターゲット分析物が存在すれば、ターゲット分析物が反復して複製されるので、二次関数や指数関数のように増加する形態の信号が試料から得られる。したがって、データセットの形態が増幅曲線の形態である場合、非線形関数とデータセットが類似する形態であり、フィッティング正確度が高くなる。
段階430で、分析装置200は試料内ターゲット分析物が不存在すると決定する。フィッティング正確度が閾値よりも小さいということは、非線形関数が増幅曲線から外れていることを意味する。言い換えると、試料内ターゲット分析物が不存在すれば、ターゲット分析物が複製される反応が発生しない。したがって、データセットと非線形関数が異なる形態であり、フィッティング正確度が低くなる。
図5は、試料内ターゲット分析物が存在する場合、フィッティング正確度を用いて分析する方法を説明するための図である。図5で、補正されたデータセット510は点線で表示され、非線形関数520は実線で表示されている。補正されたデータセット510は(サイクル、信号値)の座標値の集合(不連続データ)であるので点線で表示されている。非線形関数520は式3のシグモイド関数であり得る。非線形関数520は連続関数であるので実線で表示されている。
分析装置200は、補正されたデータセット510と非線形関数520をフィッティングする。フィッティングするということは、補正されたデータセット510と最も類似する非線形関数520を探す(search)ことを意味するか、非線形関数520のパラメータ(parameters)を決定することを意味する。非線形関数520は最小二乗法によって生成され得る。言い換えると、分析装置200は、非線形関数520と補正されたデータセット510の誤差を最小化させるために非線形関数520のパラメータを修正する過程を反復する。分析装置200は、非線形関数520と補正されたデータセット510の誤差が最小のとき、非線形関数520のパラメータを決定する。
分析装置200は、決定されたパラメータを有する非線形関数520と補正されたデータセット510のR値を計算する。分析装置200はR値の大きさによってターゲット分析物の存在又は不存在(陽性/陰性)を決定する。R値は、式4を用いて計算できる。
図5を参照すると、非線形関数520のR値は0.9985である。閾値は0.9に設定される。したがって、R値が閾値よりも大きいので、分析装置200は試料内ターゲット分析物が存在すると決定する(陽性)。分析装置200は、分析結果によって存在又は陽性(positive)というテキストをディスプレイ装置230に表示できる。
図6は、最大勾配を用いてターゲット分析物の存在又は不存在を決定する方法を説明するための順序図である。分析装置200は、非線形関数の最大勾配を用いて試料内ターゲット分析物の不存在を決定できる。図6の段階は、図3の段階350が行われた後に行われるか、図3の段階330が行われた後に行われ得る。
段階1410で、分析装置200は、非線形関数の最大勾配を生成する。分析装置200は非線形関数を微分し、微分された非線形関数の最大値を最大勾配と決定できる。
段階1420で、分析装置200は、非線形関数の最大勾配が最大勾配に対する閾値を超えるか判断する。分析装置200は最大勾配が閾値を超えると、段階1430に進行し、そうでないと段階1440に進行する。閾値は20~40に設定され得る。
段階1430で、分析装置200は試料内ターゲット分析物が存在すると決定する。非線形関数の最大勾配が閾値を超えるので、分析装置200は、ターゲット分析物に対する増幅反応が発生したと判断できる。
段階1440で、分析装置200は、試料内ターゲット分析物が不存在すると決定する。非線形関数の最大勾配が閾値を超えないので、分析装置200は、ターゲット分析物に対する増幅反応が発生しなかったと判断できる。
図7は、試料内ターゲット分析物が存在する場合、最大勾配を用いて分析する方法を説明するための図である。図7で、分析装置200は非線形関数1510の最大勾配を生成する。図7で、非線形関数1510の最大勾配は50である。分析装置200は最大勾配が閾値を超えるか判断する。図7では閾値が30に設定され、非線形関数1510の最大勾配(50)が閾値(30)を超える。したがって、分析装置200は試料内ターゲット分析物が存在すると決定する(陽性)。
試料内ターゲット分析物が存在すると、図7の非線形関数1510のように信号値が急に増加する区間が存在する。分析装置200は、急に増加する区間が存在すると、試料内ターゲット分析物が存在すると決定できる。
図8は、SBN方法でデータセットを標準化する方法を説明するための図である。図8を参照すると、データセット1900に対する基準サイクル及び基準サイクルにおける信号値が決定される。基準サイクルにおける信号値が決定されると、基準サイクルにおける信号値又は基準サイクルにおける信号値の変形値を用いて標準化係数が生成される。
基準サイクルにおける信号値を用いて標準化係数が生成される場合、基準サイクルにおける信号値自体が標準化係数になり得る。したがって、基準サイクルにおける信号値をデータセット1900の信号値に適用してデータセット1900を標準化する。
基準サイクルにおける信号値の変形値を用いて標準化係数が生成される場合、基準サイクルにおける信号値と基準値との関係を用いて標準化係数が決定され得る。基準サイクルにおける信号値と基準値との関係は、基準サイクルにおける信号値と基準値との差であり得る。一例において、基準サイクルにおける信号値と基準値との差は、基準値に対する基準サイクルにおける信号値の比(ratio)である。
基準サイクルは任意に決定されたサイクルであり、基準サイクルにおける信号値は、データセット1900の信号値である。図8に示すように、基準サイクルはデータセット1900のサイクルの中から決定され、ベースライン領域で決定される。
dRFUはデータセット1900の変位を表す。データセット1900の変位は、データセットの信号値のうち、最大値と最小値との差又は最終値と初期値との差で計算され得る。
ベースライン領域は、ターゲット分析物に対する増幅が発生しない区域であり、信号増幅区域は、ターゲット分析物に対する増幅が発生した区域である。基準サイクルはベースライン領域のサイクルの中から選択され得る。一例において、基準サイクルはサイクル4であり得る。図8では基準サイクルが1つである場合を示しているが、基準サイクルは2以上のサイクルであってもよい。複数の基準サイクルが選択される場合、複数の基準サイクルにおける複数の信号値が決定され、複数の信号値を用いて標準化係数が決定される。
図9は、非線形関数に対する特性を説明するための図である。非線形関数2000に対する特性は、試料内ターゲット分析物の存在又は不存在を決定するために用いられる。具体的に、非線形関数2000に対する特性を各特性に対する所定の閾値と比較でき、比較結果は試料内ターゲット分析物の存在又は不存在を決定するために用いられる。
本発明は、連続関数である非線形関数2000を生成するので、一部の増幅区間で発生するジャンプエラー又はノイズによる影響を最小化できる。
本発明の一具現例によれば、本発明は、非線形関数500の変位が信号閾値を超えるか否かによってターゲット分析物の存在又は不存在を決定しない。反応の1つの基準又は特性を用いる代わりに、本発明は非線形関数500の複数の特性を抽出し、前記特性を分析して試料内ターゲット分析物の存在を決定する。
既存の方法はデータセットが閾値を超えるか否かを基準にターゲット分析物の存在又は不存在を決定するため、データセットのそれぞれの信号値がターゲット分析物の存在又は不存在の決定に影響を及ぼす。したがって、ジャンプエラー又はノイズの除去を含むデータセットを補正し、閾値を適切に設定することが非常に重要であり、データセットに対する補正が正しく行われていない場合又は閾値の設定が高精度に行われていない場合には、偽陽性又は偽陰性の危険がある。
本発明は、データセット又は標準化されたデータセットにフィッティングされた非線形関数2000を用いるので、非線形関数2000に対する複数の特性を容易に抽出することができる。言い換えると、非線形関数2000は連続関数であり、且つ数学式で表示されるため、非線形関数2000の変位、最大勾配及びパラメータを含めてターゲット分析物の存在又は不存在を決定する上で有用な非線形関数2000の複数の特性を抽出することが容易であり、正確に抽出することができる。
非線形関数2000は、標準化されたデータセットにフィッティングされた関数である。図9に示す式は非線形関数2000の一例であり、シグモイド関数の一形態である。図9に示すシグモイド関数は4個のパラメータa1,a2,a3,a4を含む。シグモイド関数は、5個以上のパラメータを含んでもよく、3個以下のパラメータを含んでもよい。
非線形関数2000の特性はパラメータa1,a2,a3,a4、変位(dRFU)、最大勾配(df)又はRを含む。最大勾配はFDM(First Derivative Maximum)と表現され得る。
非線形関数2000の変位は、非線形関数2000の最大値と最小値との差又は初期値と最終値との差であり得る。一例において、非線形関数2000の変位はa2-a1と計算され得る。非線形関数2000の変位は、変位に対する閾値と比較され得る。例えば、変位に対する閾値は70、80、90、100、110、120、130又は140である。変位に対する閾値の単位はRFUであり得る。非線形関数2000の変位が変位に対する閾値未満である場合、試料内ターゲット分析物が不存在すると決定され得る。
パラメータa3は、非線形関数2000の変曲点である。dfは、非線形関数2000の最大勾配である。dfはa3における勾配であり得る。非線形関数2000の最大勾配は最大勾配に対する閾値と比較され得る。例えば、最大勾配に対する閾値は20、21、22、23、24、25、26、27、28、29、30、31、又は32である。非線形関数2000の最大勾配が最大勾配に対する閾値未満である場合、試料内ターゲット分析物が不存在すると決定され得る。
本発明の一具現例において、二次関数を用いて試料内ターゲット分析物の存在又は不存在を決定することができる。
データセットに対する二次関数(quadratic function)を生成する。全区間(全サイクル)でデータセットとのフィッティングを用いて二次関数が生成される。全区間でフィッティングされた二次関数は第1二次関数と表記され得る。フィッティングのために様々な従来の非線形回帰分析方法を本発明に用いることができる(参照:Seber,G.A.F.;Wild,C.J.(1989)。Nonlinear Regression.New York:John Wiley and Sons)。第1二次関数はy=ax+bx+cの形態の関数である。
第1二次関数が最小である時のサイクル(Cmin)又は第1二次関数のxの係数に基づいて試料内ターゲット分析物の存在又は不存在を決定する。
本発明の一具現例において、二次関数を用いて試料内ターゲット分析物の存在又は不存在を決定できる。データセットのベースライン領域のサイクルに基づいて決定されたフィッティング区間でデータセットに対する二次関数が生成される。二次関数はフィッティング区間内でデータセットとフィッティングされた関数である。全区間でフィッティングされた二次関数は第1二次関数と表記され、フィッティング区間でフィッティングされた二次関数は第2二次関数と表記され得る。フィッティング区間で第2二次関数に対するフィッティング正確度が決定される。フィッティング正確度を用いて試料内前記ターゲット分析物の存在又は不存在が決定される。
図10は、二次関数を用いる本発明の一実施例による順序図である。
段階2110でターゲット分析物に対するデータセットを得る。この段階は、上述した方法に記載された内容を参照されたい。段階2120で、データセットに対する第1二次関数を生成する。全区間(全サイクル)でデータセットとのフィッティングを用いて第1二次関数が生成される。フィッティングのために様々な従来の非線形回帰分析方法が本発明に用いられ得る(参照:Seber,G.A.F.;Wild,C.J.(1989)。Nonlinear Regression.New York:John Wiley and Sons)。第1二次関数はy=ax+bx+cの形態の関数である。
段階2130で、フィッティング区間でデータセットに対する第2二次関数を生成する。フィッティング区間は、第1二次関数が最小である時のサイクル(Cmin)又はベースライン領域のサイクルに基づいて決定される。
本明細書でフィッティング区間を言及しながら使う言葉“ベースライン領域のサイクルに基づいて決定”とは、ベースライン領域の全サイクル又は一部サイクルを選択してフィッティング区間として使用することを意味する。
フィッティング区間としてベースライン領域のサイクルは、従来の方法(例えば、米国特許第8,560,247号及びWO2016/052991)によって又は経験的に決定されたベースライン領域の全体又は一部のサイクルの中から選択され得る。
第1二次関数が生成され、最小値である時のサイクル(Cmin)が閾値以上であるか又はxの係数が0よりも大きい場合、フィッティング区間で第2二次関数が生成される。フィッティング区間はデータセットのベースライン領域のサイクルに基づいて決定され得る。或いは、フィッティング区間は第1二次関数が最小である時のサイクル(Cmin)に基づいて決定されてもよい。フィッティング区間を言及しながら使う言葉“第1二次関数が最小である時のサイクル(Cmin)に基づいて決定”とは、フィッティング区間の最終サイクル(end cycle)がCmin又はCmin周辺のサイクル(具体的にCmin±5サイクル内のサイクル)に基づいて決定されることを意味する。フィッティング区間は、上述した開始フィッティングサイクルから最終サイクルまでと決定され、最終サイクルは、第1二次関数が最小である時のサイクル(Cmin)に基づいて決定されたサイクルと決定され得る。
第2二次関数は、一次関数、多次関数(例えば、二次関数及び三次関数)及び指数関数のように様々な関数を含む。線形又は非線形回帰分析方法を用いてデータセットと最も一致する第2二次関数を決定することができる。
本発明の一具現例によれば、第2二次関数の代わりに指数関数が用いられ得る。第2二次関数はy=a(x-b)+c形態の関数である。指数関数はy=d(ea(b-x))+c形態の関数である。bは、第2二次関数又は指数関数の対称軸である。
データセットのベースライン領域で信号値にフィッティングされた指数関数が生成され、データセットから指数関数を差し引いて補正されたデータセットが生成される。
段階2140で、フィッティング区間で第2二次関数に対するフィッティング正確度(fitting accuracy)を決定する。データセットと第2二次関数間のフィッティング正確度はフィッティング区間内の信号値を用いて決定される。
本発明の特徴の一つは、第2二次関数のフィッティング正確度をターゲット分析物の分析に直接の指標として用いることである。段階2150で、フィッティング正確度を用いて試料内ターゲット分析物の存在又は不存在を決定する。
図11は、本発明の一実施例によるデータセットの補正方法を説明するための順序図である。
段階2210で、ターゲット分析物に対するデータセットを得る。この段階は、上述した方法に記載された内容を参照されたい。段階2220で、データセットに対する第1二次関数を生成する。第1二次関数は、全区間でデータセットにフィッティングされた二次関数である。段階2230で、データセットのベースライン領域のサイクルに基づいて決定されたフィッティング区間でデータセットに対する第2二次関数を生成する。第2二次関数は、フィッティング区間でデータセットにフィッティングされた二次関数である。段階2240で、データセットの信号値から第2二次関数の値を差し引いてデータセットを補正する。
図12は、第1二次関数を用いてフィッティング区間を設定する方法を説明するための図である。分析装置は、第1二次関数2320が最小である時のサイクル(Cmin)に基づいてフィッティング区間を設定する。データセット2310は信号-発生反応から得られる。データセット2310は増幅装置から得られてもよく、増幅装置から得られたデータセットを補正して得られてもよい。例えば、同一チャネルにおいて高温及び低温検出温度でデータセットを得、低温検出温度で得られたデータセットから高温検出温度で得られたデータセットを差し引いてデータセット2310を得ることができる。また、増幅装置はチャネル間の干渉を考慮してデータセットを補正し、補正されたデータセットを出力してもよい。
第1二次関数2320はデータセット2310とのフィッティングによって決定される。分析装置は、3個のパラメータを有する二次関数(y=ax+bx+c)とデータセット2310に最小二乗法を適用してデータセット2310に対する第1二次関数2320を生成する。
分析装置は、第1二次関数2320を生成した後に、第1二次関数2320が最小である時のサイクル(Cmin)を決定する。分析装置は第1二次関数2320を微分してCminを決定できる。図12では第1二次関数2320に対するCminが10の場合を示す。
minが閾値未満であれば、分析装置はCminを用いてフィッティング区間を設定する。分析装置はCminを用いてフィッティング区間の最終サイクルを決定できる。一例において、分析装置は、Cmin、Cmin-1、Cmin-2、Cmin-3、Cmin-4又はCmin-5をフィッティング区間の最終サイクルとして決定できる。または、分析装置はCmin、Cmin+1、Cmin+2、Cmin+3、Cmin+4又はCmin+5をフィッティング区間の最終サイクルとして決定できる。Cminが10であり、閾値が30であれば、Cminが閾値未満であるので、分析装置はCminを用いてフィッティング区間の最終サイクルを決定する。
分析装置はCminと最小フィッティングサイクルを用いてフィッティング区間の最終サイクルを決定できる。一例において、最小フィッティングサイクルは10、サイクル9、8、7、6、5と決定され得る。最小フィッティングサイクルは増幅反応の最終サイクルによって決定され得る。分析装置はCmin、Cmin-1、Cmin-2、Cmin-3、Cmin-4又はCmin-5のいずれか一つの値を選択し、選択された値と最小フィッティングサイクルのうち大きい値をフィッティング区間の最終サイクルとして決定することができる。最小フィッティングサイクルが9であり、Cminが10であると、分析装置は9及び10のうち大きい値である10をフィッティング区間の最終サイクルとして決定できる。
分析装置は開始フィッティングサイクルを設定する。開始フィッティングサイクルはフィッティング区間の最小サイクルである。フィッティング区間は、最小サイクルと最大サイクルとの間になる。開始フィッティングサイクルは増幅反応の最終サイクルによって決定され得る。一例において、製品の最大サイクルが40であれば、開始フィッティングサイクルはサイクル0、1、2になり得る。一例において、製品の最大サイクルがサイクル40を超えると、開始フィッティングサイクルはサイクル4、5、6、7になり得る。
図13は、第1二次関数が最小である時のサイクル(Cmin)を用いて試料内ターゲット分析物の不存在を決定する方法を説明するための図である。分析装置はCminを決定し、Cminが閾値を超えると、試料内ターゲット分析物が不存在すると決定する。第1二次関数2420はデータセット2410とのフィッティングによって決定される。分析装置は、3個のパラメータを有する二次関数(y=ax+bx+c)とデータセット2410に最小二乗法を適用してデータセット2410に対する第1二次関数2420を生成する。
図13で、データセット2410は陰性試料であり、サイクルが増加するにつれて信号値の大きさが小さくなる。したがって、データセット2410に対する第1二次関数2420も減少する形態となる。第1二次関数2420が最小である時のサイクル(Cmin)が40になる。第1二次関数2420が最小である時のサイクル(サイクル40)が閾値(サイクル30)を超えるので、分析装置は試料内ターゲット分析物が不存在すると決定する。
本発明は、データセットと第1二次関数が最小である時のサイクル(Cmin)だけによって試料内ターゲット分析物が不存在するか否かを決定できる。したがって、既存の方法とは違い、データセットを補正し、閾値を用いてCt値を取得する段階無しで、試料内ターゲットの不存在を正確、迅速且つ簡便に決定できる。
図14は、第2二次関数とデータセットのフィッティング正確度を用いて試料内ターゲット分析物の不存在を決定する方法を説明するための図である。
分析装置は、第1二次関数2510を用いてフィッティング区間を設定する。分析装置はデータセット2500に対する第1二次関数2510を生成する。分析装置は第1二次関数2510が最小である時のサイクル(Cmin)を計算する。第1二次関数2510が最小である時のサイクル(サイクル10)が閾値(サイクル30)未満であるので、分析装置は、第1二次関数2510が最小である時のサイクル(Cmin)又はベースライン領域のサイクルに基づいてフィッティング区間を決定する。
分析装置は、フィッティング区間でデータセット2500にフィッティングされた第2二次関数2520を生成する。分析装置はフィッティング区間で第2二次関数2520に対するフィッティング正確度を決定する。
図14ではフィッティング正確度としてR値を利用し、R値が0.7925である。R値が閾値(0.85)未満であるので、分析装置は試料内ターゲット分析物が不存在すると決定する。
本発明は、データセットに対する第1二次関数2510が最小である時のサイクル(Cmin)又はベースライン領域のサイクルを第2二次関数2520のフィッティング区間として用い、フィッティング正確度をターゲット分析物分析、特にターゲット分析物の不存在を検出する直接の指標として用いて、偽陽性及び偽陰性、特に偽陽性無しでターゲット分析物を分析できるようにする。
図15は、第2二次関数を用いてベースラインを設定する方法を説明するための図である。分析装置は、第2二次関数2620をベースラインとして設定できる。
分析装置は、第1二次関数2610を用いてフィッティング区間を設定する。分析装置はデータセット2600に対する第1二次関数2610を生成する。分析装置は、第1二次関数2610が最小である時のサイクル(Cmin)を計算する。第1二次関数2610が最小である時のサイクル(サイクル9)が閾値(サイクル30)未満であるので、分析装置は第1二次関数2610が最小である時のサイクル(Cmin)又はベースライン領域のサイクルに基づいてフィッティング区間を決定する。
分析装置はフィッティング区間でデータセット2600に対するフィッティングを行う。分析装置は、フィッティング区間でデータセット2600にフィッティングされた第2二次関数2620を生成する。
分析装置は、フィッティング区間で第2二次関数2620に対するフィッティング正確度を決定する。分析装置はフィッティング区間におけるデータセット2600の信号値と第2二次関数2620の関数値を用いてフィッティング正確度を決定する。図15ではフィッティング正確度としてR値を利用し、R値が0.7925である。R値が閾値(0.85)を超えるので、分析装置は第2二次関数2620をベースラインとして決定する。
第2二次関数2620を決定する時にはフィッティング区間内のデータセット2600の信号値が用いられるが、第2二次関数2620がベースラインとして設定されると、全サイクルにおいて第2二次関数2620の関数値が用いられる。
分析装置は、全サイクルでデータセット2600の信号値から第2二次関数2620の関数値を差し引いてデータセット2600を補正することができる。分析装置は、補正されたデータセットを分析して試料内ターゲット分析物の存在又は不存在を決定することができる。
本発明は、陰性対照群のような別途の分析物の分析無しにもデータセット2600を分析することだけでベースラインを設定できる長所を有する。
図16は、MuDT技術に基づく本発明の方法に対する順序図である。図16を参照して、本発明の方法をそれぞれの段階別に詳細に説明すると、次の通りである。
段階2710で、2つの異なる温度で信号を検出する。相対的に低温検出温度及び相対的に高温検出温度で信号が検出される。
段階2720で、相対的低温検出温度で検出された信号を評価する。相対的低温検出温度で検出された信号が第1閾値によって定義された第1基準を満たすか否か決定する。
相対的低温検出温度で検出された信号が第1基準を満たすとき、段階2730を行い、相対的低温検出温度で検出された信号が第1基準を満たさないとき、第1ターゲット核酸配列及び第2ターゲット核酸配列が試料内に存在しないと決定され、段階2730を行わない。
相対的低温検出温度で検出された信号が第1基準を満たさないということは、試料内第1ターゲット核酸配列及び第2ターゲット核酸配列が不存在することを意味する。したがって、段階2730を実施する必要がなく、手順を終了する。
相対的低温検出温度で検出された信号が第1基準を満たすということは、第1ターゲット核酸配列又は第2ターゲット核酸配列が試料内に存在する可能性があることを意味するので、次の段階を行う。相対的低温検出温度で検出された信号が第1基準を満たすとしても、必ずしも2個のターゲット核酸配列のうち1個以上のターゲット核酸配列が試料内に存在することを意味するわけではない。
第1基準は第1閾値によって定義(define)され得る。この段階で使われる“第1閾値”とは、相対的低温検出温度で検出された信号の有意性を決定するために用いられる閾値を意味する。“第2閾値”は、第2ターゲット核酸配列に対する信号の有意性を決定するために用いられる閾値を意味する。“第3閾値”は、第1ターゲット核酸配列に対する信号の有意性を決定するために用いられる閾値を意味する。“第3閾値”は、相対的高温検出温度で検出された信号の有意性を決定するために用いられる閾値を意味してもよい。信号の有意性は、特定温度で生成された信号が特定の閾値に対して意味のあるレベルで生成されることを意味する。信号の有意性は、特定信号-発生手段によって生成された信号とそれ以外の信号を区分するために設定された適切な閾値によって判断され得る。具体的に、信号の有意性を判断するために用いられる閾値は、関心の核酸配列から由来しない信号、例えば背景信号又はノイズ信号などを排除できる任意の値に設定される。一例として、増幅反応が進行されるにつれて信号が増幅される場合、信号が閾値以上であると、信号は有意のものと決定され得る。
閾値(第1、第2、第3閾値)は通常の閾値設定方法によって定められ得る。例えば、閾値は、背景信号、敏感度、標識特性、検出器の信号変移(signal variation)又は誤差範囲を考慮して決定することができる。の閾値は信号-発生反応の指数区域(exponential region)に設定され得る。閾値は信号-発生反応の停滞区域(plateau region)の信号値より大きくないとともにベースライン領域(baseline region)の信号値より大きい値に設定され得る。または、閾値は、ベースライン差し引きされた増幅曲線においてベースライン領域の信号値の標準偏差に一定の値(例えば、10)を掛けた値に設定することができる。
閾値は、検出器が自動で又は実施者が直接設定することができる。例えば、第1閾値は100(RFU)であり得る。
段階2730で、第2ターゲット核酸配列に対する信号を抽出する。段階2720で、相対的低温検出温度で検出された信号が第1基準を満たすとき、第2ターゲット核酸配列に対する信号を抽出する。本発明の特徴の一つは、相対的高温検出温度で検出された信号が第3基準を満たさなくとも、第2ターゲット核酸配列に対する信号を抽出する段階を実施することである。
本発明は、相対的高温検出温度で検出された信号が第3基準を満たさないときにも、すなわち、相対的高温検出温度で検出された信号に関係なく信号を抽出する段階2730を行う。
2個の異なる検出温度で検出された信号と基準値を用いて特定ターゲット核酸配列に対する信号を抽出する過程を、本願では‘信号抽出過程(Signal Extraction Process)’と命名する。
段階2740で、第2ターゲット核酸配列に対する信号を評価する。抽出された第2ターゲット核酸配列に対する信号が第2閾値又は第2信号変位によって定義された第2基準を満たすか否か識別する。第2ターゲット核酸配列に対する信号が第2基準を満たすとき、第2ターゲット核酸配列が試料内に存在すると決定される。第2ターゲット核酸配列に対する信号が第2基準を満たさないとき、第2ターゲット核酸配列が試料内に不存在すると決定される。第2基準は第2閾値又は第2信号変位によって定義される。
非線形関数フィッティング方法を適用する前に、第2ターゲット核酸配列に対する信号を二次関数を用いて補正することができ、二次関数と第2ターゲット核酸配列に対する信号とのフィッティング正確度を用いて第2ターゲット核酸配列の不存在が決定され得る。
フィッティングを行う前に、分析装置は、第2ターゲット核酸配列に対する信号に対するベースラインを設定し、第2ターゲット核酸配列に対する信号からベースラインを差し引いて、補正された第2ターゲット核酸配列に対する信号を生成できる。分析装置は、補正された第2ターゲット核酸配列に対する信号に非線形関数フィッティング方法を適用することができる。
本発明の一具現例において、分析装置はフィッティング区間を設定し、フィッティング区間で第2ターゲット核酸配列に対する信号にフィッティングされた二次関数を生成し、二次関数をベースラインとして設定できる。フィッティング区間はあらかじめ設定された区間であり得る。一例において、フィッティング区間はサイクル4~サイクル12に設定され得る。分析装置は、サイクル4~サイクル12の信号値に最も一致する二次関数をフィッティングによって生成する。この時、二次関数は対称軸を有することができ、対称軸は信号-発生反応の最終サイクル±10、最終サイクル±8、最終サイクル±6、最終サイクル±5、最終サイクル±3、最終サイクル±2、又は最終サイクル±1の範囲にあり得る。
分析装置は、補正されたデータセット(又は、補正された第2ターゲット核酸配列に対する信号)と非線形関数をフィッティングし、フィッティングされた非線形関数と補正されたデータセットとのフィッティング正確度を用いて第2ターゲット核酸配列の存在又は不存在を決定できる。
段階2750で第1ターゲット核酸配列に対する信号を評価する。
分析装置は相対的高温検出温度で検出された信号が第3閾値又は第3信号変位によって定義される第3基準を満たすか否か識別する。相対的高温検出温度で検出された信号が第3基準を満たすとき、第1ターゲット核酸配列が試料内に存在すると決定され、相対的高温検出温度で検出された信号が第3基準を満たさないとき、第1ターゲット核酸配列が試料内に不存在すると決定される。
本発明の一具現例において、相対的高温検出温度で検出された信号が第3基準を満たしても、第1ターゲット核酸配列が試料内に存在すると最終的に決定するために非線形関数フィッティング方法を用いることができる。
段階2750は、段階2710と段階2720との間、段階2720と段階2730との間、段階2730と段階2740との間、又は段階2740の後に実施され得る。
本発明の特徴及び利点を要約すると、次の通りである:
(a)本発明は、データセットに対する非線形関数のフィッティング正確度をターゲット分析物分析、特にターゲット分析物の検出に直接の指標として用いて、偽陽性及び偽陰性、特に偽陽性無しでターゲット分析物を検出できるようにする。
(b)ターゲット核酸配列を核酸増幅反応で検出する本発明の具現例において、本発明はCt値を得るための閾値を設定することなく、試料内ターゲットの存在又は不存在を正確、迅速且つ簡便に決定することができる。
(c)ターゲット核酸配列を核酸増幅反応で検出する本発明の具現例において、非線形フィッティング関数のフィッティング正確度の他に、(i)データセット、補正されたデータセット又は非線形フィッティング関数の変位、(ii)非線形フィッティング関数の最大勾配及び(iii)非線形フィッティング関数の形態を決定するパラメータ(特に、4個のパラメータを含むシグモイド関数のa4)を用いてターゲット核酸配列を検出することができ、これによって、様々な臨床試料に現れる誤ったターゲット決定、特に偽陽性を完壁に除去することができる。
(d)本発明において、変位、最大勾配及び形態-決定的パラメータのようなターゲット分析物の存在又は不存在を決定するために用いられるパラメータに適用される閾値は、特定信号値を考慮する従来技術と違い、デートセットの信号パターン(例えば、核酸増幅反応のデータセット)を考慮して設定される。このような点で、本発明は、実験ごとに、反応ごとに、製品ごとに、装備ごとに具体的に閾値を設定する必要がない長所を有する。例えば、あらかじめ核酸増幅反応のデータセットで適切な閾値を設定すれば、設定された閾値は、以降の全ての核酸増幅反応に適用され得る。または、閾値を試料の種類ごとにそれぞれ設定し、設定された閾値は、以降の当該試料を用いる全ての核酸増幅反応に適用され得る。例えば、糞便(stool)を用いた核酸増幅反応に対する閾値をあらかじめ設定すれば、設定された閾値は、以降の糞便試料を用いる全ての核酸増幅反応に適用され得る。
(e)本発明は基本的に信号の強度ではなく信号のパターンを用いてターゲット分析物を分析するものであるから、ノイズ影響を著しく減らすことができる。
(f)SBN技術を用いる一具現例において、非線形フィッティング関数は標準化係数を用いて標準化されたデータセットに適用される。
(g)SBN技術を用いる一具現例において、本発明は、より便利な方式でデータセットを補正でき、機器間及び機器内信号偏差を大幅に減らすことができる。SBN技術を用いて標準化されたデータセットは、非常に便利な方式で非線形-フィッティング関数のパラメータに対する閾値を設定可能にする。
(h)本発明は、標準化されたデータセットの形態(shape)が典型的な増幅曲線の形態と一致するか否かを分析してターゲット分析物の存在又は不存在を決定するので、ノイズやジャンプエラーによって偽陽性と判断する可能性が極めて低い。
(i)一具現例によれば、本発明は、1つの特性ではなく非線形フィッティング関数の少なくとも2つの特性を分析して検出結果を導出するので、偽陽性又は偽陰性結果を減らすことができるという点で非常に画期的な技術である。
(j)SBN技術を用いる一具現例において、適切な基準値を用いたデータ標準化をする本発明は、信号-発生手段(例えば、プライマー及びプローブ)の量を減らすことにおいてより有利である。
(k)一具現例において、本発明は、データセットに対する第1二次関数が最小である時のサイクルを、特にターゲット分析物の不存在を検出する直接の指標として用いて、偽陽性及び偽陰性、特に偽陽性無しでターゲット分析物を分析することができる。
(l)一具現例において、本発明は、(i)データセットに対する第1二次関数が最小である時のサイクル又は(ii)第2二次関数のフィッティング区間としてベースライン領域のサイクルを利用し、第2二次関数のフィッティング正確度をターゲット分析物の不存在を決定する直接の指標として用いて偽陽性及び偽陰性、特に偽陽性無しでターゲット分析物を分析することができる。
(m)一具現例において、本発明は(i)データセットに対する第1二次関数が最小である時のサイクル又は(ii)ベースライン領域のサイクルに基づいて決定された第2二次関数をデータセットを補正するために用いることができる。
(n)データセットに対する第1二次関数が最小である時のサイクルに対する閾値及び第2二次関数のフィッティング正確度に対する閾値は、特定の信号値を考慮する従来技術と違い、データセット(例えば、核酸増幅反応のデータセット)の信号パターンを考慮して設定される。このような点で、本発明は実験ごとに、反応ごとに、製品ごとに、装備ごとに閾値を具体的に設定しなくて済むという長所がある。
一実施例によるターゲット分析物を分析する装置を示す。 一実施例による分析装置を説明するための構成図である。 一実施例によるターゲット分析物の分析方法を説明するための順序図である。 一実施例によるターゲット分析物の存在又は不存在を決定する方法を説明するための順序図である。 試料内ターゲット分析物が存在する場合、フィッティング正確度を用いて分析する方法を説明するための図である。 最大勾配を用いてターゲット分析物の存在又は不存在を決定する方法を説明するための順序図である。 試料内ターゲット分析物が存在する場合、最大勾配を用いて分析する方法を説明するための図である。 SBN方法を用いてデータセットを標準化する方法を説明するための図である。 非線形関数に対する特性を説明するための図である。 二次関数を用いる本発明の一実施例による順序図である。 本発明の一実施例によるデータセットを補正する方法を説明するための順序図である。 第1二次関数を用いてフィッティング区間を設定する方法を説明するための図である。 minを用いて試料内ターゲット分析物の不存在を決定する方法を説明するための図である。 第2二次関数とデータセットとのフィッティング正確度を用いて試料内ターゲット分析物の不存在を決定する方法を説明するための図である。 第2二次関数を用いてベースラインを設定する方法を説明するための図である。 MuDT技術に基づく本発明の方法を説明するための順序図である。 標準化されていないデータセットに対する分析結果を示す図である。 標準化されていないデータセットに対する分析結果を示す図である。 標準化されていないデータセットに対する分析結果を示す図である。 標準化されていないデータセットに対する分析結果を示す図である。 標準化されたデータセットに対する分析結果を示す図である。 標準化されたデータセットに対する分析結果を示す図である。 標準化されたデータセットに対する分析結果を示す図である。 標準化されたデータセットに対する分析結果を示す図である。
以下、実施例を用いて本発明をより詳細に説明する。これらの実施例は単に本発明をより具体的に説明するためのものであり、添付する請求項に記載の本発明の範囲がそれらの実施例によって制限されないということは、本発明の属する技術の分野における通常の知識を有する者にとって明らかであろう。
実施例1:胃腸管感染ウイルスの検出
データセットの取得
急性下痢の主要原因であるノロウイルス(Norovirus)GI、ノロウイルスGII、アデノウイルス(Adenovirus)及びロタウイルス(Rotavirus)を検出するためにSeegene社のAllplexTMGI-Virus Assayを使用した。
CFX96TM実時間PCR検出システム(Bio-rad)を用いて30個のサンプルに対して核酸増幅反応を行った。核酸増幅反応は95℃で10秒、60℃で1分、そして72℃で30秒を反復する条件で行われ、総45サイクルを行う。PTOCE(WO2012/096523)及びMuDT(WO2015/147412)技術を用いてCFX96からデータセットを取得した。前記データセットは全ての増幅サイクルに対する信号値を含む。
30個のサンプルは、次の表1のように臨床実験によって陽性又は陰性が確認されたサンプルである(陽性サンプル20個、陰性サンプルが10個)。
サンプル1、2、3、6及び7はノロウイルスGII、サンプル9、10、11、13及び14はアデノウイルス、サンプル16、17、19、20及び21はノロウイルスGI、そしてサンプル24、26、27、28及び29はロタウイルスに感染されたサンプルである。
Figure 2022050639000008
補正されたデータセットの取得
データセットを補正するために陰性対照群差し引き(Negative control Subtraction)を行った。陰性対照群は、試料の添加無しでAllplexTMGI-Virus Assayの構成(component)だけを含む。サンプルに対する核酸増幅反応を行う時、同一プレートで一緒に陰性対照群の増幅反応を行って陰性対照群に対するデータセットを取得した。各サイクルでデータセットの信号値から陰性対照群の信号値を差し引いて補正されたデータセットを取得した。各サンプルに対して陰性対照群差し引きを行い、補正されたデータセットを取得した。
シグモイド関数フィッティングを用いたターゲット核酸分子の存在又は不存在を決定
(a)シグモイドフィッティング関数の取得
サンプルのそれぞれから得られた補正されたデータセットに対して4個のパラメータを含む式3を用いてシグモイド関数とのフィッティングを行った。LMアルゴリズム(Levenberg-Marquardtアルゴリズム;Christian Kanzow
et al.,JCAM,172(2):375(2004))を適用して、補正されたデータセットにフィッティングされたシグモイド関数を取得した。
(b)シグモイド関数の変位による陰性1次フィルタリング
シグモイド関数の変位を用いて陰性サンプルをフィルタリングした。シグモイドフィッティング関数の変位は、シグモイドフィッティング関数の最大RFUと最小RFUとの差を計算して取得した。計算された変位と変位に対する閾値(RFU 100)を比較して陰性サンプルをフィルタリングした。前記フィッティングされたシグモイド関数の変位が100(RFU)以下であるサンプルは陰性と決定した。
5個のサンプルのシグモイド関数の変位が100(RFU)以下であり、陰性としてフィルタリングした(サンプル5、8、12、23及び25)(表2)。
Figure 2022050639000009
(c)シグモイドフィッティング関数の最大勾配による陰性二次フィルタリング
シグモイドフィッティング関数の最大勾配を用いて残り25個のサンプルに対して二次陰性フィルタリングを行った。最大勾配は、各サンプルに対してシグモイドフィッティング関数を微分して計算した(すなわち、前記シグモイド関数に対するFDM(the first derivative maximum)値)。最大勾配に対する閾値は28に設定された。
表3に整理したように、4個のサンプル(サンプル15、18、22及び30)のシグモイド関数の最大勾配が28未満であるので、4個のサンプルを陰性としてフィルタリングした。
Figure 2022050639000010
(d)フィッティング正確度R値による陽性又は陰性サンプルの最終決定
陰性と決定された9個のサンプルを除く、残り21個のサンプルに対してフィッティング正確度を計算した。フィッティング正確度としてR値を用いた。R値は式4を用いて計算され、R値に対する閾値は0.87に設定した。R値が0.87以下であるサンプルは陰性と決定した。
表4に見られるように、21個のサンプルのうち1個のサンプルに対するR値が0.87未満で陰性サンプルとして確認された(サンプル4)。残り20個のサンプルは、R値が0.87を超え、陽性サンプルとして確認された。
Figure 2022050639000011
実施例2:従来技術による胃腸管感染ウイルスの検出(実施例1に対する比較実施例)
データセットの取得
実施例1と同じ過程によってデータセットを取得した。
補正されたデータセットの取得
Nearest neighbor smoothingアルゴリズム(Winfried Stute et al.,Journal of Multivariate Analysis,34:61(1990))を用いてノイズを除去した。生データセット(raw data set)の差が基準閾値以上になるサイクルまで線形回帰を行ってベースラインを取得し、ベースライン差し引きによって補正されたデータセットを取得した。
値に対する閾値を用いてターゲット核酸分子の存在又は不存在を決定
前記補正されたデータセットがC値に対する閾値を超えるか否か判断して、サンプルのそれぞれに対する陽性又は陰性を判定した。補正されたデータセットにおいて閾値を超える信号値があると、そのサンプルを陽性と判定し、閾値を超える信号値がないと、そのサンプルを陰性と判定した。C値に対する閾値は、ノロウイルスGI、ノロウイルスGII、アデノウイルス及びロタウイルスに対してそれぞれ120、120、60及び120が用いられた。
Figure 2022050639000012
表5に整理した通り、7個陰性、及び23個陽性と分析された。23個の陽性サンプルのうち3個のサンプル(4、5及び8)は、臨床実験結果では陰性サンプルと確認された。したがって、閾値を適用する従来技術は本発明に比べて偽陽性結果が出る可能性が一層高いはずである。
実験の結果
本発明と従来方法を適用して30個のサンプルを分析した。サンプルは総30個であり、臨床実験によって陽性サンプルは20個、陰性サンプルは10個と判定された。
Figure 2022050639000013
表6に見られるように、従来技術によって3個のサンプルに対して偽陽性結果が出た。しかし、本発明は、30個のサンプルとも臨床実験結果と同じ分析結果を示した。したがって、本発明の分析方法によれば、C値を得るための閾値設定無しで試料内ターゲット核酸分子の存在又は不存在を正確、迅速且つ簡便に決定できることが分かった。
実施例3:データセットの標準化方法及び非線形フィッティング関数を用いた試料内ターゲット分析物の分析方法
SBN(Specific Background signal-based Normalization)方法による標準化によってデータセットを補正した後、本発明の方法によって非線形フィッティング関数を用いて試料内ターゲット分析物の存在又は不存在を分析した。
データセットの取得
4個のターゲット核酸配列に対する実時間重合酵素連鎖反応を行った。3台のCFX96実時間PCR装置(Bio-Rad)を用いて4個のターゲット核酸配列を同時に増幅し、それぞれのターゲット核酸配列に対してTaqManプローブを信号-発生手段として用い、増幅サイクルを50回にして行った。同一のターゲット核酸配列が同一の濃度で含まれたサンプルを用いて各装備別、チャネル別に96個ウェルで96個反応を同一の条件で行い、これから12個グループ(3個装備×4個チャネル)のデータセットを取得した。
Figure 2022050639000014
データセットの標準化
装備別/チャネル別基準値を適用してデータセットを補正した。基準総信号変化値(Reference TSC;R-TSC)に対する各装備別/チャネル別データセットの総信号変化値の比率を用いて装備別/チャネル別基準値を決定した。基準総信号変化値は、全ての装備/チャネルに対してRFU5,000と任意に決定し、データセットの総信号変化値は、各装備別/チャネル別に96個反応の平均値を基準にして決定した。前記データセットの基準サイクルの信号値を前記比率で補正し、前記基準サイクルの補正された信号値を基準値として用いて、該当する装備の該当するチャネルから得られたデータセットに適用した。
下記段階1~段階3において装備別、チャネル別データセットから基準値を決定し、段階4では、前記決定された装備別、チャネル別基準値を用いて前記データセットを補正した。
<段階1>
基準サイクルをデータセットのサイクル5と決定し、前記サイクル5の信号値を基準値の決定に使用した。また、データセットの総信号変化値は、最後50番目のサイクルにおける信号値から基準サイクルにおける信号値を差し引いて算出した。TSC及び基準サイクルの信号値は、表8に整理した。
Figure 2022050639000015
<段階2>
前記算出された総信号変化値と共に各装備及びチャネルで基準値決定に用いられる基準総信号変化値(reference TSC;R-TSC)をRFU 5,000と指定した。
<段階3>
前記総信号変化値、基準サイクルの信号値及び基準総信号変化値を用いて各装備に適用される基準値を次のように算出した。
Figure 2022050639000016
データセットの補正に用いられる基準値は、表9のように決定された。
Figure 2022050639000017
<段階4>
前記決定された基準値を用いて、12個グループのデータセットを次のように標準化した:各ウェルのデータセットで基準サイクルの信号値と前記段階3で決定された基準値を用いて標準化係数(Normalization coefficient)を計算した:標準化係数=基準サイクルの信号値÷基準値
標準化係数を用いて全てのサイクルで信号値を標準化し、12個グループに対して標準化されたデータセットを取得した。標準化された信号値(RFU)=データセットの信号値(RFU)÷標準化係数
ベースライニング
12個グループのデータセットと標準化されたデータセットに対するベースライニングを行った。対称軸を有する二次関数を用いてベースライニングを行った。二次関数はy=a(x-50)+cの形態を使用した。ベースライニングに対するフィッティング区間はサイクル4~サイクル12と決定した。サイクル4からサイクル12までのデータセットの信号値にフィッティングされる二次関数を生成した。データセットの信号値から二次関数の値を差し引いて12個グループのベースライニングされたデータセットと12個グループの標準化及びベースライニングされたデータセットを得た。
非線形フィッティング関数としてシグモイド関数を取得
12個グループのベースライニングされたデータセット(図17~図20参照)及び12個グループの標準化及びベースライニングされたデータセット(図21~図24)に対して、4個のパラメータを含む式3のシグモイド関数を用いてシグモイド関数とのフィッティングを行った。
値、変位値及び最大勾配を実施例1のように計算した。
ターゲット核酸分子の存在又は不存在を決定
試料内ターゲット分析物の存在又は不存在を決定するために、シグモイド関数での4個パラメータ、変位、R2及び最大勾配に対する閾値を下記のように設定した:変位≧RFU100;R≧0.9;最大勾配≧50;及びa4<2.0.
4個の基準を全て満たす場合、ターゲット分析物が試料内に存在すると決定した。4個の基準のいずれか一つでも満たさない場合、ターゲット分析物が試料内に存在しないと決定した。12個グループの標準化されたデータセットに対する非線形フィッティング関数の分析の結果、4個の基準を全て満たし、12個の試料内にターゲット分析物が全て存在すると決定された。
Figure 2022050639000018
したがって、データセットを標準化し、ベースライニングした後、非線形フィッティング関数で分析して試料内ターゲット分析物の存在又は不存在を決定できることが確認できた。
値に対する閾値を用いて定量分析が必要な場合、本発明は、非線形フィッティング関数を適用してデータセットのノイズ信号を標準化でき、SBN方法によって変位また標準化できるので、装備別又はチャネル別信号差を考慮することなく、異なる装備又はチャネルに対する閾値を容易に又は均一に設定できるという点で優れた利点を呈する。
図17~図20は、それぞれ、チャネル1(FAM)、チャネル2(HEX)、チャネル3(CalRed 610)及びチャネル4(Quasar 670)に対する標準化されていないデータセットの結果を示す。図17~図20に見られるように、標準化されていないデータセットに対する非線形フィッティング関数は、装備間信号変化量差を示す変動係数(Coefficient of Variation,CV)が49.5%、51.1%、44.7%、そして62.6%と偏差が大きいことが確認できた。
図21~図24は、それぞれ、チャネル1(FAM)、チャネル2(HEX)、チャネル3(CalRed 610)及びチャネル4(Quasar 670)に対する標準化されたデータセットの結果を示す。図21~図24に示すように、標準化されたデータセットの非線形関数は、装備間信号変化量変動係数が2.7%、4.0%、5.3%、そして3.7%と偏差が顕著に減少したことが確認できる。前記非線形関数曲線から全ての装備及びチャネルで同じ閾値であるRFU 110を用いてCt値を計算して比較した結果、C値の変動係数が、標準化方法の非適用時に5.7%で、標準化方法の適用時に1.6%であった。これは、SBN方法と共に非線形フィッティング方法が、装備及びチャネル間における変動(variation)が大きく減少した定量データ(例えば、C値)を提供できる、ということが確認できた。
表11~表18は、図17~図24のデータを表す。
Figure 2022050639000019
Figure 2022050639000020
Figure 2022050639000021
Figure 2022050639000022
Figure 2022050639000023
Figure 2022050639000024
Figure 2022050639000025
Figure 2022050639000026
Min.:最小(Minimum)
Max.:最大(Maximum)
Range :Max-Min
SD:標準偏差(Standard Deviation)
CV:変動係数(Coefficient of variation)
SBN:特定背景信号基盤標準化(Specific Background signal-based Normalization)
Figure 2022050639000027
興味深いことに、SBN方法によって信号強度を調節して標準化したとき、シグモイド関数の基本形態に関連しているパラメータa3、a4、及びフィッティング正確度であるR値は変わらず、これは、SBN方法の適用によって、R値を用いた陽性又は陰性試料の決定のような本発明の非線形フィッティング分析結果及びパラメータa4を用いた異常信号の検出に影響を与えなかったことを示す。したがって、非線形フィッティング関数を用いた本発明の方法と連動して前記SBN方法を利用することが好適であることが分かった。
実施例4:呼吸器感染ウイルスIの検出
データセットの取得
呼吸器感染の主要原因であるインフルエンザウイルス(Flu A及びFlu B)及び3種のFlu Aサブタイプ(H1,H1pdm09及びH3)を検出するためにSeegene社のAllplexTMRespiratory Panel 1を使用した。
CFX96TM実時間PCR検出システム(Bio-rad)を用いて10個のサンプルに対して核酸増幅反応を行った。核酸増幅反応は、95℃で10秒、60℃で1分そして72℃で10秒を反復する条件で行われ、総45サイクルを進行した。PTOCE(WO2012/096523)及びMuDT(WO2015/147412)技術が適用され、CFX96からデータセットを取得した。データセットは全ての増幅サイクルに対する信号値を含む。
10個のサンプルは、次の表20のように、臨床実験によって陽性又は陰性が確認されたサンプルである(陽性サンプル5個、陰性サンプル5個)。サンプル1はFlu A、サンプル2はFlu B、サンプル4はFlu A-H1、そしてサンプル7及び8はFlu A-H3ウイルスに感染されたサンプルである。
Figure 2022050639000028
データセットに対する第1二次関数を生成
各サンプルのデータセットと第1二次関数をフィッティングした。第1二次関数としてy=ax+bx+cを使用した。データセットと第1二次関数のフィッティングは、LMアルゴリズム(Levenberg-Marquardtアルゴリズム;Christian Kanzow et al.,JCAM,172(2):375(2004))が適用された。
第1二次関数を用いた陰性フィルタリング
(a)第1二次関数の係数を用いる陰性1次フィルタリング
Figure 2022050639000029
10個サンプルのうち2個サンプルに対する第1二次関数のxの係数が0未満であり、2個のサンプル(サンプル3、6)を陰性としてフィルタリングした。
(b)第1二次関数のCminを用いる陰性二次フィルタリング
Figure 2022050639000030
10個サンプルのうち2個サンプルは30以上のCminを有し、2個のサンプル(サンプル5、10)を陰性としてフィルタリングした。
min に基づいて決定されたフィッティング区間でデータセットに対する第2二次関数を生成
第1二次関数を用いた陰性フィルタリングを通過したデータセットに対してCmin値を用いてフィッティング区間を決定した。最小フィッティングサイクルを12に決定し、Cminが12以下である場合にはフィッティング区間をサイクル1からサイクル12まで、そしてCminが12を超える場合にはフィッティング区間をサイクル1からサイクルCminまでと決定し、データセットのフィッティング区間で第2二次関数を生成した。第2二次関数はサイクル50の対称軸を有する関数であり、y=a(x-50)+cの形態を使用した。フィッティング区間においてデータセットと第2二次関数のフィッティングにはLMアルゴリズムが適用された。
第2二次関数を用いた陰性フィルタリング
陰性フィルタリングの結果を次表23に整理した。
Figure 2022050639000031
第1二次関数による陰性フィルタリングにおいて陰性と決定された4個のサンプルを除く、残り6個のサンプルに対してフィッティング正確度(R値)を計算した。フィッティング正確度は、フィッティング区間内でデータセットと第2二次関数を用いて計算された。R値は式5を用いて計算され、R値に対する閾値は、0.9を適用した。したがって、R値が0.9以下であるサンプルは陰性と決定した。
表23に見られるように、6個のサンプルのうち1個のサンプルに対するR値が0.9未満で陰性サンプルと確認された(サンプル9)。残り5個のサンプルは、R値が0.9を超え、データセットの信号値から第2二次関数の値を差し引いてデータセットを補正した。
また、補正されたデータセットに対するシグモイドフィッティング関数によって決定されたフィッティング正確度(R値)を計算した結果、サンプル1、2、4、7及び8の場合、R値が0.9以上を示し、陽性サンプルと決定した。
実験の結果
本発明を適用して10個のサンプルを分析した。それらのうち、第1二次関数のxの係数を用いて2個サンプルを陰性と判定し、第1二次関数が最小である時のサイクル(Cmin)を用いて2個のサンプルを陰性と判定した。データセットに対する第2二次関数のフィッティング正確度を用いて1個のサンプルを陰性判定した。残り5個サンプルに対するデータセットは、第2二次関数を用いて補正した。
したがって、本発明の分析方法によれば、第1二次関数のxの係数及び/又は第1二次関数が最小である時のサイクル(Cmin)、そしてデータセットに対する第2二次関数のフィッティング正確度を用いて迅速且つ簡便に試料内ターゲットの不存在を決定できることが分かる。また、本発明の分析方法によれば、第2二次関数を用いてデータセットを補正してノイズの除去されたデータセットを生成することができる。
実施例5:呼吸器感染ウイルスIIの検出
データセットの取得
呼吸器感染の主要原因であるインフルエンザウイルス(Flu A)及びFlu Aサブタイプ(H1pdm09及びH3)を検出するためにSeegene社のAllplexTMRespiratory Panel 1を使用した。
CFX96TM実時間PCR検出システム(Bio-rad)を用いて4個のサンプルに対して核酸増幅反応を行った。核酸増幅反応は、95℃で10秒、60℃で1分そして72℃で10秒を反復する条件で行われ、総45サイクルを進行した。PTOCE(WO2012/096523)及びMuDT(WO2015/147412)技術が適用され、CFX96からデータセットを取得した。データセットは全ての増幅サイクルで相対的低温検出温度で60℃及び相対的高温検出温度で72℃での全ての信号値を含む。
4個のサンプルは、次の表24のように臨床実験によって陽性又は陰性が確認されたサンプルである(陽性サンプル3個、陰性サンプル1個)。サンプル1はFlu A(72℃)、サンプル3はFlu A-H1pdm09(60℃)、そしてサンプル4はFlu
A-H3(72℃)ウイルスに感染されたサンプルである。サンプル4は60℃で内部対照群(Internal Control)に対する信号値を含む。
Figure 2022050639000032
60℃データセットに対する変位を用いた陰性フィルタリング
Figure 2022050639000033
変位は、最終サイクルにおける信号値と最小信号強度を有するサイクルにおける信号値(最小信号値)との差と計算された。サンプル2は変位が閾値100(RFU)を超えず、陰性としてフィルタリングした。
60℃で検出された信号から第1ターゲット核酸配列に対する信号を除去
(i)第1ターゲット核酸配列に対する信号を除去するための基準値及び(ii)相対的低温検出温度で検出された信号を用いて、相対的低温検出温度で検出された信号から第2ターゲット核酸配列に対する信号を抽出した。
第2ターゲット核酸配列に対する信号=[60℃温度で検出された信号]-[(72℃の相対的高温検出温度で検出された信号)×(第1ターゲット核酸配列に対する基準値)]


第1ターゲット核酸配列に対する基準値は検出チャネルによって変わり、サンプル1、3及び4の基準値はそれぞれ、1.3、1.2、及び1.8だった。
信号変位を用いた陰性フィルタリング
Figure 2022050639000034
第2ターゲット核酸配列に対する信号は、60℃で検出された信号から抽出された信号である。サンプル3個のうち、1個のサンプル(サンプル1)に対して第2ターゲット核酸配列に対する最後のサイクル45における信号値と最小信号値との差が閾値100(RFU)を超えず、サンプル1に対する第2ターゲット核酸配列を陰性としてフィルタリングした。
フィッティング区間で信号に対する二次関数を生成
第1ターゲット核酸配列に対する信号及び第2ターゲット核酸配列に対する信号のそれぞれを二次関数とフィッティングした。フィッティング区間はサイクル4~12に設定し、二次関数の対称軸はサイクル50に設定された。フィッティングはLMアルゴリズムを用いて行った。
二次関数のフィッティング正確度を用いた陰性フィルタリング
Figure 2022050639000035
信号変位フィルタリングで陰性と決定された1つのサンプル(サンプル1)を除く、残りサンプルに対してフィッティング区間で二次関数を用いてフィッティング正確度(R値)を計算した。R値は式5を用いて計算され、R値に対する閾値は0.9を適用した。0.9以下のR値を有するサンプルは陰性と決定した。
表27に見られるように、0.9を超えるR値を有するサンプルのデータセットを、前記データセットの信号値から二次関数の値を差し引いて補正した。
非線形フィッティング関数を用いた陰性フィルタリング
Figure 2022050639000036
(a)シグモイド関数の生成
4個のパラメータを含む式3のシグモイド関数を用いて、前記補正されたデータセットとシグモイド関数のフィッティングを行った。LMアルゴリズムを適用して補正されたデータセットにフィッティングされたシグモイド関数を生成した。
(b)シグモイドフィッティング関数の変位による陰性1次フィルタリング
シグモイド関数の変位を用いて陰性サンプルをフィルタリングした。シグモイドフィッティング関数の変位は、シグモイドフィッティング関数の最大信号値と最小信号値との差を計算して取得した。計算された変位と変位に対する閾値(100RFU)を比較して陰性サンプルをフィルタリングした。全サンプルに対する変位がいずれも閾値100を超えた。
(c)シグモイドフィッティング関数の最大勾配による陰性二次フィルタリング
シグモイドフィッティング関数の最大勾配を用いて陰性二次フィルタリングを行った。最大勾配は、各サンプルに対してシグモイドフィッティング関数を微分して計算した。最大勾配に対する閾値は30に設定された。表28に整理された通り、サンプル3の第1ターゲット核酸配列に対する信号に対してシグモイドフィッティング関数の最大勾配が30未満であり、よって、サンプル3の第1ターゲット核酸配列を陰性としてフィルタリングした。
(d)フィッティング正確度R値による陽性又は陰性サンプルの最終決定
フィッティング正確度はR値を用いた。R値は式4を用いて計算され、R値に対する閾値は、0.90を適用した。R値が0.90を超えるサンプルは陽性と決定された。
実験の結果
MuDT技術と共に非線形フィッティング関数を用いる本発明を適用して4個のサンプルを分析した。相対的低温検出温度で検出された信号の変位が閾値(100RFU)よりも小さい1個のサンプル(サンプル2)を陰性とフィルタリングした。サンプル2は、第1ターゲット核酸配列及び第2ターゲット核酸配列の両方とも存在しないと決定された。
サンプル2を除く3個のサンプルに対して第2ターゲット核酸配列に対する信号を抽出し、第1ターゲット核酸配列に対する信号の変位及び第2ターゲット核酸配列に対する信号の変位と閾値(100RFU)を比較した。閾値を超えない変位を有するサンプル1の第2ターゲット核酸配列に対する信号を陰性としてフィルタリングした。
陰性とフィルタリングされなかった信号に対するシグモイド関数を生成し、シグモイド関数の最大勾配が閾値(30)を超えないサンプル3の第1ターゲット核酸配列に対する信号を陰性としてフィルタリングした。
シグモイド関数と信号間のR値を計算し、残り全ての信号のR値が閾値0.90を超えるので、陽性としてフィルタリングした。
本発明の分析方法によれば、相対的低温検出温度で検出された信号の変位と閾値を比較して、異なる検出温度を有する2個のターゲット核酸配列の不存在を決定することができる。本発明の分析方法によれば、相対的高温検出温度で検出された信号の変位に関係なく第2ターゲット核酸配列に対する信号を抽出することによって、第2ターゲット核酸配列の存在又は不存在を決定できる。本発明の分析方法によれば、シグモイドフィッティング関数を用いて、第1ターゲット核酸配列及び第2ターゲット核酸配列の存在又は不存在を決定することができる。
以上では本発明の特定の部分を詳細に記述したが、当業界の通常の知識を有する者にとって、このような具体的な記述は好ましい具現例に過ぎず、これに本発明の範囲が制限されるものではない点は明らかである。したがって、本発明の実質的な範囲は添付する請求項とその等価物によって定義されるといえよう。

Claims (10)

  1. 次の段階を含む試料内ターゲット分析物の分析方法:
    前記ターゲット分析物に対するデータセットを得る段階;前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
    前記ターゲット分析物は、ターゲット核酸分子であり、
    前記データセットのベースライン領域のフィッティング区間で前記データセットにフィッティングされた二次関数を生成する段階;及び
    前記データセットから前記二次関数を差し引いて前記データセットを補正する段階。
  2. 前記二次関数は対称軸を有することを特徴とする、請求項1に記載の方法。
  3. 前記フィッティング区間は、開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum Fitting Cycle,MFC)までであることを特徴とする、請求項1に記載の方法。
  4. 前記データセットの変位が前記変位に対する閾値を超える場合、前記フィッティング区間は、開始フィッティングサイクル(Starting Fitting Cycle,SFC)から最小フィッティングサイクル(Minimum Fitting Cycle,MFC)までであることを特徴とする、請求項1に記載の方法。
  5. 前記方法は、前記フィッティング区間で二次関数を生成する段階前に、全領域で前記データセットにフィッティングされた第1二次関数を生成する段階をさらに含み;そして前記フィッティング区間は、前記第1二次関数が最小信号値を有するサイクル(Cmin)に基づいて決定されることを特徴とする、請求項1に記載の方法。
  6. 前記フィッティング区間は、(i)CminからN(Nは0又は正の整数)を引いたサイクルと、(ii)最小フィッティングサイクル(MFC)とのうち、大きいサイクルに基づいて決定されることを特徴とする、請求項1に記載の方法。
  7. 前記方法は、前記二次関数のフィッティング正確度を決定する段階をさらに含み;前記フィッティング正確度が前記フィッティング正確度に対する閾値を超える場合、前記二次関数を差し引く段階が行われることを特徴とする、請求項1に記載の方法。
  8. 前記フィッティング正確度は、前記データセットに対する前記二次関数のx値(chi square value)又はR値(R-square value)であることを特徴とする、請求項7に記載の方法。
  9. 次を含む試料内ターゲット分析物の分析装置:
    メモリー;及び
    プロセッサ;
    前記メモリーは、前記ターゲット分析物に対するデータセットを保存し、前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
    前記ターゲット分析物は、ターゲット核酸分子であり、そして
    前記プロセッサは、前記データセットのベースライン領域のフィッティング区間で前記データセットに対してフィッティングされた二次関数を生成し、前記データセットから前記二次関数を差し引いて前記データセットを補正する。
  10. 次の段階を含む方法を実行するためのプロセッサを具現する指示を含むコンピュータ読取り可能な記録媒体:
    ターゲット分析物に対するデータセットを得る段階;前記データセットは信号-発生手段を用いる信号-発生反応から得られ、サイクル番号及び信号値を含む複数のデータ地点を含み、
    前記ターゲット分析物は、ターゲット核酸分子であり、
    前記データセットのベースライン領域のフィッティング区間で前記データセットに対する二次関数を生成する段階;及び
    前記データセットから前記二次関数を差し引いて前記データセットを補正する段階。
JP2022005073A 2017-09-28 2022-01-17 試料内ターゲット分析物を分析する方法及び装置 Active JP7379548B2 (ja)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
KR20170125908 2017-09-28
KR10-2017-0125908 2017-09-28
KR10-2017-0136772 2017-10-20
KR20170136772 2017-10-20
KR20170143792 2017-10-31
KR10-2017-0143792 2017-10-31
KR10-2017-0184510 2017-12-29
KR20170184510 2017-12-29
PCT/KR2018/011559 WO2019066572A2 (en) 2017-09-28 2018-09-28 METHOD AND DEVICE FOR TARGET ANALYTE ANALYSIS IN A SAMPLE
JP2020518032A JP7012151B2 (ja) 2017-09-28 2018-09-28 試料内ターゲット分析物を分析する方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020518032A Division JP7012151B2 (ja) 2017-09-28 2018-09-28 試料内ターゲット分析物を分析する方法及び装置

Publications (2)

Publication Number Publication Date
JP2022050639A true JP2022050639A (ja) 2022-03-30
JP7379548B2 JP7379548B2 (ja) 2023-11-14

Family

ID=65902699

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020518032A Active JP7012151B2 (ja) 2017-09-28 2018-09-28 試料内ターゲット分析物を分析する方法及び装置
JP2022005073A Active JP7379548B2 (ja) 2017-09-28 2022-01-17 試料内ターゲット分析物を分析する方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020518032A Active JP7012151B2 (ja) 2017-09-28 2018-09-28 試料内ターゲット分析物を分析する方法及び装置

Country Status (8)

Country Link
US (2) US12018318B2 (ja)
EP (1) EP3688760A4 (ja)
JP (2) JP7012151B2 (ja)
KR (1) KR102420644B1 (ja)
CN (1) CN111149170A (ja)
AU (3) AU2018339207A1 (ja)
CA (2) CA3229263A1 (ja)
WO (1) WO2019066572A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112020019755A2 (pt) * 2018-04-20 2021-01-26 Seegene, Inc. método e aparelho para detectar uma pluralidade de sequências de ácidos nucleicos alvo na amostra
JP7353396B2 (ja) 2019-06-14 2023-09-29 シージーン アイエヌシー ターゲット核酸検出用試薬の協業開発のためのコンピュータ処理方法
WO2024128468A1 (ko) * 2022-12-12 2024-06-20 주식회사 씨젠 Assay용 컴포넌트 생성 방법 및 이를 수행하는 assay용 컴포넌트 생성 장치
WO2024128878A1 (ko) * 2022-12-15 2024-06-20 주식회사 씨젠 형광 데이터의 분석 알고리즘에 대한 성능 비교 결과를 디스플레이하는 장치 및 방법
CN116564411B (zh) * 2023-07-12 2023-09-29 广州普世君安生物科技有限公司 等温扩增核酸的结果判定方法、系统、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007188484A (ja) * 2005-12-19 2007-07-26 F Hoffmann La Roche Ag 分析法及び分析装置
JP2007267730A (ja) * 2005-12-20 2007-10-18 F Hoffmann La Roche Ag ダブルシグモイドLevenberg−Marquardt及びロバスト線形回帰による温度ステップの補正
US20090150085A1 (en) * 2007-12-06 2009-06-11 Samsung Electronics Co., Ltd. Method of determining initial concentration of nucleic acid in sample using real-time amplification data
JP2012502378A (ja) * 2008-09-09 2012-01-26 バイオ−ラッド ラボラトリーズ,インコーポレイティド 多段階回帰ベースpcr解析システム
US20120308990A1 (en) * 2011-06-01 2012-12-06 Streck, Inc. Rapid Thermocycler System for Rapid Amplification of Nucleic Acids and Related Methods
US20130179090A1 (en) * 2010-09-28 2013-07-11 Authentix, Inc. Determining the Quantity of a Taggant in a Liquid Sample
JP2016500863A (ja) * 2012-10-02 2016-01-14 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft リアルタイムpcrサイクル閾値を判定するための汎用的な方法
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5541311A (en) 1992-12-07 1996-07-30 Third Wave Technologies, Inc. Nucleic acid encoding synthesis-deficient thermostable DNA polymerase
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
US6117635A (en) 1996-07-16 2000-09-12 Intergen Company Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
US6194149B1 (en) 1998-03-03 2001-02-27 Third Wave Technologies, Inc. Target-dependent reactions using structure-bridging oligonucleotides
GB9812768D0 (en) 1998-06-13 1998-08-12 Zeneca Ltd Methods
EP1190097A2 (en) 1999-06-22 2002-03-27 Invitrogen Corporation Improved primers and methods for the detection and discrimination of nucleic acids
KR100738073B1 (ko) 2004-09-01 2007-07-12 삼성전자주식회사 실시간 핵산 증폭 데이터로부터 초기 핵산 농도를정량화하는 방법
EP1647910A1 (en) * 2004-09-29 2006-04-19 Roche Diagnostics GmbH Qualitative analysis of a sample using an algorithm
US7680604B2 (en) 2005-03-11 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by rotational transform after zero slope alignment
US7680868B2 (en) 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
EP1804172B1 (en) * 2005-12-20 2021-08-11 Roche Diagnostics GmbH PCR elbow determination using curvature analysis of a double sigmoid
US20080178653A1 (en) 2007-01-29 2008-07-31 Applera Corporation System and Method for Interpolative Calibration
US20090119020A1 (en) 2007-09-25 2009-05-07 Roche Molecular Systems, Inc. Pcr elbow determination using quadratic test for curvature analysis of a double sigmoid
US8219324B2 (en) 2008-09-12 2012-07-10 Roche Molecular Systems, Inc. Real-time PCR elbow calling by equation-less algorithm
US8271205B2 (en) * 2008-09-19 2012-09-18 Corbett Research Pty Ltd Method and system for analysis of melt curves, particularly dsDNA and protein melt curves
KR101569476B1 (ko) 2009-12-21 2015-11-16 주식회사 씨젠 Tsg프라이머 타겟 검출
WO2011130184A2 (en) * 2010-04-11 2011-10-20 Life Technologies Corporation SYSTEMS AND METHODS FOR MODEL-BASED qPCR
MX2017015093A (es) 2011-01-11 2023-03-10 Seegene Inc Detección de secuencias de ácido nucleico objetivo mediante ensayo de escisión y extensión del pto.
EP3353697A4 (en) * 2015-09-24 2019-03-20 Seegene, Inc. ANALYSIS OF MULTIPLE RECORDINGS FOR DETERMINING THE PRESENCE OR NON-PRESENCE OF TARGET ANALYSTS
WO2017086762A1 (en) * 2015-11-20 2017-05-26 Seegene, Inc. Method for calibrating a data set of a target analyte

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007188484A (ja) * 2005-12-19 2007-07-26 F Hoffmann La Roche Ag 分析法及び分析装置
JP2007267730A (ja) * 2005-12-20 2007-10-18 F Hoffmann La Roche Ag ダブルシグモイドLevenberg−Marquardt及びロバスト線形回帰による温度ステップの補正
US20090150085A1 (en) * 2007-12-06 2009-06-11 Samsung Electronics Co., Ltd. Method of determining initial concentration of nucleic acid in sample using real-time amplification data
JP2012502378A (ja) * 2008-09-09 2012-01-26 バイオ−ラッド ラボラトリーズ,インコーポレイティド 多段階回帰ベースpcr解析システム
US20130179090A1 (en) * 2010-09-28 2013-07-11 Authentix, Inc. Determining the Quantity of a Taggant in a Liquid Sample
US20120308990A1 (en) * 2011-06-01 2012-12-06 Streck, Inc. Rapid Thermocycler System for Rapid Amplification of Nucleic Acids and Related Methods
JP2016500863A (ja) * 2012-10-02 2016-01-14 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft リアルタイムpcrサイクル閾値を判定するための汎用的な方法
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NUCLEIC ACIDS RES., vol. 32, no. 22, JPN6023040573, 2004, pages 178, ISSN: 0005165926 *

Also Published As

Publication number Publication date
US20200291462A1 (en) 2020-09-17
KR20200039851A (ko) 2020-04-16
JP2021500869A (ja) 2021-01-14
WO2019066572A3 (en) 2019-06-27
JP7012151B2 (ja) 2022-01-27
WO2019066572A2 (en) 2019-04-04
KR102420644B1 (ko) 2022-07-13
JP7379548B2 (ja) 2023-11-14
AU2018339207A1 (en) 2020-04-16
CA3229263A1 (en) 2019-04-04
US20240301473A1 (en) 2024-09-12
CN111149170A (zh) 2020-05-12
CA3077137A1 (en) 2019-04-04
AU2022202180A1 (en) 2022-04-21
EP3688760A4 (en) 2021-07-14
EP3688760A2 (en) 2020-08-05
US12018318B2 (en) 2024-06-25
AU2024201268A1 (en) 2024-03-14
AU2022202180B2 (en) 2023-11-30

Similar Documents

Publication Publication Date Title
JP7012151B2 (ja) 試料内ターゲット分析物を分析する方法及び装置
JP6602374B2 (ja) 試料の分析方法
KR102385959B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
CN108351918B (zh) 对目标分析物的数据集的校准方法
US10978173B2 (en) Method for reducing noise level of data set for a target analyte
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
WO2017171469A1 (en) Detection of abnormal signal using two or more datasets
KR102110985B1 (ko) 타겟 핵산 서열에 대한 시그널 추출
KR102699175B1 (ko) 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
KR102408564B1 (ko) 타겟 핵산 서열의 존재를 결정하기 위한 분석 시그널
Kessler Design and work-up of a new molecular diagnostic assay based on real-time PCR

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231101

R150 Certificate of patent or registration of utility model

Ref document number: 7379548

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150