JP2019525289A - 信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法 - Google Patents

信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法 Download PDF

Info

Publication number
JP2019525289A
JP2019525289A JP2018563102A JP2018563102A JP2019525289A JP 2019525289 A JP2019525289 A JP 2019525289A JP 2018563102 A JP2018563102 A JP 2018563102A JP 2018563102 A JP2018563102 A JP 2018563102A JP 2019525289 A JP2019525289 A JP 2019525289A
Authority
JP
Japan
Prior art keywords
data set
cycle
signal
change amount
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018563102A
Other languages
English (en)
Other versions
JP6835877B2 (ja
Inventor
ジョンユーン・チュン
ヨンチョ・リ
ハンビット・リ
Original Assignee
シージーン アイエヌシー
シージーン アイエヌシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シージーン アイエヌシー, シージーン アイエヌシー filed Critical シージーン アイエヌシー
Publication of JP2019525289A publication Critical patent/JP2019525289A/ja
Application granted granted Critical
Publication of JP6835877B2 publication Critical patent/JP6835877B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

本発明は、信号変化量データセット及びその再構成されたデータセットを用いてサンプル内ターゲット分析物質を検出する方法に関するものである。本発明によれば、ベースライニングまたは平滑(smoothing)のようなターゲット分析物質の検出のためのデータセット補正がベースライン領域設定のような複雑なステップを経ないで容易になされることができる。【選択図】図1

Description

本発明は、信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法に関するものである。
重合酵素連鎖反応(Polynucleotide chain reaction:PCR)として公知された最も多く使われる核酸増幅反応は、二重鎖DNAの変性、DNA鋳型へのオリゴヌクレオチドプライマーのアニーリング及びDNA重合酵素によるプライマー延長の反復されたサイクル過程を含む(特許文献1〜3、非特許文献1)。
リアルタイムPCR(Real time PCR)は、サンプルでターゲット核酸をリアルタイムに検出するためのPCR基盤技術である。特定ターゲット核酸を検出するために、リアルタイムPCRは、PCR反応時、ターゲット核酸の量に比例して検出可能な蛍光信号を放出する信号−発生手段を用いる。蛍光信号の発生は、二重鎖DNAの間に挿入されるインターカレーターまたはリポーター、及びクエンチャー分子を含むオリゴヌクレオチドを用いてなされる。ターゲット核酸の量に比例する蛍光信号がリアルタイムPCRを通じて各測定地点(サイクル)毎に検出されて、各測定地点及び前記測定地点での信号値を含むデータセットを収得し、前記データセットから測定地点対比検出される蛍光信号の強さを表示した増幅曲線(amplification curve)または増幅プロファイル曲線(amplification profile curve)を得るようになる。
一般に、リアルタイムPCRによる増幅曲線はベースライン(baseline)領域、指数(exponential)領域、直線(linear)領域、及び停滞(plateau)領域に区分される。指数領域は、PCR増幅産物の増加に比例して放出される蛍光信号が増加する領域であり、直線領域は蛍光信号の増加が実質的に減少して実質的に線形に示され、停滞領域はPCR増幅産物の増加及び蛍光信号の放出が飽和状態になって、これ以上蛍光信号の増加が示されない領域をいう。
ベースライン領域は、反応初期に信号水準が変化無しで一定に維持される領域を意味する。この領域はPCR反応産物が放出する蛍光信号が検出できる程度に充分ではないので、ターゲット分析物質の増幅による蛍光信号よりは反応サンプル自体の蛍光信号と測定システム自体の蛍光信号である背景信号(background signal)がこの領域の蛍光信号の大部分を占める。
ノイズの発生、ベースラインの歪曲、または変動などの問題は、機器間、機器内信号水準の偏差、アニーリング(Annealing)温度の変化など、実験条件の変化及び反応混合物内起泡の発生がその原因である。このようなノイズまたはベースラインの歪曲または変動は、ターゲット分析物質の分析において偽陽性または偽陰性結果を示すようにする。ターゲット分析物質に対するデータセットの正確で、かつ再現性ある分析のために、増幅曲線またはデータセットから背景信号を除去するベースライニング過程及び異常な信号を補正する過程が必要である。
既存のターゲット分析方法によれば、ベースライニング過程は各サンプルのベースライン領域及びベースラインに該当するデータセットを決定し、前記ベースライン領域の背景信号を除去する過程により遂行される。特に、ベースライン領域の決定はベースライン領域の初めの地点及び終わりの地点の決定により遂行される。したがって、ベースライン領域の初めの地点及び終わりの地点を正確に決定することが重要である。
ベースライン領域の決定と関連した多様な方法が開発された。Wooなどは、増幅区間のlower boundを用いてベースライン領域を決定する方法に関して開示している(特許文献4)。Lernerなどは、増幅曲線を微分した後、設定された閾値の値以上を有する最初微分ピークの開始点をベースライン領域の終わりの地点に設定してベースライン領域を決定する方法に関して開示している(特許文献5)。
しかしながら、このような先行技術は限界または短所を有している。既存の方法によれば、ベースライン領域で発生するノイズまたは異常な信号がベースライン決定に影響を及ぼす。特に、ベースライン領域の開始地点または終わりの地点がノイズまたは異常な信号により決定される場合、ベースラインの線形回帰関数を使用したベースライニング過程は、前記ノイズまたは異常な信号に大きい影響を受けるようになる。
このような誤りを防止するために、一定の基準を設定し、前記基準に該当する信号はノイズまたは異常な信号に決定して、前記ノイズまたは異常な信号を除去するか、または避ける多様な方法が提案された。
このような努力にも関わらず、誤って設定されたベースライン領域によるターゲット分析物質検出上の誤りは頻繁に発生している。より問題になることは、ベースライン領域の決定のためのアルゴリズムが複雑で、かつ厳格になるほど、正常信号がノイズまたは異常信号に誤って決定されて、ベースライン領域の決定に新たな誤りが発生する確率が高まるということである。
また、既存の方法では修正を必要とするデータ地点を検出するためにデータセットを加工し、前記加工されたデータセットを用いてノイズ信号を有するデータ地点を検出する。そして、オリジナルデータセットで前記修正を必要とするデータ地点の信号値を補正する。結論として、ノイズまたは異常信号の検出と修正が互いに異なるデータセットで各々なされる。しかも、既存の方法ではジャンプエラーのように続く全体サイクルに影響を及ぼす誤りの場合には続く全体サイクルの信号値を全て修正しなければならないという問題がある。
したがって、ベースライン領域の複雑な設定無しでデータセットを補正することができる新たな接近法の開発が必要な実状である。
本明細書の全体に亘って多数の引用文献及び特許文献が参照され、その引用が表示されている。引用された文献及び特許の開示内容はその全体として本明細書に参照として挿入されて、本発明が属する技術分野の水準及び本発明の内容がより明確に説明される。
米国特許第4683195号明細書 米国特許第4683202号明細書 米国特許第4800159号明細書 米国特許出願公開第2007/0192040号明細書 米国特許第7720611号明細書
Saiki et al.,(1985)Science 230,1350−1354
本発明者らは、より効果的で、かつ正確にサンプル内ターゲット分析物質を分析することができるようにサンプルのデータセットをプロセシングする新たな方法を開発するために努力した。その結果、本発明者らはデータセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供し、前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを収得してサンプル分析に適合した加工されたデータセットが収得できることを突き止めた。
したがって、本発明の目的は、サンプル内ターゲット分析物質検出方法を提供することにある。
本発明の他の目的は、データセット再構成方法を提供することにある。
本発明の他の目的は、データセット平滑方法を提供することにある。
本発明の更に他の目的は、サンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供することにある。
本発明の更に他の目的は、データセット再構成方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供することにある。
本発明の更に他の目的は、データセット平滑方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供することにある。
本発明の他の目的及び利点は、以下の請求範囲及び図面により明確になる。
信号変化量データセット提供ステップ及び再構成されたデータセット提供ステップを含むサンプル内ターゲット分析物質検出方法の一具現例を図示したフローチャートである。 (i)データセットの標準化、(ii)信号変化量データセットのベースライニング、及び(iii)信号変化量データセットの異常信号の補正ステップを含むサンプル内ターゲット分析物質検出方法の一具現例を図示したフローチャートである。 本発明方法の一具現例に使われた3個の原始データセットのプロット(plot)を示す。 本発明の一具現例に従うプロセスの各ステップで収得したデータセット1のプロット(plot)を示す。 追加的なベースライニングステップを適用するか適用しないで本発明の一具現例に従うプロセスの各ステップで収得したデータセット2のプロット(plot)を示す。 ベースライニングステップを適用し、本発明の一具現例に従うプロセスの各ステップで収得したデータセット3のプロット(plot)を示す。 データセットが互いに相異する累積−開始サイクルを使用して収得された場合、各再構成されたデータセットは同一なサイクルで相異する信号値を有するが、前記“累積−開始サイクル”の差に関わらず、各差し引かれたデータセットは同一なサイクルで同一な信号値を有することを示す。 データセットが互いに相異する累積−開始信号値を使用して収得された場合、各再構成されたデータセットは同一なサイクルで相異する信号値を有するが、前記“累積−開始信号値”の差に関わらず、各差し引かれたデータセットは同一なサイクルで同一な信号値を有することを示す。 信号変化量データセットは原始データセットから信号変化量を計算する多様な方法により収得できることを示す。 信号変化量データセット提供ステップ、前記信号変化量データセットの異常信号補正ステップ、及び再構成されたデータセット提供ステップを含むサンプル内ターゲット分析物質検出方法の一具現例を図示したフローチャートを示したものである。 異常信号の補正ステップを含む本発明方法の一具現例に使われた3個の原始データセットのプロット(plot)を示す。 信号変化量データセットを用いた異常信号の検出及び除去プロセスを示したものである。 異常信号除去のための補正を適用した場合と適用しない場合の3個の再構成されたデータセットのプロット(plot)を比較した結果を示す。 本発明のノイズ補正ステップを適用した場合と適用しない場合の再構成されたデータセットのプロット(plot)を比較した結果を示す。 信号変化量データセットの補正及び前記補正された信号変化量データセットの変換ステップを含むサンプル内ターゲット分析物質検出方法の一具現例を図示したフローチャートを示したものである。 信号変化量データセットの補正及び前記補正された信号変化量データセットの変換ステップを含む本発明方法の一具現例に使われた3個の原始データセットのプロット(plot)を示す。 本発明のノイズ補正ステップを適用した場合と適用しない場合の信号変化量データセットの変換により収得した2次信号変化量データセットのプロット(plot)を比較した結果を示す。 データセット平滑(smoothing)方法の一具現例を図示したフローチャートも示したものである。 各反復ステップの再構成されたデータセット1のプロット(plot)を示す。 各反復ステップの再構成されたデータセット1のプロット(plot)の背景領域を示す。
I.再構成されたデータセットを用いたサンプル内ターゲット分析物質検出方法
本発明の一様態によれば、本発明は次のステップを含むサンプル内ターゲット分析物質検出方法を提供する:
(a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含み;及び
(d)前記再構成されたデータセットを用いてサンプル内ターゲット分析物質を検出するステップ。
本発明者らはより効果的で、かつ正確にサンプル内ターゲット分析物質を分析することができるようにサンプルのデータセットをプロセシングする新たな方法を開発するために努力した。その結果、本発明者らは(i)データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供し、(ii)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを収得してサンプル分析に適合した加工されたデータセットが収得できることを突き止めた。
本開示された方法で、ターゲット分析物質に対するデータセットはサイクル及びサイクルでの信号変化量を含む複数のデータ地点を含む信号変化量データセットに変換され、前記信号変化量データセットは再構成されて、サイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む再構成されたデータセットを提供する。
このような変換及び再構成プロセスを通じて、データセットはターゲット分析物質検出に適合するようになる。また、前記信号変化量データセットに遂行された加工(例えば、異常信号またはノイズ信号の修正または除去)は、再構成過程を通じて最終に再構成されたデータセットに反映される。このような方法によりデータセットの信号値の直接的な修正無しでターゲット分析物質検出のためのデータセット加工が可能である。
図1は、ターゲット分析物質に対する再構成されたデータセットを用いた本発明のサンプル内ターゲット分析物質検出方法の一具現例を図示したフローチャートである。
以下、本発明を詳細に説明する。
ステップ(a):ターゲット分析物質に対するデータセット提供(S110)
本発明によれば、まずターゲット分析物質に対するデータセットが提供される。前記データセットは信号−発生手段を用いたターゲット分析物質に対する信号−発生反応から収得され、前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含む。
本明細書で、用語“ターゲット分析物質”は多様な物質(例えば、生物学的物質及び化学物質のような非生物学的物質)を含むことができる。具体的に、ターゲット分析物質は核酸分子(例えば、DNA及びRNA)、蛋白質、ペプチド、炭水化物、地質、アミノ酸、生化学物質、ホルモン、抗体、抗原、代謝物、及び細胞のような生物学的物質でありうる。本発明の一具現例によれば、前記ターゲット分析物質はターゲット核酸分子でありうる。
本明細書で、用語“サンプル”は生物学的サンプル(例えば、細胞、組織及び生物学的ソースから出た流体)及び非生物学的サンプル(例えば、飲食、水、及び土壌)を含むことができる。前記生物学的サンプルは、ウイルス、細菌、組織、細胞、血液(例えば、全血、血漿、及び血清)、リンパ、骨髄液、唾液、喀痰(sputum)、スワブ(swab)、吸引液(aspiration)、母乳、小便、糞便、眼球液、精液、脳抽出物、脊髄液、関節液、胸腺液、気管支洗浄液、腹水、及び羊膜液でありうる。ターゲット分析物質がターゲット核酸序列である場合、前記サンプルは核酸抽出過程を経ることができる。抽出された核酸がRNAである場合、前記抽出されたRNAからcDNAを合成するための逆転写過程を追加で経ることができる(Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001))。
本発明の一具現例によれば、前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得される。本発明の一具現例によれば、本発明の方法はサンプル内ターゲット分析物質に対するデータセットを収得するために信号−発生反応を遂行するステップを追加で含むことができる。
本明細書で、用語“信号−発生反応”はサンプル内ターゲット分析物質の特性に依存的に信号を発生させることができる反応を意味し、前記特性は、例えば、ターゲット分析物質の活性、量または存在(または、不存在)であって、具体的にサンプル内ターゲット分析物質の存在(または、不存在)でありうる。本発明の一具現例によれば、信号−発生反応はサンプル内ターゲット分析物質の存在に依存的に信号を発生させる。
このような信号−発生反応は生物学的または化学的反応でありうる。生物学的反応は、PCR、リアルタイムPCR、マイクロアレイ、及びインベーダーアッセイのような遺伝的分析過程、免疫アッセイ過程、及び細菌培養分析過程でありうる。本発明の一具現例によれば、前記信号−発生反応は遺伝的分析過程を含む。化学的反応は、化学物質の生産、変換、または分解を含む化学的分析でありうる。本発明の一具現例によれば、信号−発生反応は、PCRまたはリアルタイムPCRでありうる。
本発明の一具現例によれば、信号−発生反応は信号の増幅反応でありうる。本明細書で、用語“増幅”または“増幅反応”は信号を増加または減少させる反応を意味する。本発明の一具現例によれば、前記増幅反応は信号−発生手段を用いたターゲット分析物質の存在に依存的な信号の増加(または、増幅)を意味する。前記増幅反応はターゲット分析物質(例えば、核酸分子)の増幅を伴うか、または伴わないことができる。したがって、本発明の一具現例によれば、信号−発生反応はターゲット核酸分子の増幅を伴うか、または伴わないで遂行できる。具体的に、本発明の増幅反応はターゲット分析物質の増幅を伴って遂行される信号増幅反応を意味する。
信号−発生反応は、信号変化を伴う。本明細書で、用語“信号”は測定可能なアウトプットを意味する。
信号変化は、ターゲット分析物質の特性、具体的に、存在または不存在を定性的または定量的に知らせる指示子の役割をする。このような指示子の例示は、蛍光強度、発光強度、化学発光強度、生発光強度、燐光強度、電荷移動、電圧、電流、電力、エネルギー、温度、粘性度、光スキャッタ、放射能強度、反射度、透光度、及び吸光度を含む。最も広く使われる指示子は蛍光強度である。前記信号変化は、信号の増加だけでなく、信号の減少を含む。本発明の一具現例によれば、信号−発生反応は信号値を増幅させる反応である。
本明細書で、用語“信号−発生手段”は分析しようとするターゲット分析物質の特性、具体的に、存在または不存在を示す信号を発生に使われる物質を意味する。
多様な信号−発生手段が知られている。信号−発生手段の例は、オリゴヌクレオチド、標識及び酵素を含むことができる。信号−発生手段は、標識自体または標識が連結されたオリゴヌクレオチドを含むことができる。前記標識は、蛍光標識、発光標識、化学発光標識、電気化学的標識、及び金属標識を含むことができる。インターカレーティング染料(intercalating dye)のように標識自体が信号−発生手段に使われることができる。択一的に、単一標識または供与分子(donor molecule)及び受容分子(acceptor molecule)を含む相互作用的な二重標識が少なくても1つのオリゴヌクレオチドに結合された形態に信号−発生手段に使われることができる。信号−発生手段は、信号を発生させるために核酸分解酵素(例えば、5’核酸切断活性を有する酵素または3’核酸切断活性を有する酵素)のような構成を追加で含むことができる。
信号−発生手段は、(1)離合体形成に依存的な方式により信号を発生させる手段、(2)ターゲット分析物質に特異的に混成化された媒介オリゴヌクレオチド(mediation oligonucleotide)の切断に依存した方式により離合体が形成されて信号を発生させる手段、及び(3)検出−オリゴヌクレオチド(detection−oligonucleotide)の切断により信号を発生させる手段を含むことができる。
本発明の方法がターゲット核酸分子の存在または不存在を決定することに適用される場合、信号−発生反応は当業界に知られた多様な方法により遂行できる。前記方法は、TaqManTMプローブ方法(米国特許第5,210,015号)、分子ビーコン方法(Tyagiなど、Nature Biotechnology 14(3):303(1996))、スコルピオン(Scorpion)方法(Whitcombeなど、Nature Biotechnology 17:804−807(1999) )、サンライズ(SunriseまたはAmplifluor)方法(Nazarenkoなど、Nucleic Acids Research、25(12):2516−2521(1997))、及び米国特許第6,117,635号)、ルクス(Lux)方法(米国特許第7,537,886号)、CPT(Duck Pなど、Biotechniques、9:142−148(1990))、LNA方法(米国特許第6,977,295号)、プレクサ(Plexor)方法(Sherrill CBなど、Journal of the American Chemical Society, 126:4550−4556(2004))、HybeaconsTM (D. J. Frenchなど、 Molecular and Cellular Probes (2001) 13, 363−374、及び米国特許第7,348,141号)、二重標識された自家−クエンチングされたプローブ(Dual−labeled、self−quenched probe;米国特許第5,876,930号)、混成化プローブ(Bernard PSなど、Clin Chem 2000, 46, 147−148)、PTOCE(PTO cleavage and extension)方法(WO 2012/096523)、PCE−SH(PTO Cleavage and Extension−Dependent Signaling Oligonucleotide Hybridization)方法(WO 2013/115442)、PCE−NH(PTO Cleavage and Extension−Dependent Non−Hybridization)方法(PCT/KR2013/012312)、及びCER方法(WO 2011/037306)でありうる。したがって、本発明で増幅反応は前述した信号−発生反応により遂行できる。
本明細書で、用語“サイクル”は条件の変化を伴った複数の測定において、前記条件の変化の単位または前記条件の変化の反復の単位を意味する。例えば、前記条件の変化または条件の変化の反復は、温度、反応時間、反応回数、濃度、pH、及び/又は測定対象(例えば、ターゲット核酸分子)の複製回数の変化または変化の反復を含む。したがって、前記サイクルは条件(例えば、温度または濃度)変化サイクル、時間(time)または過程(process)サイクル、単位運営(unit operation)サイクル、及び再生産(reproduction)サイクルでありうる。サイクル番号は、前記サイクルの反復回数を意味する。本明細書で、用語“サイクル”及び“サイクル番号”は混用できる。
例えば、酵素反応速度(enzyme kinetics)を調べる場合、基質の濃度を一定に増加させながら酵素の反応速度(reaction rate)を数回測定する。この反応で、基質濃度の増加は条件の変化に該当し、基質濃度の増加単位はサイクルに該当する。他の一例に、核酸の等温増幅を遂行する場合、1つのサンプルに対する信号は等温条件で一定の時間差を置いて数回測定される。この反応で、反応時間が条件の変化に該当し、反応時間単位がサイクルに該当する。更に他の例に、核酸増幅反応を通じてターゲット分析物質を検出する方法の1つに、温度を一定に変化させながらターゲット分析物質に混成化されたプローブから発生する蛍光信号を測定する。この反応で、前記温度の変化が条件の変化に該当し、前記温度がサイクルに該当する。
具体的に、一連の反応を反復するか、または一定時間間隔で反応を反復する場合、用語“サイクル”は前記反復の単位を意味する。例えば、重合酵素連鎖反応(PCR)の場合、1つのサイクルはターゲット核酸分子の変性、ターゲット核酸分子とプライマーのアニーリング(混成化)及びプライマーの延長を含む反応単位を意味する。この場合、反応反復の増加が条件の変化に該当し、前記反復の単位がサイクルに該当する。
本発明の一具現例によれば、サンプル内にターゲット核酸分子が存在する場合、増幅反応のサイクルが増加しながら測定される信号の値(強さ)は増加または減少することができる。本発明の一具現例によれば、ターゲット分析物質(例えば、ターゲット核酸分子)の存在を示す信号を増幅するための増幅反応はターゲット核酸分子の増幅と同時に信号が増幅する方式(例えば、リアルタイムPCR)により遂行できる。択一的に、前記増幅反応はターゲット分析物質が増幅されず、信号が増幅される方式により遂行できる(例えば、CPT method (Duck P, et al., Biotechniques, 9:142−148 (1990))、 Invader assay(米国特許第6,358,691号、及び第6,194,149号)。
ターゲット分析物質は多様な方法により増幅できる。例えば、これに限定されないが、重合酵素連鎖反応(the polymerase chain reaction(PCR))、リガーゼ連鎖反応(ligase chain reaction(LCR))(米国特許第4,683,195号、及び第4,683,202号;PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990); Wiedmann M, et al., “Ligase chain reaction (LCR)− overview and applications.” PCR Methods and Applications 1994 Feb;3(4):S51−64))、GLCR(gap filling LCR, WO 90/01069, EP 439182及びWO 93/00447)、Q−beta(Q−beta replicase amplification, Cahill P, et al., Clin Chem., 37(9):1482−5(1991) 、米国特許第5,556,751号)、鎖置換増幅(strand displacement amplification (SDA), G T Walker et al., Nucleic Acids Res. 20(7):1691−1696(1992), EP 497272)、塩基順序基盤増幅(nucleic acid sequence−based amplification (NASBA), Compton, J. Nature 350(6313):91−2(1991))、転写媒介増幅(transcription−mediated amplification(TMA), Hofmann WP et al., J Clin Virol. 32(4):289−93(2005);米国特許第5,888,779号)、またはローリングサークル増幅(rolling circle amplification(RCA), Hutchison C.A. et al., Proc. Natl Acad. Sci. USA. 102:17332−17336(2005))などを含むターゲット核酸分子を増幅するための多様な方法が知られている。
本発明の一具現例によれば、信号−発生手段に使われる標識は、蛍光標識、より具体的に、蛍光単一標識または供与分子(donor molecule)及び受容分子(acceptor molecule)を含む相互作用的な二重標識(例えば、蛍光リポーター分子及びクエンチャー分子含み)を含むことができる。
本発明の一具現例によれば、ターゲット分析物質に対するデータセットはターゲット分析物質に対する増幅反応の結果を示すデータセットでありうる。
本発明の一具現例によれば、本発明に使われる増幅反応はターゲット分析物質(具体的に、ターゲット核酸分子)の増幅と同時に信号を増幅するものでありうる。本発明の一具現例によれば、増幅反応はPCRまたはリアルタイムPCRによって実施できる。本発明の一具現例によれば、前記増幅反応は核酸分子の増幅反応でありうる。
データセットは、信号−発生反応のサイクル及び前記サイクルでの信号値を含む複数のデータ地点を含む。
本発明で、用語“信号の値”または“信号値”は信号−発生反応のサイクルで実際に測定された信号の値(例えば、増幅反応による蛍光強度の実際値)またはその加工された値でありうる。前記加工された値は測定された信号値を数学的に加工した値を含むことができる。測定された信号値を数学的に加工した値の例は、測定された信号値の対数値または導関数値(derivatives)を含むことができる。前記測定された信号値に対する導関数値はマルチ次数の導関数値でありうる。
本明細書で、用語“データ地点”はサイクル及びサイクルでの信号値を含む1つの座標値(a coordinate value)を意味する。本明細書で、用語“データ”はデータセットを構成する全ての情報を意味する。例えば、増幅反応の各サイクル及び信号値はデータでありうる。信号−発生反応、具体的に増幅反応から収得したデータ地点は直交座標系上の座標値で表示できる。直交座標系で、X軸は増幅反応のサイクルを示し、Y軸は各サイクルで測定した信号値または前記信号値の加工された値を示す。
本明細書で、用語“データセット”はデータ地点の集合を意味する。データセットは、信号−発生手段を用いた信号−発生反応(例えば、増幅反応)から直接収得したデータ地点の集合である原始データセットでありうる。択一的に、前記信号−発生手段を用いた信号−発生反応(例えば、増幅反応)から直接収得したデータ地点の集合を含むデータセットを加工して収得した加工されたデータセットでありうる。データセットは、前記信号−発生反応から収得したデータ地点またはその加工されたデータ地点の全体または一部の集合でありうる。データセットは、複数のデータ地点を含む。データセットは、少なくとも2つ以上のデータ地点を含むことができる。データ地点の数は2、3、4、5、10、または20以上でありうる。データセットは、1000個以下のデータ地点を含むことができる。データセットのデータ地点の数は、1000、500、300、200、100、90、80、70、または60以下でありうる。データセットは、3乃至1000個のデータ地点を含むことができる。
データセットのデータ地点の数は、3−1000、10−500、1−100、20−100、20−80、20−70、または20−60でありうる。本発明の一具現例によれば、データセットは20−60個のデータ地点を含むことができる。
本発明のデータセットは、複数のデータセットの加工により収得できる。複数のターゲット分析物質に対する分析を1つの反応容器で遂行する場合、各ターゲット分析物質に対するデータセットは、前記1つの反応容器でなされた反応から収得された原始データセットの加工により収得できる。例えば、1つの反応容器でなされた複数のターゲット分析物質に対するデータセットは互いに異なる温度で測定された信号から収得した複数のデータセットを加工(processing)して収得することができる。データセットはプロッティングされることができ、これによって増幅曲線を収得することができる。その強さがターゲット分子の量に比例する蛍光信号を増幅サイクルに対してプロッティングして増幅曲線または増幅プロファイル曲線を得ることができる。本発明の一具現例によれば、増幅曲線はターゲット分析物質(具体的に、核酸分子)の増幅反応により得ることができる。
本発明の一具現例によれば、データセットは原始データセットの数学的に加工されたデータセットでありうる。具体的に、データセットは原始データセットから背景信号を除去するためのベースラインが差し引かれたデータセットでありうる。ベースライン差し引かれたデータセットは当業界に公知された多様な方法(例えば、米国特許第8,560,240)により収得することができる。
本発明の一具現例によれば、データセットは、原始データセット、前記原始データセットの数学的に加工されたデータセット、前記原始データセットまたはその数学的に加工されたデータセットの標準化(normalization)されたデータセットでありうる。
本明細書で、用語“原始データセット”は信号−発生反応から収得したサイクル番号及び信号値を含むデータ地点の集合を意味する。原始データセットは、リアルタイムPCRのような信号−発生反応を遂行するための装備から最初に収得する非加工されたデータ地点のグループを意味する。本発明の一具現例によれば、原始データセットは、当業界の当業者に伝統的に知られている原始データセットでありうる。本発明の他の一具現例によれば、原始データセットは本明細書に記述された数学的に加工されたデータセットの基礎となるデータセットでありうる。本発明の一具現例によれば、原始データセットはベースラインが差し引かれていないデータセット(ベースライン非差し引きデータセット)でありうる。
本明細書で、用語“標準化”(normalization)は、信号−発生反応から収得したデータセットの信号偏差を減少または除去する過程を意味する。本明細書で、用語“補正”(calibration)または“調整”(adjustment)は、データセットの修正を意味し、具体的に、分析目的に適合するようにデータセットを修正することを意味する。標準化は補正の一様態である。
本発明の一具現例によれば、標準化されたデータセットは次のステップを含む方法により提供される:
(i)前記原始データセットまたは前記原始データセットの数学的に加工されたデータセットを補正するための標準化係数を提供するステップ;前記標準化係数は、基準値、基準サイクル、及び前記データセットを用いて提供され;前記基準サイクルは前記データセットのサイクルのうちから選択され;前記基準値は任意に定まった値であり;前記標準化係数は前記基準サイクルに該当する前記データセットのサイクルでの信号値及び前記基準値の間の関係を定めて提供され;及び
(ii)前記標準化係数を前記データセットの信号値に適用して補正された信号値を収得して標準化されたデータセットを提供するステップ。
基準サイクルは、基準値と関連して標準化係数を提供することに使われる特定信号値を決定するために選択されたサイクルである。標準化係数を提供するための基準サイクルは、データセットのサイクルのうちから任意に選択できる。基準サイクルは、サイクルの意味によって、基準温度、基準濃度、または基準時間でありうる。
本発明の一具現例によれば、基準サイクルは背景領域のサイクルから選択できる。
背景領域は、信号−発生反応で増幅信号が十分に検出される前の初期ステップを意味する。背景領域は、背景信号のみが示され、ターゲット分析物質による信号はほとんど示されない領域を意味する。背景領域信号は、サンプル内ターゲット分析物質による信号でない、分析システム自体またはターゲット分析物質が関与しない信号−発生手段自体で発生した信号である。
具体的に、基準サイクルは背景領域の1−30、2−30、2−20、2−15、2−10、2−8、3−30、3−20、3−15、3−10、3−9、3−8、4−8、または5−8サイクルで決定できる。
基準値は、標準化係数を提供するために使われる値である。本発明の基準値は、データセットの信号値を補正するために基準サイクルに適用される任意の値を意味する。基準値は、任意に定めた値でありうる。好ましくは、前記基準値は0を除外した実数のうちの任意に決まった値でありうる。好ましくは、基準値は補正されたデータセットの値と同一な種類の値であって、補正されるデータセットと同一な単位または次元を有することができる。
基準値及びデータセットで基準サイクルに対応するサイクルでの信号値から補正係数が提供されれば、標準化係数は前記基準値に対するデータセットで基準サイクルに対応するサイクルでの信号値の比率によって決定できる。
ステップ(b):信号変化量収得による信号変化量データセット提供(S120)
信号変化量データセットは、データセットの信号値を用いて各サイクルでの信号変化値を収得して提供できる。
信号変化量データセットは、データセットの各データ地点での信号変化量を示す。信号変化量データセットは、サイクル及び各サイクルでの信号変化量を含む複数のデータ地点を含む。
前記信号変化量データセットは、変化値データセット及び変化率データセットを含むことができる。前記信号変化量は、信号変化値及び信号変化率を全て含むことができる。
前記信号変化量は公知の方法により収得できる。例えば、微分法、差分法、比率法、及び線形回帰分析法により収得できるが、これに制限されるものではない。
本発明の一具現例によれば、前記各サイクルでの累積値は各サイクルでの微分値の累積値、各サイクルでの差分値の累積値、各サイクルでの比率の累積値、及び傾き値の累積値からなる群から選択されたものでありうる。
微分法によれば、信号変化量は原始データセットにfittingする関数を求めて、前記関数の導関数(derivative function)を求めた後、前記導関数を用いて各サイクルでの信号変化量を収得する方法により収得できる。
差分法によれば、2つサイクル(参照サイクル1及び2)の間の信号値の差を計算する方法にしたサイクル(ターゲットサイクル;Cn)での信号変化量を収得する。
本発明の一具現例によれば、参照サイクルのうちの1つはターゲットサイクル(Cn)であり、他の参照サイクルは前記ターゲットサイクルに直前のサイクル(Cn−1)でありうる。このような場合、Cnでの信号変化量はCnの信号値からCn−1の信号値を差し引く方法により収得することができる。1つの参照サイクルがCnに指定される場合、更に他の参照サイクルはCn−1、Cn−2、Cn−3、Cn+1、Cn+2、またはCn+3でありうる。
本発明の他の一具現例によれば、2つ参照サイクルのどちらもCnに指定されないことがある。例えば、ターゲットサイクル(Cn)での信号変化量を求めるための2つ参照サイクルは(Cn−1及びCn+1)、(Cn−2及びCn+2)または(Cn−3及びCn+3)でありうる。
本発明の一具現例によれば、ターゲットサイクルでの信号変化量は2つ参照サイクルの間の信号値の差(difference)を2つ参照サイクルの間のサイクル番号の差で割ったものでありうる。
比率法によれば、2つサイクル(参照サイクル1及び2)の間の信号値の比率を計算する方法にしたサイクル(ターゲットサイクル;Cn)での信号変化量を収得する。
本発明の一具現例によれば、参照サイクルのうちの1つはターゲットサイクル(Cn)であり、他の参照サイクルは前記ターゲットサイクルに直前のサイクル(Cn−1)でありうる。このような場合、Cnでの信号変化量はCnの信号値をCn−1の信号値で割る方法により収得することができる。
択一的に、信号変化量は線形回帰分析または最小二乗法(LMS方法)により提供できる。LMS方法は最も単純で、かつ頻繁に適用される線形回帰分析方法である。
線形回帰分析方法によれば、特定サイクルのデータ地点及び前記特定サイクル前及び/又は後に位置した少なくとも1つ以上のサイクルのデータ地点を用いて、サイクル(ターゲットサイクル;Cn)でのフィッティング(fitting)関数を線形回帰分析により求めて、前記フィッティング関数の傾き(サイクル番号の増加に従う信号値の変化量)を信号変化量に割り当てる。
フィッティング関数を収得することに使われるデータ地点の数は2つまたはその以上でありうる。例えば、フィッティング関数を収得することに使われるデータ地点の数は2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21以下でありうる。具体的に、前記データ地点の数はこの範囲に制限されないが、2−3、2−15、3−21、3−11、3−9、3−7、3−5、または5−7個でありうる。
以下、線形回帰分析の代表例として最小二乗法を説明するが、請求項の本発明の範囲はこれに制限されるものではない。
本発明の一具現例によれば、最小二乗法は、次の<数式1>で表現される:
<数式1>
ここで、
である。
Iは傾きが計算されるデータ地点のサイクル番号であり、mはI番目サイクルデータ地点の傾きであり、xiはi番目サイクルのサイクル番号であり、yiはi番目サイクルで測定される信号値である。
“n”または“a+b+1”はI番目サイクルでの傾き計算に使われるデータ地点の数を意味し、LSMR(Linear Squares Method Range)と称する。“a”はI番目サイクルでの傾き計算に使われるデータ地点グループのうち、最小サイクル番号を求めるための値である。“b”は最大サイクル番号を求めるための値である。
“a”及び“b”は各々独立的に0乃至10の整数であり、具体的に1乃至5、より具体的に1乃至3でありうる。
前記“a”及び“b”は同一な値を有することが好ましいが、測定対象物質、測定環境、または傾きが測定されるサイクルによって相異させることができる。
本発明の一具現例によれば、他のサイクルで信号変化量を求める方法が特定サイクルには適切でない場合、特定サイクルでの信号変化量は他のサイクルで信号変化量を求める方法と異なる方法により提供できる。
例えば、最初のサイクルまたは最後のサイクルでの信号変化量は、他のサイクルと相異する方法により提供できる。
本発明の一具現例によれば、信号変化量データセットのうち、最初のサイクルの信号変化量データセットは0の値に指定できる。この場合、信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して提供される再構成されたデータセットのベースライン領域の信号値は0になる。
択一的に、信号変化量データセットの最初のサイクルでの信号変化量は、原始データセットの最初のサイクルでの信号値または予め決まった信号値に指定できる。このような場合、信号変化量データセットの信号変化量を使用して各サイクルでの累積値を収得して提供される再構成されたデータセットのベースライン領域の信号値は、原始データセットの最初のサイクルでの信号値または予め決まった信号値と同一な値を有するようになる。
信号変化量データセットの信号変化量を使用して各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ(c)の以前に、信号変化量データセットの1つ以上の信号変化量は加工できる。本発明の一具現例によれば、本発明の方法は信号変化量データセットの1つ以上の信号変化量を加工するステップを追加で含むことができる。前記1つ以上の信号変化量の加工は信号変化量データセットのベースライニングまたは異常信号の修正でありうる。
信号変化量データセットの加工は、前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して提供された再構成されたデータセットに影響を及ぼすようになる。
<信号変化量データセットのベースライニング>
データセットのベースライン領域とは、ターゲット物質またはターゲット現象の存在または発生にほとんど影響を受けず、単に信号測定機器自体またはターゲット分析物質が関連しない信号−発生反応自体で発生する信号が反映された領域をいう。一般に、ベースライン領域の信号値はほとんど変化がない。しかしながら、ベースライン領域でターゲット分析物質の存在有無に関わらず、サイクルによって信号値が変化する原因になる誤りを有するデータセットがある。このような場合、ベースライン領域の誤りは修正されなければならない。
このようなベースライン領域の誤りを修正するための既存の方法は、次の過程を含む:
データセットをプロッティングしてベースライン領域を決定し、ベースラインの傾いた程度を決定する。以後、前記プロッティングされた曲線を適切に回転させて修正されたデータセットを収得する。または、ベースライン領域にフィッティング(fitting)された線形関数方程式を収得し、各サイクルでの前記関数に対する結果値を差し引いて修正されたデータセットを収得する。
このような既存の方法は、ベースライン領域を決定した後、ベースライン傾きを計算するか、またはベースラインにフィッティングされた線形関数を収得するような非常に複雑な過程を利用しなければならないという短所がある。
本発明の方法は、データセットのベースライン誤りの問題を信号変化量データセットを加工し、前記加工された信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して解決した。
本明細書で、用語“データセットのベースライニング”とは、データセットの各サイクルでの信号値からベースラインに該当する値を差し引くデータセットを加工する過程をいい、これによってベースライン差し引かれたデータセットが収得される。
信号変化量データセットのベースライニングを通じて信号変化量データセットのベースライン領域は0に調整される。再構成されたデータセットは、ステップ(c)で加工された信号変化量データセットの信号変化量を用いて各サイクルでの累積値を得て収得することができる。このような方法によりベースライン誤りが修正された加工されたデータセットを得ることができる。
本発明の一具現例によれば、前記信号変化量データセットはベースライン差し引かれた信号変化量データセットでありうる。
ベースラインの差し引きは、前記データセットのベースライン領域の値に従うデータセットの補正でありうる。
具体的に、ベースライン差し引かれた信号変化量データセットはベースライン領域の信号変化量が0に調整された信号変化量データセットでありうる。
ベースライン差し引かれた信号変化量データセットは、信号変化量データセットの1つ以上の信号変化量を補正して提供されることができ、特に、信号変化量データセットの各信号変化量から信号変化量データセットのベースライン領域の信号値を差し引いて提供できる。したがって、本発明の一具現例によれば、本発明の方法はステップ(c)の以前にステップ(b)で提供された信号変化量データセットをベースライニングするステップを含むことができる。前記ベースライニングステップは、データセットのベースラインが傾いている問題を解決するための選択的なステップである。前記ベースライニングステップは、図3のデータセット1よりデータセット2のように原始データセットのベースラインが傾いた場合、有用に適用できる。
信号変化量データセットをベースライニングする方法は、特定の方法に限定されず、公知の知られた方法のうちから選択できる。
本発明の特定の一具現例によれば、ベースライン領域の信号変化量が実質的に0になるように信号変化量データセットの信号変化量から特定値を差し引くことができる。
具体的に、信号変化量データセットで信号がターゲットの存在または発生にほとんど影響を受けない初期特定サイクルまたはサイクル領域を決定した後、決まったサイクルでの平均信号変化量を計算し、各サイクルの信号変化量から前記計算された平均信号変化量を差し引いてベースライン差し引かれた信号変化量データセットを収得する。
<信号変化量データセットの異常信号の修正>
信号変化量データセットの異常信号の修正は、本発明の加工方法の一具現例である。本発明の信号変化量データセットの異常信号の修正は、信号変化量データセットから異常信号に分類される信号を有するサイクルを検出し、前記検出されたサイクルに該当する異常信号を修正して原始データセットの異常信号を修正する方法により遂行できる。
信号変化量データセットを用いたデータセットの異常信号の修正は、セクション2で詳細に説明する。
ステップ(c):累積値収得による再構成されたデータセット提供(S130)
再構成されたデータセットは、信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して提供される。
再構成されたデータセットは、サイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。前記累積値は、オリジナル原始データの信号値に比べて変更された値である。
信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して提供される前記再構成されたデータセットは、変更された信号値を含む複数のデータ地点を含む。
ステップ(a)及び(b)を通じて原始データセットの信号値を用いて信号変化量を得て信号変化量データセットを収得し、ステップ(c)を通じて前記信号変化量データセットの信号変化量を用いて累積値を収得して前記信号変化量データセットを再構成されたデータセットに変換する。ステップ(a)から(c)を通じて原始データセットはターゲット分析物質検出により適合した再構成されたデータセットに変換される。
本発明の一具現例によれば、各サイクルでの累積値は各サイクルでの微分値の累積値;各サイクルでの差分値の累積値;各サイクルでの比率の累積値及び各サイクルでの傾き値の累積値からなる群から選択されたものでありうる。
本発明の一具現例によれば、各サイクルでの累積値は累積−開始サイクル及び累積−開始値を用いて収得することができる。
本発明の一具現例によれば、各サイクルでの累積値は累積−開始サイクル(CSC)の番号に対する各サイクルの番号(Xi)によって次の計算法のうちの1つにより計算できる:前記累積−開始サイクルは前記信号変化量データセットのサイクルのうちから選択されたサイクルであり;
(計算法−1)前記XiがCSCの番号より大きい場合、前記各サイクルでの累積値は、(i)累積−開始値、及び(ii)前記累積−開始サイクルの直後のサイクルから前記各サイクルまでの信号変化量を累積して計算され;前記累積−開始値は前記累積−開始サイクルでの累積値であり;
(計算法−2)前記XiがCSCの番号より小さな場合、前記各サイクルでの累積値は、(i)累積−開始値、及び(ii)前記各サイクルの直後のサイクルから前記累積−開始サイクルまでの信号変化量から由来した値を累積して計算され;
(計算法−3)前記XiがCSCの番号と同一な場合、前記累積−開始値が前記各サイクルでの累積値に指定される。
本明細書で、用語“信号変化量から由来した値”は前記信号変化量を加工して収得した値を意味する。前記加工は、数学的加工でありうる。本発明の一具現例によれば、前記信号変化量から由来した値は、数学的に加工された信号変化量でありうる。例えば、信号変化量から由来した値は信号変化量の足し算の逆元、掛け算の逆元、または逆数を含むことができるが、これに制限されるものではない。
各サイクルでの累積値は、累積−開始サイクル(CSC)の番号に対する各サイクルの番号(Xi)によって相異する方法により収得できる。
累積値は、累積和(cumulative sum)または累積積(cumulative product)でありうる。
前記累積値が累積和であり、累積値が計算されるサイクル(Xサイクル)の番号がCSCの番号より大きい場合、前記Xサイクルでの累積値は、(i)累積−開始値、及び(ii)前記累積−開始サイクルの直後のサイクルから前記Xサイクルまでの信号変化量を累積して収得される。
前記累積値が累積和であり、前記Xサイクルの番号がCSCの番号より小さな場合、前記Xサイクルでの累積値は、(i)累積−開始値、及び(ii)前記Xサイクルの直後のサイクルから累積−開始サイクルまでの信号変化量の足し算の逆元(additive inverse)を累積して収得される。
前記累積値が累積和である場合、用語“累積”は“足す”(adding)でありうる。
数学的に、ある数xの足し算の逆元は−xと表示され、前記xに足して和が0になる数をいう。
累積値が累積積であり、累積値が計算されるサイクル(Xサイクル)の番号がCSCの番号より大きい場合、前記Xサイクルでの累積値は、(i)累積−開始値、及び(ii)前記累積−開始サイクルの直後のサイクルから前記Xサイクルまでの信号変化量を累積して収得される。
累積値が累積積であり、前記Xサイクルの番号がCSCより小さな場合、前記Xサイクルでの累積値は、(i)累積−開始値、及び(ii)前記Xサイクルの直後のサイクルから累積−開始サイクルまでの信号変化量の逆数(reciprocal)を累積して収得される。
前記累積値が累積積である場合、用語“累積”は“掛ける”(multiplying)でありうる。
数学的に、ある数xの掛け算の逆元(multiplicative inverse)、 または逆元(reciprocal)は1/xと表示され、前記xと掛けて1になる数をいう。
本明細書で、用語“累積−開始サイクル”は各サイクルでの累積値を収得するための累積が始まるサイクルを意味する。累積−開始サイクルは、任意に選択できる。データセットの最初のサイクル及び最後のサイクルを含んだデータセット内のどんなサイクルも累積−開始サイクルに指定できる。
本発明の一具現例によれば、前記累積−開始サイクルは、データセットの最初のサイクルでありうる。このような場合、各サイクルでの累積値は前記最初のサイクルから前記各サイクルまでの信号変化量を累積して計算できる。
データセットのベースライン領域のサイクルが累積−開始サイクルに指定される場合(例えば、最初のサイクルが累積−開始サイクルに指定される場合)、累積−開始値は再構成されたデータセットのベースライン領域内信号値でありうる。このような場合、累積−開始値に0を割り当てるだけでベースライン差し引かれた再構成されたデータセットを容易に収得することができる。
本明細書で、用語“累積−開始値”は再構成されたデータセットの累積−開始サイクルでの信号値を意味する。前記累積−開始値は任意に定めた値でありうる。
本発明の一具現例によれば、累積−開始値は原始データセットの累積−開始サイクルでの信号値でありうる。原始データセットの累積−開始サイクルでの信号値を累積−開始値に設定する場合、各サイクルでの信号値を考慮する時、原始データセットと類似の再構成されたデータセットが収得できる。
本発明の一具現例によれば、前記累積−開始値は0または1でありうる。累積−開始サイクルがベースライン領域で決定されれば、再構成されたデータセットのベースライン差し引きは累積−開始値を0に設定することにより容易に具現することができる。
信号変化量データセットにフィッティング(fitting)される関数を積分して再構成されたデータセットの累積値を収得する場合、前記累積値は、(i)信号変化量データセットのサイクルを累積−開始サイクルを基準に2つのグループに分けるステップ(言い換えると、累積−開始サイクル以前サイクルグループまたは以後サイクルグループ)、及び(ii)各グループにfittingする関数の積分を求めるステップを通じて収得することができる。積分定数は信号変化量データセットの累積−開始サイクルでのフィッティング(fitting)関数の積分値が累積−開始値になるように決定できる。
加えて、累積−開始値は信号変化量データセットの累積−開始サイクルでの信号値でありうる。
本発明の一具現例によれば、各サイクルでの累積値は最初のサイクルから前記各サイクルまでの信号変化量を累積して計算できる。累積−開始サイクルが信号変化量データセットの最初のサイクルであり、累積−開始値は累積−開始サイクルでの信号値である場合、各サイクルの累積値は単純に最初のサイクルから前記各サイクルまでの信号変化量を累積して計算できる。
“最初のサイクルから前記各サイクルまでの信号変化量を累積する”ということは、“最初のサイクルから前記各サイクルまでの信号変化量を掛ける”ということと、“最初のサイクルから前記各サイクルまでの信号変化量を足す”ということを全て意味することができる。
信号変化量が各サイクルでの信号値の微分値、各サイクルで以前のサイクルを考慮した信号値の差(difference)、または各サイクルでの線形回帰分析を通じて収得した傾き値(slopevalue)であり、累積−開始サイクルは信号変化量データセットの最初のサイクルであり、累積−開始値は累積−開始サイクルでの信号値である場合、累積値は最初のサイクルから前記各サイクルまでの信号変化量を足して計算された累積和でありうる。例えば、10番目サイクル(言い換えると、サイクル番号10)での累積和はサイクル番号1から10までの信号変化量を全て足す方法により計算できる。択一的に、各サイクルでの累積和は信号変化量データセットをフィッティング(fitting)した関数の積分を求めて収得できる。積分定数は0または任意に定めた定数に指定できる。
積分定数が0に指定される場合、再構成されたデータセットのベースラインは0または実質的に0の値に調整できる。積分定数が原始データセットのベースライン領域の信号値に指定される場合、ベースラインが原始データセットのベースラインと同一な値を有する再構成されたデータセットが収得できる。
累積積は、最初のサイクルから各サイクルまでの信号変化量を掛けて計算できる。
信号変化量が各サイクルでの以前のサイクルを考慮した信号値の比率であり、累積−開始サイクルは信号変化量データセットの最初のサイクルであり、累積−開始値は累積−開始サイクルでの信号値である場合、累積値は最初のサイクルから前記各サイクルまでの信号変化量を掛けて計算された累積積でありうる。
本発明の一具現例によれば、特定サイクルでの信号変化量は他のサイクルでの信号変化量を計算することと異なる方法により計算されて提供できる。このような具現例は、他のサイクルで信号変化量を求めることに使われた計算方法が前記特定サイクルで信号変化量を求めることに適切でない場合に有用でありうる。
したがって、累積−開始値が信号変化量データセットの累積−開始サイクルでの信号値に指定されれば、再構成されたデータセットの累積値は信号変化量計算方法によって変わることがある。
例えば、累積−開始サイクルがデータセットの最初のサイクルであり、累積−開始値が信号変化量データセットの累積−開始サイクルでの信号値であり、信号変化量データセットの最初のサイクルでの信号変化量が0に指定される場合、再構成されたデータセットの最初のサイクルでの累積値は0であり、次のサイクルの累積値は最初のサイクルでの累積値に基づいて決定される。
更に他の例に、累積−開始サイクルがデータセットの最初のサイクルであり、累積−開始値が信号変化量データセットの累積−開始サイクルでの信号値であり、信号変化量データセットの最初のサイクルの信号変化量が原始データセットの最初のサイクルの信号値と同一な値に指定される場合、再構成されたデータセットの最初のサイクルでの累積値は原始データセットの最初のサイクルでの信号値と同一な値を有し、以後、サイクルでの累積値は前記最初のサイクルでの累積値に基づいて決定される。
本発明の一具現例によれば、原始データセットのベースライン領域の初期信号値がどんなものかに関わらず、ベースライン領域の信号値が特定値(例えば、0または原始データセットの最初のサイクルでの信号値と同一な値)を有する再構成されたデータセットを収得することができる。したがって、本発明の方法によれば、複数のデータセットが同一な基準に修正されることができ、したがって、信頼性ある分析結果を収得することができる。
本発明の一具現例によれば、本発明の方法はデータセットの平滑(smoothing)のために、前記(c)ステップで提供された再構成されたデータセットを(b)ステップのデータセットに設定して(b)−(c)ステップを反復するステップを追加で含むことができる。
本明細書で、用語“データセットの平滑”(smoothing of the data set)は、データセットのノイズを除去または最小化するために予め定まったアルゴリズムによってデータセットを加工または精製することを意味する。前記データセットの平滑を通じてデータセットの視覚的表現が向上する。データセットの平滑はセクションIVで詳細に説明する。
ステップ(d):再構成されたデータセットを用いたターゲット分析物質検出(S140)
再構成されたデータセットの分析を通じてサンプル内ターゲット分析物質が検出される。
サンプル内ターゲット分析物質の検出は、ターゲット分析物質に対する信号−発生反応により収得されたデータセットを用いてサンプル内ターゲット分析物質を定性的または定量的に検出することを意味する。前記定性的または定量的検出は、サンプル内ターゲット分析物質の存在または不存在を検出すること、サンプル内ターゲット分析物質の量を検出すること、生物学的または化学的反応によりターゲット分析物質の量または状態の変化を検出することでありうる。
本明細書で、用語“ターゲット分析物質の分析”、“ターゲット分析物質の検出”、“ターゲット分析物質の定性的または定量的分析”または“ターゲット分析物質の定性的または定量的検出”は、サンプル内ターゲット分析物質の存否、サンプル内ターゲット分析物質の量または生物学的または化学的反応によるターゲット分析物質の量または状態の変化に関する情報を収得することを意味し、これら用語は相互区別無しで使われることができる。
本発明の一具現例によれば、ステップ(d)のターゲット分析物質検出はサンプル内ターゲット分析物質の定性的または定量的検出でありうる。
本発明の更に他の様態によれば、本発明は次のステップを含むサンプル内ターゲット分析物質検出方法を提供する:
(a)ターゲット分析物質に対するデータセット提供;
(b)データセットの標準化;
(c)データセットの信号値を用いた各サイクルでの信号変化量収得を通じての信号変化量データセットの提供;
(d)信号変化量データセットのベースライニング;
(e)信号変化量データセットの補正;
(f)補正された信号変化量データセットの信号変化量を用いた各サイクルでの累積値収得を通じての再構成されたデータセット提供;及び
(g)再構成されたデータセットを用いたサンプル内ターゲット分析物質の検出。
前記(a)から(g)ステップを含むターゲット分析物質検出方法は、前述した内容を全て含むので、不必要な重複を避けるために、これらの間に共通した内容は省略されているが、前記方法の該当内容は全て含まれる。
データセットの標準化、信号変化量データセットの補正、及び再構成されたデータセットの提供ステップを含む前記ステップ(a)から(g)のターゲット分析物質検出方法によれば、
機器間信号偏差、異常信号、ノイズ、及び異常ベースラインのような信号−発生反応によるターゲット分析物質検出に関連した大部分の問題が解決できる。前記ステップで、ステップ(b)、(d)、及び(e)は複合的に適切に選択されて使われることができる。
II.信号変化量データセットの補正及び変換を含むサンプル内ターゲット分析物質検出方法
信号変化量データセットの加工及び変換によりターゲット分析物質検出に適切に処理されたデータセットが収得できる。
通常的に、信号変化量データセットは原始データセットを直接修正することに必要な情報の提供のみのために使われる。例えば、信号変化量データセットはベースライン領域の終わりの地点を識別するための情報を提供するために使われるか、または各サイクルでの信号が異常信号か否かを決定するための情報を提供するが、ベースライン領域の修正または異常信号の修正は信号変化量データセットの修正でない、オリジナルデータセットに対する直接的な加工を通じてなされている。
しかしながら、本発明によれば、オリジナルデータセットの異常信号の修正またはベースライン領域の修正は信号変化量データセットの加工を通じて遂行され、信号変化量データセット加工の効果は加工された信号変化量データセットの変換過程(transformation process)を通じてターゲット分析物質検出のために最終加工されたデータセットに反映される。
本発明によれば、各サイクルでの信号値の有効性検証及びデータセットの有効性確保のための加工が同一なデータセットでなされるので、データセットをより正確で、かつ効率よく修正し、これを用いた信頼性あるターゲット分析物質検出が可能である。
本発明の一様態によれば、本発明は以下を含むターゲット分析物質検出方法を提供する:
(a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットを直接補正して補正された信号変化量データセットを提供するステップ;
(d)前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するステップ;及び
(e)前記変換されたデータセットを用いてサンプル内ターゲット分析物質を検出するステップ。
ステップ(a)及び(b)を通じて、ターゲット分析物質に対するデータセットが収得され、これから各サイクル番号での信号変化量を計算して信号変化量データセットが収得される。前記(a)及び(b)ステップはセクションIで説明した通りである。
ステップ(c):信号変化量データセットの補正を通じての補正された信号変化量データセットの提供
ステップ(c)では、信号変化量データセットの補正を通じて補正された信号変化量データセットが提供される。
信号変化量データセットの補正の一具現例で、信号変化量データセットを用いて異常信号値を有するサイクルを検出し、前記検出されたサイクルの信号変化量を修正して、異常信号値を修正するステップを含むことができる。
本発明の一具現例によれば、異常信号の修正のための信号変化量データセットの補正は、次の方法により遂行される:
<信号変化量データセットを用いた異常信号修正方法>
−異常信号の検出
データセットの異常信号は異常なである信号変化を伴う。本発明の方法によれば、信号変化量データセットを用いて異常な信号の変化量を検出し、これを修正する方法により異常信号を補正する。
異常信号変化を示すピーク(異常ピーク)を検出する最初のステップであって、信号変化量データセットのピークを認識する。前記ピークはターニングポイントのように地域的な最大値または最小値(local maximum or minimum value)を含む地点(point)または一部の区域(local section)を意味する。前記地点または一部の区域は1つのデータ地点または2つ以上の連続的なデータ地点である。
具体的に、前記データ地点または2つ以上の連続的なデータ地点は、予め決まった基準から外れた信号値を有することができる。例えば、前記基準は特定値のしきい値でありうる。この場合、前記しきい値以上の値を有する2つ以上の連続的なデータ地点をピークに決定することができる。更に他の例に、前記基準は最大値または最小値対比予め決まった特定比率であって、この場合、予め決まった比率以上の比率値を有する2つ以上の連続的なデータ地点をピークに決定することができる。
本発明の一具現例によれば、ピークはしきい値を用いて認識することができる。具体的に、信号変化量データセットで地域的な最大値または最小値を有し、しきい値より大きい信号変化量を有する2つ以上の連続的なデータ地点のグループが1つのピークと認識できる。
異常な変化を示すピーク(異常ピーク)を検出する第2ステップであって、前記ピークが正常な信号変化量を示す正常なピークか、でなければ異常ピークかを決定する。
本発明の一具現例では、“半ピーク幅”(Half Peak Width)方法が信号変化量データセットのピークが正常なピークか、異常ピークかを決定することに用いられる。前記半ピーク幅の方法によれば、ピークの異常はピークの幅の半分を用いて決定される。
マックスサイクル番号は1ピーク内で最大信号変化量を有するデータ地点のサイクル番号をいい、スタートサイクル番号は1ピーク内でしきい値を超過する最初のデータ地点のサイクル番号をいう。ピークの幅の半分は前記マックスサイクル番号とスタートサイクル番号との差(Δcycle)である。
ノイズまたは他の異常な環境により発生した異常信号は、一般的にターゲット分析物質により発生する正常信号に比べて急激に信号値が増加または減少する信号変化パターンを示す。このような信号変化パターンを分析して前記ピークが正常ピークか異常ピークかを識別する。主として、異常ピークの幅の半分は正常ピークより小さい。本発明の一具現例によれば、ピークの幅の半分が予め決まったしきい値より小さなピークを異常ピークと決定する。
−異常信号の修正
決まった異常信号は、信号変化量データセットの補正を通じて修正できる。
本発明の一具現例によれば、ターゲット分析物質検出で起こることができる誤りを除去するために、異常信号を直接修正せず、原始データセットから収得した信号変化量データセットの信号変化量を補正して修正することができる。
異常ピーク内の信号変化量は互いに同一な値を有するように補正されることができ、またはサイクル番号の増加または減少によって一定の比率で増加または減少するように補正できる。
異常ピーク内の信号変化量が互いに同一な値を有するように補正される場合、前記異常ピークに該当するデータ地点の信号値は同一な比率で増加するように修正されて異常信号が除去される。
異常ピークの以前及び以後のサイクルの信号変化量が同一または類似の値を有する場合、前記異常ピーク内の信号変化量は前記異常ピークの以前及び以後のサイクルと同一または類似するように補正できる。具体的に、異常ピークの以前及び以後の1つ以上のサイクルの信号変化量の平均値を前記異常ピーク内の信号変化量に指定することができる。特に、このような補正は異常ピークのデータ地点がデータセットの増幅区間に該当する場合に適用できる。
本発明の一具現例によれば、異常ピーク内の信号変化量は0の値を有するように補正できる。このような補正により、異常ピークに該当するデータ地点の信号値は増加せず、直前のデータ地点の信号値と同一な値を有するようになる。特に、このような補正は異常ピークのデータ地点がデータセットの背景領域に該当する場合に適用できる。異常ピーク内の少なくとも1つの信号変化量が0の値を有するように補正されることができ、本発明の一具現例によれば、しきい値を超過する信号変化量のみを0の値を有するように補正することができる。
<背景地域のノイズ修正>
本発明の一具現例によれば、背景領域のノイズ信号を修正するために背景領域内の信号変化量を補正することができる。このステップは異常ピークを修正するためのものでなく、背景領域信号のノイズを修正するための選択的なステップであるので、これは前述した異常ピークの検出し、前記異常ピークの信号変化量を補正した後に遂行されることができ、または前記異常ピークの検出及び補正と独立的に進行できる。
本明細書で、用語“ノイズ”はターゲット分析物質の存否とは独立的に発生する所望しない(unwanted)、分析物質によらない(non−analyte related)信号を意味する。
異常ピークの補正の以後の信号変化量データセットで残っているピークは正常ピークであるので、最初の正常ピークの開始サイクルの以前のサイクルの信号変化量は0の値に補正することができる。
正常ピークの最初のサイクルの決定は多様な方法により決定できる。
本発明の一具現例によれば、正常ピークの開始サイクルを決定するためにギャップ(gap)が適用できる。ギャップは正常ピークの開始サイクルと正常ピーク内でしきい値を超過する最初のデータ地点のサイクルとの間のサイクル間隔を意味する。
正常ピークがしきい値により認識される場合、正常ピークの最初のサイクルは正常ピーク内のサイクルのうち、しきい値を超過する最初のデータ地点に該当するサイクル番号から前記ギャップを差し引いて決定できる。
適用されるしきい値及び信号−発生反応の一般的な信号パターンによって前記ギャップは適切に予め決定できる。
本発明の一具現例によれば、正常ピークが発生する直前のサイクル番号を認識するためのギャップ(gap)に5を使用して正常ピークの開始サイクルを決定することができる。
ステップ(d):補正された信号変化量データセットの変換を通じての変換されたデータセット提供
ステップ(d)で、前記補正された信号変化量データセットを変換して、変換されたデータセットが提供される。前記変換されたデータセットはサンプル内ターゲット分析物質の検出に用いられる。
補正された信号変化量データセットの変換は、サンプル内ターゲット分析物質の検出により適切なデータセットを提供するために遂行される。
本発明の一具現例によれば、補正された信号変化量データセットはサイクル及び対応する累積値を有するデータ地点を含む再構成されたデータセットに変換され、前記再構成されたデータセットを用いてターゲット分析物質が検出できる。再構成されたデータセット内の各サイクルに該当する累積値は原始データセットと同一な単位(例えば、RFU)を使用する信号値である。したがって、原始データセットからターゲット分析物質の検出時、使われる伝統的な基準がターゲット分析物質検出のための再構成されたデータセットにも適用できる。
本発明の一具現例によれば、変換されたデータセットはN次信号変化量データセットでありうる。前記N次信号変化量データセットは、補正された信号変化量データセットの信号変化量の変化を示すN次信号変化量を含むデータセットであり、前記Nは2以上の整数である。より高い次数の信号変化量データセットは、信号変化量データセットに比べてどんなサイクルで信号の変化(例えば、信号の増加または減少)が始まるかをより正確に特定することができる。
ステップ(e):変換されたデータセットを用いたサンプル内ターゲット分析物質の検出
ステップ(e)では、変換されたデータセットを用いてサンプル内ターゲット分析物質を検出する。
サンプル内ターゲット分析物質の検出は、ターゲット分析物質に対する信号−発生反応により収得されるデータセットを用いてサンプル内ターゲット分析物質を定性的または定量的に検出することを意味する。前記定性的または定量的検出は、サンプル内ターゲット分析物質の存在または不存在を検出すること、サンプル内ターゲット分析物質の量を検出すること、生物学的または化学的反応によりターゲット分析物質の量または状態の変化を検出することを含む。
本明細書で、用語“ターゲット分析物質の分析”、“ターゲット分析物質の検出”、“ターゲット分析物質の定性的または定量的分析”、または“ターゲット分析物質の定性的または定量的検出”は、サンプル内ターゲット分析物質の存否、サンプル内ターゲット分析物質の量または生物学的または化学的反応によるターゲット分析物質の量または状態の変化に関する情報を収得することを意味し、これら用語は相互区別無しで使われることができる。
本発明の一具現例によれば、ステップ(e)のターゲット分析物質検出はサンプル内ターゲット分析物質の定性的または定量的検出でありうる。
本発明において、検出方法は収得した変換されたデータセットの種類(type)によって適切に選択できる。
例えば、変換されたデータセットが信号変化量データセットの信号変化量を用いた各サイクルでの累積値を収得して提供された再構成されたデータセットである場合、ターゲット分析物質を検出する基準サイクル番号(言い換えると、Ct:threshold cycle)は予め決まったしきい値により決定できる。
更に他の例に、前記変換されたデータセットが信号変化量データセットの信号変化量を用いて各サイクルでの信号変化量の変化値を収得して提供される2次信号変化量データセットである場合、前記2次信号変化量データセットの最初のピークの最高値に該当するサイクル番号がthreshold cycle(Ct)に指定できる。
III.データセットの再構成方法
本発明の更に他の様態によれば、本発明は次のステップを含むデータセット再構成方法を提供する:
(a)データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(b)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
セクションIIIの方法の全てのステップはセクションIのものと重複するので、不必要な重複を避けるために、これらの間に共通した内容は省略する。
本発明の一具現例によれば、各サイクルでの信号変化量は各サイクルでの信号値の微分値;各サイクルでの信号値の差分値;各サイクルでの信号値の比率;及び各サイクルでの線形回帰分析を遂行して収得した傾き値からなる群から選択されたものでありうる。
本発明の一具現例によれば、各サイクルでの累積値は各サイクルでの微分値の累積値;各サイクルでの差分値の累積値;各サイクルでの比率の累積値;及び傾き値の累積値からなる群から選択されたものでありうる。
本発明の一具現例によれば、本発明の方法は信号変化量データセットのベースライニングステップを含むことができる。信号変化量データセットのベースライニングに関してはセクションIに記載されている。
データセットはデータセットを信号変化量データセットに転換し、前記信号変化量データセットを再構成されたデータセットに再転換するステップを含むデータセットの再構成方法により補正できる。このようなデータセットの再構成を通じて、データセットはターゲット分析物質の検出に適合するように加工される。
IV.データセット平滑方法
本発明の一様態によれば、本発明は次のステップを含むデータセット平滑方法を提供する:
(a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
本発明の一具現例によれば、前記データセットの平滑方法は前記ステップ(c)で提供された前記再構成されたデータセットを前記(b)ステップのデータセットに使用して、(b)−(c)を反復するステップを追加的に含む。
本明細書で、用語“データセットの平滑”(smoothing of the data set)はデータセットのノイズを除去または最小化するために予め定まったアルゴリズムによってデータセットを加工または精製することを意味する。前記データセットの平滑を通じてデータセットの視覚的表現が向上する。
データ分析において、データセットの平滑はデータセットの主なパターンを追従する概略的なデータセットを作るものである。データセットの平滑はノイズ、他の微細な構造または急激な現象を除去する。平滑過程を通じて、データ地点の信号は加工され、これを通じて個別的なデータ地点の特徴は減少し、近接したデータ地点の間の信号差が減少する。これは、データセットの信号の巨視的変化に対する情報を容易に認識できるようにする。
セクションIVに記載されたステップ(a)から(c)に関する説明は、セクションIのものと重複するので、不必要な重複を避けるためにこれらの間に共通した内容は省略する。
本発明の一具現例によれば、信号変化量は各サイクルでの線形回帰分析を遂行して収得した傾き値でありうる。
線形回帰分析に関しては、セクションIに記載されている。
線形回帰分析により信号変化量を収得する場合、サイクルでの信号変化量は前記信号変化量が計算されるサイクルの前、後の幾サイクルの信号値を用いて収得されるので、信号変化量が計算されるサイクルに近接したサイクルの信号値の間の差が減少する。
本方法により信号変化量データセットから収得した再構成されたデータセットは以前のデータセット(例えば、信号変化量データセットを収得するための加工される前のデータセット)より隣接したサイクルの間の信号値の偏差をより緩和させて、再構成されたデータセットはより軟らかいカーブを示すようになる。
線形回帰分析の方法に、これに制限されるものではないが、最小二乗法が用いられることがある。
以下の記載は最小二乗法を説明したものであるが、請求項の本発明の範囲は最小二乗法に制限されるものではない。
本発明の一具現例によれば、前記最小二乗法は次の<数式2>で表現される:
<数式2>
ここで、
である。
Iは傾きが計算されるデータ地点のサイクル番号であり、mはI番目サイクルデータ地点の傾きであり、Xiはi番目サイクルのサイクル番号であり、yiはi番目サイクルで測定される信号値である。
“n”または“a+b+1”はI番目サイクルでの傾き計算に使われるデータ地点の数を意味し、LSMR(Linear Squares Method Range)と称する。“a”はI番目サイクルでの傾き計算に使われるデータ地点グループのうち、最小サイクル番号を求めるための値である。“b”は最大サイクル番号を求めるための値である。
“a”及び“b”は各々独立的に0乃至10の整数であり、具体的に、1乃至5、より具体的に1乃至3でありうる。
前記“a”及び“b”は同一な値を有することが好ましいが、測定対象物質、測定環境、または傾きが測定されるサイクルによって相異することができる。
例えば、“a”及び“b”の値が(1、1)、(2、2)、(3、3)、及び(4、4)のグループから選択できる。前記順序対のうち、最初の値は“a”の値であり、2番目の値は“b”の値である。
信号値の変化(増加または減少)がターゲット分析物質の存在または量に依存的に増加する場合、平滑プロセスによって変化開始サイクル地点が移動(shift)することを防止するために、値“a”が値“b”より大きく設定できる。例えば、“a”及び“b”の値は(2、1)、(3、1)、(4、1)、(5、1)、(3、2)、(4、2)、(5、2)、(4、3)、(5、3)、及び(5、4)のグループから選択できる。
反対に、信号値の変化(増加または減少)がターゲット分析物質の存在または量に依存的に減少する場合、平滑プロセスにより変化開始サイクル地点が移動(shift)することを防止するために、値“b”が値“a”より大きく設定できる。例えば、“a”及び“b”の値は(1、2)、(1、3)、(1、4)、(1、5)、(2、3)、(2、4)、(2、5)、(3、4)、(3、5)、及び(4、5)のグループから選択できる。
本発明の一具現例によれば、線形回帰分析を通じて傾き値を得るために使われるデータ地点の数は3乃至10でありうる。
本発明の一具現例によれば、前記方法は前記ステップ(c)で提供された前記再構成されたデータセットを前記(b)ステップのデータセットに使用して、(b)−(c)を反復するステップを追加的に含むことができる。
(b)−(c)ステップの反復は、以前に収得した再構成されたデータセットから信号変化量データセットを提供し、前記信号変化量データセットからまた再構成されたデータセットを収得することによって遂行できる。信号変化量データセットの提供及びその変換を反復することをデータ変換反復法(Iteration Method for Data Conversion;IMDC)と称する。
データセットの平滑のために(b)−(c)ステップを反復する回数は特別に制限されず、例えば1、2、3、4、5、6、7、8、9、または10回でありうる。一具現例に、前記反復回数は1乃至10回、2乃至5回、2乃至4回、2乃至3回でありうる。前記反復の回数が増加するほどデータセットの平滑程度が増加するようになる。しかしながら、過度に反復される場合、ターゲット分析物質の存在を示す信号パターンとターゲット分析物質の不存在を示す信号パターンを区分し難くなることがある。
V.記録媒体、装置及びプログラム
本発明の他の様態によれば、本発明はサンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含み;及び
(d)前記再構成されたデータセットを用いてサンプル内ターゲット分析物質を検出するステップ。
本発明の他の一様態によれば、本発明はサンプル内ターゲット分析物質を検出するための方法を実行するためのプロセッサを具現する、コンピュータにより読取可能な記録媒体に格納されるコンピュータプログラムを提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含み;及び
(d)前記再構成されたデータセットを用いてサンプル内ターゲット分析物質の存在または不存在を決定するステップ。
プログラム指示はプロセッサにより実行される時、プロセッサが前述した本発明の方法を実行するようにする。サンプル内ターゲット分析物質を検出するための方法を実行するプログラム指示は次の指示を含むことができる:ターゲット分析物質に対するデータセットを受信するようにする指示;データセットの信号値を用いて各サイクルで信号変化量を収得して信号変化量データセットを提供するようにする指示;信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するようにする指示;及び前記再構成されたデータセットを用いてサンプル内ターゲット分析物質の存否を決定するようにする指示。
本発明の他の一様態によれば、本発明はサンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットを直接補正して補正された信号変化量データセットを提供するステップ;
(d)前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するステップ;及び
(e)前記変換されたデータセットを用いてサンプル内ターゲット分析物質の存在または不存在を決定するステップ。
本発明の他の一様態によれば、本発明はサンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する、コンピュータにより読取可能な記録媒体に格納されるコンピュータプログラムを提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
(c)前記信号変化量データセットを直接補正して、補正された信号変化量データセットを提供するステップ;
(d)前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するステップ;及び
(e)前記変換されたデータセットを用いてサンプル内ターゲット分析物質の存在または不存在を決定するステップ。
プログラム指示はプロセッサにより実行される時、プロセッサが前述した本発明の方法を実行するようにする。サンプル内ターゲット分析物質を検出するための方法を実行するプログラム指示は次の指示を含むことができる:ターゲット分析物質に対するデータセットを受信するようにする指示;前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するようにする指示;前記信号変化量データセットを直接補正して、補正された信号変化量データセットを提供するようにする指示;前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するようにする指示;及び前記変換されたデータセットを用いてサンプル内ターゲット分析物質の存否を決定するようにする指示。
本発明の他の一様態によれば、本発明はデータセット再構成方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
本発明の他の一様態によれば、本発明はデータセット再構成方法を実行するためのプロセッサを具現する、コンピュータにより読取可能な記録媒体に格納されるコンピュータプログラムを提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
プログラム指示はプロセッサにより実行される時、プロセッサが前述した本発明の方法を実行するようにする。データセット再構成方法を実行するプログラム指示は次の指示を含むことができる:データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するようにする指示;前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するようにする指示。
本発明の他の一様態によれば、本発明はデータセット平滑方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体を提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
本発明の他の一様態によれば、本発明はデータセット平滑方法を実行するためのプロセッサを具現する、コンピュータにより読取可能な記録媒体に格納されるコンピュータプログラムを提供し、前記方法は次のステップを含む:
(a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
(b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
(c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
プログラム指示はプロセッサにより実行される時、プロセッサが前述した本発明の方法を実行するようにする。データセット平滑方法を実行するプログラム指示は次の指示を含むことができる:ターゲット分析物質に対するデータセットを受信するようにする指示;前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するようにする指示;前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するようにする指示。
本発明の方法はプロセッサで実行され、前記プロセッサは独立実行型コンピュータ(stand−alone computer)、ネットワーク付着コンピュータ、またはリアルタイムPCR装置のようなデータ収集装置にあるプロセッサでありうる。
コンピュータにより読取可能な記録媒体は当業界に公知された多様な格納媒体、例えば、CD−R、CD−ROM、DVD、フラッシュメモリ、フロッピーディスク、ハードドライブ、ポータブルHDD、USB、マグネチックテープ、MINIDISC、不揮発性メモリカード、EEPROM、光学ディスク、光学格納媒体、RAM、ROM、システムメモリ、及びウェブサーバーを含むが、これに限定されるものではない。
データセットは多様な方式により収集できる。例えば、データセットはPCRデータ収集装置にあるプロセッサにより収集できる。データセットはリアルタイムにプロセッサに提供されることができ、またはメモリユニットまたはバッファに格納され、実験完了後、プロセッサに提供できる。類似するには、データセットは、前記収集装置とのネットワーク連結(例えば、LAN、VPN、インターネット、及びイントラネット)または直接接続(例えば、USBまたは他の直接有線接続または無線接続)によりデスクトップコンピュータシステムのような別途のシステムに提供されることができ、またはCD、DVD、フロッピーディスク、及びポータブルHDDのようなポータブル媒体上に提供できる。類似するように、データセットは、ノートブックまたはデスクトップコンピュータシステムのようなクライアントにネットワーク接続(例えば、LAN、VPN、インターネット、イントラネット、及び無線通信ネットワーク)を介してサーバーシステムに提供できる。
本発明を実行するプロセッサを具現する指示は、ロジックシステムに含まれることができる。前記指示は、たとえソフトウェア記録媒体(例えば、ポータブルHDD、USB、フロッピーディスク、CD、及びDVD)に提供できるが、ダウンロードされてメモリモジュール(例えば、ハードドライブまたはローカルまたは付属のRAMまたはROMのような他のメモリ)に格納できる。本発明を実行するコンピュータコードは、C、C++、Java(登録商標)、Visual Basic、VBScript、JavaScript(登録商標)、Perl、及びXMLのような多様なコーディング言語で実行できる。また、多様な言語及びプロトコルは本発明に従うデータセットと命令の外部及び内部格納と伝達に利用できる。
本発明の他の様態によれば、本発明は(a)コンピュータプロセッサ、及び(b)前記コンピュータプロセッサにカップリングされた前記本発明のコンピュータにより読取可能な記録媒体を含む、サンプル内ターゲット分析物質を検出するための装置を提供する。
本発明の他の様態によれば、本発明は(a)コンピュータプロセッサ、及び(b)前記コンピュータプロセッサにカップリングされた前記本発明のコンピュータにより読取可能な記録媒体を含む、データセットを再構成するための装置を提供する。
本発明の他の様態によれば、本発明は(a)コンピュータプロセッサ、及び(b)前記コンピュータプロセッサにカップリングされた前記本発明のコンピュータにより読取可能な記録媒体を含む、データセットを平滑(smoothing)するための装置を提供する。
本発明の一具現例によれば、本発明の装置はサンプル及び信号−発生手段を収容することができる反応容器、前記反応容器の温度を調節する温度調節手段及び/又は増幅サイクルでの信号を検出する検出器を追加的に含むことができる。
本発明の一具現例によれば、コンピュータシステムはサイクルの信号値を受信するだけでなく、データセットをプロセシングし、再構成されたデータセットを提供し、サンプル内ターゲット分析物質の存否を決定する。
コンピュータプロセッサは1つのプロセッサが前述したパフォーマンスを全て行うよう構築できる。択一的に、プロセッサユニットは多数個のプロセッサが各々のパフォーマンスを実行するように構築することができる。
本発明の一具現例によれば、プロセッサはターゲット分析物質(例えば、標的核酸分子)の検出に用いられる従来の装置(例えば、リアルタイムPCR装置)にソフトウェアをインストールして具現させることができる。
本発明の特徴及び利点を要約すると、次の通りである。
(A)ターゲット分析物質の検出のためのデータセットを信号変化量データセットに変換後、信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成する。これで、ベースライン領域の設定など、既存の複雑なステップ無しでデータセットのベースライニングや平滑(smoothing)のようなターゲット分析物質の検出に必要なデータセットの補正の効果を得ることができる。
(B)既存のターゲット分析物質の検出方法において、信号変化量データセットはオリジナルデータセットの直接的な修正に必要な情報を提供することに限定して使用されたものであり、データセットに対する修正は前記収得した情報に基づいて前記オリジナルデータセットに直接遂行されたものである。
本発明によれば、信号変化量データセットの分析により認識された必要な修正は信号変化量データセットに直接適用され、前記信号データセットの変換を通じて前記必要な修正はターゲット検出に使われるデータセットに適用される。
このような方法により、データセットの信号値に対する直接的な補正無しで誤り修正及びベースライニングのようなターゲット分析物質の検出のためのデータセット加工が可能である。信号変化量データセット及び再構成されたデータセットの提供ステップを含む本発明のターゲット分析物質検出方法は、データセットに含まれた誤り信号を効果的に検出し、除去することができる。
(c)ジャンプエラー(jump error)のような誤りは、特定地点での誤りが以後のサイクルにも誤りを発生させる。信号変化量データセットを通じて異常信号を修正する本発明の方法によれば、全てのサイクルの全ての信号値を補正せず、誤りが発生したサイクルの信号変化値を修正することにより、jump errorのような誤りを修正することができる。
(d)信号変化量データセットの変換を含む本発明のターゲット分析物質検出方法は、信号変化量データセットを用いて再構成されたデータセットまたは信号変化量データセットの変化水準を示すデータセットのような多様なデータを用いてターゲット分析物質を分析する方法を提供する。
(e)本発明の平滑(smoothing)方法は、データセットの修正とベースライニングを同時に行うことができる。また、データ変換回数の調節を通じて平滑程度を調節することができる。
以下、実施例を通じて本発明をより詳細に説明する。これら実施例は本発明をより具体的に説明するためのものであって、本発明の要旨に従って本発明の範囲がこれら実施例により制限されないということは、本発明が属する技術分野で通常の知識を有する者に当たって自明である。
実施例1:信号変化量の累積値を用いたターゲット分析物質の検出
本実施例ではターゲット核酸に対するリアルタイムPCRから収得したデータセットの信号変化量の累積値を収得してデータセットを再構成するステップを含む本発明の方法を通じてターゲット分析物質が効果的に検出されるかを試験した。
ターゲット分析物質(例えば、ターゲット核酸分子)の検出を遂行するために、(i)ターゲット分析物質に対するデータセット提供、(ii)信号変化量収得を通じての信号変化量データセット提供、(iii)信号変化量の累積値を収得して再構成されたデータセット提供、及び(iv)前記再構成されたデータセットを用いたターゲット分析物質検出のステップを含む過程が使われた。
本発明の有効性を評価するために、ターゲット核酸分子に対するリアルタイムPCRを通じて収得したデータセットを加工して再構成されたデータセットを収得し、前記収得した再構成されたデータセットに予め決まったターゲット検出用しきい値を適用してターゲット核酸分子の存否を決定した。
<1−1>データセットの収得
ターゲット核酸分子に対するリアルタイムPCRは、Bio−Rad社のCFX96TM Real−Time PCR Detection Systemを用いて、プローブを信号−発生手段に使用して増幅サイクル50回で遂行された。
リアルタイムPCRから収得したデータセットのうち、本方法を適用する3個のデータセットを選択した。図3はデータセット1、2、及び3と命名された前記選択された3個のデータセットをプロッティングした増幅曲線である。
<1−2>変化値データセット収得
前記収得した原始データセットから信号変化量データセットを収得した。信号変化量は次の<数式3>に従う差分法(difference method)により算出された。
<数式3>
Δy=y−yi−1 (if i=1、Δy=0)
i:データセットのサイクル番号
:i番目サイクルの信号値
Δy:i番目サイクルでの信号変化量
<1−3>信号変化量データセットのベースライニング(選択的過程)
<1−3>は、図3のデータセット2またはデータセット3のようにデータセットのベースラインが傾いている場合、このような誤りを信号変化量データセットの補正を通じて解決するステップである。反対に、データセット1のようにベースラインが傾いていない場合、<1−3>を遂行する必要がない。
信号変化量データセットのベースラインが0の値を有するように信号変化量データセットの各サイクルの信号変化量で特性値を差し引いた。具体的に、信号変化量データセットで信号が実質的に検出されない反応初期特定サイクル番号または特定サイクル区間を予め指定した後、前記指定したサイクル番号または区間の平均変化量を算出し、前記算出された平均変化量を各サイクルの信号変化量から差し引いた。
本実施例で、信号変化量データセットのベースライニングのための平均信号変化量は、開始サイクル(S)を3、終わりサイクル(E)を10にベースライン区間を指定して<数式4>により計算したものであり、<数式5>により前記区間の平均変化量が0になるように信号変化量データセットの全体サイクルの信号変化量を修正した。そして、結果の確認のために、ベースライニングされた信号変化量データセットをプロッティング(X軸:サイクル番号、Y軸:ΔRFU)してベースライニングされた信号変化値曲線を収得した。
<数式4>
i:データセットのサイクル番号
Δy:i番目サイクルでの信号変化量
Δyバー:ベースライン区間の平均信号変化量
S:信号変化量データセットのベースライン区間の開始サイクル番号
E:信号変化量データセットのベースライン区間の最後のサイクル番号
n:E−S+1
<数式5>
i:データセットのサイクル番号
Δy:i番目サイクルでの信号変化量
Δyバー:ベースライン区間の平均信号変化量
fit.Δy:ベースライニングされた信号変化量データセットのi番目サイクルでの信号変化量。
<1−4>信号変化量の累積値の収得を通じて再構成されたデータセットの収得
累積和を収得して再構成されたデータセットを収得した。各サイクルでの累積和は信号変化量データセットの最初のサイクルから該当サイクルまでの信号変化量を累積して収得した。本実施例では、前記累積和は次の<数式6>により算出された。前記再構成されたデータセットをプロッティングして再構成された増幅曲線を収得した(X軸:サイクル番号、Y軸:RFU)。
<数式6>
CSV:再構成されたデータセットの累積−開始サイクルの信号強さ
CSC:データセットの累積−開始サイクル番号
i:データセットのサイクル番号
I:累積値が計算されるサイクル番号
Δy:信号変化量データセットのi番目サイクルでの信号変化量
cum.y:再構成されたデータセットのi番目サイクルでの信号強さ
信号変化量データセットをベースライニングした時、<数式5>のfit.Δyは<数式6>のΔyとなる。
本実施例では、CSCは1に指定し、CSVは0に指定した。
前記過程を通じて収得した再構成されたデータセットをプロッティングして収得した曲線を相互比較した。
図4のデータセット1に示すように、ターゲット分析物質に対するデータセットをステップ<1−1>、<1−2>、及び<1−4>により加工した結果、データセットのベースライン領域の信号値が0に収束するようにデータセットが再構成されることを確認した。このような結果は、本発明の方法によりベースライン領域の設定のステップ無しでベースライン領域の信号値を0または所望の値に収束するようにすることができることを確認した。
図5Aのデータセット2に示すように、ターゲット分析物質に対するデータセットをベースライニングステップ無しで、ステップ<1−1>、<1−2>、及び<1−4>により加工した結果、最初の信号値は0に収束するが、傾いたベースラインの問題は修正されないことを確認した。このような場合、ステップ<1−3>をステップ<1−2>と<1−4>との間に追加すれば、傾いたベースラインが修正できることを確認した。しかも、図5Bに示すように、データセット3の傾いたベースラインもステップ<1−3>の追加適用により修正されることを確認することができる。
このように、ベースライニングステップである追加的なステップ<1−3>を遂行してデータセットの傾いたベースラインが修正できることを確認した。
<1−5>ターゲット分析物質の検出
前記収得した再構成されたデータセットを用いてターゲット分析物質を検出した。予め定まったしきい値以上の蛍光値を見せるサンプルに対して陽性と判定し、しきい値未満の蛍光値を見せるサンプルを陰性と判定した。前記予め定まったしきい値はRFU 1000に指定した。図4、5A、及び図5BのCUSUM結果に示すように、本発明により検出誤り無しでターゲット分析物質が成功的に検出されることを確認した。
実施例2:信号変化量の累積値収得のための多様な計算法比較
本実施例では、信号変化量の累積値を算出する多様な方法を用いて再構成されたデータセットを収得し、これを相互比較した。
再構成されたデータセットは、(i)ターゲット分析物質に対するデータセット収得;(ii)信号変化量収得を通じての信号変化量データセット収得;(iii)信号変化量の累積値収得を通じての再構成されたデータセット提供のステップを含む方法により提供された。
<2−1>データセットの収得
実施例1に記載したように、各サイクルに対する蛍光値(RFU)を含むデータセット1をリアルタイムPCRから収得した。
<2−2>信号変化量データセットの収得
前記収得した原始データセットから信号変化量データセットを収得した。
信号変化量は、前記<数式3>に従う差分法、以下の<数式7>に従う最小二乗法(Least Square Method)、以下の<数式8>に従う比率法(Ratio Method)、または以下の微分方程式による微分法(Differentiation)を用いて算出した。
<数式7>
I:データセットの信号変化量が計算されるサイクル番号
:i番目サイクル番号
:i番目サイクルで測定になる信号強さ
Δy:i番目サイクルでの信号変化量
“a”and“b”:0乃至10の整数
n:a+b+1、信号変化量算出に使われるデータの数
xバー::“I−a”から“I+b”までのサイクル番号の平均
yバー:“I−a”から“I+b”までのサイクルで測定される信号強さの平均
本実施例では、“a”と“b”に1が使われた。“I−a”が1より小さな場合、前記aは“I−a”が1になるように調整できる。“I+b”が全体データ地点の数より大きい場合、前記bは“I+b”が全体データ地点の数と同一になるように調整できる。
<数式8>
i:データセットのサイクル番号
:i番目サイクルで測定される信号強さ
Δy:i番目サイクルでの信号変化量
微分方程式
i:データセットのサイクル番号
:i番目サイクル番号
Δy:i番目サイクルでの信号変化量
前記微分方程式は、原始データセットから計算された6次多項式を微分して収得したものである。
<2−3>信号変化量の累積値収得による再構成されたデータセット収得
再構成されたデータセットは、信号変化量の累積和、累積積、または積分のような信号変化量の累積値を収得して提供される。具体的に、累積値は前記<数式6>に従う累積和、以下の<数式9>に従う累積積、及び以下の積分方程式に従う積分を通じて算出した。
<数式9>
CSV:再構成されたデータセットの累積−開始サイクルの信号強さ
CSC:データセットの累積−開始サイクル番号
I:累積値が計算されるサイクル番号
i:データセットのサイクル番号
Δy:信号変化量データセットのi番目サイクルでの信号変化量
cum.y:再構成されたデータセットのi番目サイクルでの信号強さ
積分方程式
i:データセットのサイクル番号
:i番目サイクル番号
cum.y:再構成されたデータセットのi番目サイクルの信号強さ
前記積分方程式は、信号変化量データセットから計算された6次多項式を積分して収得したものである。
前記ステップを通じて収得した再構成されたデータセットをプロッティングして得たカーブを相互比較した。
<2−4>多様な累積−開始サイクル及び累積−開始値を用いて収得した再構成されたデータセットの比較
信号変化量データセットから多様な累積−開始サイクル(CSC)及び累積−開始値(CSV)を用いて再構成されたデータセットを収得し、これらを相互比較した。
信号変化量データセットは,前記<数式3>に従う差分法を用いて収得し、前記<数式6>に従う累積和を用いて再構成されたデータセットを収得した。CSCは1、34、及び50に各々指定し、CSVは−2000、0、2000に各々指定した。
各データセットの差し引かれたデータセットは、サイクル番号1の信号値が0に収束するように再構成されたデータセットの各サイクルの信号値から特定値を差し引いて収得した。
図6Aに示すように、各再構成されたデータセットは互いに異なる累積−開始サイクル(CSC)を用いて再構成されたデータセットを収得する場合、これらは同一サイクルで互いに異なる信号値を有するが、再構成されたデータセットは同一な累積−開始値を使用したので、累積−開始サイクルでの信号値は同一である。しかしながら、各差し引かれたデータセットは累積−開始サイクルの差に関わらず、同一サイクルで同一な信号値を有する。
図6Bに示すように、各再構成されたデータセットは互いに異なる累積−開始値を用いて再構成されたデータセットを収得する場合、同一サイクルで互いに異なる信号値を有するが、これらは累積−開始値という同一種類の信号値である。しかしながら、各差し引かれたデータセットは累積−開始値の差に関わらず、同一サイクルで同一な信号値を有する。
結論的に、相異する累積−開始サイクルまたは累積−開始値を使用して算出された再構成されたデータセットの累積値の信号強さ(言い換えると、Y軸の値)が互いに相異しても、各再構成されたデータセットは同一な信号パターンを有するようになる。
<2−5>多様な信号変化量及び累積値の算出方法の比較
信号変化量及び累積値を計算する多様な方法を用いて再構成されたデータセットを収得し、前記収得した再構成されたデータセットを比較した。
信号変化量は、前記<数式7>に従う最小二乗法(Least Square Method)、前記<数式8>に従う比率法(Ratio Method)または前記微分方程式による微分法(Differentiation)を用いて算出した。
累積値は、前記<数式6>に従う累積和、前記<数式9>に従う累積積、及び前記積分方程式に従う積分法を通じて算出した。
再構成されたデータセットが累積和を用いて収得された場合、CSCには1の値を指定し、CSVには0を指定した。また、再構成されたデータセットが累積積を用いて収得された場合、CSCには1の値を指定し、CSVには1.00の値を指定した。
図7に示すように、信号変化量データセットは原始データセットから信号変化量を算出する多様な方法により収得できる。また、再構成されたデータセットは信号変化量データセットから累積値を計算する多様な方法により収得できる。
結論的に、信号変化量及び累積値算出に多様な知られた計算方法が使用できることを確認した。
実施例3:信号変化量補正による検出誤り修正
実施例3では、データセットの異常信号により発生するターゲット分析物質の存否決定上の誤りを信号変化量の補正を用いた本発明の方法により除去できるかを実験した。
本実施例では、信号変化量補正及びデータセットの再構成を次のステップを含むプロセスにより遂行した。
(i)ターゲット分析物質に対するデータセット提供;(ii)信号変化量収得による信号変化量データセット提供;(iii)収得した信号変化量データセットの異常信号修正;(iv)信号変化量の累積値収得を通じての再構成されたデータセット提供;及び(v)再構成されたデータセットを用いたターゲット分析物質検出。
<3−1>異常信号を含むデータセット収得
ターゲット核酸分子に対するリアルタイムPCRはBio−Rad社のCFX96TM Real−Time PCR Detection Systemを用いて、プローブを信号−発生手段に使用して増幅サイクル50回で遂行された。リアルタイムPCRにより収得したデータセットのうち、本方法を適用するためにジャンプエラーが存在する3個のデータセットを選択した。図9は、前記選択された3個のデータセットをプロッティングした結果である。
<3−2>信号変化量データセット収得
前記収得した原始データセットから信号変化量データセットを収得した。信号変化量は前記<数式7>及び実施例<2−2>により最小二乗法(Least Square Method)を使用して計算した。
<3−3>信号変化量データセットの異常信号修正
信号変化量データセットの異常信号の修正は、(a)異常信号の検出及び(b)異常信号の補正のステップによりなされる。
a.異常信号検出
信号変化量ピークの存在有無を判断するための“信号変化量しきい値”(threshold for signal change amount)に、本実施例では変化値200を使用した。信号変化量データセットで信号変化量が200以上のサイクルがある場合、信号変化量ピークが存在すると判断した。信号変化量ピークの存在を決定した後、前記ピークが正常ピークか異常ピークかを区分するために“半ピーク幅”(Half Peak Width)方法を使用した。半ピーク幅の計算は、次の<数式10>により進行した。
<数式10>
Half Peak Width(=Δcycle)=Max cycle−Start cycle
Max cycle:ピークのうち、最高信号変化量を示すデータ地点のサイクル番号。
Start cycle:ピーク内でMax cycleの以前に信号変化量しきい値(threshold for signal change amount)以上の信号変化量を示す最初のデータ地点のサイクル番号。
半ピーク幅を計算した後、予め設定されたピークしきい値(threshold for peak)を使用して正常ピークと異常ピークを区分した。本実施例では、前記ピークしきい値に2を指定した。前記算出された半ピーク幅がピークしきい値以下である場合、前記ピークは異常ピークに決定され、半ピーク幅がピークしきい値を超過する場合、前記ピークは正常なピークに決まった。
b.異常信号修正
異常ピークを識別した後、異常信号を示すピークを修正した。図10の2番目カーブに示すように、信号変化量しきい値以上の信号変化量を示す部分を0に修正し、これで、補正された信号変化量データセットを収得した。
c.ノイズ修正(選択的ステップ)
本過程は、異常ピークを修正した後、背景信号のノイズを修正するために選択的に使われる過程である。図8の3番目カーブに示すように、異常ピークを除去した後、正常ピークが存在する場合、0サイクルから前記正常ピークの開始サイクル直前のサイクルまでの信号変化量を0に作った。また、正常ピークがない場合には、全てのサイクルの全ての信号ピークをノイズと認識し、信号変化量を0に修正した。正常ピークの開始サイクル直前のサイクルの番号はカーブと信号変化量しきい値が交差する地点を示すサイクル番号から予め定まったサイクル数(“Gap”)を差し引く方法により決定した。
<3−4>信号変化量累積を通じての再構成されたデータセット収得及びターゲット分析物質検出
補正された信号変化量データセットから信号変化量を累積して再構成されたデータセットを収得し、前記再構成されたデータセットを用いてターゲット核酸を検出した。再構成されたデータセットの収得及びターゲット核酸の検出は実施例1に記載されたものと同一な方法により遂行した。本実施例では、ターゲット検出用しきい値にRFU500を指定した。
信号変化量データセットの信号変化量の補正(言い換えると、異常信号の修正)及び累積を通じて収得した再構成されたデータセットは、図11Aにプロッティングされている。比較のために、補正無しで信号変化量データセットの信号変化量の累積を通じて収得した再構成されたデータセットを図11Aに点線で示した。
図11Aに示すように、異常信号(例えば、jump error)が信号変化量の補正により修正されることを確認した。また、正常信号と異常信号が同時に存在する場合にも正常信号に影響を及ぼさないで、異常信号のみ補正されることを確認した。データセット1及び3を通じてターゲット核酸分子が誤り無しで検出されることを確認し、ターゲット核酸分子を含まないデータセット2では誤り無しでターゲット核酸分子が未検出されることを確認した。
ノイズ修正プロセスの効果を確認するために、ノイズ修正が加えられた補正された信号変化量データセットと、ノイズ修正が加えられない信号変化量データセットを各々プロッティングした。補正された信号変化量データセット1と、補正されない信号変化量データセット1のノイズ信号を含むサイクルの一部の領域を図示した図11Bに示すように、補正されたデータセット1ではノイズ信号が除去され、信号水準は変動無しで一定なことを確認した。
このように、本発明の方法は増幅曲線の異常信号を修正することができ、これで、効果的に異常信号によるターゲット核酸存否に対する決定誤りを減少させることができることを確認した。しかも、本発明の方法はターゲット分析物質をより正確に定量することができる加工されたデータセットを提供する。
実施例4:変換されたデータセットを用いたターゲット分析物質の検出
実施例4では、ターゲット分析物質に対する信号変化量データセットの補正及び補正された信号変化量データセットの変換を通じてターゲット分析物質の検出が可能であるかを実験した。
本実施例では、ターゲット分析物質検出方法を次のステップを含むプロセスに従って遂行した。
(i)ターゲット分析物質に対するデータセット提供;(ii)信号変化量収得による信号変化量データセット提供及び収得した信号変化量データセットの補正;(iii)補正された信号変化量データセットの変換;(iv)変換されたデータセットを用いたターゲット分析物質検出。
<4−1>データセット収得
ターゲット核酸分子に対するリアルタイムPCRは、Bio−Rad社のCFX96TM Real−Time PCR Detection Systemを用いて、プローブを信号−発生手段に使用して増幅サイクル50回で遂行された。リアルタイムPCRにより収得したデータセットのうち、本方法を適用するために3個のデータセットを選択した。図13は、前記選択された3個のデータセットをプロッティングした結果である。
<4−2>信号変化量データセットの収得及び補正
前記3個の原始データセットから1次変化量計算を通じて信号変化量データセットを収得し、信号変化量データセットの1次信号変化量を補正して異常信号を除去した。
信号変化量データセットの収得及び補正は、実施例<3−2>及び<3−3>と同一な方法により遂行した。異常信号の修正は、実施例<3−3>に記載されたことと同一な方法により遂行した。具体的に、異常信号を検出した後、ピーク内で信号変化量しきい値である200以上の信号変化量を含むサイクルの信号変化量を0に修正した。
<4−3>補正された信号変化量データセットの変換
前記補正された信号変化量データセットを変換して、変換されたデータセットを収得し、これを用いてターゲット分析物質を検出した。本実施例では、前記変換は信号変化量データセットから2次信号変化量データセットを収得する方法により遂行した。
具体的に、2次信号変化量は次の<数式11>により算出された。ターゲット分析物質の検出のために、前記2次信号変化量データセットをプロッティングして変換されたデータセットのカーブを収得した。
<数式11>
I:信号変化量が計算されるサイクル番号
:i番目サイクル番号
cor.s:i番目サイクルでの補正された信号変化量
cor.ss:i番目サイクルでの変換された信号変化量
“a”and“b”:0乃至10の整数
n:a+b+1、信号変化量算出に使われるデータの数
xバー:“I−a”から“I+b”までのサイクル番号の平均
cor.sバー:“I−a”から“I+b”までの補正された信号変化量の平均
本実施例では、“a”と“b”に1が使われた。“I−a”が1より小さな場合、前記aは“I−a”が1になるように調整できる。“I+b”が全体データ地点の数より大きい場合、前記bは“I+b”が全体データ地点の数と同一になるように調整できる。
<4−4>ターゲット分析物質の検出
前記収得した変換されたデータセットを用いてターゲット核酸分子(言い換えると、ターゲット分析物質)を検出した。2次信号変化量が予め定まったしきい値以上であるサンプルを陽性と判定し、2次信号変化量が予め定まったしきい値未満であるサンプルに対しては陰性と判定した。本実施例では、前記予め定まったターゲット検出用しきい値に2次信号変化値70を指定した。
変換されたデータセットのカーブを図示した図14に示すように、ターゲット分析物質を検出した結果は、信号変化量に対する補正適用有無によって異なるように示された。
具体的に、正常信号のみ存在する陽性サンプルであるデータセット1の場合、信号変化量に対する補正有無に関わらず、ターゲット核酸が存在するという同一な結果が導出された。
異常信号を含む陰性サンプルであるデータセット2の場合、信号変化量を補正しない場合にはターゲット検出用しきい値以上の異常信号によって偽陽性結果が観察された。一方、信号変化量を補正した場合には、変換されたデータセットのカーブで異常信号が除去されたので、真陰性結果が導出された。
異常信号を含む陽性サンプルであるデータセット3の場合、信号変化量を補正しない場合にはターゲット検出用しきい値以上の異常信号によって検出誤りが発生した。一方、信号変化量を補正した場合には変換されたデータセットのカーブで異常信号が除去されたので、真陽性結果が導出された。
このように、信号変化量データセットの補正及び変換を含む本発明の方法によれば、ターゲット分析物質検出誤りを除去し、より正確に検出できることを確認した。
実施例5:再構成されたデータセットを用いたデータセットの平滑
実施例5では、再構成されたデータセットをプロッティングして収得したカーブが平滑(smoothing)されるかを実験した。
図15に示すように、データセットの平滑は次のステップを含むプロセスに従って遂行した。
(i)ターゲット分析物質に対するデータセット提供;(ii)データセットの信号値を用いた各サイクルでの信号変化量収得による信号変化量データセット提供;(iii)信号変化量データセットの信号変化量を用いた各サイクルでの累積値収得による再構成されたデータセット提供。追加で、前記プロセスは選択的に前記ステップ(ii)及び(iii)を反復するステップを追加することができる。
<5−1>データセットの収得
実施例1のようにリアルタイムPCRを通じて各サイクル当たり蛍光値(RFU)を含むデータセットを収得した。
<5−2>信号変化量データセットの収得
信号変化量収得を通じて前記収得したデータセットから信号変化量データセットを収得した。信号変化量は前記<数式7>の最小二乗法により計算した。
本実施例では、“a”と“b”に2が使われた。“I−a”が1より小さな場合、前記aは“I−a”が1になるように調整できる。“I+b”が全体データ地点の数より大きい場合、前記bは“I+b”が全体データ地点の数と同一になるように調整できる。
ベースライニングは、実施例<1−3>に記載された方法と同一な方法により遂行されたものであり、信号変化量データセットの最初再構成の前に1回に限り実施した。
<5−3>信号変化量の累積値収得を通じての再構成されたデータセット収得
信号変化量データセットの各サイクルでの累積和を求めて再構成されたデータセットを収得した。累積和は、前記<数式6>を用いて算出した。
本実施例において、CSCは1に指定し、CSVは0に指定した。
<5−4>データセット再構成の反復を通じての平滑効果上昇
データセット再構成プロセスの反復によりデータセット平滑効果が増加するかを実験した。ステップ<5−3>で収得した再構成されたデータセットをステップ<5−2>でのデータセットに再使用する方法により前記ステップ<5−2>及び<5−3>を反復して最終の再構成されたデータセットを収得した。前記ステップ<5−2>及び<5−3>の反復は2回遂行されたものであり、したがって、反復数を異にする全3個の再構成されたデータセットを収得した。データセット再構成を反復する時、信号発生地点が変わることを防止するために、<数式7>でaは3、bは1を各々使用した。
データセットの平滑効果の上昇を確認するために、全ての再構成されたデータセットをプロッティングして比較した。
また、各再構成反復ステップの再構成されたデータセットを用いてターゲット核酸検出を遂行した。予め定まったターゲット検出用しきい値以上の蛍光値を示すサンプルは陽性と判定し、予め定まったターゲット検出用しきい値未満の蛍光値を示すサンプルは陰性と判定した。本実施例では、RFU300を前記予め定まったターゲット検出用しきい値に指定した。
図16Aに示すように、データセットの平滑効果は最初の再構成されたデータセットでも示され、再構成プロセスが反復されるほどその効果が増加することを確認した。また、ターゲット核酸検出に誤りがないことを確認した。
図16Bは、再構成されたデータセットの背景領域に該当する0から20サイクルまでの部位のカーブを拡大したものである。図16Bに示すように、背景領域(0から20サイクル)でのデータセットの平滑効果が示されることを確認することができる。
このように、本発明のデータセット再構成方法はデータセットがプロッティングされたカーブを平滑にし、背景領域のノイズ信号を除去することができる。したがって、本発明の方法はサンプル内ターゲット分析物質の検出及び定量をより正確で、かつ信頼性あるようにすることができる。
以上、本発明の特定の部分を詳細に記述したところ、当業界の通常の知識を有する者に当たって、このような具体的な技術は単に好ましい具現例であり、これに本発明の範囲が制限されるものではない点は明白である。したがって、本発明の実質的な範囲は添付した請求項とその等価物により定義されるというはずである。

Claims (26)

  1. 以下のステップ(a)〜(d)を含むサンプル内ターゲット分析物質検出方法:
    (a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
    (c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含み;及び
    (d)前記再構成されたデータセットを用いてサンプル内ターゲット分析物質を検出するステップ。
  2. 前記各サイクルでの累積値は、累積−開始サイクル(CSC)の番号に対する各サイクルの番号(X)により次の計算法のうちの1つにより計算されることを特徴とする、請求項1に記載の方法:
    前記累積−開始サイクルは、前記信号変化量データセットのサイクルのうちから選択されたサイクルであり;
    (計算法−1)前記XがCSCの番号より大きい場合、前記各サイクルでの累積値は、(i)累積−開始値、及び(ii)前記累積−開始サイクルの直後のサイクルから前記各サイクルまでの信号変化量を累積して計算され;前記累積−開始値は前記累積−開始サイクルでの累積値であり;
    (計算法−2)前記XがCSCの番号より小さな場合、前記各サイクルでの累積値は、(i)累積−開始値、及び(ii)前記各サイクルの直後のサイクルから前記累積−開始サイクルまでの信号変化量から由来した値を累積して計算され;
    (計算法−3)前記XがCSCの番号と同一な場合、前記累積−開始値が前記各サイクルでの累積値に指定される。
  3. 前記各サイクルでの累積値は最初のサイクルから前記各サイクルまでの信号変化量を累積して計算されることを特徴とする、請求項1に記載の方法。
  4. 前記各サイクルでの信号変化量は、各サイクルでの信号値の微分値、各サイクルでの信号値の差分値、各サイクルでの信号値の比率、及び各サイクルでの線形回帰分析を遂行して収得した傾き値からなる群から選択されることを特徴とする、請求項1から3のうち、いずれか一項に記載の方法。
  5. 前記各サイクルでの累積値は、各サイクルでの微分値の累積値、各サイクルでの差分値の累積値、各サイクルでの比率の累積値、及び傾き値の累積値からなる群から選択されることを特徴とする、請求項4に記載の方法。
  6. 前記信号変化量データセットの少なくとも1つの信号変化量を加工するステップを追加的に含むことを特徴とする、請求項1に記載の方法。
  7. 前記ステップ(a)の前記データセットは、原始データセット、前記原始データセットの数学的に加工されたデータセット、前記原始データセットの標準化されたデータセット、または前記原始データセットの前記加工されたデータセットの標準化されたデータセットであることを特徴とする、請求項1に記載の方法。
  8. 前記標準化されたデータセットは、次のステップを含むプロセスにより提供されることを特徴とする、請求項7に記載の方法。
    (i)前記原始データセットまたは前記原始データセットの数学的に加工されたデータセットを補正するための標準化係数を提供するステップ;前記標準化係数は基準値、基準サイクル、及び前記データセットを用いて提供され;前記基準サイクルは前記データセットのサイクルのうちから選択され;前記基準値は任意に定まった値であり;前記標準化係数は前記基準サイクルに該当する前記データセットのサイクルでの信号値及び前記基準値の間の関係を定めて提供され;及び
    (ii)前記標準化係数を前記データセットの信号値に適用して補正された信号値を収得して標準化されたデータセットを提供するステップ。
  9. 前記信号変化量データセットは、ベースラインが差し引かれた信号変化量データセットであることを特徴とする、請求項1に記載の方法。
  10. 前記データセットの平滑のために、前記ステップ(c)で提供された前記再構成されたデータセットを前記ステップ(b)のデータセットに使用して、前記ステップ(b)と(c)を反復するステップを追加で含むことを特徴とする、請求項1に記載の方法。
  11. 前記ステップ(d)のターゲット分析物質の検出は、前記サンプル内ターゲット分析物質の定性的または定量的検出であることを特徴とする、請求項1に記載の方法。
  12. 前記ステップ(a)の以前にサンプル内ターゲット分析物質に対するデータセットを収得するための信号−発生反応を遂行するステップを追加的に含むことを特徴とする、請求項1に記載の方法。
  13. 前記信号−発生反応は、信号増幅反応であることを特徴とする、請求項1に記載の方法。
  14. 次のステップ(a)〜(e)を含むサンプル内ターゲット分析物質検出方法:
    (a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
    (c)前記信号変化量データセットを直接補正して、補正された信号変化量データセットを提供するステップ;
    (d)前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するステップ;及び
    (e)前記変換されたデータセットを用いてサンプル内ターゲット分析物質を検出するステップ。
  15. 前記変換されたデータセットは、信号変化量データセットの信号変化量の変化を示すN次信号変化量を含むN次信号変化量データセットであり;前記Nは2以上の整数であることを特徴とする、請求項14に記載の方法。
  16. 前記ステップ(e)のターゲット分析物質の検出は、前記サンプル内ターゲット分析物質の定性的または定量的検出であることを特徴とする、請求項14に記載の方法。
  17. 次のステップ(a)及び(b)を含むデータセット再構成方法:
    (a)データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
    (b)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
  18. 前記各サイクルでの信号変化量は、各サイクルでの信号値の微分値;各サイクルでの信号値の差分値;各サイクルでの信号値の比率;及び各サイクルでの線形回帰分析を遂行して収得した傾き値からなる群から選択されることを特徴とする、請求項17に記載の方法。
  19. 前記各サイクルでの累積値は、各サイクルでの微分値の累積値;各サイクルでの差分値の累積値;各サイクルでの比率の累積値;及び傾き値の累積値からなる群から選択されることを特徴とする、請求項17に記載の方法。
  20. 次のステップ(a)〜(c)を含むデータセット平滑方法:
    (a)ターゲット分析物質に対するデータセットを提供するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
    (c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
  21. 前記データセットの平滑のために、前記ステップ(c)で提供された前記再構成されたデータセットを前記ステップ(b)のデータセットに使用して、前記ステップ(b)と(c)を反復するステップを追加で含むことを特徴とする、請求項20に記載の方法。
  22. 前記信号変化量は、各サイクルで線形回帰分析を遂行して収得した傾き値であることを特徴とする、請求項20に記載の方法。
  23. サンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体であって、次のステップ(a)〜(d)を含む:
    (a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
    (c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含み;及び
    (d)前記再構成されたデータセットを用いてサンプル内ターゲット分析物質の存在または不存在を決定するステップ。
  24. サンプル内ターゲット分析物質検出方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体であって、次のステップ(a)〜(e)を含む:
    (a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;
    (c)前記信号変化量データセットを直接補正して、補正された信号変化量データセットを提供するステップ;
    (d)前記補正された信号変化量データセットを変換して、変換されたデータセットを提供するステップ;及び
    (e)前記変換されたデータセットを用いてサンプル内ターゲット分析物質の存在または不存在を決定するステップ。
  25. データセット再構成方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体であって、次のステップ(a)〜(c)を含む:
    (a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットはサイクル及び信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
    (c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。
  26. データセット平滑方法を実行するためのプロセッサを具現する指示を含むコンピュータにより読取可能な記録媒体であって、次のステップ(a)〜(c)を含む:
    (a)ターゲット分析物質に対するデータセットを受信するステップ;前記データセットは信号−発生手段を用いた前記ターゲット分析物質に対する信号−発生反応から収得され;前記データセットはサイクル及び前記信号−発生反応の信号値を含む複数のデータ地点を含み;
    (b)前記データセットの信号値を用いて各サイクルでの信号変化量を収得して信号変化量データセットを提供するステップ;前記信号変化量データセットはサイクル及び前記サイクルでの信号変化量を含む複数のデータ地点を含み;及び
    (c)前記信号変化量データセットの信号変化量を用いて各サイクルでの累積値を収得して再構成されたデータセットを提供するステップ;前記再構成されたデータセットはサイクル及び前記サイクルでの累積値を含む複数のデータ地点を含む。

JP2018563102A 2016-06-02 2017-06-02 信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法 Active JP6835877B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20160068932 2016-06-02
KR10-2016-0068932 2016-06-02
PCT/KR2017/005790 WO2017209563A1 (en) 2016-06-02 2017-06-02 Method for detecting a target analyte in a sample using a signal change-amount data set

Publications (2)

Publication Number Publication Date
JP2019525289A true JP2019525289A (ja) 2019-09-05
JP6835877B2 JP6835877B2 (ja) 2021-02-24

Family

ID=60478835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018563102A Active JP6835877B2 (ja) 2016-06-02 2017-06-02 信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法

Country Status (6)

Country Link
US (1) US20190156920A1 (ja)
EP (1) EP3465504A4 (ja)
JP (1) JP6835877B2 (ja)
KR (2) KR102326604B1 (ja)
CN (1) CN109923613B (ja)
WO (1) WO2017209563A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017086762A1 (en) * 2015-11-20 2017-05-26 Seegene, Inc. Method for calibrating a data set of a target analyte
AU2019255933B2 (en) * 2018-04-20 2022-08-25 Seegene, Inc. . Method and apparatus for detecting a plurality of target nucleic acid sequences in sample
KR102699175B1 (ko) * 2018-12-14 2024-08-26 주식회사 씨젠 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
CN112669910A (zh) * 2020-12-30 2021-04-16 杭州博日科技股份有限公司 扩增曲线基线确定方法、装置以及电子设备
CN113641957B (zh) * 2021-06-29 2024-08-13 南京邮电大学 一种基于归一化流的信号检测方法
CN115641916B (zh) * 2022-09-29 2024-05-03 杭州准芯生物技术有限公司 一种分子生物学检测方法、计算机设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005516630A (ja) * 2002-02-07 2005-06-09 アプレラ コーポレイション リアルタイムpcrのための自動閾値設定およびベースライン決定
JP2011512787A (ja) * 2007-12-28 2011-04-28 アボット・ラボラトリーズ 関連アプリケーションに相互参照する有効関連値を使用する対立遺伝子識別解析
US20150186598A1 (en) * 2013-12-30 2015-07-02 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time pcr signals
JP2015529085A (ja) * 2012-09-10 2015-10-05 バイオファイア・ダイアグノスティクス,リミテッド・ライアビリティ・カンパニー マルチプル増幅サイクル検出

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115673A (en) * 1997-08-14 2000-09-05 Instrumentation Metrics, Inc. Method and apparatus for generating basis sets for use in spectroscopic analysis
AU2005295298B2 (en) * 2004-10-18 2011-07-14 Brandeis University Primers, probes and methods for nucleic acid amplification
CN100368560C (zh) * 2005-09-22 2008-02-13 广州华银医药科技有限公司 一种呼吸道病原体的实时荧光聚合酶链式反应检测方法
US7587283B2 (en) * 2006-07-01 2009-09-08 Celera Corporation Growth and baseline identification determination for amplification data
US8005628B2 (en) * 2007-01-29 2011-08-23 Applied Biosystems, Llc Systems and methods for baseline correction using non-linear normalization
EP2809813B1 (en) * 2012-02-03 2018-08-08 California Institute of Technology Signal encoding and decoding in multiplexed biochemical assays
JP6386031B2 (ja) * 2013-05-15 2018-09-05 ソーン ダイアグノスティックス インコーポレイテッド 核酸増幅信号収集及び信号分析
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples
KR20160039529A (ko) * 2014-10-01 2016-04-11 주식회사 씨젠 증폭곡선을 보정하는 방법 및 시료 분석을 위한 정보를 획득하는 방법, 그 기록매체, 그 컴퓨터 프로그램, 컴퓨터 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005516630A (ja) * 2002-02-07 2005-06-09 アプレラ コーポレイション リアルタイムpcrのための自動閾値設定およびベースライン決定
JP2011512787A (ja) * 2007-12-28 2011-04-28 アボット・ラボラトリーズ 関連アプリケーションに相互参照する有効関連値を使用する対立遺伝子識別解析
JP2015529085A (ja) * 2012-09-10 2015-10-05 バイオファイア・ダイアグノスティクス,リミテッド・ライアビリティ・カンパニー マルチプル増幅サイクル検出
US20150186598A1 (en) * 2013-12-30 2015-07-02 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time pcr signals

Also Published As

Publication number Publication date
KR102326604B1 (ko) 2021-11-15
US20190156920A1 (en) 2019-05-23
CN109923613A (zh) 2019-06-21
KR20210138152A (ko) 2021-11-18
EP3465504A1 (en) 2019-04-10
KR20190004834A (ko) 2019-01-14
WO2017209563A9 (en) 2018-12-27
KR102385959B1 (ko) 2022-04-12
EP3465504A4 (en) 2020-02-12
WO2017209563A1 (en) 2017-12-07
JP6835877B2 (ja) 2021-02-24
CN109923613B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
JP6835877B2 (ja) 信号変化量データセットを用いたサンプル内ターゲット分析物質検出方法
KR102300738B1 (ko) 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법
JP6602374B2 (ja) 試料の分析方法
EP3090372B1 (en) Detection and correction of jumps in real-time pcr signals
CN108351918B (zh) 对目标分析物的数据集的校准方法
JP7012151B2 (ja) 試料内ターゲット分析物を分析する方法及び装置
US11781180B2 (en) Detection of abnormal signal using two or more datasets
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
KR102699175B1 (ko) 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
EP3432177B1 (en) Method and device for analyzing a dataset
KR20180135986A (ko) 데이터 세트에서 비정상적인 시그널의 검출

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190130

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210204

R150 Certificate of patent or registration of utility model

Ref document number: 6835877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250