KR20170051539A - 시료의 분석 방법 - Google Patents

시료의 분석 방법 Download PDF

Info

Publication number
KR20170051539A
KR20170051539A KR1020177011966A KR20177011966A KR20170051539A KR 20170051539 A KR20170051539 A KR 20170051539A KR 1020177011966 A KR1020177011966 A KR 1020177011966A KR 20177011966 A KR20177011966 A KR 20177011966A KR 20170051539 A KR20170051539 A KR 20170051539A
Authority
KR
South Korea
Prior art keywords
cycle
cycles
signal
baseline
amplification
Prior art date
Application number
KR1020177011966A
Other languages
English (en)
Other versions
KR102336732B1 (ko
Inventor
천종윤
이영조
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Priority claimed from PCT/KR2015/010308 external-priority patent/WO2016052991A1/en
Publication of KR20170051539A publication Critical patent/KR20170051539A/ko
Application granted granted Critical
Publication of KR102336732B1 publication Critical patent/KR102336732B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • G06F19/10
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2561/00Nucleic acid detection characterised by assay method
    • C12Q2561/113Real time assay

Abstract

본 발명은 시료(sample)의 분석 방법에 관한 것이다.  특히, 본 발명은 시료를 분석하는 방법 및 증폭 반응의 원시 데이터 세트를 보정하는 방법에 관한 것이다.  본 발명의 시료의 분석 방법은 사이클 중 적어도 2개의 사이클의 임계값이 서로 다른 가변 임계값을 신호-발생 반응의 사이클에 적용하여, 신호-발생 반응에 의한 신호의 유의성을 결정하는데 방해되는 요소 또는 신호-발생 반응에 의한 실제 신호의 증가를 나타내는 것이 아닌 부정확한 신호들을 효과적으로 제거한다.  본 발명의 시료의 분석 방법은 더욱 정확하고 신뢰성 있는 시료의 분석 결과를 제공한다. 

Description

시료의 분석 방법{METHODS FOR ANALYZING SAMPLES}
본 발명은 시료(sample)의 분석 방법에 관한 것이다. 특히, 본 발명은 시료를 분석하는 방법 및 증폭 반응의 원시 데이터 세트를 보정하는 방법에 관한 것이다.
시료의 분석은 다양한 기술 분야에서 매우 중요한 기술이다. 시료의 분석은 특정한 특성의 관점에서 시료를 상세히 설명하거나, 묘사하거나, 또는 특징을 확인하기 위해 수행한다.
시료의 분석은 생명공학 분야에서 더욱 중요한 의미를 갖는다. 특히, 시료의 분석은 일반적으로 분석 물질(analyte)의 존재 또는 부존재, 결합 친화도, 효소 활성, 유전자 발현 수준 및 아미노산이나 뉴클레오타이드 서열과 같은 특정 특성에 대한 정보를 제공하기 위해 수행한다. 대표적으로 시료의 분석을 위해 면역분석법(immunoassay) 및 유전자 분석법(genetic analysis)이 널리 사용되어 왔으며, 생체시료(biosample)를 분석하는 기술들에 관하여는 미국 등록 특허 제6,516,276호, 제6,228,593호, 제7,349,809호, 제7,115,229호 및 제6,816,790호에 공개되어 있다.
표적 핵산 증폭 반응은 표적 핵산 분자를 검출하는 대부분의 기술들에 널리 관련되어 있다. 핵산 증폭은 다양한 증폭 기술들이 제안되어 올 만큼 분자 생물학 분야의 다양한 방법들 중에서 가장 핵심적인 기술이다. 핵산 증폭 기술로서 가장 널리 사용되는 기술은 중합효소 연쇄반응(Polynucleotide Chain Reaction: PCR)으로서, 이 기술은 이중가닥 DNA의 변성, DNA 주형에로의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클 과정에 기초한다(Mullis 등, 미국 등록 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., (1985) Science 230, 1350-1354).
실시간 PCR(Real-time PCR)은 시료에서 표적 핵산 분자를 실시간으로 검출하기 위한 PCR 기반 기술이다[Logan J et al., (2009). Real-Time PCR: Current Technology and Applications. Caister Academic Press]. 특정 표적 핵산 분자를 검출하기 위하여, 표적 핵산의 양에 비례하여 검출 가능한 형광신호를 방출하는 신호-발생 수단을 이용한다. 검출 가능한 형광신호의 방출은, 예를 들어 이중 나선 DNA 사이에 결합하면 신호를 방출하는 인터칼레이터(intercalator)를 사용하거나, 형광 리포터 분자 및 퀀처(quencher) 분자를 갖는 올리고뉴클레오타이드를 사용하는 방법이 있다. 표적 핵산의 양에 비례하는 형광신호가 각 증폭 사이클 마다 검출되며, 이를 증폭 사이클에 대하여 플롯팅하여 증폭곡선(amplification curve) 또는 증폭 프로파일 곡선(amplification profile curve)을 얻게 된다.
일반적으로 실시간 PCR에 의한 증폭곡선은 베이스라인 영역(baseline region), 지수 영역(exponential phase), 직선 영역(linear phase), 및 정체 영역(plateau phase)으로 나뉘어진다. 지수 영역은 PCR 증폭 산물의 증가에 비례하여 방출되는 형광신호가 증가하는 영역이다. 직선 영역에서는 형광 신호 증가가 실질적으로 감소하게 되고, 실질적으로 선형 방식으로 행동하게 되며, 정체 영역은 PCR 증폭 산물의 증가 및 형광신호의 방출이 포화상태에 이르러 더 이상 형광신호의 증가가 나타나지 않는 영역을 지칭한다.
베이스라인 영역은 PCR 반응 초기 사이클 동안에 형광신호가 거의 변화 없이 일정하게 유지되는 영역을 의미한다. 이 영역에서는 PCR 산물의 수준이 검출 가능한 정도로 충분하지 않기 때문에, 이 영역의 형광신호의 대부분은 반응 시료 자체의 형광신호 및 측정 시스템 자체의 형광신호를 포함하는 배경신호(background signal)에 기인한다.
실시간 PCR 데이터의 정확하고, 재현성 있는 분석을 위해서 얻어진 증폭곡선의 보정(correction) 또는 정규화(normalization)를 행해야 한다. 증폭곡선의 보정은 베이스라인 영역을 결정하고, 결정된 베이스라인 영역에서의 배경신호(background signal)을 제거함으로써 행할 수 있다.
배경신호(background signal)는 PCR 반응 시 반응 조건 및 환경의 변화를 반영하기 때문에 반응마다 상이하게 나타나며, 이로 인하여 시료내의 핵산 분자의 양과는 무관한 베이스라인 이동(baseline drift)이 빈번하게 나타난다. 이러한 베이스라인 이동은 반응 간 증폭곡선의 비교를 어렵게 만들며, 표적 핵산 검출에 있어 위양성 또는 위음성 결과를 초래하기 쉽다. 따라서, PCR 데이터 분석에 있어, 이러한 베이스라인 영역의 적절한 설정 및 설정된 베이스라인을 기반으로 한 PCR 실험 데이터의 수정이 필요하다.
증폭곡선을 보정하기 위한 종래의 하나의 방법에서는 PCR 초기 사이클 중 임의의 사이클 영역(예, 3-15 사이클)을 베이스라인으로 결정하며, 다른 방법에서는 실험에 의해 증폭곡선이 결정된 후 증폭신호가 충분히 증가하기 전 사이클을 결정하여 베이스라인을 설정한다. 미국등록특허 제8,219,324호는 증폭곡선의 2차 도함수(second derivative)를 구하고 일정한 특징을 갖는 데이터 지점을 베이스라인의 끝지점 사이클로 하여 베이스라인 영역을 설정하는 방법을 개시한다.
이러한 종래의 방법들은 몇 가지 중요한 단점들을 갖는다.
전술한 종래의 하나의 방법에서 베이스라인을 하나의 초기 임의 사이클 영역으로 결정하는 경우, 반응마다 상이한 배경신호의 변화를 보정할 수는 있으나, 이 방법은 베이스라인 이동(baseline drift)를 보정하지는 않는다. 또한, 증폭영역의 시작은 초기 시료에 존재하는 표적 핵산의 양에 따라 달라지므로, 베이스라인 영역이 미리 결정되어 있는 경우, 이를 다양한 샘플에 일률적으로 적용하는 것이 곤란하다. 또한, 베이스라인 영역을 실험자가 임의로 결정하는 경우, 동일 증폭곡선이라도 분석하는 실험자에 따라 베이스라인 영역 설정이 달라질 수 있으며, 이에 따라 이후 실제 증폭 산물의 양이 달라질 수 있으므로, 신뢰성 있는 결과를 도출하기 곤란하다.
또는, 미국 등록 특허 제8,219,324호에 개시된 방법에 의하면 베이스라인은 복잡한 알고리즘에 의해 결정되는데, 이 경우 상기 알고리즘에는 명확하게 정의되지 않는 많은 파라미터가 필요하게 되며, 종종 최적화가 어렵게 된다.
임계값을 사용하는 다양한 시료 분석 방법들에서, 노이즈 신호들 또는 비-전형적인 패턴의 신호들(예를 들어, 음의 기울기 패턴)의 발생 때문에 위양성 또는 위음성 결과가 야기될 수 있다. 이러한 분석 오류는 종래의 임계값을 사용하는 방법에 의해서는 제거하기가 어렵다.
따라서, 당업계에서는 각 시료(또는 PCR 반응)에 대해 새로운 방식으로 임계값을 설정하거나 정확한 베이스라인 영역을 설정함으로써 시료 분석 방법을 개선하기 위한 새로운 접근법(예를 들어, 증폭 곡선의 보정)의 개발이 절실히 필요하며, 이는 보다 정확하고 신뢰성 있는 분석 결과에 기여한다.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명의 발명자는 신호-발생 반응을 통하여 수득한 데이터 세트의 가공을 통하여 더욱 정확하고, 신뢰성 있는 신호-발생 반응의 결과를 얻고, 이로인해 더욱 정확하고, 신뢰성 있는 시료의 분석결과를 제공하기 위하여 연구하였다. 그 결과, 신호-발생 반응에 의한 신호의 유의성을 결정하는데 방해되는 요소 또는 신호-발생 반응에 의한 실제 신호의 증가를 나타내는 것이 아닌 부정확한 신호들을 효과적으로 제거하기 위하여, 사이클 중 적어도 2개의 사이클의 임계값이 서로 다른 가변 임계값이 신호-발생 반응의 사이클에 적용될 수 있는 것을 발견하였다. 또한 본 발명이 증폭반응의 원시 데이터 세트의 보정에 적용될 수 있음을 발견하였다.
따라서, 본 발명의 목적은 가변 임계값을 사용한 시료 분석 방법을 제공하는 것이다.
본 발명의 다른 목적은 신호-발생 수단을 이용한 증폭반응의 원시 데이터 세트를 보정하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 시료 분석 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
본 발명의 또 다른 목적은 신호-발생 수단을 이용한 증폭반응의 원시 데이터 세트를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
본 발명의 또 다른 목적은 시료 분석을 위한 장치를 제공하는 것이다.
본 발명의 또 다른 목적은 신호-발생 수단을 이용한 증폭반응의 원시 데이터 세트를 보정하는 장치를 제공하는 것이다.
본 발명의 또 다른 목적은 시료 분석 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공하는 것이다.
본 발명의 또 다른 목적은 신호-발생 수단을 이용한 증폭반응의 원시 데이터 세트를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공하는 것이다.
본 발명의 다른 목적 및 이점은 하기의 청구범위 및 도면에 의해 보다 명확하게 된다.
본 명세서 발명의 상세한 설명에서, 본 발명과 직접적인 관련이 없고, 기술분야에 잘 알려진 일반 기술 및 지식에 관한 설명은 상세한 설명이 본 발명을 더욱 잘 설명하기 위하여 생략된다. 또한, 이하 설명된 섹션간 공통되는 내용은 명세서의 복잡성을 피하기 위하여 생략된다.
I. 가변 임계값을 이용한 시료의 분석
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 시료 분석 방법을 제공한다.
(a) 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하는 단계;
(b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
(c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
(d) 상기 (c) 단계에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
본 발명은 신호-발생 반응에서 얻은 데이터 세트(예를 들어 신호값과 사이클)를 사용하고, 이를 가공하여 시료를 분석하는 방법에 관한 것이다.
본 발명의 일 구현예에 따르면, 시료의 분석은 시료내 분석물질의 존재 또는 부존재를 결정하는 것이다. 용어 “시료 내 분석물질의 존재 또는 부존재의 결정”은 시료내 분석물질의 존재 또는 부존재를 정량적, 정성적으로 결정하는 것을 의미한다.
본 발명의 발명자는 신호-발생 반응을 통하여 수득한 데이터 세트의 가공을 통하여 더욱 정확하고, 신뢰성 있는 신호-발생 반응의 결과를 얻고, 이로인해 더욱 정확하고, 신뢰성 있는 시료의 분석결과를 제공하기 위하여 연구하였다. 그 결과,
신호-발생 반응에 의한 신호의 유의성을 결정하는데 방해되는 요소 또는 신호-발생 반응에 의한 실제 신호의 증가를 나타내는 것이 아닌 부정확한 신호들을 효과적으로 제거하기 위하여, 사이클 중 적어도 2개의 사이클의 임계값이 서로 다른 가변 임계값이 신호-발생 반응의 사이클에 적용되는 것을 발견하였다. 또한 본 발명이 증폭반응의 원시 데이터 세트의 보정에 적용될 수 있음을 발견하였다.
사이클 중 적어도 2개의 사이클의 임계값이 서로 다른 값을 가지는 임계값이 신호-발생 반응의 사이클에 적용되는 본 방법은 알려진 바가 없다.
도 1a는 본 발명의 시료 분석 방법의 일 구현예에 대한 흐름도이다. 본 발명을 보다 상세히 설명하면 다음과 같다.
단계 (a) : 신호값 수득 단계(S10)
첫번째로, 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득한다.
본 발명은 신호-발생 반응에서 얻은 데이터 세트(예를 들어 신호값과 사이클)를 사용하여 시료를 분석하는 방법에 관한 것이다. 단계 (a)는 (i) 시료를 이용한 신호-발생 반응의 사이클 및 (ii) 사이클에서의 신호-발생 반응의 신호값을 포함하는 데이터 세트를 수득하는 단계로도 설명될 수 있다.
본 발명에서 용어 “신호-발생 반응”은 시료내 분석물질의 존재에 의존적으로 신호를 발생할 수 있는 반응을 의미한다.
신호-발생 반응은 신호의 변화를 수반한다.
본 발명의 일 구현예에 따르면, 신호-발생 반응은 신호 증폭 반응이다.
본 발명에서 용어 “신호”는 측정 가능한 산출물을 의미한다.
신호 변화는 분석물질의 존재 또는 부존재를 정량적 또는 정성적으로 나타내는 지표 역할을 할 수 있다.
유용한 지표의 예로는 형광 강도, 발광 강도, 화학발광 강도, 생발광 강도, 인광 강도, 전하 전달, 전압, 전류, 전력, 에너지, 온도, 점도, 광산란, 방사선 강도, 반사력, 투과도, 흡광도가 있다. 가장 널리 쓰이는 지표로는 형광 강도가 있다.
본 발명의 일 구현예에 따르면, 신호-발생 반응은 증폭 곡선을 제공하는 반응이다. 특히, 증폭곡선은 신호 증폭곡선이다.
이러한 신호-발생 반응은 생물학적 또는 화학적 반응을 포함한다. 생물학적 반응은 PCR, 실시간 PCR, 마이크로어레이, 인베이더 어세이, 면역어세이 반응 및 세균 배양 분석과 같은 유전적 분석 반응을 포함한다. 특히, 신호-발생 반응은 유전적 분석 반응을 포함한다. 화학적 반응은 화학 물질의 생산, 변화 또는 분해를 포함하는 화학적 분석방법을 포함한다.
분석물질(analyte)은 핵산(예를들어, DNA 또는 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화학물, 호르몬, 항체, 항원, 대사산물, 세포 등일 수 있다. 택일적으로, 분석물질은 화학물질과 같은 비-생물학적 물질일 수 있다.
본 발명의 일 구현예에 따르면, 분석물질은 표적 핵산분자이다. 용어 “ 표적 핵산 분자”는 분석 또는 검출 대상 핵산 분자를 의미한다.
본 발명의 일 구현예에 따르면, 신호-발생 반응은 분석물질의 증폭이 동반되거나 또는 동반되지 않는 반응이다.
특히, 신호-발생 반응은 분석물질, 구체적으로 표적 핵산 분자의 증폭이 동반되는 반응이다. 더욱 특별하게는, 신호-발생 반응은 표적 핵산 분자의 증폭이 동반되며, 표적 핵산 분자의 증폭에 따라 신호가 증가 또는 감소(바람직하게는 증가) 할 수 있는 반응이다.
본 발명에서 용어 “신호 발생”은 신호의 발생 또는 소멸 및 신호의 증가 또는 감소를 모두 포함한다. 특히, 용어 “신호 발생은 신호의 증가를 의미한다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 신호-발생 수단의 존재하에서 수행된다.
본 발명에서 용어 “신호-발생 수단”은 분석물질(예를 들어, 표적 핵산 분자)의 존재를 나타내는 신호의 발생에 사용되는 물질을 의미한다. 예를 들어, 올리고뉴클레오티드, 표지 및 효소일 수 있다. 택일적으로, 본 발명에서 용어 “신호-발생 수단”은 신호 발생을 위한 물질을 사용하는 방법을 의미하는 것으로 사용될 수 있다.
다양한 종류의 신호-발생 수단이 당업자에게 알려져 있다. 신호-발생 수단은 표지 그 자체 및 표지가 붙은 올리고뉴클레오티드를 모두 포함한다. 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다. 표지는 인터칼레이팅 염료(intercalating dye)와 같이, 표지 자체가 신호-발생 수단으로 사용될 수 있다. 택일적으로, 단일 표지 또는 공여 분자 (donor molecule) 및 수용 분자 (acceptor molecule)을 포함하는 상호작용적 이중 표지가 하나 이상의 올리고뉴클레오티드에 결합된 상태로 사용될 수 있다.
신호-발생 수단은 핵산분해 효소(예를 들어 5’-뉴클레아제 또는 및 3’-뉴클레아제)와 같은 신호를 발생시키기 위한 요소를 추가적으로 포함할 수 있다.
본 발명의 방법은 표적 핵산 분자의 존재 또는 부존재를 결정하는데 사용되므로, 신호-발생 반응은 당업계에 알려진 다양한 방법에 따라 수행될 수 있다. 대표적인 예로는 TaqManTM probe 방법 (미국 제5,210,015호), Molecular Beacon 방법 (Tyagi 등, Nature Biotechnology, 14 (3):303(1996)), 스콜피온(Scorpion) 방법 (Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise or Amplifluor) 방법 (Nazarenko 등, Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국특허 제6,117,635호), 럭스(Lux) 방법 (미국특허 제7,537,886호), CPT (Duck P 등, Biotechniques, 9:142-148(1990)), LNA 방법 (미국특허 제6,977,295호), 플렉서(Plexor) 방법 (Sherrill CB 등, Journal of the American Chemical Society, 126:4550-4556(2004)), HybeaconsTM (D. J. French 등, Molecular and Cellular Probes (2001) 13, 363-374 및 미국특허 제7,348,141호), Dual-labeled, self-quenched probe (미국특허 제5,876,930호), Hybridization probe (Bernard PS 등, Clin Chem 2000, 46, 147-148), PTOCE (PTO cleavage and extension) 방법 (WO 2012/096523), PCE-SH (PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법 (WO 2013/115442), PCE-NH (PTO Cleavage and Extension-Dependent Non-Hybridization) 방법 (PCT/KR2013/012312) and CER 방법 (WO 2011/037306)이 있다.
본 발명에서 용어 “증폭” 또는 “증폭 반응”은 신호를 증가 또는 감소 시키기 위한 반응을 의미한다. 상기 신호의 증가 또는 감소는 신호-발생 수단에 의하여 일어난다.
본 발명의 일 구현예에 따르면, 신호-발생 수단에 의한 신호는 분석물질(예를 들어, 표적 핵산 분자)의 존재에 의존적으로 발생하며, 상기 신호의 강도는 증폭반응에 따라 증가 또는 감소한다.
본 발명의 일 구현예에 따르면, 증폭 반응은 분석물질(예를 들어, 표적 핵산 분자)의 존재에 의존적으로 신호-발생 수단에 의한 신호를 증폭하기 위한 반응을 의미한다.
본 발명의 일 구현예에 따르면, 증폭 곡선은 증폭 반응에 의하여 수득된다.
본 발명에서 용어 “사이클”은 상태 변화를 수반하는 복수의 측정에서 상태 변화의 단위를 의미한다. 상태의 변화는 예를 들어 온도의 변화, 반응시간의 변화, 반응 횟수의 변화, 농도의 변화, pH의 변화 및/또는 측정대상(예를 들어, 표적 핵산 분자)의 복제 횟수의 변화를 포함한다. 따라서, 사이클은 시간 또는 과정 사이클, 단위운영 사이클 및 복제 사이클일 수 있다.
예를 들어, 효소의 기질 분해능이 기질의 농도에 따라 분석되는 경우, 효소의 분해능에 대한 복수의 측정이 다양한 기질농도에서 수행된다. 이 경우, 기질 농도의 증가가 상태 변화에 해당될 수 있으며, 그 증가 단위가 사이클에 해당될 수 있다.
다른 예로서, 등온 증폭 반응은 반응시간에 따라 동일온도 조건에서 복수의 측정이 이루어지며, 이 경우 반응시간이 상태 변화에 해당되며, 반응시간 단위가 사이클에 해당될 수 있다.
특히, 일련의 반응의 반복 또는 일정시간 간격을 갖는 반응의 반복의 경우, 용어 “사이클”은 상기 반복의 단위를 의미한다.
예를 들어, 중합효소 연쇄 반응(PCR)에서, 사이클은 표적 분자의 변성, 표적 분자와 프라이머의 어닐링(혼성화) 및 프라이머의 연장을 포함하는 반응 단위를 의미한다. 이 경우 반응의 반복의 증가가 상태 변화에 해당하며, 상기 반복 단위가 사이클에 해당될 수 있다.
본 발명의 일 구현예에 따르면, 표적 핵산 분자가 시료에 존재하는 경우, 측정되는 신호값(예를 들어 신호 강도)은 증폭 반응의 사이클의 증가에 따라 증가하거나 감소한다.
본 발명의 일 구현예에 따르면, 표적 핵산 분자의 존재를 나타내는 신호의 증폭을 위한 증폭 반응은 신호가 표적 핵산 분자의 증폭과 동시에 증폭되는 방법(예를 들어 실시간 PCR)으로 수행될 수 있다. 택일적으로, 상기 증폭 반응은 신호가 표적 핵산 분자의 증폭을 수반하지 않고 증폭되는 방법[예를 들어, CPT 방법 (Duck P, et al., Biotechniques, 9:142-148 (1990)), Invader 어세이 (미국특허 제6,358,691호 및 제6,194,149호)]으로 수행될 수 있다.
표적 핵산 분자를 증폭하는 다양한 방법이 알려져 있다. 이에 제한되지는 아니하나, 예를 들어, 중합효소연쇄반응(PCR, polymerase chain reaction), 라가아제연쇄반응 (LCR, ligase chain reaction, Wiedmann M 등, "Ligase chain reaction (LCR)- overview and applications." PCR Methods and Applications 1994 Feb;3(4):S51-64), GLCR (gap filling LCR, WO 90/01069, EP 439182 및 WO 93/00447), Q-beta (Q-beta replicase amplification, Cahill P, et al., Clin Chem., 37(9):1482-5(1991), 미국특허 제5,556,751호), 가닥치환증폭 (SDA, strand displacement amplification, G T Walker 등, Nucleic Acids Res. 20(7):16911696(1992), EP 497272), NASBA (nucleic acid sequence-based amplification, Compton, J. Nature 350(6313):912(1991)), 전사매개증폭 (TMA, Transcription-Mediated Amplification, Hofmann WP 등, J Clin Virol. 32(4):289-93(2005); 미국특허 제5,888,779호) 또는 롤링서클증폭 (RCA, Rolling Circle Amplification, Hutchison C.A. 등, Proc. Natl Acad. Sci. USA. 102:1733217336(2005))일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명에서 사용하는 표지는 형광 표지일 수 있으며, 더 구체적으로 단일 형광 표지 또는 형광 리포터 분자 및 퀀처 분자를 포함하는 상호 작용적 이중 표지 일 수 있다. 본 발명의 일 구현예에 따르면, 본 발명에서 사용하는 증폭 반응은 표적 핵산 분자의 증폭을 수반하여 신호를 증폭시킨다. 본 발명의 일 구현예에 따르면, 본 발명의 증폭반응은 PCR 방법에 의해 수행된다.
신호-발생 반응은 시료 분석을 위한 데이터 세트(신호값 및 사이클값)를 제공한다.
본 발명에서 용어 “신호값”은 신호-발생 반응의 사이클에서 실제 측정된 신호값(예를들어, 증폭 반응에 의한 실제 형광 강도) 또는 이의 변형을 의미한다. 상기 변형은 측정된 신호값(신호강도)의 수학적으로 가공된 값일 수 있다. 측정된 신호값의 수학적으로 가공된 값은 예를 들어, 측정된 신호값의 대수값(logarithmic values) 또는 미분값(derivatives)일 수 있다. 상기 측정된 신호값의 미분값은 다중 미분을 포함할 수 있다.
본 발명에서 용어 “데이터 지점”은 사이클과 상기 사이클에서의 신호값을 포함하는 좌표값을 의미한다. 신호-발생 수단을 이용한 증폭 반응에 의해 얻어진 데이터 지점들은 직교 좌표계의 좌표값으로 표시될 수 있다. 상기 직교 좌표계에서, X축은 증폭반응의 사이클을 나타내며, Y축은 해당 사이클에서 상기 신호-발생 수단으로부터의 신호값을 나타낸다(도 2 참조).
본 발명에서 용어 “데이터 세트”는 데이터 지점의 집합을 의미한다. 상기 데이터 세트는 원시 데이터 세트와 변형된 데이터 세트를 포함한다.
원시 데이터 세트는 본 발명의 분석을 위한 최초의 데이터 세트일 수 있다. 상기 원시 데이터 세트는 시료 분석을 위한 신호-발생 반응(예를들어, 증폭 반응)을 통하여 직접 수득한 데이터 지점의 집합일 수 있다.
예를 들어, 본 발명은 증폭 반응의 원시 데이터 세트를 보정하기 위하여 사용되는 경우, 원시 데이터 세트는 증폭 반응으로부터 직접 수득한 데이터 지점의 집합을 포함할 수 있다(도 2 참조).
변형된 데이터 세트는 원시 데이터 세트가 수학적으로 가공된 데이터 세트를 포함한다. 상기 변형된 데이터 세트는 보정된 데이터 세트 및 기울기 데이터 세트를 포함한다. 보정된 데이터 세트는 원시 데이터 세트의 보정을 통하여 수득한 데이터 지점의 집합이다.
본 명세서에서, 원시 데이터 세트와 변형된 데이터 세트는 상대적인 의미를 가질 수 있다. 예를 들어, 원시 데이터 세트는 어떠한 데이터의 변형이 되기 이전 데이터 세트를 의미할 수 있으며, 변형된 데이터 세트는 데이터의 변형(들) 후에 수득한 데이터 세트일 수 있다.
본 발명에서 사용된 데이터 세트는 신호-발생 반응에서 수득한 데이터 지점의 부분 또는 전부 또는 보정된 데이터 지점의 전부 또는 일부를 포함할 수 있다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 표적 핵산 분자의 증폭을 동반하는 반응이다. 더욱 구체적으로, 상기 표적 핵산 분자의 증폭을 동반하는 반응은 실시간 중합효소연쇄반응이다(실시간 PCR).
본 발명의 일 구현예에 따르면, 상기 신호값은 신호-발생 반응으로부터 발생된 신호값 이거나 또는 신호-발생 반응으로부터 발생된 신호의 수학적으로 변형된 값이다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 실시간 PCR 이고, 상기 신호값은 실시간 PCR로부터 발생된 신호의 수학적으로 변형된 값이고, 상기 수학적으로 변형된 값은 신호값을 사이클에 대하여 미분한 값이다(도 3 참조). 상기 사이클에 대하여 미분된 신호값은 원시 데이터 세트의 도함수를 포함한다.
도 2는 신호-발생 반응으로서 실시간 PCR을 통하여 수득한 데이터 세트의 구체적인 예를 나타내고 있으며, 실시간 PCR의 증폭 곡선에 해당된다. 도 2에 나타난 데이터 세트는 신호-발생 반응으로부터 직접적으로 수득한 원시 데이터 세트이다. 원시 데이터 세트는 실시간 PCR의 증폭 사이클 및 상기 증폭 사이클에서 측정된 신호 강도(예를들어 RFU)를 포함한다.
도 3은 원시 데이터 세트의 변형 중 하나를 나타내고 있는데, 이는 증폭 사이클에서 계산된 기울기에 대한 데이터 지점을 포함한다. 도 3의 곡선은 도 2의 원시 데이터 세트의 도함수에 해당한다.
증폭 반응을 나타내는 증폭 곡선은 신호값을 증폭 사이클에 대하여 플롯팅하여 수득할 수 있다. 본 명세서의 증폭 곡선은 데이터 세트를 플롯팅하여 수득한 곡선을 말한다.
보정전 증폭 곡선은 측정된 신호값 또는 이의 변형에 기초한, 각 증폭 사이클에서 측정된 신호값 또는 이의 변형된 값을 보여주는 보정전 증폭 곡선을 의미한다. 상기 보정전 증폭 곡선은 증폭 사이클에 대하여 측정된 신호 강도를 플롯팅하여 수득된다. 특히, 보정전 증폭 곡선은 원시 데이터 세트를 플롯팅하여 수득할 수 있다.
보정후 증폭곡선은 보정전 증폭 곡선을 기초로 보정된 증폭 곡선을 의미한다. 상기 보정된 증폭곡선은 보정된 데이터 세트를 플롯팅하여 수득할 수 있다.
본 발명에서 용어 “표적 핵산” 또는 “표적 핵산 분자” 는 검출 또는 정량하려는 관심 핵산 분자를 의미한다. 상기 표적 핵산 분자는 이중가닥 뿐만 아니라, 단일가닥의 서열을 모두 포함한다. 상기 표적 핵산 분자는 반응에서 새롭게 생성된 서열 뿐만 아니라, 초기부터 핵산 시료 내에 존재하는 서열을 포함한다.
상기 표적 핵산분자는 어떠한 DNA (gDNA, ,cDNA), RNA 분자 또는 이들의 교잡체 (chimera nucleic acid)를 모두 포함할 수 있다. 상기 핵산 분자는 이중-가닥 형태 또는 단일-가닥 형태일 수 있다. 출발물질로서 핵산이 이중 가닥인 경우, 두 가닥을 단일-가닥 또는 일부 단일-가닥 형태로 변형하는 것이 바람직하다. 가닥을 분리하는 알려진 방법은, 이에 제한되지 아니하며, 예를 들어, 열처리, 알칼리, 포름아마이드(formamide), 요소(urea) 및 글리콕살(glycoxal) 처리, 효소적 처리(예를 들어 헬리케이즈 활성), 및 결합 단백질이 있다. 예를 들어, 가닥 분리는 80°C 내지 105°C의 열처리를 통하여 이루어질 수 있다. 이러한 처리를 이룰 수 있는 일반적 방법은 Joseph Sambrook 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)에서 제공된다.
상기 표적 핵산 분자는 자연적으로 발생한 원핵, 진핵(예를 들어, 원생동물(protozoans) 및 기생동물(parasites), 곰팡이(fungi), 효모(yeast), 고등식물, 하등 동물, 포유류나 인간을 포함하는 고등 동물), 바이러스(예를 들어, 헤르페스 바이러스(Herpes viruses), HIV, 인플루엔자 바이러스(influenza virus), 엡스타인-바 바이러스(Epstein-Barr virus), 간염 바이러스(hepatitis virus), 폴리오바이러스(polio virus) 등) 또는 비로이드(viroid)의 핵산을 포함한다. 핵산 분자는 또한 재조합적으로 생산 또는 화학적으로 합성되었거나, 또는 합성될 수 있는 어떠한 핵산 분자도 포함한다. 따라서, 상기 핵산 서열은 자연에서 발견되거나, 발견되지 않는 것일 수 있다. 표적 핵산 분자는 알려진 또는 알려지지 않은 서열을 모두 포함한다.
본 발명의 용어 “시료”는 세포, 조직, 생물유래 유체(fluid) 또는 본 발명에 의하여 평가될 수 있는 기타 중간물질을 의미하며, 상기 시료는 예컨대, 바이러스, 박테리아, 조직, 세포, 혈액, 혈청, 혈장, 림프, 객담, 스왑(swap), 흡인액(aspirate), 기관지 폐포 세척액(bronchoalveolar lavage fluid), 젓, 소변, 분변, 안구액, 타액, 정액, 뇌 추출물, 척수액, 맹장, 비장 및 편도선 추출액, 양막액, 복수액 및 비생물학적 시료(예를 들어 식품 또는 물)이다. 상기 시료는 또한 화학반응의 액상, 고상의 물질일 수 있다. 추가로, 상기 시료는 생물학적 원료에서 추출한 자연 핵산과 합성된 핵산 분자를 모두 포함한다.
단계 (b): 각 사이클에 임계값 적용 단계(S20)
임계값이 각각의 사이클에 적용되어, 복수의 임계값들이 사이클들에 적용된다. 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다르다. 다시 말해, 복수의 임계값은 전체가 또는 일부가 서로 다른 값을 가진다.
본 발명의 가장 두드러진 특징은 복수의 임계값을 신호-발생 반응의 사이클들에 적용하며, 이때 상기 사이클 중 적어도 2개의 사이클들의 임계값은 서로 다르다는 것이다.
각 사이클에는 하나의 개별 임계값이 할당된다. 예를 들어, 신호-발생 반응의 사이클이 30개인 경우, 30개의 임계값이 개별적으로 할당된다. 상기 할당된 임계값은 같거나, 서로 다를 수 있다. 본 발명의 가장 현저한 특징은 상기 할당된 임계값 중 적어도 2 개는 서로 다르다는 것이다.
임계값의 적용은 임계값에 의해 결정되는 임계값 기준을 만족하는 데이터 지점을 선택하기 위하여 수행된다. 전통적으로, 신호-발생 반응에서의 신호값을 평가하기 위하여 하나의 임계값이 채택된다. 다시말해, 종래의 기술은 신호-발생 반응의 신호값을 평가하기 위하여 모든 사이클에 걸쳐 동일한 임계값을 사용하는 고정 임계값 방법을 도입하였다.
이와는 달리, 본 발명은 사이클 중 적어도 2개 사이클의 임계값은 서로 다른 가변 임계값을 사용하며, 이로서 시료를 분석한다.
사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다르다. 말하자면, 복수의 임계값들은 전체가 서로 다르거나, 또는 일부가 서로 다른 값을 가진다.
사이클에 대한 임계값을 플롯팅하여 얻은 그래프를 TC 그래프(threshold cycle graph)라고 한다. 이 TC 그래프는 임계값 세트를 플롯팅하여 얻어진다. 상기 임계값 세트는 임계값 지점의 집합이다. 임계값 지점이란 사이클과 상기 사이클에서의 임계값을 포함하는 좌표값을 말한다.
베이스라인을 구하기 위하여 데이터 세트에 적용되는 임계값은 베이스라인 임계값으로 명명되며, 사이클에 대하여 베이스라인 임계값들을 플롯팅하여 얻은 그래프를 BT 그래프라고 한다.
본 발명의 방법이 증폭 반응의 원시 데이터 세트를 보정하기 위하여 사용되는 경우(e.g., baselining), TC 그래프의 일종인 BT 그래프는 베이스라인 임계값을 사이클에 대하여 플롯팅하여 얻어진다(도 9 참조).
본 발명의 일 구현예에 따르면, 사이클들 중 적어도 2개 이상의 사이클들은 서로 다른 임계값을 가지며, 따라서, 시료 분석을 위한 정보를 월등히 정확하게 수득할 수 있다. 본 발명에서 이를 “가변 임계값(VT)” 방법이라 명명한다. 상기 VT 방법은 가변 베이스라인 임계값 방법과 가변 신호 임계값 방법을 모두 포함한다.
본 발명의 일 구현예에 따르면, 상기 임계값은 임계값-변화 사이클(threshold-changed cycle, TCC)을 기준으로, 상기 TCC 이전 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수와 상기 TCC 이후 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수가 서로 다르도록 결정된다.
본 발명의 일 구현예에 따르면, TCC에는 TCC 이전 사이클의 함수 또는 TCC 이후 사이클의 함수 중 어떤 것도 적용될 수 있다.
본 발명에서 용어 “임계값-변화 사이클” (TCC)은 임계값 변화의 패턴이 사이클을 넘어가면서 변경되는 기준 사이클을 의미한다. 특히, 본 발명에서 용어 “임계값-변화 사이클” (TCC)은 임계값이 변하는 기준 사이클을 의미한다. 상기 TCC는 하나일 수 있으며, 또는 복수일 수 있다. 본 발명에서 용어 “TTC 이전 사이클들”은 임계값-변화 사이클보다 앞의 사이클들을 의미하며, “TCC 이후 사이클들”은 임계값-변화 사이클보다 뒤의 사이클들을 의미한다.
TCC 이전 사이클들과 이들 TCC 이전 사이클들에 적용되는 임계값들에 의해 형성된 함수와 TCC 이후 사이클들과 이들 TCC 이후 사이클들에 적용되는 임계값들에 의해 형성된 함수가 서로 다르다는 것은 TCC 이전 사이클들과 TCC 이후 사이클들의 TC 그래프들이 서로 다른 패턴을 나타낸다는 것을 의미한다. 이의 예시는 도 9에 나타나 있으며, 섹션 II에서 후술한다.
상기 TCC는 한 반응에 1개 또는 그 이상 설정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 TCC의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40 또는 50개 일 수 있다. 상기 TCC의 수는 70, 60, 50, 40 또는 30 이하일 수 있다. 구체적으로, 상기 TCC의 수는 1-2 또는 1-3개일 수 있다.
본 발명의 일 구현예에 따르면, 사이클들은 적어도 하나의 TCC(임계값-변화 사이클)을 기준으로 적어도 2개의 다른 그룹으로 분류된다. 동일한 그룹에 분류된 사이클들은 연속적이며, 동일한 임계값을 가진다. 바로 인접한 서로 다른 그룹에 속하는 사이클들은 서로 다른 임계값을 가진다. 따라서, 떨어진 서로 다른 그룹에 속하는 사이클들은 서로 다르거나 동일한 임계값을 가진다. TCC는 TCC 앞 사이클 또는 뒷 사이클과 동일한 임계값을 가질 수 있다. TCC는 하나의 데이터 세트에서 한 개가 설정될 수 있으며, 이 경우 데이터 세트의 사이클들은 2 개의 그룹으로 분류된다. 택일적으로, TCC는 하나의 데이터 세트에서 2 개 이상 설정될 수 있으며, 이 경우 데이터 세트의 사이클들은 3 개 이상의 그룹으로 분류된다.
표현 “바로 인접한 서로 다른 그룹에 속하는 사이클들”의 예시는 다음과 같다. 신호-발생 반응은 총 40개 사이클을 포함하고, 그룹 1은 1-10 사이클, 그룹 2는 11-20 사이클, 그룹 3은 21-30사이클이며, 그룹 4는 31-40 사이클이다. 이 경우 바로 인접한 서로 다른 그룹은 그룹 1과 그룹 2, 그룹 2와 그룹 3 또는 그룹 3과 그룹 4이다. 떨어진 서로 다른 그룹은 그룹 1과 그룹 4, 그룹 1과 그룹 3 또는 그룹 2와 그룹 4이다.
본 발명의 일 구현예에 따르면, 상기 바로 인접한 서로 다른 그룹의 함수들은 서로 다르며, 상기 떨어진 서로 다른 그룹의 함수들은 서로 같거나 다를 수 있다.
본 발명의 일 구현예에 따르면, 상기 단계 (b)는 사이클들 중 적어도 하나의 사이클에 추가 임계값을 적용하는 단계를 더 포함한다.
본 발명의 일 구현예에 따르면, 추가적인 임계값 세트가 데이터 세트에 적용된다.
본 발명의 일 구현예에 따르면, 임계값 세트는 사이클들 중 적어도 2개 사이클에 적용되는 임계값이 서로 다른 가변 임계값 세트이다.
본 발명의 일 구현예에 따르면, 임계값 세트는 사이클들에 적용된 임계값들이 동일한 고정 임계값 세트이다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 가변 임계값 세트 및 고정 임계값 세트로 구성된 군에서 선택되는 적어도 2개의 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 적어도 하나의 고정 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 적어도 하나의 가변 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 적어도 하나의 고정 임계값 세트와 적어도 하나의 가변 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트의 각각은 대응하는 임계값 기준을 가진다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 데이터 세트 분석에 동시에 적용된다. 복수의 사이클이 임계값 기준을 만족하는 것으로 관찰되면, 이들 모두가 분석에 사용되거나, 또는 그 일부가 분석에 사용 될 수 있다.
본 발명의 일 구현예에 따르면, 다중 임계값 세트는 데이터 세트 분석에 순차적으로 적용된다. 첫번째로 적용된 임계값 세트의 임계값 기준을 만족하는 사이클이 없는 경우, 또다른 임계값 세트가 적용된다.
본 발명의 일 구현예에 따르면, 임계값 세트는 데이터 세트에 적용이 되며, 추가 임계값은 사이클들 중 적어도 하나의 사이클에 적용될 수 있다.
추가 임계값의 적용에 관하여는 후술될 섹션 II의 (3) 다중 임계값 세트 방법의 기재를 참조하여 설명될 수 있다.
단계 (c): 임계값 기준을 만족하는 사이클의 확인(S30)
각 사이클에 임계값을 적용한 다음, 각 임계값에 의해 결정된 임계값 기준(criterion)을 만족하는 하나 이상의 사이클이 확인된다.
본 발명에서 용어 “임계값 기준”은 일정한 특징을 가지는 사이클을 확인하기 위한 기준을 말하며, 상기 일정한 기준은 각 임계값에 의해 결정된다.
본 발명의 일 구현예에 따르면, 임계값 기준은 임계값과 관심 사이클에서의 신호값을 포함하는 어떤 참조(reference) 또는 기준(benchmark)일 수 있다.
본 발명의 일 구현예에 따르면, 상기 임계값 기준은 사이클의 신호값과 해당 사이클에 적용된 임계값 사이의 크기 관계일 수 있다.
본 발명의 일 구현예에 따르면, 상기 임계값 기준은 각 사이클의 신호값과 각 증폭 사이클의 임계값의 비교일 수 있다.
특히, 상기 임계값 기준은 신호값이 임계값 이상인지, 이하인지 여부로 정의된다.
본 발명의 일 구현예에 따르면, 상기 임계값 기준은 임계값과 동일하거나 임계값 보다 큰 신호값을 갖는 것이다.
예를 들어, 임계값이 1 내지 10 사이클에서는 5로 설정되며, 11 내지 20 사이클에서는 2로 설정되는 경우, 임계값 기준은 신호값이 1 내지 10 사이클에서는 5 이상이며, 11 내지 20 사이클에서는 2 이상인 것으로 정의될 수 있다.
단계 (d): 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계(S40)
시료는 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 분석된다.
본 발명의 일 구현예에 따르면, 상기 시료의 분석은 시료 내 표적 핵산분자의 존재를 결정하는 것이고, 상기 임계값 기준를 만족하는 하나 이상의 사이클의 확인은 증폭 곡선의 Ct 값을 결정하는 것이다. 이 경우, 임계값 기준은 임계값과 동일한 신호값을 가지는 것일 수 있다. 확인되는 사이클의 수는 하나일 수 있다.
본 발명의 방법이 표적 핵산 분자의 존재를 결정하기 위하여 실시간 PCR에서 Ct 값을 결정하는데 적용되는 경우, 본 발명의 방법은 다음과 같은 단계를 포함한다.
(a) 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 실시간 PCR의 각각의 사이클들에서의 신호값을 수득하는 단계;
(b) 각각의 사이클에 신호 임계값을 적용하여 복수의 신호 임계값들을 사이클에 적용하는 단계로서, 상기 사이클들 중 적어도 2개의 사이클들의 임계값은 서로 다른 것인 단계;
(c) 신호 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계;
(d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 실시간 PCR에서의 Ct 값을 결정하는 단계;
실시간 PCR에서의 Ct 값 결정에 적용하는 예는 실시예 3 및 도 11a 내지 11c에 예시되어 있다. 상기 임계값은 Ct 값 결정에 있어서는 신호 임계값으로 명명된다. Ct 값을 결정하는 본 방법은 VST(가변 신호 임계값) 방법으로 명명 된다.
실시예 3 및 도 11a 내지 11c에 언급된 바와 같이, 가변 신호 임계값을 사용하는 본 방법은 초기 노이즈 신호가 발생되는 초기 증폭 사이클의 데이터 지점들이 표적 핵산 분자가 존재하는 것으로 결정되는 오류를 제거할 수 있다. 더구나, 본 방법은 후기 증폭 사이클들에서 신호값이 증가하는 시작지점을 보다 정확하게 결정할 수 있으며, 이로 인하여 Ct 값 결정에 있어 오류를 제거할 수 있다.
본 발명의 일 구현예에 따르면, 시료의 분석은 시료에서 표적 핵산 분자의 존재를 결정하는 것이며, 임계값 기준을 만족하는 하나 이상의 사이클들을 확인하는 것은 실시간 PCR의 증폭곡선의 베이스라인 영역의 끝지점 사이클을 결정할 수 있다. 이 경우, 임계값 기준은 베이스라인 임계값과 동일한 신호값을 갖는 것이다. 확인되는 사이클의 수는 하나 일 수 있다.
본 방법이 표적 핵산 분자의 존재를 결정하기 위한 증폭곡선의 베이스라인 영역의 끝지점 사이클을 결정하는데 적용되는 경우 본 방법은 다음의 단계를 포함한다.
(a) 사이클들에서의 신호값을 제공하기 위하여, 시료를 사용하는 실시간 PCR의 각각의 사이클에서의 신호값을 수득하여, (i) 실시간 PCR의 증폭 사이클 및 (ii) 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
(b) 상기 원시 데이터 세트를 사용하여 베이스라인 영역의 시작지점 사이클 및 끝지점 사이클을 결정하여 베이스라인 영역을 결정하는 단계로서, 상기 끝지점 사이클은 다음의 단계에 의해 결정된다.
(b1) 베이스라인 임계값을 각 증폭 사이클에 적용하여, 복수의 베이스라인 임계값이 증폭 사이클들에 적용하는 단계로서, 사이클들 중 적어도 2개 사이클의 베이스라인 임계값은 서로 다른 것인 단계;
(b2) 각각의 베이스라인 임계값에 의해 결정되는 베이스라인 임계값 기준을 만족하는 하나 이상의 사이클을 확인하는 단계;
(b3) 상기 단계 (b2)에서 확인된 사이클 또는 사이클들을 사용하여 베이스라인 영역의 끝지점 사이클을 결정하는 단계;
(c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점으로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
(d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 상기 실시간 PCR의 증폭 사이클들 및 (ii) 상기 차감한 결과들을 포함하는 것인 단계.
더욱 구체적으로, 상기 단계 (b2)에서의 확인은 원시 데이터 세트를 사용하여 각각의 증폭 사이클에 대해 계산된 기울기와 각각의 증폭 사이클에 대한 베이스라인 임계값을 비교하여 수행된다.
섹션 II에 설명된 방법이 섹션 I의 대표적인 실시예이므로, 이들간 공통되는 내용은 명세서의 복잡성을 피하기 위하여 생략된다.
본 방법은 증가 패턴 (예를 들어 증폭 반응에 의한 신호 변화) 및 감소 패턴의 신호 변화를 포함하는 어떠한 패턴의 신호 변화에도 적용될 수 있다.
II. 증폭 반응의 원시 데이터 세트의 보정
본 발명의 다른 양태에 따르면, 본 발명은 다음의 단계를 포함하는 신호-발생 수단의 존재하에서 수행된 증폭반응의 원시 데이터 세트를 보정하는 방법을 제공한다.
(a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호-발생 수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
(b) 상기 원시 데이터 세트로부터 베이스라인 시작지점 사이클과 끝지점 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
(c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
(d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 상기 증폭 반응의 증폭 사이클들 및 (ii) 상기 차감한 결과들을 포함하는 것인 단계.
증폭반응의 원시 데이터 세트를 보정하는 방법인 본 방법은 시료를 분석하는 방법의 특정 구현예이므로, 이들간 공통되는 기재는 명세서의 복잡성을 피하기 위하여 생략된다.
본 발명의 발명자는 증폭 반응을 통하여 수득한 원시 데이터 세트를 보정하고, 이로서 증폭 반응에 대한 더욱 정확하고 신뢰성 있는 분석 결과를 정성적, 정량적으로 제공하는 새로운 방법에 대하여 연구하였다. 그 결과, 증폭 반응의 원시 데이터 세트를 보정하는 새로운 방법을 발견하였다. 특히, 본 발명의 새로운 방법에 의하여 베이스라인 영역의 끝지점 사이클이 결정될 수 있으며, 본 발명은 증폭 반응의 더욱 정확하고 신뢰성 있는 분석결과를 수득하는데 기여하는 것을 발견하였다.
도 1b는 본 발명의 증폭곡선 보정 방법의 일 구현예에 대한 흐름도를 나타낸다. 본 발명을 보다 상세히 설명하면 다음과 같다.
단계 (a): 원시 데이터 세트 수득(S110)
첫번째로, 원시 데이터 세트가 수득된다. 상기 원시 데이터 세트는 (i) 증폭 반응의 증폭 사이클들 및 (ii) 신호-발생 수단으로부터 얻은 증폭 사이클들에서의 신호값을 포함한다.
원시 데이터 세트는 신호-발생 수단의 존재하에 증폭 반응을 수행하여 수득된다. 단계 (a)는 택일적으로, 신호-발생 수단의 존재하에 증폭 반응을 수행하여 원시 데이터 세트를 수득하는 단계로 표현될 수 있다.
본 발명의 일 구현예에 따르면, 신호-발생 수단에 의한 신호는 표적 핵산 분자의 존재에 의존적으로 발생하며, 이의 강도(intensity)는 증폭 반응의 진행에 따라 증가하거나 감소한다.
본 발명의 일 구현예에 따르면, 증폭 반응은 표적 핵산 분자의 존재에 의존적으로 신호-발생 수단의 존재하에서 신호를 증폭하는 반응을 의미한다.
특히, 일련의 반응의 반복 또는 일정시간 간격을 갖는 반응의 반복의 경우, 용어 “사이클”은 상기 반복의 단위를 의미한다.
예를 들어, 중합효소 연쇄 반응(PCR)에서, 사이클은 표적 분자의 변성, 표적 분자와 프라이머의 어닐링(혼성화) 및 프라이머의 연장을 포함하는 반응 단위를 의미한다. 이 경우 반응의 반복의 증가가 상태 변화에 해당하며, 상기 반복 단위가 사이클에 해당한다. 다른 예로, LAMP (Loop-mediated isothermal amplification) 및 NASBA (Nucleic acid sequence-based amplification)와 같은 등온 핵산 증폭 반응의 경우에는 사이클은 시간 간격을 의미한다.
본 발명의 일 구현예에 따르면, 표적 핵산 분자가 시료 내에 존재하는 경우, 측정된 신호값(예를 들어, 신호 강도)은 증폭 사이클 수의 증가에 따라 증가하거나, 감소한다.
상기 원시 데이터 세트는 (i) 증폭 사이클들 및 (ii) 신호-발생 수단으로부터 얻은 증폭 사이클들에서의 신호값을 포함한다.
본 발명의 용어 “신호값”은 증폭 사이클에서 실제 측정된 신호값 또는 이의 변형을 의미한다. 상기 변형은 측정된 신호값(신호강도)의 수학적으로 가공된 값을 포함할 수 있다. 수학적으로 가공된 값은 예를 들어, 측정된 신호값의 대수값(logarithmic values) 또는 미분값(derivatives)을 포함할 수 있다. 상기 측정된 신호값의 미분값은 다중 미분을 포함할 수 있다.
전술한 바와 같이, 원시 데이터 세트를 수득하는 단계(S110)에서, 증폭 사이클 및 상기 증폭 사이클에서의 신호-발생 수단으로부터의 신호값을 포함하는 데이터 세트는 증폭 반응의 수행에 의해 얻어지며, 보정전 증폭곡선(첫번째 증폭 곡선)을 제공하기 위하여 플롯팅 된다.
(i) 증폭 사이클들 및 (ii) 상기 증폭 사이클들에서의 신호값들을 포함하는 원시 데이터 세트는 증폭반응에 의해 얻어지며, 도 2에 도시된 바와 같은 보정전 증폭곡선을 제공하기 위하여 플롯팅 된다. 도 2에서 RFU는 상대적 형광 단위(relative fluorescence unit)이다.
전술한 바와 같이, 증폭 곡선은 베이스라인 영역(baseline region), 지수 영역(exponential phase), 직선 영역(linear phase) 및 정체 영역(plateau phase)으로 구분된다.
베이스라인 영역에서는 초기 증폭 사이클 동안 형광 신호의 변화가 거의 없다. 지수 영역은 증폭 산물의 증가에 비례하여 형광 신호가 증가하는 것을 보여준다. 직선 영역에서는 형광신호의 증가가 실질적으로 감소하고, 실질적으로 선형으로 나타난다. 정체 영역에서는 증폭 산물과 형광 신호의 포화로 인하여, 형광 신호의 증가는 거의 없다.
베이스라인 영역의 신호의 대부분을 차지하는 백그라운드 신호가 시료 내 표적 핵산 분자의 양과 무관한 베이스라인 이동(drift)의 원인이 되므로, 베이스라인 영역의 결정 및 증폭 곡선의 보정이 이루어져야 한다.
단계 (b): 베이스라인 영역 결정(S120)
다음으로, 원시 데이터 세트를 이용한 베이스라인 영역의 시작지점 사이클 및 끝지점 사이클의 결정에 의해 베이스라인 영역이 결정된다.
베이스라인 영역 결정에 관한 “원시 데이터 세트의 이용”은 상기 원시 데이터 세트의 직접적, 간접적 사용을 모두 포함한다. 원시 데이터 세트의 간접적 이용은 원시 데이터 세트의 변형된 데이터 세트의 이용을 포함한다.
본 발명의 일 구현예에 따르면, 시작지점 사이클 및 끝지점 사이클은 원시 데이터 세트로부터 직접 결정되거나 또는 원시 데이터 세트가 수학적으로 가공된 데이터 세트로부터 결정될 수 있다.
예를 들어, 시작지점 사이클은 일정한 값 이상의 신호값을 가지는 첫번째 사이클로 결정하는 방법으로 원시 데이터 세트로부터 직접적으로 결정될 수 있다. 택일적으로, 끝지점 사이클은 일정한 값 이상의 기울기 값을 가지는 첫번째 사이클로 결정하는 방법으로 수학적으로 가공된 데이터 세트로부터 결정될 수 있다.
본 발명에서 용어 “시작지점 사이클”은 베이스라인 영역이 시작에 해당하는 사이클을 의미한다.
베이스라인의 시작지점 사이클(S)은 사용자에 의하여 임의로 결정될 수 있다. 일반적으로, 시작지점 사이클은 증폭 반응의 초기의 전형적인 변동 형태가 나타난 다음 사이클로 결정될 수 있다. 예를 들어, 시작지점 사이클은 1-10 사이클에서 결정될 수 있으며, 예를 들어 2-10, 2-8, 2-6 또는 2-4 사이클에서 결정될 수 있다.
택일적으로, 베이스라인 영역의 시작지점 사이클(S)은 일정 조건을 만족하는 사이클을 고려하여 결정될 수 있다.
예를 들어, 시작지점 사이클은 이전 사이클과 다른 기울기 경향을 보이는 첫번째 사이클로 결정될 수 있다. 상기 이전 사이클과 다른 기울기 경향을 보이는 사이클은 예를 들어, 이전 사이클보다 큰 기울기를 가지되, 초기 사이클의 기울기보다 10% 이하의 기울기를 가지는 사이클, 이전 사이클의 기울기가 음수일 때 양수의 기울기를 보이는 사이클 또는 이전 사이클의 기울기가 양수일 때 음수의 기울기를 가지는 사이클 일 수 있다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 신호값의 변화율이 계산되고, 이를 베이스라인의 시작지점 사이클 또는 끝지점 사이클 결정에 이용될 수 있다. 본 명세서에서 특별히 달리 표현하지 않는 한, 용어 “기울기”는 선택된 사이클에서 신호값의 변화율을 의미한다. 본 발명의 일 구현예에 따르면, 기울기는 사이클에 대하여 플롯팅 되어, 기울기 곡선을 제공한다.
본 발명에서 용어 “끝지점 사이클”은 베이스라인 영역의 종료에 해당하는 사이클을 의미한다. 베이스라인 끝지점 사이클(E)이 베이스라인 영역의 끝을 결정하므로, 베이스라인 끝지점 사이클은 신호 증폭이 발생하기 전 사이클에서 결정된다.
상기 베이스라인 영역의 끝지점 사이클은 원시 데이터 세트 또는 이의 변형된 데이터 세트로부터 결정될 수 있다.
베이스라인 영역의 끝지점 사이클은 다양한 방법을 통해 결정될 수 있다.
예를 들어, 끝지점 사이클은 2차 미분값이 최대가 되는 사이클로 결정될 수 있다. 또는, 데이터 세트의 기울기 곡선의 특징(위치 및 크기)이 끝지점 사이클 결정을 위해 분석될 수 있다. 예를 들어, 기울기 곡선은 지수 영역의 피크가 가장 클 것이므로, 베이스라인 영역의 끝지점 사이클은 지수 영역의 피크의 시작 사이클로 결정될 수 있다.
또한 끝지점 사이클은 이전 사이클들과 비교하여 변동계수(coefficient of variation)가 급격히 증가하는 것을 보이는 첫번째 사이클로 결정될 수 있다. 또는, 끝지점 사이클은 미리 지정한 값 이상의 변동계수를 가지는 사이클로 결정될 수 있다. 상기 변동계수는 표준편차를 산술평균으로 나눈 것으로 정의된다. 상기 변동계수는 변동계수가 산출되는 사이클과 이의 일정 개수 전, 후의 사이클을 선택하고, 이들 선택된 사이클의 표준 편차 및 산술평균을 계산하여 변동계수를 구할 수 있다. 상기 선택된 사이클의 일정 개수는 1, 2, 3, 4 또는 5 일 수 있으며, 바람직하게는 1 또는 2일 수 있다.
본 발명의 일 구현예에 따르면, 상기 끝지점 사이클은 상기 시작지점 사이클과 데이터 세트에서 가장 큰 기울기를 가지는 데이터 지점의 사이클 사이에서 결정된다.
본 발명의 일 구현예에 따르면, 상기 끝지점 사이클은 초과사이클(not-less-than cycle) 중에서 선택될 수 있다. 또는 상기 끝지점 사이클은 초과사이클 중에서 선택된 사이클을 끝지점 사이클 결정을 위한 기준사이클로 하여 결정될 수 있다.
본 발명에서 용어 “초과사이클(들)”(not-less-than cycle(s))은 베이스라인 임계값과 동일하거나 그 이상의 값을 가지는 데이터 지점의 사이클 또는 사이클들을 의미한다. 다시 말해, 초과사이클은 베이스라인 임계값 이상의 기울기를 가지는 사이클일 수 있다.
증폭곡선이 감소하는 패턴인 경우, 끝지점 사이클은 미만사이클(not-more-than cycle)들 중에서 선택된 사이클에 의해 결정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 끝지점 사이클은 교차지점사이클 중에서 선택된 사이클에 의해 결정될 수 있다. 또는 상기 끝지점 사이클은 교차지점사이클 중에서 선택된 사이클을 끝지점 사이클 결정을 위한 기준사이클로 하여 결정될 수 있다.
본 발명의 용어 “교차지점사이클”(cross-point cycle)은 베이스라인 임계값과 동일한 값을 가지는 데이터 지점의 사이클 또는 사이클들을 의미한다.
상기 교차지점사이클은 데이터 지점의 사이클들 중에서 결정될 수 있다.
상기 교차지점사이클은 베이스라인 임계값과 데이터 포인트들을 사용하여 수학적으로 계산된 사이클에 의해 결정될 수 있다.
본 발명의 일 구현예에 따르면, 끝지점 사이클은 베이스라인 임계값과 동일한 기울기를 가지는 데이터 지점(들)의 사이클, 베이스라인 임계값을 초과하는 기울기를 가지는 첫번째 데이터 지점(들)의 사이클 또는 베이스라인 임계값을 미만의 1차 기울기를 가지는 첫번째 데이터 지점(들)의 사이클에 의해 결정된다. 또는 특정 값의 기울기를 가지는 데이터 지점의 사이클 또는 특정 값을 초과하는 첫번째 데이터 지점의 사이클을 기준 사이클로 사용하여, 끝지점 사이클을 결정하기 위한 수학적 방정식에 대입하는 방법으로 끝지점 사이클이 결정될 수 있다. 상기 수학적 방정식의 예는 “끝지점 사이클 = 기준 사이클 - (1, 2, 3 또는 4 사이클)”; “끝지점 사이클 = 기준 사이클 + (1, 2, 3 또는 4 사이클)”; “끝지점 사이클 = [기준 사이클 x 0.9]”; 및 “끝지점 사이클 = [기준 사이클 - (베이스라인 임계값 x 0.1)]”를 포함한다. [X] 는 X값과 동일하거나 작은 가장 큰 정수를 표시하는 것이다.
상기 기울기와 함께 기재된 특정 값은 베이스라인 임계값(BT)이다. 베이스라인 임계값은 일반적으로 베이스라인을 결정하는데 사용되며, 본 발명에서는 베이스라인 영역의 끝지점 사이클을 결정하는데 사용된다. 상기 베이스라인 임계값은 측정 대상 및/또는 측정 장비에 따라 미리 결정(또는 입력)될 수 있으며, 또는 사용자에 의해 임의로 결정될 수 있다.
본 발명의 일 구현예에 따르면, 끝지점 사이클은 베이스라인 임계값과 기울기 곡선의 첫번째 교차지점의 사이클 또는 (상기) 첫번째 교차지점의 데이터 지점의 사이클과 가장 가까운 사이클에 의해 결정될 수 있다.
교차지점의 사이클 또는 교차지점의 데이터 지점의 사이클을 교차지점사이클이라 한다. 상기 교차지점사이클은 각 사이클에 대하여 베이스라인 임계값들을 플롯팅 하여 얻은 그래프(이하, 베이스라인 임계값 그래프 또는 BT 그래프라 함)와 기울기 곡선이 교차하는 지점의 사이클일 수 있다.
교차지점사이클의 수는 기울기 곡선 및/또는 BT 그래프의 모양에 따라 하나 또는 그 이상일 수 있다. 끝지점 사이클을 결정하기 위한 교차지점사이클은 예를 들어, 첫번째 교차지점사이클 또는 마지막 교차지점사이클과 같이 미리 결정된 특정 교차지점사이클에 의해 결정될 수 있다. 또는 교차지점사이클의 수가 2개 이상인 경우 가장 작은 사이클 수를 가지는 교차지점사이클이 끝지점 사이클로 결정될 수 있다.
교차지점의 사이클의 값은 정수가 아닐 수 있다. 실제 실험에서 사이클은 정수로 표시되므로, 끝지점 사이클은 정수인 것이 바람직하다. 따라서, 상기 교차지점 사이클을 초과하는 첫번째 정수 사이클(integral cycle) 또는 상기 첫번째 정수 사이클의 1, 2, 3 또는 4 번째 앞 또는 뒤의 사이클이 끝지점 사이클로 결정될 수 있다. 또는 끝지점 사이클은 교차지점사이클 미만의 가장 큰 정수 사이클 또는 상기 가장 큰 정수 사이클의 1, 2, 3 또는 4 번째 앞 또는 뒤의 사이클이 끝지점 사이클로 결정될 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 영역의 끝지점 사이클은 베이스라인 임계값과 기울기 곡선의 첫번째 교차지점의 사이클 또는 상기 첫번째 교차지점의 데이터 포인트의 사이클의 1, 2, 3 또는 4 사이클 앞 또는 뒤의 사이클에 의해 결정될 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값은 증폭영역이 나타나기 전의 초기 사이클 동안 백그라운드 신호에 의해 간섭받지 않도록 설정될 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값은 다양한 시료들의 분석 결과에 의해 선택된 적절한 값으로 설정될 수 있다.
도 3은 2 내지 4 사이클 중의 한 사이클이 시작지점 사이클로 결정되고, 베이스라인 임계값과 기울기 곡선간의 첫번째 교차지점 사이클이 끝지점 사이클로 결정된 베이스라인 영역을 나타낸다.
본 발명에서는, 상기 결정된 시작지점 사이클과 끝지점 사이클간의 상대적 거리가 일정 값 이하인 경우, 상기 상대적 거리는 적절한 베이스라인 영역을 확보하기 위하여 추가로 조정될 수 있다.
상기 상대적 거리는 끝지점 사이클에서 시작지점 사이클을 차감하여 계산될 수 있다. 상기 추가 조정이 필요한 상대적 거리의 일정 값은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10사이클 일 수 있으며, 바람직하게는 0, 1, 2, 3 또는 4 사이클 일 수 있다.
상기 추가 조정의 방법은 시작지점 사이클 또는 끝지점 사이클 또는 이 둘 사이클 모두를 상기 상대적 거리가 일정 값 이상이 되도록 임의로 설정하는 방법일 수 있다. 또는 상기 추가 조정 방법은 시작지점 사이클 또는 끝지점 사이클 중 하나를 전술한 시작지점 사이클 또는 끝지점 사이클 결정 방법에 따라 결정하고, 상기 결정된 시작 또는 끝 사이클로부터 상기 상대적 거리가 일정 값 이상이 되는 사이클 범위에서 다른 하나를 전술한 시작지점 사이클 또는 끝지점 사이클 결정 방법에 따라 결정하는 방법으로 결정할 수 있다.
본 발명의 일 구현예에 따르면, 데이터 지점의 기울기는 상기 데이터 지점의 사이클에서의 신호값의 변화를 나타낸다.
전술한 바와 같이, 본 발명의 증폭 반응은 사이클에 따라 신호감소를 보이는 반응을 포함한다.
상기 기울기는 미분법 등 다양한 방법으로 계산될 수 있다.
상기 기울기는 특정 사이클의 데이터 지점 및 상기 특정 사이클의 앞 및/또는 뒤의 사이클 또는 사이클들의 적어도 하나의 데이터 지점을 사용하여 최소 자승법 또는 LMS(least mean square) 알고리즘 등에 의해 계산될 수 있다.
이하 선형 회귀 분석의 대표적인 예로 최소 자승법(least square method)을 예를 들어 설명하나 본 발명은 이에 제한되지 않는다.
최소 자승법으로 기울기를 계산하는데 사용되는 데이터 지점들의 개수는 2개 이상일 수 있다. 예를 들어 최소 자승법으로 기울기를 계산하는데 사용되는 데이터들의 개수는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 이하일 수 있다. 특히 상기 데이터 지점의 개수는 2-3, 2-15, 3-11, 3-9, 3-7, 3-5 또는 5-7개일 수 있다.
최소 자승법으로 기울기를 계산하는데 사용되는 데이터 지점들은 인접한 사이클들이거나, 떨어져 있는 사이클들 일 수 있다.
예를 들어, 기울기는 특정 사이클의 데이터 지점 및 특정 사이클 이전 및/또는 이후 사이클에 대응하는 적어도 하나의 데이터 지점을 사용하여 최소 자승법에 의해 계산할 수 있다.
다른 예로는, 상기 기울기는 상기 데이터 세트 중 특정 사이클에 대응하는 데이터 지점, 특정 사이클 이전 사이클의 데이터 지점 및 특정 사이클 이후 사이클의 데이터 지점을 사용하여 최소 자승법에 의해 계산될 수 있다.
최소 자승법에 의하여 기울기 계산에 사용되는 데이터 지점의 수는 사이클에 따라 달라질 수 있다. 예를 들어, 데이터 지점의 기울기는 서로 인접한 2개 또는 3개의 데이터 지점을 사용하여 최소 자승법에 의해 계산될 수 있다. 예를 들어 첫번째 사이클 이전에는 사이클이 존재하지 않으므로, 첫번째 사이클의 기울기는 첫번째 사이클과 그 다음 사이클의 데이터 지점을 사용하여 최소 자승법에 의해 계산될 수 있다. 마지막 사이클 이후에는 사이클이 없으므로, 마지막 사이클의 기울기는 마지막 사이클과 인접한 바로 앞 사이클을 사용하여 최소 자승법에 의해 계산될 수 있다. 다른 사이클들에 대하여는 상기 기울기는 해당 사이클의 데이터 지점, 상기 해당 사이클의 바로 앞 사이클의 데이터 지점 및 상기 해당 사이클의 바로 뒤 사이클의 데이터 지점을 사용하여 최소 자승법에 의해 계산될 수 있다.
본 발명의 일 구현예에 따르면, 상기 최소 자승법은 아래 수학식 1로 표현될 수 있다.
수학식 1
Figure pct00001
여기서
Figure pct00002
I는 기울기를 구하려는 데이터 지점의 사이클이고, m은 I번째 사이클의 데이터 지점의 기울기이고, xi는 i번째 사이클의 사이클 번호이고, yi는 i번째 사이클에서 측정된 신호값이고, n은 a+b+1이고, a 및 b는 독립적으로 0 이상 10 이하의 정수이다. 단, a는 I 미만이며, a+b+1은 2 이상, 원시 데이터 세트의 데이터 지점 개수 이하이며, I+b는 원시 데이터 세트의 데이터 지점 개수 이하이다.
“a+b+1”은 I번째 사이클의 기울기를 계산하기 위하여 사용되는 데이터 지점의 개수며, LSMR(최소 자승법 범위; Least Squares Method Range)이라 칭한다. “a”는 I번째 사이클의 기울기를 계산하기 위하여 사용되는 데이터 지점 중 최소 사이클을 계산하기 위한 값이다. “b”는 최대 사이클을 계산하기 위한 값이다. 데이터 지점의 개수는 전제 반응에서 수득한 데이터 지점의 수를 의미하며, 증폭곡선의 최대 사이클값에 해당한다.
“a” 및 “b”는 독립적으로 0 내지 10의 정수이며, 바람직하게는 1 내지 5의 정수, 더욱 바람직하게는 1 내지 3의 정수일 수 있다.
상기 “a” 및 “b”는 동일한 값인 것이 유리하지만, 이들은 측정 대상, 측정 환경 및 사이클에 따라 달라질 수 있다.
상기 “a” 및 “b”는 I-a가 1 미만이거나, I+b가 전체 데이터 지점의 수를 초과하는 경우를 제외하고, 반응의 전제 데이터 지점에 동일하게 적용되는 것이 유리하다. 그러나, 신호값의 변화 측면에서 특별한 특성 또는 구간 특성을 보이는 특정 데이터 지점 또는 특정 범위의 데이터 지점들의 기울기는 다른 상기 “a” 및 “b”를 적용하여 계산할 수 있다.
비록 한 반응의 모든 데이터 지점들에 일정한 “a” 및 “b”가 적용되는 경우라도, I-a가 1 미만이거나, I+b가 전제 데이터 지점의 수를 초과하는 데이터 지점의 기울기를 계산하기 위하여는 “a” 및 “b”의 값은 다른 데이터 지점에 적용된 것과는 다른 값을 가질 수 있다. 예를 들어, I-a가 1 미만인 데이터 지점에서는 “a”는 “I-a”가 1이 되도록 조정될 수 있다. 이 경우 “b”는 일정하게 유지되거나, “a”의 조정에 따라 달라질 수 있다.
I+b가 전체 데이터 지점의 수를 초과하는 데이터 지점의 경우, “b”는 “I+b”가 전체 데이터 지점의 수와 동일하도록 조정될 수 있다. 이 경우 “a”는 일정하게 유지되거나, “b”의 조정에 따라 달라질 수 있다.
LSMR의 값, “a” 및 “b”는 측정 대상 및/또는 측정 장비에 따라 미리 결정(입력)될 수 있으며, 또는 사용자에 의해 임의로 결정될 수 있다.
도 3은 수학식 1로 표현되는 최소 자승법에 의해 계산된 기울기 곡선을 나타낸다. Y-축은 최소 자승법에 의해 각 증폭 사이클에서 계산된 형광 신호 강도(또는 상대적 형광 단위)의 기울기를 나타낸다.
베이스라인 영역 결정의 끝지점 사이클
전술한 바와 같이, 초기 사이클들에서 배경신호에 의한 간섭을 피하면서, 베이스라인 영역의 끝지점 사이클은 원시 데이터 세트로부터 각 증폭 사이클에서 계산된 기울기와 각 증폭 사이클에 대한 베이스라인 임계값을 비교하여 결정될 수 있다.
베이스라인 임계값은 베이스라인 영역의 끝지점 사이클을 결정하기 위하여 설정된다. 상기 베이스라인 임계값은 측정 대상 및/또는 측정 장비에 따라 미리 결정(입력)될 수 있으며, 또는 사용자에 의해 임의로 결정될 수 있다.
배경신호 또는 노이즈에 의한 증폭 분석의 오류는 끝지점 사이클의 잘못된 결정에 의한 것일 수 있다. 핵산 증폭 반응과 같은 증폭 반응에서, 비정상적인 형광 신호는 초기 사이클에서 빈번하게 나타나고, 기록된다. 비정상적인 형광신호의 검출은 표적 핵산 분자의 양을 반영하지 않는 형광 신호를 검출하는 것을 말한다.
베이스라인 임계값을 지나치게 낮게 설정되는 경우, 비정상적인 형광신호의 기울기 값이 끝지점 사이클 결정에 영향을 미칠 수 있다. 만일 이렇게 결정된 끝지점 사이클을 사용하여 베이스라인 영역이 결정이 되고, 증폭곡선이 보정되면, 보정된 증폭곡선은 위양성 결과를 나타내거나, 증폭산물의 양을 반영하지 않는다. 만일 끝지점 사이클 결정에 비정상적인 형광신호의 기울기 값이 관여되는 것을 피하기 위하여, 베이스라인 임계값이 지나치게 높게 설정되는 경우, 베이스라인 임계값과 기울기 곡선간의 교차가 초기 사이클이 아닌, 뒤쪽 사이클에서 일어나거나, 기울기 곡선의 피크가 낮은 경우에는 베이스라인 임계값과 기울기 곡선간의 교차가 일어나지 않을 수 있다.
본 발명의 일 구현예에 따르면, 전술한 문제를 해결하기 위하여, 특정 사이클 이전의 사이클은 끝지점 사이클 결정과정에서 제외시킨다. 또는 초기 배경신호가 끝지점 사이클 결정에 관여되지 않도록 베이스라인 임계값이 조정된다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값은 증폭 영역이 관찰되기 전의 초기 사이클들에서 배경신호에 의해 간섭받지 않도록 설정될 수 있다.
(1)특정 사이클 이전 사이클의 제외 방법
본 발명의 일 구현예에 따르면, 끝지점 사이클을 결정하기 위하여, 특정 사이클 이전의 사이클을 제외시키는 방법에서, 상기 특정 사이클은 최소 베이스라인 끝지점 사이클(MBEC, Minimum Baseline End-point Cycle)이다. 이 방법에서, 끝지점 사이클은 MBEC 이상의 사이클 중에서 결정된다. MBEC 적용에 의하여, 증폭 반응 초기 사이클 동안의 배경신호 또는 노이즈 신호에 의해 끝지점 사이클이 증폭영역의 시작보다 지나치게 떨어져 초기에 결정되는 것을 방지할 수 있다. 이와 같이 끝지점 사이클 결정에 MBEC를 설정하는 방법을 “MBEC방법”이라 한다.
상기 MBEC는 측정 기기, 개별 장비의 특성, 분석 시료, 시약의 영향에 의한 배경신호 또는 노이즈 신호의 패턴에 따라 다양하게 설정될 수 있다. MBEC는 배경신호 또는 노이즈 신호에 의한 오류가 방지되는 한, 설정 사이클 범위에 제한이 없다. 예를 들어 MBEC는 1 내지 50 사이클 범위에서 결정될 수 있으며, 바람직하게는 1-10, 1-15, 1-20, 1-25, 1-30, 1-35, 1-40, 5-10, 5-15, 5-20, 5-25, 5-30 사이클, 더욱 바람직하게는 5-15 사이클 범위에서 결정될 수 있다.
도 8a 및 도 8b에 도시된 바와 같이, 기울기 곡선의 두 개의 교차지점 사이클(E1, E2) 중에서, MBEC가 적용되면, MBEC를 초과하는 E2가 끝지점 사이클로 결정된다.
또한 MBEC를 초과하는 교차지점 사이클이 2개 이상인 경우, 더 작은 교차지점 사이클이 끝지점 사이클로 결정될 수 있다. 전술한 바와 같이, MBEC를 초과하는 가장 작은 교차지점 사이클의 값이 정수가 아닌 경우, 상기 가장 작은 교차지점 사이클을 초과하는 첫번째 정수 사이클값 또는 상기 첫번째 정수 사이클값의 1, 2, 3, 또는 4 사이클 앞 또는 뒤의 사이클이 끝지점 사이클로 결정될 수 있다. 또는 상기 가장 작은 교차지점 사이클값 미만의 가장 큰 정수 사이클 또는 상기 가장 큰 정수 사이클의 1, 2, 3 또는 4 사이클 앞 또는 뒤 사이클이 끝지점 사이클로 결정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 단계 (b)에서 베이스라인 영역의 끝지점 사이클은 최소 베이스라인 끝지점 사이클(minimum baseline end-point cycle, MBEC) 이상의 사이클에서 결정되며, 상기 MBEC는 증폭반응 전 또는 후에 결정될 수 있다.
MBEC가 결정된 후에는, 베이스라인 영역의 끝지점 사이클은 다양한 방법으로 쉽게 결정될 수 있다. 예를 들어, 교차지점 사이클(들) 또는 초과사이클(들)이 먼저 확인되고, 이들이 끝지점 사이클로 결정될 수 있는지 여부를 평가하기 위하여 MBEC와 비교한다. 또는 상기 끝지점 사이클을 단순히 MBEC 이후 사이클 중에서 결정할 수 있다.
만일 MBEC 이상의 교차지점 사이클이 없는 경우에는 기울기 곡선의 마지막 사이클이 끝지점 사이클로 결정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 베이스라인 영역의 끝지점 사이클은 다음의 단계를 포함하는 방법에 의해 결정될 수 있다.
(i) 각각의 증폭 사이클에 대해 계산된 기울기를 수득하는 단계;
(ii) 상기 기울기를 각각의 증폭 사이클에 대한 베이스라인 임계값과 비교하여 베이스라인 영역의 후보 끝지점 사이클을 수득하는 단계;
(iii) 상기 후보 끝지점 사이클을 MBEC와 비교하는 단계로서, 상기 후보 끝지점 사이클이 MBEC 보다 큰 경우 상기 후보 끝지점 사이클을 끝지점 사이클로 결정하는 단계.
후보 끝지점이 MBEC 미만인 경우, 상기 후보는 제거되고, 상기 단계 (i) 및 (ii) 가 새로운 후보 끝지점을 찾기 위하여 반복된다. 만일 MBEC 이상에서 후보 끝지점이 없는 경우, 기울기 곡선의 마지막 사이클이 끝지점 사이클로 결정될 수 있다.
본 발명의 MBEC방법은 바람직하지 않은 증폭반응 초기 사이클에서 끝지점 사이클이 결정되는 것을 방지하고, 결과적으로 보다 정확하게 증폭곡선을 보정할 수 있다.
(2) 가변 베이스라인 임계값 방법
본 발명의 일 구현예에 따르면, 베이스라인 임계값(BT)은 초기 배경신호가 끝지점 사이클 결정에 관여되지 않도록 조정된다.
전술한 바와 같이, 원시 데이터 세트를 이용하여 각 증폭 사이클에서 계산된 기울기와 각 증폭 사이클에 대한 베이스라인 임계값을 비교하여 끝지점 사이클을 결정하기 위하여, 고정 베이스라인 임계값(FBT)이 모든 증폭 반응의 사이클에 적용되는 것이 일반적이다.
본 발명에 의하면, 베이스라인 임계값은 각 사이클에 대하여 동일하거나, 또는 다르게 적용(할당) 될 수 있다. 또는 베이스라인 임계값은 모든 사이클에 있어 다르게 적용될 수 있다.
본 발명의 일 구현예에 따르면, 사이클들 중 적어도 2개의 사이클은 서로 다른 베이스라인 임계값을 가진다. 따라서, 복수의 베이스라인 임계값은 전체가 또는 일부가 서로 다르다. 복수의 베이스라인 임계값들 전체 또는 일부가 서로 다른 값을 가지도록 사이클에 적용되는 베이스라인 임계값을 조정하는 이 방법은 “가변 베이스라인 임계값”(VBT, variable baseline threshold) 방법이라고 명명한다.
본 발명의 일 구현예에 따르면, 상기 베이스라인 영역의 끝지점 사이클은 다음의 단계를 포함하는 방법에 의해 결정될 수 있다.
(b1) 각각의 증폭 사이클에 베이스라인 임계값을 적용하여 복수의 베이스라인 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2개의 사이클들의 베이스라인 임계값들은 서로 다른 것인 단계;
(b2) 베이스라인 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인 하는 단계; 및
(b3) 상기 단계 (b2)에서 확인된 사이클 또는 사이클들을 사용하여 베이스라인 영역의 끝지점 사이클을 결정하는 단계.
베이스라인 임계값을 사이클에 대하여 플롯팅하여 수득한 그래프를 BT 그래프라고 한다.
단일 베이스라인 임계값이 모든 사이클에 할당되는 경우, 상기 BT 그래프는 x축과 평행한 직선을 가진다.
VBT 방법에 의하면, 도 9에 표시된 것과 같이 서로 다른 베이스라인 임계값에 의한 다양한 BT 그래프를 수득할 수 있다.
본 발명의 일 구현예에 따르면, 증폭 반응의 사이클들은 적어도 2개의 서로 다른 그룹으로 분류되며, 동일한 그룹에 속하는 사이클들은 서로 동일한 베이스라인 임계값을 가지며, 서로 다른 그룹에 속하는 사이클들은 서로 다른 베이스라인 임계값을 가진다. 이 경우, BT 그래프는 x축과 평행한 직선을 가진다 (도 9의 (a) 및 (b) 참조).
본 발명의 일 구현예에 따르면, 전체 또는 일부 사이클의 베이스라인 임계값은 사이클 수 증가에 따라 일정 비율로 증가하거나, 감소할 수 있다. 이 경우, BT 그래프는 1차 함수 형태로 나타난다. (도 9의 (c), (d), (g) 및 (h) 참조).
본 발명의 일 구현예에 따르면, 전체 또는 일부 사이클의 베이스라인 임계값은 사이클 수 증가에 따라 변화하는 비율로 증가하거나, 감소할 수 있다. 이 경우, BT 그래프는 곡선 함수(예를 들어 2차 함수) 형태로 나타난다 (도 9의 (f) 참조).
본 발명의 일 구현예에 따르면, 증폭 사이클은 적어도 2개의 그룹으로 분류되며, 동일 그룹으로 분류된 사이클들은 동일한 베이스라인 임계값을 가지고, 다른 그룹으로 분류된 사이클들은 다른 베이스라인 임계값을 가진다. 이러한 경우, BT 그래프는 적어도 2개의 함수에 의해 표현될 수 있다. 상기 BT 그래프는 연속적 또는 불연속적으로 플롯팅 될 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값-변화 사이클 (BTCC)이 설정되고, 상기 설정된 BTCC의 전, 후 사이클들에는 서로 다른 베이스라인 임계값이 각각 적용된다.
본 발명에서 용어 “베이스라인 임계값-변화 사이클”(BTCC; baseline threshold-changed cycle)은 베이스라인 임계값의 변화 패턴이 사이클을 넘어가면서 변경되는 기준 사이클을 말한다. 특히 용어 “베이스라인 임계값-변화 사이클” (BTCC)은 베이스라인 임계값이 변화하는 기준 사이클을 의미한다. 상기 BTCC는 하나의 증폭 반응에 대하여 하나 또는 그 이상 설정될 수 있다. 상기 BTCC는 증폭반응 전, 증폭반응 중 또는 증폭반응 후에 설정될 수 있다.
본 발명의 일 구현예에 따르면, 증폭 사이클에 대한 베이스라인 임계값은 베이스라인 임계값-변화 사이클(BTCC)을 기준으로, 상기 BTCC 이전 사이클들과 이들에 적용되는 베이스라인 임계값들의 집합에 의해 형성된 제1함수와 상기 BTCC 이후 사이클들과 이들에 적용되는 베이스라인 임계값들의 집합에 의해 형성된 제2함수가 서로 다르도록 설정된다.
본 발명의 일 구현예에 따르면, BTCC에는 BTCC 이전 사이클에 대한 함수 또는 BTCC 이후 사이클에 대한 함수가 적용될 수 있다.
하나의 사이클에 하나의 베이스라인 임계값이 적용되므로, 사이클에 대한 베이스라인 임계값의 함수가 형성될 수 있다. 상기 함수는 전체 사이클에 대한 임계값들의 집합으로부터 형성될 수 있으며, 일부 사이클에 대한 임계값들의 집합으로부터 형성될 수 있다.
BTCC 이전 사이클들과 이들에 적용되는 베이스라인 임계값들의 집합에 의해 형성된 제1함수와 상기 BTCC 이후 사이클들과 이들에 적용되는 베이스라인 임계값들의 집합에 의해 형성된 제2함수가 서로 다르도록 설정된다는 것은 BTCC 이전 사이클의 제1함수의 BT 그래프와 BTCC 이후 사이클의 제2함수의 BT 그래프가 서로 다른 패턴을 보인다는 것을 의미한다.
예를 들어, BTCC 이전 사이클에 적용된 베이스라인 임계값은 1차 함수로 나타낼 수 있으며, BTCC 이후 사이클에 적용된 베이스라인 임계값은 상수 함수로 나타낼 수 있다(도 9의 (c) 참조). 도 9의 (c)에서, BTCC 이전 사이클에 적용된 베이스라인 임계값은 일정하게 감소하며, BTCC 이후 사이클에 적용된 베이스라인 임계값은 고정된 값을 가진다.
다른 예로, 두 개의 베이스라인 임계값을 가지는 경우, 첫번째 BTCC (BTCC1)이전 사이클에 대한 베이스라인 임계값과 두번째 BTCC (BTCC2) 이후 사이클에 대한 베이스라인 임계값은 상수함수로 나타내며, BTCC1과 BTCC2 사이의 베이스라인 임계값은 상기 두 개의 상수함수를 연결하는 1차 함수(도 9의 (d) 참조) 또는 2차 함수 또는 다른 함수(도 9의 (f) 참조)로 나타낼 수 있다.
BTCC 전의 BT 그래프와 BTCC 후의 BT 그래프는 BTCC를 기점으로 불연속적인 형태일 수 있다(도 9의 (e) 및 (h) 참조). 이러한 경우, BTCC를 BTCC 전 함수와 BTCC 후 함수에 각각 적용하면 서로 다른 함수값을 산출한다.
본 발명의 일 구현예에 따르면, 상기 증폭 사이클은 베이스라인 임계값-변화 사이클(BTCC)를 경계로 2 이상의 다른 그룹으로 분류된다. 이 경우, 동일한 그룹에 속하는 사이클들은 연속적이고, 동일한 그룹에 속하는 사이클들은 서로 동일한 베이스라인 임계값을 가지며, 바로 인접한 서로 다른 그룹에 속하는 사이클들은 서로 다른 베이스라인 임계값을 갖는다. 따라서, 이격된 다른 그룹에 분류된 사이클들은 서로 다르거나, 동일한 임계값을 가질 수 있다. BTCC의 베이스라인 임계값은 BTCC 이전 사이클 또는 이후 사이클의 베이스라인 임계값과 동일할 수 있다. BTCC는 하나의 데이터 세트에 하나가 설정될 수 있으며, 이 경우 데이터 세트의 사이클은 2개의 그룹으로 분류된다. 또는 상기 BTCC는 하나의 데이터 세트에 2개 이상 설정될 수 있으며, 이 경우 데이터 세트의 사이클은 3개 이상의 그룹으로 분류된다.
본 발명의 일 구현예에 따르면, 증폭 사이클은 적어도 1개 이상의 BTCC를 기준으로 적어도 2개의 다른 그룹으로 분류되며, 동일한 그룹에 속하는 사이클들은 동일한 베이스라인 임계값을 가질 수 있다. 비특이적 신호 또는 노이즈 신호가 심하게 나타나는 사이클 구간에는 높은 또는 낮은 베이스라인 임계값이 적용되어, 비특이적 또는 노이즈 신호가 정상 신호로 검출되지 않게 할 수 있다. 또한 그 외 다른 사이클 구간에는 일반적인 베이스라인 임계값이 적용되어 정상 신호를 검출 및 분석한다.
바람직하게는, 증폭 사이클들은 BTCC를 기준으로 서로 다른 2개의 그룹으로 분류되며, 동일한 그룹은 동일한 베이스라인 임계값을 가지며, 다른 그룹으로 분류된 그룹은 다른 베이스라인 임계값을 가진다. BTCC는 BTCC 앞 또는 뒤 사이클과 동일한 베이스라인 임계값을 가질 수 있다.
본 발명의 일 실시예에서는, 상기 VBT 방법을 초기 사이클이 비정상적으로 높은 기울기값을 가지는 증폭 결과에 사용하였다. BTCC를 설정한 후, 증폭곡선의 보정을 위하여, 높은 베이스라인 임계값을 BTCC 이전 사이클에 적용하고, 낮은 베이스라인 임계값을 BTCC 이후 사이클에 적용하였다. VBT를 적용한 경우가 더 정확하게 증폭곡선을 보정할 수 있는 것을 확인하였다.
상기 BTCC는 측정기기, 시료, 시약의 특성에 영향을 받는 배경신호 또는 노이즈 신호의 패턴에 따라 달라질 수 있다. BTCC는 배경신호 또는 노이즈 신호에 의한 오류가 방지되는 한, 그 결정 범위에 제한이 없다. 예를 들어, BTCC는 70, 60, 50, 40, 30, 29, 38, 27, 26, 25, 24, 23, 22, 21, 20 또는 15 사이클 이하일 수 있다. 상기 BTCC 사이클은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35 또는 40 사이클 이상일 수 있다. BTCC는 1 내지 70사이클 범위 내에서 결정될 수 있으며, 바람직한 사이클 범위는 1-60, 1-50, 1-40, 1-30, 5-60, 5-50, 5-40, 10-40, 10-35, 15-35, 15-30, 15-25 이며, 더욱 바람직하게는 15-25 사이클이다.
도 10a 및 도 10b에 도시된 바와 같이, BTCC를 기준으로 제1 BT 그래프(1st BT) 와 제2 BT 그래프 (2nd BT)로 표시되는 2개의 함수가 상수 함수이면, 기울기 곡선과의 첫번째 교차지점 사이클이 베이스라인 영역의 끝지점 사이클(E2)로 결정될 수 있다.
MBEC 방법과 VBT 방법은 선택적으로 적용될 수 있다. 또한 상기 두 방법이 모두 증폭곡선의 보정에 적용될 수 있다.
실시예 2에서는 인플루엔자 A 바이러스(Flu A)의 핵산을 수득하고, 증폭하여 제1 증폭곡선을 확보하였다. 베이스라인 영역의 끝지점 사이클을 MBEC 방법 또는 VBT 방법을 각각 적용하거나, 둘 다 적용하지 않고 각각 수득하였다. 이후, 수득한 끝지점 사이클로 결정된 베이스라인 영역을 사용하여 제1 증폭곡선을 보정하였다. 그 결과, MBEC 방법 또는 VBT 방법을 적용한 보정은 상기 방법을 적용하지 않은 보정에 비하여 증폭산물의 양을 더 정확하게 반영하는 보정된 증폭곡선을 제공할 수 있는 것을 확인하였다.
(3) 다중 베이스라인 임계값 세트 방법
본 발명의 일 구현예에 따르면, 추가적인 베이스라인 임계값이 사이클들 중 적어도 하나의 사이클에 적용될 수 있다.
본 발명의 일 구현예에 따르면, 추가적인 베이스라인 임계값 세트가 데이터 세트에 적용될 수 있다.
일반적인 핵산 증폭에서는, 표적 핵산 분자가 없는 경우 증폭곡선은 편평한 모양(flat shape) 이거나 비특이적 결합 및 증폭에 의하여 조금 증가하는 패턴이다. 가능성이 낮지만, 비정상적인 음성 증폭 반응은 사이클의 증가에 따라 신호값의 감소를 보인다(즉, 음성 기울기 패턴).
이러한 경우, 베이스라인 영역 결정 및 원시 데이터 세트 보정에 있어서 오류가 발생하기 쉬운데 이는 베이스라인 임계값 세트와 증폭 곡선(또는 기울기 곡선) 사이의 교차지점이 발생하지 않고, 따라서, 베이스라인 영역의 끝지점 사이클이 설정되지 않기 때문이다. 본 발명의 추가 베이스라인 임계값 세트의 적용은 이러한 오류가 있는 분석을 방지할 수 있다. 예를들어, 추가 베이스라인 임계값 세트의 베이스라인 임계값이 음수로 적용될 수 있으며, 따라서, 음수의 기울기 값을 가지는 베이스라인 영역의 끝지점 사이클을 결정할 수 있다.
본 발명의 일 구현예에 따르면, 적어도 2개의 임계값 세트가 데이터 세트에 적용된다. 증폭곡선 분석에서 오류 방지를 위하여, 적어도 2개의 임계값 세트를 데이터 세트에 적용하는 방법은 “다중 베이스라인 임계값 세트” 방법으로 명명된다. 베이스라인 임계값 세트는 베이스라인 임계값 지점의 집합이다. 상기 베이스라인 임계값 지점은 사이클과 상기 사이클에서의 베이스라인 임계값을 포함하는 좌표값을 말한다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값 세트는 사이클 중 적어도 2개의 사이클에 적용된 베이스라인 임계값이 서로 다른 가변 베이스라인 임계값 세트일 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값 세트는 모든 사이클에 적용되는 베이스라인 임계값이 동일한 고정 베이스라인 임계값 세트일 수 있다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 가변 베이스라인 임계값 세트와 고정 베이스라인 임계값을 포함하는 그룹에서 선택된 적어도 2개의 베이스라인 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 적어도 하나의 고정 베이스라인 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 적어도 하나의 가변 베이스라인 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 적어도 하나의 고정 베이스라인 임계값 세트 및 적어도 하나의 가변 베이스라인 임계값 세트를 포함한다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 적어도 2개의 베이스라인 임계값 세트를 포함하며, 상기 적어도 2개의 베이스라인 임계값 세트는 모두 고정 베이스라인 임계값 세트이다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트의 각 베이스라인 임계값 세트는 대응하는 임계값 기준을 가질 수 있다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 동시에 분석대상 데이터 세트에 적용될 수 있다. 임계값 기준을 만족하는 복수의 사이클이 관찰되는 경우, 모든 또는 그 일부가 분석에 사용될 수 있다.
본 발명의 일 구현예에 따르면, 다중 베이스라인 임계값 세트는 순차적으로 분석대상 데이터 세트에 적용될 수 있다. 첫번째로 적용된 베이스라인 임계값 세트의 임계값 기준을 만족하는 사이클이 없는 경우, 또다른 베이스라인 임계값 세트가 적용된다.
본 발명의 일 구현예에 따르면, 베이스라인 임계값 세트가 데이터 세트에 적용되고, 추가적인 베이스라인 임계값 세트가 사이클 중 적어도 하나의 사이클에 적용될 수 있다.
본 발명의 일 구현예에 따르면, 베이스라인 영역의 끝지점 사이클은 다음의 단계를 포함하는 방법에 의해 결정될 수 있다.
(a) 각 사이클에 베이스라인 임계값을 적용하는 단계;
(b) 적어도 하나의 사이클에 추가 베이스라인 임계값을 적용하는 단계;
(c) 각 베이스라인 임계값에 의해 결정된 베이스라인 임계값 기준을 만족하는 하나 이상의 사이클을 확인하는 단계;
(d) 상기 단계 (c)에서 확인된 사이클을 사용하여 베이스라인 영역의 끝지점 사이클을 결정하는 단계;
단계 (a)의 베이스라인 임계값은 정상적인 증폭결과의 끝지점 결정을 위하여 적용된다.
단계 (b)의 추가적인 베이스라인 임계값은 단계 (a)의 베이스라인 임계값에 의해 결정된 주 임계값 기준(main threshold criterion) 을 만족시키는 사이클이 없는 비정상적인 증폭 결과에 적용된다.
더 구체적으로, 임계값 기준을 만족시키는 사이클은 다음의 방법으로 확인된다. : n 번째 사이클의 차감 결과의 부호가 (n-1) 번째 사이클의 차감 결과의 부호와 서로 다른 경우, n 번째 사이클은 임계값 기준을 만족한 것이다. 상기 차감 결과는 신호값에서 임계값을 뺀 결과이다.
끝지점 사이클을 결정하기 위하여, 다양한 데이터 세트들이 사용될 수 있다. 적절한 임계값 및 결정 방법은 데이터 세트의 종류에 따라 선택될 수 있다. 당업자는 본 발명의 방법을 전술한 기울기 데이터 세트에 대한 구현예 및 실시예의 지시 및 방향에 기초하여 다양한 데이터 세트의 분석에 이용할 수 있다.
단계 (c): 최적라인 함수 산출(S130)
베이스라인 영역의 결정 다음으로 베이스라인 영역의 최적라인 함수가 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 산출된다.
최적라인 함수는 데이터에 나타난 경향을 가장 잘 나타내는 함수를 의미한다. 최적라인은 상기 최적라인 함수를 플롯팅하여 얻은 그래프를 의미한다.
최적라인 함수는 베이스라인 영역 내 적어도 2개의 데이터 지점들을 사용하여 구할 수 있다. 예를 들어, 베이스라인 영역의 일부 또는 모든 지역의 데이터 포인트를 사용하여 구할 수 있다.
최적라인 함수는 여러 방법으로 구해질 수 있다. 예를 들어, 베이스라인 영역내의 데이터 지점을 사용한 선형회귀분석(linear regression analysis) 또는 LMS(least mean square) 알고리즘에 의해 구해질 수 있다.
특히, 선형 회귀선의 1차 방정식, “y = mx+b” 으로 표시되는 최적라인 함수는 시작지점 사이클부터 끝지점 사이클까지의 데이터 지점을 사용하여 구해질 수 있다.
도 4a에 도시된 바와 같이, 최적라인 기울기인 “m” 및 최적라인의 y축 절편인 “b”은 다음의 수학식 2 및 3에 의해 계산될 수 있다.
수학식 2
Figure pct00003
수학식 3
Figure pct00004
상기에서
Figure pct00005
이고, m 은 최적라인의 기울기이고, b는 y축 절편이고, xi 는 I 번째 사이클의 사이클 번호이고, yi 는 i번째 사이클에서 측정된 신호값이고, S는 베이스라인 영역의 시작지점 사이클이고, E 는 베이스라인 영역의 끝지점 사이클이고, n은 E-S+1이다.
단계 (d): 보정된 데이터 세트 수득(S140)
보정된 데이터 세트는 원시 데이터 세트의 신호값에서 최적신호 함수의 값을 차감하여 수득된다. 상기 수득한 데이터 세트는 (i) 증폭 반응의 증폭 신호값 및 (ii) 차감된 결과들을 포함한다.
본 발명의 일 구현예에 따르면, 상기 단계 (a)는 제1증폭곡선을 수득하기 위하여 원시 데이터 세트를 플롯팅 하는 단계를 추가로 포함하며, 상기 단계 (d)는 보정된 증폭 곡선을 수득하기 위하여 보정된 데이터 세트를 플롯팅 하는 단계를 추가로 포함한다.
보정된 증폭 곡선(제2증폭곡선)은 보정전 증폭곡선 (제1증폭곡선)에서 최적라인을 차감하여 수득할 수 있다. 도 5에 도시된 바와 같이, 원시 데이터 세트의 신호값에서 최적라인 함수로부터 계산된 값을 차감하여 보정된 데이터 세트 및 보정된 증폭곡선을 수득한다.
본 발명의 일 구현예에 따르면, 원시 데이터 세트의 보정은 최적라인 함수에서 산출된 값을 베이스라인 영역 뿐 만 아니라 베이스라인 영역 이 아닌 그 외 영역에서도 차감하는 것을 포함한다. 예를 들면, 모든 사이클에 대하여 원시 데이터 세트를 수득하고, 원시 데이터 세트의 신호값에서 최적라인 함수의 값을 차감하여 보정된 데이터 세트를 구하고, 이어 상기 보정된 데이터 세트를 플롯팅하여 보정된 증폭곡선을 수득할 수 있다. 또는 베이스라인 영역에 속하는 사이클의 원시 데이터 세트를 수득하여, 최적라인 함수 및 보정된 데이터 세트를 얻고, 다른 사이클들에 대하여는 사이클에서 신호 발생시 마다 원시 데이터 세트를 수득하고, 상기 원시 데이터 세트에서 최적라인 함수에 의한 해당 사이클에 대응하는 값을 차감하여 보정된 데이터 세트를 수득하고, 이를 플롯팅하여 보정된 증폭곡선을 얻을 수 있다.
III. 기록매체, 장치 및 컴퓨터 프로그램
이하 기재된 본 발명의 기록매체, 장치 및 컴퓨터 프로그램은 본 발명의 방법을 컴퓨터에서 실행하기 위한 것이므로, 이들간 공통되는 기재는 명세서의 복잡성을 피하기 위하여 생략된다.
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 시료를 분석하는 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
(a) 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하는 단계;
(b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
(c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
(d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 시료 내 분석물질의 존재에 의존적으로 신호를 발생시킨다. 이때 상기 분석물질은 표적 핵산 분자이고, 상기 신호-발생 반응은 표적 핵산분자의 증폭이 동반되거나 또는 동반 되지 않는 반응이며, 상기 표적 핵산분자의 증폭이 동반되는 반응은 실시간 PCR (real-time polymerase chain reaction)일 수 있다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 실시간 PCR이며, 신호값은 상기 실시간 PCR에 의해 발생된 신호값이 수학적으로 변형된 값이며, 상기 수학적으로 변형된 값은 사이클에 대해 신호값을 미분한 값이다.
본 발명의 일 구현예에 따르면, 상기 임계값은 임계값-변화 사이클(threshold-changed cycle, TCC)을 기준으로, 상기 TCC 이전 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수와 상기 TCC 이후 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수가 서로 다르도록 결정된다.
본 발명의 다른 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 신호-발생 수단의 존재 하에서 수행된 증폭 반응으로부터 수득한 원시 데이터 세트(raw data set)를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
(a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호-발생 수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
(b) 상기 원시 데이터 세트로부터 베이스라인 시작지점 사이클과 끝지점 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
(c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
(d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 증폭 반응의 증폭 사이클들 및 (ii) 상기 차감한 결과들을 포함하는 것인 단계.
본 발명의 일 구현예에 따르면, 상기 단계 (b)에서 베이스라인 영역의 끝지점 사이클은 다음의 단계를 포함하는 방법에 의해 결정된다.
(b1) 각각의 증폭 사이클에 베이스라인 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2개의 사이클들의 베이스라인 임계값들은 서로 다른 것인 단계; (b2) 베이스라인 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인 하는 단계; 및 (b3) 상기 단계 (b2)에서 확인된 사이클 또는 사이클들을 사용하여 베이스라인 영역의 끝지점 사이클을 결정하는 단계.
본 발명의 일 구현예에 따르면, 상기 단계 (b1)의 기울기는 특정 사이클에서의 데이터 지점 및 상기 특정 사이클의 이전 및/또는 이후의 사이클 또는 사이클들의 적어도 하나의 데이터 지점을 이용한 최소 자승법에 의해 계산될 수 있다.
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 시료를 분석하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공한다.
(a) 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하는 단계;
(b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
(c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
(d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
본 발명의 일 구현예에 의하면, 상기 신호-발생 반응은 시료 내 분석물질의 존재에 의존적으로 신호를 발생시키며, 상기 분석 물질은 표적 핵산분자이며, 상기 신호-발생 반응은 표적 핵산분자의 증폭이 동반되거나 또는 동반 되지 않는 반응이며, 상기 표적 핵산분자의 증폭이 동반되는 반응은 실시간 PCR (real-time polymerase chain reaction)이다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 실시간 PCR이며, 신호값은 상기 실시간 PCR에 의해 발생된 신호값이 수학적으로 변형된 값이며, 상기 수학적으로 변형된 값은 사이클에 대해 신호값을 미분한 값이다.
본 발명의 일 구현예에 따르면, 상기 임계값은 임계값-변화 사이클(threshold-changed cycle, TCC)을 기준으로, 상기 TCC 이전 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수와 상기 TCC 이후 사이클들 및 이들에 적용되는 임계값들의 집합에 의해 형성된 함수가 서로 다르도록 결정된다.
본 발명의 다른 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 신호-발생 수단의 존재 하에서 수행된 증폭 반응으로부터 얻은 원시 데이터 세트를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공한다.
(a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호-발생 수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
(b) 상기 원시 데이터 세트로부터 베이스라인 시작지점 사이클과 끝지점 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
(c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
(d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 증폭 반응의 증폭 사이클들 및 (ii) 상기 차감한 결과들을 포함하는 것인 단계.
본 발명의 일 구현예에 따르면, 상기 신호-발생 수단의 존재 하에서 수행된 증폭 반응으로부터 얻은 원시 데이터 세트를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공한다.
본 발명의 일 구현예에 따르면, 상기 단계 (b)에서 베이스라인 영역의 끝지점 사이클은 다음의 단계를 포함하는 방법에 의해 결정된다.
(b1) 각각의 증폭 사이클에 베이스라인 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2개의 사이클들의 베이스라인 임계값들은 서로 다른 것인 단계; (b2) 베이스라인 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및 (b3) 상기 단계 (b2)에서 확인된 사이클 또는 사이클들을 사용하여 베이스라인 영역의 끝지점 사이클을 결정하는 단계.
본 발명의 일 구현예에 따르면, 상기 단계 (b1)의 기울기는 특정 사이클에서의 데이터 지점 및 상기 특정 사이클의 이전 및/또는 이후의 사이클 또는 사이클들의 적어도 하나의 데이터 지점을 이용한 최소 자승법에 의해 계산될 수 있다.
상기 프로그램 지시들은, 프로세서에 의해 수행되는 경우, 프로세서가 상기 기술한 본 발명의 방법을 수행하도록 운영될 수 있다. 시료 분석 방법을 수행하기 위한 프로그램 지시들은 사이클들에서의 신호값들을 제공하기 위하여, 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하는 지시; 각각의 사이클에 임계값을 적용하고, 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클을 확인하는 지시; 및 상기 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 지시를 포함할 수 있다. 증폭반응으로부터 얻은 원시 데이터 세트를 보정하는 방법을 수행하기 위한 프로그램 지시들은 원시 데이터 세트를 수득하는 지시; 상기 원시 데이터 세트로부터 베이스라인 시작지점 사이클과 끝지점 사이클을 결정하여 베이스라인 영역을 결정하고, 상기 베이스라인 영역의 최적라인 함수를 산출하는 지시 및 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 지시를 포함할 수 있다.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터, 네트워크 부착 컴퓨터 또는 실시간 PCR장치와 같은 데이터 수득 장치에 있는 프로세서 일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
데이터 지점(예를 들어, 신호 강도 및 증폭 사이클)은 다양한 방식으로 수집될 수 있다. 예를 들어, 데이터 지점은 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 데이터 지점은 수득되는 즉시 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게는, 데이터 세트는, 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
데이터 지점들이 수신되거나 얻어지고 난 후, 시료를 분석하거나, 증폭 반응의 보정된 데이터 세트를 얻기 위한 데이터 분석 프로세스가 진행된다. 예를 들어, 시료 분석을 위한 프로세서는 각 임계값에 의해 결정된 임계값 기준을 만족하는 하나 또는 그 이상의 사이클을 확인하기 위하여 수신된 데이터 지점들을 분석한다. 증폭 반응의 보정된 데이터 세트를 얻기 위한 프로세서는 베이스라인 영역을 결정하고, 베이스라인 영역의 최적라인 함수를 산출하고, 원시 데이터 세트의 신호값으로부터 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하기 위하여 수신된 데이터 지점들을 분석한다.
본 발명을 실행하기 위한 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는 비록 포터블 HDD, USB, 플로피 디스크, CD 및 DVD 와 같은 소프트웨어 기록 매체로 제공될 수 있지만, 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 다운로드 및 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 시료를 분석하는 장치를 제공한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 신호-발생 수단의 존재하에서 수행된 증폭반응의 원시 데이터 세트를 보정하는 장치를 제공한다.
본 발명의 일 구현예에 따르면, 상기 장치는 시료 및 신호-발생 수단을 수용할 수 있는 반응용기, 상기 반응용기의 온도를 조절하는 온도조절 수단 및/또는 증폭 사이클에서의 신호를 검출하는 검출기를 추가적으로 포함할 수 있다.
본 발명의 일 구현예에 따르면, 상기 컴퓨터 프로세서는 사이클들에서의 신호값을 수신할 뿐만 아니라, 시료를 분석하거나, 증폭반응의 보정된 데이터 세트를 얻는다.
상기 프로세서는 하나의 프로세서가 다음의 두 퍼포먼스를 수행하도록 구축될 수 있다 : 데이터 지점의 수신 및 시료의 분석이나 보정된 데이터 세트를 수득.
또는, 프로세서 유닛은 두 개의 프로세서가 상기 두 개의 퍼포먼스를 각각 실행하도록 구축될 수 있다.
본 발명의 일 구현예에 따르면, 프로세서는 표적 분석물질(예컨대, 표적 핵산분자)의 검출에 이용되는 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨 하여 구현시킬 수 있다.
도 6은 증폭 반응의 원시 데이터 세트를 보정하기 위한 본 발명의 일 구현예에 최적화 된 실시간 PCR 시스템을 도시하고 있다. 상기 시스템은 실시간 PCR 증폭을 수행하기 위한 실시간 PCR 장치(110), 원시 데이터 세트를 보정하고, 보정된 결과를 디스플레이 하기 위하여 케이블(130)을 통하여 상기 실시간 PCR 장치(110)에 연결된 로직 시스템인 컴퓨터 시스템(120)을 포함한다. 상기 컴퓨터 시스템(120)은 보정 결과를 사용자의 요구에 따라 그래프, 테이블 및 워드 등 다양한 형태로 디스플레이 할 수 있다. 상기 컴퓨터 시스템은 증폭 반응의 증폭곡선을 보정하기 위한 본 발명의 방법을 수행하기 위한, 컴퓨터로 읽을 수 있는 기록매체를 포함한다. 상기 실시간 PCR 장치(110) 및 상기 컴퓨터 시스템(120)은 시스템에 통합될 수 있다.
증폭 곡선에 관한 데이터 지점들 (예를 들어, 신호 강도 및 증폭 사이클)은 다양한 방법으로 수집될 수 있다. 예를 들어, 데이터 지점은 실시간 PCR 장치(110)의 데이터 수집장치 내 프로세서에 의해 수신되고 수집될 수 있다. 데이터 세트는 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다.
유사하게는, 데이터 세트는, 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 미디어를 통하여 실시간 PCR 장치 (110)로부터 데스크탑 컴퓨터 시스템과 같은 컴퓨터 시스템(120)에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
데이터 세트가 수신되고 얻어진 다음, 데이터 분석 프로세서는 보정된 증폭 곡선을 반영하는 데이터 세트를 준비한다.
증폭 곡선의 보정은 컴퓨터 시스템(120)에 인스톨되어 있는 어플리케이션(즉, 프로그램)에 의해 수행될 수 있다. 택일적으로, 증폭 곡선의 보정은 컴퓨터 시스템(120)의 운영 시스템에서 상기 어플리케이션이 운영될 수 있는 컴퓨터 시스템(120)에 어플리케이션 스토어 서버 또는 어플리케이션 공급자 서버를 통하여 직접 설치된 어플리케이션에 의해 만들어질 수 있다. 상기 운영 시스템은 Window, Macintosh 및 스마트 폰이나, 테블릿 PCT 같은 모바일 단말기에 설치되는 iOS 및 안드로이드 같은 모바일 운영 시스템을 포함한다.
상기 기술한 바와 같이, 본 발명의 증폭 곡선 보정 방법은 공급자가 설치한 또는 사용자가 직접 설치한 어플리케이션(즉, 프로그램)에 의해 컴퓨터 시스템(120)에 구현될 수 있으며, 컴퓨터로 읽을 수 있는 기록매체(122)에 기록될 수 있다.
본 발명의 증폭 곡선을 보정하기 위한 방법이 구현된 컴퓨터 프로그램(124)은 상기 보정을 위한 모든 기능을 구현할 수 있다. 상기 컴퓨터 프로그램(124)은 본 발명의 방법을 실행하도록 구현된 컴퓨터로 읽을 수 있는 기록매체에 저장된 프로그램 지시를 포함한 프로그램일 수 있다.
컴퓨터 프로그램(124)는 C, C++, JAVA, Visual basic, VBScript, JavaScript, Perl, XML 및 기계어 같은 적절한 컴퓨터 언어를 사용하여 코드될 수 있다. 상기 프로그램 코드는 상기 언급된 수학적 함수에 대한 함수 코드 및 컴퓨터 시스템(120)의 프로세서에 의해 순서대로 프로세스를 이행하기 위한 제어 코드를 포함한다.
상기 코드들은 프로세서에 의하여 상기 기술된 기능의 이행에 필요한 추가 정보 또는 미디어가 컴퓨터 시스템(120)의 내장 또는 외장 메모리의 어느 위치(주소)에서 참조되어야 하는지에 대한 메모리 참조 코드를 추가로 포함한다.
컴퓨터 시스템(120)이 프로세서의 기능의 실행을 위해, 다른 컴퓨터 또는 서버와 원격으로 통신이 필요한 경우, 상기 코드는 어떻게 프로세서가 통신 모듈(예를 들어, 유선 및/또는 무선 통신 모듈)을 사용하여 다른 컴퓨터 또는 서버와 원격으로 통신하는지 또는 통신시 어떤 정보 또는 미디어를 전달해야 하는지에 대한 통신 관련 코드를 추가로 포함할 수 있다.
본 발명의 구현을 위한 기능적 프로그램 및 코드(코드 조각)는 컴퓨터가 읽는 저장 미디어 및 실행 프로그램 등 시스템 환경을 고려하여 당업계 프로그래머에 의해 쉽게 추론되거나 수정될 수 있다.
저장 매체(122)가 배포될 수 있으며, 컴퓨터로 읽을 수 있는 코드들이 저장되고 배포 형식으로 실행될 수 있다. 이러한 경우 복수의 배포된 컴퓨터 중 적어도 하나의 컴퓨터에 상기 저장 매체(122)는 네트워크로 연결된 컴퓨터 시스템에 분산될 수 있으며, 분사 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 이러한 경우, 복수의 분산된 컴퓨터 중 적어도 하나의 컴퓨터는 상기 기능들 중 일부를 실행하고, 그 실행 결과를 적어도 하나의 컴퓨터에 전달하고, 결과를 전달 받은 컴퓨터도 상기 기능 중 일부를 실행하고, 그 결과를 적어도 하나의 다른 컴퓨터에 제공한다.
본 발명의 실행을 위한 어플리케이션(즉, 프로그램)이 기록된 저장 매체(122)는 어플리케이션 스토어 서버 또는 어플리케이션 공급자 서버에 포함된 저장매체(예를 들어 하드디스크) 또는 어플리케이션 공급자 서버 그 자체일 수 있으며, 프로그램을 기록한 또 다른 컴퓨터 및 이의 저장 매체일 수 있다.
저장 매체(122)를 읽을 수 있는 컴퓨터 시스템(120)은 일반적인 데스크 탑이나 노트북 등의 일반 PC 뿐만 아니라, 스마트 폰, 태블릿 PC, PDA(Personal Digital Assistants) 및 이동통신 단말기 등의 모바일 단말기를 포함할 수 있으며, 컴퓨팅 가능한 모든 장치를 포함한다.
본 발명의 특징 및 이점을 요약하면 다음과 같다.
(a) 시료 분석을 위한 본 발명은 다중 반응 및 공정에서 주로 나타나는 오류 신호에 기초한 사이클 결정을 방지하고, 이로서 시료 분석을 위한 정보를 더욱 정확하게 수득할 수 있다.
(b) 시료 분석을 위한 본 발명에서, 임계값은 각 사이클에 적용되어 복수의 임계값이 사이클들에 독립적으로 적용되며, 이로서, 시료 분석에 있어 비정상적인 신호의 영향을 제거한다. 기존의 방법은 시료분석에서 신호 그 자체를 분석하여 비정상적인 신호를 제거한다. 그러므로, 본 발명의 방법은 기존의 방법과 다른 알고리즘으로 시행되는 것이며, 따라서, 기존의 방법과 함께 사용할 수 있으며, 이를 통해 시료 분석의 정확성을 크게 향상시킬 수 있다.
(c) 본 발명은 각 시료의 보다 정확한 베이스라인 영역 설정을 통하여 증폭 곡선을 보정하므로, 증폭 반응의 결과들은 보다 정확하고, 신뢰성 있게 분석된다.
(d) 본 발명은 간결한 과정(알고리즘)에 의해 증폭곡선을 보정하기 때문에, 분석 대상 및 측정 장비에 따른 최적화가 매우 용이하다.
도 1a는 본 발명의 시료 분석 방법의 일 구현예에 대한 흐름도를 나타낸다.
도 1b는 본 발명의 증폭곡선 보정 방법의 일 구현예에 대한 흐름도를 나타낸다.
도 2는 신호-발생 수단으로 Taqman 프로브를 사용하여 수행한 50 사이클 이상 실시간 PCR의 결과를 보여주는 보정전 증폭곡선을 나타낸다. 실시간 PCR은 신호-발생 수단의 존재 하에 수행되어 증폭 사이클 번호와 측정된 신호를 포함하는 원시 데이터 세트를 수득한다. 원시 데이터 세트는 플롯팅 된다. RFU는 상대적 형광 단위를 표시한다.
도 3은 도 2의 보정전 증폭곡선의 기울기 곡선을 나타낸다. Y축은 원시 데이터 세트를 이용하여 계산된 각 증폭 사이클에서의 기울기를 나타낸다. 기울기는 최소 자승법에 의해 계산되었다. S는 베이스라인 영역의 시작지점 사이클이고, E는 베이스라인 영역의 끝지점 사이클이다. 초기 사이클 중 하나가 시작지점 사이클(S)로 결정되었으며, 베이스라인 임계값과 기울기 곡선의 첫번째 교차지점 사이클이 끝지점 사이클(E)로 결정되었다.
도 4a는 도 2의 보정전 증폭 곡선(원시 데이터 세트)의 베이스라인 영역과 최소 자승법에 의해 수득한 최적라인 함수에 의해 그려진 최적라인(선형 회귀선)의 베이스라인 영역의 확대도이다. S는 베이스라인 영역의 시작지점 사이클이고, E는 베이스라인 영역의 끝지점이다.
도 4b는 원시 데이터 세트의 측정된 신호값에서 최적라인 함수의 값을 차감하여 수득한 보정된 증폭곡선의 베이스라인 영역의 확대도이다. S는 베이스라인 영역의 시작지점 사이클이고, E는 베이스라인 영역의 끝지점이다.
도 5는 도 2의 보정된 증폭곡선을 수득하는 과정을 나타낸 것이다. 도 2의 원시 데이터 세트의 형광 신호 세기에서 최적라인(선형 회귀선) 함수값이 차감되어 보정된 데이터 세트가 수득되고, 보정된 데이터 세트를 플롯팅 하여 보정된 증폭곡선을 수득하였다.
도 6은 본 발명의 시료 분석용 프로그램을 갖춘 실시간 PCR 시스템의 일 구현예를 도식적으로 나타낸 것이다.
도 7은 베이스라인 영역의 끝지점을 결정하기 위하여 고정 베이스라인 임계값 (“300” 또는 “30”)을 전체 증폭 사이클에 사용하는 경우 베이스라인 영역 결정에 오류가 발생 하는 것을 보여준다.
도 8a 및 도 8b는 각각 고농도 시료 및 저농도 시료에서 베이스라인 영역을 결정하는 구현예를 나타낸 것이다. 끝지점 사이클은 기울기 곡선과 베이스라인 임계값의 교차지점 사이클 중에서 최소 베이스라인 끝지점 사이클(MBEC) 이후 사이클로 결정되었다.
도 8c는 끝지점 사이클 결정에 MBEC를 사용하거나, 사용하지 않고 결정된 베이스라인 영역을 사용하여 증폭곡선을 보정한 결과를 나타낸 것이다.
도 9는 사이클에 따라 달라질 수 있는 베이스라인 임계값이 증폭 곡선 (또는 기울기 곡선)에 적용된 다수의 구현예를 도식적으로 나타낸 것이다. 두꺼운 선은 베이스라인 임계값을 나타낸다. BTCC는 베이스라인 임계값-변화 사이클을 나타낸다.
도 10a 및 도 10b는 각각 고농도 시료 및 저농도 시료의 기울기 곡선에 VBT(가변 베이스라인 임계값, Variable Baseline Threshold)를 적용한 결과를 나타낸 것이다. 끝지점 사이클은 기울기 곡선과 BTCC(베이스라인 임계값-변화 사이클)에 따라 다르게 적용되는 베이스라인 임계값과 기울기 곡선간의 교차지점 사이클로 결정된다.
도 10c는 끝지점 사이클 결정에 VBT(가변 베이스라인 임계값)을 사용하거나, 사용하지 않고 구해진 베이스라인 영역을 사용하여 증폭곡선을 보정한 결과를 나타낸 것이다.
도 11a는 Ct 값을 결정하기 위하여 증폭 곡선에 VST(가변 신호 임계값)을 적용한 결과를 나타낸 것이다. FST(고정 신호 임계값) 방법은 공지기술을 의미한다.
도 11b 및 도 11c는 Ct 값을 결정하기 위하여 차례로 희석된 Flu A의 genomic RNA(10-3, 10-4, 10-5, 10-6, 및 10-7 희석)의 증폭 곡선에 VST(가변 신호 임계값)을 적용한 결과를 나타낸 것이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 증폭곡선의 보정
도 6에서 도시된 실시간 PCR 시스템을 사용하여 증폭곡선의 기울기 곡선 및 베이스라인 임계값으로부터 얻은 베이스라인 영역의 최적라인에 의해 증폭곡선을 보정할 수 있는지를 조사하였다.
원시 데이터 세트(보정 전 증폭곡선)의 수득 (S110)
업스트림 프라이머 및 다운스트림 프라이머의 연장 및 TaqMan 프로브의 절단을 위해 5´ 뉴클레아제 활성을 갖는 Taq DNA 중합효소를 사용하였다. Neisseria gonorrhoeae (NG)의 지놈 DNA를 표적 핵산 서열로 사용하였다.
NG의 검출을 위해 TaqMan 실시간 PCR을 사용하였다. 표적 핵산이 존재하면 TaqMan 프로브가 절단되고 표지된 단편(fragment)이 방출된다. 증폭곡선은 표지된 단편으로부터의 신호를 측정하여 얻을 수 있다.
NG에 대한 TaqMan 프로브는 5´ 말단에 형광 리포터 분자(Cal Fluor Red 610)를 표지하고, 3´ 말단에 퀀처 분자(BHQ-2)를 표지하였다(SEQ ID NO: 3).
본 실시예에서 사용된 업스트림 프라이머, 다운스트림 프라이머, 및 프로브의 서열은 다음과 같다:
NG-F 5’-TACGCCTGCTACTTTCACGCTIIIIIGTAATCAGATG-3’ (SEQ ID NO: 1)
NG-R 5’-CAATGGATCGGTATCACTCGCIIIIICGAGCAAGAAC-3’ (SEQ ID NO: 2)
NG-P 5’-[Cal Fluor Red 610]TGCCCCTCATTGGCGTGTTTCG[BHQ-2]-3’ (SEQ ID NO: 3)
(I: Deoxyinosine, BHQ-2: Black hole quencher-2)
실시간 PCR은 표적 핵산(10 pg, 1 pg, 100 fg, 10 fg, 또는 1 fg의 NG 지놈 DNA), NG 표적 증폭을 위한 5 pmole의 업스트림 프라이머(SEQ ID NO: 1) 및 5 pmole의 다운스트림 프라이머(SEQ ID NO: 2), 3 pmole의 TaqMan 프로브(SEQ ID NO: 3), 및 5 μl의 4X 마스터 믹스(Master Mix) [최종, 200 μM dNTPs, 2 mM MgCl2, 2 U의 Taq DNA 중합효소]을 포함하는 최종 부피 20 μl의 반응 혼합액에서 수행하였다. 상기 반응 혼합액을 포함하는 튜브를 실시간 PCR 장치(CFX96TM, Bio-Rad)에서 50℃에서 5분간 두고, 이어서 95℃에서 15분간 변성한 후, 95℃에서 30초, 60℃에서 60초 및 72℃에서 30초로 이루어지는 사이클을 50회 반복하였다. 신호 검출은 각 사이클 마다 60℃에서 수행하였다.
원시 데이터 세트는 실시간 PCR 증폭에 의해 얻었고, 보정전 증폭곡선은 원시 데이터 세트를 사용하여 플롯팅하였다(도 2 참조).
보정 전 증폭곡선은 다음과 같이 보정하였다.
베이스라인 영역의 결정 (S120)
증폭반응의 3번째 사이클을 베이스라인 영역의 시작지점 사이클(S)로 설정하였다.
베이스라인 영역의 끝지점 사이클(E)을 결정하기 위해, 수학식 1로 표시되는 최소 자승법(Least Square Method)을 사용한 선형 회귀 분석(Linear Regression Analysis, LRA)을 원시 데이터에 대해 행하여 기울기 곡선을 얻었다. 이때, i 번째 사이클에서의 기울기값을 산출하기 위해 i-1, i, i+1의 3개 사이클에 대응하는 데이터들을 사용하였다(즉, a = 1 및 b = 1).
기울기 곡선에서 피크가 생성되기 전 초기 사이클에서의 배경신호(Background signal)와 교차되지 않도록, 베이스라인 임계값(Baseline threshold)을 “20”으로 설정하였다. 베이스라인 임계값과 기울기 곡선과의 최초의 교차지점(cross-point, CP)의 사이클을 끝지점 사이클(E)로 결정하여, 최종적으로 베이스라인 영역을 결정하였다(도 3 참조).
베이스라인 영역의 최적라인 함수의 산출 (S130)
상기 결정된 베이스라인 영역의 시작지점 사이클(S)부터 끝지점 사이클(E)까지 각 사이클들의 데이터들을 이용하여 최소 자승법에 의해 선형 회귀선의 1차 선형 방정식 형태의 최적라인 함수를 산출하였다(도 4a 참조).
산출되는 선형 회귀선 1차 선형 방정식의 일반식은 “y=mx+b”이며, 여기에서 기울기를 나타내는 “m”은 전술한 수학식 2에 따라 산출하였으며, y축 절편을 나타내는 “b”는 전술한 수학식 3에 따라 산출하였다. 그 결과 산출된 선형 회귀선의 1차 선형 방정식 형태의 최적라인 함수는 “y=2.512x+2396.4” 이다.
보정된 데이터 세트(보정된 증폭곡선)의 수득 (S140)
보정 전 증폭곡선 전체 1 - 50 사이클들에서 상기 산출한 최적라인 함수값들을 차감하여 보정된 데이터 세트를 수득하고, 보정된 증폭곡선을 수득하기 위해 상기 보정된 데이터 세트를 플롯팅(plotting)하였다.
도 4b는 도 2의 베이스라인 영역의 원시 데이터 세트의 각 사이클의 데이터(측정된 신호값)에서 베이스라인 영역의 최적라인 함수에 따른 데이터(함수값)을 차감하여 얻은 보정된 데이터 세트를 나타낸다.
도 5는 상기 보정된 데이터 세트를 플롯팅하여 얻은 보정된 증폭곡선을 나타낸다.
본 발명의 방법은 단순한 알고리즘을 사용하여 증폭곡선의 보정을 행할 수 있으므로, 본 발명은 측정되는 시료 및 측정 기기에 대한 특정 조건을 더욱 간단한 방식으로 최적화하는 것이 가능하다.
실시예 2: 증폭곡선의 보정 (II)
실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭곡선을 보정하기 위한 베이스라인 영역 결정에서의 오류를 제거할 수 있는지 조사하였다.
업스트림 프라이머 및 다운스트림 프라이머의 연장 및 TaqMan 프로브의 절단을 위해 5´ 뉴클레아제 활성을 갖는 Taq DNA 중합효소를 사용하였다. 인플루엔자 A 바이러스(Flu A)의 지놈 DNA를 표적 핵산 서열로 사용하였다.
TaqMan 실시간 PCR을 사용하여 Flu A를 검출하였다. 표적 핵산이 존재하면 TaqMan 프로브가 절단되고 표지된 단편이 방출된다. 증폭곡선은 표지된 단편으로부터의 신호를 측정하여 얻을 수 있다.
Flu A에 대한 TaqMan 프로브는 5´ 말단에 형광 리포터 분자(FAM)를 표지하고, 3´ 말단에 퀀처 분자(BHQ-1)를 표지하였다(SEQ ID NO: 6).
본 실시예에서 사용된 업스트림 프라이머, 다운스트림 프라이머, 및 프로브의 서열은 다음과 같다:
Flu A-F 5’- TGGAATGGCTAAAGACAAGACCIIIIITGTCACCTCT-3’ (SEQ ID NO: 4)
Flu A-R 5’- CATCCTGTTGTATATGAGGCCCATIIIICTGGCAAG -3’ (SEQ ID NO: 5)
Flu A-P 5’-[FAM] CTCACTGGGCACGGTGAGCGTGA [BHQ-1]-3’ (SEQ ID NO: 6)
(I: Deoxyinosine, BHQ-1: Black hole quencher-1)
실시간 PCR은 표적 핵산(추출한 Flu A 지놈 RNA의 10-3, 10-4, 10-5, 또는 10-6 희석), Flu A 표적 증폭을 위한 5 pmole의 업스트림 프라이머(SEQ ID NO: 4) 및 5 pmole의 다운스트림 프라이머(SEQ ID NO: 5), 3 pmole의 TaqMan 프로브(SEQ ID NO: 6), 및 5 μl의 5X RT-PCR 완충액[75 mM Tris-HCl (pH 8.3), 50 mM KCl, 2.5 mM MgCl2, 0.2 mM dNTP] 및 2 μl의 효소 혼합물 [최종, 3.5 U의 Taq DNA 중합효소, 25 U의 MMLV 역전사 효소, 5 U의 RNase 억제제]을 포함하는 최종 부피 25 μl의 반응 혼합액에서 수행하였다. 상기 반응 혼합액을 포함하는 튜브를 실시간 PCR 장치(CFX96TM, Bio-Rad)에서 50℃에서 20분간 두고, 이어서 95℃에서 15분간 변성한 후, 95℃에서 10초, 60℃에서 60초 및 72℃에서 10초로 이루어지는 사이클을 45회 반복하였다. 신호 검출은 각 사이클 마다 60℃에서 수행하였다.
베이스라인 영역 결정 단계(S120)에서의 오류 확인
베이스라인 영역의 끝지점 사이클(E)은 증폭반응에서 실제 표적 신호 세기의 증가가 시작되는 사이클 또는 이 사이클에 근접한 사이클로 결정될 수 있다.
베이스라인 영역의 끝지점 사이클은 각 사이클에서 계산되는 기울기 및 각 사이클에서의 임계값을 모두 고려하여 결정될 수 있다. 이 경우, 베이스라인 임계값은 실시예 1에서처럼 모든 증폭 사이클들에 대해서 적용될 수 있다. 그러나, 이러한 접근법은 베이스라인 영역을 결정할 때 오류를 발생시킬 수 있다(도 7 참조).
예를 들어, 베이스라인 임계값을 “30”과 같이 낮게 설정할 경우, 실제 표적 신호 세기가 증가하기 시작하는 지점이 아니라, 초기 노이즈 신호가 발생한 지점이 베이스라인 영역의 끝지점 사이클로 결정될 수 있어, 베이스라인 영역 결정 오류가 발생될 수 있다. 반면, 이러한 오류를 피하기 위해 베이스라인 임계값을 “300”과 같이 높게 설정하면, 저농도의 표적 서열을 포함하는 시료(즉, 기울기값이 낮은 시료)로부터는 실제 표적 신호 세기가 증가하기 시작하는 지점이 검출되지 않아, 이 역시 베이스라인 영역 결정에 오류가 발생될 수 있다.
이와 같이, 베이스라인 영역 결정 오류로 인해 정확한 실제 증폭 산물의 양이 반영되지 않은 보정된 증폭곡선이 얻어질 수 있다.
MBEC 방법에 의한 끝지점 사이클의 결정
증폭 반응의 3번째 사이클을 베이스라인 영역의 시작지점 사이클(S)로 설정하였다.
도 8a 및 도 8b에서 나타난 바와 같이, 기울기 곡선에서 끝지점 사이클은 최소 베이스라인 끝지점 사이클(minimum baseline end-point cycle, MBEC) 이후의 사이클로 결정될 수 있다. 실시예 2에서 10번째 사이클이 MBEC로 결정되었다.
도 8a (고농도 시료) 및 도 8b (저농도 시료)에서 나타난 바와 같이, MBEC를 적용하지 않으면, 끝지점 사이클이 베이스라인 임계값과 기울기 곡선 사이의 최초 교차지점(CP1)의 사이클로 지정되어, 베이스라인 영역(B1)은 3-7 사이클 영역(고농도 시료) 또는 3-4 사이클 영역(저농도 시료)으로 결정된다. 반면에, MBEC를 적용하면, MBEC를 넘어서는 영역에서의 최초 교차지점(CP2)의 사이클이 끝지점 사이클로 지정되어, 베이스라인 영역(B2)은 3-29 사이클 영역(고농도 시료) 또는 3-38 사이클 영역(저농도 시료)으로 결정된다.
도 8c에서 보여지는 바와 같이, 베이스라인 임계값을 “30”으로 결정하고 MBEC를 적용하지 않으면, 보정된 증폭곡선으로부터 증폭산물의 양을 부정확하게 반영하거나 위음성 결과로 해석된다. 그러나, 베이스라인 임계값을 “30”으로 결정하고, MBEC를 적용하면, 보정된 증폭곡선은 증폭산물의 양을 정확하게 반영하게 된다.
이와 같이, 증폭반응의 초기 사이클들에서 빈번하게 발견되는 노이즈 신호 때문에, 이러한 초기 노이즈 신호가 발생하는 지점이 베이스라인 영역의 끝지점 사이클로 잘못 결정될 수 있어, 베이스라인 결정 오류가 발생된다.
상기 결과들에 의해 베이스라인 영역의 결정(S120) 오류는 본 발명의 방법에 의해 성공적으로 제거될 수 있음을 확인하였다.
VBT(Variable Baseline Threshold) 방법에 의한 끝지점 사이클의 결정
실시예 2에서 사용한 VBT(가변 베이스라인 임계값) 방법은 베이스라인 임계값-변화 사이클(baseline threshold-changed cycle, BTCC)을 결정하고 서로 다른 베이스라인 임계값들을 상기 BTCC 전 및 후의 사이클들에 각각 적용하는 방식으로 수행한다.
BTCC를 20 사이클로 결정하고 제1의 BT(베이스라인 임계값)를 1-20 사이클에 적용하고, 제2의 BT를 21-45 사이클에 각각 다르게 적용하였다. 제1의 BT는 “300”으로 결정하였고, 제2의 BT는 “30”으로 결정하였다.
도 10a(고농도 시료) 및 도 10b(저농도 시료)에 보여지는 바와 같이, VBT를 적용하지 않고 고정 베이스라인 임계값을 “30”으로 하여 모든 사이클에 적용하였을 때, 고농도 시료인 경우 끝지점 사이클(E1)은 7 사이클로 결정되거나, 또는 저농도 시료인 경우 끝지점 사이클(E1)은 4 사이클로 결정되었다.
증폭 반응의 3번째 사이클을 베이스라인 영역의 시작지점 사이클(S)로 결정하면, 베이스라인 영역(B1)은 3-7 사이클 영역(고농도 시료) 또는 3-4 사이클 영역(저농도 시료)으로 결정되었다. 반면에, VBT를 적용하면, 끝지점 사이클(E1)은 고농도 시료인 경우 29 사이클로 결정되거나, 또는 저농도 시료인 경우 38 사이클로 결정되었다. 따라서, 베이스라인 영역(B2)은 3-29 사이클(고농도 시료) 또는 3-38 사이클(저농도 시료)으로 결정되었다.
도 10c에서 보여지는 바와 같이, VBT를 적용하지 않았을 때, 보정된 증폭곡선은 증폭산물의 양을 부정확하게 반영하거나 위음성 결과를 나타내었다. 그러나, VBT를 적용하였을 때, 보정된 증폭곡선은 증폭산물의 양을 정확하게 반영하였고 위음성 결과는 나타나지 않았다.
따라서, 상기 결과에 따르면, 가변적인 베이스라인 임계값들을 다르게 설정하는 VBT 방법을 통해, 초기 증폭 사이클에서 초기 노이즈 신호를 발생시키는 지점을 베이스라인 영역의 끝지점 사이클(E)로 잘못 설정하는 오류를 제거할 수 있음을 확인하였다. 또한, VBT 방법은 증폭 사이클의 후반부에서 신호 증가가 시작되는 지점을 더 정확하게 결정할 수 있어, 베이스라인 영역의 결정(S120) 오류를 제거할 수 있었다.
실시예 2의 결과에 따르면, 베이스라인 영역은 초기 사이클들에서의 배경 신호의 간섭 없이 결정될 수 있음을 확인하였다.
상기한 바와 같이, 본 발명은 베이스라인 영역 결정 오류를 제거하여 증폭곡선을 보정함으로써 더욱 신뢰성 있고 정확한 방식으로 증폭곡선을 분석할 수 있다.
실시예 3: 정확한 Ct 값 결정에 의한 표적 핵산의 검출 및 정량
증폭곡선으로부터 Ct 값을 결정하는 단계에서의 오류를 제거할 수 있는지를 조사하였다.
업스트림 프라이머 및 다운스트림 프라이머의 연장 및 TaqMan 프로브의 절단을 위해 5´ 뉴클레아제 활성을 갖는 Taq DNA 중합효소를 사용하였다. 인플루엔자 A 바이러스(Flu A)의 지놈 DNA를 표적 핵산 서열로 사용하였다.
Flu A 검출을 위해 TaqMan 실시간 PCR을 사용하였다. 표적 핵산이 존재하면 TaqMan 프로브가 절단되고 표지된 단편이 방출된다. 증폭곡선은 표지된 단편으로부터의 신호를 측정하여 얻을 수 있다.
Flu A에 대한 TaqMan 프로브는 5´ 말단에 형광 리포터 분자(FAM)를 표지하고, 3´ 말단에 퀀처 분자(BHQ-1)를 표지하였다(SEQ ID NO: 6).
본 실시예에서 사용된 업스트림 프라이머, 다운스트림 프라이머, 및 프로브의 서열은 다음과 같다:
Flu A-F 5’- TGGAATGGCTAAAGACAAGACCIIIIITGTCACCTCT-3’ (SEQ ID NO: 4)
Flu A-R 5’- CATCCTGTTGTATATGAGGCCCATIIIICTGGCAAG -3’ (SEQ ID NO: 5)
Flu A-P 5’-[FAM] CTCACTGGGCACGGTGAGCGTGA [BHQ-1]-3’ (SEQ ID NO: 6)
(I: Deoxyinosine, BHQ-1: Black hole quencher-1)
실시간 PCR은 표적 핵산(추출한 Flu A 지놈 RNA의 10-3, 10-4, 10-5, 10-6 또는 10-7 희석), Flu A 표적 증폭을 위한 5 pmole의 업스트림 프라이머(SEQ ID NO: 4) 및 5 pmole의 다운스트림 프라이머(SEQ ID NO: 5), 3 pmole의 TaqMan 프로브(SEQ ID NO: 6), 및 5 μl의 5X RT-PCR 완충액[75 mM Tris-HCl (pH 8.3), 50 mM KCl, 2.5 mM MgCl2, 0.2 mM dNTP] 및 2 μl의 효소 혼합물[최종, 3.5 U의 Taq DNA 중합효소, 25 U의 MMLV 역전사 효소, 5 U의 RNase 억제제]을 포함하는 최종 부피 25 μl의 반응 혼합액에서 수행하였다. 상기 반응 혼합액을 포함하는 튜브를 실시간 PCR 장치(CFX96TM, Bio-Rad)에서 50℃에서 20분간 두고, 이어서 95℃에서 15분간 변성한 후, 95℃에서 10초, 60℃에서 60초 및 72℃에서 10초로 이루어지는 사이클을 45회 반복하였다. 신호 검출은 각 사이클 마다 60℃에서 수행하였다.
Ct 값 결정 오류의 확인
증폭곡선으로부터 표적 핵산의 정확한 양을 얻기 위한 전통적인 사이클 임계값 (Ct) 방법은 신호 임계값을 사용한다. Ct 값은 형광 반응이 배경 신호 수준 이상으로 증가하여 미리 결정된 신호 임계값과 교차하는, 증폭곡선의 지수기 내의 지점에 기초하여 결정된다. 이러한 경우, 고정 신호 임계값(fixed signal threshold, FST)의 사용은 Ct 값 결정에 오류를 발생시킬 수 있다.
도 11a는 추출한 Flu A 지놈 RNA의 희석(10-3)으로부터 얻은 보정된 증폭곡선을 보여준다.
도 11a에서 보여지는 바와 같이, FST 값이 “200” RFU와 같이 낮은 값으로 결정되면, 실제 표적 신호가 지수적으로 증가하는 지점 아니라 초기 노이즈 신호를 발생시키는 지점이 Ct 값으로 결정될 수 있고, 이에 의해 표적 핵산 농도 결정에서의 오류가 발생하게 된다.
도 11b는 추출한 Flu A 지놈 RNA의 희석(10-7 ~ 10-3)으로부터 얻은 보정된 증폭곡선을 보여준다. 도 11b에서 나타난 바와 같이, FST 값이 “500” RFU와 같이 높은 값으로 결정되면, 낮은 농도의 표적 서열을 포함하는 시료는 실제 표적 핵산의 양 보다 적은 양으로 결정될 수 있다.
이와 같이, 고정 신호 임계값을 설정하는 전통적인 Ct 방법은 표적 핵산 농도 결정에서의 오류를 제거할 수 없음을 확인하였다.
VST(Variable Signal Threshold) 방법에 의한 Ct 값의 결정
실시예 3에서 사용한 VST(가변 신호 임계값) 방법은 신호 임계값-변화 사이클(signal threshold-changed cycle, STCC)을 결정하고 서로 다른 신호 베이스라인 임계값들을 상기 STCC 전 및 후의 사이클들에 각각 적용하는 방식으로 수행한다.
도 11a에서, STCC를 10 사이클로 결정하고 제1의 ST(신호 임계값)을 1-10 사이클에, 제2의 ST를 11-45 사이클에 각각 다르게 적용하였다. 도 11b 및 도 11c에서, STCC를 38 사이클로 결정하고 제1의 ST(신호 임계값)을 1-38 사이클에 적용하고, 제2의 ST를 39-45 사이클에 각각 다르게 적용하였다. 상기 제1의 ST는 “500” RFU으로 결정하고, 제2의 ST는 “200” RFU로 각각 결정하였다.
도 11a에서 보여지는 바와 같이, FST를 “200” RFU로 적용하였을 때, FST와 증폭곡선 사이의 최초 교차지점(CP1)에서의 Ct 값은 1.24로 결정되었다. 반면에서, VST를 적용하였을 때, VST에 대한 최초 교차지점(CP2)에서의 Ct 값은 32.02로 결정되었다.
도 11b 및 도 11c에서 보여지는 바와 같이, 표적 핵산의 존재 또는 부존재를 구분하는 컷-오프 값은 Ct < 40으로 설정하였다. FST를 “500” RFU로 설정하여 적용하였을 때, 10-6 희석된 RNA의 결과는 Ct 43.41을 나타내었는데, 이 값은 표적 핵산의 양을 부정확하게 반영한 것이다.
또한, 표적 핵산의 존재 또는 부존재를 구분하는 컷-오프 값이 Ct < 40으로 설정되었으므로, Ct 43.41은 표적 핵산의 부존재를 나타내는데, 이는 위음성 결과에 해당한다. VST를 적용하는 경우, 10-6 희석된 RNA의 결과는 Ct 39.82를 나타내는데, 이는 표적 핵산의 양을 정확하게 반영한 것으로서, 양성 결과를 나타낸다.
따라서, 가변적인 신호 임계값을 서로 다르게 설정하는 VST 방법은 초기 증폭 곡선에서의 초기 노이즈 신호를 발생시키는 지점을 Ct 값으로 잘못 해석하는 오류를 제거할 수 있다. 또한, VST 방법은 Ct 값을 더 정확하게 결정할 수 있어, 표적 핵산 농도 결정 오류를 제거할 수 있다.
상기한 바와 같이, 본 발명은 적절한 신호 임계값 설정을 통해 정확한 Ct 값을 결정함으로써 더욱 신뢰성 있고 및 정확한 방식으로 표적 핵산을 검출하고 정량할 수 있다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> Seegene, Inc. <120> Methods for Analyzing Samples <130> PI170003 <150> KR 10-2014-0132229 <151> 2014-10-01 <150> KR 10-2014-0191924 <151> 2014-12-29 <150> KR 10-2015-0051080 <151> 2015-04-10 <160> 6 <170> KoPatentIn 3.0 <210> 1 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> NG-F <220> <221> misc_feature <222> (22)..(26) <223> n denotes deoxyinosine <400> 1 tacgcctgct actttcacgc tnnnnngtaa tcagatg 37 <210> 2 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> NG-R <220> <221> misc_feature <222> (22)..(26) <223> n denotes deoxyinosine <400> 2 caatggatcg gtatcactcg cnnnnncgag caagaac 37 <210> 3 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> NG-P <400> 3 tgcccctcat tggcgtgttt cg 22 <210> 4 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Flu A-F <220> <221> misc_feature <222> (23)..(27) <223> n denotes deoxyinosine <400> 4 tggaatggct aaagacaaga ccnnnnntgt cacctct 37 <210> 5 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Flu A-R <220> <221> misc_feature <222> (25)..(28) <223> n denotes deoxyinosine <400> 5 catcctgttg tatatgaggc ccatnnnnct ggcaag 36 <210> 6 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Flu A-P <400> 6 ctcactgggc acggtgagcg tga 23

Claims (34)

  1. 다음의 단계를 포함하는 시료의 분석 방법:
    (a) 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하여 사이클들에서의 신호값들을 제공하는 단계;
    (b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
    (c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
    (d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
  2. 제 1 항에 있어서, 상기 시료의 분석은 시료 내 분석물질의 존재 또는 부존재를 정량적 또는 정성적으로 결정하는 것임을 특징으로 하는 방법.
  3. 제 1 항에 있어서, 상기 신호-발생 반응은 시료 내 분석물질의 존재에 의존적으로 신호를 발생시키는 것을 특징으로 하는 방법.
  4. 제 1 항에 있어서, 상기 신호-발생 반응은 신호발생수단의 존재하에서 수행하는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서, 상기 신호-발생 반응은 증폭 곡선을 제공하는 반응인 것을 특징으로 하는 방법.
  6. 제 2 항에 있어서, 상기 분석 물질은 표적 핵산분자인 것을 특징으로 하는 방법.
  7. 제 6 항에 있어서, 상기 신호-발생 반응은 표적 핵산분자의 증폭이 동반되거나 또는 동반 되지 않는 반응인 것을 특징으로 하는 방법.
  8. 제 7 항에 있어서, 상기 표적 핵산분자의 증폭 반응은 실시간 PCR (real-time polymerase chain reaction)인 것을 특징으로 하는 방법.
  9. 제 1 항에 있어서, 상기 신호값은 신호-발생 반응으로부터 발생된 신호값 이거나 또는 신호-발생 반응으로부터 발생된 신호의 수학적으로 변형된 값인 것을 특징으로 하는 방법.
  10. 제 1 항에 있어서, 상기 신호-발생 반응은 실시간 PCR 이고, 상기 신호값은 실시간 PCR로부터 발생된 신호의 수학적으로 변형된 값이고, 상기 수학적으로 변형된 값은 사이클에 대해 신호값을 미분한 값인 것을 특징으로 하는 방법.
  11. 제 1 항에 있어서, 상기 임계값은 임계값-변화 사이클(threshold-changed cycle, TCC)을 기준으로, 상기 TCC 이전 사이클들 및 이에 대응하는 임계값들의 집합에 의해 형성된 함수와 상기 TCC 이후 사이클들 및 이에 대응하는 임계값들의 집합에 의해 형성된 함수가 서로 다르도록 설정되는 것을 특징으로 하는 방법.
  12. 제 1 항에 있어서, 상기 임계값 기준은 임계값과 동일하거나 임계값 보다 큰 신호값을 갖는 것을 특징으로 하는 방법.
  13. 제 1 항에 있어서, 상기 단계 (b)는 사이클들 중 적어도 하나의 사이클에 추가 임계값을 적용하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  14. 제 5 항에 있어서, 상기 시료의 분석은 시료 내 표적 핵산분자의 존재를 결정하는 것이고, 상기 임계값 기준를 만족하는 하나 이상의 사이클의 확인은 증폭 곡선의 Ct 값을 결정하는 것임을 특징으로 하는 방법.
  15. 제 5 항에 있어서, 상기 시료의 분석은 시료 내 표적 핵산분자의 존재를 결정하는 것이고, 상기 임계값 기준를 만족하는 하나 이상의 사이클의 확인은 증폭 곡선의 베이스라인 영역의 끝 사이클을 결정하는 것임을 특징으로 하는 방법.
  16. 다음의 단계를 포함하는 신호발생수단의 존재 하에서 수행된 증폭 반응으로부터 수득한 원시 데이터 세트(raw data set)를 보정하는 방법:
    (a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호발생수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
    (b) 상기 원시 데이터 세트로부터 베이스라인 시작 사이클과 끝 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
    (c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
    (d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 증폭 반응의 증폭 사이클 및 (ii) 상기 차감한 결과를 포함하는 것인 단계.
  17. 제 16 항에 있어서, 상기 단계 (a)는 상기 원시 데이터 세트를 플롯팅(plotting)하여 증폭곡선을 수득하는 단계를 더 포함하고, 상기 단계 (d)는 상기 보정된 데이터 세트를 플롯팅하여 보정된 증폭곡선을 수득하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  18. 제 16 항에 있어서, 상기 단계 (b)에서 베이스라인 영역의 끝 사이클은 다음의 단계를 포함하는 방법에 의해 결정되는 것을 특징으로 하는 방법:
    (b1) 각각의 증폭 사이클에 베이스라인 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 베이스라인 임계값들은 서로 다른 것인 단계;
    (b2) 베이스라인 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
    (b3) 상기 단계 (b2)에서 확인된 사이클 또는 사이클들을 사용하여 베이스라인 영역의 끝 사이클을 결정하는 단계.
  19. 제 18 항에 있어서, 증폭 사이클에 대한 베이스라인 임계값은 베이스라인 임계값-변화 사이클(baseline threshold-changed cycle, BTCC)을 기준으로, 상기 BTCC 이전 사이클들과 이에 대응하는 베이스라인 임계값들의 집합에 의해 형성된 제1함수와 상기 BTCC 이후 사이클들과 이에 대응하는 베이스라인 임계값들의 집합에 의해 형성된 제2함수가 서로 다르도록 설정되는 것을 특징으로 하는 방법.
  20. 제 18 항에 있어서, 상기 증폭 사이클은 베이스라인 임계값-변화 사이클(baseline threshold-changed cycle, BTCC)를 경계로 2 이상의 그룹으로 분류되며, 동일한 그룹에 속하는 사이클들은 연속적이고, 동일한 그룹에 속하는 사이클들은 서로 동일한 베이스라인 임계값을 가지며, 바로 인접한 서로 다른 그룹에 속하는 사이클들은 서로 다른 베이스라인 임계값을 갖는 것을 특징으로 하는 방법.
  21. 제 18 항에 있어서, 상기 단계 (b2)에서의 확인은 원시 데이터 세트를 사용하여 각각의 증폭 사이클에 대해 계산된 기울기와 각각의 증폭 사이클에 대한 베이스라인 임계값을 비교하여 수행되는 것은 특징으로 하는 방법.
  22. 제 21 항에 있어서, 상기 기울기는 특정 사이클에서의 데이터 지점 및 상기 특정 사이클의 이전 및/또는 이후의 사이클 또는 사이클들의 적어도 하나의 데이터 지점을 이용한 최소 자승법에 의해 계산되는 것을 특징으로 하는 방법.
  23. 제 22 항에 있어서, 상기 최소 자승법은 다음의 수학식 1을 사용하여 행하는 것을 특징으로 하는 방법:
    [수학식 1]
    Figure pct00006


    상기 수학식 1에서
    Figure pct00007
    이고,
    I 는 기울기를 구하고자 하는 데이터의 사이클 번호이고,
    m 은 I 번째 사이클의 데이터 지점의 기울기이고,
    xi는 i 번째 사이클의 사이클 번호이고,
    yi는 i 번째 사이클에서 측정된 신호값이고,
    n은 a+b+1이고,
    a 및 b는 독립적으로 0 이상 10 이하의 정수(단, a는 I 미만이며, a+b+1은 2이상 원시 데이터 세트의 데이터 지점의 개수 이하, I+b는 원시 데이터 세트의 데이터 지점 개수 이하)이다.
  24. 제 16 항에 있어서, 상기 단계 (b)에서 베이스라인의 끝 사이클은 최소 베이스라인 끝 사이클(minimum baseline end-point cycle, MBEC) 이상의 사이클에서 결정되는 것을 특징으로 하는 방법.
  25. 제 24 항에 있어서, 상기 베이스라인 끝 사이클은 다음의 단계를 포함하는 방법에 의해 결정하는 것을 특징으로 하는 방법:
    (i) 각각의 증폭 사이클에 대해 계산된 기울기를 수득하는 단계;
    (ii) 상기 기울기를 각각의 증폭 사이클에 대한 베이스라인 임계값과 비교하여 베이스라인 영역의 후보 끝 사이클을 수득하는 단계; 및
    (iii) 상기 후보 끝 사이클을 MBEC와 비교하는 단계로서, 상기 후보 끝 사이클이 MBEC 보다 큰 경우 상기 후보 끝 사이클은 끝 사이클로 결정하는 단계.
  26. 제 18 항에 있어서, 추가의 베이스라인 임계값을 사이클들 중에 적어도 하나의 사이클에 적용하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  27. 제 16 항에 있어서, 상기 베이스라인 영역의 최적라인 함수를 산출하는 단계는 베이스라인 영역 내 적어도 2 개의 데이터 지점을 사용한 선형 회귀 분석에 의해 행하는 것을 특징으로 하는 방법.
  28. 제 16 항에 있어서, 상기 베이스라인 영역의 최적라인 함수는 아래 수학식 2 및 3에 의해 산출되는 것을 특징으로 하는 방법.
    [수학식 2]
    Figure pct00008

    [수학식 3]
    Figure pct00009

    상기 수학식 2 및 3에서
    Figure pct00010
    이고,
    m은 최적라인의 기울기이고, b는 최적라인의 Y축 절편이고, Xi는 i번째 사이클의 사이클 번호이고, Yi는 i번째 사이클에서 측정된 신호세기이고, S는 상기 베이스라인 영역의 시작 사이클이고, E는 상기 베이스라인 영역의 끝 사이클이고, n은 E-S+1이다.
  29. 시료를 분석하는 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체로서, 상기 시료를 분석하는 방법은 다음의 단계를 포함하는 것을 특징으로 하는 기록매체:
    (a) 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하여 사이클들에서의 신호값들을 제공하는 단계;
    (b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
    (c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
    (d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
  30. 신호발생수단의 존재 하에서 수행된 증폭 반응으로부터 수득한 원시 데이터 세트(raw data set)를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터로 읽을 수 있는 기록매체로서, 상기 원시 데이터 세트를 보정하는 방법은 다음의 단계를 포함하는 것을 특징으로 하는 기록매체:
    (a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호발생수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
    (b) 상기 원시 데이터 세트로부터 베이스라인 시작 사이클과 끝 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
    (c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
    (d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 증폭 반응의 증폭 사이클 및 (ii) 상기 차감한 결과를 포함하는 것인 단계.
  31. (a) 컴퓨터 프로세서; 및 (b) 상기 컴퓨터 프로세서와 연결된 제 29 항 기재의 컴퓨터로 읽을 수 있는 기록매체를 포함하는, 시료의 분석을 위한 장치.
  32. (a) 컴퓨터 프로세서; 및 (b) 상기 컴퓨터 프로세서와 연결된 제 30 항 기재의 컴퓨터로 읽을 수 있는 기록매체를 포함하는, 신호발생수단의 존재 하에서 수행된 증폭 반응으로부터 얻은 원시 데이터 세트를 보정하는 방법을 위한 장치.
  33. 시료를 분석하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램으로서, 상기 시료를 분석하는 방법은 다음의 단계를 포함하는 것을 특징으로 하는 컴퓨터 프로그램:
    (a) 상기 시료를 사용하는 신호-발생 반응의 각각의 사이클에서의 신호값을 수득하여 사이클들에서의 신호값들을 제공하는 단계;
    (b) 각각의 사이클에 임계값을 적용하여 복수의 임계값들을 사이클들에 적용하는 단계로서, 상기 사이클들 중 적어도 2 개의 사이클들의 임계값들은 서로 다른 것인 단계;
    (c) 임계값들 각각에 의해 결정되는 임계값 기준을 만족하는 하나 이상의 사이클 또는 사이클들을 확인하는 단계; 및
    (d) 상기 단계 (c)에서 확인된 사이클 또는 사이클들을 사용하여 시료를 분석하는 단계.
  34. 신호발생수단의 존재 하에서 수행된 증폭 반응으로부터 얻은 원시 데이터 세트를 보정하는 방법을 실행시키기 위한 프로세서를 구현하는, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램으로서, 상기 원시 데이터 세트를 보정하는 방법은 다음의 단계를 포함하는 것을 특징으로 하는 컴퓨터 프로그램:
    (a) (i) 상기 증폭 반응에서의 증폭 사이클 및 (ii) 상기 신호발생수단으로부터 얻은 상기 증폭 사이클에서의 신호값을 포함하는 원시 데이터 세트를 수득하는 단계;
    (b) 상기 원시 데이터 세트로부터 베이스라인 시작 사이클과 끝 사이클을 결정하여 베이스라인 영역을 결정하는 단계;
    (c) 상기 결정된 베이스라인 영역 내 원시 데이터 세트의 2개 이상의 데이터 지점들로부터 베이스라인 영역의 최적라인 함수를 산출하는 단계; 및
    (d) 상기 원시 데이터 세트의 신호값으로부터 상기 베이스라인 영역의 최적라인 함수에 의해 계산된 함수값을 차감하여 보정된 데이터 세트를 수득하는 단계로서, 상기 보정된 데이터 세트는 (i) 증폭 반응의 증폭 사이클 및 (ii) 상기 차감한 결과를 포함하는 것인 단계.
KR1020177011966A 2014-10-01 2015-09-30 시료의 분석 방법 KR102336732B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20140132229 2014-10-01
KR1020140132229 2014-10-01
KR20140191924 2014-12-29
KR1020140191924 2014-12-29
KR1020150051080A KR20160039529A (ko) 2014-10-01 2015-04-10 증폭곡선을 보정하는 방법 및 시료 분석을 위한 정보를 획득하는 방법, 그 기록매체, 그 컴퓨터 프로그램, 컴퓨터 장치
KR1020150051080 2015-04-10
PCT/KR2015/010308 WO2016052991A1 (en) 2014-10-01 2015-09-30 Methods for analyzing samples

Publications (2)

Publication Number Publication Date
KR20170051539A true KR20170051539A (ko) 2017-05-11
KR102336732B1 KR102336732B1 (ko) 2021-12-08

Family

ID=55800641

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020150051080A KR20160039529A (ko) 2014-10-01 2015-04-10 증폭곡선을 보정하는 방법 및 시료 분석을 위한 정보를 획득하는 방법, 그 기록매체, 그 컴퓨터 프로그램, 컴퓨터 장치
KR1020177011966A KR102336732B1 (ko) 2014-10-01 2015-09-30 시료의 분석 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020150051080A KR20160039529A (ko) 2014-10-01 2015-04-10 증폭곡선을 보정하는 방법 및 시료 분석을 위한 정보를 획득하는 방법, 그 기록매체, 그 컴퓨터 프로그램, 컴퓨터 장치

Country Status (4)

Country Link
US (2) US20170226563A1 (ko)
EP (1) EP3201359B1 (ko)
JP (1) JP6602374B2 (ko)
KR (2) KR20160039529A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200055087A (ko) * 2017-09-28 2020-05-20 주식회사 씨젠 증폭 데이터 표시 방법 및 장치
WO2023068823A1 (ko) * 2021-10-21 2023-04-27 주식회사 씨젠 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법
WO2024025390A1 (ko) * 2022-07-29 2024-02-01 주식회사 씨젠 파라미터의 임계값 설정용 인터페이스 제공 장치 및 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102385959B1 (ko) * 2016-06-02 2022-04-12 주식회사 씨젠 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
US20210317515A1 (en) * 2018-07-10 2021-10-14 Gen-Probe Incorporated Methods and systems for detecting and quantifying nucleic acids
US11150165B2 (en) * 2019-03-01 2021-10-19 Dell Products, L.P. System and method for configuration drift detection and remediation
CN115985396B (zh) * 2022-12-16 2023-12-12 苏州思迈德生物科技有限公司 一种实时荧光定量pcr扩增数据的分析处理方法及装置
CN116564411B (zh) * 2023-07-12 2023-09-29 广州普世君安生物科技有限公司 等温扩增核酸的结果判定方法、系统、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070111249A1 (en) * 2001-08-21 2007-05-17 Applera Corporation Automatic threshold setting for quantitative polymerase chain reaction
EP1801237A2 (en) * 2005-12-20 2007-06-27 Boehringer Mannheim Gmbh Temperature step correction with double sigmoid Levenberg-Marquardt and robust linear regression
EP1804172A2 (en) * 2005-12-20 2007-07-04 Boehringer Mannheim Gmbh PCR elbow determination using curvature analysis of a double sigmoid
US20070248982A1 (en) * 2002-02-07 2007-10-25 Applera Corporation Automatic threshold setting and baseline determination for real-time PCR
US7363168B2 (en) * 2001-10-02 2008-04-22 Stratagene California Adaptive baseline algorithm for quantitative PCR
US7720611B2 (en) * 2005-05-13 2010-05-18 Bio-Rad Laboratories, Inc. Baselining amplification data
WO2011130184A2 (en) * 2010-04-11 2011-10-20 Life Technologies Corporation SYSTEMS AND METHODS FOR MODEL-BASED qPCR
KR20120103496A (ko) * 2011-03-09 2012-09-19 삼성테크윈 주식회사 실시간 중합효소 연쇄 반응에 있어서 표준 곡선 및 임계값을 획득하는 방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070111249A1 (en) * 2001-08-21 2007-05-17 Applera Corporation Automatic threshold setting for quantitative polymerase chain reaction
US7363168B2 (en) * 2001-10-02 2008-04-22 Stratagene California Adaptive baseline algorithm for quantitative PCR
US20070248982A1 (en) * 2002-02-07 2007-10-25 Applera Corporation Automatic threshold setting and baseline determination for real-time PCR
US7720611B2 (en) * 2005-05-13 2010-05-18 Bio-Rad Laboratories, Inc. Baselining amplification data
EP1801237A2 (en) * 2005-12-20 2007-06-27 Boehringer Mannheim Gmbh Temperature step correction with double sigmoid Levenberg-Marquardt and robust linear regression
EP1804172A2 (en) * 2005-12-20 2007-07-04 Boehringer Mannheim Gmbh PCR elbow determination using curvature analysis of a double sigmoid
WO2011130184A2 (en) * 2010-04-11 2011-10-20 Life Technologies Corporation SYSTEMS AND METHODS FOR MODEL-BASED qPCR
KR20120103496A (ko) * 2011-03-09 2012-09-19 삼성테크윈 주식회사 실시간 중합효소 연쇄 반응에 있어서 표준 곡선 및 임계값을 획득하는 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nucleic Acids Research (2008) 36(14):e91 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200055087A (ko) * 2017-09-28 2020-05-20 주식회사 씨젠 증폭 데이터 표시 방법 및 장치
WO2023068823A1 (ko) * 2021-10-21 2023-04-27 주식회사 씨젠 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법
WO2024025390A1 (ko) * 2022-07-29 2024-02-01 주식회사 씨젠 파라미터의 임계값 설정용 인터페이스 제공 장치 및 방법

Also Published As

Publication number Publication date
EP3201359A4 (en) 2018-05-02
US20170226563A1 (en) 2017-08-10
KR20160039529A (ko) 2016-04-11
KR102336732B1 (ko) 2021-12-08
EP3201359A1 (en) 2017-08-09
EP3201359B1 (en) 2019-12-04
US20210238652A1 (en) 2021-08-05
JP2018502552A (ja) 2018-02-01
JP6602374B2 (ja) 2019-11-06

Similar Documents

Publication Publication Date Title
US20210238652A1 (en) Methods for analyzing samples
WO2016052991A1 (en) Methods for analyzing samples
US11781174B2 (en) Calibration method, apparatus and computer program product
US10978173B2 (en) Method for reducing noise level of data set for a target analyte
KR102385959B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
KR102270771B1 (ko) 표적 분석물질에 대한 데이터 세트의 보정 방법
AU2022202180B2 (en) Method and device for analyzing target analyte in sample
US11781180B2 (en) Detection of abnormal signal using two or more datasets
CN108368547B (zh) 与靶核酸序列有关的信号提取
US20220025449A1 (en) Method for detecting a target analyte in a sample using an s-shaped function for a slope data set
KR102385960B1 (ko) 분석물질-비의존적 신호값을 이용한 타겟 분석물질에 대한 데이터 세트 보정 방법
WO2017131463A1 (en) Methods for providing signal for target nucleic acid sequence

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right