KR20180035925A - 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법 - Google Patents

타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법 Download PDF

Info

Publication number
KR20180035925A
KR20180035925A KR1020187008454A KR20187008454A KR20180035925A KR 20180035925 A KR20180035925 A KR 20180035925A KR 1020187008454 A KR1020187008454 A KR 1020187008454A KR 20187008454 A KR20187008454 A KR 20187008454A KR 20180035925 A KR20180035925 A KR 20180035925A
Authority
KR
South Korea
Prior art keywords
data set
determinant
target analyte
absence
determinants
Prior art date
Application number
KR1020187008454A
Other languages
English (en)
Other versions
KR102165931B1 (ko
Inventor
천종윤
이영조
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20180035925A publication Critical patent/KR20180035925A/ko
Application granted granted Critical
Publication of KR102165931B1 publication Critical patent/KR102165931B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • G06F19/24
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • G06F19/26
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Abstract

본 발명은 다중 데이터 세트 분석법(MDA)에 의한 타겟 분석물질의 존재 또는 부존재 결정 방법에 관한 것이다. 본 발명은 증폭 반응으로부터의 2개 이상의 상이한 데이터 세트를 이용하여, 타겟 분석 물질의 존재 또는 부존재의 결정시 오류(특히, 위양성 오류)를 극적으로 감소시킬 수 있다.

Description

타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
관련 출원에 대한 상호참조
본원은 대한민국 특허청에 2015년 9월 24일에 출원된 2015-0135386호의 우선권을 주장하며, 그 내용은 전체가 참조로 본원에 포함되어 있다.
기술분야
본 발명은 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석(MDA)에 관한 것이다.
핵산 증폭은 분자 생물학 분야에서 이용되는 다양한 방법에서 필수적인 과정으로서, 이에 다양한 증폭 방법이 알려져 있다. 예를 들어, Miller, H. I. 등 (WO 89/06700)은, 프로모터/프라이머 서열을 타겟 단일가닥 DNA("ssDNA")에 혼성화시킨 다음 상기 서열의 많은 RNA 카피를 전사하는 과정을 포함하는 핵산서열 증폭 방법을 개시하고 있다. 다른 공지의 핵산 증폭 방법들은 전사 증폭 시스템을 포함한다(Kwoh, D. et al., Proc. Natl. Acad. Sci. U.S.A., 86:1173(1989); 및 Gingeras T.R. et al., WO 88/10315).
중합효소 연쇄반응(polymerase chain reaction, PCR)으로 알려진 대표적인 핵산 중폭방법은 이중가닥 DNA의 변성 후 DNA 주형에로의 올리고뉴클레오티드 프라이머의 어닐링, 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클에 기초한다(Mullis et al., 미국특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al.,(1985) Science 230, 1350-1354).
이러한 방법 중에서, 타겟 핵산의 증폭을 실시간(real-time) 방식으로 검출하는 실시간 PCR 기술이 널리 이용되고 있다. 관심있는 타겟 핵산 서열을 검출하기 위해, 실시간 PCR은 타겟 핵산 서열의 양에 비례하여 검출가능한 형광 신호를 방출하는 신호 발생 수단을 이용한다. 검출가능한 형광 신호의 방출은 이중가닥 DNA에 결합할 때 형광 신호를 발생하는 인터컬레이터를 사용하거나, 형광 리포터 분자 및 상기 형광 리포터 분자의 형광을 억제할 수 있는 퀀처 분자를 갖는 올리고뉴클레오타이드를 사용함으로써 달성할 수 있다. 그것은 타겟 핵산 서열의 양에 비례하는 강도를 갖는 형광 신호를 각 사이클마다 측정하여, 사이클 번호와 신호 세기의 좌표값의 쌍을 갖는 원시 데이터 세트(raw data set)를 생성한다. 이후, 편의를 위해 상기 세기 값을 사이클 수에 대해 플롯팅하여 당업계에 널리 알려진 증폭곡선("증폭 프로파일 곡선"으로도 불림)을 수득할 수 있다.
실시간 PCR의 증폭곡선은 전형적으로 3개의 영역, 즉 베이스라인(baseline) 영역, 지수(exponential) 영역 및 정체(plateau) 영역으로 구성된다. 지수 영역은 증폭 산물(앰플리콘)의 증가에 비례하여 방출되는 형광 신호가 증가하는 영역을 지칭한다. 정체 영역은 PCR 앰플리콘 및 형광 신호 수준의 포화로 인해 형광 신호가 거의 증가되지 않는 영역을 지칭한다. 베이스라인 영역은 PCR의 초기 사이클 동안 형광 신호가 거의 변화하지 않는 영역을 지칭한다. 베이스라인 영역에서는 PCR 앰플리콘으로부터의 형광 신호가 검출될 정도로 충분하지 않으므로, 이 영역에서 검출되는 신호는 증폭으로부터의 신호가 아니라 주로 반응 샘플 및 검출 시스템으로부터의 신호(백그라운드 신호) 때문일 수 있다.
실시간 PCR의 데이터를 보다 정확하고 재현성있게 분석하기 위해서는, 스무딩(smooting)(또는 핏팅(fitting), 근사(approximation) 등), 베이스라인 차감(baselining), 및/또는 일반화(normalization)을 포함하는 데이터 가공이 필요하다(Alexey Larionov et al., BMC Bioinformatics 2005, 6:62; 미국특허 제7,720,611호 참조).
타겟 분석물질의 존재 또는 부존재를 결정하기 위한 종래 방법들은 증폭곡선에 미리 정해진 신호 역치(threshold)를 적용하고 상기 신호 역치를 초과하는 신호값을 갖는 사이클을 확인하는 것을 포함한다. 이러한 방법에서, 역치를 초과하는 신호값이 있으면, 이것은 타겟 핵산 서열의 증폭을 나타내며, 따라서 타겟 핵산 서열의 존재가 결정될 수 있고, 그렇지 않으면 타겟 핵산 서열의 부존재가 결정될 수 있다.
타겟 핵산 서열의 존재 또는 부존재를 결정하는데 사용되는 신호 역치는 증폭이 진행되는 동안 임의의 사이클, 예를 들면 베이스라인의 종결점(end-point) 사이클, 지수 영역의 시작점(start-point) 사이클, 또는 지수 영역 내의 임의의 사이클에서의 형광 신호의 세기로서 설정될 수 있다. 이는 실시간 PCR의 민감도와 관련된다. 신호 역치가 너무 높게 설정되면, 초기 타겟 핵산 서열의 농도가 낮은 샘플나 증폭 효율이 낮은 샘플이 음성 샘플로 잘못 결정될 수 있다(위음성 오류). 반면, 신호 역치가 너무 낮으면, 타겟 핵산 서열이 없는 샘플(음성 샘플)이 노이즈로 인해 양성 샘플로 잘못 결정될 수 있다(위양성 오류). 따라서, 이러한 위음성 및 위양성 오류를 최소화하기 위해서는 최적의 신호 역치를 설정할 필요가 있다.
이러한 노력에도 불구하고, 샘플의 준비, PCR 반응 및 데이터 가공 중 발생하는 모든 오류를 근본적으로 제거할 수 없다. 따라서, 타겟 핵산 서열을 보다 정확하게 검출하기 위한 새로운 접근법을 개발할 필요가 있다.
최근에는 실시간 PCR 데이터 세트로부터 오류를 제거함으로써 보다 정확하게 데이터를 분석하기 위한 몇 가지 기술들이 개발되었다. 예를 들어, 미국특허 제8,560,247호는 특정 증폭 데이터의 기울기가 최대 증폭 기울기를 초과하면 이를 비-증폭 데이터, 즉 오류(노이즈, 점프 등)로 결정하는 기술을 개시하고 있다. 또한, 미국출원공개 제2015/0186598호는 상이한 신호를 갖는 2차 도함수 값을 갖는 2개의 연속 사이클을 확인함으로써 증폭 곡선에서 점프 오류(jump error)를 확인하는 방법을 개시하고 있다.
선행 기술들이 오류 데이터로서 판별된 일부 데이터를 제거하거나 보정하는 방법을 개시하고 있으나, 상기 보정은 정상 데이터를 오히려 비정상 데이터로 변경할 가능성이 있을 뿐만 아니라 데이터를 왜곡시킬 가능성이 있다. 또한, 상기 방법은 모든 가능한 오류를 확인할 수 없으므로, 정확한 데이터 분석에 효과적이지 못하다.
본원 전반에, 많은 특허 및 문헌이 언급되고 그 인용이 괄호 안에 제공되어 있다. 이들 특허 및 문헌의 개시내용은 본 발명 및 본 발명이 속하는 기술 분야의 수준을 보다 명확하게 설명하기 위해 그 전체가 본원에 참조로 포함되어 있다.
본 발명자들은 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정함에 있어서 빈번하게 발생하는 오류(특히, 위양성 오류)를 최소화하기 위하여 예의 연구 노력하였다. 그 결과, 본 발명자들은 타겟 분석물질에 대한 신호 발생 수단을 사용하여 증폭 반응을 실시하고, (i) 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자를 제공하고, 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 것을 포함하는, 오류 없이 증폭 분석이 가능한 새로운 프로토콜을 확립하였다.
따라서, 본 발명의 목적은 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 방법을 제공하는 데 있다.
본 발명의 다른 목적은 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 데 있다.
본 발명의 또 다른 목적은 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 장치를 제공하는 데 있다.
본 발명의 다른 목적은 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 첨부된 청구범위 및 도면과 함께 하기 상세한 설명으로부터 명확하게 될 것이다.
본 명세서가 본 발명을 더 잘 설명하고 예시하도록 하기 위해, 본 명세서에서 본 기술분야에서 널리 알려져 있고 본 발명과 직접 관련되지 않은 일반 기술 및 지식에 대한 설명은 생략된다.
I. 타겟 분석물질의 존재 또는 부존재의 결정 방법
본 발명은 다음 단계를 포함하는 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 방법을 제공한다:
(a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용하여 증폭 반응을 실시하는 단계;
(b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
(c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
본 발명자들은 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정함에 있어서 빈번하게 발생하는 오류(특히, 위양성 오류)를 최소화하기 위하여 예의 연구 노력하였다. 그 결과, 본 발명자들은 타겟 분석물질에 대한 신호 발생 수단을 사용하여 증폭 반응을 실시하고, (i) 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자를 제공하고, 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 것을 포함하는, 오류 없이 증폭 분석이 가능한 새로운 프로토콜을 확립하였다.
본 발명의 가장 큰 특징은 2개 이상의 상이한 유형의 데이터 세트를 사용하여 타겟 분석물질의 존재 또는 부존재를 결정하는 것이다. 따라서, 본 발명의 방법은 "다중 데이터 세트 분석법(multiple data set analysis: MDA)"으로도 명명된다.
본 발명은 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 방법에 관한 것이다. 본원에 사용된 바와 같이 용어 "샘플 내 타겟 분석물질의 존재 또는 부존재의 결정"은 샘플 내 타겟 분석물질의 정성적 결정을 의미한다. 특히, 샘플 내의 타겟 분석물질의 존재 또는 부존재의 결정은 또한 관심있는 타겟 분석물질에 대해 증폭 반응, 예를 들면 중합효소 연쇄 반응(PCR) 또는 실시간 PCR을 실시한 후, 상기 증폭 반응으로부터 유래된 데이터 세트를 평가(분석)하여 타겟 분석물질의 존재 또는 부존재를 결정하는 것을 의미한다.
본 발명에 따른 MDA에 의해 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 방법을 첨부된 도면을 참조하여 설명할 것이다. MDA(100)는 하기와 같이 3개의 단계를 포함한다:
단계 (a): 증폭 반응의 실시(200)
본 단계에서는, 타겟 분석물질에 대한 신호 발생 수단을 이용하여 증폭 반응을 수행한다(도 1; 200 참고).
본원에 사용된 바와 같이 용어 "타겟 분석물질(analyte)"은 검출되거나 분석될 임의의 물질을 지칭하며, 이는 다양한 물질(예컨대, 생물학적 물질 및 비생물학적 물질), 특히 생물학적 물질, 보다 특히 핵산분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원, 대사물질 및 세포를 포함한다. 가장 특히, 타겟 분석물질은 타겟 핵산분자(또는 타겟 핵산 서열)이다. 타겟 분석물질은 샘플 내에 존재한다.
본원에 사용된 바와 같이 용어 "샘플"은 생물학적 샘플(예컨대, 세포, 조직 및 체액) 및 비생물학적 샘플(예컨대, 음식물, 물 및 토양)을 포함한다. 상기 생물학적 샘플은, 비제한적으로, 바이러스, 세균, 조직, 세포, 혈액(전혈, 혈장 및 혈청 포함), 림프, 골수액, 타액, 객담(sputum), 스왑(swab), 흡인액(aspiration), 우유, 소변, 분변, 안구액, 정액, 뇌 추출물, 척수액(SCF), 관절액, 흉선액, 기관지 세척액, 복수 및 양막액이다. 상기 샘플은 효율적인 증폭 반응을 위해 본 기술분야에서 공지된 핵산 추출(nucleic acid extraction) 과정을 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001). 상기 핵산 추출 과정은 샘플의 종류에 따라 달라질 수 있다. 또한, 상기 추출된 핵산이 RNA인 경우 cDNA를 합성하기 위한 역전사(reverse transcription) 과정을 추가로 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001).
본원에서 사용된 바와 같이 용어 "신호 발생 수단"은 타겟 분석물질의 존재를 나타내는 신호의 생성에 사용되는 임의의 수단(예컨대, 물질)을 의미한다.
다양한 신호 발생 수단이 당업계에 널리 알려져 있다. 신호 발생 수단은 표지 자체 또는 표지를 갖는 올리고뉴클레오타이드를 포함한다. 상기 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다. 인터컬레이팅 염료(intercalating dye)와 같은 표지 자체가 신호 발생 수단으로서 작용할 수 있다. 또는, 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지가 적어도 하나의 올리고뉴클레오타이드에 결합된 형태로 신호 발생 수단으로서 사용될 수 있다. 상기 신호 발생 수단은 신호를 발생시키기 위하여 핵산절단 효소(예를 들어, 5' 뉴클레아제 또는 3' 뉴클레아제)를 추가로 포함할 수 있다.
타겟 분석물질, 특히 타겟 핵산분자의 존재를 나타내는 신호를 발생시키는 다양한 방법이 당업계에 알려져 있다. 대표적인 예는 다음을 포함한다: TaqManTM 프로브 방법(미국특허 제5,210,015호), 분자 비콘 방법(Tyagi 등, Nature Biotechnology v.14 MARCH 1996), 스콜피온(Scorpion) 방법(Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise) 또는 앰플리플루오르(Amplifluor) 방법(Nazarenko 등, 2516-2521 NucleicAcids Research, 25(12):2516-2521(1997), 및 미국특허 제6,117,635호), 럭스(Lux) 방법(미국특허 제7,537,886호), CPT(Duck P, 등. Biotechniques, 9:142-148(1990)), LNA 방법(미국특허 제6,977,295호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), HybeaconsTM(D. J. French, et al., Molecular and Cellular Probes (2001) 13, 363-374 및 미국특허 제7,348,141호), 이중표지된 자가-퀀칭된 프로브(Dual-labeled, self-quenched probe; 미국특허 제5,876,930호), 혼성화 프로브(Bernard PS, et al., Clin Chem 2000, 46, 147-148), PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO 2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(PCT/KR2013/012312) 및 CER 방법(WO 2011/037306). 따라서, 본 발명에서 증폭 반응은 상술한 신호 발생 방법 중 하나에 의해 실시될 수 있다.
본 명세서에서 용어 "증폭 반응"은 신호 발생 수단에 의하여 발생되는 신호를 증가 또는 감소시키는 반응을 의미한다.
본 발명의 일 구현예에 따르면, 증폭 반응은 타겟 분석물질의 존재에 의존적으로 상기 신호 발생 수단에 의한 신호의 증가(또는 증폭)를 지칭한다. 이러한 증폭 반응은 타겟 분석물질(예컨대, 핵산분자)의 증폭이 동반되거나 또는 동반되지 않을 수 있다. 보다 구체적으로, 본 발명의 증폭 반응은 타겟 분석물질의 증폭이 동반되는 신호의 증폭을 의미한다.
본 발명의 일 구현예에 따르면, 타겟 분석물질(예컨대, 타겟 핵산분자)의 존재를 나타내는 신호를 증폭시키기 위한 증폭 반응은 타겟 분석물질(예컨대, 타겟 핵산분자)이 증폭되면서, 신호도 증폭되는 방식으로 실시될 수 있다(예를 들어, 실시간 PCR). 또는 본 발명의 일 구현예에 따르면, 증폭 반응은 타겟 분석물질(예컨대, 타겟 핵산분자)이 증폭되지 않고 신호가 증폭되는 방식으로 실시될 수 있다(예를 들어, CPT 방법(Duck P, et al., Biotechniques, 9:142-148 (1990)), Invader assay(미국특허 제6,358,691호 및 제6,194,149호)).
타겟 핵산 서열을 증폭하는 다양한 방법들이 당업계에 널리 알려져 있으며, 이는 중합효소 연쇄 반응(PCR), 리가아제 연쇄반응(ligase chain reaction(LCR))(미국특허 제4,683,195호 및 제4,683,202호; PCR Protocols: A Guideto Methods and Applications(Innis et al., eds, 1990)), 가닥 치환 증폭(strand displacement amplification(SDA))(Walker, et al. NucleicAcids Res. 20(7):1691-6 (1992); Walker PCR Methods Appl 3(1):1-6 (1993)), 전사 매개 증폭(transcription-mediated amplification)(Phyffer, et al., J. Clin. Microbiol. 34:834-841 (1996); Vuorinen,et al., J. Clin. Microbiol. 33:1856-1859 (1995)), 핵산 서열 기반 증폭(nucleic acid sequence-based amplification (NASBA))(Compton, Nature 350(6313):91-2 (1991)), 롤링서클 증폭(rolling circle amplification, RCA)(Lisby, Mol. Biotechnol. 12(1):75-99 (1999); Hatch et al., Genet. Anal. 15(2):35-40 (1999)) 및 Q-beta 레플리카제(Q-Beta Replicase)(Lizardi et al., BiolTechnology 6:1197 (1988))를 포함한다.
본 발명의 일 구현예에 따르면, 상기 신호 발생 수단은 형광 표지, 보다 구체적으로 형광 단일표지 또는 형광 이중표지(예컨대, 형광 리포터 분자 및 퀀처 분자 포함)를 포함한다. 본 발명의 일 구현예에 따르면, 증폭 반응은 타겟 분석물질(예컨대, 타겟 핵산분자)의 증폭이 수반되면서 신호를 증폭한다. 본 발명의 일 구현예에 따르면, 증폭 반응은 PCR, 구체적으로 실시간 PCR에 의해 실시된다.
본 발명의 방법은 증폭 반응으로부터 수득된 복수의 데이터 세트를 사용하여 타겟 분석물질을 분석하는 것을 특징으로 하므로, 상기 방법은 샘플의 종류, 신호 발생 수단의 종류, 반응 조건 및 장비와 같은 반응 요소에 제한되지 않는다. 본 발명은 증폭 반응이 타겟 분석물질의 존재 또는 부존재를 결정할 수 있는 데이터 세트를 제공하는 한 어떤 증폭 반응에도 적용될 수 있다.
단계 (b): 데이터 세트 풀 및 결정인자의 제공(300)
본 단계에서, (i) 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자가 제공된다. 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해진다.
(i) 데이터 세트 풀의 제공
먼저, 본 단계에서는 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀이 제공된다.
본원에 사용된 바와 같이 용어 "데이터 세트 풀"은 데이터 세트들의 집합을 가리킨다. 특히, 본원에서 데이터 세트 풀은 타겟 분석물질에 대한 신호 발생 수단을 사용한 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 집합을 가리킨다. 데이터 세트의 풀 내의 상이한 유형의 데이터 세트들은 단계 (a)의 증폭 반응으로부터 수득된다. 데이터 세트 풀은 2, 3, 4, 5, 6, 7, 또는 그 이상의 상이한 유형의 데이터 세트들을 포함할 수 있다.
본 발명의 일 구현예에 따르면, 데이터 세트 풀 내의 데이터 세트들은 각각 증폭 사이클 수와 증폭 사이클 수에서의 신호값을 포함한다.
본원에서 사용된 바와 같이 용어 "사이클"은 일정한 조건의 변화를 수반한 복수의 측정에 있어, 조건의 변화 단위를 지칭한다. 상기 일정한 조건의 변화는 반응시간, 반응횟수, 농도, pH, 측정 대상(예를 들어 핵산)의 복제 횟수의 증가 또는 감소를 포함한다. 또한, 상기 사이클은 상기 조건의 변화 단위로부터 수학적으로 가공된 단위를 포함할 수 있다.
일예로 기질의 농도에 따른 효소의 기질 분해 능력을 측정하는 경우, 기질 농도를 달리하여 수 차례 효소의 기질 분해 정도를 측정한다. 기질 농도의 증가는 조건의 변화에 해당할 수 있으며, 상기 증가 단위가 하나의 사이클에 해당할 수 있다.
다른 일예로 핵산의 등온증폭 반응(isothermal amplification)의 경우 등온 조건하에 반응 시간의 과정에서 샘플의 복수의 측정이 가능하며, 상기 반응 시간이 조건의 변화에 해당할 수 있고, 상기 반응 시간의 단위가 하나의 사이클에 해당할 수 있다.
다른 일예로, 핵산의 등온증폭 반응의 데이터 세트로부터 1차 도함수가 얻어지는 경우, 반응 시간 사이의 차이가 조건의 변화에 해당할 수 있고, 반응 시간 사이의 차이의 단위가 하나의 사이클에 해당할 수 있다.
보다 구체적으로, 일련의 반응을 반복하거나 시간 간격으로 반응을 반복하는 경우, 용어 "사이클"은 상기 반복의 하나의 단위를 의미한다.
예를 들어, 중합효소 연쇄 반응(PCR)에서, 사이클은 타겟 분자의 변성, 핵산 분자와 프라이머 간의 어닐링(혼성화) 및 프라이머의 연장을 포함하는 반응 단위를 의미한다. 반응의 반복의 증가는 조건의 변화에 해당하며, 반복의 단위는 사이클에 해당한다.
본원에 사용된 바와 같이 용어 "신호값"은 증폭 사이클에서 실제적으로 측정된 신호값(예컨대, 신호의 세기) 또는 이들의 변형값을 의미한다. 상기 변형값은 상기 실제적으로 측정된 신호값(즉, 원시 데이터 세트에서의 신호값)의 수학적으로 가공된 값을 포함할 수 있다. 상기 실제적으로 측정된 신호값의 수학적으로 가공된 값의 예는 측정된 신호값의 로그값 또는 도함수값을 포함할 수 있다. 측정된 신호값의 도함수값은 다차-도함수값을 포함할 수 있다.
전술한 사이클 수 및 신호값은 하기 설명될 데이터 지점을 구성한다.
본원에 사용된 바와 같이 용어 "데이터 지점(data point)"은 사이클 수 및 상기 사이클에서의 신호값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 본원에 사용된 바와 같이 용어 "데이터"는 데이터 세트를 구성하는 모든 정보를 의미한다. 예컨대, 증폭 사이클 수 및 신호값 각각은 데이터이다.
신호 발생 수단을 사용한 증폭 반응에 의해 얻어진 데이터 지점들은 직교 좌표계에서 좌표값으로 플롯팅될 수 있다. 상기 직교 좌표계에서, X-축은 증폭 반응의 사이클을 나타내며, Y-축은 상기 사이클에서 측정 또는 가공된 신호값을 나타낸다.
본원에 사용된 바와 같이 용어 "데이터 세트"는 데이터 지점들의 집합을 의미한다. 예를 들어, 데이터 세트는 신호 발생 수단의 존재 하에 증폭 반응으로부터 직접적으로 수득되는 데이터 지점의 세트이거나 이러한 데이터 세트를 변형하여 수득되는 변형된 데이터 세트일 수 있다. 상기 데이터 세트는 증폭 반응에 의해 수득되는 데이터 지점들 또는 이의 변형된 데이터 지점들의 일부 또는 전체일 수 있다. 상기 데이터 세트는 플롯팅되어 증폭곡선이 얻어질 수 있다.
특히, 본원에 사용된 바와 같이 용어 "2개 이상의 상이한 유형의 데이터 세트들"은 2개 이상의 데이터 세트들이 서로 그 유형이 상이한 것을 의미한다. 상이한 유형의 데이터 세트들은 데이터 세트들 간에 서로 상응하는 데이터 지점의 일부 또는 전부가 서로 실질적으로 상이한 것을 의미한다. 예를 들어, 상이한 유형의 데이터 세트는 서로 상응하는 데이터 지점이 데이터 성분(예컨대, 사이클 수 및 신호값)의 단위 또는 크기가 상이한 것을 의미한다. 2개의 데이터의 세트들의 유형 차이는 데이터 세트들이 수득되는 방법에 좌우된다. 2개의 데이터 세트들이 동일한 방법으로 수득되는 경우, 상기 데이터 세트들은 동일한 유형으로 간주된다. 즉, 2개의 데이터 세트들이 동일한 방법으로 수득되는 경우, 상응하는 데이터 지점의 일부 또는 전부가 서로 상이하다고 할지라도 상기 데이터 세트들은 동일한 유형으로 간주될 수 있다. 마찬가지로, 2개의 데이터 세트들이 상이한 방법으로 수득되는 경우, 상응하는 데이터 지점의 일부 또는 전부가 서로 동일하다고 할지라도 상기 데이터 세트들은 상이한 유형의 데이터 세트들로 간주될 수 있다. 또한, 본원에서 사용된 용어 "상이한 유형의 데이터 세트들"은 하나의 증폭으로부터 상이한 방법으로 수득되는 데이터 세트들을 포함하는 것으로 의도되므로, 2개 이상의 증폭 반응으로부터 동일한 방법으로 수득된 2개 이상의 데이터 세트들은 상기 용어의 범위에 속하지 않는다. 예를 들어, 제1 원시 데이터 세트가 증폭 반응을 수행하여 수득되고 제2 원시 데이터 세트가 증폭 반응을 재수행하여 수득되는 경우, 가능한 실험 오차 또는 편차로 인해 2개의 원시 데이터 세트 사이에 일부 상이한 데이터 지점이 있다고 할지라도 이들은 상이한 유형의 데이터 세트들로 간주되지 않는다. 원시 데이터 세트와 상기 원시 데이터 세트의 다양한 수학적 가공에 의해 수득된 하나 이상의 데이터 세트들은 상이한 유형의 데이터 세트를 대표할 수 있다.
본 발명의 일 구현예에 따르면, 상이한 유형의 데이터 세트들은 원시 데이터 세트를 포함할 수 있다. 상기 원시 데이터 세트는 증폭 사이클 수 및 상기 증폭 사이클 수에서의 신호값을 포함할 수 있다.
본원에 사용된 바와 같이 용어 "원시 데이터 세트(raw data set)"는 증폭 반응으로부터 직접적으로 얻은 데이터 지점들(사이클 수 및 신호값 포함)의 세트를 의미한다. 상기 원시 데이터 세트는 실시간 PCR을 수행하는 장치(예를 들면, thermocycler, PCR machine 또는 DNA amplifier)로부터 최초로 받는, 가공되지 않은 데이터 지점들의 세트를 의미한다. 본 발명의 일 구현예에서, 원시 데이터 세트는 당업자에 의해 통상적으로 이해되는 원시 데이터 세트를 포함할 수 있다. 본 발명의 일 구현예에서, 원시 데이터 세트는 가공 전의 데이터 세트를 포함할 수 있다. 본 발명의 일 구현예에서, 원시 데이터 세트는 본원에 기재된 수학적으로 가공된 데이터 세트를 위한 기초가 되는 데이터 세트를 포함할 수 있다. 본 발명의 일 구현예에서, 원시 데이터 세트는 베이스라인에 의해 차감되지 않은 데이터 세트(베이스라인 미차감 데이터 세트)를 포함할 수 있다. 원시 데이터 세트는 실시간 PCR 기계로부터 출력되어 Microsoft™ EXCEL 등에 기록 및 저장될 수 있다.
본 발명의 일 구현예에 따르면, 상이한 유형의 데이터 세트들은 원시 데이터 세트의 수학적으로 가공된 하나 이상의 데이터 세트를 포함할 수 있다.
본원에 사용된 바와 같이 용어 "(원시 데이터 세트의) 수학적으로 가공된 데이터 세트"는 원시 데이터 세트를 수학적으로 가공하여 1차적으로 수득된 데이터 세트뿐만 아니라, 1차적으로 수학적으로 가공된 데이터 세트를 수학적으로 재가공하여 수득된 데이터 세트를 포괄한다. 예를 들어, 상기 용어는 원시 데이터 세트의 도함수, 예를 들어 1차 도함수, 2차 도함수, 3차 도함수 및 고차 도함수와 같이 다양한 방식으로 원시 데이터 세트를 수학적으로 가공하여 수득된 데이터 세트를 포함할 수 있다.
본 발명의 일 구현예에 따르면, 상기 수학적으로 가공된 데이터 세트는 특정 연산(calculation) 또는 함수(function)를 사용하여 원시 데이터 세트의 신호값으로부터 가공된 수학적으로 가공된 신호값을 포함한다.
본원에서 데이터 세트 또는 신호값과 함께 사용된 용어 "연산"은 하나 또는 그 이상의 인풋(데이터)을 하나 또는 그 이상의 결과로 전환시키는 수학적 과정을 의미한다. 예를 들어, 실시간 PCR에 의해 얻어진 신호값[예컨대, RFU(relative fluorescence unit)]을 연산을 통해 로그값(logarithm value)으로 수학적으로 가공할 수 있다.
본원에서 데이터 세트 또는 신호값과 함께 사용된 용어 "함수에 의한 가공(processing)"은 인풋(데이터)들의 세트 및 아웃풋(데이터)의 세트 사이의 관계(relation)에 의해 수학적으로 가공하는 것을 의미한다. 예를 들어, 원시 데이터 세트는 베이스라인 영역의 기울기를 구하기 위하여 선형회귀분석에 의해 수학적으로 가공된다. 또는, 원시 데이터 세트는 원시 데이터 세트의 도함수를 구하기 위하여 선형회귀분석에 의해 수학적으로 가공될 수 있다.
본 발명의 일 구현예에 따르면, 수학적으로 가공된 데이터 세트는 상기 원시 데이터 세트의 신호값의 m차 변화량(m차 변화율)(여기서, m은 1 이상의 정수임)을 포함한다. 구체적으로, 상기 m은 1-10, 1-5, 1-3, 또는 1-2의 정수이다. 상기 신호값의 m차 변화량은 신호값의 m차 도함수(기울기)일 수 있다. 상기 m차 도함수는 선형회귀분석에 의해 얻어진 선형회귀선(증폭 반응의 복수의 사이클에 대한)의 기울기 값으로부터 얻을 수 있다. 이러한 수학적으로 가공된 데이터 세트는 "기울기 데이터 세트" 및 플롯팅되는 경우 "기울기 곡선"으로 지칭될 수 있다.
구체적으로, 본 발명에서 이용되는 선형회귀분석은 최소자승법에 따라 실시된다. 최소 자승법은 아래 수학식 1로 표시된다:
<식 1>
Figure pct00001
상기 식에서,
Figure pct00002
이고;
I는 기울기를 구하고자 하는 데이터 지점의 사이클이며;
m은 i번째 사이클에서의 데이터 지점의 기울기이고;
Xi는 i번째 사이클의 사이클이며;
Yi는 i번째 사이클에서 측정된 신호값이고;
n은 a+b+1이며;
a 및 b는 독립적으로 0-10의 정수(단, a는 I 미만이며, a+b+1은 2 내지 원시 데이터 세트의 데이터 지점의 개수의 범위이고, I+b는 원시 데이터 세트의 데이터 지점의 개수 미만임)이다.
상기 "a+b+1"은 i번째 사이클에서의 기울기를 구하기 위해 사용되는 데이터 지점의 개수이며, 최소자승법 범위(LSMR, Linear Squares Method Range)라 칭한다. "a"는 i번째 사이클에서의 기울기를 구하기 위해 사용되는 데이터 지점의 세트 중에서 최소 사이클을 구하기 위한 값이다. "b"는 최대 사이클을 구하기 위한 값이다. 데이터 지점의 개수는 전체 반응으로부터 수득된 데이터 지점을 가리키며, 플롯팅된 곡선의 최대 사이클 값(횟수)에 해당한다. 상기 "a" 및 "b"는 독립적으로 0-10, 바람직하게는 1-5, 더욱 바람직하게는 1-3의 정수를 나타낸다.
본 발명의 일 구현예에 따르면, 수학적으로 가공된 데이터 세트는 상기 원시 데이터 세트의 백그라운드 신호값을 제거하기 위하여 결정된 베이스라인에 의해 차감된(subtracted) 신호값을 포함하는 데이터 세트이다. 이러한 수학적으로 가공된 데이터 세트는 본원에서 "베이스라인 차감된 데이터 세트" 및 플롯팅되는 경우 "베이스라인 차감된 곡선"으로 불릴 수 있다.
베이스라인 차감된 데이터 세트는 당업계에 공지된 다양한 방법(예컨대, 미국특허 제8,560,247호)을 통하여 얻을 수 있다. 예를 들어, 상기 데이터 세트는 하기 단계를 포함하는 과정에 의해 얻을 수 있다: (i) 원시 데이터 세트를 사용하여 베이스라인 시작점 사이클과 종결점 사이클을 결정하여 베이스라인 영역을 결정하는 단계; (ii) 상기 결정된 베이스라인 영역 내의 적어도 2개의 데이터를 사용하여 베이스라인 영역의 최적라인(best-fit line) 함수를 확립하는 단계; 및 (iii) 원시 데이터 세트의 신호값으로부터 상기 최적라인 함수값을 차감하여 데이터 세트를 수득하는 단계.
구체적으로, 베이스라인 차감된 데이터 세트는 (i) 1번째, 2번째, 3번째, 4번째 또는 5번째 사이클부터 증폭이 시작되기 전 사이클까지의 영역을 베이스라인 영역으로 결정하는 단계; (ii) 상기 베이스라인 영역 내의 사이클에 대해 선형회귀선의 방정식을 계산하는 단계; 및 (iii) 각 사이클마다 측정된 신호값으로부터 상기 선형회귀선의 방정식에 의해 계산된 해당 사이클에서의 신호값을 차감하는 단계에 의해 수득될 수 있다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 제공되는 데이터 세트 풀은 원시 데이터 세트 및 이의 수학적으로 가공된 하나 이상의 데이터 세트로 이루어진 군으로부터 선택되는 적어도 하나의 데이터 세트를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 제공되는 데이터 세트 풀은 원시 데이터 세트 및 이의 수학적으로 가공된 데이터 세트를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 제공되는 데이터 세트 풀은 원시 데이터 세트 및 이의수학적으로 가공된 둘 이상의 데이터 세트를 포함한다.
보다 구체적으로, 단계 (b)에서 제공되는 데이터 세트 풀은 (i) 원시 데이터 세트; (ii) 상기 원시 데이터 세트의 신호값의 m차 변화량(여기서, m은 1 이상의 정수임)을 포함하는 수학적으로 가공된 데이터 세트; 및 (iii) 원시 데이터 세트의 백그라운드 신호값을 제거하기 위하여 결정된 베이스라인에 의해 차감된 신호값을 포함하는 수학적으로 가공된 데이터 세트를 포함한다.
전술한 데이터 세트 외에도, 단계 (b)에서 제공되는 데이터 세트 풀은 타겟 분석물질에 대한 신호 발생 수단을 사용한 증폭 반응으로부터 수득될 수 있는 다른 유형의 데이터 세트를 추가로 포함할 수 있다. 상기 데이터 세트 풀에 포함되는 다른 유형의 데이터 세트는 당업계에 공지된 다양한 유형의 데이터 세트일 수 있다. 상기 데이터 세트 풀에 포함되는 데이터 세트는, 상기 데이터 세트가 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는데 사용될 수 있는 한, 제한되지 않는다. 상기 데이터 세트 풀에 포함되는 데이터 세트는 프로그램, 소프트웨어 또는 알고리즘을 통해 수득되고 제공될 수 있다. 예를 들어, 프로그램, 소프트웨어 또는 알고리즘 내에 사용될 당업계에 공지된 다양한 유형의 데이터 세트들이 미리 입력된 후, 사용자는, 예를 들어 체크 박스를 통해, 상기 데이터 세트 풀에 포함시키고자 하는 데이터 세트의 유형을 선택(체크)할 수 있다. 상기 프로그램, 소프트웨어 및 알고리즘은 선택된 데이터 세트가 종래의 방법에 의해 증폭 반응의 결과로부터 생성되고, 상기 생성된 데이터 세트가 단계 (b)에서 제공(디스플레이)되도록 설계될 수 있다.
본 단계에서, 상이한 유형의 데이터 세트들이 제공되는 시점은 제한이 없다. 본 발명의 일 구현예에서, 상이한 유형의 데이터 세트들은 거의 동시에 제공될 수 있다. 본 발명의 또 다른 구현예에서, 상이한 유형의 데이터 세트들은 상이한 시점에 제공될 수 있으며, 예를 들어 순차적으로 제공될 수 있다. 데이터 세트들이 상이한 시점에 제공되더라도, 당업자는 상기 단계에서 최종적으로 하나의 데이터 세트 풀이 제공된다는 것을 인식할 것이다.
본 발명의 일 구현예에 따르면, 상이한 유형의 데이터 세트들 중 적어도 하나의 데이터 세트가 원하는 시점에 수득되거나 생성된 다음, 제공될 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 타겟 분석물질의 존재 또는 부존재를 결정하는데 사용될 데이터 세트들의 유형을 선택하는 단계를 추가로 포함할 수 있다.
(ii) 결정인자의 제공
두 번째로, 본 단계에서는 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자가 제공된다. 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트들을 미리 정해진 기준(criteria)에 의하여 평가함으로써 수득되고, 상기 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며, 상기 각각의 기준은 상기 각각의 유형의 데이터 세트에 대하여 미리 정해진다.
표현 "결정인자가 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트들을 평가함으로써 수득된다"는 것은 상기 결정인자가 반드시 상기 데이터 풀 내의 모든 데이터 세트들을 평가함으로써 수득된다는 것은 아니라는 것을 의미한다. 즉, 단계 (b)에서의 결정인자의 개수는 데이터 세트 풀 내의 데이터 세트들의 개수와 동일하거나 적을 수 있다. 예를 들어, 상기 단계 (b)에서 제공되는 데이터 세트 풀 내의 데이터 세트들의 개수는 5개인 반면, 상기 단계 (b)에서 제공되는 결정인자의 개수는 5개, 4개, 3개, 또는 2개일 수 있다.
본 발명의 일 구현예에 따르면, 상기 방법은 데이터 세트 풀 내의 데이터 세트들 중에서 평가될 데이터 세트를 선택하는 단계를 추가로 포함할 수 있다. 이후, 상기 선택된 데이터 세트만이 결정인자를 제공하는데 사용될 수 있다. 상기 평가될 데이터 세트의 선택은 특정한 프로그램, 소프트웨어 또는 알고리즘에 의해 구현될 수 있다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 데이터 세트 풀에 포함된 데이터 세트들의 전부일 수 있다. 이 경우, 상기 선택 단계는 데이터 세트 풀 내의 모든 데이터 세트들을 선택하는 것을 포함할 수 있다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 데이터 세트 풀 내에 포함된 데이터 세트들 중 일부일 수 있다. 이 경우, 상기 선택 단계는 데이터 세트 풀 내에서 일부 데이터 세트를 선택하는 것을 포함할 수 있다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 원시 데이터 세트 및 이의 수학적으로 가공된 하나 이상의 데이터 세트로 이루어진 군으로부터 선택되는 적어도 하나의 데이터 세트를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 원시 데이터 세트 및 이의 수학적으로 가공된 데이터 세트를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 원시 데이터 세트 및 이의 수학적으로 가공된 둘 이상의 데이터 세트를 포함한다.
보다 구체적으로, 단계 (b)에서 결정인자를 제공하기 위해 선택될 데이터 세트는 (i) 원시 데이터 세트, (ii) 상기 원시 데이터 세트의 신호값의 m차 변화량(여기서, m은 1 이상의 정수임)을 포함하는 수학적으로 가공된 데이터 세트, 및 (iii) 상기 원시 데이터 세트의 백그라운드 신호값을 제거하기 위하여 결정된 베이스라인에 의해 차감된 신호값을 포함하는 수학적으로 가공된 데이터 세트를 포함한다.
단계 (b)에서 결정인자를 제공하기 위해 평가될 2개 이상의 데이터 세트의 선택은 다양한 인자, 예를 들어 존재 또는 부존재를 결정하는데 있어서 특정 데이터 세트의 유용성, 특정 데이터 세트에 대한 선호도 등에 따라 달라될 수 있다.
본원에 사용된 바와 같이 용어 "결정인자(determinative factor)"는 데이터 세트를 기준에 따라 평가함으로써 수득된, 샘플 내 타겟 분석물질의 존재 또는 부존재의 확정적 결정을 하기 전의 예비적 참조사항을 의미한다. 용어 "결정인자"는 샘플 내 타겟 분석물질의 존재 또는 부존재를 확정적으로 결정하는데 있어 고려할 만한 인자를 가리킨다.
전술한 바와 같이, 하나의 데이터 세트로부터 하나의 결정인자가 수득된다. 즉, 본원의 2개 이상의 결정인자는 2개 이상의 상이한 유형의 데이터 세트들로부터 수득된 것이다.
본 발명의 일 구현예에 따르면, 상기 결정인자는 (i) 상기 타겟 분석물질의 존재의 개연성(probability)을 나타내는 양성 결정인자(positive determinative factor) 또는 상기 타겟 분석물질의 부존재의 개연성을 나타내는 음성 결정인자(negative determinative factor)이거나, (ii) 상기 타겟 분석물질의 존재 또는 부존재의 개연성을 나타내지 않으나 상기 타겟 분석물질의 존재 또는 부존재를 결정하는데 사용되는 전결정 값(predeterminative value)이다. 보다 구체적으로, 결정인자는 상기 타겟 분석물질의 존재의 개연성을 나타내는 양성 결정인자 또는 상기 타겟 분석물질의 부존재의 개연성을 나타내는 음성 결정인자다.
상기 결정인자는 다음 두 가지 유형으로 분류될 수 있다.
첫 번째 유형의 결정인자는, 그 자체가 타겟 분석물질의 존재 또는 부존재의 개연성을 나타낼 수 있는 결정인자를 포함한다.
구체적으로, 상기 결정인자는 양성 결정인자 또는 음성 결정인자로 표시된다. 상기 양성 결정인자 및 음성 결정인자는 지시값(indicative value)이거나 예/아니오 유형의 표시(indication)이다.
본원에 사용된 바와 같이 용어 "지시값"은 타겟 분석물질의 존재 및 부존재의 개연성을 나타내는 수치값으로서, 참조값과 비교하여 고려되된다. 상기 지시값은 타겟 분석물질의 존재의 개연성을 나타내는 수치값, 예를 들면 미리 정해진 역치를 초과하는 수치값 또는 타겟 분석물질의 부존재의 개연성을 나타내는 수치값, 예를 들면 미리 정해진 역치 이하의 수치값일 수 있다. 예를 들어, 특정한 데이터 세트에 대한 역치를 "50"으로 설정한 경우, 50을 초과하는 수치값(예컨대 60, 70 등)은 타겟 분석물질의 존재의 개연성을 나타내는 양성 결정인자인 반면, 50 이하의 수치값(예컨대 40, 30 등)은 타겟 분석물질의 부존재의 개연성을 나타내는 음성 결정인자일 수 있다.
본원에 사용된 바와 같이 용어 "예/아니오 유형의 표시"는 타겟 분석물질의 존재 또는 부존재의 개연성에 따라 결정인자를 오직 두 가지 표시(indication)로 표현하는 것을 의미한다. 상기 표시는 어떠한 기호(symbol), 단어(word) 및 기재(description)를 포함할 수 있다. 예를 들어, 결정인자가 타겟 분석물질의 존재를 나타내는 양성 결정인자로 표시되는 경우, 그것은 "+", "Yes", "Y", "1", "양" 또는 "P(positive)"로 표현될 수 있다. 결정인자가 타겟 분석물질의 부존재를 나타내는 음성 결정인자로 표시되는 경우, 그것은 "-", "No", "N", "O", "음" 또는 "N(negative)"로 표현될 수 있다. 상기 "예/아니오 유형의 표시"는 다양한 방식으로 표현될 수 있다.
본원에 사용된 바와 같이 용어 "개연성(probability)"은 타겟 분석물질의 존재 또는 부존재 중 어느 하나일 가능성이 50%, 60%, 70%, 80% 또는 90%를 초과하는 경우를 가리키기 위해 사용된다. 따라서, 표현 "타겟 분석물질의 존재의 개연성을 나타내는"은 타겟 분석물질의 존재 가능성이 50%, 60%, 70%, 80% 또는 90%를 초과하는 것을 의미하고, 표현 "분석물질의 부존재의 개연성을 나타내는"은 타겟 분석물질이 부존재 가능성이 50%, 60%, 70%, 80% 또는 90%를 초과하는 것을 의미한다.
본 발명의 특징 중 하나는, 예/아니오 유형의 표시와 같이 간단하게 표현된 결정인자를 이용한 경우에도, 종래기술들보다 개선된 정확도로 타겟 분석물질의 존재 또는 부존재를 확정적으로 결정할 수 있다는 것이다. 종래 방법에 따르면, 타겟 분석물질의 존재 또는 부존재를 단지 하나의 데이터 세트를 사용하여 평가해 왔으며, 이는 하나의 결정인자를 이용하는 것에 해당한다. 이에 반해, 본 발명은 2개 이상의 결정인자를 이용함으로써 보다 정확한 판정이 가능하다.
두 번째 유형의 결정인자는, 타겟 분석물질의 존재 또는 부존재의 개연성을 나타내지는 않으나, 타겟 분석물질의 존재 또는 부존재를 결정하는데 사용되는 전결정 값을 포함한다. 본원에 사용된 바와 같이 용어 "전결정 값"은 최종 결정에 사용되는 값이나, 상기 값 자체로는 타겟 분석물질의 존재 또는 부존재와 무관한 값이다. 예를 들어, 전결정 값이 "100"과 같은 수치 값인 경우, 이 수치 값 자체는 타겟 분석물질의 존재 또는 부존재의 개연성을 나타낼 수 없으나, 제공되는 결정인자 모두를 고려하여 타겟 분석물질의 존재 또는 부존재를 확정적으로 결정하는데 사용될 수 있다. 상기 전결정 값은 최종 값을 수득하기 위해 특정한 수학식 또는 연산에 적용될 수 있고, 이후 상기 최종 값은 미리 정해진 기준에 따라 평가되어 타겟 분석물질의 존재 또는 부존재를 나타낼 수 있다.
당업자는 이러한 결정인자는 예시에 불과할 뿐 다른 결정인자들이 대신 사용될 수 있음을 인식할 것이다.
전술한 결정인자는 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트들을 미리 정해진 기준으로 평가함으로써 수득된다.
본원에서 사용된 바와 같이 데이터 세트의 평가와 함께 사용된 용어 "기준"은 데이터 세트로부터 결정인자, 예컨대 양성 결정인자 또는 음성 결정인자, 또는 전결정 값을 도출하기 위한 근거를 의미한다. 또한, 상기 "기준"은 데이터 세트가 타겟 분석물질의 존재 또는 부존재를 나타내는 소정의 특성을 갖는지 확인하는데 사용될 수 있는 근거를 의미한다.
일 예로서, 상기 "기준"은 양성(타겟 분석물질의 존재) 샘플과 음성(타겟 분석물질의 부존재) 샘플을 구별하기 위하여 데이터 세트에 적용될 수 있는 지표 또는 항목을 가리킬 수 있다. 구체적으로, 신호값이 양성 샘플과 음성 샘플을 구별할 수 있는 지표로서 사용되는 경우, 상기 신호값이 "기준"이 될 수 있다.
다른 예로서, 상기 "기준"은 양성 샘플과 음성 샘플을 구별하기 위하여 데이터 세트에 적용될 수 있는 특정한 수치(예컨대, 역치)를 의미할 수 있다. 구체적으로, 수치 "200"이 양성 샘플과 음성 샘플을 구별하기 위한 값으로 설정된 경우, 상기 "200"이 "기준"이 될 수 있다.
추가 예로서, 상기 "기준"은 양성 샘플과 음성 샘플을 구별하기 위한 특정한 수치(예컨대, 임계값) 대비 조건을 의미할 수 있다. 구체적으로, "수치 200을 초과하는 경우, 상기 샘플은 양성 샘플에 해당한다"라는 표현이 "기준"이 될 수 있다.
상기 기준은 데이터 세트의 유형마다 달라질 수 있다.
상기 기준의 구체적인 예는, 비제한적으로 신호값들의 비율 역치, 선형 회귀에서 R2 역치, 신호 변화량(변화율)의 역치, 및 신호 역치를 포함한다. 상기 기준은 반복적인 실험에 의해 정해지거나, 당업계에 공지된 값 중에서 선택되거나, 참조 샘플(대조군 샘플)을 이용하여 정해질 수 있다. 당업자라면 상기 기재된 예시적인 기준 대신에 다른 적절한 기준이 선택되어 사용될 수 있음을 인식할 것이다.
본 발명의 일 구현예에 따르면, 하나의 사이클에서의 신호값 대 다른 사이클에서의 신호값의 비율로부터 기준이 정해질 수 있다. 일반적으로, 양성 샘플의 경우, 종결점 사이클에서의 신호값이 시작점 사이클에서의 신호값보다 더 큰 반면, 음성 샘플의 경우, 종결점 사이클에서의 신호값이 시작점 사이클에서의 신호값보다 크지 않다. 따라서, 종결점 사이클에서의 신호값 대 시작점 사이클에서의 신호값의 비율 "1.0"이 기준으로서 미리 정해질 수 있다. 이후, 1.0 이하의 비율을 갖는 데이터 세트로부터 음성 결정인자가 수득되고, 1.0 초과의 비율을 갖는 데이터 세트로부터 양성 결정인자가 수득될 수 있다. 이 경우, 신호값의 비율 "1.0"은 단계 (b)의 기준으로서 역할을 하는 역치이다.
본 발명의 일 구현예에 따르면, 하나의 영역에서의 평균 신호값 대 다른 영역에서의 평균 신호값의 비율로부터 기준이 정해질 수 있다. 일반적으로, 양성 샘플의 경우, 증폭 반응의 종결 영역(예컨대, 45 내지 50 사이클)에서의 평균 신호값이 시작 영역(예컨대, 1 내지 5 사이클)에서의 평균 신호값보다 더 큰 반면, 음성 샘플의 경우, 종결 영역에서의 평균 신호값이 시작 영역에서의 평균 신호값보다 크지 않다. 따라서, 종결 영역에서의 평균 신호값 대 시작 영역에서의 평균 신호값의 비율 "1.0"이 기준으로서 미리 정해질 수 있다. 이후, 1.0 이하의 비를 갖는 데이터 세트로부터 음성 결정인자가 수득되고, 1.0 초과의 비를 갖는 데이터 세트로부터 양성 결정인자가 수득될 수 있다. 이 경우, 평균 신호값의 비율 "1.0"은 단계 (b)의 기준으로서 역할을 하는 역치이다.
본 발명의 일 구현예에 따르면, 원시 데이터 세트의 일부 또는 전부에 대해 선형 회귀 적합(linear regression fit)을 실시한 후, 상기 선형 회귀에서 R2>0.99를 갖는 데이터 세트로부터 음성 결정인자가 수득되고, 그렇지 않은 경우 양성 결정인자가 수득된다. 이 경우, 상기 선형 회귀에서의 R2 "0.99"가 단계 (b)의 기준으로서 역할을 하는 역치이다.
본 발명의 일 구현예에 따르면, 원시 데이터 세트의 일부 또는 전부에 대하여 2차 회귀 적합(quadratic regression fit)을 실시한 후, 상기 2차 회귀에서 R2>0.98인 데이터 세트로부터 음성 결정인자가 수득되고, 그렇지 않은 경우 양성 결정인자가 수득된다. 이 경우, 상기 2차 회귀에서의 R2 "0.98"이 단계 (b)의 기준으로서 역할을 하는 역치이다.
본 발명의 일 구현예에 따르면, 원시 데이터 세트의 신호값의 m차 변화량을 포함하는 수학적으로 가공된 곡선(기울기 곡선)에 신호 변화율 "40"을 적용한 후, 40 이상의 피크 값을 갖는 데이터 세트로부터 음성 결정인자가 수득되고, 그렇지 않은 경우 양성 결정인자가 수득된다. 이 경우, 상기 신호 변화율 "40"이 단계 (b)의 기준으로서 역할을 하는 역치이다.
본 발명의 일 구현예에 따르면, 베이스라인이 차감된 수학적으로 가공된 데이터 세트에 신호값의 역치 "150"을 적용한 후, 150 이상의 최대 신호값을 갖는 데이터 세트로부터 양성 결정인자가 수득되고, 그렇지 않은 경우 음성 결정인자가 수득된다. 이 경우, 상기 신호값 "150"이 단계 (b)의 기준으로서 역할을 하는 역치이다.
이와 같이, 양성 또는 음성 결정인자를 수득하는데 사용되는 기준은 각 데이터 세트의 유형에 따라 달라질 수 있다.
본 단계에서, 상기 미리 정해진 기준을 이용한 데이터 세트의 평가는 전술한 바와 같이 타겟 분석물질의 존재 또는 부존재를 결정하기 위해 각각의 유형의 데이터 세트에 부여된 역치를 기준으로서 사용함으로써 실시될 수 있다.
또는, 상기 미리 정해진 기준을 이용한 데이터 세트의 평가는 타겟 분석물질의 존재 또는 부존재를 결정하기 위해 각각의 유형의 데이터 세트에 부여된 복수의 역치를 기준으로서 사용함으로써 실시될 수 있다. 예를 들어, 각각의 유형의 데이터 세트에 대해 미리 정해진 기준은 복수의 하위-기준을 포함할 수 있고, 상기 데이터 세트는 상기 하위-기준으로 평가되어, 복수의 하위-결정인자를 생성할 수 있다. 이후, 상기 하위-결정인자를 평가하여(예컨대, 연산에 의해) 데이터 세트에 대해 결정인자를 수득한다.
본 단계에서, 결정인자들이 제공되는 시점에 제한이 없다. 본 발명의 일 구현예에서, 상기 결정인자들은 거의 동시에 제공될 수 있다. 본 발명의 또 다른 구현예에서, 상기 결정인자들은 상이한 시점에 제공될 수 있으며, 예를 들어 순차적으로 제공될 수 있다. 상기 결정인자들은 데이터 세트가 제공된 후 곧바로 제공되거나, 데이터 세트의 제공과는 별개로 제공될 수 있다. 일례로, 제1 데이터 세트가 제공된 후 상기 데이터 세트에 대한 제1 결정인자가 제공되고, 이후에 제2 데이터 세트가 제공된 후 상기 데이터 세트에 대한 제2 결정인자가 제공된다. 다른 예로, 제1 데이터 세트 및 제2 데이터 세트가 제공된 후, 상기 제1 데이터 세트에 대한 제1 결정인자 및 상기 제2 데이터 세트에 대한 제2 결정인자가 제공될 수 있다.
본 발명의 일 구현예에 따르면, 상기 결정인자들 중 적어도 하나의 결정인자는 필요한 시점에 해당 데이터 세트로부터 수득된 다음 제공될 수 있다.
단계 (b)는 제공된 결정인자들 중에서 적어도 하나의 결정인자를 기준을 사용하여 평가하는 것을 포함할 수 있다. 본 발명의 일 구현예에서, 단계 (b)는 이전 결정인자를 기준을 사용하여 평가한 다음, 평가 결과에 따라 선택적으로 다음 결정인자를 제공하는 것을 포함할 수 있다.
단계 (c): 타겟 분석물질의 존재 또는 부존재의 결정(400)
본 단계에서는, 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정한다.
본원에 사용된 바와 같이, 표현 "결정인자 중 적어도 2개의 결정인자를 이용"한다는 것은 단계 (b)에서 제공된 모든 결정인자가 단계 (c)에서 반드시 이용되는 것은 아니라는 것을 의미한다. 즉, 단계 (b)에서 제공된 결정인자 중 일부 또는 전부가 단계 (c)에서의 결정에 이용될 수 있다. 구체적으로, 단계 (c)에서의 결정을 위해 단계 (b)에서 제공된 결정인자 중 일부를 이용하는 것은 하기 기재된 바와 같은 "순차적 결정 접근법"의 일 구현예일 수 있다.
또한, 본원에서 사용된 바와 같이 표현 "적어도 2개의 결정인자를 이용"한다는 것은 샘플 내 타겟 분석물질의 존재 또는 부존재의 결정에서 적어도 2개의 결정인자를 고려(평가)한다는 것을 의미한다. 즉, 상기 표현은 적어도 2개의 결정인자가 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 고려할만한 인자라는 것을 의미한다.
또한, 표현 "적어도 2개의 결정인자를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 것"은 미리 정해진 기준에 기초하여 적어도 2개의 결정인자를 평가하고 상기 평가 결과로부터 타겟 분석물질의 존재 또는 부존재를 결정하는 것을 포함하는 것으로 의도된다. 이러한 평가는 결정인자가 미리 정해진 기준을 만족하는지 확인하는 것을 가리킨다.
또한, 표현 "적어도 2개의 결정인자를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 것"은 결정인자의 평가 방법에 관계없이 타겟 분석물질의 존재 또는 부존재가 적어도 2개의 결정인자를 이용하여 최종적으로 결정될 수 있는 모든 경우를 포함하는 것으로 의도된다.
단계 (c)는 결정인자를 제공하는 단계에서 존재 또는 부존재 결정을 위해 사용되는 결정인자를 순차적으로 평가하는 것을 포함하며, 상기 적어도 2개의 결정인자는 상기 존재 또는 부존재 결정을 위해 최종적으로 평가된다. 또는, 단계 (c)는 결정인자를 제공하는 단계에서 존재 또는 부존재 결정을 위해 사용되는 결정인자를 순차적으로 평가하는 것을 포함하며, 이전 결정인자의 평가 결과에 따라 다음 결정인자가 제공되며, 상기 적어도 2개의 결정인자는 상기 존재 또는 부존재 결정을 위해 최종적으로 평가된다.
본 발명의 일 구현예에 따르면, 단계 (c)에서 이용되는 결정인자는 원시 데이터 세트 및 이의 수학적으로 가공된 하나 이상의 데이터 세트로 이루어진 군으로부터 선택되는 적어도 하나의 데이터 세트를 평가함으로서 수득된 적어도 하나의 결정인자를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (c)에서 이용되는 결정인자는 (i) 원시 데이터 세트를 평가함으로써 수득된 결정인자 및 (ii) 원시 데이터 세트의 수학적으로 가공된 데이터 세트를 평가함으로써 수득된 결정인자를 포함한다.
본 발명의 일 구현예에 따르면, 단계 (c)에서 이용되는 결정인자는 (i) 원시 데이터 세트를 평가함으로써 수득된 결정인자, 및 (ii) 원시 데이터 세트의 수학적으로 가공된 2개 이상의 데이터 세트를 평가함으로써 수득된 2개 이상의 결정인자를 포함한다.
보다 구체적으로, 단계 (c)에서 이용되는 이용되는 결정인자는 (i) 원시 데이터 세트를 평가함으로써 수득된 결정인자, (ii) 원시 데이터 세트의 신호값의 m차 변화량(여기서, m은 1 이상의 정수임)을 포함하는 수학적으로 가공된 데이터 세트를 평가함으로써 수득된 결정인자, 및 (iii) 원시 데이터 세트의 백그라운드 신호값을 제거하기 위하여 결정된 베이스라인에 의해 차감된 신호값을 포함하는 수학적으로 가공된 데이터 세트를 평가함으로써 수득된 결정인자를 포함한다.
본 발명의 일 구현예에 따르면, 결정인자가 양성 결정인자 또는 음성 결정인자로 표시되는 경우, 타겟 분석물질의 존재 또는 부존재의 결정은 다음과 같이 실시될 수 있다: 단계 (c)에서의 결정인자가 모두 양성 결정인자인 경우, 샘플 내 타겟 분석물질의 존재가 결정되고, 단계 (c)에서의 결정인자 중 적어도 하나의 결정인자가 음성 결정인자인 경우, 샘플 내 타겟 분석물질의 부존재가 결정된다. 예를 들어, 단계 (c)에서 사용된 3개의 결정인자가 (+), (+) 및 (+)인 경우, 샘플 내 타겟 분석물질의 존재가 결정되며, 그렇지 않으면 샘플 내 타겟 분석물질의 부존재가 결정된다.
구체적으로, 타겟 분석물질의 존재 또는 부존재의 결정은 크게 두 가지 접근법에 의해 실시될 수 있다: 총괄적(또는 병렬적) 결정 및 순차적(또는 직렬적) 결정.
(i) 총괄적(또는 병렬적) 결정 접근법
용어 "총괄적 결정 접근법" 또는 "병렬적 결정 접근법"은 단계 (b)에서의 결정인자를 총괄적으로 또는 동시에 고려하여 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 접근법을 가리킨다.
상기 총괄적 결정 접근법이 도 2에 예시되어 있다. 도 2에서 보는 바와 같이, 증폭 반응으로부터 3개의 데이터 세트들이 수득되며(200), 상기 데이터 세트들로부터 3개의 결정인자가 수득된다(300). 이후, 상기 3개의 결정인자를 총괄적으로 평가하여 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정한다(400).
샘플 내 타겟 분석물질의 존재 또는 부존재의 결정은 상기 2개 이상의 결정인자를 미리 정해진 존재 또는 부존재 기준으로 총괄적으로 평가함으로써 실시된다. 미리 정해진 존재 또는 부존재 기준을 이용한 2개 이상의 결정인자의 총괄적 평가는 상기 2개 이상의 결정인자의 조합이 미리 정해진 존재 또는 부존재 기준을 만족하는지 확인함으로써 실시된다.
상기 결정인자가 양성 결정인자 또는 음성 결정인자로 표시되는 경우, 상기 2개 이상의 결정인자의 조합은 단계 (c)에서 사용된 모든 결정인자의 집합을 포함할 수 있다. 예를 들어, 3개의 결정인자의 조합은 양성 결정인자, 양성 결정인자 및 음성 결정인자와 같은 3개의 결정인자의 집합을 포함할 수 있다.
또한, 상기 결정인자가 전결정 값으로 표시되는 경우, 상기 2개 이상의 결정인자의 조합은 전결정 값의 연산으로부터 도출된 값을 포함할 수 있다.
본원에서 사용된 바와 같이 용어 "존재 기준" 또는 "부존재 기준"은 상기 2개 이상의 결정인자의 조합을 사용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 근거를 가리킨다.
상기 2개 이상의 결정인자의 조합이 미리 정해진 존재 기준을 만족하면 샘플 내의 타겟 분석물질의 존재가 결정되고, 상기 2개 이상의 결정인자의 조합이 미리 정해진 부존재 기준을 만족하면 샘플 내의 타겟 분석물질의 부존재가 결정된다. 상기 존재 기준 및 부존재 기준은 이들이 상기 2개 이상의 결정인자의 모든 가능한 조합을 커버하도록 설정될 수 있거나, 상기 2개 이상의 결정인자의 모든 가능한 조합을 커버하지 않도록 설정될 수 있다. 상기 존재 및 부존재 기준이 모든 가능한 조합을 커버하도록 설정되는 경우, 반드시 존재 및 부존재 중 하나가 결정된다. 반면, 상기 존재 및 부존재 기준이 모든 가능한 조합을 커버하지 않도록 설정되는 경우, 일부 조합에서 존재 및 부존재 중 어느 것도 결정되지 않을 수 있다. 이 경우, 존재 및 부존재 이외의 다른 결정이 이뤄질 수 있으며, 예를 들어, '미확정' 또는 '재실험'과 같은 결정이 이뤄질 수 있다.
총괄적 결정 접근법의 일 구현예에 따르면, 결정인자가 양성 결정인자 또는 음성 결정인자일 때, 상기 미리 정해진 존재 또는 부존재 기준은 전체 결정인자 중 양성 결정인자 또는 음성 결정인자의 비율에 의해 정해질 수 있다.
일례로서, 상기 미리 정해진 존재 기준은 전체 결정인자 중 양성 결정인자의 비율이 50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과 또는 100%인 기준일 수 있다. 다른 예로서, 상기 미리 정해진 존재 기준은 전체 결정인자 중 음성 결정인자의 비율이 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 또는 0%인 기준일 수 있다.
일례로서, 상기 미리 정해진 부존재 기준은 전체 결정인자 중 음성 결정인자의 비율이 50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과 또는 100%인 기준일 수 있다. 다른 예로서, 상기 미리 정해진 부존재 기준은 전체 결정인자 중 양성 결정인자의 비율이 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 또는 0%인 기준일 수 있다.
특히, 상기 미리 정해진 존재 기준은 전체 결정인자 중 양성 결정인자의 비율이 100%인 기준일 수 있고, 상기 미리 정해진 부존재 기준은 전체 결정인자 중 음성 결정인자의 비율이 100%인 기준일 수 있다.
구체적으로, 존재 또는 부존재 결정에 사용되는 결정인자가 모두 양성인 경우, 샘플 내 타겟 분석물질의 존재가 결정되고, 결정인자 중 적어도 하나가 음성 결정인자인 경우, 샘플 내 타겟 분석물질의 부존재가 졀정된다. 예를 들어, 3개의 결정인자 중에서 2개가 양성 결정인자이고 1개가 음성 결정인자인 경우, 샘플 내 타겟 분석물질의 부존재가 최종적으로 결정된다(도 2 참고).
또는, 존재 또는 부존재 결정에 사용되는 결정인자 중 양성 결정인자의 개수가 음성 결정인자의 개수보다 큰 경우, 샘플 내 타겟 분석물질의 존재가 최종적으로 결정되고, 상기 단계 (b)에서 제공된 결정인자 중 음성 결정인자의 개수가 양성 결정인자의 개수보다 크거나 같은 경우, 샘플 내 타겟 분석물질의 부존재가 최종적으로 결정된다. 예를 들어, 존재 또는 부존재 결정을 위해 5개의 상이한 유형의 데이터 세트들로부터의 5개의 결정인자를 사용하는 구현예 방법에서, 5개의 결정인자 중에서 3개가 양성 결정인자이고 2개가 음성 결정인자인 경우, 샘플 내 타겟 분석물질의 존재가 최종적으로 결정된다.
일 구현예에 따르면, 결정인자가 전결정 값으로 표시될 때, 상기 미리 정해진 존재 또는 부존재 기준은 상기 전결정 값의 연산에 의해 정해질 수 있다.
일례로서, 상기 미리 정해진 존재 기준은 전결정 값의 연산으로부터 산출된 값이 미리 정해진 값보다 큰 기준일 수 있고, 상기 미리 정해진 부존재 기준은 전결정 값의 연산으로부터 산출된 값이 미리 정해진 값보다 작거나 같은 기준일 수 있다. 상기 존재 및 부존재 기준에 따라, 샘플 내 타겟 분석물질의 존재 또는 부존재가 최종적으로 결정될 수 있다. 예를 들어, 3개의 전결정 값의 연산으로부터 도출된 값 "p"가 미리 정해진 값 "q"보다 큰 경우 샘플 내 타겟 분석물질의 존재가 최종적으로 결정될 수 있고, 상기 "p"가 "q"보다 작거나 같은 경우 샘플 내 타겟 분석물질의 부존재가 확정적으로 결정될 수 있다.
상기 총괄적 결정 접근법의 일 구현예에 따르면, 각각의 결정인자에 가중치가 부여될 수 있다. 예를 들어, 특정한 데이터 세트를 평가하여 수득된 결정인자가 샘플 내 타겟 분석물질의 존재 또는 부존재의 결정에 있어서 신빙성이 더 높은 경우, 상기 결정인자에 더 높은 가중치를 부여할 수 있다.
(ii) 순차적(또는 직렬적) 결정 접근법
본원에 사용된 바와 같이 용어 "순차적 결정 접근법" 또는 "직렬적 결정 접근법"은 결정인자를 순서에 따라 순차적으로 고려하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계적 접근법을 가리킨다.
순차적 결정 접근법의 일 구현예에 따르면, 평가될 데이터 세트의 개수 및 유형이 미리 선택된 다음, 상기 데이터 세트에 순서가 부여된다. 이 경우, 첫 번째 순서의 데이터 세트를 제외한 데이터 세트들이 분석을 위해 평가될지 여부를 고려하지 않고 모두 생성되고 제공될 수 있거나, 이들이 분석에 필요할 때 생성되고 제공될 수 있다.
상기 순차적 결정 접근법은 당업자에 의해 다양한 방식으로 실시될 수 있다
일례로서, 상기 순차적 결정 접근법은 "진행 & 정지(Go & Stop)" 방식에 따라 실시될 수 있다. 상기 접근법은 2개 이상의 결정인자를 순차적으로 판단한다. 이전 결정인자가 "정지" 기준을 만족하는 것으로 평가되면, 다음 결정인자를 고려하지 않고 존재 또는 부존재가 곧바로 결정되며(정지), 이전 결정인자가 "진행" 기준을 만족하는 것으로 평가되면, 다음 순서의 결정인자가 평가된다(진행).
일 구현예에 따르면, 타겟 분석물질의 존재 또는 부존재의 결정은 데이터 세트 풀로부터 선택된 데이터 세트들에 순서를 부여하고, 해당 데이터 세트와 동일한 순서를 갖는 결정인자를 미리 정해진 "진행 또는 정지" 기준을 이용하여 상기 순서로 순차적으로 평가함으로써 실시된다. 구체적으로, 단계 (b)에서 데이터 세트 풀로부터 선택된 데이터 세트들에 순서가 부여될 수 있고, 상기 데이터 세트들은 결정인자를 수득하기 위해 순차적으로 평가된다. 이후, 해당 데이터 세트와 동일한 순서를 갖는 결정인자가 미리 정해진 "진행 또는 정지" 기준으로 순차적으로 평가된다.
일 구현예에 따르면, 평가될 결정인자는 미리 선택될 수 있다. 상기 선택된 결정인자는 평가 전에 모두 제공될 수 있다. 또는, 상기 결정인자는 순차적으로 제공될 수 있다. 따라서, 특정 순서의 결정인자가 "정지" 기준을 만족하면, 다음 결정인자 뿐만 아니라 다음 결정인자로부터의 데이터 세트를 수득하거나 제공할 필요가 없다.
용어 "진행 또는 정지" 기준은 2개 이상의 결정인자를 순차적으로 이용할 때 다음 결정인자를 고려할지 여부를 결정하기 위한 근거를 가리킨다. 본 발명의 일 구현예에서, "진행 또는 정지" 기준은 결정인자가 양성 또는 음성인지 여부 및 다음 결정인자가 존재하는지 아니면 존재하지 않는지 여부에 의해 정해진다.
본 발명에서 사용된 "진행 또는 정지" 기준은 "진행" 기준 및 "정지" 기준을 포함할 수 있다.
상기 "정지" 기준은 특정 순서의 결정인자가 샘플 내 타겟 분석물질의 존재 또는 부존재의 결정에 미치는 영향이 다른 결정인자에 비해 매우 유의하게 커서 다른 결정인자가 평가될 필요가 없다고 결론을 내리게 하는 기준을 가리킨다. 반면, "진행" 기준은 특정 순서의 결정인자가 샘플 내 타겟 분석물질의 존재 또는 부존재의 결정에 미치는 영향이 다른 결정인자에 비해 유의하지 않아 다른 결정인자를 평가할 필요가 있다고 결론을 내리게 하는 기준을 가리킨다.
본 발명의 일 구현예에 따르면, 상기 "진행 또는 정지" 기준은 (i) 결정인자가 음성인 "정지" 기준, (ii) 결정인자가 양성이고 다음 결정인자가 더 이상 존재하지 않는 "정지" 기준, 및 (iii) 결정인자가 양성이고 다음 결정인자가 존재하는 "진행" 기준을 포함하고, 특정 순서의 결정인자가 (i)에 의해 정해지는 "정지" 기준을 만족하는 경우, 타겟 분석물질의 부존재가 결정되고, 특정 순서의 결정인자가 (ii)에 의해 정해지는 "정지" 기준을 만족하는 경우, 타겟 분석물질의 존재가 결정되며, 특정 순서의 결정인자가 (iii)에 의해 정해지는 "진행" 기준을 만족하는 경우, 다음 결정인자가 평가된다.
순차적 결정 접근법의 한 가지 예가 도 3에 나타나 있다. 상기 순차적 결정 접근법에서, 3개의 결정인자(즉, 첫 번째, 두 번째 및 세 번째 결정인자)는 모두 분석 전에 미리 제공된다.
도 3에서 예시된 바와 같이, 첫 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가한다. 첫 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 두 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 다음 두 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가한다. 다음 두 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 세 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 세 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가한다. 다음 세 번째 결정인자는 양성("+")이고 다음 결정인자는 존재하지 않으므로, 이는 (ii)에 의해 정해진 "정지" 기준을 만족한다. 따라서, 샘플 내의 타겟 분석물질의 존재가 결정될 수 있다.
순차적 결정 접근법의 또 다른 예시가 도 4에 나타나 있다. 상기 순차적 결정 접근법에서, 3개의 결정인자(즉, 첫 번째, 두 번째 및 세 번째 결정인자)는 모두 분석 전에 미리 제공된다.
도 4에 예시된 바와 같이, 첫 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가한다. 첫 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 두 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 다음 두 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가한다. 다음 두 번째 결정인자는 음성("-")이므로, 이는 (i)에 의해 정해진 "정지" 기준을 만족한다. 따라서, 다음 결정인자(예컨대, 세 번째 결정인자)를 평가하지 않고 샘플 내의 타겟 분석물질의 부존재가 결정될 수 있다.
도 3 및 4에 예시된 바와 같이, 판단될 결정인자는 분석 전에 미리 선택되고 제공된다. 그러나, 이전 결정인자가 "정지" 기준을 만족하면 다음 결정인자가 평가될 필요가 없으므로, 다음 결정인자(예컨대, 도 4에서 세 번째 결정인자) 뿐만 아니라 해당 데이터 세트가 미리 수득 및 제공될 필요가 없다.
순차적 결정 접근법에 따르면, 단계 (b)에서 제공되는 결정인자의 개수와 단계 (c)에서 사용되는 결정인자의 개수 사이에는 어떠한 차이가 있을 수 있다. 이것은 이전 결정인자가 "정지" 기준을 만족하고 판단될 나머지 결정인자가 존재하는 경우에 발생한다.
순차적 결정 접근법의 경우, 단계 (c)에서 사용되는 데이터 세트(즉, 결정인자)의 개수는 특정 순서의 결정인자가 "정지" 기준 또는 "진행" 기준을 만족하는 것으로 평가될지 여부에 따라 달라질 수 있다.
택일적인 구현예에 따르면, "진행 또는 정지" 기준은 (i) 결정인자가 양성인 "정지" 기준, (ii) 결정인자가 음성이고 다음 결정인자가 더 이상 존재하지 않는 "정지" 기준, 및 (iii) 결정인자가 음성이고 다음 결정인자가 존재하는 "진행" 기준을 포함하며, 특정 순서의 결정인자가 (i)에 의해 정해지는 "정지" 기준을 만족하면, 타겟 분석물질의 존재가 결정되고, 특정 순서의 결정인자가 (ii)에 의해 정해지는 "정지" 기준을 만족하면 타겟 분석물질의 부존재가 결정되며, 특정 순서의 결정인자가 (iii)에 의해 정해지는 "진행" 기준을 만족하면, 다음 결정인자가 평가된다.
총괄적 접근법 및 순차적 접근법의 일부 구현예가 본원에 기재되었지만, 당업자라면 본 발명의 범위 및 취지를 벗어나지 않으면서 본원에 기재된 구현예의 다양한 변형 및 변화가 이루어질 수 있음을 인식할 것이다.
II. 기록매체, 장치 및 프로그램
본 발명의 다른 양태에 따르면, 본 발명은 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용한 증폭 반응의 결과를 받는 단계;
(b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자(determinative factor)를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
(c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
본 발명의 다른 양태에 따르면, 본 발명은 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용한 증폭 반응의 결과를 받는 단계;
(b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자(determinative factor)를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
(c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
이하 기재된 기록 매체, 장치 및 컴퓨터 프로그램은 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 타겟 분석물질에 대한 신호 발생 수단을 이용한 증폭 반응의 결과를 받는 지시; (ii) 데이터 세트 풀 및 2개 이상의 결정인자를 제공하는 지시; 및 (iii) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 샘플 내의 타겟 분석물질의 존재 또는 부존재를 확정적으로 결정하는 지시.
상기 기재된 본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 스탠드-얼로운 컴퓨터, 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
데이터 세트는 다양한 메커니즘을 통해 수집될 수 있다. 예를 들어, 데이터 세트는 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 데이터 세트는 데이터 지점이 수집되면서 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게는, 데이터 세트는, 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 기재된 컴퓨터 해독가능한 기록매체를 포함하는, 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 장치를 제공한다.
본 발명의 일 구현예에 따르면, 본 발명의 장치는 샘플 및 신호 발생 수단을 수용할 수 있는 반응용기, 상기 반응용기의 온도를 조절하는 온도조절 수단 및/또는 증폭 사이클에서의 신호를 검출하는 검출기를 추가적으로 포함할 수 있다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다.
본 발명의 일 구현예에 따르면, 프로세서는 타겟 핵산 분자의 검출에 이용되는 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨하여 구현시킬 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 증폭 반응으로부터 유래된 2개 이상의 데이터 세트를 이용하여, 샘플 내 타겟 분석물질의 존재 또는 부존재 결정에 있어 오류(특히, 위양성 오류)를 극적으로 감소시킨다.
(b) 본 발명이 예/아니오 유형의 표시에 의해 실시되는 경우, 본 발명은 종래 방법과 비교하여 향상된 정확도 및 간편성을 나타낸다.
도 1은 본 발명에 따른 대표적인 다중 데이터 세트 분석법(MDA)을 보여주는 흐름도이다.
도 2는 총괄적 결정 접근법에 기초한 MDA의 일 구현예를 보여주는 흐름도이다. 증폭 반응으로부터 3개의 데이터 세트가 수득되며(200), 상기 데이터 세트로부터 3개의 결정인자가 수득된다(300). 이후, 상기 3개의 결정인자를 총괄적으로 평가하여 시료 내의 표적 분석물질의 존재 또는 부존재를 결정한다.
도 3은 순차적 결정 접근법에 기초한 MDA의 일 구현예를 보여주는 흐름도이다. 순차적 결정 접근법에 따르면, 각 결정인자가 "진행 또는 정지" 기준을 만족하는지 순차적으로 평가된다. "진행 또는 정지" 기준은 (i) 결정인자가 음성인 "정지" 기준, (ii) 결정인자가 양성이고 다음 결정인자가 더 이상 존재하지 않는 "정지" 기준, 및 (iii) 결정인자가 양성이고 다음 결정인자가 존재하는 "진행" 기준을 포함하고; 특정 순서의 결정인자가 (i)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 부존재가 결정되고, 특정 순서의 결정인자가 (ii)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 존재가 결정되며, 특정 순서의 결정인자가 (iii)에 의해 정해지는 "진행" 기준을 만족하는 경우, 다음 결정인자가 평가된다. 도 3에서 첫 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가된다. 첫 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 두 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 다음 두 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가된다. 다음 두 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 세 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 세 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가된다. 다음 세 번째 결정인자는 양성("+")이고 다음 결정인자는 존재하지 않으므로, 이는 (ii)에 의해 정해진 "정지" 기준을 만족한다. 따라서, 샘플 내의 타겟 분석물질의 존재가 결정될 수 있다.
도 4은 순차적 결정 접근법에 기초한 MDA의 또 다른 구현예를 보여주는 흐름도이다. 도 4에서, 첫 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가된다. 첫 번째 결정인자는 양성("+")이고 다음 결정인자(예컨대, 두 번째 결정인자)가 존재하므로, 이는 (iii)에 의해 정해진 "진행" 기준을 만족한다. 따라서, 다음 두 번째 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가된다. 다음 두 번째 결정인자는 음성("-")이므로, 이는 (i)에 의해 정해진 "정지" 기준을 만족한다. 따라서, 다음 결정인자(예컨대, 세 번째 결정인자)를 평가하지 않고 샘플 내 타겟 분석물질의 부존재가 결정될 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 증폭 반응으로부터 다양한 데이터 세트의 수득 및 결정인자의 결정
본 발명의 다중 데이터 세트 분석법(MDA)의 유효성을 평가하기 위하여, 2개 또는 3개의 데이터 세트를 이용하는 MDA를 대조군으로서 1개의 데이터 세트만을 이용하는 단일 데이터 세트 분석법과 비교하였다.
타겟 핵산 서열을 포함하는 양성 샘플과 타겟 핵산 서열을 함유하지 않은 음성 샘플을 대상으로 실시간 중합효소 연쇄반응을 실시하여 하기와 같이 3가지 유형의 데이터 세트를 수득하였다: (i) 원시 데이터 세트; (ii) 수학적으로 가공된 데이터 세트 I; 및 (iii) 수학적으로 가공된 데이터 세트 II. 이후, 각각의 데이터 세트를 미리 정해진 기준으로 평가하여 양성 결정인자(타겟 핵산 서열의 존재의 개연성을 나타냄) 또는 음성 결정인자(타겟 핵산 서열의 부존재의 개연성을 나타냄)를 수득하였다.
<1-1> 원시 데이터 세트(raw data set)의 수득 및 결정인자의 결정
하기 샘플을 대상으로 실시간 PCR 반응을 실시하였다: (i) 다양한 농도의 관심있는 타겟 핵산 서열을 함유하는 것으로 분석된 24개의 샘플(양성 샘플); 및 (ii) 관심있는 타겟 핵산 서열을 함유하지 않는 것으로 분석된 129개의 샘플(음성 샘플). 타겟 핵산 서열은 캄필로박터 종의 게놈 DNA였다. 반응을 양성 샘플 또는 음성 샘플, 다운스트림 프라이머, 업스트림 프라이머, TaqMan 프로브, 및 MgCl2, dNTP 및 Taq DNA 중합효소를 함유하는 마스터 믹스를 함유하는 튜브에서 실시하였다. 반응 혼합물을 함유하는 튜브를 실시간 열순환기(CFX96; Bio-Rad)에 넣었다. 상기 반응 혼합물을 95℃에서 15분간 변성시킨 다음, 95℃에서 10초, 60℃에서 60초, 72℃에서 30초의 45 사이클을 실시하였다. 신호를 각 사이클의 72℃에서 검출하였다.
증폭 반응으로부터 각 샘플에 대하여 원시 데이터 세트를 수득하였다. 상기 원시 데이터 세트는 사이클 수 및 각 사이클 수에서의 상대적 형광 단위(RFU)로 구성되었다. 상기 RFU를 사이클 수에 대해 플롯팅하여 플롯(X축: 사이클 번호, Y축: RFU)을 수득하였다. 상기 플롯을 "베이스라인 차감되지 않은 곡선"으로 명명하였다.
이후, 각 베이스라인 차감되지 않은 곡선에 대하여, 하기 방정식 II를 이용하여 종결점 사이클(45 사이클)에서의 RFU 대 시작점 사이클(1 사이클)에서의 RFU의 비율을 계산하였다.
<식 II>
신호값 비율 = (45 사이클에서의 RFU) / (1 사이클에서의 RFU)
이후, 미리 정해진 비율 역치 이상의 비율을 갖는 샘플에 대해 양성 결정인자를 수득하고 상기 역치값 미만의 비율을 갖는 샘플에 대해 음성 결정인자를 수득하였다. 본 실시예에서, 비율 역치는 1.0으로 설정하였다.
<1-2> 수학적으로 가공된 데이터 세트 I의 수득 및 그의 결정인자의 결정
상기 실시예 <1-1>의 베이스라인 차감되지 않은 곡선을 각각 사용하여 당업계에 공지된 최소자승법(Least Square Method)에 의해 각 사이클에서의 형광값의 기울기를 계산하였다. 상기 계산된 기울기를 사이클 수에 대해 플롯팅하여 수학적으로 가공된 데이터 세트 중 하나인 이른바 '기울기 곡선(Slope Curve)'을 수득하였다.
이후, 각 기울기 곡선에 미리 정해진 기울기 역치를 적용하였다. 모든 사이클에서 상기 역치 이상의 기울기를 갖는 샘플에 대해 양성 결정인자를 수득하고, 모든 사이클에서 상기 역치 미만의 기울기를 갖는 샘플에 대해 음성 결정인자를 수득하였다. 본 실시예에서, 상기 기울기 역치는 40으로 설정하였다.
<1-3> 수학적으로 가공된 데이터 세트 II의 수득 및 그의 결정인자의 결정
상기 실시예 <1-1>의 베이스라인 차감되지 않은 곡선을 사용하여 베이스라인을 결정한 후, 상기 베이스라인 차감되지 않은 곡선으로부터 베이스라인을 차감하여 이른바 '베이스라인 차감된 곡선'을 수득하였다. 구체적으로, 3번째 사이클로부터 증폭이 시작되기 전 사이클까지의 영역을 베이스라인으로 설정하고, 상기 구간 내의 사이클에서의 신호값으로부터 선형 회귀 방정식을 구하였다. 이후, 각 사이클에서 측정된 신호값에서 선형 회귀 방정식에 의해 사이클에서 계산된 신호값을 차감하여 베이스라인 차감된 증폭 곡선을 수득하였다.
상기 베이스라인 차감된 각각의 곡선에 미리 정해진 신호 역치를 적용하였다. 모든 사이클에서 상기 역치 이상의 신호값을 갖는 샘플에 대해 양성 결정인자를 수득하고, 상기 역치 미만의 신호값을 갖는 샘플에 대해 음성 결정인자를 수득하였다. 본 실시예에서, 상기 신호 역치는 200으로 설정하였다.
실시예 2: 1개의 데이터 세트를 이용한 타겟 핵산 서열의 존재 또는 부존재의 결정
본 실시예에서는 각 샘플에 대해 1개의 데이터 세트를 사용하여 타겟 핵산 서열의 존재 또는 부존재를 결정하였다.
구체적으로, 각 샘플에 대해 실시예 <1-1>, <1-2> 및 <1-3>에 기재된 데이터 세트 중 1개의 데이터 세트를 미리 정해진 기준으로 평가하여 결정인자를 수득하였다. 상기 결정인자가 양성 결정인자인 것으로 평가되는 경우 타겟 핵산 서열의 존재를 최종 결정한 반면, 상기 결정인자가 음성 결정인자인 것으로 평가되는 경우 타겟 핵산 서열의 부존재를 최종 결정하였다.
실시예 <1-1>의 베이스라인 차감되지 않은 곡선에 대한 결과를 하기 표 1에 나타내었다.
샘플 베이스라인 차감되지 않은 곡선 오류 비율 (%)
오류 정상 전체 위양성 위음성
음성 39 90 129 25.5%
(39/153)
0.0%
(0/153)
양성 0 24 24
상기 표 1에서 보는 바와 같이, 총 129개의 음성 샘플 중 39개 샘플이 타겟 핵산 서열을 함유하는 양성 샘플로 잘못 평가되었다. 반면, 타겟 핵산을 함유하는 24개의 양성 샘플은 모두 양성 샘플로 정상적으로 평가되었다. 전체 153개의 샘플 중 위양성 오류 비율 및 위음성 오류 비율은 각각 25.5%(39/153) 및 0.0%(0/153)인 것으로 나타났다.
실시예 <1-2>의 기울기 곡선에 대한 결과를 하기 표 2에 나타내었다.
샘플 기울기 곡선 오류 비율(%)
오류 정상 전체 위양성 위음성
음성 9 120 129 5.9%
(9/153)
0.0%
(0/153)
양성 0 24 24
상기 표 2에서 보는 바와 같이, 총 129개의 음성 샘플 중 9개 샘플이 타겟 핵산 서열을 포함하는 양성 샘플로 잘못 평가되었다. 반면, 24개의 양성 샘플은 모두 양성 샘플로 정상적으로 평가되었다. 전체 153개의 샘플 중 위양성 오류 비율 및 위음성 오류 비율은 각각 5.9%(9/153) 및 0.0%(0/153)인 것으로 나타났다.
실시예 <1-3>의 베이스라인 차감된 곡선에 대한 결과를 하기 표 3에 나타내었다.
샘플 베이스라인 차감된 곡선 오류 비율(%)
오류 정상 전체 위양성 위음성
음성 8 121 129 5.2%
(8/153)
0.0%
(0/153)
양성 0 24 24
상기 표 3에서 보는 바와 같이, 전체 129개의 음성 샘플 중 8개의 샘플이 타겟 핵산 서열을 포함하는 것으로 잘못 평가되었다. 반면, 24개의 양성 샘플은 모두 양성 샘플로 정상적으로 평가되었다. 따라서, 총 153개의 샘플 중 위양성 오류 비율 및 위음성 오류 비율은 각각 5.2%(8/153) 및 0.0%(0/153)인 것으로 나타났다.
모든 실험 결과에서, 모든 양성 샘플은 정상적으로 평가되었지만, 상당수의 음성 샘플은 잘못 평가되었으며(위양성 오류의 발생), 이는 1개의 데이터 세트만을 이용하면 샘플 내 타겟 핵산 서열의 존재 또는 부존재의 결정시 위음성 오류가 발생할 가능성이 높다는 것을 입증한다.
실시예 3: 2개의 데이터 세트를 이용한 타겟 핵산 서열의 존재 또는 부존재의 결정
각 샘플에 대한 2개의 데이터 세트를 미리 정해진 기준을 이용하여 평가하여 2개의 결정인자를 얻은 다음, 하기와 같이 상기 2개의 결정인자의 몇 가지 조합을 이용하여 타겟 핵산 서열의 존재 또는 부존재를 결정하였다: (i) 실시예 <1-1> 및 <1-2>에서의 결정인자들의 조합; (ii) 실시예 <1-2> 및 <1-3>에서의 결정인자들의 조합; 및 (iii) 실시예 <1-1> 및 <1-3>에서의 결정인자들의 조합.
상기 조합에서, 2개의 결정인자가 모두 양성 결정인자인 경우 상기 샘플에 대해 타겟 핵산 서열의 존재를 최종적으로 결정하였고, 2개의 결정인자 중 어느 하나가 음성 결정인자인 경우 상기 샘플에 대해 타겟 핵산 서열의 부존재를 최종적으로 결정하였다.
실시예 <1-1>의 베이스라인 차감되지 않은 곡선 및 실시예 <1-2>의 기울기 곡선에 대한 결과를 하기 표 4 및 5에 나타내었다.
사례 베이스라인 차감되지 않은 곡선 기울기 곡선 샘플
음성 양성
1 - - 81 0
2 + - 39 0
3 - + 9 0
4 + + 0 24
전체 129 24
샘플 다중 데이터 분석법 오류 비율(%)
사례 오류 정상 전체 위양성 위음성
음성 사례 1~3 0 129 129 0.0%
(0/153)
0.0%
(0/153)
양성 사례 4 0 24 24
상기 표 4에서 보는 바와 같이, 129개의 음성 샘플 모두는 2개의 결정인자 중 어느 하나가 음성 결정인자인 사례 1 내지 3에 해당하는 것으로 평가되어, 음성 샘플로 정상적으로 평가되었다. 그리고, 24개의 양성 샘플 모두는 2개의 결정인자가 모두 양성 결정인자인 사례 4에 해당하는 것으로 평가되어, 양성 샘플로 정상적으로 평가되었다. 따라서, 표 5에서 보는 바와 같이, 전체 153개의 샘플에 대한 위양성 오류 비율 및 위음성 오류 비율은 각각 0.0%(0/153) 및 0.0%(0/153)인 것으로 나타났다. 상기 결과는 단일 데이터 세트 분석법에 의해 잘못 평가될 사례 2 및 3이 본 발명의 다중 데이터 세트 분석에 의해 잘못된 오류 없이 평가될 수 있음을 보여준다.
실시예 <1-2>의 기울기 곡선 및 실시예 <1-3>의 베이스라인 차감된 곡선에 대한 결과를 하기 표 6 및 7에 나타내었다.
사례 기울기 곡선 베이스라인 차감된 곡선 음성 샘플 양성 샘플
1 - - 116 0
2 + - 5 0
3 - + 4 0
4 + + 4 24
전체 129 24
샘플 다중 데이터 분석법 오류 비율(%)
사례 오류 정상 전체 위양성 위음성
음성 사례 1~3 4 125 129 2.6%
(4/153)
0.0%
(0/153)
양성 사례 4 0 24 24
상기 표 6에서 보는 바와 같이, 129개의 음성 샘플은 2개의 결정인자 중 어느 하나가 음성 결정인자인 사례 1 내지 3에 해당하는 것으로 평가되어, 모두 음성 샘플로 정상적으로 평가되었다. 총 129개 음성 샘플 중 4개의 음성 샘플은 2개의 결정인자 모두가 양성 결정인자인 사례 4에 해당하는 것으로 평가되어, 양성 샘플로 잘못 평가되었다(즉, 위양성 오류). 24개의 양성 샘플 모두는 사례 4에 해당하는 것으로 평가되어, 양성 샘플로 정상적으로 평가되었다. 따라서, 표 7에서 보는 바와 같이, 총 153개의 샘플 중 위양성 오류 비율 및 위음성 오류 비율은 각각 2.6%(4/153) 및 0.0%(0/153)인 것으로 나타났다. 상기 결과는 본 발명의 다중 데이터 세트 분석법이 위양성 오류를 제거하는데 있어서 단일 데이터 세트 분석법보다 우수함을 보여준다.
실시예 <1-1>의 베이스라인 차감되지 않은 곡선 및 실시예 <1-3>의 베이스라인 차감된 곡선에 대한 결과를 하기 표 8 및 9에 나타내었다.
사례 베이스라인 차감되지 않은 곡선 베이스라인 차감된 곡선 음성 샘플 양성 샘플
1 - - 84 0
2 + - 37 0
3 - + 6 0
4 + + 2 24
전체 129 24
샘플 다중 데이터 세트 분석법 오류 비율(%)
사례 오류 정상 전체 위양성 위음성
음성 사례 1~3 2 127 129 1.3%
(2/153)
0.0%
(0/153)
양성 사례 4 0 24 24
상기 표 8에서 보는 바와 같이, 129개의 음성 샘플 중 127개의 음성 샘플은 2개의 결정인자 중 어느 하나가 음성 결정인자인 사례 1 내지 3에 해당하는 것으로 평가되어, 음성 샘플로 정상적으로 평가되었다. 총 129개의 음성 샘플 중 2개의 음성 샘플은 2개의 결정인자 모두가 양성 결정인자인 사례 4에 해당하는 것으로 평가되어, 양성 샘플로 잘못 평가되었다. 24개의 양성 샘플은 2개의 결정인자 모두가 양성 결정인자인 사례 4에 해당하는 것으로 평가되어, 양성 샘플로 정상적으로 평가되었다. 따라서, 표 9에서 보는 바와 같이, 전체 153개의 샘플 중 위양성 오류 비율 및 위음성 오류 비율은 각각 1.3%(2/153) 및 0.0%(0/153)인 것으로 나타났다. 상기 결과는 본 발명의 다중 데이터 세트 분석법이 위양성 오류를 제거하는데 있어서 단일 데이터 세트 분석법보다 우수함을 보여준다.
상기 결과에서, 본 발명의 다중 데이터 세트 분석법은 모든 양성 샘플에 대해 정상적인 평가를 제공하나 소수의 음성 샘플에 대해 잘못된 평가(즉, 위양성 오류)를 제공한 것으로 나타났다. 다중 데이터 세트 분석법의 이러한 위양성 오류 비율이 실시예 2에서 나타난 단일 데이터 세트 분석법보다 훨씬 더 낮다는 점에 유의한다. 따라서, 다중 데이터 세트(예컨대, 2개의 데이터 세트)를 이용한 다중 데이터 세트 분석법이 위양성 오류의 발생을 크게 줄일 수 있음이 명확히 인식될 것이다.
실시예 4: 3개의 데이터 세트를 이용한 타겟 핵산 서열의 존재 또는 부존재의 결정
본 발명에 따른 다중 데이터 세트 분석법은 2가지 상이한 접근법으로 실시될 수 있다:
(i) 샘플에 대한 각각의 데이터 세트를 미리 정해진 기준에 따라 평가하여 타겟 핵산 서열의 존재와 관련된 양성 결정인자 또는 타겟 핵산 서열의 부존재와 관련된 음성 결정인자를 수득한 후, 상기 결정인자를 총괄적으로 평가하여 타겟 핵산 서열의 존재 또는 부존재를 최종적으로 결정하는 총괄적 결정 접근법; 및
(ii) 샘플에 대한 데이터 세트에 대한 결정인자를 순차적으로 평가하여 샘플 내 타겟 핵산 서열의 존재 또는 부존재를 최종적으로 결정하는 순차적 결정 접근법으로서, 이전 결정인자가 음성 결정인자인 경우(이전 결정인자가 "정지" 기준을 만족하는 경우) 다음 결정인자를 고려하지 않고 최종적으로 타겟 핵산 서열의 부존재가 결정되고, 이전 결정인자가 양성 결정인자이고 다음 결정인자가 더 이상 존재하지 않는 경우(이전 결정인자가 "정지" 기준을 만족하는 경우) 최종적으로 타겟 핵산 서열의 존재를 결정하고, 이전 결정인자가 양성 결정인자이고 다음 결정인자가 존재하는 경우(이전 결정인자가 "진행" 기준을 만족하는 경우) 다음 결정인자를 동일한 방식으로 순차적으로 평가하는 접근법.
<4-1> 총괄적 결정 접근법
실시예 <1-1> 내지 <1-3>의 데이터 세트를 전술한 총괄적 결정 접근법에 따라 평가하여 샘플 내 타겟 핵산 서열의 존재 또는 부존재를 결정하였다
이 분석에서, 3개의 데이터 세트에 대한 3개의 결정인자가 모두 양성 결정인자인 경우 최종적으로 샘플 내 타겟 핵산 서열의 존재를 결정하였고, 3개의 결정인자 중 어느 하나가 음성 결정인자인 경우 최종적으로 샘플 내 타겟 핵산 서열의 부존재를 결정하였다.
총괄적 결정 접근법에 따른 결과를 하기 표 10 및 11에 나타내었다.
사례 베이스라인 차감되지 않은 곡선 기울기 곡선 베이스라인 차감된 곡선 샘플
음성 양성
1 - - - 79 0
2 + - - 37 0
3 - + - 5 0
4 - - + 2 0
5 + + - 0 0
6 + - + 2 0
7 - + + 4 0
8 + + + 0 24
전체 129 24
샘플 다중 데이터 세트 분석법 오류 비율(%)
사례 오류 정상 전체 위양성 위음성
음성 사례 1~7 0 129 129 0.0%
(0/153)
0.0%
(0/153)
양성 사례 8 0 24 24
상기 표 10에서 보는 바와 같이, 129개의 음성 샘플 모두는 3개의 결정인자 중 어느 하나가 음성 결정인자인 사례 1 내지 7에 해당되는 것으로 평가되어, 음성 샘플로 정상적으로 평가되었다. 또한, 24개의 양성 샘플 모두는 3개의 결정인자 모두가 양성 결정인자인 사례 8에 해당되는 것으로 평가되어, 양성 샘플로 정상적으로 평가되었다. 따라서, 표 11에서 보는 바와 같이, 총 153개의 샘플에 대한 위양성 오류 비율 및 위음성 오류 비율은 각각 0.0%(0/153) 및 0.0%(0/153)인 것으로 나타났다. 상기 결과는 본 발명의 다중 데이터 세트 분석법이 위양성 오류를 제거하는데 있어서 단일 데이터 세트 분석법보다 우수함을 보여준다.
흥미롭게도, 모든 양성 및 음성 샘플은 총괄적 결정 접근법에 따라 정상적으로 평가되었다. 이 결과는 3개의 데이터 세트를 이용하는 총괄적 결정 접근법이 위양성 오류의 발생을 완전히 제거할 수 있음을 보여준다.
<4-2> 순차적 결정 접근법
본 실시예에서는 실시예 <1-1> 내지 <1-3>의 데이터 세트에 대한 결정인자를 순차적 결정 접근법에 따라 평가하여 샘플 내 타겟 핵산 서열의 존재 또는 부존재를 결정하였다.
구체적으로, 실시예 <1-1> 내지 <1-3>의 데이터 세트들에 순서를 부여하고, 상기 데이터 세트로부터 수득된 결정인자를 순서별로 순차적으로(상기 결정인자는 상응하는 데이터 세트와 동일한 순서를 자동적으로 가짐) 특정 순서의 결정인자가 "진행 또는 정지" 기준을 만족하는지 평가하였다. 특정 순서의 결정인자가 미리 정해진 "정지" 기준을 만족하는 경우 타겟 핵산 서열의 존재 또는 부존재를 결정하고, 특정 순서의 결정인자가 미리 정해진 "진행" 기준을 만족하는 경우, 다음 결정인자를 평가하였다. 상기 "정지" 기준은 특정 순서의 결정인자가 음성 결정인자인 기준, 또는 특정 순서의 결정인자가 양성 결정인자이고 다음 결정인자가 더 이상 존재하지 않는 기준으로 설정하였다. 상기 "진행" 기준은 특정 순서의 결정인자가 양성 인자이고 다음 결정인자가 존재하는 기준으로서 설정하였다.
(i) 단계 1: 베이스라인 차감되지 않은 곡선을 이용한 평가
24개의 양성 샘플 및 129개의 음성 샘플의 베이스라인 차감되지 않은 곡선을 미리 정해진 기준으로 평가하여 양성 결정인자 또는 음성 결정인자를 수득하였다. 음성 결정인자를 가진 샘플은 음성 샘플로 최종적으로 평가하였고, 양성 결정인자를 가진 샘플은 단계 2로 이동시켰다. 결과를 하기 표 12에 나타내었다.
샘플 전체 결과 비고
양성 결정인자 음성 결정인자
음성 129 39 90 90개 샘플이 음성 샘플로 최종 평가됨
양성 24 24 0
상기 표 12에서 보는 바와 같이, 총 129개의 음성 샘플 중 39개의 음성 샘플은 양성 결정인자를 갖는 것으로 나타난 반면, 90개의 음성 샘플은 음성 결정인자를 갖는 것으로 나타났다. 24개의 양성 샘플 모두는 양성 결정인자를 갖는 것으로 나타났다. 본 발명의 접근법에 따라, 음성 결정인자를 가진 90개 음성 샘플을 본 단계에서 음성 샘플로 최종 평가하였다.
(ii) 단계 2: 기울기 곡선을 이용한 평가
단계 1에서 양성 결정인자를 가졌던 63개의 샘플(39개의 음성 샘플 및 24개의 양성 샘플 포함)의 기울기 곡선을 미리 정해진 기준으로 추가로 평가하였다. 결과를 하기 표 13에 나타내었다.
샘플 전체 결과 비고
양성 결정인자 음성 결정인자
음성 39 0 39 39개 샘플이 음성 샘플로 최종 평가됨
양성 24 24 0
상기 표 13에서 보는 바와 같이, 39개의 음성 샘플은 모두 음성 결정인자를 갖는 것으로 평가되었고, 24개의 양성 샘플은 모두 양성 결정인자를 갖는 것으로 평가되었다. 본 발명의 접근법에 따라, 상기 음성 결정인자를 가진 39개의 샘플을 본 단계에서 음성 샘플로 최종 평가하였고, 양성 결정인자를 가진 샘플은 단계 3으로 이동시켰다.
(iii) 단계 3: 베이스라인 차감된 곡선을 이용한 평가
단계 2에서 양성 결정인자를 갖는 것으로 평가된 24개의 샘플(0개의 음성 샘플 및 24개의 양성 샘플 포함)의 베이스라인 차감된 곡선을 미리 정해진 기준으로 추가로 평가하였다. 결과를 하기 표 14에 나타내었다.
샘플 전체 결과 비고
양성 결정인자 음성 결정인자
음성 0 0 0
양성 24 24 0 24개 샘플이 양성 샘플로 최종 평가됨
상기 표 14에서 보는 바와 같이, 24개의 양성 샘플 모두는 양성 결정인자를 갖는 것으로 나타났다. 다른 데이터 세트로부터 수득된 다음 결정인자가 더 이상 존재하지 않으므로, 상기 양성 결정인자를 가진 24개의 샘플을 본 발명의 접근법에 따라 본 단계에서 양성 샘플로 최종 평가하였다. 상기 결과는 모든 양성 및 음성 샘플이 순차적 결정 접근법에 의해 정상적으로 평가되었음을 명확히 보여주었다.
상기 결과는 3개의 데이터 세트를 이용한 순차적 결정 접근법이 임의의 결정 오류를 완전히 제거할 수 있음을 입증한다. 또한, 상기 결과는 총괄적 및 순차적 결정 접근법이 택일적 방식으로 적절히 채택될 수 있음을 보여준다.
요약하면, 전술한 결과는 본 발명에 다른 다중 데이터 세트 분석법이 단일 데이터 세트 분석법과 비교하여 임의의 결정 오류를 유의하게 감소시켜 보다 정확하게 샘플 내 타겟 핵산 서열의 존재 또는 부존재를 결정할 수 있게 해준다는 것을 입증한다.
결론적으로, 본 발명에 따른 다중 데이터 세트 분석법은 단일 데이터 세트를 사용할 때 발생할 가능성이 높은 결정 오류(그 중에서도, 위양성 오류)를 제거하는데 효과적으로 그리고 신뢰성있게 사용될 수 있다. 또한, 단일 데이터 세트만을 이용하는 것보다 다중 데이터 세트를 이용한 종합적 분석법이 타겟 핵산 서열의 존재 또는 부존재를 결정하기 위한 다양한 사례에서 오류를 제거하는데 더 효과적이다. 또한, 총괄적 접근법 및 순차적 접근법은 실질적으로 동일한 결정 결과를 나타내므로, 과정상 약간의 차이가 있지만 사용자의 편의에 따라 택일적으로 채택될 수 있다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (20)

  1. 하기를 포함하는 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 방법:
    (a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용하여 증폭 반응을 실시하는 단계;
    (b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
    (c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
  2. 제 1 항에 있어서, 상기 타겟 분석물질은 타겟 핵산 분자인 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서, 상기 단계 (a)에서의 증폭 반응은 중합효소 연쇄 반응(PCR) 또는 실시간 PCR인 것을 특징으로 하는 방법.
  4. 제 1 항에 있어서, 상기 단계 (b)에서 제공되는 데이터 세트 풀은 원시 데이터 세트 및 이의 수학적으로 가공된 하나 이상의 데이터 세트로 이루어진 군으로부터 선택되는 적어도 하나의 데이터 세트를 포함하는 것을 특징으로 하는 방법.
  5. 제 4 항에 있어서, 상기 수학적으로 가공된 데이터 세트는 원시 데이터 세트의 신호값의 m차 변화량(여기서, m은 1 이상의 정수임)을 포함하는 데이터 세트; 또는 원시 데이터 세트의 백그라운드 신호값을 제거하기 위하여 결정된 베이스라인에 의해 차감된 신호값을 포함하는 데이터 세트인 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서, 상기 단계 (b)에서의 결정인자의 개수는 상기 데이터 세트 풀 내의 데이터 세트의 개수와 동일하거나 적은 것을 특징으로 하는 방법.
  7. 제 1 항에 있어서, 상기 단계 (b)에서 미리 정해진 기준을 이용한 데이터 세트의 평가는 타겟 분석물질의 존재 또는 부존재를 결정하기 위해 각각의 유형의 데이터 세트에 부여된 역치를 이용함으로써 실시되는 것을 특징으로 하는 방법.
  8. 제 1 항에 있어서, 상기 결정인자는 (i) 상기 타겟 분석물질의 존재의 개연성(probability)을 나타내는 양성 결정인자 또는 상기 타겟 분석물질의 부존재의 개연성을 나타내는 음성 결정인자이거나, (ii) 상기 타겟 분석물질의 존재 또는 부존재의 개연성을 나타내지 않으나 상기 타겟 분석물질의 존재 또는 부존재를 결정하는데 사용되는 전결정 값(predeterminative value)인 것을 특징으로 하는 방법.
  9. 제 8 항에 있어서, 상기 결정인자는 양성 결정인자 또는 음성 결정인자로 표시되고, 상기 단계 (c)에서의 결정인자가 모두 양성 결정인자인 경우, 샘플 내 타겟 분석물질의 존재가 결정되고, 단계 (c)에서의 결정인자 중 적어도 하나의 결정인자가 음성 결정인자인 경우, 샘플 내 타겟 분석물질의 부존재가 결정되는 것을 특징으로 하는 방법.
  10. 제 8 항에 있어서, 상기 양성 결정인자 및 음성 결정인자는 지시값(indicative value)이거나 예/아니오 유형의 표시(yes/no type indications)인 것을 특징으로 하는 방법.
  11. 제 1 항에 있어서, 상기 단계 (c)에서 사용된 결정인자는 원시 데이터 세트 및 이의 수학적으로 가공된 하나 이상의 데이터 세트로 이루어진 군으로부터 선택되는 적어도 하나의 데이터 세트를 평가함으로서 수득된 적어도 하나의 결정인자를 포함하는 것을 특징으로 하는 방법.
  12. 제 1 항에 있어서, 상기 타겟 분석물질의 존재 또는 부존재의 결정은 상기 2개 이상의 결정인자를 미리 정해진 존재 또는 부존재 기준으로 총괄적으로 평가함으로써 실시되는 것을 특징으로 하는 방법.
  13. 제 12 항에 있어서, 상기 미리 정해진 존재 또는 부존재 기준은, (i) 결정인자가 양성 결정인자 또는 음성 결정인자로 표시될 때, 전체 결정인자 중 양성 결정인자 또는 음성 결정인자의 비율, 또는 (ii) 결정인자가 전결정 값으로 표시될 때, 전결정 값의 연산에 의해 정해지는 것을 특징으로 하는 방법.
  14. 제 1 항에 있어서, 상기 타겟 분석물질의 존재 또는 부존재의 결정은 데이터 세트 풀로부터 선택된 데이터 세트에 순서를 부여하고, 해당 데이터 세트와 동일한 순서를 갖는 결정인자를 미리 정해진 "진행 또는 정지" 기준으로 순서별로 순차적으로 평가함으로써 실시되는 것을 특징으로 하는 방법.
  15. 제 14 항에 있어서, 상기 "진행 또는 정지" 기준은 결정인자가 양성 또는 음성인지 여부 및 다음 결정인자가 존재하는지 아니면 존재하지 않는지 여부에 의해 정해지는 것을 특징으로 하는 방법.
  16. 제 14 항에 있어서, 상기 "진행 또는 정지" 기준은 (i) 결정인자가 음성인 "정지" 기준, (ii) 결정인자가 양성이고 다음 결정인자가 더 이상 존재하지 않는 "정지" 기준, 및 (iii) 결정인자가 양성이고 다음 결정인자가 존재하는 "진행" 기준을 포함하고; 특정 순서의 결정인자가 (i)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 부존재가 결정되고, 특정 순서의 결정인자가 (ii)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 존재가 결정되며, 특정 순서의 결정인자가 (iii)에 의해 정해지는 "진행" 기준을 만족하는 경우, 다음 결정인자가 평가되는 것을 특징으로 하는 방법.
  17. 제 14 항에 있어서, 상기 "진행 또는 정지" 기준은 (i) 결정인자가 양성인 "정지" 기준, (ii) 결정인자가 음성이고 다음 결정인자가 더 이상 존재하지 않는 "정지" 기준, 및 (iii) 결정인자가 음성이고 다음 결정인자가 존재하는 "진행" 기준을 포함하고; 특정 순서의 결정인자가 (i)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 존재가 결정되고, 특정 순서의 결정인자가 (ii)에 의해 정해지는 "정지" 기준을 만족하는 경우 타겟 분석물질의 부존재가 결정되며, 특정 순서의 결정인자가 (iii)에 의해 정해지는 "진행" 기준을 만족하는 경우, 다음 결정인자가 평가되는 것을 특징으로 하는 방법.
  18. 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용한 증폭 반응의 결과를 받는 단계;
    (b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자(determinative factor)를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
    (c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
  19. (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 제18항의 컴퓨터 해독가능한 기록매체를 포함하는, 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 장치.
  20. 다중 데이터 세트 분석법(multiple data set analysis: MDA)에 의해 샘플 내의 타겟 분석물질(analyte)의 존재 또는 부존재를 결정하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램으로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 상기 타겟 분석물질에 대한 신호 발생 수단을 이용한 증폭 반응의 결과를 받는 단계;
    (b) (i) 상기 증폭 반응의 결과를 나타내는 상이한 유형의 데이터 세트들을 포함하는 데이터 세트 풀(pool) 및 (ii) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 2개 이상의 결정인자(determinative factor)를 제공하는 단계; 상기 결정인자는 상기 데이터 세트 풀로부터 선택된 2개 이상의 데이터 세트를 미리 정해진 기준(criteria)으로 평가함으로써 수득되고; 각각의 결정인자는 각각의 유형의 데이터 세트로부터 수득되며; 각각의 기준은 각각의 유형의 데이터 세트에 대해 미리 정해지며;
    (c) 상기 결정인자 중 적어도 2개의 결정인자를 이용하여 상기 샘플 내의 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
KR1020187008454A 2015-09-24 2016-09-23 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법 KR102165931B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020150135386 2015-09-24
KR20150135386 2015-09-24
PCT/KR2016/010708 WO2017052300A1 (en) 2015-09-24 2016-09-23 Multiple dataset analysis for determining the presence or absence of target analyte

Publications (2)

Publication Number Publication Date
KR20180035925A true KR20180035925A (ko) 2018-04-06
KR102165931B1 KR102165931B1 (ko) 2020-10-14

Family

ID=58386507

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187008454A KR102165931B1 (ko) 2015-09-24 2016-09-23 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법

Country Status (4)

Country Link
US (1) US20180247015A1 (ko)
EP (1) EP3353697A4 (ko)
KR (1) KR102165931B1 (ko)
WO (1) WO2017052300A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023177221A1 (en) * 2022-03-15 2023-09-21 Seegene, Inc. Device for determining presence/absence of target nucleic acid, method for determining presence/absence of target by the device, server for distributing update information, and method for distributing update information by the server
WO2024025390A1 (ko) * 2022-07-29 2024-02-01 주식회사 씨젠 파라미터의 임계값 설정용 인터페이스 제공 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019066572A2 (en) * 2017-09-28 2019-04-04 Seegene, Inc. . METHOD AND DEVICE FOR TARGET ANALYTE ANALYSIS IN A SAMPLE

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1798650A1 (en) * 2005-12-19 2007-06-20 Roche Diagnostics GmbH Analytical method and instrument
EP2653558A1 (en) * 2012-04-18 2013-10-23 Roche Diagniostics GmbH A method of detecting nucleic acid targets using a statistical classifier

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69837913T2 (de) * 1997-04-01 2008-02-07 Solexa Ltd., Saffron Walden Verfahren zur vervielfältigung von nukleinsäure
ES2357956T3 (es) * 2003-12-06 2011-05-04 Abbott Laboratories Método y sistema para analizar reacciones usando un sistema de información.
DE602005025791D1 (de) * 2004-10-18 2011-02-17 Univ Brandeis Verfahren zur nukleinsäureamplifikation
US7720611B2 (en) * 2005-05-13 2010-05-18 Bio-Rad Laboratories, Inc. Baselining amplification data
CA2736243A1 (en) * 2008-09-09 2010-03-18 Bio-Rad Laboratories, Inc. Multi-stage, regression-based pcr analysis system
US9607128B2 (en) * 2013-12-30 2017-03-28 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time PCR signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1798650A1 (en) * 2005-12-19 2007-06-20 Roche Diagnostics GmbH Analytical method and instrument
EP2653558A1 (en) * 2012-04-18 2013-10-23 Roche Diagniostics GmbH A method of detecting nucleic acid targets using a statistical classifier

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023177221A1 (en) * 2022-03-15 2023-09-21 Seegene, Inc. Device for determining presence/absence of target nucleic acid, method for determining presence/absence of target by the device, server for distributing update information, and method for distributing update information by the server
WO2024025390A1 (ko) * 2022-07-29 2024-02-01 주식회사 씨젠 파라미터의 임계값 설정용 인터페이스 제공 장치 및 방법

Also Published As

Publication number Publication date
EP3353697A4 (en) 2019-03-20
EP3353697A1 (en) 2018-08-01
WO2017052300A1 (en) 2017-03-30
US20180247015A1 (en) 2018-08-30
KR102165931B1 (ko) 2020-10-14

Similar Documents

Publication Publication Date Title
KR102326604B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
KR102300738B1 (ko) 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법
JP2012525147A5 (ko)
KR102270771B1 (ko) 표적 분석물질에 대한 데이터 세트의 보정 방법
KR102165933B1 (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
JP2022050639A (ja) 試料内ターゲット分析物を分析する方法及び装置
JP5591707B2 (ja) 特にリアルタイムpcrによる、核酸の集団の測定
KR102110985B1 (ko) 타겟 핵산 서열에 대한 시그널 추출
US11702697B2 (en) Quality testing of DNA samples
KR20210091371A (ko) 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
KR102408564B1 (ko) 타겟 핵산 서열의 존재를 결정하기 위한 분석 시그널
CN109576350B (zh) 一种dna与rna同时定量的试剂盒、方法及质控方法
JP2016189746A (ja) プライマー対、プローブ、薬剤耐性c型肝炎ウイルスの検出キット、薬剤耐性c型肝炎ウイルスの検出方法およびc型肝炎の予後予測方法
KR102110999B1 (ko) 타겟 핵산 서열에 대한 시그널을 제공하는 방법
KR20180135986A (ko) 데이터 세트에서 비정상적인 시그널의 검출

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant