KR20210091371A - 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법 - Google Patents

기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법 Download PDF

Info

Publication number
KR20210091371A
KR20210091371A KR1020217022246A KR20217022246A KR20210091371A KR 20210091371 A KR20210091371 A KR 20210091371A KR 1020217022246 A KR1020217022246 A KR 1020217022246A KR 20217022246 A KR20217022246 A KR 20217022246A KR 20210091371 A KR20210091371 A KR 20210091371A
Authority
KR
South Korea
Prior art keywords
data set
cycle
cycle number
value
function
Prior art date
Application number
KR1020217022246A
Other languages
English (en)
Inventor
김효진
이한빛
이영조
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20210091371A publication Critical patent/KR20210091371A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2561/00Nucleic acid detection characterised by assay method
    • C12Q2561/113Real time assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 기울기 데이터 세트에 대한 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법에 관한 것이다. 본 발명의 방법은 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수득하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며; 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고; 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계를 포함한다.

Description

기울기 데이터 세트에 대한 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
관련 출원에 대한 상호참조
본 출원은 2018년 12월 14일에 출원된 대한민국 특허출원 제2018-0162444호의 우선권을 주장하며, 이의 개시내용은 그 전체가 참조로 본원에 포함되어 있다.
기술분야
본 발명은 기울기 데이터 세트에 대한 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법에 관한 것이다.
핵산 증폭을 위해 가장 널리 사용되는 중합효소 연쇄반응(PCR)은 이중가닥 DNA의 변성 후 DNA 주형에의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클을 포함한다(Mullis 등, 미국 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., (1985) Science 230, 1350-1354).
실시간 PCR(Real-time PCR)은 샘플 내의 타겟 핵산을 실시간으로 검출하기 위한 PCR 기반 기술이다. 특정 타겟 핵산을 검출하기 위하여, 실시간 PCR은 타겟 핵산의 양에 비례하여 검출 가능한 형광 시그널을 발생할 수 있는 시그널 발생 수단을 이용한다. 형광 시그널의 발생은 이중 가닥 DNA 사이에 인터컬레이팅될 때 시그널을 발생하는 인터컬레이터 또는 형광 리포터와 ??처 분자를 갖는 올리고뉴클레오타이드를 사용하여 달성될 수 있다. 타겟 분자의 양에 비례하는 강도를 갖는 형광 시그널을 각 증폭 사이클에서 검출하고 증폭 사이클에 대해 플롯팅하여 증폭 곡선(amplification curve) 또는 증폭 프로파일 곡선(amplification profile curve)을 얻는다.
PCR 증폭 곡선은 전형적으로 다수의 단계, 즉 형광이 거의 일정하게 유지되는 베이스라인 단계, 형광이 각 사이클마다 거의 두 배가 되는 지수 단계, 및 증폭이 점점 감소되는 정체 단계를 갖는다.
베이스라인 단계는 PCR의 초기 단계 동안 형광 시그널이 거의 변화하지 않는 영역을 의미한다. 베이스라인 영역에서, PCR 앰플리콘의 수준은 검출되기에 충분하지 않으므로 이 영역에서 검출되는 시그널은 반응 시약 및 측정 장치로부터의 형광 시그널을 포함하는 배경 시그널(background signal)에 기인할 수 있다. 지수 단계는 증폭 산물의 증가에 비례하는 형광 시그널의 증가를 나타낸다. 정체 단계는 PCR 앰플리콘 및 형광 시그널 수준의 포화로 인해 형광 시그널이 거의 증가하지 않는 영역을 의미한다.
현재까지 실시간 PCR에 의해 수득된 데이터 세트를 사용하여 샘플 내 타겟 분석물질을 검출하기 위한 다양한 방법이 개발되었다.
한 가지 방법은 적어도 시그널 값이 미리 결정된 역치를 초과하는지 결정하는 단계를 포함한다. 이는 각 반응에 대해 보다 적합한 역치 값을 설정하기 위해 많은 데이터 세트를 수집하는 것을 요구한다. 대안으로서, 미국 특허 제6,303,305호 및 제6,783,934호는 증폭 곡선의 n차 도함수 최댓값을 역치 사이클(Ct) 값으로 결정하는 방법을 개시하고 있고, Liu 등은 시그모이드 피팅 모델의 일차 도함수 최댓값을 Ct 값으로 결정하는 방법을 개시하고 있다(Liu and Saint, 2002; Tichopad et al., 2002).
또한, 표준 곡선을 사용한 정량 방법이 당업계에 널리 알려져 있다. 그것은 공지된 표준 물질의 일련의 희석물을 사용하여 증폭 곡선을 생성하고 표준 물질의 로그(log) 변형된 농도를 Ct 값에 대해 플롯팅하여 정량을 위한 표준 곡선을 얻는다. 이후, 표준 곡선으로부터 미지의 샘플에 대한 Ct 값에 해당하는 농도를 계산하여 미지의 샘플을 정량한다.
다른 방법으로서, 내부 대조군(internal control)을 사용한 정량 방법이 제안되었다.
최근에는 증폭 곡선의 수학적 모델링을 통하여 타겟 핵산을 정량하기 위한 접근법이 제시되었다. 원시 PCR 형광 데이터의 지수 곡선의 형태는 증폭 효율에 관한 정보를 포함하고 있기 때문에, 각각의 PCR 반응의 동력학(kinetics)으로부터 효율을 계산하는 것이 이론적으로 가능하다. 다른 방법들은 증폭 곡선(Liu and Saint, 2002), 시그모이드 피팅 모델의 일차 도함수 최댓값(Liu and Saint, 2002; Tichopad et al., 2002), 상호작용 선형 윈도우(interactive window-of-linearity) 알고리즘(Ramakers et al., 2003), 중간값 지점(mid-value point) 회귀(Peirson et al., 2003), 스튜던트화 잔차 통계(studentized residual statistics) 후 4-매개변수 로지스틱 모델 피팅(FPLM)(Tichopad et lal., 2003), 및 동력학 이상치 감지(Kinetic outlier detection; KOD) 방법(Bar et al., 2003)의 사용을 포함한다.
전술한 방법들은 타겟 분석물질을 검출하기 위해, 반응으로부터 수득된 데이터 세트, 예컨대 원시 데이터 세트를 직접 이용하거나 그의 수학적 모델링에 초점을 맞추고 있다.
대안적인 접근법으로서, 본 발명은 기울기 데이터 세트에 대한 S자 형태의 함수를 사용하여 타겟 분석물질을 검출하는 새로운 방법을 제공한다.
본 명세서 전체에 걸쳐 다수의 특허들 및 문헌들이 참조되고 그 인용이 괄호로 표시되어 있다. 이러한 특허들 및 문헌들의 개시 내용은 본 발명 및 본 발명이 속하는 기술 수준을 보다 명확하게 설명하기 위하여 그 전체로서 본 명세서에 참조로 포함되어 있다.
본 발명자들은 타겟 분석물질의 검출을 위해 증폭 반응으로부터 수득된 데이터 세트를 처리하는 새로운 방법을 개발하고자 광범위한 연구를 수행하였다. 그 결과, 본 발명자들은 기울기 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수를 사용하여 타겟 분석물질을 검출할 수 있음을 확인하였다.
따라서, 본 발명의 목적은 샘플 내 타겟 분석물질을 검출하는 방법을 제공하는 데 있다.
본 발명의 다른 목적은 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 데 있다.
본 발명의 또 다른 목적은 샘플 내 타겟 분석물질을 검출하기 위한 장치를 제공하는데 있다.
본 발명의 또 다른 목적은 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하는데 있다.
본 발명의 다른 목적 및 이점은 첨부된 청구범위 및 도면과 함께 하기의 실시예, 청구범위 및 도면에 의해 보다 명확하게 된다.
I. 기울기 데이터 세트를 사용한 타겟 분석물질의 검출
본 발명의 일 양태에서, 본 발명은 하기 단계를 포함하는 샘플 내 타겟 분석물질을 검출하는 방법을 제공한다:
(a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수득하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
(b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
(c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
(d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
본 발명자들은 타겟 분석물질의 검출을 위해 증폭 반응으로부터 수득된 데이터 세트를 처리하는 새로운 방법을 개발하고자 광범위한 연구를 수행하였다. 그 결과, 본 발명자들은 기울기 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수를 사용하여 타겟 분석물질을 검출할 수 있음을 확인하였다.
본 발명의 방법에 따른 샘플 내 타겟 분석물질의 검출이 도 1에 개략적으로 예시되어 있다. 본 발명의 방법을 다음과 같이 보다 상세히 설명할 것이다:
단계 (a): 타겟 분석물질에 대한 제1 데이터 세트의 수득
본 발명에 따르면, 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수득한다(110). 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함한다.
본원에 사용된 제1 데이터 세트는 "증폭 데이터 세트"와 상호교환적으로 사용될 수 있다.
본원에서 사용된 용어 "타겟 분석물질(target analyte)"은 다양한 물질(예컨대, 생물학적 물질 및 비생물학적 물질, 예컨대 화학물질)을 포함할 수 있다. 구체적으로, 타겟 분석물질은 생물학적 물질, 예컨대 핵산분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원, 대사물질 및 세포를 포함할 수 있다. 보다 구체적으로, 타겟 분석물질은 핵산 분자를 포함할 수 있다. 타겟 분석물질은 샘플 내에 존재한다.
본원에서 사용된 바와 용어 "샘플"은 본 발명의 방법을 겪는 임의의 물질을 지칭한다. 특히, 용어 "샘플"은 관심있는 핵산을 함유하거나 함유할 것으로 추정되는 임의의 물질 또는 관심있는 타겟 핵산 서열을 함유하거나 함유할 것으로 추정되는 핵산 자체인 임의의 물질을 지칭한다. 보다 특히, 본원에 사용된 용어 "샘플"은 생물학적 샘플(예컨대, 생물학적 공급원으로부터의 세포, 조직 및 체액) 및 비생물학적 샘플(예컨대, 음식물, 물 및 토양)을 포함한다. 생물학적 샘플은 비제한적으로, 바이러스, 세균, 조직, 세포, 혈액, 혈청, 혈장, 림프, 객담, 스왑(swab), 흡인액(aspirate), 기관지 세척액, 우유, 소변, 분변, 안구액, 타액, 정액, 뇌 추출물, 척수액(SCF), 맹장, 비장 및 편도 조직 추출물, 복수 및 양막액을 포함한다. 또한, 샘플은 생물학적 공급원으로부터 단리된 자연 발생 핵산 분자 및 합성 핵산 분자를 포함할 수 있다.
본원에서 사용된 용어 "타겟 핵산", "타겟 핵산 서열", 또는 "타겟 서열"은 분석 또는 검출을 위한 관심 핵산 서열을 의미한다. 타겟 핵산 서열은 단일 가닥뿐만 아니라 이중 가닥 서열을 포함한다. 타겟 핵산 서열은 샘플 내에 초기에 존재하는 서열뿐만 아니라 반응에서 새롭게 생성된 서열을 포함한다.
타겟 핵산 서열은 임의의 DNA(gDNA 및 cDNA), RNA 분자 및 이들의 혼성체(키메라 핵산)를 포함한다. 서열은 이중 가닥 또는 단일 가닥 형태일 수 있다. 출발 물질로서 핵산이 이중 가닥인 경우, 상기 이중 가닥을 단일 가닥 또는 부분적 단일 가닥 형태로 만드는 것이 바람직하다. 가닥을 분리시키는 공지된 방법은 비제한적으로, 가열, 알카리, 포름아미드, 우레아 및 글리콕살 처리, 효소적 방법(예, 헬리카아제 작용) 및 결합 단백질을 포함한다. 예를 들어, 가닥 분리는 80-105℃의 온도에서 가열함으로써 달성될 수 있다. 이러한 처리를 달성하는 일반적인 방법은 문헌[Joseph Sambrook, 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)]에 개시되어 있다.
타겟 핵산 서열은 임의의 자연 발생 원핵세포 핵산, 진핵세포(예컨대, 원생동물과 기생동물, 균류, 효모, 고등 식물, 하등 동물 및 고등 동물, 예컨대 포유동물과 인간) 핵산, 바이러스(예컨대, 헤르페스 바이러스, HIV, 인플루엔자 바이러스, 엡스타인-바 바이러스, 간염 바이러스, 폴리오바이러스 등) 핵산 또는 비로이드 핵산을 포함한다. 핵산 분자는 또한 재조합으로 생산된 또는 생산될 수 있는 또는 화학적으로 합성된 또는 합성될 수 있는 임의의 핵산 분자일 수 있다. 따라서, 타겟 핵산 서열은 자연계에서 발견될 수 있거나 발견되지 않을 수 있다.
타겟 핵산 서열은 주어진 시점에 알려진 서열 또는 주어진 시점부터 이용가능한 서열로 한정하는 것으로 해석되지 않아야 하며, 대신에 현재 또는 미래의 어느 시점에 이용가능하거나 알려질 수 있는 서열을 포함하는 것으로 해석되어야 한다. 즉, 타겟 핵산 서열은 본 발명의 방법을 실시하는 시점에 알려지거나 알려지지 않을 수 있다. 알려지지 않은 타겟 핵산 서열의 경우, 그의 서열은 본 발명을 실시하기 전에 종래의 시퀀싱 방법 중 하나에 의해 결정될 수 있다.
타겟 분석물질이 타겟 핵산 분자인 경우, 샘플은 핵산 추출 과정을 거칠 수 있다. 핵산 추출 과정은 샘플의 종류에 따라 달라질 수 있다. 추출된 핵산이 RNA인 경우, 추출된 RNA로부터 cDNA를 합성하기 위한 역전사(reverse transcription) 과정을 추가로 실시된다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)).
본 발명의 일 구현예에 따르면, 타겟 핵산 서열은 뉴클레오타이드 변이를 포함한다.
본원에서 사용된 용어 "뉴클레오타이드 변이(nucleotide variation)"는 서열이 유사한 연속의 DNA 세그먼트 중 특정 위치의 DNA 서열에서의 어떤 단일 또는 복수의 뉴클레오타이드의 치환, 결실 또는 삽입을 의미한다. 이러한 연속적 DNA 세그먼트들은 하나의 유전자 또는 하나의 염색체의 어떤 다른 부위를 포함한다. 이러한 뉴클레오타이드 변이는 돌연변이(mutant) 또는 다형성 대립유전자 변이(polymorphic allele variations)일 수 있다. 예를 들어, 본 발명에서 검출되는 뉴클레오타이드 변이는 단일 뉴클레오타이드 다형성(single nucleotide polymorphism; SNP), 돌연변이(mutation), 결실, 삽입, 치환 및 전좌를 포함한다. 예시적인 뉴클레오타이드 변이는, 인간 지놈 내의 다양한 변이(예컨대, 메틸렌사수소 엽산 환원효소(methylenetetrahydrofolate reductase; MTHFR)에서의 변이), 병원체의 약제 내성과 관련된 변이 및 종양 형성-유발 변이를 포함한다. 본원에서 사용된 용어 "뉴클레오타이드 변이"는 핵산 서열의 특정 위치에서의 임의의 변이를 포함한다. 즉, 용어 "뉴클레오타이드 변이"는 핵산 서열의 특정 위치에서의 야생형 및 그의 임의의 돌연변이형을 포함한다.
일 구현예에서, 본원에서 사용되는 제1 데이터 세트는 시그널 발생 과정에 의하여 수득된다.
본원에서 사용된 용어 "시그널 발생 과정"은 샘플 내 타겟 분석물질의 특성, 즉 타겟 분석물질의 활성, 양 또는 존재(또는 부존재), 특히 샘플내 분석물의 존재(또는 부존재)에 의존적으로 시그널을 발생시킬 수 있는 임의의 과정을 의미한다. 본원에서 시그널 발생 과정은 생물학적 반응 및 화학적 반응을 포함한다. 이러한 생물학적 반응은 PCR, 실시간 PCR 및 마이크로어레이 분석과 같은 유전적 분석, 면역학적 분석 및 박테리아 성장 분석을 포함한다. 일 구현예에 따르면, 시그널 발생 과정은 화학 물질의 생성, 변화 또는 파괴를 분석하는 것을 포함한다.
시그널 발생 과정은 시그널 변화를 동반한다. 시그널 변화는 타겟 핵산 서열의 존재 또는 부존재를 정성적으로 또는 정량적으로 나타내는 지시자 역할을 할 수 있다.
"시그널 발생 과정"의 세부내용은 본 발명자들에 의해 출원된 WO 2015/147412에 개시되어 있으며, 이의 교시는 그 전체가 참조로 본원에 포함되어 있다.
일 구현예에 따르면, 시그널 발생 과정은 증폭 과정, 특히 시그널 증폭 과정이다.
본 발명의 일 구현예에 따르면, 시그널 발생 과정은 타겟 분석물질의 증폭을 동반하거나 동반하지 않는 과정이다.
구체적으로, 시그널 발생 과정은 타겟 핵산 분자의 증폭을 동반하는 과정이다. 보다 구체적으로, 시그널 발생 과정은 타겟 핵산 분자의 증폭을 동반하고 타겟 핵산 분자의 증폭시 시그널을 증가시키거나 감소시킬 수 있는(구체적으로, 시그널을 증가시킬 수 있는) 과정이다.
본원에서 사용된 용어 "시그널 발생"은 시그널의 출현 또는 소멸 그리고 시그널의 증가 또는 감소를 포함한다. 구체적으로, 용어 "시그널 발생"은 시그널의 증가를 의미한다.
시그널 발생 과정은 당업자에게 공지된 다양한 방법에 따라 실시될 수 있다. 이러한 방법의 예는 하기 시그널 발생 수단에 관한 설명을 참조할 수 있다.
일 구현예에 따르면, 시그널 발생 과정은 타겟 증폭과 함께 시그널 증폭을 수반하는 과정으로 실시될 수 있다.
일 구현예에 따르면, 시그널 발생 과정으로서 증폭 반응은 타겟 핵산 분자의 증폭과 동시에 시그널이 증폭되는 방식으로 실시된다(예컨대, 실시간 PCR). 택일적으로, 시그널 증폭 반응은 타겟 핵산 분자의 증폭 없이 시그널이 증폭되는 방식으로 실시된다(예를 들어, CPT 방법(Duck P, et al., Biotechniques, 9:142-148 (1990)), Invader assay(미국 특허 제6,358,691호 및 제6,194,149호)).
타겟 핵산 분자를 증폭하는 다양한 방법들이 알려져 있으며, 이는 비제한적으로 PCR(중합효소 연쇄반응), LCR(리가아제 연쇄반응, Wiedmann M, et al., "Ligase chain reaction (LCR)- overview and applications." PCR Methods and Applications, 3(4):S51-64(1994) 참고), GLCR(갭 필링 LCR, WO 90/01069, EP 0439182 및 WO 93/00447 참고), Q-beta(Q-beta replicase amplification, Cahill P, et al., Clin Chem., 37(9):1482-5(1991), 미국 특허 5,556,751 참고), SDA(strand displacement amplification, G T Walker et al., Nucleic Acids Res. 20(7):16911696(1992), EP 0497272 참고), NASBA(nucleic acid sequence-based amplification, Compton, J. Nature 350(6313):912(1991) 참고), TMA(Transcription-Mediated Amplification, Hofmann WP et al., J Clin Virol. 32(4):289-93(2005); 미국 특허 5,888,779 참고) 또는 RCA(Rolling Circle Amplification, Hutchison C.A. et al., Proc. Natl Acad. Sci. USA. 102:1733217336(2005) 참고)를 포함한다.
본원에서 사용된 용어 "시그널"은 측정가능한 아웃풋을 의미한다. 본원에 사용된 용어 "시그널 값"은 시그널을 정량적으로 나타내는 표현이다.
시그널의 세기 또는 시그널 변화는 분석물질(타겟 핵산 서열)의 존재 또는 부존재를 정성적으로 또는 정량적으로 나타내는 지시자 역할을 할 수 있다.
유용한 지시자의 예는 형광 세기, 발광 세기, 화학발광 세기, 생발광 세기, 인광 세기, 전하 이동, 전압, 전류, 전력, 에너지, 온도, 점성도, 광 스캐터, 방사능 세기, 반사도, 투광도 및 흡광도를 포함한다. 시그널 변화는 시그널 증가뿐만 아니라 시그널 감소를 포함할 수 있다. 일 구현예에 따르면, 시그널 발생 과정은 시그널 값을 증폭시키는 과정이다.
시그널은 시그널 검출로부터의 다양한 시그널 특성, 예컨대 시그널 세기[예컨대, RFU(relative fluorescence unit) 값 또는 증폭 반응을 실시하는 경우, 특정 사이클, 선택된 사이클 또는 엔드-포인트에서의 RFU 값], 시그널 변화 모양(또는 패턴) 또는 Ct 값 또는 상기 특성을 수학적으로 가공하여 얻은 값을 포함한다.
일 구현예에 따르면, 용어 "시그널"은 검출 온도에서 수득된 시그널 자체뿐만 아니라 상기 시그널을 수학적으로 가공하여 제공된 변형된 시그널을 포함한다.
본 발명의 일 구현예에 따르면, 실시간 PCR에 의해 증폭 곡선을 얻는 경우, 증폭 곡선으로부터 다양한 시그널 값(또는 특성)을 선택하고 타겟 존재를 결정하는데 사용할 수 있다(세기, Ct 값 또는 증폭 곡선 데이터).
시그널(특히, 시그널 세기)은 그의 검출 온도뿐만 아니라 사용된 시그널 발생 수단에 따라 달라질 수 있다.
본원에서 사용된 용어 "시그널 발생 수단"은 분석하고자 하는 타겟 분석물질의 특성, 보다 구체적으로 존재 또는 부존재를 나타내는 시그널의 발생에 사용되는 임의의 물질을 의미한다.
본원에서 사용된 용어 "시그널 발생 수단"은 타겟 핵산 서열의 존재를 나타내는 시그널을 발생하는데 사용되는 임의의 물질을 의미하며, 예컨대 올리고뉴클레오타이드, 표지 및 효소를 포함한다. 택일적으로, 본원에서 사용된 용어 "시그널 발생 수단"은 시그널 발생을 위한 물질을 사용하는 임의의 방법을 의미하기 위해 사용될 수 있다.
다양한 시그널 발생 수단이 당업자에게 알려져 있다. 시그널 발생 수단은 표지 자체 및 표지를 갖는 올리고뉴클레오타이드를 포함한다. 상기 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함할 수 있다. 상기 표지 자체, 예컨대 인터컬레이팅 염료(intercalating dye)가 시그널 발생 수단으로서의 역할을 할 수 있다. 택일적으로, 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지가 적어도 하나의 올리고뉴클레오타이드에 결합된 형태로 시그널 발생 수단으로서 사용될 수 있다. 시그널 발생 수단은 핵산 절단 효소(예컨대, 5'-뉴클레아제 및 3'-뉴클레아제)와 같은 시그널을 발생시키기 위한 추가적인 성분을 포함할 수 있다.
시그널 발생 수단은 이들의 시그널 발생 방식에 따라 다음과 같이 분류될 수 있다:
a. 타겟 핵산 서열 및 상기 타겟 핵산 서열에 특이적으로 혼성화되는 검출 올리고뉴클레오타이드 간의 이합체 형성에 의해 시그널을 발생시키는 시그널 발생 수단.
본원에서 사용된 바와 같이, 용어 "검출 올리고뉴클레오타이드(detection oligonucleotide)"는 검출될 시그널의 발생에 관여하는 올리고뉴클레오타이드이다. 일 구현예에 따르면, 상기 검출 올리고뉴클레오타이드는 실제 시그널 발생에 관여하는 올리고뉴클레오타이드를 포함한다. 예를 들어, 시그널 발생은 다른 올리고뉴클레오타이드(예컨대, 타겟 핵산 서열 또는 검출 올리고뉴클레오타이드에 상보적인 뉴클레오타이드 서열을 포함하는 올리고뉴클레오타이드)와 검출 올리고뉴클레오타이드의 혼성화 또는 비-혼성화에 좌우된다. 일 구현예에 따르면, 상기 검출 올리고뉴클레오타이드는 적어도 하나의 표지를 포함한다.
타겟 핵산 서열 및 검출 올리고뉴클레오타이드 간의 이합체 형성에 의한 시그널 발생은 스콜피온 방법(Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈 또는 앰플리플루오르 방법(Nazarenko 등, Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국 특허 제6,117,635호), 럭스 방법(미국 특허 제7,537,886호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), 분자 비콘 방법(Tyagi 등, Nature Biotechnology v.14 MARCH 1996), Hybeacon 방법(French DJ 등, Mol. Cell Probes, 15(6):363-374(2001)), 인접한 혼성화 프로브 방법(Bernard P.S. 등, Anal. Biochem., 273:221(1999)) 및 LNA 방법(미국 특허 제6,977,295호)을 포함하는 다양한 방법에 의해 달성될 수 있다.
b. 타겟 핵산 서열에 특이적으로 혼성화된 매개 올리고뉴클레오타이드(mediation oligonucleotide)의 절단에 의존적인 방식으로 이합체의 형성에 의해 시그널을 발생시키는 시그널 발생 수단. 본원에서 사용된 용어 "매개 올리고뉴클레오타이드"는 타겟 핵산 서열을 포함하지 않는 이합체의 생성을 매개하는 올리고뉴클레오타이드를 지칭한다.
일 구현예에 따르면, 상기 매개 올리고뉴클레오타이드의 절단 자체는 시그널을 발생하지 않고, 절단에 의해 형성된 단편이 시그널 발생을 위한 연속적인 반응에 관여한다.
상기 매개 올리고뉴클레오타이드의 절단에 의존적인 방식으로 형성된 이합체에 의한 시그널 발생은 PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO 2013/115442) 및 PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(WO 2014/104818)을 포함하는 다양한 공지된 방법에 의해 달성될 수 있다.
c. 검출 올리고뉴클레오타이드가 타겟 핵산 서열에 혼성화된 다음, 상기 검출 올리고뉴클레오타이드의 절단에 의해 시그널을 발생시키는 시그널 발생 수단. 상기 검출 올리고뉴클레오타이드가 타겟 핵산 서열에 혼성화된 다음, 상기 검출 올리고뉴클레오타이드의 절단에 의한 시그널 발생은 TaqMan 프로브 방법(미국 특허 제5,210,015호 및 미국 특허 제5,538,848호)을 포함하는 다양한 방법에 의해 달성될 수 있다.
d. 타겟 핵산 서열에 특이적으로 혼성화된 매개 올리고뉴클레오타이드의 절단에 의존적인 방식으로 검출 올리고뉴클레오타이드의 절단에 의해 시그널을 발생시키는 시그널 발생 수단.
일 구현예에 따르면, 타겟 핵산 서열에 혼성화된 매개 올리고뉴클레오타이드가 절단되어 단편을 방출하는 경우, 상기 단편은 검출 올리고뉴클레오타이드에 특이적으로 혼성화되어 상기 검출 올리고뉴클레오타이드의 절단을 유도한다.
상기 매개 올리고뉴클레오타이드의 절단에 의존적인 방식의 검출 올리고뉴클레오타이드의 절단에 의한 시그널 발생은 Invader 분석(미국 특허 제5,691,142호), PCEC(PTO Cleavage and Extension-Dependent Cleavage) 방법(WO 2012/134195) 및 미국 특허 제7,309,573호에 기재된 방법을 포함하는 다양한 방법에 의해 달성될 수 있다.
본원에서 사용된 용어 "시그널 증폭 반응"은 시그널 발생 수단에 의하여 발생되는 시그널을 증가 또는 감소시키는 반응을 의미한다.
일 구현예에 따르면, 시그널 증폭 반응은 시그널 발생 수단을 사용하여 타겟 분석물질의 존재에 의존적으로 발생하는 시그널의 증가(또는 증폭)를 의미한다. 시그널 증폭 반응은 타겟 분석물질(예컨대, 타겟 핵산 분자)의 증폭을 동반하거나 동반하지 않는다. 보다 구체적으로, 시그널 증폭 반응은 타겟 분석물질의 증폭을 동반하는 시그널 증폭을 의미한다.
시그널 증폭 반응에 의해 수득되는 제1 데이터 세트는 사이클 번호를 포함한다.
본원에서 사용된 용어 "사이클 번호" 또는 "사이클"은 조건의 변화를 수반한 복수의 측정에서 조건의 변화 단위를 말한다. 예를 들어, 조건의 변화는 온도, 반응 시간, 반응 횟수, 농도, pH 및/또는 타겟 핵산 분자 서열의 복제 횟수의 변화를 포함한다. 따라서, 사이클은 시간 또는 공정 사이클, 단위 작동 사이클 및 재현 사이클을 포함할 수 있다.
일 예로서, 효소 동력학을 조사하는 경우, 기질의 농도를 규칙적으로 증가시키면서 효소의 반응 속도를 수 차례 측정한다. 이 반응에서, 기질 농도의 증가가 조건의 변화에 해당할 수 있고, 기질 농도의 증가 단위가 사이클에 해당할 수 있다.
다른 예로서, 등온 증폭(isothermal amplification)은 등온 조건 하의 반응 시간 동안 수차례 샘플을 측정하게 하며, 반응 시간이 조건의 변화에 해당할 수 있고, 반응 시간의 단위가 사이클에 해당할 수 있다. 예를 들어, 5, 10, 15분 등과 같은 5분 간격이 하나의 반응 시간으로 설정되는 경우, 사이클은 5분 사이클, 10분 사이클, 15분 사이클 등으로 표현될 수 있다. 택일적으로, 5분 간격을 하나의 단위로 간주하면, 5분 사이클은 1번째 사이클, 10분 사이클은 2번째 사이클, 15분 사이클은 3번째 사이클 등으로 나타낼 수 있다.
또 다른 예로서, 멜팅 분석 또는 혼성화 분석의 경우, 일정 범위의 온도 내에서 온도를 변화시키면서 시그널의 변화를 측정할 수 있으며, 온도가 조건의 변화에 해당할 수 있고, 온도 단위(예를 들어, 측정 온도)가 사이클에 해당할 수 있다. 예를 들어, 40℃, 40.5℃, 50℃, 50.5℃ 등과 같이 0.5℃ 간격이 하나의 반응 시간으로 설정되는 경우, 사이클은 40℃ 사이클, 40.5℃ 사이클, 50℃ 사이클, 50.5℃ 사이클 등으로 표현될 수 있다. 택일적으로, 0.5℃ 간격을 하나의 단위로 간주하면, 40℃ 사이클은 1번째 사이클, 40.5℃ 사이클은 2번째 사이클, 50℃ 사이클은 3번째 사이클 등으로 나타낼 수 있다.
구체적으로, 일련의 반응을 반복하거나 일정한 시간 간격으로 반응을 반복하는 경우, 용어 "사이클"은 상기 반복의 하나의 단위를 의미한다.
예를 들어, 중합효소 연쇄반응(PCR)에서, 사이클은 타겟 분자의 변성(denaturation), 타겟 분자와 프라이머 간의 어닐링(혼성화) 및 프라이머 연장을 포함하는 반응 단위를 의미한다. 상기 반응의 반복의 증가가 조건의 변화에 해당할 수 있고, 상기 반복의 단위가 사이클에 해당할 수 있다.
증폭 반응에 의해 수득된 제1 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호 및 상기 사이클 번호에서의 시그널 값을 갖는다.
본 명세서에서 사용된 용어 "시그널 값"은 시그널 발생 과정의 각 사이클에서 실제적으로 측정된 시그널 수준(예컨대, 시그널의 세기)의 수치 값 또는 이의 변형을 의미한다. 상기 변형은 측정된 시그널 값의 수학적으로 가공된 값을 포함할 수 있다. 측정된 시그널 값(즉, 원시 데이터 세트의 시그널 값)의 수학적으로 가공된 값의 예는 더하기, 빼기, 곱하기, 또는 나누기에 의해 수득된 값, 또는 로그값을 포함할 수 있다.
본원에서 사용된 용어 "데이터 지점(data point)"은 사이클 및 상기 사이클에서의 시그널 값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 본원에서 사용된 용어 "데이터"는 데이터 세트를 구성하는 모든 정보를 의미한다. 예컨대, 증폭 반응의 사이클 및 시그널 값 각각은 데이터이다.
시그널 발생 반응, 특히 시그널 증폭 반응으로부터 수득된 데이터 지점들은 직교 좌표계 내의 좌표값으로 플롯팅될 수 있다. 직교 좌표 시스템에서, X-축은 증폭 반응의 사이클을 나타내며, Y-축은 각 사이클에서 측정된 시그널 값 또는 이들의 변형을 나타낸다.
본원에서 사용된 용어 "데이터 세트"는 데이터 지점들의 세트를 의미한다. 예를 들어, 데이터 세트는 시그널 발생 수단을 사용한 증폭 반응으로부터 직접 수득되는 데이터 지점의 세트인 원시 데이터 세트를 포함할 수 있다. 택일적으로, 데이터 세트는 시그널 발생 과정으로부터 직접 수득된 데이터 지점의 세트를 포함하는 데이터 세트의 변형에 의해 수득되는 변형된 데이터 세트일 수 있다. 상기 데이터 세트는 시그널 발생 과정으로부터 수득된 데이터 지점들의 전체 또는 일부 세트를 포함할 수 있다. 상기 데이터 세트는 복수의 데이터 지점을 포함한다. 데이터 세트는 적어도 2개의 데이터 지점을 포함할 수 있다. 구체적으로, 데이터 세트 내의 데이터 지점의 수는 적어도 2, 3, 4, 5, 10 또는 20개일 수 있다. 또한 데이터 세트 내의 데이터 지점의 수는 1000개 이하의 데이터 지점일 수 있다. 구체적으로, 데이터 세트 내의 데이터 지점의 수는 1000, 500, 300, 200, 100, 90, 80, 70, 60개 이하일 수 있다. 데이터 세트 내의 데이터 지점의 수는 3-1000개일 수 있다. 구체적으로, 3-1000, 10-500, 1-100, 20-100, 20-80, 20-70, 20-60개일 수 있다. 일 구현예에 따르면, 데이터 세트 내의 데이터 지점의 수는 20 내지 60개일 수 있다.
일 구현예에서, 제1 데이터 세트는 복수의 데이터 세트를 가공하여 수득될 수 있다. 2개의 타겟 분석물질을 단일 반응에서 검출하는 경우, 2개의 타겟 분석물질 각각에 대한 데이터 세트는 단일 반응에 의해 수득된 데이터 세트를 가공함으로써 제공될 수 있다. 예를 들어, 2개의 타겟 분석물질 각각에 대한 데이터 세트는 2개의 상이한 검출 온도에서의 시그널을 측정함으로써 2개의 데이터 세트를 수득하고 상기 2개의 데이터 세트를 가공함으로써 제공될 수 있다.
제1 데이터 세트는 플롯팅되어 증폭곡선을 얻을 수 있다.
본 발명의 일 구현예에 따르면, 증폭 곡선은 타겟 분석물질(구체적으로, 타겟 핵산 분자)의 증폭 반응에 의해 얻어진 증폭 곡선이다.
일 구현예에서, 본 발명의 단계 (a)의 제1 데이터 세트는 원시 데이터 세트(raw data set), 상기 원시 데이터 세트의 수학적으로 변형된 데이터 세트, 상기 원시 데이터 세트의 표준화(normalization)된 데이터 세트 또는 상기 수학적으로 변형된 데이터 세트의 표준화된 데이터 세트일 수 있다.
본 발명의 특정 구현예에서, 단계 (a)의 제1 데이터 세트는 원시 데이터 세트이다. 본원에서 사용된 바와 같이, 용어 "원시 데이터 세트"는 시그널 발생 반응으로부터 직접 수득한 시그널을 포함하는 데이터 세트를 말한다. 예를 들어, 원시 데이터 세트는 시그널 수신 장치로부터 수득되고, 수집 장치 상에서 기본적인 시그널 가공을 거친 다음, 시그널 분석 단계로 넘어오는 시그널의 세트를 포함한다.
본 발명의 특정 구현예에서, 단계 (a)의 제1 데이터 세트는 원시 데이터 세트의 수학적으로 변형된 데이터 세트이다. 본원에서 사용된 용어 "수학적으로 가공된 데이터 세트"는 원시 데이터 세트로부터 수학적 가공을 통해 변환된 데이터 세트를 지칭한다. 상기 수학적으로 가공된 데이터 세트는 원시 데이터 세트로부터 배경 시그널 값을 제거함으로써 수득된 베이스라인 차감된 데이터 세트이다. 베이스라인 차감된 데이터 세트는 당업계에 공지된 다양한 방법(예컨대, 미국특허 제8,560,247호)에 의해 수득될 수 있다.
본 발명의 일 구현예에서, 단계 (a)의 제1 데이터 세트는 원시 데이터 세트의 표준화된 데이터 세트 또는 수학적으로 변형된 데이터 세트의 표준화된 데이터 세트이다. 본원에서 사용된 용어 "표준화(normalization)"는 복수의 반응들에 대한 데이터 세트들 사이의 시그널 편차를 줄이거나 없애는 과정(process)을 의미한다. 본원에서 사용된 용어 "보정" 또는 "조정"은, 분석 목적을 위해 데이터 세트의 데이터(특히, 시그널 값)를 정정 또는 변형하는 것을 의미한다. 표준화는 보정의 일 양태이다.
일 구현예에 따르면, 상기 표준화된 데이터 세트는 하기 단계를 포함하는 방법에 의해 제공될 수 있다:
(i) 상기 원시 데이터 세트 또는 상기 원시 데이터 세트의 수학적으로 변형된 데이터 세트를 보정(calibration)하기 위한 표준화 계수(normalization coefficient)를 제공하는 단계; 상기 데이터 세트는 시그널 발생 수단을 이용한 시그널 발생 반응에 의하여 발생된 시그널로부터 제공되며; 상기 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하고; 상기 표준화 계수는 기준값(reference value), 기준 사이클(reference cycle) 및 상기 데이터 세트를 사용하여 제공되며; 상기 기준값은 임의로 결정된 값이며; 상기 표준화 계수는 상기 기준 사이클에 해당되는 상기 데이터 세트의 사이클에서의 시그널 값과 상기 기준값 사이의 관계(relationship)를 정하여 제공되며; 그리고,
(ii) 상기 표준화 계수를 상기 데이터 세트의 시그널 값들에 적용하여 보정된 시그널 값을 얻어 표준화된 데이터 세트를 제공하는 단계.
기준 사이클은 기준값을 갖는 표준화 계수를 제공하기 위해 사용되는 특정 시그널 값을 결정하기 위해 선택된 사이클이다. 표준화 계수의 제공에 사용되는 기준 사이클은 데이터 세트의 사이클로부터 임의적으로 선택될 수 있다.
일 구현예에 따르면, 기준 사이클은 배경 구역 내의 사이클로부터 선택될 수 있다.
배경 시그널은 샘플 내 타겟 분석물질 자체에 의해, 또는 샘플 내의 타겟 분석물질에 의한 것이 아닌, 타겟 분석물질에 관여되지 않은 시그널 발생 수단 자체에 의해 발생된 시그널이다. 배경 구역은 타겟 분석물질로 인한 시그널은 거의 발생하지 않고 배경 시그널만 발생하는 구역이다.
배경 구역은 시그널의 증폭이 충분히 검출되기 전의 시그널 발생 과정의 초기 단계를 의미한다. 구체적으로, 기준 사이클은 배경 구역 내의 1-30 사이클, 2-30 사이클, 2-20 사이클, 2-15 사이클, 2-10 사이클, 2-8 사이클, 3-30 사이클, 3-20 사이클, 3-15 사이클, 3-10 사이클, 3-9, 3-8, 4-8 또는 5-8 사이클로부터 결정될 수 있다.
기준값은 표준화 계수를 제공하기 위해 사용되는 값이다. 본 발명의 기준값은 데이터 세트의 시그널 값들을 보정을 위해 기준 사이클 번호에 적용되는 임의의 값을 의미한다. 기준값은 임의로 결정된 값일 수 있다. 바람직하게는, 기준값은 0 이외의 실수로부터 임의로 결정된 값이다. 바람직하게는, 기준값은 보정될 데이터 세트의 값과 동일한 유형의 값일 수 있고 보정될 데이터 세트와 동일한 단위 또는 치수를 가질 수 있다.
기준값 및 데이터 세트의 기준 사이클에 해당하는 사이클에서의 시그널 값에 의해 표준화 계수가 제공되는 경우, 표준화 계수는 데이터 세트의 기준 사이클에 해당하는 사이클에서의 시그널 값 대 기준값의 비율에 의해 제공될 수 있다.
단계 (b): 제2 데이터 세트의 수득
이후, 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 생성한다. 상기 제2 데이터 세트는 복수의 데이터 지점을 포함하고, 각 데이터 지점은 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는다.
본원에서 사용된 제2 데이터 세트는 "기울기 데이터 세트"와 상호교환적으로 사용될 수 있다.
본원에 사용된 용어 "기울기 값"은 각 데이터 지점에서의 시그널 값의 변화를 의미하며, 이는 "변화 값"과 상호교환적으로 사용될 수 있다. 기울기 값 또는 변화 값은 변화율을 포함할 수 있으므로, 기울기 데이터 세트는 변화율 데이터 세트를 포함할 수 있다.
기울기 값은 비제한적으로 시그널 값의 미분, 차분, 계차, 비율 또는 선형회귀 분석을 포함하는, 당업계에 공지된 방법에 의해 수득될 수 있다.
미분에 의한 기울기 값의 계산은, 일반적으로 제1 데이터 세트(예컨대, 원시 데이터 세트)를 근사화하는 함수를 계산하는 단계, 상기 근사화된 함수로부터 도함수를 계산하는 단계, 및 상기 도함수를 사용하여 각 사이클 번호에서 기울기 값을 수득하는 단계를 포함한다.
차분에 의한 기울기 값의 계산은, 일반적으로 기울기 값을 계산하고자 하는 사이클 번호에서의 시그널 값(대상 시그널 값)과 또 다른 사이클 번호에서의 시그널 값(기준 시그널 값) 사이의 차이를 계산하는 단계, 및 상기 차이를 대상 사이클 번호에서의 기울기 값으로 취하는 단계를 포함한다. 상기 기준 시그널 값은, 예를 들어 대상 사이클 번호의 직전 또는 직후 사이클 번호에서의 시그널 값일 수 있거나, 또는 대상 사이클 번호 이전 또는 이후의 2 이상의 사이클 번호에서의 시그널 값일 수 있다. 택일적으로, 상기 기준 시그널 값은 대상 사이클 번호의 이전 또는 이후의 수 개의 사이클 번호에서의 시그널 값들의 평균일 수 있다. 전형적으로, 기준 시그널 값은 대상 사이클 번호의 직전 사이클 번호에서의 시그널 값일 수 있다.
계차에 의한 시그널 값의 기울기 값의 계산은, 일반적으로 기울기 값을 계산하고자 하는 사이클 번호에서의 시그널 값(대상 사이클 번호)과 또 다른 사이클 번호에서의 시그널 값(기준 시그널 값)의 차이를 계산하는 단계, 상기 계산된 차이를 대상 사이클 번호와 기준 사이클 번호 사이의 차이로 나누는 단계, 결과물을 대상 사이클에서의 기울기 값으로 취하는 단계를 포함한다. 상기 기준 시그널 값은, 예를 들어 대상 사이클 번호의 직전 또는 직후 사이클 번호에서의 시그널 값일 수 있거나, 또는 대상 사이클 번호 이전 또는 이후의 2 이상의 사이클 번호에서의 시그널 값일 수 있다. 계차에 의해 결정된 기울기 값은 사이클 번호당 시그널 값의 변화량에 해당한다.
비율에 의한 기울기 값의 계산은, 일반적으로 두 사이클 번호에서의 2개의 시그널 값 사이의 비율을 계산하는 것을 포함한다. 일 구현예에서, 대상 사이클 번호에서의 비율은 대상 사이클에서의 시그널 값을 바로 앞 사이클에서의 시그널 값으로 나눔으로써 계산된다.
선형 회귀 분석법(linear regression analysis)에 의한 기울기 값의 계산은, 일반적으로 기울기 값을 계산하고자 하는 데이터 지점(대상 데이터 지점)을 포함하는 수 개의 데이터 지점들을 피팅하는 선형 함수를 구하고, 상기 피팅된 함수에서 사이클 번호당 시그널 값의 증가량을 결정하는 것을 포함한다. 상기 선형 함수를 수득하는 데 사용되는 데이터 지점의 수는 2개 이상의 데이터 지점일 수 있으며, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 이하일 수 있다.
선형 회귀 분석의 예는 최소 제곱법(least square method)을 포함하나, 이에 제한되지 않는다.
상기 최소 제곱법은 아래 수학식 1로 표현될 수 있다.
수학식 I
Figure pct00001
Figure pct00002
상기 식에서,
I는 기울기를 계산하고자 하는 데이터 지점의 사이클이고,
m은 I번째 사이클에서의 데이터 지점의 기울기이며,
xi는 i번째 사이클의 사이클이고,
yi는 i번째 사이클에서 측정된 시그널 값이며,
Si는 i번째 사이클에서의 기울기 값이다.
상기 "n" 또는 "a+b+1"은 I번째 사이클에서의 기울기를 계산하기 위하여 사용되는 데이터 지점의 수이며, 최소 제곱법 범위(LSMR, Linear Squares Method Range)라 칭한다. "a"는 I번째 사이클에서 기울기를 계산하기 위하여 사용되는 데이터 지점의 세트 중 최소 사이클을 계산하기 위한 값이다. "b"는 최대 사이클을 계산하기 위한 값이다. "a" 및 "b"는 독립적으로 0-10 정수, 바람직하게는 1-5, 보다 바람직하게는 1-3을 나타낸다. "a"와 "b"의 값은 동일한 것이 유리하지만, 측정 대상, 측정 환경 및 기울기를 측정하고자 하는 사이클에 따라 서로 상이할 수 있다.
일 구현예에 따르면, 특정 사이클 번호(들)에서의 기울기 값의 계산은 나머지 사이클 번호에서의 기울기 값의 계산과 상이할 수 있다. 예를 들어, 차분 방법에 의하여 기울기 값을 수득하는 경우, 첫 번째 사이클 번호 또는 마지막 사이클 번호에서의 기울기 값은 차분 방법과 다른 방법에 의해 수득될 수 있고; 선형회귀 분석에 의하여 기울기 값을 수득하는 경우, 초기 사이클 번호(예를 들어, 첫 번째 사이클 번호 및 두 번째 사이클 번호) 또는 말기 사이클 번호(예를 들어, 마지막 사이클 번호 및 그 직전 사이클 번호)에서의 기울기 값은 선형회귀 분석과 다른 방법에 의해 수득될 수 있다.
예를 들어, 첫 번째 사이클 번호 또는 말기 사이클 번호에서의 기울기 값은 0으로서 결정될 수 있다. 택일적으로, 첫 번째 사이클 번호에서의 기울기 값은 첫 번째 사이클 번호 또는 두 번째 사이클 번호에서의 시그널 값으로서 결정될 수 있다. 택일적으로, 첫 번째 사이클 번호 또는 말기 사이클 번호에서의 기울기 값은 미리 결정된 값으로서 결정될 수 있다.
일 구현예에 따르면, 방법은 상기 단계 (a) 및 (c) 사이에, 상기 기울기 데이터 세트 내의 하나 이상의 데이터 지점의 기울기 값들을 보정하는 단계를 추가로 포함할 수 있다.
이러한 보정의 예는 기울기 데이터 세트 내의 비정상적 시그널을 보정하는 것을 포함하고, 이는 상기 기울기 데이터 세트 내의 비정상적인 시그널 값을 갖는 사이클 번호를 검출한 후 검출된 비정상적인 사이클 번호에 해당하는 기울기 값을 보정하는 것을 포함한다.
단계 (c): 제2 데이터 세트 내의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수의 계산
다음으로, 상기 제2 데이터 세트 내의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산한다.
본 발명자들은 제2 데이터 세트 내의 특정 사이클 부분이 타겟 분석물질의 존재와 관련된 증폭 곡선 또는 성장 곡선의 패턴을 나타낸다는 것을 확인하였다. 이 발견에 기초하여, 본 발명은 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 회귀 함수가 타겟 분석물질의 검출 또는 정량에 사용할 수 있음을 제시한다.
본 발명에 따르면, 단계 (c)는 하기 서브단계를 포함할 수 있다:
(c1) 상기 기울기 데이터 세트에서 증폭 곡선 또는 성장 곡선의 패턴을 나타내고 시그모이드 함수와 같은 S자 형태의 함수에 피팅될 수 있는 부분을 선택하는 단계; 및
(c2) 상기 선택된 부분을 근사화하는 S자 형태의 함수, 예컨대 시그모이드 함수를 계산하는 단계.
일 구현예에서, 상기 단계 (c)의 제2 데이터 세트(기울기 데이터 세트) 내의 선택된 부분은 타겟 분석물질의 존재시 증폭 곡선 또는 성장 곡선의 패턴을 나타내는 사이클 구간이다. 즉, 상기 선택된 부분은 타겟 분석물질의 존재시 증폭 곡선 또는 성장 곡선의 형태를 나타내는 사이클 구간 내이다.
일 구현예에서, 상기 단계 (c)의 제2 데이터 세트(기울기 데이터 세트) 내의 선택된 부분은 타겟 분석물질의 존재시 사이클 번호가 증가함에 따라 기울기 값이 증가하는 패턴을 나타내는 사이클 구간이다. 즉, 상기 선택된 부분은 타겟 분석물질의 존재시 사이클 번호가 증가함에 따라 기울기 값이 증가하는 패턴을 나타내는 사이클 구간 내이다.
일반적으로, 타겟 분석물질의 존재시 제2 데이터 세트와 같은 기울기 데이터 세트는 정규 분포로도 알려진 "벨 모양의 곡선"을 나타낸다. 대칭축(중심축)에 대해 벨 모양의 곡선의 좌측은 증폭 곡선 또는 성장 곡선과 같이 증가하는 패턴, 즉 사이클 번호가 증가함에 따라 기울기 값이 증가하는 패턴을 보이는 반면, 상기 벨 모양의 곡선의 우측은 사이클 번호가 증가함에 따라 기울기 값이 감소하는 패턴을 보인다. 따라서, 벨 모양의 정규 분포를 나타내는 기울기 데이터 세트의 좌측은 본 발명의 방법에 따라 S자 형태의 함수에 의해 근사화될 "부분"으로서 선택될 수 있다.
일 구현예에서, 상기 단계 (c)의 제2 데이터 세트 내의 선택된 부분은 제2 데이터 세트 내의 1번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위 내이다. 전술한 바와 같이, 최대 기울기 값은 벨 모양의 정규 분포를 나타내는 기울기 데이터 세트에서 대칭축에 있으므로, 선택된 부분의 마지막 사이클의 상한은 기울기 데이터 세트에서 대칭축에 의해 정의될 수 있다.
상기 단계 (c)의 제2 데이터 세트 내의 선택된 부분의 한계(metes and bounds)를 정의하는 시작 사이클 및 마지막 사이클은 다음과 같다:
(i) 시작 사이클
상기 선택된 부분의 시작 사이클은 상기 선택된 부분을 근사화하거나 피팅하는 S자 형태의 함수의 피팅 적합도(goodness of fit)를 고려하여 선택될 수 있다.
일 구현예에서, 상기 선택된 부분의 시작 사이클은 1 내지 30번째 사이클 번호 중 어느 하나; 1 내지 25번째 사이클 번호 중 어느 하나; 1 내지 20번째 사이클 번호 중 어느 하나; 1 내지 15번째 사이클 번호 중 어느 하나; 1 내지 10번째 사이클 번호 중 어느 하나; 또는 1 내지 5번째 사이클 번호 중 어느 하나일 수 있다.
특정 구현예에서, 상기 선택된 부분의 시작 사이클은 제2 데이터 세트에서 1 내지 10번째 사이클 번호 중 어느 하나이다.
또 다른 구현예에서, 상기 선택된 부분의 시작 사이클은 제2 데이터 세트에서 2 내지 30번째 사이클 번호 중 어느 하나; 2 내지 25번째 사이클 번호 중 어느 하나; 2 내지 20번째 사이클 번호 중 어느 하나; 2 내지 15번째 사이클 번호 중 어느 하나; 2 내지 10번째 사이클 번호 중 어느 하나; 2 내지 5번째 사이클 번호 중 어느 하나; 3 내지 30번째 사이클 번호 중 어느 하나; 3 내지 25번째 사이클 번호 중 어느 하나; 3 내지 20번째 사이클 번호 중 어느 하나; 3 내지 15번째 사이클 번호 중 어느 하나; 3 내지 10번째 사이클 번호 중 어느 하나; 3 내지 5번째 사이클 번호 중 어느 하나; 4 내지 30번째 사이클 번호 중 어느 하나; 4 내지 25번째 사이클 번호 중 어느 하나; 4 내지 20번째 사이클 번호 중 어느 하나; 4 내지 15번째 사이클 번호 중 어느 하나; 4 내지 10번째 사이클 번호 중 어느 하나; 4 내지 5번째 사이클 번호 중 어느 하나일 수 있다. 제2 데이터 세트에서 초기 사이클 번호, 예컨대 1번째, 2번째 또는 3번째 사이클 번호에서의 기울기 값은 타겟 분석물질로부터 유래되지 않은 노이즈를 포함하는 경향이 있다. 따라서, 함수의 피팅 적합도를 증가시키기 위해 상기 선택된 부분에 이러한 초기 사이클 번호가 포함되지 않도록 하는 것이 바람직하다.
또 다른 구현예에 따르면, 시작 사이클은 제2 데이터 세트에서 마지막 사이클 번호 직전의 적어도 5개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 7개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 10개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 20개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 25개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 30개의 연속적인 사이클 번호, 마지막 사이클 번호 직전의 적어도 35개의 연속적인 사이클 번호, 또는 마지막 사이클 번호 직전의 적어도 40개의 연속적인 사이클 번호로부터 선택된다.
특정 구현예에서, 상기 선택된 부분의 시작 사이클은 제2 데이터 세트에서 3-10번째 사이클 번호로부터 선택될 수 있다.
(ii) 마지막 사이클
상기 선택된 부분의 마지막 사이클은 상기 선택된 부분을 근사화하거나 피팅하는 S자 형태의 함수의 피팅 적합도를 고려하여 선택될 수 있다.
전술한 바와 같이, 벨 모양의 정규 분포를 나타내는 제2 데이터 세트와 같은 기울기 데이터 세트의 경우, 최대 기울기 값을 갖는 사이클 번호 이후의 부분은 사이클 번호가 증가함에 따라 기울기 값이 감소하는 패턴, 즉 비증폭 곡선 또는 비성장 곡선과 같은 패턴을 나타낸다. 최대 기울기 값을 갖는 사이클 번호 이후의 데이터 지점을 선택된 부분 내로 포함시키는 것은 S자 형태의 함수, 예컨대 시그모이드 함수의 피팅 적합도를 악화시킬 수 있다. 따라서, 최대 기울기 값을 갖는 사이클 번호 이후의 데이터 지점은 단계 (b)의 선택된 부분으로부터 배제시키는 것이 바람직하다.
일 구현예에서, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 15개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 10개의 연속적인 사이클 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 7개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 6개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 5개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 4개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 3개의 연속적인 사이클 번호 중 어느 하나; 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 2개의 연속적인 사이클 번호 중 어느 하나; 또는 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 사이클 번호이다.
특정 구현예에서, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 5개의 연속적인 사이클 번호 중 어느 하나이다. 구체적으로, 상기 선택된 부분의 마지막 사이클은 최대 기울기 값을 갖는 사이클 번호, 최대 기울기 값을 갖는 사이클 번호의 5 사이클 이전의 사이클 번호, 최대 기울기 값을 갖는 사이클 번호의 4 사이클 이전의 사이클 번호, 최대 기울기 값을 갖는 사이클 번호의 3 사이클 이전의 사이클 번호, 최대 기울기 값을 갖는 사이클 번호의 2 사이클 이전의 사이클 번호, 또는 최대 기울기 값을 갖는 사이클 번호의 1 사이클 이전의 사이클 번호이다. 예를 들어, 기울기 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호가 35번째 사이클 번호인 경우, 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 35번째 사이클 번호, 34번째 사이클 번호, 33번째 사이클 번호, 32번째 사이클 번호, 31번째 사이클 번호, 또는 30번째 사이클 번호이다.
일 구현예에서, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호이다. 예를 들어, 기울기 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호가 35번째 사이클 번호인 경우, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 35번째 사이클 번호이다.
일 구현예에 따르면, 상기 선택된 부분의 마지막 사이클은 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 15개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 10개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 7개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 6개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 5개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 4개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 3개의 연속적인 사이클 번호 중 어느 하나, 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 2개의 연속적인 사이클 번호 중 어느 하나, 또는 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 사이클 번호 중 어느 하나이다.
특정 구현예에서, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 대칭축에 해당하는 사이클 번호 및 대칭축에 해당하는 사이클 번호 직전의 5개의 연속적인 사이클 번호 중 어느 하나이다. 예를 들어, 기울기 데이터 세트에서 대칭축에 해당하는 사이클 번호가 35번째 사이클 번호인 경우, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 35번째 사이클 번호, 34번째 사이클 번호, 33번째 사이클 번호, 32번째 사이클 번호, 31번째 사이클 번호, 또는 30번째 사이클 번호이다.
일 구현예에서, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 대칭축에 해당하는 사이클 번호이다. 예를 들어, 기울기 데이터 세트에서 대칭축에 해당하는 사이클 번호가 35번째 사이클 번호인 경우, 상기 선택된 부분의 마지막 사이클은 제2 데이터 세트에서 35번째 사이클 번호이다.
일 구현예에 따르면, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은 첫 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위 이내이다. 다시 말하면, 시작 사이클 및 마지막 사이클 각각은 첫 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위 이내에서 선택된다.
일 예로서, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은 첫 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위일 수 있다. 또 다른 예로서, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은 두 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위일 수 있다. 또 다른 예로서, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은 세 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위일 수 있다.
추가 예로서, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은 제2 데이터 세트에서 세 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호 직전의 3개의 연속적인 사이클 번호 중 어느 하나까지의 범위일 수 있다.
일 구현예에서, 상기 단계 (c)의 제2 데이터 세트의 선택된 부분은, 비제한적으로, 적어도 5개의 사이클, 적어도 8개의 사이클, 적어도 10개의 사이클, 적어도 15개의 사이클, 적어도 20개의 사이클, 또는 적어도 30개의 사이클을 포함한다.
일 구현예에서, 제2 데이터 세트의 선택된 부분은 기울기 데이터 세트의 전부 또는 일부이다.
일 구현예에서, 제2 데이터 세트의 선택된 부분은 연속적인 사이클로 이루어진다. 또 다른 구현예에서, 제2 데이터 세터의 선택된 부분은 불연속적인 사이클로 이루어진다. 예를 들어, 제2 데이터 세트의 선택된 부분은 3, 5, 7, 9, 11, 13, 및 15번째 사이클 번호와 같은 홀수 번째의 사이클 번호로 이루어질 수 있거나, 또는 4, 6, 8, 10, 12, 14 및 16번째 사이클 번호와 같은 짝수 번째의 사이클 번호로 이루어진 구간일 수 있다. 또 다른 구현예에서, 제2 데이터 세트의 선택된 부분은 일부 연속적인 사이클 및 일부 불연속적인 사이클, 예컨대, 3-6번째, 10번째, 12번째, 14-18번째 사이클로 이루어진다.
제2 데이터 세트의 선택된 부분은 위와 같은 요구사항을 고려하여, 사용자에 의해 직접 또는 컴퓨터 시스템에 의해 자동으로 선택될 수 있다.
제2 데이터 세트의 선택된 부분은 기울기 데이터 세트에 원래 존재하지 않았던 추가의 데이터 지점을 포함할 수 있다.
일 구현예에서, 제2 데이터 세트의 선택된 부분은 선택된 부분의 마지막 사이클 이후에 하나 이상의 추가의 데이터 지점을 추가로 포함하고, 상기 하나 이상의 추가의 데이터 지점은 선택된 부분의 마지막 사이클 번호에서의 기울기 값과 동일한 기울기 값을 갖는다.
타겟 분석물질을 함유하지만 전형적인 S자 형태의 증폭 곡선을 나타내지 않는 양성 샘플의 경우, 예컨대 증폭 곡선에서 정체 구역이 관찰되지 않는 양성 샘플의 경우, 본 발명의 방법은 종종 기울기 데이터 세트의 마지막 사이클 번호보다 큰 제1 도함수 최댓값(FDM)을 Ct 값으로서 생성하여 위음성 결과를 초래할 수 있다. 하지만, 이러한 위음성 결과는 제2 데이터 세트의 선택된 부분에 정체 구역에 해당하는 추가의 데이터 지점을 삽입함으로써 피할 수 있다.
제2 데이터 세트의 선택된 부분에 포함되거나 삽입될 추가의 데이터 지점은 선택된 부분의 마지막 사이클에서의 기울기 값과 동일한 기울기 값을 가져야 하며, 이는 1-40, 1-30, 1-20, 또는 1-10개의 데이터 지점, 보다 특히 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 데이터 세트일 수 있다.
일 예로서, 제2 데이터 세트의 선택된 부분의 마지막 사이클에서의 기울기 값이 "800"인 경우, 포함될 추가의 데이터 지점의 수는 10이고, 추가의 데이터 지점의 기울기 값은 "800"이다.
본원에 사용된 바와 같이, 제2 값과 "동일한" 제1 값은 제1 값이 제2 값과 "정확히 동일한" 경우뿐만 아니라 제1 값이 제2 값과 "실질적으로 동일한" 경우를 포함하는 것으로 의도된다.
이후, 상기 선택된 부분을 근사화하는 S자 형태의 함수를 계산한다.
본원에서 사용된 문구 "S자 형태의 함수를 계산하는 것"은 상기 선택된 부분의 데이터 지점들에 가장 잘 피팅되는(best-fit) S자 형태의 함수를 산출하는 과정을 의미한다. 상기 S자 형태의 함수를 계산하는 과정은 본원에서 S자 형태 회귀 분석(S-shaped regression analysis)으로 명명될 수 있다. 상기 S자 형태의 함수는 당업계에 공지된 피팅 방법을 사용하여 계산될 수 있다.
일 구현예에 따르면, 상기 단계 (c)에서 S자 형태의 함수를 계산하는 것은 상기 선택된 부분의 데이터 지점을 당업계에 공지된 종래의 S자 형태의 함수에 피팅하는 것; 및 가장 잘 피팅되는 함수 및 그의 매개변수를 결정하는 것을 포함한다.
또 다른 구현예에 따르면, 상기 단계 (c)에서 S자 형태의 함수를 계산하는 것은 특정 S자 형태의 함수의 매개변수를 결정하는 것을 포함한다. 구체적으로, 단계 (c)의 S자 형태의 회귀 함수를 계산하는 것은 상기 선택된 부분의 데이터 지점을 특정 S자 형태의 함수에 피팅하는 것; 및 가장 잘 피팅된 함수의 매개변수를 결정하는 것을 포함한다.
본 발명의 방법에 사용되는 S자 형태의 함수는 타겟 분석물질에 대한 성장 곡선, 특히 증폭 곡선, 더욱 특히 실시간 PCR 곡선을 근사화하는 것으로 당업계에 알려진 함수일 수 있다.
상기 S자 형태의 회귀 함수의 예는 시그모이드(sigmoid) 함수, 로지스틱(logistic) 함수, 곰페르츠(Gompertz) 함수, 및 차프만(Chapman) 함수를 들 수 있으나, 이에 제한되지 않는다.
일 구현예에서, S자 형태의 함수는 하기에 상세히 설명된 수학식 II-IV 중 어느 하나에 의해 표현된다.
(a) 시그모이드 함수(sigmoid function)
시그모이드 함수는 로지스틱 함수의 특별한 경우로서, 또한 특징적인 S자 형태의 곡선 또는 시그모이드 곡선을 가지며, 하기의 수학식 II로 표현될 수 있다.
수학식 II
Figure pct00003
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 시그모이드 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
상기 수학식에서, α1은 상기 함수가 나타내는 곡선에서의 백그라운드 값에 해당할 수 있고; α2는 상기 함수가 나타내는 곡선에서의 최댓값에 해당할 수 있으며; α3은 상기 함수가 나타내는 곡선에서의 중간값을 갖는 사이클 번호에 해당할 수 있고; α4는 상기 함수가 나타내는 곡선의 기울기에 해당할 수 있다.
(b) 로지스틱 함수(logistic function)
로지스틱 함수는 특징적인 S자 형태 곡선 또는 시그모이드 곡선을 갖는 함수이며, 하기의 수학식 III으로 표현될 수 있다.
수학식 III
Figure pct00004
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 로지스틱 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
상기 수학식에서, α1은 상기 함수가 나타내는 곡선에서의 백그라운드 값에 해당할 수 있고; α2는 상기 함수가 나타내는 곡선에서의 최댓값에 해당할 수 있으며; α3은 상기 함수가 나타내는 곡선에서의 중간값을 갖는 사이클 번호에 해당할 수 있고; α4는 상기 함수가 나타내는 곡선의 기울기에 해당할 수 있다.
(c) 곰페르츠 함수(Gompertz function)
곰페르츠 함수는 시그모이드 함수의 한 종류로서, 가파르게 상승하였다가 점진적으로 수평선에 근접하는 형태의 곡선을 가지며, 하기 수학식 IV로 표현될 수 있다.
수학식 IV
Figure pct00005
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 곰페르츠 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
상기 수학식에서, α1은 상기 함수가 나타내는 곡선에서의 백그라운드 값에 해당할 수 있고; α2는 상기 함수가 나타내는 곡선에서의 최댓값에 해당할 수 있으며; α3은 상기 함수가 나타내는 곡선에서의 중간값을 갖는 사이클 번호에 해당할 수 있고; α4는 상기 함수가 나타내는 곡선의 기울기에 해당할 수 있다.
(d) 차프만 함수(Chapma function)
차프만 함수는 시그모이드 함수의 한 종류로서, 하기 수학식 V로 표현될 수 있다.
수학식 V
Figure pct00006
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 차프만 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
상기 수학식에서, α1은 상기 함수가 나타내는 곡선에서의 백그라운드 값에 해당할 수 있고; α2는 상기 함수가 나타내는 곡선에서의 최댓값에 해당할 수 있으며; α3은 상기 함수가 나타내는 곡선에서의 중간값을 갖는 사이클 번호에 해당할 수 있고; α4는 상기 함수가 나타내는 곡선의 기울기에 해당할 수 있다.
S자 형태의 함수에 대한 추가 설명은 문헌[Michele Guescini et al., BMC Bioinformatics 2008, 9:326]을 참고한다.
일 구현예에 따르면, 선택된 부분의 데이터 지점들에 피팅되는 함수를 계산하기 위해 컴퓨터 시스템이 사용된다. 상기 컴퓨터 시스템은 회귀 분석을 수행할 수 있는 컴퓨터 프로그램이 그 안에 저장된 컴퓨터 해독가능한 저장 매체 및 상기 컴퓨터 프로그램을 구동할 수 있는 프로세서를 포함한다.
전술한 바와 같이, 상기 S자 형태의 함수는 미리 결정된 함수일 수 있고, 상기 회귀 분석은 상기 S자 형태의 함수의 매개변수를 결정하는 과정일 수 있다.
구체적으로, 데이터 지점에서의 사이클을 독립변수 x로 설정하고, 상기 사이클에서의 시그널 값을 종속변수 y로 설정한 경우, 상기 종속변수는 상기 독립변수의 다항 함수로 표현된다.
단계 (d): S자 형태의 함수를 이용한 타겟 분석물질의 검출
이후, 생성된 S자 형태의 함수를 사용하여 샘플 내의 타겟 분석물질을 검출한다.
본원에서 사용된 용어 "검출하다", "검출하는" 또는 "검출"은 타겟 분석물질의 "정성" 및 "정량" 모두를 포함한다. 본원에 사용된 용어 "정성" 또는 "정성 분석"은 S자 형태의 함수를 사용하여 샘플 내의 타겟 분석물질의 존재를 결정하는 것을 지칭하는 반면; 본원에 사용된 용어 "정량" 또는 "정량 분석"은 S자 형태의 함수를 사용하여 샘플 내의 타겟 분석물질의 초기 양을 결정하는 것을 지칭한다.
본원에서 사용된 바와 같이, 문구 "S자 형태의 함수를 사용하는 것"은 S자 형태의 함수를 직접 또는 간접적으로 사용하는 것을 포함한다. 예를 들어, S자 형태의 함수를 직접 사용하는 것은 S자 형태의 함수의 매개변수 값을 사용하여 타겟 분석물질을 검출하는 것 등을 포함하는 반면, S자 형태의 함수를 간접적으로 사용하는 것은 S자 형태의 함수의 모양을 사용하여 타겟 분석물질을 검출하는 것을 포함한다.
일 구현예에서, 상기 단계 (d)에서 S자 형태의 함수를 사용하는 것은 상기 S자 형태의 함수로부터 역치 사이클(threshold cycle; Ct) 값을 결정하는 것을 포함한다. 상기 Ct 값은 샘플 내 타겟 분석물질의 정성 또는 정량에 사용된다.
상기 S자 형태의 함수로부터 Ct 값을 결정하는 것은 하기와 같이 다양한 방법에 의해 수행될 수 있다.
a. 역치의 사용에 의한 Ct 값의 결정
일 구현예에서, S자 형태의 함수로부터 Ct 값을 결정하는 것은 상기 함수가 나타내는 S자 형태의 곡선에 역치를 적용하는 것을 포함한다. 일반적으로, 상기 S자 형태의 곡선과 상기 역치 사이의 교차점이 Ct 값으로서 결정될 수 있다.
상기 S자 형태의 곡선에 적용되는 역치는 당업계에 공지된 통상적인 방법에 의해 결정될 수 있다. 상기 S자 형태의 곡선에 적용되는 역치는 배경 시그널, 민감도, 표지 특성, 또는 검출기 간의 시그널 편차를 고려하여 결정될 수 있다. 상기 S자 형태의 곡선에 적용되는 역치는 S자 형태의 곡선의 지수 영역(exponential region)에서의 임의의 기울기 값과 동일한 값을 갖도록 결정될 수 있다. 상기 S자 형태의 곡선에 적용되는 역치는 S자 형태의 곡선의 베이스라인 영역(baseline region)에서의 기울기 값보다 크지만 정체 영역(plateau region)에서의 기울기의 값보다 작도록 결정될 수 있다. 택일적으로, 상기 S자 형태의 곡선에 적용되는 역치는 S자 형태의 곡선의 베이스라인 영역에서의 기울기의 표준 편차에 일정한 값(예컨대, 10)을 곱함으로써 수득된 값을 갖도록 결정될 수 있다.
상기 역치는 실시자에 의해 직접 또는 검출기에 의해 자동적으로 결정될 수 있다. 상기 역치는 타겟 분석물질에 대한 반복 실험을 통하여 경험적으로 결정될 수 있다. 택일적으로, 상기 역치는 수학적 계산에 의해 결정될 수 있다.
b. 함수의 n차 도함수 최댓값을 사용한 Ct 값의 결정
일 구현예에서, 상기 S자 형태의 함수로부터 Ct 값을 결정하는 것은 (i) 상기 S자 형태의 함수의 1차, 2차 또는 n차 도함수(여기서, n은 자연수임)를 계산하는 단계; 및 (ii) 상기 1차, 2차 또는 n차 도함수의 최댓값을 갖는 사이클 번호를 Ct 값으로서 결정하는 단계를 포함한다.
특정 구현예에서, Ct 값은 상기 S자 형태의 함수의 1차 도함수의 최댓값을 갖는 사이클 번호이다.
c. 함수의 매개변수를 사용한 Ct 값의 결정
일 구현예에서, 상기 단계 (d)에서 S자 형태의 함수를 사용하는 것은 상기 S자 형태의 함수의 매개변수로부터 Ct 값을 결정하는 단계를 포함한다.
상기 S자 형태의 함수의 매개변수로부터 Ct 값을 결정하는 것은 특정 매개변수를 Ct 값로 결정하거나, 특정 매개변수를 포함하는 계산식에 의해 계산된 값을 Ct 값으로 결정하거나, 복수의 매개변수를 포함하는 계산식에 의해 계산된 값을 Ct 값으로 결정하는 것을 포함할 수 있다.
예를 들어, 수학식 II로 표현되는 S자 형태의 함수가 사용되는 경우, 상기 함수의 1차 도함수 최댓값을 갖는 사이클 번호는 매개변수 α3의 값에 해당한다. 따라서, 상기 단계 (d)에서 S자 형태의 함수를 사용하는 것은 매개변수 α3의 값을 Ct 값으로서 결정하는 단계를 포함한다.
전술한 방법 외에도 당업계에 알려진 다른 방법이 Ct 값을 결정하는 데 사용될 수 있는 것으로 당업자에게 이해되어야 한다.
전술한 방법에 의해 결정된 역치 사이클은 하기와 같이 샘플 내 타겟 분석물질의 정성 또는 정량 분석에 사용될 수 있다.
a. 정성 분석
정성 분석에서, 결정된 Ct 값을 갖지 않는 샘플 또는 단계 (a) 또는 (b)의 데이터 세트에서의 마지막 사이클보다 큰 결정된 Ct 값을 갖는 샘플은 타겟 분석물질을 함유하지 않는 것(즉, 음성 샘플)으로 결정되며; 단계 (a) 또는 (b)의 데이터 세트에서의 마지막 사이클보다 작거나 동일한 결정된 Ct 값을 갖는 샘플은 타겟 분석물질을 함유하는 것(즉, 양성 샘플)으로 결정된다.
예를 들어, 본 발명의 방법에 의해 미지의 샘플로부터 수득된 Ct 값이 35이고, 단계 (a)의 또는 단계 (b)의 데이터 세트에서의 마지막 사이클이 50인 경우, 상기 샘플은 양성인 것으로 결정되는 반면; Ct 값이 70이고, 단계 (a) 또는 단계 (b)의 데이터 세트에서의 마지막 사이클이 50인 경우, 상기 샘플은 음성인 것으로 결정된다.
b. 정량 분석
정량 분석에서, 표준 타겟 분석물질의 희석 시리즈를 각각 증폭 반응에 적용하여 복수의 증폭 곡선을 얻은 다음, 상기 증폭 곡선으로부터 전술한 본 발명의 방법에 의해 Ct 값들을 결정한다. 이후, 상기 Ct 값들을 표준 분석물질의 로그(log) 변환된 농도에 대해 플롯팅하여 정량을 위한 표준 곡선을 구한다. 이후, 미지의 샘플(초기 양을 모르는 샘플)을 증폭 반응에 적용하여 Ct 값을 얻은 다음, 이를 표준 곡선에 적용하여 미지의 샘플의 초기 양을 결정한다.
이러한 Ct 값을 사용한 정성 또는 정량 분석은 당업계에 공지된 다양한 방법에 따라 수행될 수 있다.
II. 기울기 데이터 세트를 사용한 타겟 분석물질의 검출(필터링 방법 포함)
본 발명의 또 다른 양태에서, 본 발명의 방법은 제1 데이터 세트를 필터링하는 단계를 추가로 포함할 수 있다.
구체적으로, 본 발명의 방법은 단계 (a)-(b) 사이에 하기 단계를 추가로 포함할 수 있다:
(a1) 제1 데이터 세트에 역치 값을 적용하는 단계; 및
(a2) 상기 제1 데이터 세트가 상기 역치 값을 초과하는 시그널 값을 갖는 경우, 다음 단계 (b)를 진행하는 단계.
일반적으로, 타겟 핵산 서열을 함유하지 않는 음성 샘플의 경우, 단계 (a)에서 수득된 제1 데이터 세트뿐만 아니라 단계 (b)에서 수득된 제2 데이터 세트는 모든 사이클 번호에서 유의하게 낮은 시그널 값을 가질 것이며, 특히 음성 샘플로부터의 제2 데이터 세트는 증폭 곡선 또는 성장 곡선과 같은 패턴을 나타내지 않을 것이고, 즉 사이클 번호가 증가함에 따라 기울기 값이 증가하지 않는다. 이것은 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수를 수득하기 어렵게 만들 수 있다. 따라서, 본 발명의 방법은 음성 샘플에 적용되지 않도록 하는 것이 바람직할 것이다.
이와 관련하여, 본 발명의 방법은 데이터 세트를 필터링하는 단계, 즉 음성 샘플로부터 유래된 것으로 예상되는 데이터 세트를 제거하여 양성 샘플로부터 유래된 것으로 예상되는 데이터 세트만을 수득하는 단계를 포함한다.
상기 단계 (a1)에서는, 상기 단계 (a)의 제1 데이터 세트에 역치 값을 적용하여 양성 샘플로부터의 데이터 세트와 음성 샘플로부터의 데이터 세트를 구별한다. 이러한 구별은 역치를 적용함으로써 쉽게 달성될 수 있다. 단계 (a)의 제1 데이터 세트에 역치를 적용한 후, 상기 역치 값을 초과하는 시그널 값을 갖는 데이터 세트는 양성 샘플로부터 유래된 데이터 세트인 것으로 결정되고, 상기 역치 미만의 모든 시그널 값을 갖는 데이터 세트는 음성 샘플로부터 유래된 데이터 세트인 것으로 결정된다.
이후, 상기 단계 (a2)에서는, 상기 제1 데이터 세트가 상기 역치 값을 초과하는 시그널 값을 갖는 경우 다음 단계 (b)를 진행한다. 역치 값을 초과하는 시그널 값을 갖는 데이터 세트는 양성 샘플로부터 유래된 것으로 예상되므로, 본 발명의 방법에 따라 가장 잘 피팅된 S자 형태의 함수를 생성할 것으로 예상된다.
반면, 상기 데이터 세트가 역치 값 미만의 모든 시그널 값을 갖는 경우 다음 단계 (b)를 진행하지 않는다. 역치 값 미만의 모든 시그널 값을 갖는 데이터 세트는 음성 샘플로부터 유래된 것으로 예상되므로, 본 발명의 방법에 따라 가장 잘 피팅된 S자 형태의 함수를 생성하지 못할 수 있다. 역치 값 미만의 모든 시그널 값을 갖는 데이터 세트는 단계 (b)를 진행하지 않고 타겟 분석물질의 부재를 나타낼 수 있다.
III. 기울기 데이터 세트를 사용한 타겟 분석물질의 검출(필터링 단계 포함)
본 발명의 또 다른 양태에 따르면, 본 발명의 방법은 제2 데이터 세트를 필터링하는 단계를 추가로 포함할 수 있다.
구체적으로, 본 발명의 방법은 단계 (b)-(c) 사이에 하기 단계를 추가로 포함할 수 있다:
(b1) 제2 데이터 세트에 역치 값을 적용하는 단계; 및
(b2) 상기 제2 데이터 세트가 상기 역치 값을 초과하는 기울기 값을 갖는 경우 다음 단계 (c)를 진행하는 단계.
상기 섹션 III의 방법은 제1 데이터 세트가 아닌 제2 데이터 세트에 역치 값을 적용하는 것을 제외하면 섹션 II에 기재된 방법과 동일하므로, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
하지만, 상기 섹션 III의 방법에 적용되는 역치 값은 상기 섹션 II의 방법에 적용되는 역치와 다를 수 있다는 점에 유의한다.
IV. 기록매체, 장치 및 프로그램
본 발명의 다른 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수신하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
(b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
(c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
(d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
본 발명의 또 다른 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수신하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
(b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
(c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
(d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
본 발명의 기록 매체, 장치 및 컴퓨터 프로그램은 상술한 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 본 발명의 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 타겟 분석물질에 대한 시그널 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수신하도록 하는 지시; (ii) 제1 데이터 세트에 대해 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하도록 하는 지시; (iii) 상기 제2 데이터 세트의 선택된 부분을 근사화하여 S자 형태의 함수를 계산하도록 하는 지시; 그리고 (iv) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하도록 하는 지시.
전술한 본 발명의 방법은 프로세서, 예컨대 독립 실행형 컴퓨터(stand alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서에서 실행된다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
제1 데이터 세트는 다양한 메커니즘을 통해 수집될 수 있다. 예를 들어, 제1 데이터 세트는 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 제1 데이터 세트는 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게는, 제1 데이터 세트는, 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터 세트와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 추가 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 전술한 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 샘플 내 타겟 분석물질을 검출하기 위한 장치를 제공한다.
본 발명의 일 구현예에 따르면, 본 발명의 장치는 샘플 및 시그널 발생 수단을 수용할 수 있는 반응 용기, 상기 반응 용기의 온도를 조절하는 온도 조절 수단 및/또는 증폭 사이클에서의 시그널을 검출하는 검출기를 추가적으로 포함할 수 있다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축될 수 있다.
일 구현예에 따르면, 프로세서는 타겟 핵산 서열의 검출을 위한 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨함으로써 구현될 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 기울기 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 새로운 방법을 제공한다.
(b) 본 발명은 역치를 사용하지 않고도 기울기 값 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수의 매개변수로부터 역치 사이클을 수득하는 방법을 제공한다.
(c) 본 발명의 방법은 반응 또는 장비 간의 시그널 편차에 영향을 받지 않고 보다 정확하게 타겟 분석물질을 검출할 수 있다.
(d) 원시 데이터 세트에 대해 가장 잘 피팅되는 S자 형태의 함수를 사용하여 타겟 분석물질을 검출하는 종래의 방법은 함수의 피팅 적합도를 증가시키기 위해 복잡한 베이스라인 기울기 보정을 요구하는 반면, 본 발명의 방법은 이러한 베이스라인 기울기 보정을 배제할 수 있다.
도 1은 본 발명의 일 구현예에 따른 방법을 예시하는 흐름도이다.
도 2는 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA(100 pg, 10 pg, 1 pg, 및 100 fg)를 함유하는 샘플 및 상기 타겟 분석물질을 함유하지 않는 샘플(NTC)을 사용한 증폭 반응에 의해 수득된 5개의 원시 데이터 세트를 나타낸다(실선, NG 100 pg; -○-, NG 10 pg; -□-, NG 1 pg; 및 -△-, 100 fg; -X-, NTC).
도 3은 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플 및 상기 타겟 분석물질을 함유하지 않는 샘플에 대한 5개의 기울기 데이터 세트를 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): 100 fg; (e): NG NTC). 상기 각 기울기 데이터 세트 내의 양쪽 화살표는 S자 형태의 함수를 얻기 위해 선택된 부분을 가리킨다.
도 4는 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 기울기 데이터 세트의 각 선택된 부분을 근사화하는 시그모이드 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 5는 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 기울기 데이터 세트의 각 선택된 부분을 근사화하는 로지스틱 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 6은 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 기울기 데이터 세트의 각 선택된 부분을 근사화하는 곰페르츠 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 7은 실시예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 기울기 데이터 세트의 각 선택된 부분을 근사화하는 챔프먼 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 8은 선택된 부분의 마지막 사이클 이후에 추가의 10개의 데이터 지점이 추가된 5개의 기울기 데이터 세트를 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 9는 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 추가의 데이터 지점을 갖는 각 선택된 부분을 근사화하는 시그모이드 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 10은 비교예 1의 방법에 따라 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 각 원시 데이터 세트를 근사화하는 시그모이드 함수에 의해 생성된 4개의 곡선을 나타낸다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): NG 100 fg).
도 11은 타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플을 이용하여 10회 반복된 PCR 반응으로부터 수득된 원시 데이터 세트를 나타낸다.
도 12는 4개의 농도의 타겟 분석물질을 함유하는 샘플을 사용하여 생성된 표준 곡선을 나타낸다. 상기 표준 곡선은 타겟 분석물질의 로그 변환된 농도와 1차 도함수 최댓값(First Derivative Maximum, FDM) 사이의 관계를 나타낸다.
본 발명을 실시예에 의해 더 상세히 설명할 것이다. 이들 실시예는 보다 구체적으로 예시하기 위한 것이며, 첨부된 청구범위에 제시된 본 발명의 범위는 실시예에 의해 제한되지 않는다는 것이 당업자에게 자명할 것이다.
실시예 1: 기울기 데이터 세트에 대한 S자 형태의 함수를 사용한 타겟 분석물질의 검출(구현예 1)
본 발명의 일 구현예에 따라 기울기 데이터 세트에 대한 S자 형태의 함수를 사용하여 타겟 분석물질을 검출할 수 있는지 조사하였다.
타겟 분석물질의 검출을 하기와 같이 실시하였다: (i) 타겟 분석물질에 대한 원시 데이터 세트(즉, 본원에서 제1 데이터 세트)의 수득, (ii) 각 사이클 번호에서 기울기 값의 계산(및 선택적으로 기울기 데이터 세트의 필터링)에 의한 기울기 데이터 세트(즉, 본원에서 제2 데이터 세트)의 수득, (iii) 기울기 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수의 수득, 및 (iv) S자 형태의 함수를 사용하여 타겟 분석물질의 검출.
<1-1> 실시간 중합효소 연쇄반응의 실시 및 원시 데이터 세트의 수득
타겟 분석물질로서 나이세리아 고노로애(Neisseria gonorrhoeae; NG, 코람데오랩; ATCC 700825)의 지놈 DNA를 사용하였다. 상기 타겟 분석물질을 증폭시키고 그의 증폭산물로부터 시그널을 발생시키기 위해, 하기 표 1에 기재된 프라이머 쌍 및 TaqMan 프로브의 존재하에 실시간 PCR을 실시하였다.
명칭 타입 서열 (5’ → 3’) 서열번호
NG_F 프라이머 TACGCCTGCTACTTTCACGCT 1
NG_R 프라이머 CAATGGATCGGTATCACTCGC 2
NG_P 프로브 [FAM]TGCCCCTCATTGGCGTGTTTCG[BHQ-1] 3
BHQ : Quencher (Black Hole Quencher)상기 실시간 PCR은 10 pmole의 정방향 프라이머(서열번호: 1) 및 10 pmole의 역방향 프라이머(서열번호: 2), 5 pmole의 TaqMan 프로브(서열번호: 3), 하나의 타겟 분석물질(100 pg, 10 pg, 1 pg, 또는 100 fg의 NG 게놈 DNA) 또는 음성 대조군으로서 멸균 증류수(NTC) 및 10 ㎕의 2X Master Mix(최종, 200 uM dNTPs, 2.5 mM MgCl2, 1.6 U의 Taq DNA 중합효소)(Solgent, Korea)를 포함한 20 ㎕의 최종 부피에서 실시하였다. 상기 반응 혼합물을 포함하는 튜브를 실시간 써모사이클러(CFX96 Real-time Cycler, Bio-Rad 사)에서 95℃에서 15분 동안 둔 다음, 95℃에서 30초, 60℃에서 60초 및 72℃에서 30초의 50 사이클을 실시하였다. 형광의 검출은 매 사이클마다 60℃에서 측정하였다.
그 결과, 다양한 농도의 타겟 분석물질을 함유하는 샘플로부터 5개의 원시 데이터 세트, 즉 베이스라인 차감되지 않은 데이터 세트를 수득하였다. 결과가 도 2에 나타나 있다(실선: NG 100 pg; -○-: NG 10 pg; -□-: NG 1 pg; 및 -△-: 100 fg; -X-: NTC).
<1-2> 기울기 데이터 세트의 수득
상기 실시예 <1-1>의 원시 데이터 세트에서 각 사이클 번호에서의 시그널 값을 사용하여 각 사이클 번호에서의 기울기 값을 계산하여 기울기 데이터 세트를 수득하였다.
구체적으로, 시그널 값을 사용한 기울기 값의 계산은 하기 수학식 VI에 나타낸 바와 같이 차분법(Difference Method)에 의해 수행하였다.
수학식 VI
△yi = yi - yi-1
상기 식에서, i는 원시 데이터 세트에서 사이클 번호이고, yi는 i번째 사이클 번호에서의 시그널 값이며; △yi는 i번째 사이클 번호에서의 기울기 값이고, 단 i가 0일 때 △y1=0이다.
상기 다양한 농도의 타겟 분석물질을 함유하는 샘플 및 상기 타겟 분석물질을 함유하지 않는 샘플에 대해 생성된 5개의 기울기 데이터 세트를 도 3에 나타내었다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; (d): 100 fg; 및 (e): NTC).
<1-3> 기울기 데이터 세트의 필터링(선택적)
상기 실시예 <1-2>에서 수득된 5개의 기울기 데이터 세트 중에서, 유의한 기울기 값을 갖지 않는 기울기 데이터 세트를 필터링하였다.
필터링을 위해, 각 기울기 데이터 세트에 필터링 역치 값 100(단위: △RFU)을 적용하였다. 상기 역치 값 적용 후, 상기 필터링 역치 이상의 기울기 값을 갖는 기울기 데이터 세트는 다음 단계를 진행한 반면, 상기 필터링 역치 미만의 모든 기울기 값을 갖는 데이터 세트는 다음 단계를 진행하지 않고 음성으로 판정하였다.
그 결과, 다양한 농도의 타겟 분석물질을 포함하는 샘플에 대한 4개의 기울기 데이터 세트(도 3에서 그래프 (a)-(d) 참고)는 필터링 역치를 초과하는 기울기 값을 갖는 것으로 나타났다. 반면, 타겟 분석물질을 함유하지 않는 샘플에 대한 기울기 데이터 세트(도 3에서 그래프 (e))만이 필터링 역치 미만의 모든 기울기 값을 갖는 것으로 나타났으며, 음성 샘플로서 필터링되었다.
<1-4> 기울기 데이터 세트의 선택된 부분에 대한 S자 형태의 함수의 계산
S자 형태의 함수의 계산을 위해, 상기 실시예 <1-3>의 기울기 데이터 세트 각각으로부터 부분을 선택하였다. 각 기울기 데이터 세트의 선택된 부분은 첫 번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위였다.
각 기울기 데이터 세트에 대한 선택된 부분은 각각 1 내지 31번째 사이클 번호(도 3의 그래프 (a) 참고), 1 내지 34번째 사이클 번호(도 3의 그래프 (b) 참고), 1 내지 38번째 사이클 번호(도 3의 그래프 (c) 참고), 및 1 내지 41번째 사이클 번호(도 3의 그래프 (d))였다. 상기 선택된 부분이 도 3의 각 기울기 데이터에 양쪽 화살표로 표시되어 있다.
이후, 상기 선택된 부분 각각을 근사화하는 S자 형태의 함수를 계산하였다. 본 실시예에서는, 하기 수학식 II로 표시되는 시그모이드 함수를 상기 S자 형태의 함수의 예로 사용하였다.
수학식 II
Figure pct00007
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 시그모이드 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
기울기 데이터 세트의 선택된 부분에 대한 시그모이드 함수의 피팅은 통상적인 LM 알고리즘(Levenberg-Marquardt 알고리즘; Christian Kanzow et al., JCAM, 172(2):375(2004) 참고)에 따라 실시하여, 상기 기울기 데이터 세트의 선택된 부분을 근사화하는 시그모이드 함수를 수득하였다.
타겟 분석물질로서 다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 생성된 4개의 시그모이드 함수를 도 4에 도시하였다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): 100 fg). 또한, 각 시그모이드 함수의 매개변수의 값을 하기 표 2에 나타내었다.
매개변수 매개변수 값
100 pg 10 pg 1 pg 100 fg
Figure pct00008
-5 -8 -5 -3
Figure pct00009
1092 1051 1008 1035
Figure pct00010
27.92 31.40 34.85 38.44
Figure pct00011
0.322 0.307 0.312 0.313
<1-5> 역치(threshold)를 사용한 타겟 분석물질의 검출 상기 실시예 <1-4>에서 수득된 4개의 시그모이드 곡선 각각에 검출 역치 값을 적용하여 상기 각 곡선과 역치 값 사이의 교차점을 역치 사이클(Ct)로서 결정하였다. 상기 검출 역치 값은 시그모이드 함수의 매개변수 값 α2의 대략 10%에 해당하는 100(단위: △RFU)이었다.
이후, 상기 검출 역치 값을 초과하는 기울기 값을 갖는 샘플, 즉 Ct 값을 갖는 샘플을 양성으로 판정하였고, 상기 검출 역치 값 미만의 모든 기울기 값을 갖는 샘플, 즉 Ct 값이 없는 샘플을 음성으로 판정하였다.
상기 결과를 하기 표 3에 나타내었다.
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100 fg -
필터링 역치 100
최대 기울기 값 978 901 901 888 8
다음 단계로 진행 아니오
검출 역치 100
Ct 값 24.87 28.27 31.81 35.31 -
결과 양성 양성 양성 양성 음성
표 3에 나타낸 바와 같이, 다양한 농도의 타겟 분석물질을 함유하는 샘플은 각각 24.87, 28.27, 31.81, 및 35.31의 Ct 값을 갖는 것으로 나타나 모두 양성인 것으로 판정되었다.
실시예 2: 기울기 데이터 세트에 대한 S자 형태의 함수를 사용한 타겟 분석물질의 검출(구현예 2)
Ct 값을 수득하기 위한 택일적인 접근법으로서, 시그모이드 함수의 1차 도함수 최댓값(First Derivative Maximum, FDM)을 갖는 사이클 번호를 Ct로 사용하였다.
상기 시그모이드 함수의 FDM 사이클 번호는 상기 시그모이드 함수의 2차 도함수가 0이 되는 x 값을 계산하거나 시그모이드 함수의 매개변수 α3을 취함으로써 결정하였다. 특히, FDM 사이클 번호로서 매개변수 α3을 사용하는 것은 시그모이드 함수를 미분할 필요성을 제거하였다.
이후, FDM 사이클 번호(α3)가 기울기 데이터 세트의 마지막 사이클 번호, 예컨대 50보다 작거나 같은 샘플을 양성으로 판정하였고, FDM 사이클 번호가 기울기 데이터 세트에서 마지막 사이클 번호보다 큰 샘플을 음성으로 판정하였다.
상기 결과를 하기 표 4에 나타내었다.
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100 fg -
필터링 역치 100
최대 기울기 값 978 901 901 888 8
다음 단계로 진행 아니오
FDM 사이클 번호 27.92 31.40 34.85 38.44 -
결과 양성 양성 양성 양성 음성
표 4에 나타낸 바와 같이, 다양한 농도의 타겟 분석물질을 함유하는 샘플은 각각 27.92, 31.40, 34.85, 및 38.44의 FDM 사이클 번호(α3)를 갖는 것으로 나타났고, 상기 FDM 사이클 번호가 모두 50보다 작으므로 모두 양성으로 판정되었다.
실시예 3: 기울기 데이터 세트에 대한 S자 형태의 함수를 사용한 타겟 분석물질의 검출(구현예 3)
시그모이드 함수 대신에 로지스틱 함수(logistic function), 곰페르츠 함수(Gompertz function) 및 차프만 함수(Chapman function)를 사용하는 것을 제외하여 실시예 2의 과정을 반복하여, 기울기 데이터 세트의 선택된 부분을 근사화하는 각각의 S자 형태의 함수를 수득하였다. 이후, 1차 도함수 최댓값(First Derivative Maximum, FDM)을 갖는 사이클 번호를 Ct로 결정하였고, 이를 타겟 분석물질을 검출하는 데 사용하였다.
본 실시예에서 사용된 로지스틱 함수는 하기 수학식 III으로 표현될 수 있다.
수학식 III
Figure pct00012
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 로지스틱 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
본 실시예에 사용된 곰페르츠(Gompertz) 함수는 하기의 수학식 IV로 표시될 수 있다.
수학식 IV
Figure pct00013
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 곰페르츠 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
본 실시예에 사용된 차프만(Chapman) 함수는 하기 수학식 V로 표시될 수 있다.
수학식 V
Figure pct00014
상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 차프만 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
다양한 농도의 타겟 분석물질에 대한 로지스틱 함수, 곰페르츠 함수 또는 차프만 함수를 나타내는 생성된 곡선을 각각 도 5, 도 6 및 도 7에 나타내었다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): 100 fg).
로지스틱 함수, 곰페르츠 함수, 및 차프만 함수에 대한 매개변수 값이 각각 표 5, 6 및 7에 나타나 있다.
매개변수 로지스틱 함수
NG 100 pg NG 10 pg NG 1 pg NG 100 fg
Figure pct00015
-4 -7 -5 -3
Figure pct00016
1134 1102 1041 1071
Figure pct00017
28.01 31.52 34.92 38.53
Figure pct00018
-19.644 -20.967 -23.970 -26.452
매개변수 곰페르츠 함수
NG 100 pg NG 10 pg NG 1 pg NG 100 fg
Figure pct00019
-2 -6 -3 -1
Figure pct00020
1369 1450 1261 1419
Figure pct00021
25.34 28.80 32.19 35.87
Figure pct00022
2.806 3.202 2.877 3.132
매개변수 차프만 함수 매개변수 값
NG 100 pg NG 10 pg NG 1 pg NG 100 fg
Figure pct00023
-2 -6 -3 -1
Figure pct00024
1369 1450 1261 1419
c 19232.30 18534.91 166252.14 218144.76
Figure pct00025
0.155 0.136 0.151 0.139
각 함수의 FDM 사이클 번호를 상기 함수의 2차 도함수가 0이 되는 x 값을 계산함으로써 결정하였다.
로지스틱 함수의 FDM 사이클 번호는 하기 수학식 VII에 의해 계산될 수 있다.
수학식 VII
Figure pct00026
곰페르츠 함수의 FDM 사이클 번호는 하기 수학식 VIII과 같이 계산될 수 있다.
수학식 VIII
Figure pct00027
차프만 함수의 FDM 사이클 번호는 하기 수학식 IX와 같이 계산할 수 있다.
수학식 IX
Figure pct00028
FDM 사이클 번호가 마지막 사이클 번호, 예컨대 50과 동일하거나 작은 샘플을 양성으로 판정한 반면, FDM 사이클 번호가 마지막 사이클보다 큰 샘플을 음성으로 판정하였다.
상기 결과를 하기 표 8에 나타내었다.
S자 형태의
회귀함수
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100 fg -
로지스틱 함수 FDM 사이클 번호 28.02 31.53 34.92 38.53 -
결과 양성 양성 양성 양성 음성
곰페르츠 함수 FDM 사이클 번호 28.32 31.70 35.25 38.74 -
결과 양성 양성 양성 양성 음성
차프만 함수 FDM 사이클 번호 27.68 31.47 34.58 38.48 -
결과 양성 양성 양성 양성 음성
표 8에서 보는 바와 같이, 다양한 농도의 타겟 분석물질(NG 100 pg, 10 pg, 1 pg 및 100 fg)을 함유하는 샘플에 대한 FDM 사이클 번호는 로지스틱 함수, 곰페르츠 함수, 그리고 차프만 함수와 같은 다양한 S자 형태의 함수를 사용하여 모두 50번째 사이클 번호보다 작은 것으로 나타났다. 따라서, 상기 샘플은 모두 양성으로 판정되었다.
실시예 4: 추가의 데이터 지점을 갖는 기울기 데이터 세트에 대한 S자 형태의 함수를 사용한 타겟 분석물질의 검출(구현예 4)
상기 실시예 1에서 필터링 역치 이상의 기울기 값을 갖는 것으로 결정된 기울기 데이터 세트의 선택된 부분에 상기 선택된 부분의 마지막 사이클 번호에서의 기울기 값과 동일한 기울기 값을 갖는 추가의 데이터 지점을 추가하였다. 이후, 추가의 데이터 지점을 갖는 선택된 부분을 근사화하는 S자 형태의 함수를 계산하였다. 마지막으로, 상기 실시예 2에서와 같이 타겟 분석물질을 검출하기 위해 상기 S자 형태의 함수로부터 Ct 값으로서 FDM 사이클 번호를 결정하였다.
구체적으로, 선택된 부분의 마지막 사이클에서의 기울기 값과 동일한 기울기 값을 갖는 추가의 10개의 데이터 지점을 도 8에 도시된 바와 같이 마지막 사이클 이후에 추가하였다((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; (d): 100 fg 및 (e) NTC).
도 5의 그래프 (a)에 도시된 기울기 데이터 세트의 경우, 1 내지 31번째 사이클 번호까지의 부분이 선택되었다. 이후, 31번째 사이클 번호에서의 기울기 값과 동일한 값을 갖는 추가의 10개의 데이터 지점을 31번째 사이클 직후에, 즉 32번째 내지 41번째 사이클 번호에 추가하였다.
유사하게, 도 5의 그래프 (b), (c) 및 (d)에 도시된 바와 같은 선택된 부분에 각각 35번째 내지 44번째 사이클 번호, 39번째 내지 48번째 사이클 번호, 및 42번째 내지 51번째 사이클 번호까지의 위치에 추가의 데이터 지점을 추가하였다.
추가의 데이터 지점이 추가된 선택된 부분을 시그모이드 함수에 피팅하였다. 다양한 농도의 타겟 분석물질에 대해 시그모이드 함수에 의해 생성된 5개의 곡선을 도 9에 도시하였고((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): 100 fg), 각 시그모이드 함수에 대한 매개변수 값을 하기 표 9에 나타내었다.
매개변수 매개변수 값
100 pg 10 pg 1 pg 100 fg
Figure pct00029
-3 -5 -3 -1
Figure pct00030
987 909 909 896
Figure pct00031
27.59 30.93 34.50 37.97
Figure pct00032
0.380 0.379 0.368 0.368
이후, FDM 사이클 번호(α3)가 50번째 사이클보다 큰 샘플을 음성으로 판정하였다. 상기 결과를 하기 표 10에 나타내었다.
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100 fg -
FDM 사이클 번호 27.59 30.93 34.50 37.97 -
결과 양성 양성 양성 양성 음성
표 10에서 나타낸 바와 같이, 다양한 농도의 타겟 분석물질을 함유하는 샘플은 각각 27.59, 30.93, 34.50, 및 37.97의 FDM 사이클 번호(α3)를 갖는 것으로 나타났다. 따라서, 상기 샘플은 50 미만의 FDM 사이클 번호로 인해 모두 양성으로 판정하였다.
비교예 1: 원시 데이터 세트를 사용한 타겟 분석물질의 검출
기울기 데이터 세트의 선택된 부분을 사용하는 대신에 원시 데이터 세트의 전체를 사용하는 것을 제외하고, 실시예 1의 절차를 반복하였다.
각 원시 데이터 세트로부터 S자 형태의 함수를 계산하기에 앞서 각 원시 데이터 세트를 베이스라이닝한 후, 필터링 역치 200을 사용하여 필터링하였다. 이후, 원시 데이터 세트를 근사화하는 시그모이드 함수를 계산하였다.
다양한 농도의 나이세리아 고노로애(NG) 게놈 DNA를 함유하는 샘플에 대한 원시 데이터 세트에 피팅된 시그모이드 함수에 의해 생성된 4개의 곡선을 도 10에 도시하였고((a): NG 100 pg; (b): NG 10 pg; (c): NG 1 pg; 및 (d): 100 fg), 각 시그모이드 함수에 대한 매개변수 값을 하기 표 11에 나타내었다.
매개변수 매개변수 값
NG 100 pg NG 10 pg NG 1 pg NG 100 fg
Figure pct00033
-47 -46 -36 -23
Figure pct00034
8660 8591 8574 7827
Figure pct00035
31.53 35.22 38.77 41.84
Figure pct00036
0.193 0.184 0.185 0.200
상기 시그모이드 함수에 의해 생성된 각 곡선에 검출 역치를 적용하여 각 곡선과 역치 사이의 교차점을 Ct 값으로서 결정하였다. 상기 검출 역치는 시그모이드 함수에 대한 α2 값의 대략 10%에 해당하는 800으로 설정하였다.이후, 상기 검출 역치를 초과하는 기울기 값을 갖는 샘플, 즉 Ct 값을 갖는 샘플을 양성으로 판정한 반면, 검출 역치 미만의 모든 기울기 값을 갖는 샘플, 즉 Ct 값이 없는 샘플을 음성으로 판정하였다.
상기 결과를 하기 표 12에 나타내었다.
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100 fg -
필터링 역치 200
최대 시그널 값 8845 8804 8741 7869 99
다음 단계로 진행 아니오
검출 역치 800
Ct 값 26.48 29.98 33.48 37.16 -
결과 양성 양성 양성 양성 음성
표 12에 나타낸 바와 같이, 다양한 농도의 타겟 분석물질을 포함하는 샘플은 각각 26.48, 29.98, 33.48, 및 37.16의 Ct 값을 갖는 것으로 나타났다. 따라서, 상기 샘플을 모두 양성으로 판정하였다.
비교예 2: 원시 데이터 세트를 사용한 타겟 분석물질의 검출
실시예 2에서 기울기 데이터 세트의 선택된 부분을 사용하는 대신에 원시 데이터 세트의 전체를 사용하는 것을 제외하고, 실시예 2의 과정을 반복하였다.
비교예 1에서 계산된 시그모이드 함수로부터 FDM 사이클 번호를 결정하였다.
이후, 상기 FDM 사이클 번호(α3)가 데이터 세트의 마지막 사이클, 예컨대 50번째 사이클보다 작거나 같은 샘플은 양성으로 판정하였고, FDM 사이클 번호가 마지막 사이클보다 큰 샘플은 음성으로 판정하였다.
상기 결과를 하기 표 13에 나타내었다.
타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100fg -
필터링 역치 200
최대 시그널 값 8845 8804 8741 7869 99
다음 단계로 진행 아니오
FDM 사이클 번호 31.53 35.22 38.77 41.84 -
FDM에 의한
타겟 검출 결과
양성 양성 양성 양성 음성
표 13에 나타낸 바와 같이, 다양한 농도의 타겟 분석물질을 포함하는 샘플은 각각 31.53, 35.22, 38.77, 및 41.84의 FDM 사이클 번호(α3)를 갖는 것으로 나타났다. 따라서, 상기 샘플은 FMD 사이클이 모두 50 미만이므로 양성으로 판정하였다.
실시예 1 및 2(본 발명) 및 비교예 1 및 2(종래의 방법)의 결과를 하기 표 14에 요약하였다.
검출 방법 타겟 분석물질 양성 음성
농도 100 pg 10 pg 1 pg 100fg -
실시예 1 Ct 값 24.87 28.27 31.81 35.31 -
결과 양성 양성 양성 양성 음성
실시예 2 Ct 값 27.92 31.40 34.85 38.44 -
결과 양성 양성 양성 양성 음성
비교예 1 Ct 값 26.48 29.98 33.48 37.16 -
결과 양성 양성 양성 양성 음성
비교예 2 Ct 값 31.53 35.22 38.77 41.84 -
결과 양성 양성 양성 양성 음성
상기 표 14에 나타낸 바와 같이, 본 발명의 방법(실시예 1 및 2)은 종래 방법(실시예 3 및 4)과 대등하게 타겟 분석물질의 존재를 검출하는데 사용될 수 있는 것으로 나타났다. 특히, 검출 역치를 사용하지 않고 S자 형태의 함수의 파라미터를 사용하는 것은 반응 또는 장치 간의 시그널 편차에 의해 영향을 받지 않고 타겟 분석물질의 보다 정확한 검출을 허용할 것으로 예상된다.또한, 원시 데이터 세트에 대한 가장 잘 피팅된 S자 형태의 함수를 사용하는 종래의 방법(비교예 1 및 2)은 함수의 피팅 적합도를 증가시키기 위해 복잡한 베이스라인 기울기 보정을 요구하는 반면, 본 발명의 방법은 이러한 베이스라인 기울기 보정을 배제할 수 있다.
실시예 5: 기울기 데이터 세트를 사용한 타겟 분석물질의 정량
본 발명의 방법이 샘플 내 타겟 분석물질을 정량하는 데 사용될 수 있는지 조사하였다.
본 실시예에서, 절대 정량을 위해 표준 곡선 방법을 사용하였다. 구체적으로, 표준 물질의 연속 희석액을 실시간 PCR 반응에 적용하여 표준 곡선을 얻고, 이로부터 결정 계수(R2)와 PCR 효율(efficiency)을 계산하여 본 발명의 방법을 타겟 분석물질 정량에 적용할 수 있는지 확인하였다. 본 실시예에서는, 실시예 2에서 결정된 FDM 사이클 번호를 사용하였다.
<5-1> 표준 타겟 분석물질을 사용한 표준 곡선의 수득
타겟 분석물질의 절대 정량을 위해, 하기와 같이 표준 곡선을 수득하였다.
<5-1-1> 실시간 PCR의 실시 및 원시 데이터 세트의 수득
실시예 <1-1>에와 같이 4개의 농도의 타겟 분석물질(나이세리아 고노로애(NG) 게놈 DNA)을 이용하여 실시간 PCR 반응을 10회 반복하여, 원시 데이터 세트를 수득하였다. 생성된 원시 데이터 세트를 도 11에 나타내었다.
<5-1-2> 기울기 데이터 세트의 수득
상기 원시 데이터 세트 각각을 실시예 <1-2>에서와 같이 기울기 데이터 세트로 변환하였다.
<5-1-3> 기울기 데이터 세트의 필터링
이후, 실시예 <1-3>에서와 같이 필터링 역치 100을 각 기울기 데이터 세트에 적용하였다. 그 결과, 모든 기울기 데이터 세트는 상기 필터링 역치를 초과하는 기울기 값을 갖는 것으로 확인되었다.
<5-1-4> 기울기 데이터 세트의 선택된 부분에 대한 S자 형태의 함수의 계산
실시예 <1-4>에서와 같이, 각 기울기 데이터 세트의 선택된 부분을 근사화하는 S자 형태의 함수를 수득하였다. 각 시그모이스 함수의 매개변수의 값을 하기 표 15에 나타내었다.
농도 반복 선택된
사이클 구간
매개변수
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
100 pg 1 1 ~ 31 사이클 -7 1028 27.97 0.326
2 1 ~ 31 사이클 -2 1384 28.59 0.313
3 1 ~ 31 사이클 -4 1213 27.88 0.336
4 1 ~ 31 사이클 -5 1250 28.18 0.325
5 1 ~ 31 사이클 -6 1229 28.01 0.330
6 1 ~ 31 사이클 -5 1170 27.85 0.326
7 1 ~ 31 사이클 -8 1196 27.99 0.331
8 1 ~ 31 사이클 -8 1151 27.82 0.328
9 1 ~ 31 사이클 -9 1166 28.11 0.318
10 1 ~ 31 사이클 -5 1092 27.92 0.322
10 pg 1 1 ~ 34 사이클 -6 1041 31.57 0.315
2 1 ~ 34 사이클 -4 1215 31.62 0.319
3 1 ~ 35 사이클 -8 1226 31.63 0.332
4 1 ~ 34 사이클 -6 1138 31.42 0.325
5 1 ~ 34 사이클 -6 1261 31.31 0.311
6 1 ~ 34 사이클 -7 1243 31.43 0.319
7 1 ~ 35 사이클 -5 1109 31.00 0.352
8 1 ~ 35 사이클 -5 1153 31.41 0.345
9 1 ~ 34 사이클 -5 1168 31.34 0.322
10 1 ~ 34 사이클 -8 1051 31.40 0.307
1 pg 1 1 ~ 38 사이클 -5 1016 35.17 0.328
2 1 ~ 39 사이클 -3 1003 34.98 0.311
3 1 ~ 38 사이클 -7 1203 35.00 0.328
4 1 ~ 39 사이클 -6 984 34.75 0.317
5 1 ~ 38 사이클 -7 1175 35.09 0.320
6 1 ~ 38 사이클 -4 1157 34.83 0.322
7 1 ~ 39 사이클 -8 941 34.58 0.316
8 1 ~ 38 사이클 -6 1181 34.89 0.330
9 1 ~ 39 사이클 -7 940 34.37 0.324
10 1 ~ 38 사이클 -5 1008 34.85 0.312
100 fg 1 1 ~ 42 사이클 -4 1012 38.67 0.338
2 1 ~ 42 사이클 -3 1100 39.00 0.267
3 1 ~ 41 사이클 -7 1197 38.26 0.321
4 1 ~ 42 사이클 -6 1020 38.83 0.267
5 1 ~ 42 사이클 -5 1056 38.37 0.344
6 1 ~ 41 사이클 -5 1167 38.12 0.327
7 1 ~ 42 사이클 -7 977 38.09 0.268
8 1 ~ 42 사이클 -4 1121 38.57 0.339
9 1 ~ 42 사이클 -8 972 38.51 0.261
10 1 ~ 41 사이클 -3 1035 38.44 0.313
<5-1-5> 표준 곡선의 생성
상기 실시예 2에서와 같이, 시그모이드 함수로부터 FDM 사이클 번호를 결정하였다. 이후, 표준 타겟 분석물질의 Log 변환된 농도(x-축)를 FDM(y-축)에 대해 플롯팅하여 절대 정량을 위한 표준 곡선을 생성하였다.
생성된 표준 곡선을 도 12에 나타내었고, 표준 곡선의 결정계수(R2) 및 PCR 효율을 하기 표 16에 나타내었다.
반복 표준곡선
표준곡선 식 R2 PCR 효율 PCR 효율(%)
1 y = -3.571x + 35.131 0.9999 1.905 91%
2 y = -3.460x + 35.277 0.9959 1.945 95%
3 y = -3.451x + 34.914 0.9989 1.949 95%
4 y = -3.529x + 35.059 0.9968 1.920 92%
5 y = -3.487x + 34.936 0.9992 1.935 94%
6 y = -3.422x + 34.769 0.9996 1.960 96%
7 y = -3.389x + 34.610 0.9986 1.973 97%
8 y = -3.570x + 34.957 0.9999 1.906 91%
9 y = -3.421x + 34.793 0.9950 1.960 96%
10 y = -3.499x + 34.903 0.9999 1.931 93%
평균 y = -3.480x + 34.935 0.9997 1.938 94%
표 16에서 보는 바와 같이, 표준 곡선의 평균 R2 값은 0.9997이고, 평균 PCR 효율은 94%였다.
<5-2> 정량 적용가능성의 평가
본 발명의 방법이 타겟 분석물질을 정량하는 데 적용가능한지 여부를 R2 값과 PCR 효율에 기초하여 판단하였다.
최적화된 정량적 PCR(qPCR)의 기준은 선형 표준 곡선(R2 > 0.98) 및 높은 증폭 효율(90-105%)이다(2006 Bio-Rad Laboratories, Inc. Real-Time PCR Applications Guide 참고).
표 16에서 나타낸 바와 같이, 본 발명의 방법에 의해 얻은 표준 곡선의 최소 R2는 0.995이었고, PCR 증폭 효율은 90 ~ 105%이었고, 이들 모두는 상기 기준을 만족한다.
상기 결과는 기울기 데이터 세트의 선택된 부분에 피팅된 S자 형태의 함수를 사용하는 방법이 타겟 분석물질의 정량에 적용가능하다는 것을 입증한다.
이상으로 본 발명의 바람직한 구현예를 기술하였는바, 본 발명의 사상에 속하는 이의 변형 및 변화가 당업자에게 자명할 것이라고 이해될 것이며, 본 발명의 범위는 첨부된 청구범위 및 이들의 등가물에 의해 결정될 것이다.
<110> SEEGENE, INC. <120> METHOD FOR DETECTING A TARGET ANALYTE IN A SAMPLE USING AN S-SHAPED FUNCTION FOR A SLOPE DATA SET <130> SG-PN18022 <150> KR 10-2018-0162444 <151> 2018-12-14 <160> 3 <170> KoPatentIn 3.0 <210> 1 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleotide: NG_F <400> 1 tacgcctgct actttcacgc t 21 <210> 2 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleotide: NG_R <400> 2 caatggatcg gtatcactcg c 21 <210> 3 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleotide: NG_P <400> 3 tgcccctcat tggcgtgttt cg 22

Claims (20)

  1. 하기 단계를 포함하는 샘플 내 타겟 분석물질을 검출하는 방법:
    (a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수득하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
    (b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
    (c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
    (d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
  2. 제1항에 있어서, 상기 제1 데이터 세트는 원시 데이터 세트(raw data set), 상기 원시 데이터 세트의 수학적으로 변형된 데이터 세트, 상기 원시 데이터 세트의 표준화(normalization)된 데이터 세트, 또는 상기 수학적으로 변형된 데이터 세트의 표준화된 데이터 세트인 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 기울기 값은 시그널 값의 미분, 차분, 계차, 비율 또는 선형회귀 분석법에 의해 수득되는 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 제2 데이터 세트의 선택된 부분은 상기 제2 데이터 세트에서 1번째 사이클 번호부터 최대 기울기 값을 갖는 사이클 번호까지의 범위 내인 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 제2 데이터 세트의 선택된 부분의 시작 사이클은 상기 제2 데이터 세트에서 1번째 내지 10번째 사이클 번호 중 어느 하나인 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 상기 제2 데이터 세트의 선택된 부분의 마지막 사이클은 상기 제2 데이터 세트에서 최대 기울기 값을 갖는 사이클 번호 또는 최대 기울기 값을 갖는 사이클 번호 직전의 5개의 연속적인 사이클 번호 중 어느 하나인 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 제2 데이터 세트의 선택된 부분은 적어도 5개의 사이클을 포함하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 단계 (c)에서 S자 형태의 함수의 계산은 S자 형태의 함수의 매개변수를 결정하는 것을 포함하는 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 S자 형태의 함수는 시그모이드(sigmoid) 함수, 로지스틱(logistic) 함수, 곰페르츠(Gompertz) 함수, 및 차프만(Chapman) 함수로 이루어진 군으로부터 선택된 어느 하나인 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 S자 형태의 함수는 II-IV 중 어느 하나에 의해 표현되는 것을 특징으로 하는 방법:
    수학식 II
    Figure pct00041

    수학식 III
    Figure pct00042

    수학식 IV
    Figure pct00043

    수학식 V
    Figure pct00044

    상기 수학식에서, α1, α2, α3, 및 α4는 기울기 데이터 세트의 선택된 부분에 S자 형태의 함수를 피팅함으로써 결정된 파라미터이고, x는 사이클 번호이다.
  11. 제1항에 있어서, 상기 단계 (d)에서 S자 형태의 함수를 사용하는 것은 상기 S자 형태의 함수로부터 역치 사이클(threshold cycle; Ct)을 결정하는 것을 포함하는 것을 특징으로 하는 방법.
  12. 제11항에 있어서, 상기 S자 형태의 함수로부터 역치 사이클(Ct)을 결정하는 것은 (i) 상기 S자 형태의 함수의 1차, 2차 또는 n차 도함수(여기서, n은 자연수임)를 계산하는 단계; 및 (ii) 상기 1차, 2차 또는 n차 도함수의 최댓값을 갖는 사이클 번호를 역치 사이클(Ct) 값으로서 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
  13. 제1항에 있어서, 상기 단계 (d)에서 S자 형태의 함수를 사용하는 것은 상기 S자 형태의 함수의 하나 이상의 매개변수를 사용하여 역치 사이클(Ct) 값을 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
  14. 제1항에 있어서, 단계 (a)-(b) 사이에 하기 단계를 추가로 포함하는 것을 특징으로 하는 방법:
    (a1) 제1 데이터 세트에 역치 값을 적용하는 단계; 및
    (a2) 상기 제1 데이터 세트가 상기 역치 값을 초과하는 시그널 값을 갖는 경우, 다음 단계 (b)를 진행하는 단계.
  15. 제1항에 있어서, 단계 (b)-(c) 사이에 하기 단계를 추가로 포함하는 것을 특징으로 하는 방법:
    (b1) 제2 데이터 세트에 역치 값을 적용하는 단계; 및
    (b2) 상기 제2 데이터 세트가 상기 역치 값을 초과하는 기울기 값을 갖는 경우 다음 단계 (c)를 진행하는 단계.
  16. 제1항에 있어서, 상기 타겟 분석물질은 타겟 핵산 분자인 것을 특징으로 하는 방법.
  17. 제1항에 있어서, 상기 제2 데이터 세트의 선택된 부분은 상기 선택된 부분의 마지막 사이클 이후에 하나 이상의 추가의 데이터 지점을 추가로 포함하고, 상기 하나 이상의 추가의 데이터 지점은 상기 선택된 부분의 마지막 사이클 번호에서의 기울기 값과 동일한 기울기 값을 갖는 것을 특징으로 하는 방법.
  18. 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수신하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
    (b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
    (c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
    (d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
  19. (a) 컴퓨터 프로세서, 및 (b) 제18항의 컴퓨터 해독가능한 기록매체를 포함하는, 샘플 내 타겟 분석물질을 검출하기 위한 장치.
  20. 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램으로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 타겟 분석물질에 대한 증폭 반응에 의해 성장 곡선을 나타내는 제1 데이터 세트를 수신하는 단계; 상기 제1 데이터 세트는 각각 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는 복수의 데이터 지점을 포함하며;
    (b) 상기 제1 데이터 세트에 대한 각 사이클 번호에서 기울기 값을 계산하여 제2 데이터 세트를 수득하는 단계; 상기 제2 데이터 세트는 각각 사이클 번호 및 상기 사이클 번호에서의 기울기 값을 갖는 복수의 데이터 지점을 포함하고;
    (c) 상기 제2 데이터 세트의 선택된 부분을 근사화하는 S자 형태(S-shaped)의 함수를 계산하는 단계; 및
    (d) 상기 S자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 단계.
KR1020217022246A 2018-12-14 2019-12-13 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법 KR20210091371A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20180162444 2018-12-14
KR1020180162444 2018-12-14
PCT/KR2019/017733 WO2020122679A1 (en) 2018-12-14 2019-12-13 Method for detecting a target analyte in a sample using an s-shaped function for a slope data set

Publications (1)

Publication Number Publication Date
KR20210091371A true KR20210091371A (ko) 2021-07-21

Family

ID=71076579

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217022246A KR20210091371A (ko) 2018-12-14 2019-12-13 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법

Country Status (4)

Country Link
US (1) US20220025449A1 (ko)
EP (1) EP3895170A4 (ko)
KR (1) KR20210091371A (ko)
WO (1) WO2020122679A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078676B (zh) * 2023-10-16 2024-01-12 青岛盛鑫达机械有限公司 基于图像处理的破碎锤外壳视觉检测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6387621B1 (en) * 1999-04-27 2002-05-14 University Of Utah Research Foundation Automated analysis of real-time nucleic acid amplification
KR100738073B1 (ko) * 2004-09-01 2007-07-12 삼성전자주식회사 실시간 핵산 증폭 데이터로부터 초기 핵산 농도를정량화하는 방법
US20130273547A1 (en) * 2012-04-16 2013-10-17 Samsung Techwin Co., Ltd. Method to determine and correct baseline and to characterize pcr amplification kinetics
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples
US11781180B2 (en) * 2016-04-01 2023-10-10 Seegene, Inc. Detection of abnormal signal using two or more datasets
EP3465504A4 (en) * 2016-06-02 2020-02-12 Seegene, Inc. METHOD FOR DETECTING A TARGET ANALYTIC IN A SAMPLE USING A DATA SET WITH SIGNAL ALIGNMENT

Also Published As

Publication number Publication date
EP3895170A1 (en) 2021-10-20
WO2020122679A1 (en) 2020-06-18
EP3895170A4 (en) 2022-10-12
US20220025449A1 (en) 2022-01-27

Similar Documents

Publication Publication Date Title
KR102210548B1 (ko) 상이한 검출 온도를 이용한 타겟 핵산 서열의 검출
JP4443717B2 (ja) 被験体の定量方法
US20210238652A1 (en) Methods for analyzing samples
CN109923613B (zh) 利用信号变化量数据集的样品内的目标分析物质检测方法
US10978173B2 (en) Method for reducing noise level of data set for a target analyte
KR102270771B1 (ko) 표적 분석물질에 대한 데이터 세트의 보정 방법
US11781180B2 (en) Detection of abnormal signal using two or more datasets
WO2016052991A1 (en) Methods for analyzing samples
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
KR102110985B1 (ko) 타겟 핵산 서열에 대한 시그널 추출
KR20210091371A (ko) 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법
KR102270849B1 (ko) 타겟 핵산 서열의 존재를 결정하기 위한 분석 시그널
KR102385960B1 (ko) 분석물질-비의존적 신호값을 이용한 타겟 분석물질에 대한 데이터 세트 보정 방법
KR102110999B1 (ko) 타겟 핵산 서열에 대한 시그널을 제공하는 방법