KR102326604B1 - 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법 - Google Patents

신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법 Download PDF

Info

Publication number
KR102326604B1
KR102326604B1 KR1020197000113A KR20197000113A KR102326604B1 KR 102326604 B1 KR102326604 B1 KR 102326604B1 KR 1020197000113 A KR1020197000113 A KR 1020197000113A KR 20197000113 A KR20197000113 A KR 20197000113A KR 102326604 B1 KR102326604 B1 KR 102326604B1
Authority
KR
South Korea
Prior art keywords
data set
signal
cycle
value
cycles
Prior art date
Application number
KR1020197000113A
Other languages
English (en)
Other versions
KR20190004834A (ko
Inventor
천종윤
이영조
이한빛
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Priority to KR1020217036681A priority Critical patent/KR102385959B1/ko
Publication of KR20190004834A publication Critical patent/KR20190004834A/ko
Application granted granted Critical
Publication of KR102326604B1 publication Critical patent/KR102326604B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Genetics & Genomics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Microbiology (AREA)

Abstract

본 발명은 신호 변화량 데이터 세트 및 이의 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 방법에 관한 것이다. 본 발명에 따르면, 베이스라이닝 또는 평활(smoothing)과 같은 타겟 분석물질 검출을 위한 데이터 세트 보정이 베이스라인 영역 설정과 같은 복잡한 단계를 거치지 않고 쉽게 이루어질 수 있다.

Description

신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
본 발명은 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법에 관한 것이다.
중합효소 연쇄반응(Polynucleotide chain reaction: PCR)으로 공지된 가장 많이 사용되는 핵산 증폭 반응은 이중가닥 DNA의 변성, DNA 주형에로의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클 과정을 포함한다(Mullis 등, 미국 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., (1985) Science 230, 1350-1354).
실시간 PCR(Real time PCR)은 샘플에서 타겟 핵산을 실시간으로 검출하기 위한 PCR 기반 기술이다. 특정 타겟 핵산을 검출하기 위하여, 실시간 PCR은 PCR 반응 시 타겟 핵산의 양에 비례하여 검출 가능한 형광신호를 방출하는 신호-발생 수단을 이용한다. 형광신호의 발생은 이중가닥 DNA 사이에 삽입되는 인터컬레이터 또는 리포터 및 퀀처 분자를 포함하는 올리고뉴클레오타이드를 이용하여 이루어진다. 타겟 핵산의 양에 비례하는 형광신호가 실시간 PCR을 통하여 각 측정지점(사이클) 마다 검출되어, 각 측정지점 및 상기 측정지점에서의 신호값을 포함하는 데이터 세트를 수득하고, 상기 데이터 세트로부터 측정지점 대비 검출되는 형광신호의 세기를 표시한 증폭곡선(amplification curve) 또는 증폭 프로파일 곡선(amplification profile curve)을 얻게 된다.
일반적으로 실시간 PCR에 의한 증폭곡선은 베이스라인(baseline) 영역, 지수(exponential) 영역, 직선(linear) 영역 및 정체(plateau) 영역으로 구분된다. 지수 영역은 PCR 증폭 산물의 증가에 비례하여 방출되는 형광신호가 증가하는 영역이며, 직선 영역은 형광 신호의 증가가 실질적으로 감소하여 실질적으로 선형으로 나타나며, 정체 영역은 PCR 증폭 산물의 증가 및 형광신호의 방출이 포화상태에 이르러 더 이상 형광신호의 증가가 나타나지 않는 영역을 말한다.
베이스라인 영역은 반응 초기에 신호수준이 변화 없이 일정하게 유지되는 영역을 의미한다. 이 영역은 PCR 반응 산물이 방출하는 형광신호가 검출될 수 있을 정도로 충분하지 않기 때문에, 타겟 분석물질의 증폭에 의한 형광신호보다는 반응 샘플 자체의 형광신호와 측정 시스템 자체의 형광신호인 배경신호(background signal)가 이 영역의 형광신호의 대부분을 차지한다.
노이즈의 발생, 베이스라인의 왜곡 또는 변동과 같은 문제는 기기간, 기기내 신호 수준의 편차, Annealing 온도의 변화 등 실험 조건의 변화 및 반응 혼합물 내 기포의 발생이 그 원인이다. 이러한 노이즈 또는 베이스라인의 왜곡 또는 변동은 타겟 분석물질의 분석에 있어서 위양성 또는 위음성 결과를 나타나게 한다. 타겟 분석물질에 대한 데이터 세트의 정확하고 재현성 있는 분석을 위하여, 증폭 곡선 또는 데이터 세트로부터 배경신호를 제거하는 베이스라이닝 과정 및 비정상적 신호를 보정하는 과정이 필요하다.
기존의 타겟 분석 방법에 의하면, 베이스라이닝 과정은 각 샘플의 베이스라인 영역 및 베이스라인에 해당하는 데이터 세트를 결정하고, 상기 베이스라인 영역의 배경신호를 제거하는 과정으로 수행된다. 특히, 베이스라인 영역의 결정은 베이스라인 영역의 첫 지점 및 끝 지점 결정을 통하여 수행된다. 따라서, 베이스라인 영역의 첫 지점 및 끝 지점을 정확하게 결정하는 것이 중요하다.
베이스라인 영역의 결정과 관련된 다양한 방법이 개발되었다. Woo 등은 증폭구간의 lower bound를 이용하여 베이스라인 영역을 결정하는 방법에 관하여 개시하고 있다(미국 공개공보 2007/0192040). Lerner 등은 증폭곡선을 미분한 후 설정된 역치값 이상을 가지는 첫번째 미분 피크의 시작점을 베이스라인 영역의 끝 지점으로 설정하여 베이스라인 영역을 결정하는 방법에 관하여 개시하고 있다(미국 특허 7,720,611).
그러나, 이러한 선행기술들은 한계 또는 단점을 가지고 있다. 기존의 방법에 의하면, 베이스라인 영역에서 발생하는 노이즈 또는 비정상적 신호가 베이스라인 결정에 영향을 미친다. 특히 베이스라인 영역의 시작 지점 또는 끝 지점이 노이즈 또는 비정상적 신호에 의하여 결정되는 경우, 베이스라인의 선형회귀 함수를 사용한 베이스라이닝 과정은 상기 노이즈 또는 비정상적 신호에 큰 영향을 받게 된다.
이러한 오류를 방지하기 위하여, 일정한 기준을 설정하고, 상기 기준에 해당하는 신호는 노이즈 또는 비정상적 신호로 결정하여 상기 노이즈 또는 비정상적 신호를 제거하거나 피하는 다양한 방법이 제안되었다.
이러한 노력에도 불구하고, 잘못 설정된 베이스라인 영역에 의한 타겟 분석물질 검출 상의 오류는 빈번하게 발생하고 있다. 더욱 문제되는 것은 베이스라인 영역의 결정을 위한 알고리즘이 복잡하고 엄격해질수록 정상 신호가 노이즈 또는 비정상 신호로 잘못 결정되어, 베이스라인 영역 결정에 새로운 오류가 발생할 확률이 높아진다는 것이다.
또한, 기존의 방법에서는 수정이 필요한 데이터 지점들을 검출하기 위하여 데이터 세트를 가공하고, 상기 가공된 데이터 세트를 이용하여 노이즈 신호를 가지는 데이터 지점들을 검출한다. 그리고, 오리지널 데이터 세트에서 상기 수정이 필요한 데이터 지점들의 신호값을 보정한다. 결론적으로, 노이즈 또는 비정상 신호의 검출과 수정이 서로 다른 데이터 세트에서 각각 이루어진다. 더구나, 기존의 방법에서는 점프 에러와 같이 뒤따르는 전체 사이클에 영향을 미치는 오류의 경우에는 뒤따르는 전체 사이클의 신호값들을 모두 수정해야 하는 문제가 있다.
따라서, 베이스라인 영역의 복잡한 설정이 없이 데이터 세트를 보정할 수 있는 새로운 접근법의 개발이 필요한 실정이다.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 보다 효과적이고 정확하게 샘플 내 타겟 분석물질을 분석할 수 있도록 샘플의 데이터 세트를 프로세싱하는 새로운 방법을 개발하기 위하여 노력하였다. 그 결과, 본 발명자들은 데이터 세트의 신호값을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하고, 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 수득하여 샘플 분석에 적합한 가공된 데이터 세트를 수득할 수 있음을 밝혀내었다.
따라서, 본 발명의 목적은 샘플 내 타겟 분석물질 검출 방법을 제공하는 것이다.
본 발명의 다른 목적은 데이터 세트 재구성 방법을 제공하는 것이다.
본 발명의 다른 목적은 데이터 세트 평활 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 것이다.
본 발명의 또 다른 목적은 데이터 세트 재구성 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 것이다.
본 발명의 또 다른 목적은 데이터 세트 평활 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 것이다.
본 발명의 다른 목적 및 이점은 하기의 청구범위 및 도면에 의해 보다 명확하게 된다.
I. 재구성된 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법을 제공한다:
(a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함하며; 및
(d) 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 단계.
본 발명자들은 보다 효과적이고 정확하게 샘플 내 타겟 분석물질을 분석할 수 있도록 샘플의 데이터 세트를 프로세싱하는 새로운 방법을 개발하기 위하여 노력하였다. 그 결과, 본 발명자들은 (i) 데이터 세트의 신호값을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하고, (ii) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 수득하여 샘플 분석에 적합한 가공된 데이터 세트를 수득할 수 있음을 밝혀내었다.
본 개시된 방법에서, 타겟 분석물질에 대한 데이터 세트는 사이클들 및 사이클에서의 신호 변화량을 포함하는 복수의 데이터 지점들을 포함하는 신호 변화량 데이터 세트로 변환되고, 상기 신호 변화량 데이터 세트는 재구성 되어, 사이클들 및 상기 사이클에서의 누적값을 포함하는 복수의 데이터 지점을 포함하는 재구성된 데이터 세트를 제공한다.
이와 같은 변환 및 재구성 프로세스를 통하여, 데이터 세트는 타겟 분석물질 검출에 적합하게 된다. 또한 상기 신호 변화량 데이터 세트에 수행된 가공 (예를 들어, 비정상 신호 또는 노이즈 신호의 수정 또는 제거)은 재구성 과정을 통하여 최종 재구성된 데이터 세트에 반영된다. 이러한 방법으로, 데이터 세트의 신호값의 직접적인 수정 없이 타겟 분석물질 검출을 위한 데이터 세트 가공이 가능하다.
도 1은 타겟 분석물질에 대한 재구성된 데이터 세트를 이용한 본 발명의 샘플 내 타겟 분석물질 검출 방법의 일 구현예를 도시한 흐름도이다
이하 본 발명을 상세히 설명한다.
단계 (a): 타겟 분석물질에 대한 데이터 세트 제공 (S110)
본 발명에 따르면, 우선 타겟 분석물질에 대한 데이터 세트가 제공된다. 상기 데이터 세트는 신호-발생 수단을 이용한 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며, 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함한다.
본 명세서에서 용어 "타겟 분석물질"은 다양한 물질(예를 들어, 생물학적 물질 및 화학물질과 같은 비생물학적 물질)을 포함할 수 있다. 구체적으로, 타겟 분석물질은 핵산 분자 (예를 들어 DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생화학물질, 호르몬, 항체, 항원, 대사물 및 세포와 같은 생물학적 물질일 수 있다. 본 발명의 일 구현예에 따르면, 상기 타겟 분석물질은 타겟 핵산 분자일 수 있다.
본 명세서에서 용어 "샘플"은 생물학적 샘플 (예를 들어, 세포, 조직 및 생물학적 소스에서 나온 유체) 및 비생물학적 샘플 (예를 들어, 음식, 물 및 토양)을 포함할 수 있다. 상기 생물학적 샘플은 바이러스, 세균, 조직, 세포, 혈액 (예를 들어 전혈, 혈장 및 혈청), 림프, 골수액, 타액, 객담(sputum), 스왑(swab), 흡인액(aspiration), 젖, 소변, 분변, 안구액, 정액, 뇌 추출물, 척수액, 관절액, 흉선액, 기관지 세척액, 복수 및 양막액일 수 있다. 타겟 분석물질이 타겟 핵산 서열인 경우 상기 샘플은 핵산 추출과정을 거칠 수 있다. 추출된 핵산이 RNA인 경우, 상기 추출된 RNA로부터 cDNA를 합성하기 위한 역전사 과정을 추가로 거칠 수 있다(Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)).
본 발명의 일 구현예에 따르면, 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득된다. 본 발명의 일 구현예에 따르면, 본 발명의 방법은 샘플 내 타겟 분석물질에 대한 데이터 세트를 수득하기 위하여 신호-발생 반응을 수행하는 단계를 추가로 포함할 수 있다.
본 명세서에서 용어 "신호-발생 반응"은 샘플 내 타겟 분석물질의 특성에 의존적으로 신호를 발생시킬 수 있는 반응을 의미하며, 상기 특성은 예를 들어, 타겟 분석물질의 활성, 양 또는 존재(또는 부존재)일 수 있으며, 구체적으로 샘플 내 타겟 분석물질의 존재(또는 부존재)일 수 있다. 본 발명의 일 구현예에 따르면, 신호-발생 반응은 샘플 내 타겟 분석물질의 존재에 의존적으로 신호를 발생시킨다.
이러한 신호-발생 반응은 생물학적 또는 화학적 반응일 수 있다. 생물학적 반응은 PCR, 실시간 PCR, 마이크로어레이 및 인베이더 어세이와 같은 유전적 분석 과정, 면역 어세이 과정 및 세균 배양 분석 과정일 수 있다. 본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 유전적 분석 과정을 포함한다. 화학적 반응은 화학물질의 생산, 변환 또는 분해를 포함하는 화학적 분석일 수 있다. 본 발명의 일 구현예에 따르면, 신호-발생 반응은 PCR 또는 실시간 PCR일 수 있다.
본 발명의 일 구현예에 따르면, 신호-발생 반응은 신호의 증폭 반응일 수 있다. 본 명세서에서 용어 "증폭" 또는 "증폭 반응"은 신호를 증가 또는 감소 시키는 반응을 의미한다. 본 발명의 일 구현예에 따르면, 상기 증폭 반응은 신호-발생 수단을 이용한 타겟 분석물질의 존재에 의존적인 신호의 증가 (또는 증폭)을 의미한다. 상기 증폭 반응은 타겟 분석물질 (예를 들어, 핵산 분자)의 증폭을 동반하거나 동반하지 않을 수 있다. 따라서, 본 발명의 일 구현예에 따르면, 신호-발생 반응은 타겟 핵산 분자의 증폭을 동반하거나 동반하지 않고 수행될 수 있다. 구체적으로, 본 발명의 증폭 반응은 타겟 분석물질의 증폭을 동반하여 수행되는 신호 증폭 반응을 의미한다.
신호-발생 반응은 신호 변화를 동반한다. 본 명세서에서 용어 "신호"는 측정 가능한 아웃풋을 의미한다.
신호 변화는 타겟 분석물질의 특성, 구체적으로 존재 또는 부존재를 정성적 또는 정량적으로 알려주는 지시자 역할을 한다. 이러한 지시자의 예시는 형광 세기, 발광 세기, 화학발광 세기, 생발광 세기, 인광세기, 전하 이동, 전압, 전류, 전력, 에너지, 온도, 점성도, 광 스캐터, 방사능 세기, 반사도, 투광도 및 흡광도를 포함한다. 가장 넓게 사용되는 지시자는 형광 세기이다. 상기 신호 변화는 신호의 증가뿐만 아니라 신호의 감소를 포함한다. 본 발명의 일 구현예에 따르면, 신호-발생 반응은 신호값을 증폭시키는 반응이다.
본 명세서에서 용어 "신호-발생 수단"은 분석하고자 하는 타겟 분석물질의 특성, 구체적으로 존재 또는 부존재를 나타내는 신호를 발생에 사용되는 물질을 의미한다.
다양한 신호-발생 수단이 알려져 있다. 신호-발생 수단의 예는 올리고뉴클레오타이드, 표지 및 효소를 포함할 수 있다. 신호-발생 수단은 표지 자체 또는 표지가 연결된 올리고뉴클레오타이드를 포함할 수 있다. 상기 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함할 수 있다. 인터컬레이팅 염료(intercalating dye)와 같이 표지 자체가 신호-발생 수단으로 사용될 수 있다. 택일적으로, 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지가 적어도 하나의 올리고뉴클레오타이드에 결합된 형태로 신호-발생 수단으로 사용될 수 있다. 신호-발생 수단은 신호를 발생시키기 위하여 핵산 분해 효소(예를 들어, 5' 핵산 절단 활성을 갖는 효소 또는 3' 핵산 절단 활성을 갖는 효소)와 같은 구성을 추가로 포함할 수 있다.
신호-발생 수단은 (1) 이합체 형성에 의존적인 방식으로 신호를 발생시키는 수단, (2) 타겟 분석물질에 특이적으로 혼성화된 매개 올리고뉴클레오타이드(mediation oligonucleotide)의 절단에 의존적인 방식으로 이합체가 형성되어 신호를 발생시키는 수단, 및 (3) 검출-올리고뉴클레오타이드(detection-oligonucleotide)의 절단에 의하여 신호를 발생시키는 수단을 포함할 수 있다.
본 발명의 방법이 타겟 핵산 분자의 존재 또는 부존재를 결정하는데 적용되는 경우, 신호-발생 반응은 당업계에 알려진 다양한 방법들에 따라 수행될 수 있다. 상기 방법들은 TaqManTM 프로브 방법(미국특허 제5,210,015호), 분자 비콘 방법(Tyagi 등, Nature Biotechnology 14 (3):303(1996)), 스콜피온(Scorpion) 방법 (Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise 또는 Amplifluor) 방법(Nazarenko 등, Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국특허 제6,117,635호), 럭스(Lux) 방법(미국특허 제7,537,886호), CPT(Duck P, 등. Biotechniques, 9:142-148(1990)), LNA 방법 (미국특허 제6,977,295호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), HybeaconsTM (D. J. French 등, Molecular and Cellular Probes (2001) 13, 363-374 및 미국특허 제7,348,141호), 이중표지된 자가-퀀칭된 프로브(Dual-labeled, self-quenched probe; 미국특허 제5,876,930호), 혼성화 프로브(Bernard PS 등, Clin Chem 2000, 46, 147-148), PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO 2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(PCT/KR2013/012312) 및 CER 방법(WO 2011/037306)일 수 있다. 따라서, 본 발명에서 증폭 반응은 상술한 신호-발생 반응들에 의하여 수행될 수 있다.
본 명세서에서 용어 "사이클"은 조건의 변화를 수반한 복수의 측정에 있어서, 상기 조건의 변화의 단위 또는 상기 조건의 변화의 반복의 단위를 의미한다. 예를 들어, 상기 조건의 변화 또는 조건의 변화의 반복은 온도, 반응시간, 반응 횟수, 농도, pH 및/또는 측정 대상(예를 들어 타겟 핵산 분자)의 복제 횟수의 변화 또는 변화의 반복을 포함한다. 그러므로, 상기 사이클은 조건(예를 들어, 온도 또는 농도) 변화 사이클, 시간(time) 또는 과정(process) 사이클, 단위 운영(unit operation) 사이클 및 재생산(reproduction) 사이클 일 수 있다. 사이클 번호는 상기 사이클의 반복 횟수를 의미한다. 본 명세서에서 용어 "사이클" 및 "사이클 번호"는 혼용될 수 있다.
일예로, 효소반응속도(enzyme kinetics)를 조사하는 경우, 기질의 농도를 일정하게 증가시키면서 효소의 반응속도(reaction rate)를 수 차례 측정한다. 이 반응에서 기질 농도의 증가는 조건의 변화에 해당하며, 기질 농도의 증가 단위는 사이클에 해당한다. 다른 일예로, 핵산의 등온 증폭을 수행하는 경우, 하나의 샘플에 대한 신호는 등온 조건에서 일정한 시간차를 두고 수 차례 측정된다. 이 반응에서 반응 시간이 조건의 변화에 해당되며, 반응 시간 단위가 사이클에 해당될 수 있다. 또 다른 예로, 핵산 증폭 반응을 통하여 타겟 분석물질을 검출하는 방법의 하나로, 온도를 일정하게 변화시키면서 타겟 분석물질에 혼성화된 프로브로부터 발생하는 형광신호를 측정한다. 이 반응에서 상기 온도의 변화가 조건의 변화에 해당되며, 상기 온도가 사이클에 해당될 수 있다.
구체적으로, 일련의 반응들을 반복하거나 일정 시간 간격으로 반응을 반복하는 경우, 용어 "사이클"은 상기 반복의 단위를 의미한다. 예를 들어, 중합효소 연쇄반응(PCR)의 경우, 하나의 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링(혼성화) 및 프라이머의 연장을 포함하는 반응 단위를 의미한다. 이 경우 반응 반복의 증가가 조건의 변화에 해당되며, 상기 반복의 단위가 사이클에 해당될 수 있다.
본 발명의 일 구현예에 따르면, 샘플 내에 타겟 핵산 분자가 존재하는 경우, 증폭 반응의 사이클이 증가하면서 측정되는 신호의 값(세기)은 증가하거나 감소할 수 있다. 본 발명의 일 구현예에 따르면, 타겟 분석물질(예를 들어, 타겟 핵산 분자)의 존재를 나타내는 신호를 증폭하기 위한 증폭 반응은 타겟 핵산 분자의 증폭과 동시에 신호가 증폭되는 방식(예를 들어 실시간 PCR)으로 수행될 수 있다. 택일적으로, 상기 증폭 반응은 타겟 분석물질이 증폭되지 않고 신호가 증폭되는 방식으로 수행될 수 있다(예를 들어, CPT method (Duck P, et al., Biotechniques, 9:142-148 (1990)), Invader assay (미국특허 제6,358,691호 및 제6,194,149호)).
타겟 분석물질은 다양한 방법으로 증폭될 수 있다. 예를 들어, 이에 한정되지 않지만, 중합효소연쇄반응(the polymerase chain reaction (PCR)), 리가아제 연쇄반응(ligase chain reaction (LCR)) (미국특허 제4,683,195호 및 제4,683,202호; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990); Wiedmann M, et al., "Ligase chain reaction (LCR)- overview and applications." PCR Methods and Applications 1994 Feb;3(4):S51-64)), GLCR (gap filling LCR, WO 90/01069, EP 439182 및 WO 93/00447), Q-beta (Q-beta replicase amplification, Cahill P, et al., Clin Chem., 37(9):1482-5(1991), 미국특허 제5,556,751호), 가닥 치환 증폭(strand displacement amplification (SDA), G T Walker et al., Nucleic Acids Res. 20(7):1691-1696(1992), EP 497272), 염기순서기반증폭(nucleic acid sequence-based amplification (NASBA), Compton, J. Nature 350(6313):91-2(1991)), 전사 매개 증폭(transcription-mediated amplification(TMA), Hofmann WP et al., J Clin Virol. 32(4):289-93(2005); 미국특허 제5,888,779호) 또는 롤링서클 증폭(rolling circle amplification(RCA), Hutchison C.A. et al., Proc. Natl Acad. Sci. USA. 102:17332-17336(2005)) 등을 포함하는 타겟 핵산 분자를 증폭하기 위한 다양한 방법이 알려져 있다.
본 발명의 일 구현예에 따르면, 신호-발생 수단에 사용되는 표지는 형광 표지, 보다 구체적으로 형광 단일표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중표지(예컨대, 형광 리포터 분자 및 퀀처 분자 포함)를 포함할 수 있다.
본 발명의 일 구현예에 따르면, 타겟 분석물질에 대한 데이터 세트는 타겟 분석물질에 대한 증폭반응의 결과를 나타내는 데이터 세트일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명에 사용되는 증폭 반응은 타겟 분석물질(구체적으로, 타겟 핵산 분자)의 증폭과 동시에 신호를 증폭하는 것일 수 있다. 본 발명의 일 구현예에 따르면, 증폭 반응은 PCR 또는 실시간 PCR에 따라 실시될 수 있다. 본 발명의 일 구현예에 따르면, 상기 증폭 반응은 핵산 분자의 증폭 반응일 수 있다.
데이터 세트는 신호-발생 반응의 사이클들 및 상기 사이클들에서의 신호값들을 포함하는 복수의 데이터 지점을 포함한다.
본 발명에서 용어 "신호의 값" 또는 "신호값"은 신호-발생 반응의 사이클들에서 실제 측정된 신호의 값 (예를 들어, 증폭 반응에 의한 형광 세기의 실제 값) 또는 이의 가공된 값일 수 있다. 상기 가공된 값은 측정된 신호값을 수학적으로 가공한 값을 포함할 수 있다. 측정된 신호값을 수학적으로 가공한 값의 예는 측정된 신호값의 로그값 또는 도함수값(derivatives)을 포함할 수 있다. 상기 측정된 신호값에 대한 도함수값은 멀티 차수의 도함수값일 수 있다.
본 명세서에서 용어 "데이터 지점"은 사이클 및 사이클에서의 신호값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 본 명세서에서 용어 "데이터"는 데이터 세트를 구성하는 모든 정보를 의미한다. 예를 들어, 증폭 반응의 각 사이클 및 신호값은 데이터 일 수 있다. 신호-발생 반응, 구체적으로 증폭 반응으로부터 수득한 데이터 지점들은 직교좌표계 상의 좌표값으로 표시될 수 있다. 직교좌표계에서 X축은 증폭 반응의 사이클들을 나타내며, Y축은 각 사이클에서 측정한 신호값 또는 상기 신호값의 가공된 값을 나타낸다.
본 명세서에서 용어 "데이터 세트"는 데이터 지점들의 집합을 의미한다. 데이터 세트는 신호-발생 수단을 이용한 신호-발생 반응(예를 들어, 증폭 반응)으로부터 직접 수득한 데이터 지점들의 집합인 원시 데이터 세트일 수 있다. 택일적으로, 상기 신호-발생 수단을 이용한 신호-발생 반응(예를 들어, 증폭 반응)으로부터 직접 수득한 데이터 지점들의 집합을 포함하는 데이터 세트를 가공하여 수득한 가공된 데이터 세트일 수 있다. 데이터 세트는 상기 신호-발생 반응으로부터 수득한 데이터 지점들 또는 이의 가공된 데이터 지점들의 전체 또는 일부 집합일 수 있다. 데이터 세트는 복수의 데이터 지점을 포함한다. 데이터 세트는 적어도 2 이상의 데이터 지점을 포함할 수 있다. 데이터 지점의 수는 2, 3, 4, 5, 10 또는 20 이상일 수 있다. 데이터 세트는 1000개 이하의 데이터 지점을 포함할 수 있다. 데이터 세트의 데이터 지점의 수는 1000, 500, 300, 200, 100, 90, 80, 70 또는 60 이하일 수 있다. 데이터 세트는 3 내지 1000개의 데이터 지점을 포함할 수 있다.
데이터 세트의 데이터 지점의 수는 3-1000, 10-500, 1-100, 20-100, 20-80, 20-70 또는 20-60일 수 있다. 본 발명의 일 구현예에 따르면, 데이터 세트는 20-60개의 데이터 지점을 포함할 수 있다.
본 발명의 데이터 세트는 복수의 데이터 세트의 가공에 의하여 수득할 수 있다. 복수의 타겟 분석물질에 대한 분석을 하나의 반응용기에서 수행하는 경우, 각 타겟 분석물질에 대한 데이터 세트는 상기 하나의 반응용기에서 이루어진 반응으로부터 수득된 원시 데이터 세트들의 가공을 통하여 수득될 수 있다. 예를 들어 하나의 반응용기에서 이루어진 복수의 타겟 분석물질에 대한 데이터 세트들은 서로 다른 온도에서 측정된 신호로부터 수득한 복수의 데이터 세트들을 가공(processing)하여 수득할 수 있다. 데이터 세트는 플롯팅 될 수 있으며, 이에 의하여 증폭 곡선을 수득할 수 있다. 그 세기가 타겟 분자의 양에 비례하는 형광 신호를 증폭 사이클에 대하여 플롯팅하여 증폭 곡선 또는 증폭 프로파일 곡선을 얻을 수 있다. 본 발명의 일 구현예에 따르면, 증폭 곡선은 타겟 분석물질 (구체적으로 핵산 분자)의 증폭 반응에 의하여 얻을 수 있다.
본 발명의 일 구현예에 따르면, 데이터 세트는 원시 데이터 세트의 수학적으로 가공된 데이터 세트일 수 있다. 구체적으로 데이터 세트는 원시 데이터 세트로부터 배경신호를 제거하기 위한 베이스라인이 차감된 데이터 세트일 수 있다. 베이스라인 차감된 데이터 세트는 당업계에 공지된 다양한 방법 (예를 들어, 미국특허 제8,560,240)을 통하여 수득할 수 있다.
본 발명의 일 구현예에 따르면, 데이터 세트는 원시 데이터 세트, 상기 원시 데이터 세트의 수학적으로 가공된 데이터 세트, 상기 원시 데이터 세트 또는 이의 수학적으로 가공된 데이터 세트의 표준화(normalization)된 데이터 세트일 수 있다.
본 명세서에서 용어 "원시 데이터 세트"는 신호-발생 반응으로부터 수득한 사이클 번호 및 신호값을 포함하는 데이터 지점의 집합을 의미한다. 원시 데이터 세트는 실시간 PCR과 같은 신호-발생 반응을 수행하기 위한 장비로부터 최초로 수득하는 비가공된 데이터 지점들의 그룹을 의미한다. 본 발명의 일 구현예에 따르면, 원시 데이터 세트는 당업계의 당업자에게 전통적으로 알려져 있는 원시 데이터 세트일 수 있다. 본 발명의 다른 일 구현예에 따르면, 원시 데이터 세트는 본 명세서에 기술된 수학적으로 가공된 데이터 세트의 기초가 되는 데이터 세트일 수 있다. 본 발명의 일 구현예에 따르면, 원시 데이터 세트는 베이스라인이 차감되지 않은 데이터 세트(베이스라인 비차감 데이터 세트)일 수 있다.
본 명세서에서 용어 "표준화"(normalization)은 신호-발생 반응으로부터 수득한 데이터 세트의 신호 편차를 감소시키거나 제거하는 과정을 의미한다. 본 명세서에서 용어 "보정"(calibration) 또는 "조정"(adjustment)은 데이터 세트의 수정을 의미하며, 구체적으로 분석 목적에 적합하도록 데이터 세트를 수정하는 것을 의미한다. 표준화는 보정의 일 양태이다.
본 발명의 일 구현예에 따르면, 표준화된 데이터 세트는 다음의 단계를 포함하는 방법에 의하여 제공된다:
(i) 상기 원시 데이터 세트 또는 상기 원시 데이터 세트의 수학적으로 가공된 데이터 세트를 보정하기 위한 표준화 계수를 제공하는 단계; 상기 표준화 계수는 기준값, 기준 사이클 및 상기 데이터 세트를 이용하여 제공되며; 상기 기준 사이클은 상기 데이터 세트의 사이클들 중에서 선택되며; 상기 기준값은 임의로 정해진 값이며; 상기 표준화 계수는 상기 기준 사이클에 해당되는 상기 데이터 세트의 사이클에서의 신호값 및 상기 기준값 사이의 관계를 정하여 제공되며; 및
(ii) 상기 표준화 계수를 상기 데이터 세트의 신호값들에 적용하여 보정된 신호값들을 수득하여 표준화된 데이터 세트를 제공하는 단계.
기준 사이클은 기준값과 연관되어 표준화 계수를 제공하는데 사용되는 특정 신호값을 결정하기 위하여 선택된 사이클이다. 표준화 계수를 제공하기 위한 기준 사이클은 데이터 세트의 사이클 중에서 임의로 선택될 수 있다. 기준 사이클은 사이클의 의미에 따라 기준 온도, 기준 농도 또는 기준 시간 일 수 있다.
본 발명의 일 구현예에 따르면, 기준 사이클은 배경지역의 사이클에서 선택될 수 있다.
배경지역은 신호-발생 반응에서 증폭 신호가 충분히 검출되기 전 초기 단계를 의미한다. 배경지역은 배경 신호만이 나타나며, 타겟 분석물질에 의한 신호는 거의 나타나지 않는 지역을 의미한다. 배경지역 신호는 샘플 내 타겟 분석물질에 의한 신호가 아닌 분석 시스템 자체 또는 타겟 분석물질이 관여하지 아니한 신호-발생 수단 자체에서 발생된 신호이다.
구체적으로, 기준 사이클은 배경지역의 1-30, 2-30, 2-20, 2-15, 2-10, 2-8, 3-30, 3-20, 3-15, 3-10, 3-9, 3-8, 4-8, 또는 5-8 사이클에서 결정될 수 있다.
기준값은 표준화 계수를 제공하기 위하여 사용되는 값이다. 본 발명의 기준값은 데이터 세트의 신호값을 보정하기 위하여 기준 사이클에 적용되는 임의의 값을 의미한다. 기준값은 임의로 정한 값 일 수 있다. 바람직하게는 상기 기준값은 0을 제외한 실수 중에서 임의로 결정된 값일 수 있다. 바람직하게는 기준값은 보정된 데이터 세트의 값들과 동일한 종류의 값일 수 있으며, 보정될 데이터 세트와 동일한 단위 또는 차원을 가질 수 있다.
기준값 및 데이터 세트에서 기준 사이클에 대응하는 사이클에서의 신호값으로부터 보정계수가 제공되면, 표준화 계수는 상기 기준값에 대한 데이터 세트에서 기준 사이클에 대응하는 사이클에서의 신호값의 비율에 따라 결정될 수 있다.
단계 (b): 신호 변화량 수득에 의한 신호 변화량 데이터 세트 제공 (S120)
신호 변화량 데이터 세트는 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화값을 수득하여 제공될 수 있다.
신호 변화량 데이터 세트는 데이터 세트의 각 데이터 지점에서의 신호 변화량을 나타낸다. 신호 변화량 데이터 세트는 사이클들 및 각 사이클에서의 신호 변화량을 포함하는 복수의 데이터 지점을 포함한다.
상기 신호 변화량 데이터 세트는 변화값 데이터 세트 및 변화율 데이터 세트를 포함할 수 있다. 상기 신호 변화량은 신호 변화값 및 신호 변화율을 모두 포함할 수 있다.
상기 신호 변화량은 공지의 방법에 의해 수득될 수 있다. 예를 들어, 미분법, 차분법, 비율법 및 선형회귀분석법에 의해 수득될 수 있으나, 이에 제한되지 아니한다.
본 발명의 일 구현예에 따르면, 상기 각 사이클에서의 누적값은 각 사이클에서의 미분값들의 누적값, 각 사이클에서의 차분값들의 누적값, 각 사이클에서의 비율들의 누적값 및 기울기값들의 누적값으로 이루어진 군에서 선택된 것일 수 있다.
미분법에 따르면, 신호 변화량은 원시 데이터 세트에 fitting하는 함수를 구하고, 상기 함수의 도함수(derivative function)를 구한 후, 상기 도함수를 이용하여 각 사이클에서의 신호 변화량을 수득하는 방법으로 수득할 수 있다.
차분법에 따르면, 두 사이클(참조 사이클 1 및 2)간의 신호값의 차이를 계산하는 방법으로 한 사이클(타겟 사이클; Cn)에서의 신호 변화량을 수득한다.
본 발명의 일 구현예에 따르면, 참조 사이클 중 하나는 타겟 사이클(Cn)이며, 다른 참조 사이클은 상기 타겟 사이클에 바로 이전 사이클(Cn-1)일 수 있다. 이러한 경우, Cn에서의 신호 변화량은 Cn의 신호값에서 Cn-1의 신호값을 차감하는 방법으로 수득할 수 있다. 하나의 참조 사이클이 Cn으로 지정되는 경우 또 다른 참조 사이클은 Cn-1, Cn-2, Cn-3, Cn+1, Cn+2 또는 Cn+3일 수 있다.
본 발명의 다른 일 구현예에 따르면, 두 참조 사이클 중 어떤 것도 Cn으로 지정되지 않을 수 있다. 예를 들어, 타겟 사이클(Cn)에서의 신호 변화량을 구하기 위한 두 참조 사이클은 (Cn-1 및 Cn+1), (Cn-2 및 Cn+2) 또는 (Cn-3 및 Cn+3)일 수 있다.
본 발명의 일 구현예에 따르면, 타겟 사이클에서의 신호 변화량은 두 참조 사이클 사이의 신호값의 차(difference)를 두 참조 사이클 사이의 사이클 번호의 차이로 나눈 것일 수 있다.
비율법에 의하면, 두 사이클(참조 사이클 1 및 2)간의 신호값의 비율을 계산하는 방법으로 한 사이클(타겟 사이클; Cn)에서의 신호 변화량을 수득한다.
본 발명의 일 구현예에 따르면, 참조 사이클 중 하나는 타겟 사이클(Cn)이며, 다른 참조 사이클은 상기 타겟 사이클에 바로 이전 사이클(Cn-1)일 수 있다. 이러한 경우, Cn에서의 신호 변화량은 Cn의 신호값을 Cn-1의 신호값으로 나누는 방법으로 수득할 수 있다.
택일적으로, 신호 변화량은 선형회귀분석 또는 최소자승법(LMS 방법)에 의해 제공될 수 있다. LMS방법은 가장 단순하고 빈번하게 적용되는 선형회귀분석 방법이다.
선형회귀분석 방법에 따르면, 특정 사이클의 데이터 지점 및 상기 특정 사이클 전 및/또는 후에 위치한 적어도 하나 이상의 사이클의 데이터 지점을 이용하여, 사이클(타겟 사이클; Cn)에서의 피팅(fitting) 함수를 선형회귀분석에 따라 구하고, 상기 피팅 함수의 기울기(사이클 번호의 증가에 따른 신호값의 변화량)를 신호 변화량으로 할당한다.
피팅 함수를 수득하는데 사용되는 데이터 지점의 수는 2개 또는 그 이상일 수 있다. 예를 들어, 피팅 함수를 수득하는데 사용되는 데이터 지점의 수는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 이하일 수 있다. 구체적으로 상기 데이터 지점의 수는 이 범위에 제한되지 아니하나, 2-3, 2-15, 3-21, 3-11, 3-9, 3-7, 3-5 또는 5-7개 일 수 있다.
이하 선형회귀분석의 대표예로 최소자승법을 설명하나, 청구항의 본 발명의 범위는 이에 제한되지 않는다.
본 발명의 일 구현예에 따르면, 최소자승법은 다음 수학식 1로 표현된다:
수학식 1
Figure 112019000448381-pct00001
여기에서,
Figure 112019000448381-pct00002
이다.
I는 기울기가 계산되는 데이터 지점의 사이클 번호이며, m은 I번째 사이클 데이터 지점의 기울기이며, xi는 i번째 사이클의 사이클 번호이며, yi는 i번째 사이클에서 측정되는 신호값이다.
"n" 또는 "a+b+1"은 I번째 사이클에서의 기울기 계산에 사용되는 데이터 지점의 수를 의미하며, LSMR(Linear Squares Method Range)라고 칭한다. "a"는 I번째 사이클에서의 기울기 계산에 사용되는 데이터 지점 그룹 중 최소 사이클 번호를 구하기 위한 값이다. "b"는 최대 사이클 번호를 구하기 위한 값이다.
"a" 및 "b"는 각각 독립적으로 0 내지 10의 정수이며, 구체적으로 1 내지 5, 보다 구체적으로 1 내지 3일 수 있다.
상기 "a" 및 "b"는 동일한 값을 가지는 것이 바람직하지만, 측정 대상 물질, 측정 환경 또는 기울기가 측정되는 사이클에 따라 상이할 수 있다.
본 발명의 일 구현예에 따르면, 다른 사이클들에서 신호 변화량을 구하는 방법이 특정 사이클에는 적절하지 않는 경우, 특정 사이클에서의 신호 변화량은 다른 사이클들에서 신호 변화량을 구하는 방법과 다른 방법으로 제공될 수 있다.
예를 들어, 첫번째 사이클 또는 마지막 사이클에서의 신호 변화량은 다른 사이클과 상이한 방법으로 제공될 수 있다.
본 발명의 일 구현예에 따르면, 신호 변화량 데이터 세트 중 첫번째 사이클의 신호 변화량 데이터 세트는 0의 값으로 지정될 수 있다. 이 경우, 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 제공되는 재구성된 데이터 세트의 베이스라인 영역의 신호값은 0이 된다.
택일적으로, 신호 변화량 데이터 세트의 첫번째 사이클에서의 신호 변화량은 원시 데이터 세트의 첫번째 사이클에서의 신호값 또는 미리 결정된 신호값으로 지정될 수 있다. 이러한 경우, 신호 변화량 데이터 세트의 신호 변화량을 사용하여 각 사이클에서의 누적값을 수득하여 제공되는 재구성된 데이터 세트의 베이스라인 영역의 신호값은 원시 데이터 세트의 첫번째 사이클에서의 신호값 또는 미리 결정된 신호값과 동일한 값을 가지게 된다.
신호 변화량 데이터 세트의 신호 변화량을 사용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계 (c) 이전에, 신호 변화량 데이터 세트의 하나 이상의 신호 변화량은 가공될 수 있다. 본 발명의 일 구현예에 따르면, 본 발명의 방법은 신호 변화량 데이터 세트의 하나 이상의 신호 변화량을 가공하는 단계를 추가로 포함할 수 있다. 상기 하나 이상의 신호 변화량의 가공은 신호 변화량 데이터 세트의 베이스라이닝 또는 비정상 신호의 수정일 수 있다.
신호 변화량 데이터 세트의 가공은 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 제공된 재구성된 데이터 세트에 영향을 미치게 된다.
<신호 변화량 데이터 세트의 베이스라이닝>
데이터 세트의 베이스라인 영역이란 타겟 물질 또는 타겟 현상의 존재 또는 발생에 거의 영향을 받지 않고, 단지 신호 측정 기기 자체 또는 타겟 분석물질이 관련되지 않은 신호-발생 반응 자체에서 발생하는 신호가 반영된 영역을 말한다. 일반적으로 베이스라인 영역의 신호값은 거의 변화가 없다. 그러나, 베이스라인 영역에서 타겟 분석물질의 존재 여부에 상관없이 사이클에 따라 신호값이 변화하는 원인이 되는 오류를 가지는 데이터 세트가 있다. 이러한 경우 베이스라인 영역의 오류는 수정되어야 한다.
이러한 베이스라인 영역의 오류를 수정하기 위한 기존의 방법들은 다음의 과정을 포함한다:
데이터 세트를 플롯팅하여 베이스라인 영역을 결정하고, 베이스라인의 기울어진 정도를 결정한다. 이후, 상기 플롯팅된 곡선을 적절히 회전시켜 수정된 데이터 세트를 수득한다. 또는 베이스라인 영역에 피팅(fitting)된 선형 함수 방정식을 수득하고 각 사이클에서의 상기 함수에 대한 결과값을 차감하여 수정된 데이터 세트를 수득한다.
이러한 기존의 방법들은 베이스라인 영역을 결정한 후 베이스라인 기울기를 계산하거나, 베이스라인에 피팅된 선형 함수를 수득하는 것과 같은 매우 복잡한 과정을 이용해야 하는 단점이 있다.
본 발명의 방법은 데이터 세트의 베이스라인 오류 문제를 신호 변화량 데이터 세트를 가공하고, 상기 가공된 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 해결하였다.
본 명세서에서 용어 "데이터 세트의 베이스라이닝"이란 데이터 세트의 각 사이클에서의 신호값으로부터 베이스라인에 해당하는 값을 차감하는 데이터 세트를 가공하는 과정을 말하며, 이로 인하여 베이스라인 차감된 데이터 세트가 수득된다.
신호 변화량 데이터 세트의 베이스라이닝을 통하여 신호 변화량 데이터 세트의 베이스라인 영역은 0으로 조정된다. 재구성된 데이터 세트는 단계 (c)에서 가공된 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 얻어 수득할 수 있다. 이러한 방법으로 베이스라인 오류가 수정된 가공된 데이터 세트를 얻을 수 있다.
본 발명의 일 구현예에 따르면, 상기 신호 변화량 데이터 세트는 베이스라인 차감된 신호 변화량 데이터 세트일 수 있다.
베이스라인의 차감은 상기 데이터 세트의 베이스라인 영역의 값에 따른 데이터 세트를 보정일 수 있다.
구체적으로 베이스라인 차감된 신호 변화량 데이터 세트는 베이스라인 영역의 신호 변화량이 0으로 조정된 신호 변화량 데이터 세트일 수 있다.
베이스라인 차감된 신호 변화량 데이터 세트는 신호 변화량 데이터 세트의 하나 이상의 신호 변화량을 보정하여 제공될 수 있으며, 특히 신호 변화량 데이터 세트의 각 신호 변화량에서 신호 변화량 데이터 세트의 베이스라인 영역의 신호값을 차감하여 제공될 수 있다. 그러므로, 본 발명의 일 구현예에 따르면, 본 발명의 방법은 단계 (c) 이전에 단계 (b)에서 제공된 신호 변화량 데이터 세트를 베이스라이닝하는 단계를 포함할 수 있다. 상기 베이스라이닝 단계는 데이터 세트의 베이스라인이 기울어져 있는 문제를 해결하기 위한 선택적인 단계이다. 상기 베이스라이닝 단계는 도 3의 데이터 세트 1 보다 데이터 세트 2와 같이 원시 데이터 세트의 베이스라인이 기울어진 경우 유용하게 적용될 수 있다.
신호 변화량 데이터 세트를 베이스라이닝 하는 방법은 특정 방법으로 한정되지 아니하며, 공지의 알려진 방법 중에 선택될 수 있다.
본 발명의 특정 일 구현예에 따르면, 베이스라인 영역의 신호 변화량이 실질적으로 0이 되도록 신호 변화량 데이터 세트의 신호 변화량에서 특정 값을 차감할 수 있다.
구체적으로, 신호 변화량 데이터 세트에서 신호가 타겟의 존재 또는 발생에 거의 영향을 받지 않는 초기 특정 사이클 또는 사이클 영역을 결정한 후, 결정된 사이클에서의 평균 신호 변화량을 계산하고, 각 사이클의 신호 변화량으로부터 상기 계산된 평균 신호 변화량을 차감하여 베이스라인 차감된 신호 변화량 데이터 세트를 수득한다.
<신호 변화량 데이터 세트의 비정상 신호의 수정>
신호 변화량 데이터 세트의 비정상 신호의 수정은 본 발명의 가공 방법의 일 구현예이다. 본 발명의 신호 변화량 데이터 세트의 비정상 신호의 수정은 신호 변화량 데이터 세트로부터 비정상 신호로 분류되는 신호를 가지는 사이클을 검출하고, 상기 검출된 사이클에 해당하는 비정상 신호를 수정하여 원시 데이터 세트의 비정상 신호를 수정하는 방법으로 수행될 수 있다.
신호 변화량 데이터 세트를 이용한 데이터 세트의 비정상 신호의 수정은 섹션 2에서 상세히 설명한다.
단계 (c): 누적값 수득에 의한 재구성된 데이터 세트 제공 (S130)
재구성된 데이터 세트는 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 제공된다.
재구성된 데이터 세트는 사이클들 및 상기 사이클에서의 누적값을 포함하는 복수의 데이터 지점을 포함한다. 상기 누적값은 오리지널 원시 데이터의 신호값에 비하여 개조된 값이다.
신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 제공되는 상기 재구성된 데이터 세트는 개조된 신호값을 포함하는 복수의 데이터 지점을 포함한다.
단계 (a) 및 (b)를 통하여 원시 데이터 세트의 신호값을 이용하여 신호 변화량을 얻어 신호 변화량 데이터 세트를 수득하고, 단계 (c)를 통하여 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 누적값을 수득하여 상기 신호 변화량 데이터 세트를 재구성된 데이터 세트로 변환한다. 단계 (a) 내지 (c)를 통하여 원시 데이터 세트는 타겟 분석물질 검출에 월등하게 적합한 재구성된 데이터 세트로 변환된다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 누적값은 각 사이클에서의 미분값들의 누적값; 각 사이클에서의 차분값들의 누적값; 각 사이클에서의 비율들의 누적값 및 각 사이클에서의 기울기값들의 누적값으로 이루어진 군에서 선택된 것일 수 있다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 누적값은 누적-시작 사이클 및 누적-시작값을 이용하여 수득할 수 있다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 누적값은 누적-시작 사이클(CSC)의 번호에 대한 각 사이클의 번호(Xi)에 따라 다음의 계산법들 중 하나에 의하여 계산될 수 있다: 상기 누적-시작 사이클은 상기 신호 변화량 데이터 세트의 사이클들 중에서 선택된 사이클이며;
(계산법-1) 상기 Xi이 CSC의 번호보다 큰 경우, 상기 각 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 누적-시작 사이클 바로 다음 사이클부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산되며; 상기 누적-시작 값은 상기 누적-시작 사이클에서의 누적값이며;
(계산법-2) 상기 Xi이 CSC의 번호보다 작은 경우, 상기 각 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 각 사이클의 바로 다음 사이클부터 상기 누적-시작 사이클까지의 신호 변화량으로부터 유래된 값을 누적하여 계산되며;
(계산법-3) 상기 Xi이 CSC의 번호와 동일한 경우, 상기 누적-시작 값이 상기 각 사이클에서의 누적값으로 지정된다.
본 명세서에서 용어 "신호 변화량으로부터 유래된 값"은 상기 신호 변화량을 가공하여 수득한 값을 의미한다. 상기 가공은 수학적 가공일 수 있다. 본 발명의 일 구현예에 따르면, 상기 신호 변화량으로부터 유래된 값은 수학적으로 가공된 신호 변화량일 수 있다. 예를 들어, 신호 변화량으로부터 유래된 값은 신호 변화량의 덧셈의 역원, 곱셈의 역원 또는 역수를 포함할 수 있으나, 이에 제한되지 않는다.
각 사이클에서의 누적값은 누적-시작 사이클(CSC)의 번호에 대한 각 사이클의 번호(Xi)에 따라 상이한 방법으로 수득될 수 있다.
누적값은 누적합(cumulative sum) 또는 누적곱(cumulative product)일 수 있다.
상기 누적값이 누적합이며, 누적값이 계산될 사이클(X 사이클)의 번호가 CSC의 번호보다 큰 경우, 상기 X 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 누적-시작 사이클 바로 다음 사이클부터 상기 X 사이클까지의 신호 변화량을 누적하여 수득된다.
상기 누적값이 누적합이며, 상기 X 사이클의 번호가 CSC의 번호보다 작은 경우, 상기 X 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 X 사이클 바로 다음 사이클부터 누적-시작 사이클까지의 신호 변화량의 덧셈의 역원(additive inverse)을 누적하여 수득된다.
상기 누적값이 누적합인 경우, 용어 "누적"은 "더하기"(adding)일 수 있다.
수학적으로, 어떤 수 x의 덧셈의 역원은 -x로 표시되며, 상기 x에 더하여 합이 0이 되는 수를 말한다.
누적값이 누적곱이며, 누적값이 계산될 사이클(X 사이클)의 번호가 CSC의 번호보다 큰 경우, 상기 X 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 누적-시작 사이클 바로 다음 사이클부터 상기 X 사이클까지의 신호 변화량을 누적하여 수득된다.
누적값이 누적곱이며, 상기 X 사이클의 번호가 CSC보다 작은 경우, 상기 X 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 X 사이클 바로 다음 사이클부터 누적-시작 사이클까지의 신호 변화량의 역수(reciprocal)를 누적하여 수득된다.
상기 누적값이 누적곱인 경우, 용어 "누적"은 "곱하기"(multiplying)일 수 있다.
수학적으로, 어떤 수 x의 곱셈의 역원(multiplicative inverse) 또는 역원(reciprocal)은 1/x로 표시되며, 상기 x와 곱하여 1이 되는 수를 말한다.
본 명세서에서 용어 "누적-시작 사이클"은 각 사이클에서의 누적값을 수득하기 위한 누적이 시작되는 사이클을 의미한다. 누적-시작 사이클은 임의로 선택될 수 있다. 데이터 세트의 최초 사이클 및 마지막 사이클을 포함한 데이터 세트 내의 어떤 사이클도 누적-시작 사이클로 지정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 누적-시작 사이클은 데이터 세트의 첫번째 사이클 일 수 있다. 이러한 경우, 각 사이클에서의 누적값은 상기 첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산될 수 있다.
데이터 세트의 베이스라인 영역의 사이클이 누적-시작 사이클로 지정되는 경우(예를 들어, 첫번째 사이클이 누적-시작 사이클로 지정되는 경우), 누적-시작값은 재구성된 데이터 세트의 베이스라인 영역 내 신호값일 수 있다. 이러한 경우, 누적-시작 값으로 0을 배정하는 것만으로 베이스라인 차감된 재구성된 데이터 세트를 쉽게 수득할 수 있다.
본 명세서에서 용어 "누적-시작 값"은 재구성된 데이터 세트의 누적-시작 사이클에서의 신호값을 의미한다. 상기 누적-시작 값은 임의로 정한 값 일 수 있다.
본 발명의 일 구현예에 따르면, 누적-시작 값은 원시 데이터 세트의 누적-시작 사이클에서의 신호값일 수 있다. 원시 데이터 세트의 누적-시작 사이클에서의 신호값을 누적-시작 값으로 설정하는 경우, 각 사이클에서의 신호값을 고려할 때 원시 데이터 세트와 유사한 재구성된 데이터 세트가 수득될 수 있다.
본 발명의 일 구현예에 따르면, 상기 누적-시작 값은 0 또는 1 일 수 있다. 누적-시작 사이클이 베이스라인 영역에서 결정되면, 재구성된 데이터 세트의 베이스라인 차감은 누적-시작 값을 0으로 설정하는 것으로 손쉽게 구현할 수 있다.
신호 변화량 데이터 세트에 피팅(fitting)되는 함수를 적분하여 재구성된 데이터 세트의 누적값을 수득하는 경우, 상기 누적값은 (i) 신호 변화량 데이터 세트의 사이클을 누적-시작 사이클을 기준으로 두 개의 그룹으로 나누는 단계 (다시 말해, 누적-시작 사이클 이전 사이클 그룹 또는 이후 사이클 그룹) 및 (ii) 각 그룹에 fitting 하는 함수의 적분을 구하는 단계를 통하여 수득할 수 있다. 적분 상수는 신호 변화량 데이터 세트의 누적-시작 사이클에서의 피팅(fitting) 함수의 적분값이 누적-시작 값이 되도록 결정될 수 있다.
추가로, 누적-시작 값은 신호 변화량 데이터 세트의 누적-시작 사이클에서의 신호값일 수 있다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 누적값은 첫번째 사이클에서부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산될 수 있다. 누적-시작 사이클이 신호 변화량 데이터 세트의 첫번째 사이클이며, 누적-시작 값은 누적-시작 사이클에서의 신호값인 경우, 각 사이클의 누적값은 단순히 첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산될 수 있다.
"첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 누적한다"는 것은 "첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 곱한다"는 것과 "첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 더한다"는 것을 모두 의미할 수 있다.
신호 변화량이 각 사이클에서의 신호값의 미분값, 각 사이클에서 이전 사이클을 고려한 신호값의 차이(difference) 또는 각 사이클에서의 선형회귀분석을 통하여 수득한 기울기 값(slope value)이며, 누적-시작 사이클은 신호 변화량 데이터 세트의 첫번째 사이클이며, 누적-시작 값은 누적-시작 사이클에서의 신호값인 경우, 누적값은 첫 사이클에서 상기 각 사이클까지의 신호 변화량을 더하여 계산된 누적합일 수 있다. 예를 들어, 10번째 사이클(다시 말해, 사이클 번호 10)에서의 누적합은 사이클 번호 1부터 10까지의 신호 변화량을 모두 더하는 방법으로 계산될 수 있다. 택일적으로, 각 사이클에서의 누적합은 신호 변화량 데이터 세트를 피팅(fitting)한 함수의 적분을 구하여 수득될 수 있다. 적분 상수는 0 또는 임의로 정한 상수로 지정될 수 있다.
적분 상수가 0으로 지정되는 경우, 재구성된 데이터 세트의 베이스라인은 0 또는 실질적으로 0인 값으로 조정될 수 있다. 적분 상수가 원시 데이터 세트의 베이스라인 영역의 신호값으로 지정되는 경우, 베이스라인이 원시 데이터 세트의 베이스라인과 동일한 값을 가지는 재구성된 데이터 세트가 수득될 수 있다.
누적곱은 첫번째 사이클에서 각 사이클까지의 신호 변화량을 곱하여 계산될 수 있다.
신호 변화량이 각 사이클에서의 이전 사이클을 고려한 신호값의 비율이며, 누적-시작 사이클은 신호 변화량 데이터 세트의 첫번째 사이클이며, 누적-시작 값은 누적-시작 사이클에서의 신호값인 경우, 누적값은 첫번째 사이클에서 상기 각 사이클까지의 신호 변화량을 곱하여 계산된 누적곱일 수 있다.
본 발명의 일 구현예에 따르면, 특정 사이클에서의 신호 변화량은 다른 사이클에서의 신호 변화량을 계산하는 것과 다른 방법으로 계산되어 제공될 수 있다. 이러한 구현예는 다른 사이클들에서 신호 변화량을 구하는데 사용된 계산 방법이 상기 특정 사이클에서 신호 변화량을 구하는데 적절하지 않는 경우 유용할 수 있다.
따라서, 누적-시작 값이 신호 변화량 데이터 세트의 누적-시작 사이클에서의 신호값으로 지정되면, 재구성된 데이터 세트의 누적값은 신호 변화량 계산 방법에 따라 달라질 수 있다.
예를 들어, 누적-시작 사이클이 데이터 세트의 첫번째 사이클이며, 누적-시작 값이 신호 변화량 데이터 세트의 누적-시작 사이클에서의 신호값이며, 신호 변화량 데이터 세트의 첫번째 사이클에서의 신호 변화량이 0으로 지정되는 경우, 재구성된 데이터 세트의 첫번째 사이클에서의 누적값은 0이며, 다음 사이클의 누적값은 첫번째 사이클에서의 누적값에 기초하여 결정된다.
또 다른 예로, 누적-시작 사이클이 데이터 세트의 첫번째 사이클이며, 누적-시작 값이 신호 변화량 데이터 세트의 누적-시작 사이클에서의 신호값이며, 신호 변화량 데이터 세트의 첫번째 사이클의 신호 변화량이 원시 데이터 세트의 첫번째 사이클의 신호값과 동일한 값으로 지정되는 경우, 재구성된 데이터 세트의 첫번째 사이클에서의 누적값은 원시 데이터 세트의 첫번째 사이클에서의 신호값과 동일한 값을 가지며, 이후 사이클에서의 누적값은 상기 첫번째 사이클에서의 누적값에 기초하여 결정된다.
본 발명의 일 구현예에 따르면, 원시 데이터 세트의 베이스라인 영역의 초기 신호값이 어떤 것인지와 무관하게, 베이스라인 영역의 신호값이 특정 값(예를 들어, 0 또는 원시 데이터 세트의 첫번째 사이클에서의 신호값과 동일한 값)을 가지는 재구성된 데이터 세트를 수득할 수 있다. 그러므로, 본 발명의 방법에 의하면, 복수의 데이터 세트가 동일한 기준으로 수정될 수 있으며, 따라서, 신뢰성 있는 분석결과를 수득할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 데이터 세트의 평활(smoothing)을 위하여, 상기 (c) 단계에서 제공된 재구성된 데이터 세트를 (b) 단계의 데이터 세트로 설정하여 (b) -(c) 단계를 반복하는 단계를 추가로 포함할 수 있다.
본 명세서에서 용어 "데이터 세트의 평활"(smoothing of the data set)은 데이터 세트의 노이즈를 제거 또는 최소화 하기 위하여 미리 정해진 알고리즘에 따라 데이터 세트를 가공 또는 정제하는 것을 의미한다. 상기 데이터 세트의 평활을 통하여 데이터 세트의 시각적 표현이 향상된다. 데이터 세트의 평활은 섹션 IV에서 상세히 설명한다.
단계 (d): 재구성된 데이터 세트를 이용한 타겟 분석물질 검출 (S140)
재구성된 데이터 세트의 분석을 통하여 샘플 내 타겟 분석물질이 검출된다.
샘플 내 타겟 분석물질의 검출은 타겟 분석물질에 대한 신호-발생 반응에 의하여 수득된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 정성적 또는 정량적으로 검출 하는 것을 의미한다. 상기 정성적 또는 정량적 검출은 샘플 내 타겟 분석물질의 존재 또는 부존재를 검출하는 것, 샘플 내 타겟 분석물질의 양을 검출하는 것, 생물학적 또는 화학적 반응에 의하여 타겟 분석물질의 양 또는 상태의 변화를 검출하는 것일 수 있다.
본 명세서에서 용어 "타겟 분석물질의 분석", "타겟 분석물질의 검출", "타겟 분석물질의 정성적 또는 정량적 분석" 또는 "타겟 분석물질의 정성적 또는 정량적 검출"은 샘플 내 타겟 분석물질의 존부, 샘플 내 타겟 분석물질의 양 또는 생물학적 또는 화학적 반응에 의한 타겟 분석물질의 양 또는 상태의 변화에 관한 정보를 수득하는 것을 의미하며, 이들 용어는 상호 구별 없이 사용될 수 있다.
본 발명의 일 구현예에 따르면, 단계 (d)의 타겟 분석물질 검출은 샘플 내 타겟 분석물질의 정성적 또는 정량적 검출일 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 다음의 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법을 제공한다:
(a) 타겟 분석물질에 대한 데이터 세트 제공;
(b) 데이터 세트의 표준화;
(c) 데이터 세트의 신호값을 이용한 각 사이클에서의 신호 변화량 수득을 통한 신호 변화량 데이터 세트의 제공;
(d) 신호 변화량 데이터 세트의 베이스라이닝;
(e) 신호 변화량 데이터 세트의 보정;
(f) 보정된 신호 변화량 데이터 세트의 신호 변화량을 이용한 각 사이클에서의 누적값 수득을 통한 재구성된 데이터 세트 제공; 및
(g) 재구성된 데이터 세트를 이용한 샘플 내 타겟 분석물질의 검출.
상기 (a) 내지 (g) 단계를 포함하는 타겟 분석물질 검출 방법은 앞서 설명한 내용을 모두 포함하므로, 불필요한 중복을 피하기 위하여, 이들 사이에 공통된 내용은 생략되어 있으나, 상기 방법의 해당 내용은 모두 포함된다.
데이터 세트의 표준화, 신호 변화량 데이터 세트의 보정 및 재구성된 데이터 세트의 제공 단계를 포함하는 상기 단계 (a) 내지 (g)의 타겟 분석물질 검출 방법에 따르면,
기기간 신호 편차, 비정상 신호, 노이즈 및 비정상 베이스라인과 같은 신호-발생 반응에 의한 타겟 분석물질 검출에 관련된 대부분의 문제가 해결될 수 있다. 상기 단계들에서, 단계 (b), (d) 및 (e)는 복합적으로 적절히 선택되어 사용될 수 있다.
II. 신호 변화량 데이터 세트의 보정 및 변환을 포함하는 샘플 내 타겟 분석물질 검출 방법
신호 변화량 데이터 세트의 가공 및 변환에 의하여 타겟 분석물질 검출에 적절하게 처리된 데이터 세트가 수득될 수 있다.
통상적으로 신호 변화량 데이터 세트는 원시 데이터 세트를 직접 수정하는데 필요한 정보를 제공하기 위하여만 사용된다. 예를 들어, 신호 변화량 데이터 세트는 베이스라인 영역의 끝 지점을 식별하기 위한 정보를 제공하기 위하여 사용되거나, 각 사이클에서의 신호가 비정상 신호인지 여부를 결정하기 위한 정보를 제공하지만, 베이스라인 영역의 수정 또는 비정상 신호의 수정은 신호 변화량 데이터 세트의 수정이 아닌, 오리지널 데이터 세트에 대한 직접적인 가공을 통하여 이루어지고 있다.
그러나, 본 발명에 의하면, 오리지널 데이터 세트의 비정상 신호의 수정 또는 베이스라인 영역의 수정은 신호 변화량 데이터 세트의 가공을 통하여 수행되며, 신호 변화량 데이터 세트 가공의 효과는 가공된 신호 변화량 데이터 세트의 변환 과정(transformation process)을 통하여 타겟 분석물질 검출을 위하여 최종 가공된 데이터 세트에 반영된다.
본 발명에 따르면, 각 사이클에서의 신호값의 유효성 검증 및 데이터 세트의 유효성 확보를 위한 가공이 동일한 데이터 세트에서 이루어지므로, 데이터 세트를 보다 정확하고 효율적으로 수정하고, 이를 이용한 신뢰성 있는 타겟 분석물질 검출이 가능하다.
본 발명의 일 양태에 따르면, 본 발명은 다음을 포함하는 타겟 분석물질 검출 방법을 제공한다:
(a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하는 단계;
(d) 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하는 단계; 및
(e) 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 단계.
단계 (a) 및 (b)를 통하여, 타겟 분석물질에 대한 데이터 세트가 수득되며, 이로부터 각 사이클 번호에서의 신호 변화량을 계산하여 신호 변화량 데이터 세트가 수득된다. 상기 (a) 및 (b) 단계는 섹션 I에서 설명한 바와 같다.
단계 (c): 신호 변화량 데이터 세트의 보정을 통한 보정된 신호 변화량 데이터 세트의 제공
단계 (c)에서는, 신호 변화량 데이터 세트의 보정을 통하여 보정된 신호 변화량 데이터 세트가 제공된다.
신호 변화량 데이터 세트의 보정의 일 구현예로, 신호 변화량 데이터 세트를 이용하여 비정상 신호값을 가지는 사이클을 검출하고 상기 검출된 사이클의 신호 변화량을 수정하여, 비정상 신호값을 수정하는 단계들을 포함할 수 있다.
본 발명의 일 구현예에 따르면, 비정상 신호의 수정을 위한 신호 변화량 데이터 세트의 보정은 다음의 방법에 따라 수행된다:
<신호 변화량 데이터 세트를 이용한 비정상 신호 수정 방법>
- 비정상 신호의 검출
데이터 세트의 비정상 신호는 비정상적인 신호 변화를 동반한다. 본 발명의 방법에 따르면, 신호 변화량 데이터 세트를 이용하여 비정상적인 신호의 변화량을 검출하고, 이를 수정하는 방법에 의해 비정상 신호를 보정한다.
비정상 신호 변화를 나타내는 피크(비정상 피크)를 검출하는 첫번째 단계로, 신호 변화량 데이터 세트의 피크들을 인식한다. 상기 피크는 터닝 포인트와 같이 지역적인 최대값 또는 최소값(local maximum or minimum value)을 포함하는 지점(point) 또는 일부 구역(local section)을 의미한다. 상기 지점 또는 일부 구역은 하나의 데이터 지점 또는 2개 이상의 연속적인 데이터 지점이다.
구체적으로, 상기 데이터 지점 또는 2개 이상의 연속적인 데이터 지점은 미리 결정된 기준으로부터 벗어난 신호값을 가질 수 있다. 예를 들어, 상기 기준은 특정 값의 임계값일 수 있다. 이 경우, 상기 임계값 이상의 값을 가지는 2개 이상의 연속적인 데이터 지점을 피크로 결정할 수 있다. 또 다른 예로, 상기 기준은 최대값 또는 최소값 대비 미리 결정된 특정 비율일 수 있으며, 이 경우 미리 결정된 비율 이상의 비율값을 가지는 2개 이상의 연속적인 데이터 지점을 피크로 결정할 수 있다.
본 발명의 일 구현예에 따르면, 피크는 임계값을 이용하여 인식할 수 있다. 구체적으로 신호 변화량 데이터 세트에서 지역적인 최대값 또는 최소값을 가지며 임계값보다 큰 신호 변화량을 가지는 2 이상의 연속적인 데이터 지점의 그룹이 하나의 피크로 인식될 수 있다.
비정상적인 변화를 나타내는 피크(비정상 피크)를 검출하는 두번째 단계로서, 상기 피크가 정상적인 신호 변화량을 나타내는 정상적인 피크인지 아니면 비정상 피크인지를 결정한다.
본 발명의 일 구현예에서는 "반피크 폭"(Half Peak Width) 방법이 신호 변화량 데이터 세트의 피크가 정상적인 피크인지, 비정상 피크인지 결정하는데 이용된다. 상기 반피크 폭 방법에 의하면, 피크의 비정상은 피크의 폭의 절반을 이용하여 결정된다.
맥스 사이클 번호는 한 피크 내에서 최대 신호 변화량을 가지는 데이터 지점의 사이클 번호를 말하며, 스타트 사이클 번호는 한 피크 내에서 임계값을 초과하는 최초 데이터 지점의 사이클 번호를 말한다. 피크의 폭의 절반은 상기 맥스 사이클 번호와 스타트 사이클 번호의 차이(Δcycle)이다.
노이즈 또는 다른 비정상적인 환경에 의하여 발생한 비정상 신호는 일반적으로 타겟 분석물질에 의하여 발생하는 정상 신호에 비하여 급격하게 신호값이 증가하거나 감소하는 신호 변화 패턴을 나타낸다. 이러한 신호 변화 패턴을 분석하여 상기 피크가 정상 피크인지 비정상 피크인지 식별한다. 주로, 비정상 피크의 폭의 절반은 정상피크 보다 작다. 본 발명의 일 구현예에 따르면, 피크의 폭의 절반이 미리 결정된 임계값보다 작은 피크를 비정상 피크로 결정한다.
- 비정상 신호의 수정
결정된 비정상 신호는 신호 변화량 데이터 세트의 보정을 통하여 수정될 수 있다.
본 발명의 일 구현예에 따르면, 타겟 분석물질 검출에서 일어날 수 있는 오류를 제거하기 위하여, 비정상 신호를 직접 수정하지 않고, 원시 데이터 세트로부터 수득한 신호 변화량 데이터 세트의 신호 변화량을 보정하여 수정할 수 있다.
비정상 피크 내의 신호 변화량들은 서로 동일한 값을 가지도록 보정될 수 있으며, 또는 사이클 번호의 증가 또는 감소에 따라 일정한 비율로 증가하거나 감소하도록 보정될 수 있다.
비정상 피크 내의 신호 변화량이 서로 동일한 값을 가지도록 보정되는 경우, 상기 비정상 피크에 해당하는 데이터 지점의 신호값은 동일한 비율로 증가하도록 수정되어 비정상 신호가 제거된다.
비정상 피크의 이전 및 이후 사이클의 신호 변화량이 동일하거나 유사한 값을 가지는 경우, 상기 비정상 피크 내의 신호 변화량은 상기 비정상 피크의 이전 및 이후 사이클과 동일 또는 유사하게 보정될 수 있다. 구체적으로, 비정상 피크의 이전 및 이후의 하나 이상의 사이클의 신호 변화량의 평균값을 상기 비정상 피크 내의 신호 변화량으로 지정할 수 있다. 특히, 이러한 보정은 비정상 피크의 데이터 지점들이 데이터 세트의 증폭구간에 해당하는 경우 적용될 수 있다.
본 발명의 일 구현예에 따르면, 비정상 피크 내의 신호 변화량은 0의 값을 가지도록 보정될 수 있다. 이러한 보정에 의하여, 비정상 피크에 해당하는 데이터 지점의 신호값은 증가하지 않고 바로 직전의 데이터 지점의 신호값과 동일한 값을 가지게 된다. 특히, 이러한 보정은 비정상 피크의 데이터 지점들이 데이터 세트의 배경지역에 해당하는 경우 적용될 수 있다. 비정상 피크 내 적어도 하나의 신호 변화량이 0의 값을 가지도록 보정될 수 있으며, 본 발명의 일 구현예에 따르면, 임계값을 초과하는 신호 변화량만을 0의 값을 가지도록 보정할 수 있다.
<배경지역의 노이즈 수정>
본 발명의 일 구현예에 따르면, 배경지역의 노이즈 신호를 수정하기 위하여 배경지역 내의 신호 변화량을 보정할 수 있다. 이 단계는 비정상 피크를 수정하기 위한 것이 아니라, 배경지역 신호의 노이즈를 수정하기 위한 선택적인 단계이므로, 이는 전술한 비정상 피크의 검출하고 상기 비정상 피크의 신호 변화량을 보정한 후에 수행될 수 있으며, 또는 상기 비정상 피크의 검출 및 보정과 독립적으로 진행될 수 있다.
본 명세서에서 용어 "노이즈"는 타겟 분석물질의 존부와는 독립적으로 발생하는 원하지 않은(unwanted), 분석물질에 의하지 않은(non-analyte related) 신호를 의미한다.
비정상 피크들의 보정 이후 신호 변화량 데이터 세트에서 남아 있는 피크들은 정상 피크일 것이므로, 첫번째 정상 피크의 시작 사이클 이전 사이클들의 신호 변화량은 0의 값으로 보정할 수 있다.
정상 피크의 첫번째 사이클의 결정은 다양한 방법에 의하여 결정될 수 있다.
본 발명의 일 구현예에 따르면, 정상 피크의 시작 사이클을 결정하기 위하여 갭(gap)이 적용될 수 있다. 갭은 정상 피크의 시작 사이클과 정상 피크 내에서 임계값을 초과하는 첫번째 데이터 지점의 사이클 사이의 사이클 간격을 의미한다.
정상 피크가 임계값에 의하여 인식되는 경우, 정상 피크의 첫번째 사이클은 정상 피크 내의 사이클 중 임계값을 초과하는 첫번째 데이터 지점에 해당하는 사이클 번호로부터 상기 갭을 차감하여 결정될 수 있다.
적용될 임계값 및 신호-발생 반응의 일반적인 신호 패턴에 따라 상기 갭은 적절히 미리 결정될 수 있다.
본 발명의 일 구현예에 따르면, 정상 피크가 발생하기 직전의 사이클 번호를 인식하기 위한 갭(gap)으로 5를 사용하여 정상 피크의 시작 사이클을 결정할 수 있다.
단계 (d): 보정된 신호 변화량 데이터 세트의 변환을 통한 변환된 데이터 세트 제공
단계 (d)에서, 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트가 제공된다. 상기 변환된 데이터 세트는 샘플 내 타겟 분석물질의 검출에 이용된다.
보정된 신호 변화량 데이터 세트의 변환은 샘플 내 타겟 분석물질의 검출에 보다 적절한 데이터 세트를 제공하기 위하여 수행된다.
본 발명의 일 구현예에 따르면, 보정된 신호 변화량 데이터 세트는 사이클들 및 대응되는 누적값을 가지는 데이터 지점들을 포함하는 재구성된 데이터 세트로 변환되고, 상기 재구성된 데이터 세트를 이용하여 타겟 분석물질이 검출될 수 있다. 재구성된 데이터 세트 내의 각 사이클에 해당하는 누적값은 원시 데이터 세트와 동일한 단위(예를 들어 RFU)를 사용하는 신호값이다. 따라서, 원시 데이터 세트로부터 타겟 분석물질 검출시 사용되는 전통적인 기준이 타겟 분석물질 검출을 위한 재구성된 데이터 세트에도 적용될 수 있다.
본 발명의 일 구현예에 따르면, 변환된 데이터 세트는 N차 신호 변화량 데이터 세트일 수 있다. 상기 N차 신호 변화량 데이터 세트는 보정된 신호 변화량 데이터 세트의 신호 변화량의 변화를 나타내는 N차 신호 변화량을 포함하는 데이터 세트이며, 상기 N은 2 이상의 정수이다. 더 높은 차수의 신호 변화량 데이터 세트는 신호 변화량 데이터 세트에 비하여 어떤 사이클에서 신호의 변화 (예를 들어 신호의 증가 또는 감소)가 시작되는지 더 정확하게 특정할 수 있다.
단계 (e): 변환된 데이터 세트를 이용한 샘플 내 타겟 분석물질의 검출
단계 (e)에서는 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출한다.
샘플 내 타겟 분석물질의 검출은 타겟 분석물질에 대한 신호-발생 반응에 의하여 수득되는 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 정성적 또는 정량적으로 검출하는 것을 의미한다. 상기 정성적 또는 정량적 검출은 샘플 내 타겟 분석물질의 존재 또는 부존재를 검출하는 것, 샘플 내 타겟 분석물질의 양을 검출하는 것, 생물학적 또는 화학적 반응에 의하여 타겟 분석물질의 양 또는 상태의 변화를 검출하는 것을 포함한다.
본 명세서에서 용어 "타겟 분석물질의 분석", "타겟 분석물질의 검출", "타겟 분석물질의 정성적 또는 정량적 분석" 또는 "타겟 분석물질의 정성적 또는 정량적 검출"은 샘플 내 타겟 분석물질의 존부, 샘플 내 타겟 분석물질의 양 또는 생물학적 또는 화학적 반응에 의한 타겟 분석물질의 양 또는 상태의 변화에 관한 정보를 수득하는 것을 의미하며, 이들 용어는 상호 구별 없이 사용될 수 있다.
본 발명의 일 구현예에 따르면, 단계 (e)의 타겟 분석물질 검출은 샘플 내 타겟 분석물질의 정성적 또는 정량적 검출일 수 있다.
본 발명에 있어서 검출 방법은 수득한 변환된 데이터 세트의 종류(type)에 따라 적절히 선택될 수 있다.
예를 들어, 변환된 데이터 세트가 신호 변화량 데이터 세트의 신호 변화량을 이용한 각 사이클에서의 누적값을 수득하여 제공된 재구성된 데이터 세트인 경우, 타겟 분석물질을 검출하는 기준 사이클 번호(말하자면, Ct : threshold cycle)는 미리 결정된 임계값에 의하여 결정될 수 있다.
또 다른 예로, 상기 변환된 데이터 세트가 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 신호 변화량의 변화값을 수득하여 제공되는 2차 신호 변화량 데이터 세트인 경우, 상기 2차 신호 변화량 데이터 세트의 첫번째 피크의 최고값에 해당하는 사이클 번호가 threshold cycle (Ct)로 지정될 수 있다.
III. 데이터 세트의 재구성 방법
본 발명의 또 다른 양태에 따르면, 본 발명은 다음의 단계를 포함하는 데이터 세트 재구성 방법을 제공한다:
(a) 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(b) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
섹션 III의 방법의 모든 단계는 섹션 I의 것과 중복되므로, 불필요한 중폭을 피하기 위하여, 이들 사이에 공통된 내용은 생략한다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 신호 변화량은 각 사이클에서의 신호값들의 미분값; 각 사이클에서의 신호값들의 차분값; 각 사이클에서의 신호값들의 비율; 및 각 사이클에서의 선형회귀분석을 수행하여 수득한 기울기값으로 이루어진 군에서 선택된 것 일 수 있다.
본 발명의 일 구현예에 따르면, 각 사이클에서의 누적값은 각 사이클에서의 미분값들의 누적값; 각 사이클에서의 차분값들의 누적값; 각 사이클에서의 비율들의 누적값; 및 기울기값들의 누적값으로 이루어진 군에서 선택된 것 일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 신호 변화량 데이터 세트의 베이스라이닝 단계를 포함할 수 있다. 신호 변화량 데이터 세트의 베이스라이닝에 관하여는 섹션 I에 기재되어 있다.
데이터 세트는 데이터 세트를 신호 변화량 데이터 세트로 전환하고 상기 신호 변화량 데이터 세트를 재구성된 데이터 세트로 재전환 하는 단계를 포함하는 데이터 세트의 재구성 방법을 통하여 보정될 수 있다. 이러한 데이터 세트의 재구성을 통하여, 데이터 세트는 타겟 분석물질의 검출에 적합하게 가공된다.
IV. 데이터 세트 평활 방법
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 데이터 세트 평활방법을 제공한다:
(a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
본 발명의 일 구현예에 따르면, 상기 데이터 세트의 평활 방법은 상기 단계 (c)에서 제공된 상기 재구성된 데이터 세트를 상기 (b)단계의 데이터 세트로 사용하여, (b)-(c)를 반복하는 단계를 추가적으로 포함한다.
본 명세서에서 용어 "데이터 세트의 평활"(smoothing of the data set)은 데이터 세트의 노이즈를 제거 또는 최소화 하기 위하여 미리 정해진 알고리즘에 따라 데이터 세트를 가공 또는 정제하는 것을 의미한다. 상기 데이터 세트의 평활을 통하여 데이터 세트의 시각적 표현이 향상된다.
데이터 분석에 있어서, 데이터 세트의 평활은 데이터 세트의 주된 패턴을 추종하는 대략적인 데이터 세트를 만드는 것이다. 데이터 세트의 평활은 노이즈, 다른 미세한 구조 또는 급격한 현상을 제거한다. 평활 과정을 통하여, 데이터 지점의 신호는 가공되며, 이를 통하여 개별적인 데이터 지점의 특징은 감소하고, 근접한 데이터 지점들간의 신호 차이가 감소한다. 이것은 데이터 세트의 신호의 거시적 변화에 대한 정보를 쉽게 인식할 수 있게 한다.
섹션 IV에 기재된 단계 (a) 내지 (c)에 관한 설명은 섹션 I의 것과 중복되므로, 불필요한 중복을 피하기 위하여 이들 사이에 공통된 내용은 생략한다.
본 발명의 일 구현예에 따르면, 신호 변화량은 각 사이클에서의 선형회귀분석을 수행하여 수득한 기울기값일 수 있다.
선형회귀분석에 관하여는 섹션 I에 기재되어 있다.
선형회귀분석에 의하여 신호 변화량을 수득하는 경우, 사이클에서의 신호 변화량은 상기 신호 변화량이 계산될 사이클의 전, 후 몇 사이클의 신호값을 이용하여 수득되므로, 신호 변화량이 계산되는 사이클에 근접한 사이클들의 신호값들 간의 차이가 감소한다.
본 방법에 의하여 신호 변화량 데이터 세트로부터 수득한 재구성된 데이터 세트는 이전의 데이터 세트(예를 들어 신호 변화량 데이터 세트를 수득하기 위한 가공이 되기 전 데이터 세트)보다 인접한 사이클 사이의 신호값의 편차를 보다 완화시켜, 재구성된 데이터 세트는 보다 부드러운 커브를 보이게 된다.
선형회귀분석의 방법으로, 이에 제한되지 아니하나, 최소자승법이 사용될 수 있다.
아래 기재는 최소자승법을 설명한 것이나, 청구항의 본 발명의 범위는 최소자승법에 제한되지 아니한다.
본 발명의 일 구현예에 따르면, 상기 최소자승법은 다음의 수학식 2로 표현된다:
수학식 2
Figure 112019000448381-pct00003
여기에서,
Figure 112019000448381-pct00004
이다.
I는 기울기가 계산되는 데이터 지점의 사이클 번호이며, m은 I번째 사이클 데이터 지점의 기울기이며, xi는 i번째 사이클의 사이클 번호이며, yi는 i번째 사이클에서 측정되는 신호값이다.
"n" 또는 "a+b+1"은 I번째 사이클에서의 기울기 계산에 사용되는 데이터 지점의 수를 의미하며, LSMR(Linear Squares Method Range)라고 칭한다. "a"는 I번째 사이클에서의 기울기 계산에 사용되는 데이터 지점 그룹 중 최소 사이클 번호를 구하기 위한 값이다. "b"는 최대 사이클 번호를 구하기 위한 값이다.
“a” 및 “b”는 각각 독립적으로 0 내지 10의 정수이며, 구체적으로 1 내지 5, 보다 구체적으로 1 내지 3일 수 있다.
상기 “a” 및 “b”는 동일한 값을 가지는 것이 바람직하지만, 측정 대상 물질, 측정 환경 또는 기울기가 측정되는 사이클에 따라 상이할 수 있다.
예를 들어, "a" 및 "b"의 값이 (1, 1), (2, 2), (3, 3) 및 (4, 4)의 그룹에서 선택될 수 있다. 상기 순서쌍 중 첫번째 값은 "a"의 값이며, 두번째 값은 "b"의 값이다.
신호값의 변화(증가 또는 감소)가 타겟 분석물질의 존재 또는 양에 의존적으로 증가하는 경우, 평활 프로세스에 의하여 변화 시작 사이클 지점이 이동(shift)하는 것을 방지하기 위하여, 값 "a"가 값 "b"보다 크게 설정될 수 있다. 예를 들어, "a" 및 "b"의 값은 (2, 1), (3, 1), (4, 1), (5, 1), (3, 2), (4, 2), (5, 2), (4, 3), (5, 3) 및 (5, 4)의 그룹에서 선택될 수 있다.
반대로, 신호값의 변화(증가 또는 감소)가 타겟 분석물질의 존재 또는 양에 의존적으로 감소하는 경우, 평활 프로세스에 의하여 변화 시작 사이클 지점이 이동(shift)하는 것을 방지하기 위하여, 값 "b"가 값 "a"보다 크게 설정될 수 있다. 예를 들어, "a" 및 "b"의 값은 (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5) 및 (4, 5)의 그룹에서 선택될 수 있다.
본 발명의 일 구현예에 따르면, 선형회귀분석을 통해 기울기 값을 얻기 위하여 사용되는 데이터 지점의 수는 3 내지 10일 수 있다.
본 발명의 일 구현예에 따르면, 상기 방법은 상기 단계 (c)에서 제공된 상기 재구성된 데이터 세트를 상기 (b)단계의 데이터 세트로 사용하여, (b)-(c)를 반복하는 단계를 추가적으로 포함할 수 있다.
(b)-(c) 단계의 반복은 이전에 수득한 재구성된 데이터 세트로부터 신호 변화량 데이터 세트를 제공하고, 상기 신호 변화량 데이터 세트로부터 다시 재구성된 데이터 세트를 수득하는 것에 의하여 수행될 수 있다. 신호 변화량 데이터 세트의 제공 및 이의 변환을 반복하는 것을 데이터 변환 반복법(Iteration Method for Data Conversion; IMDC)이라 칭한다.
데이터 세트 평활을 위하여 (b)-(c) 단계를 반복하는 횟수는 특별히 제한되지 아니하며, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10회 일 수 있다. 일 구현예로, 상기 반복 횟수는 1 내지 10회, 2 내지 5회, 2 내지 4회, 2 내지 3회일 수 있다. 상기 반복의 횟수가 증가할수록 데이터 세트의 평활 정도가 증가하게 된다. 그러나, 과도하게 반복되는 경우, 타겟 분석물질의 존재를 나타내는 신호 패턴과 타겟 분석물질의 부존재를 나타내는 신호 패턴을 구분하기 어려워질 수 있다.
V. 기록매체, 장치 및 프로그램
본 발명의 다른 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함하며; 및
(d) 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 단계.
본 발명의 다른 일 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함하며; 및
(d) 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
프로그램 지시들은 프로세서에 의해 실행될 때, 프로세서가 전술한 본 발명의 방법을 실행하도록 한다. 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: 타겟 분석물질에 대한 데이터 세트를 수신하도록 하는 지시; 데이터 세트의 신호값을 이용하여 각 사이클에서 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하도록 하는 지시; 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하도록 하는 지시; 및 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존부를 결정하도록 하는 지시.
본 발명의 다른 일 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하는 단계;
(d) 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하는 단계; 및
(e) 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
본 발명의 다른 일 양태에 따르면, 본 발명은 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
(c) 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하는 단계;
(d) 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하는 단계; 및
(e) 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
프로그램 지시들은 프로세서에 의해 실행될 때, 프로세서가 전술한 본 발명의 방법을 실행하도록 한다. 샘플 내 타겟 분석물질을 검출하기 위한 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: 타겟 분석물질에 대한 데이터 세트를 수신하도록 하는 지시; 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하도록 하는 지시; 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하도록 하는 지시; 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하도록 하는 지시; 및 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존부를 결정하도록 하는 지시.
본 발명의 다른 일 양태에 따르면, 본 발명은 데이터 세트 재구성 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
본 발명의 다른 일 양태에 따르면, 본 발명은 데이터 세트 재구성 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
프로그램 지시들은 프로세서에 의해 실행될 때, 프로세서가 전술한 본 발명의 방법을 실행하도록 한다. 데이터 세트 재구성 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: 데이터 세트의 신호값을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하도록 하는 지시; 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하도록 하는 지시.
본 발명의 다른 일 양태에 따르면, 본 발명은 데이터 세트 평활 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
본 발명의 다른 일 양태에 따르면, 본 발명은 데이터 세트 평활 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며;
(b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
(c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
프로그램 지시들은 프로세서에 의해 실행될 때, 프로세서가 전술한 본 발명의 방법을 실행하도록 한다. 데이터 세트 평활 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: 타겟 분석물질에 대한 데이터 세트를 수신하도록 하는 지시; 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하도록 하는 지시; 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하도록 하는 지시.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand-alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수집 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
데이터 세트는 다양한 방식으로 수집될 수 있다. 예를 들어, 데이터 세트는 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 데이터 세트는 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게는, 데이터 세트는, 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 되어 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터 세트와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 샘플 내 타겟 분석물질을 검출하기 위한 장치를 제공한다.
본 발명의 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 데이터 세트를 재구성하기 위한 장치를 제공한다.
본 발명의 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 데이터 세트를 평활(smoothing) 하기 위한 장치를 제공한다.
본 발명의 일 구현예에 따르면, 본 발명의 장치는 샘플 및 신호-발생 수단을 수용할 수 있는 반응용기, 상기 반응용기의 온도를 조절하는 온도조절 수단 및/또는 증폭 사이클에서의 신호를 검출하는 검출기를 추가적으로 포함할 수 있다.
본 발명의 일 구현예에 따르면, 컴퓨터 시스템은 사이클의 신호값을 수신할 뿐만 아니라 데이터 세트를 프로세싱하고, 재구성된 데이터 세트를 제공하고, 샘플 내 타겟 분석물질의 존부를 결정한다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다.
본 발명의 일 구현예에 따르면, 프로세서는 타겟 분석물질(예컨대, 표적 핵산분자)의 검출에 이용되는 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨 하여 구현시킬 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다.
(A) 타겟 분석물질 검출을 위한 데이터 세트를 신호 변화량 데이터 세트로 변환 후 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성한다. 이로서 베이스라인 구역의 설정 등 기존의 복잡한 단계 없이 데이터 세트의 베이스라이닝이나 평활(smoothing)과 같은 타겟 분석물질의 검출에 필요한 데이터 세트의 보정의 효과를 얻을 수 있다.
(B) 기존의 타겟 분석물질의 검출 방법에서, 신호 변화량 데이터 세트는 오리지널 데이터 세트의 직접적인 수정에 필요한 정보를 제공하는데 한정되어 사용되었으며, 데이터 세트에 대한 수정은 상기 수득한 정보에 기초하여 상기 오리지널 데이터 세트에 직접 수행되었다.
본 발명에 의하면, 신호 변화량 데이터 세트의 분석에 의하여 인식된 필요한 수정은 신호 변화량 데이터 세트에 직접 적용되고, 상기 신호 데이터 세트의 변환을 통하여 상기 필요한 수정은 타겟 검출에 사용되는 데이터 세트에 적용된다.
이러한 방법으로, 데이터 세트의 신호값에 대한 직접적인 보정 없이 오류 수정 및 베이스라이닝과 같은 타겟 분석물질 검출을 위한 데이터 세트 가공이 가능하다. 신호 변화량 데이터 세트 및 재구성된 데이터 세트의 제공 단계를 포함하는 본 발명의 타겟 분석물질 검출 방법은 데이터 세트에 포함된 오류 신호를 효과적으로 검출하고, 제거할 수 있다.
(c) jump error와 같은 오류는 특정 지점에서의 오류가 이후 사이클에도 오류를 발생시킨다. 신호 변화량 데이터 세트를 통하여 비정상 신호를 수정하는 본 발명의 방법에 따르면, 모든 사이클의 모든 신호값을 보정하지 않고, 오류가 발생한 사이클의 신호 변화값을 수정하는 것으로 jump error와 같은 오류를 수정할 수 있다.
(d) 신호 변화량 데이터 세트의 변환을 포함하는 본 발명의 타겟 분석물질 검출 방법은 신호 변화량 데이터 세트를 이용하여 재구성된 데이터 세트 또는 신호 변화량 데이터 세트의 변화 수준을 나타내는 데이터 세트와 같은 다양한 데이터를 이용하여 타겟 분석물질을 분석하는 방법을 제공한다.
(e) 본 발명의 평활(smoothing) 방법은 데이터 세트의 수정과 베이스라이닝을 동시에 할 수 있다. 또한 데이터 변환 횟수의 조절을 통하여 평활 정도를 조절할 수 있다.
도 1은 신호 변화량 데이터 세트 제공 단계 및 재구성된 데이터 세트 제공 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법의 일 구현예를 도시한 흐름도이다.
도 2는 (i) 데이터 세트의 표준화, (ii) 신호 변화량 데이터 세트의 베이스라이닝 및 (iii) 신호 변화량 데이터 세트의 비정상 신호의 보정 단계들을 포함하는 샘플 내 타겟 분석물질 검출 방법의 일 구현예를 도시한 흐름도이다.
도 3은 본 발명 방법의 일 구현예에 사용된 3개의 원시 데이터 세트의 플롯(plot)들을 나타낸다.
도 4는 본 발명의 일 구현예에 따른 프로세스의 각 단계에서 수득한 데이터 세트 1의 플롯(plot)들을 나타낸다.
도 5A는 추가적인 베이스라이닝 단계를 적용하거나 적용하지 않고 본 발명의 일 구현예에 따른 프로세스의 각 단계에서 수득한 데이터 세트 2의 플롯(plot)들을 나타낸다.
도 5B는 베이스라이닝 단계를 적용하고 본 발명의 일 구현예에 따른 프로세스의 각 단계에서 수득한 데이터 세트 3의 플롯(plot)들을 나타낸다.
도 6A는 데이터 세트들이 서로 상이한 누적-시작 사이클을 사용하여 수득된 경우, 각 재구성된 데이터 세트는 동일한 사이클에서 상이한 신호값을 가지지만, 상기 "누적-시작 사이클"의 차이에 무관하게 각 차감된 데이터 세트는 동일한 사이클에서 동일한 신호값을 가진다는 것을 보여준다.
도 6B는 데이터 세트들이 서로 상이한 누적-시작 신호값을 사용하여 수득된 경우, 각 재구성된 데이터 세트는 동일한 사이클에서 상이한 신호값을 가지지만, 상기 "누적-시작 신호값"의 차이에 무관하게 각 차감된 데이터 세트는 동일한 사이클에서 동일한 신호값을 가진다는 것을 보여준다.
도 7은 신호 변화량 데이터 세트는 원시 데이터 세트로부터 신호 변화량을 계산하는 다양한 방법에 의해 수득할 수 있다는 것을 보여준다.
도 8은 신호 변화량 데이터 세트 제공 단계, 상기 신호 변화량 데이터 세트의 비정상 신호 보정 단계 및 재구성된 데이터 세트 제공 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법의 일 구현예를 도시한 흐름도를 나타낸 것이다.
도 9는 비정상 신호의 보정 단계를 포함하는 본 발명 방법의 일 구현예에 사용된 3개의 원시 데이터 세트의 플롯(plot)들을 나타낸다.
도 10은 신호 변화량 데이터 세트를 이용한 비정상 신호의 검출 및 제거 프로세스를 나타낸 것이다.
도 11A는 비정상 신호 제거를 위한 보정을 적용한 경우와 적용하지 않은 경우의 3개의 재구성된 데이터 세트들의 플롯(plot)들을 비교한 결과를 나타낸다.
도 11B는 본 발명의 노이즈 보정 단계를 적용한 경우와 적용하지 않은 경우의 재구성된 데이터 세트들의 플롯(plot)들을 비교한 결과를 나타낸다.
도 12는 신호 변화량 데이터 세트의 보정 및 상기 보정된 신호 변화량 데이터 세트의 변환 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법의 일 구현예를 도시한 흐름도를 나타낸 것이다.
도 13은 신호 변화량 데이터 세트의 보정 및 상기 보정된 신호 변화량 데이터 세트의 변환 단계를 포함하는 본 발명 방법의 일 구현예에 사용된 3개의 원시 데이터 세트의 플롯(plot)들을 나타낸다.
도 14는 본 발명의 노이즈 보정 단계를 적용한 경우와 적용하지 않은 경우의 신호 변화량 데이터 세트의 변환에 의해 수득한 2차 신호 변화량 데이터 세트의 플롯(plot)들을 비교한 결과를 나타낸다.
도 15는 데이터 세트 평활(smoothing) 방법의 일 구현예를 도시한 흐름도를 나타낸 것이다.
도 16A는 각 반복 단계의 재구성된 데이터 세트 1의 플롯(plot)들을 나타낸다.
도 16B는 각 반복 단계의 재구성된 데이터 세트 1의 플롯(plot)들의 배경지역을 나타낸다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 신호 변화량의 누적값을 이용한 타겟 분석물질의 검출
본 실시예에서는 타겟 핵산에 대한 실시간 PCR로부터 수득한 데이터 세트의 신호 변화량의 누적값을 수득하여 데이터 세트를 재구성하는 단계를 포함하는 본 발명의 방법을 통하여 타겟 분석물질이 효과적으로 검출 되는지 시험하였다.
타겟 분석물질(예를 들어 타겟 핵산 분자)의 검출을 수행하기 위하여, (i) 타겟 분석물질에 대한 데이터 세트 제공, (ii) 신호 변화량 수득을 통한 신호 변화량 데이터 세트 제공, (iii) 신호 변화량의 누적값을 수득하여 재구성된 데이터 세트 제공, 및 (iv) 상기 재구성된 데이터 세트를 이용한 타겟 분석물질 검출의 단계를 포함하는 과정이 사용되었다.
본 발명의 유효성을 평가하기 위하여, 타겟 핵산 분자에 대한 실시간 PCR을 통하여 수득한 데이터 세트를 가공하여 재구성된 데이터 세트를 수득하고, 상기 수득한 재구성된 데이터 세트에 미리 결정된 타겟 검출용 임계값을 적용하여 타겟 핵산 분자의 존부를 결정하였다.
<1-1> 데이터 세트의 수득
타겟 핵산 분자에 대한 실시간 PCR은 Bio-Rad 사의 CFX96™ Real-Time PCR Detection System을 이용하고, 프로브를 신호-발생 수단으로 사용하여 증폭 사이클 50회로 수행되었다.
실시간 PCR로부터 수득한 데이터 세트 중, 본 방법을 적용할 3개의 데이터 세트를 선택하였다. 도 3은 데이터 세트 1, 2, 및 3으로 명명된 상기 선택된 3개의 데이터 세트를 플롯팅한 증폭곡선이다.
<1-2> 변화값 데이터 세트 수득
상기 수득한 원시 데이터 세트로부터 신호 변화량 데이터 세트를 수득하였다. 신호 변화량은 다음의 수학식 3에 따른 차분법(difference method)에 따라 산출되었다.
수학식 3
Figure 112019000448381-pct00005
Figure 112019000448381-pct00006
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00007
: i 번째 사이클의 신호값
Figure 112019000448381-pct00008
: i 번째 사이클에서의 신호 변화량
<1-3> 신호 변화량 데이터 세트의 베이스라이닝 (선택적 과정)
<1-3>은 도 3의 데이터 세트 2 또는 데이터 세트 3과 같이 데이터 세트의 베이스라인이 기울어져 있는 경우, 이러한 오류를 신호 변화량 데이터 세트의 보정을 통하여 해결하는 단계이다. 반대로, 데이터 세트 1과 같이 베이스라인이 기울어져 있지 아니한 경우 <1-3>을 수행할 필요가 없다.
신호 변화량 데이터 세트의 베이스라인이 0의 값을 가지도록 신호 변화량 데이터 세트의 각 사이클의 신호 변화량에서 일정값을 차감하였다. 구체적으로 신호 변화량 데이터 세트에서 신호가 실질적으로 검출되지 않는 반응 초기 특정 사이클 번호 또는 특정 사이클 구간을 미리 지정한 뒤, 상기 지정한 사이클 번호 또는 구간의 평균 변화량을 산출하고 상기 산출된 평균 변화량을 각 사이클의 신호 변화량에서 차감하였다.
본 실시예에서 신호 변화량 데이터 세트의 베이스라이닝을 위한 평균 신호 변화량은 시작 사이클(S)을 3, 끝 사이클(E)을 10으로 베이스라인 구간을 지정하여 <수학식 4>에 따라 계산하였고, <수학식5>에 따라 상기 구간의 평균 변화량이 0이 되도록 신호 변화량 데이터 세트의 전체 사이클의 신호 변화량을 수정하였다. 그리고 결과 확인을 위하여 베이스라이닝된 신호 변화량 데이터 세트를 플롯팅(X축: 사이클 번호, Y축:ΔRFU)하여 베이스라이닝된 신호 변화값 곡선을 수득하였다.
수학식 4
Figure 112019000448381-pct00009
Figure 112019000448381-pct00010
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00011
: i 번째 사이클에서의 신호 변화량
Figure 112019000448381-pct00012
: 베이스라인 구간의 평균 신호 변화량
S : 신호 변화량 데이터 세트의 베이스라인 구간의 시작 사이클 번호
E : 신호 변화량 데이터 세트의 베이스라인 구간의 마지막 사이클 번호
n : E - S + 1
수학식 5
Figure 112019000448381-pct00013
Figure 112019000448381-pct00014
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00015
: i 번째 사이클에서의 신호 변화량
Figure 112019000448381-pct00016
: 베이스라인 구간의 평균 신호 변화량
Figure 112019000448381-pct00017
: 베이스라이닝 된 신호 변화량 데이터 세트의 i 번째 사이클에서의 신호 변화량.
<1-4> 신호 변화량의 누적값을 수득을 통한 재구성된 데이터 세트의 수득
누적합을 수득하여 재구성된 데이터 세트를 수득하였다. 각 사이클에서의 누적합은 신호 변화량 데이터 세트의 첫번째 사이클에서부터 해당 사이클까지의 신호 변화량을 누적하여 수득하였다. 본 실시예에서는 상기 누적합은 다음의 수학식 6에 따라 산출되었다. 상기 재구성된 데이터 세트를 플롯팅하여 재구성된 증폭곡선을 수득하였다(X축: 사이클 번호, Y축: RFU).
수학식 6
Figure 112019000448381-pct00018
Figure 112019000448381-pct00019
: 재구성된 데이터 세트의 누적-시작 사이클의 신호 세기
Figure 112019000448381-pct00020
: 데이터 세트의 누적-시작 사이클 번호
Figure 112019000448381-pct00021
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00022
: 누적값이 계산되는 사이클 번호
Figure 112019000448381-pct00023
: 신호 변화량 데이터 세트의 i 번째 사이클에서의 신호 변화량
Figure 112019000448381-pct00024
: 재구성된 데이터 세트의 i 번째 사이클에서의 신호 세기
신호 변화량 데이터 세트를 베이스라이닝 하였을 때, 수학식 5의
Figure 112019000448381-pct00025
는 수학식 6의
Figure 112019000448381-pct00026
가 된다.
본 실시예에서는 CSC는 1로 지정하였으며, CSV는 0으로 지정하였다.
상기 과정을 통하여 수득한 재구성된 데이터 세트를 플롯팅하여 수득한 곡선을 상호 비교하였다.
도 4의 데이터 세트 1에서 보는 바와 같이, 타겟 분석물질에 대한 데이터 세트를 단계 <1-1>, <1-2> 및 <1-4>에 따라 가공한 결과, 데이터 세트의 베이스라인 영역의 신호값이 0으로 수렴하도록 데이터 세트가 재구성되는 것을 확인하였다. 이러한 결과는 본 발명의 방법에 의하여 베이스라인 영역의 설정의 단계 없이 베이스라인 영역의 신호값들을 0 또는 원하는 값으로 수렴하도록 할 수 있는 것을 확인하였다.
도 5A의 데이터 세트 2에서 보는 바와 같이, 타겟 분석물질에 대한 데이터 세트를 베이스라이닝 단계 없이 단계 <1-1>, <1-2> 및 <1-4>에 따라 가공한 결과, 첫번째 신호값은 0으로 수렴하지만, 기울어진 베이스라인의 문제는 수정되지 않는 것을 확인하였다. 이러한 경우, 단계 <1-3>을 단계 <1-2>와 <1-4> 사이에 추가하면, 기울어진 베이스라인을 수정할 수 있는 것을 확인하였다. 더구나, 도 5B에서 보는 바와 같이, 데이터 세트 3의 기울어진 베이스라인도 단계 <1-3>의 추가 적용으로 수정되는 것을 확인할 수 있다.
이와 같이, 베이스라이닝 단계인 추가적인 단계 <1-3>를 수행하여 데이터 세트의 기울어진 베이스라인을 수정할 수 있는 것을 확인하였다.
<1-5> 타겟 분석물질의 검출
상기 수득한 재구성된 데이터 세트를 이용하여 타겟 분석물질을 검출하였다. 미리 정해진 임계값 이상의 형광값을 보이는 샘플에 대하여 양성으로 판정하였으며, 임계값 미만의 형광값을 보이는 샘플을 음성으로 판정하였다. 상기 미리 정해진 임계값은 RFU 1000으로 지정하였다. 도4, 5A 및 5B의 CUSUM 결과에서 보는 바와 같이, 본 발명에 의하여, 검출 오류 없이 타겟 분석물질이 성공적으로 검출 되는 것을 확인하였다.
실시예 2: 신호 변화량의 누적값 수득을 위한 다양한 계산법 비교
본 실시예에서는 신호 변화량의 누적값을 산출하는 다양한 방법을 이용하여 재구성된 데이터 세트를 수득하고 이를 상호 비교하였다.
재구성된 데이터 세트는 (i) 타겟 분석물질에 대한 데이터 세트 수득; (ii) 신호 변화량 수득을 통한 신호 변화량 데이터 세트 수득; (iii) 신호 변화량의 누적값 수득을 통한 재구성된 데이터 세트 제공의 단계를 포함하는 방법에 따라 제공되었다.
<2-1> 데이터 세트의 수득
실시예 1에 기재한 바와 같이, 각 사이클에 대한 형광값 (RFU)을 포함하는 데이터 세트 1을 실시간 PCR로부터 수득하였다.
<2-2> 신호 변화량 데이터 세트의 수득
상기 수득한 원시 데이터 세트로부터 신호 변화량 데이터 세트를 수득하였다.
신호 변화량은 상기 수학식 3에 따른 차분법, 아래 수학식 7에 따른 최소자승법(Least Square Method), 아래 수학식 8에 따른 비율법(Ratio Method) 또는 아래 미분방정식에 의한 미분법(Differentiation)을 이용하여 산출하였다.
수학식 7
Figure 112019000448381-pct00027
Figure 112019000448381-pct00028
Figure 112019000448381-pct00029
: 데이터 세트의 신호 변화량이 계산되는 사이클 번호
Figure 112019000448381-pct00030
: i 번째 사이클 번호
Figure 112019000448381-pct00031
: i 번째 사이클에서 측정되는 신호 세기
Figure 112019000448381-pct00032
: i 번째 사이클에서의 신호 변화량
"a" and "b" : 0 내지 10의 정수
n : a + b + 1, 신호 변화량 산출에 사용되는 데이터의 수
Figure 112019000448381-pct00033
: "I-a" 에서 "I+b"까지의 사이클 번호의 평균
Figure 112019000448381-pct00034
: "I-a"에서 "I+b" 까지의 사이클에서 측정되는 신호 세기의 평균
본 실시예에서는 "a"와 "b"에 1이 사용되었다. "I-a"가 1 보다 작은 경우, 상기 a는 "I-a"가 1이 되도록 조정될 수 있다. "I+b"가 전체 데이터 지점의 수보다 큰 경우, 상기 b는 "I+b"가 전체 데이터 지점의 수와 동일하게 되도록 조정될 수 있다.
수학식 8
Figure 112019000448381-pct00035
Figure 112019000448381-pct00036
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00037
: i 번째 사이클에서 측정되는 신호 세기
Figure 112019000448381-pct00038
: i 번째 사이클에서의 신호 변화량
미분 방정식
Figure 112019000448381-pct00039
-
Figure 112019000448381-pct00040
Figure 112019000448381-pct00041
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00042
: i 번째 사이클 번호
Figure 112019000448381-pct00043
: i 번째 사이클에서의 신호 변화량
상기 미분 방정식은 원시 데이터 세트로부터 계산된 6차 다항식을 미분하여 수득한 것이다.
<2-3> 신호 변화량의 누적값 수득에 의한 재구성된 데이터 세트 수득
재구성된 데이터 세트는 신호 변화량의 누적합, 누적곱 또는 적분과 같은 신호 변화량의 누적값을 수득하여 제공된다. 구체적으로, 누적값은 상기 수학식 6에 따른 누적합, 아래 수학식 9에 따른 누적곱 및 아래의 적분 방정식에 따른 적분을 통하여 산출하였다.
수학식 9
Figure 112019000448381-pct00044
Figure 112019000448381-pct00045
: 재구성된 데이터 세트의 누적-시작 사이클의 신호 세기
Figure 112019000448381-pct00046
: 데이터 세트의 누적-시작 사이클 번호
Figure 112019000448381-pct00047
: 누적값이 계산되는 사이클 번호
Figure 112019000448381-pct00048
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00049
: 신호 변화량 데이터 세트의 i 번째 사이클에서의 신호 변화량
Figure 112019000448381-pct00050
: 재구성된 데이터 세트의 i 번째 사이클에서의 신호 세기
적분방정식
Figure 112019000448381-pct00051
-
Figure 112019000448381-pct00052
Figure 112019000448381-pct00053
Figure 112019000448381-pct00054
: 데이터 세트의 사이클 번호
Figure 112019000448381-pct00055
: i 번째 사이클 번호
Figure 112019000448381-pct00056
: 재구성된 데이터 세트의 i 번째 사이클의 신호 세기
상기 적분 방정식은 신호 변화량 데이터 세트로부터 계산된 6차 다항식을 적분하여 수득한 것이다.
상기 단계를 통하여 수득한 재구성된 데이터 세트를 플롯팅하여 얻은 커브들을 상호 비교하였다.
<2-4> 다양한 누적-시작 사이클 및 누적-시작 값을 이용하여 수득한 재구성된 데이터 세트의 비교
신호 변화량 데이터 세트로부터 다양한 누적-시작 사이클(CSC) 및 누적-시작 값(CSV)을 이용하여 재구성된 데이터 세트들을 수득하였으며, 이들을 상호 비교하였다.
신호 변화량 데이터 세트는 상기 수학식 3에 따른 차분법을 이용하여 수득하였으며, 상기 수학식 6에 따른 누적합을 이용하여 재구성된 데이터 세트를 수득하였다. CSC는 1, 34 및 50으로 각각 지정하였으며, CSV는 -2000, 0, 2000으로 각각 지정하였다.
각 데이터 세트의 차감된 데이터 세트는 사이클 번호 1의 신호값이 0으로 수렴하도록 재구성된 데이터 세트의 각 사이클의 신호값으로부터 특정값을 차감하여 수득하였다.
도 6A에서 보는 바와 같이, 각 재구성된 데이터 세트는 서로 다른 누적-시작 사이클(CSC)을 이용하여 재구성된 데이터 세트를 수득하는 경우 이들은 동일 사이클에서 서로 다른 신호값을 가지지만, 재구성된 데이터 세트들은 동일한 누적-시작 값을 사용하였으므로, 누적-시작 사이클에서의 신호값은 동일하다. 그렇지만, 각 차감된 데이터 세트는 누적-시작 사이클의 차이에 무관하게 동일 사이클에서 동일한 신호값을 가진다.
도 6B에서 보는 바와 같이, 각 재구성된 데이터 세트는 서로 다른 누적-시작 값을 이용하여 재구성된 데이터 세트를 수득하는 경우 동일 사이클에서 서로 다른 신호값을 가지지만, 이들은 누적-시작 값이라는 동일 종류의 신호값이다. 그렇지만, 각 차감된 데이터 세트는 누적-시작 값의 차이에 무관하게 동일 사이클에서 동일한 신호값을 가진다.
결론적으로 상이한 누적-시작 사이클 또는 누적-시작 값을 사용하여 산출된 재구성된 데이터 세트의 누적값의 신호 세기(다시 말해, Y축의 값)가 서로 상이하여도, 각 재구성된 데이터 세트는 동일한 신호 패턴을 가지게 된다.
<2-5> 다양한 신호 변화량 및 누적값의 산출 방법의 비교
신호 변화량 및 누적값을 계산하는 다양한 방법을 이용하여 재구성된 데이터 세트를 수득하였으며, 상기 수득한 재구성된 데이터 세트를 비교하였다.
신호 변화량은 상기 수학식 7에 따른 최소자승법(Least Square Method), 상기 수학식 8에 따른 비율법(Ratio Method) 또는 상기 미분방정식에 의한 미분법(Differentiation)을 이용하여 산출하였다.
누적값은 상기 수학식 6에 따른 누적합, 상기 수학식 9에 따른 누적곱 및 상기 적분 방정식에 따른 적분법을 통하여 산출하였다.
재구성된 데이터 세트가 누적합을 이용하여 수득된 경우, CSC에는 1의 값을 지정하였으며, CSV에는 0을 지정하였다. 또한 재구성된 데이터 세트가 누적곱을 이용하여 수득된 경우, CSC에는 1의 값을 지정하였으며, CSV에는 1.00의 값을 지정하였다.
도 7에서 보는 바와 같이, 신호 변화량 데이터 세트는 원시 데이터 세트로부터 신호 변화량을 산출하는 다양한 방법에 의하여 수득될 수 있다. 또한 재구성된 데이터 세트는 신호 변화량 데이터 세트로부터 누적값을 계산하는 다양한 방법에 의하여 수득될 수 있다.
결론적으로, 신호 변화량 및 누적값 산출에 다양한 알려진 계산 방법이 사용될 수 있음을 확인하였다.
실시예 3: 신호 변화량 보정에 의한 검출 오류 수정
실시예 3에서는 데이터 세트의 비정상 신호에 의해 발생하는 타겟 분석물질의 존부 결정 상의 오류를 신호 변화량의 보정을 이용한 본 발명의 방법에 의하여 제거할 수 있는지 실험하였다.
본 실시예에서는 신호 변화량 보정 및 데이터 세트의 재구성을 다음의 단계를 포함하는 프로세스에 따라 수행하였다.
(i) 타겟 분석물질에 대한 데이터 세트 제공; (ii) 신호 변화량 수득에 의한 신호 변화량 데이터 세트 제공; (iii) 수득한 신호 변화량 데이터 세트의 비정상 신호 수정; (iv) 신호 변화량의 누적값 수득을 통한 재구성된 데이터 세트 제공; 및 (v) 재구성된 데이터 세트를 이용한 타겟 분석물질 검출.
<3-1> 비정상 신호를 포함하는 데이터 세트 수득
타겟 핵산 분자에 대한 실시간 PCR은 Bio-Rad 사의 CFX96™ Real-Time PCR Detection System을 이용하고, 프로브를 신호-발생 수단으로 사용하여 증폭 사이클 50회로 수행되었다. 실시간 PCR에 의하여 수득한 데이터 세트 중, 본 방법을 적용하기 위하여 Jump 에러가 존재하는 3개의 데이터 세트를 선택하였다. 도 9는 상기 선택된 3개의 데이터 세트를 플롯팅한 결과이다.
<3-2> 신호 변화량 데이터 세트 수득
상기 수득한 원시 데이터 세트로부터 신호 변화량 데이터 세트를 수득하였다. 신호 변화량은 상기 수학식 7 및 실시예 <2-2>에 따라 최소자승법 (Least Square Method)을 사용하여 계산하였다.
<3-3> 신호 변화량 데이터 세트의 비정상 신호 수정
신호 변화량 데이터 세트의 비정상 신호의 수정은 (a) 비정상 신호의 검출 및 (b) 비정상 신호의 보정의 단계에 따라 이루어진다.
a. 비정상 신호 검출
신호 변화량 피크의 존재 유무를 판단하기 위한 "신호 변화량 임계값"(threshold for signal change amount)으로, 본 실시예에서는 변화값 200을 사용하였다. 신호 변화량 데이터 세트에서 신호 변화량이 200이상인 사이클이 있는 경우, 신호 변화량 피크가 존재하는 것으로 판단하였다. 신호 변화량 피크의 존재를 결정한 후, 상기 피크가 정상 피크인지 비정상 피크인지를 구분하기 위하여 "반피크 폭" (Half Peak Width) 방법을 사용하였다. 반피크 폭 계산은 다음의 수학식 10에 따라 진행하였다.
수학식 10
Half Peak Width (=Δcycle) = Max cycle - Start cycle
Max cycle: 피크 중 최고 신호 변화량을 나타내는 데이터 지점의 사이클 번호.
Start cycle: 피크 내에서 Max cycle 이전에 신호 변화량 임계값(threshold for signal change amount)이상의 신호 변화량을 나타내는 최초 데이터 지점의 사이클 번호.
반피크 폭을 계산 한 후, 미리 설정된 피크 임계값(threshold for peak)을 사용하여 정상 피크와 비정상 피크를 구분하였다. 본 실시예에서는 상기 피크 임계값으로 2를 지정하였다. 상기 산출된 반피크 폭이 피크 임계값 이하인 경우, 상기 피크는 비정상 피크로 결정되며, 반피크 폭이 피크 임계값을 초과하는 경우 상기 피크는 정상적인 피크로 결정되었다.
b. 비정상 신호 수정
비정상 피크를 식별한 후, 비정상 신호를 나타내는 피크를 수정하였다. 도 10의 두번째 커브에서 보는 바와 같이, 신호 변화량 임계값 이상의 신호 변화량을 나타내는 부분을 0으로 수정하였으며, 이로서 보정된 신호 변화량 데이터 세트를 수득하였다.
c. 노이즈 수정 (선택적 단계)
본 과정은 비정상 피크를 수정한 후 배경 신호의 노이즈를 수정하기 위하여 선택적으로 사용되는 과정이다. 도 8의 3번째 커브에서 보는 바와 같이, 비정상 피크를 제거한 후 정상 피크가 존재하는 경우, 0 사이클부터 상기 정상 피크의 시작 사이클 직전의 사이클까지의 신호 변화량을 0으로 만들었다. 또한 정상 피크가 없는 경우에는 모든 사이클의 모든 신호 피크를 노이즈로 인식하고, 신호 변화량을 0으로 수정하였다. 정상 피크의 시작 사이클 직전의 사이클의 번호는 커브와 신호 변화량 임계값이 교차하는 지점을 나타내는 사이클 번호에서 미리 정해진 사이클 수("Gap")를 차감하는 방법으로 결정하였다.
<3-4> 신호 변화량 누적을 통한 재구성된 데이터 세트 수득 및 타겟 분석물질 검출
보정된 신호 변화량 데이터 세트로부터 신호 변화량을 누적하여 재구성된 데이터 세트를 수득하고, 상기 재구성된 데이터 세트를 이용하여 타겟 핵산을 검출하였다. 재구성된 데이터 세트의 수득 및 타겟 핵산의 검출은 실시예 1에 기재된 바와 동일한 방법으로 수행하였다. 본 실시예에서는 타겟 검출용 임계값으로 RFU 500을 지정하였다.
신호 변화량 데이터 세트의 신호 변화량의 보정(다시 말해, 비정상 신호의 수정) 및 누적을 통하여 수득한 재구성된 데이터 세트는 도 11A에 플롯팅 되어 있다. 비교를 위하여 보정없이 신호 변화량 데이터 세트의 신호 변화량의 누적을 통하여 수득한 재구성된 데이터 세트를 도 11A에 점선으로 나타내었다.
도 11A에 보는 바와 같이, 비정상 신호(예를 들어, jump error)가 신호 변화량의 보정에 의하여 수정되는 것을 확인하였다. 또한 정상 신호와 비정상 신호가 동시에 존재하는 경우에도 정상 신호에 영향을 미치지 않고 비정상 신호만 보정되는 것을 확인하였다. 데이터 세트 1 및 3을 통하여 타겟 핵산 분자가 오류 없이 검출 되는 것을 확인하였으며, 타겟 핵산 분자를 포함하지 않은 데이터 세트 2에서는 오류 없이 타겟 핵산 분자가 미검출 되는 것을 확인하였다.
노이즈 수정 프로세스의 효과를 확인하기 위하여, 노이즈 수정이 가해진 보정된 신호 변화량 데이터 세트와 노이즈 수정이 가해지지 않은 신호 변화량 데이터 세트를 각각 플롯팅하였다. 보정된 신호 변화량 데이터 세트 1과 보정되지 않은 신호 변화량 데이터 세트 1의 노이즈 신호를 포함하는 사이클의 일부 영역을 도시한 도 11B에서 보는 바와 같이, 보정된 데이터 세트 1에서는 노이즈 신호가 제거되었으며, 신호 수준은 변동 없이 일정한 것을 확인하였다.
이와 같이, 본 발명의 방법은 증폭 곡선의 비정상 신호를 수정할 수 있으며, 이로서 효과적으로 비정상 신호에 의한 타겟 핵산 존부에 대한 결정 오류를 감소시킬 수 있음을 확인하였다. 더구나, 본 발명의 방법은 타겟 분석물질을 보다 정확하게 정량할 수 있는 가공된 데이터 세트를 제공한다.
실시예 4: 변환된 데이터 세트를 이용한 타겟 분석물질의 검출
실시예 4에서는 타겟 분석물질에 대한 신호 변화량 데이터 세트의 보정 및 보정된 신호 변화량 데이터 세트의 변환을 통하여 타겟 분석물질 검출이 가능한지 실험하였다.
본 실시예에서는 타겟 분석물질 검출 방법을 다음의 단계를 포함하는 프로세스에 따라 수행하였다.
(i) 타겟 분석물질에 대한 데이터 세트 제공; (ii) 신호 변화량 수득에 의한 신호 변화량 데이터 세트 제공 및 수득한 신호 변화량 데이터 세트의 보정; (iii) 보정된 신호 변화량 데이터 세트의 변환; (iv) 변환된 데이터 세트를 이용한 타겟 분석물질 검출.
<4-1> 데이터 세트 수득
타겟 핵산 분자에 대한 실시간 PCR은 Bio-Rad 사의 CFX96™ Real-Time PCR Detection System을 이용하고, 프로브를 신호-발생 수단으로 사용하여 증폭 사이클 50회로 수행되었다. 실시간 PCR에 의하여 수득한 데이터 세트 중, 본 방법을 적용하기 위하여 3개의 데이터 세트를 선택하였다. 도 13은 상기 선택된 3개의 데이터 세트를 플롯팅한 결과이다.
<4-2> 신호 변화량 데이터 세트의 수득 및 보정
상기 3개의 원시 데이터 세트로부터 1차 변화량 계산을 통하여 신호 변화량 데이터 세트를 수득하고, 신호 변화량 데이터 세트의 1차 신호 변화량을 보정하여 비정상 신호를 제거하였다.
신호 변화량 데이터 세트의 수득 및 보정은 실시예 <3-2> 및 <3-3>에서와 동일한 방법으로 수행하였다. 비정상 신호의 수정은 실시예 <3-3>에 기재된 바와 동일한 방법으로 수행하였다. 구체적으로, 비정상 신호를 검출 한 후, 피크 내에서 신호 변화량 임계값인 200 이상의 신호 변화량을 포함하는 사이클들의 신호 변화량을 0으로 수정하였다.
<4-3> 보정된 신호 변화량 데이터 세트의 변환
상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 수득하고 이를 이용하여 타겟 분석물질을 검출하였다. 본 실시예에서는 상기 변환은 신호 변화량 데이터 세트로부터 2차 신호 변화량 데이터 세트를 수득하는 방법으로 수행하였다.
구체적으로, 2차 신호 변화량은 다음의 수학식 11에 따라 산출되었다. 타겟 분석물질 검출을 위하여 상기 2차 신호 변화량 데이터 세트를 플롯팅하여 변환된 데이터 세트의 커브를 수득하였다.
수학식 11
Figure 112019000448381-pct00057
Figure 112019000448381-pct00058
Figure 112019000448381-pct00059
: 신호 변화량이 계산되는 사이클 번호
Figure 112019000448381-pct00060
: i 번째 사이클 번호
Figure 112019000448381-pct00061
: i 번째 사이클에서의 보정된 신호 변화량
Figure 112019000448381-pct00062
: i 번째 사이클에서의 변환된 신호 변화량
"a" and "b" : 0 내지 10의 정수
n : a + b + 1, 신호 변화량 산출에 사용되는 데이터의 수
Figure 112019000448381-pct00063
: "I-a" 에서 "I+b"까지의 사이클 번호의 평균
Figure 112019000448381-pct00064
: "I-a" 에서 "I+b"까지의 보정된 신호 변화량의 평균
본 실시예에서는 "a"와 "b"에 1이 사용되었다. "I-a"가 1 보다 작은 경우, 상기 a는 "I-a"가 1이 되도록 조정될 수 있다. "I+b"가 전체 데이터 지점의 수보다 큰 경우, 상기 b는 "I+b"가 전체 데이터 지점의 수와 동일하게 되도록 조정될 수 있다.
<4-4> 타겟 분석물질의 검출
상기 수득한 변환된 데이터 세트를 이용하여 타겟 핵산 분자 (다시 말해, 타겟 분석물질)을 검출하였다. 2차 신호 변화량이 미리 정해진 임계값 이상인 샘플을 양성으로 판정하였으며, 2차 신호 변화량이 미리 정해진 임계값 미만인 샘플에 대하여는 음성으로 판정하였다. 본 실시예에서는 상기 미리 정해진 타겟 검출용 임계값으로 2차 신호 변화값 70을 지정하였다.
변환된 데이터 세트의 커브를 도시한 도 14에서 보는 바와 같이, 타겟 분석물질을 검출한 결과는 신호 변화량에 대한 보정 적용 유무에 따라 다르게 나타났다.
구체적으로, 정상 신호만 존재하는 양성 샘플인 데이터 세트 1의 경우, 신호 변화량에 대한 보정 유무에 무관하게 타겟 핵산이 존재한다는 동일한 결과가 도출되었다.
비정상 신호를 포함하는 음성 샘플인 데이터 세트 2의 경우, 신호 변화량을 보정하지 않은 경우에는 타겟 검출용 임계값 이상의 비정상 신호로 인하여 위양성 결과가 관찰되었다. 반면, 신호 변화량을 보정한 경우에는 변환된 데이터 세트의 커브에서 비정상 신호가 제거되었으므로, 진 음성 결과가 도출되었다.
비정상 신호를 포함하는 양성 샘플인 데이터 세트 3의 경우, 신호 변화량을 보정하지 않은 경우에는 타겟 검출용 임계값 이상의 비정상 신호로 인하여 검출 오류가 발생하였다. 반면, 신호 변화량을 보정한 경우에는 변환된 데이터 세트의 커브에서 비정상 신호가 제거되었으므로, 진 양성 결과가 도출되었다.
이와 같이, 신호 변화량 데이터 세트의 보정 및 변환을 포함하는 본 발명의 방법에 의하면, 타겟 분석물질 검출 오류를 제거하고, 보다 정확하게 검출할 수 있음을 확인하였다.
실시예 5: 재구성된 데이터 세트를 이용한 데이터 세트의 평활
실시예 5에서는 재구성된 데이터 세트를 플롯팅하여 수득한 커브가 평활(smoothing) 되는지 실험하였다.
도 15에서 보는 바와 같이, 데이터 세트의 평활은 다음의 단계를 포함하는 프로세스에 따라 수행하였다.
(i) 타겟 분석물질에 대한 데이터 세트 제공; (ii) 데이터 세트의 신호값을 이용한 각 사이클에서의 신호 변화량 수득에 의한 신호 변화량 데이터 세트 제공; (iii) 신호 변화량 데이터 세트의 신호 변화량을 이용한 각 사이클에서의 누적값 수득에 의한 재구성된 데이터 세트 제공. 추가로, 상기 프로세스는 선택적으로 상기 단계 (ii) 및 (iii)을 반복하는 단계를 추가할 수 있다.
<5-1> 데이터 세트의 수득
실시예 1에서와 같이 실시간 PCR을 통하여 각 사이클 당 형광값(RFU)을 포함하는 데이터 세트를 수득하였다.
<5-2> 신호 변화량 데이터 세트의 수득
신호 변화량 수득을 통하여 상기 수득한 데이터 세트로부터 신호 변화량 데이터 세트를 수득하였다. 신호 변화량은 상기 수학식 7의 최소자승법에 의하여 계산하였다.
본 실시예에서는 "a"와 "b"에 2가 사용되었다. "I-a"가 1 보다 작은 경우, 상기 a는 "I-a"가 1이 되도록 조정될 수 있다. "I+b"가 전체 데이터 지점의 수보다 큰 경우, 상기 b는 "I+b"가 전체 데이터 지점의 수와 동일하게 되도록 조정될 수 있다.
베이스라이닝은 실시예 <1-3>에 기재된 방법과 동일한 방법으로 수행되었으며, 신호 변화량 데이터 세트의 첫번째 재구성 전에 1회 한하여 실시하였다.
<5-3> 신호 변화량의 누적값 수득을 통한 재구성된 데이터 세트 수득
신호 변화량 데이터 세트의 각 사이클에서의 누적합을 구하여 재구성된 데이터 세트를 수득하였다. 누적합은 상기 수학식 6을 이용하여 산출하였다.
본 실시예에서 CSC는 1로 지정하였으며, CSV는 0으로 지정하였다.
<5-4> 데이터 세트 재구성의 반복을 통한 평활 효과 상승
데이터 세트 재구성 프로세스의 반복으로 인하여 데이터 세트 평활 효과가 증가하는지 실험하였다. 단계 <5-3>에서 수득한 재구성된 데이터 세트를 단계 <5-2>에서의 데이터 세트로 재사용하는 방법으로 상기 단계 <5-2> 및 <5-3>을 반복하여 최종 재구성된 데이터 세트를 수득하였다. 상기 단계 <5-2> 및 <5-3>의 반복은 2회 수행되었으며, 따라서 반복 수를 달리하는 총 3개의 재구성된 데이터 세트를 수득하였다. 데이터세트 재구성을 반복할 때, 신호 발생지점이 변하는 것을 방지하기 위하여, 수학식 7에서 a는 3, b는 1을 각각 사용하였다.
데이터 세트의 평활 효과 상승을 확인하기 위하여, 모든 재구성된 데이터 세트를 플롯팅하여 비교하였다.
또한 각 재구성 반복 단계의 재구성된 데이터 세트를 이용하여 타겟 핵산 검출을 수행하였다. 미리 정해진 타겟 검출용 임계값 이상의 형광값을 나타내는 샘플은 양성으로 판정하였으며, 미리 정해진 타겟 검출용 임계값 미만의 형광값을 나타내는 샘플은 음성으로 판정하였다. 본 실시예에서는 RFU300을 상기 미리 정해진 타겟 검출용 임계값으로 지정하였다.
도 16A에서 보는 바와 같이, 데이터 세트의 평활 효과는 첫번째 재구성된 데이터 세트에서도 나타나며, 재구성 프로세스가 반복될수록 그 효과가 증가하는 것을 확인하였다. 또한 타겟 핵산 검출에 오류가 없는 것을 확인하였다.
도 16B는 재구성된 데이터 세트의 배경지역에 해당하는 0 에서 20 사이클까지의 부위의 커브를 확대한 것이다. 도 16B에서 보는 바와 같이, 배경지역(0 내지 20 사이클)에서의 데이터 세트의 평활 효과가 나타나는 것을 확인할 수 있다.
이와 같이, 본 발명의 데이터 세트 재구성 방법은 데이터 세트가 플롯팅된 커브를 평활하게 하고, 배경지역의 노이즈 신호를 제거할 수 있다. 그러므로 본 발명의 방법은 샘플 내 타겟 분석물질의 검출 및 정량을 보다 정확하고 신뢰성 있게 할 수 있다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (26)

  1. 하기 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법:
    (a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
    (c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함하며; 및
    (d) 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 단계.
  2. 제1항에 있어서, 상기 각 사이클에서의 누적값은 누적-시작 사이클(CSC)의 번호에 대한 각 사이클의 번호(Xi)에 따라 다음의 계산법들 중 하나에 의하여 계산되는 것을 특징으로 하는 방법:
    상기 누적-시작 사이클은 상기 신호 변화량 데이터 세트의 사이클들 중에서 선택된 사이클이며;
    (계산법-1) 상기 Xi이 CSC의 번호보다 큰 경우, 상기 각 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 누적-시작 사이클 바로 다음 사이클부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산되며; 상기 누적-시작 값은 상기 누적-시작 사이클에서의 누적값이며;
    (계산법-2) 상기 Xi이 CSC의 번호보다 작은 경우, 상기 각 사이클에서의 누적값은 (i) 누적-시작 값 및 (ii) 상기 각 사이클의 바로 다음 사이클부터 상기 누적-시작 사이클까지의 신호 변화량으로부터 유래된 값을 누적하여 계산되며;
    (계산법-3) 상기 Xi이 CSC의 번호와 동일한 경우, 상기 누적-시작 값이 상기 각 사이클에서의 누적값으로 지정된다.
  3. 제1항에 있어서, 상기 각 사이클에서의 누적값은 첫번째 사이클부터 상기 각 사이클까지의 신호 변화량을 누적하여 계산되는 것을 특징으로 하는 방법.
  4. 제1 항 내지 제3항 중 어느 한 항에 있어서, 상기 각 사이클에서의 신호 변화량은 각 사이클에서의 신호값들의 미분값, 각 사이클에서의 신호값들의 차분값, 각 사이클에서의 신호값들의 비율 및 각 사이클에서의 선형회귀분석을 수행하여 수득한 기울기값으로 이루어진 군에서 선택된 것을 특징으로 하는 방법.
  5. 제4항에 있어서, 상기 각 사이클에서의 누적값은 각 사이클에서의 미분값들의 누적값, 각 사이클에서의 차분값들의 누적값, 각 사이클에서의 비율들의 누적값 및 기울기값들의 누적값으로 이루어진 군에서 선택된 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 상기 방법은 상기 신호 변화량 데이터 세트의 적어도 하나의 신호 변화량을 가공하는 단계를 추가적으로 포함하는 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 단계 (a)의 데이터 세트는 원시 데이터 세트, 상기 원시 데이터 세트의 수학적으로 가공된 데이터 세트, 상기 원시 데이터 세트의 표준화된 데이터 세트 또는 상기 원시 데이터 세트의 상기 가공된 데이터 세트의 표준화된 데이터 세트인 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 표준화된 데이터 세트는 다음의 단계를 포함하는 프로세스에 의하여 제공되는 것을 특징으로 하는 방법:
    (i) 상기 원시 데이터 세트 또는 상기 원시 데이터 세트의 수학적으로 가공된 데이터 세트를 보정하기 위한 표준화 계수를 제공하는 단계; 상기 표준화 계수는 기준값, 기준 사이클 및 상기 데이터 세트를 이용하여 제공되며; 상기 기준 사이클은 상기 데이터 세트의 사이클들 중에서 선택되며; 상기 기준값은 임의로 정해진 값이며; 상기 표준화 계수는 상기 기준 사이클에 해당되는 상기 데이터 세트의 사이클에서의 신호값 및 상기 기준값 사이의 관계를 정하여 제공되며; 및
    (ii) 상기 표준화 계수를 상기 데이터 세트의 신호값들에 적용하여 보정된 신호값들을 수득하여 표준화된 데이터 세트를 제공하는 단계.
  9. 제1항에 있어서, 상기 신호 변화량 데이터 세트는 베이스라인이 차감된 신호 변화량 데이터 세트인 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 방법은, 데이터 세트의 평활을 위하여, 상기 단계 (c)에서 제공된 상기 재구성된 데이터 세트를 상기 (b) 단계의 데이터 세트로 사용하여, 상기 단계 (b)-(c)를 반복하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 상기 단계 (d)의 타겟 분석물질의 검출은 상기 샘플 내 타겟 분석물질의 정성적 또는 정량적 검출인 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 방법은 상기 단계 (a) 이전에 샘플 내 타겟 분석물질에 대한 데이터 세트를 수득하기 위한 신호-발생 반응을 수행하는 단계를 추가적으로 포함하는 것을 특징으로 하는 방법.
  13. 제1항에 있어서, 상기 신호-발생 반응은 신호 증폭 반응인 것을 특징으로 하는 방법.
  14. 다음의 단계를 포함하는 샘플 내 타겟 분석물질 검출 방법:
    (a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
    (c) 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하는 단계;
    (d) 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하는 단계; 및
    (e) 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질을 검출하는 단계.
  15. 제14항에 있어서, 상기 변환된 데이터 세트는 상기 보정된 신호 변화량 데이터 세트의 신호 변화량의 변화를 나타내는 N차 신호 변화량을 포함하는 N차 신호 변화량 데이터 세트이며; 상기 N은 2 이상의 정수인 것을 특징으로 하는 방법.
  16. 제14항에 있어서, 상기 단계 (e)의 타겟 분석물질의 검출은 상기 샘플 내 타겟 분석물질의 정성적 또는 정량적 검출인 것을 특징으로 하는 방법.
  17. 다음의 단계를 포함하는 데이터 세트 재구성 방법:
    (a) 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며; 및
    (b) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
  18. 제17항에 있어서, 상기 각 사이클에서의 신호 변화량은 각 사이클에서의 신호값들의 미분값; 각 사이클에서의 신호값들의 차분값; 각 사이클에서의 신호값들의 비율; 및 각 사이클에서의 선형회귀분석을 수행하여 수득한 기울기값으로 이루어진 군에서 선택된 것을 특징으로 하는 방법.
  19. 제17항에 있어서, 상기 각 사이클에서의 누적값은 각 사이클에서의 미분값들의 누적값; 각 사이클에서의 차분값들의 누적값; 각 사이클에서의 비율들의 누적값; 및 기울기값들의 누적값으로 이루어진 군에서 선택된 것을 특징으로 하는 방법.
  20. 다음의 단계를 포함하는 데이터 세트 평활 방법:
    (a) 타겟 분석물질에 대한 데이터 세트를 제공하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량을 포함하는 복수의 데이터 지점을 포함하며; 및
    (c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
  21. 제20항에 있어서, 상기 방법은, 데이터 세트의 평활을 위하여, 상기 단계 (c)에서 제공된 상기 재구성된 데이터 세트를 상기 (b) 단계의 데이터 세트로 사용하여, 상기 단계 (b)-(c)를 반복하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  22. 제20항에 있어서, 상기 신호 변화량은 각 사이클에서 선형회귀분석을 수행하여 수득한 기울기값인 것을 특징으로 하는 방법.
  23. 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 상기 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
    (c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함하며; 및
    (d) 상기 재구성된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
  24. 샘플 내 타겟 분석물질 검출 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며;
    (c) 상기 신호 변화량 데이터 세트를 직접 보정하여 보정된 신호 변화량 데이터 세트를 제공하는 단계;
    (d) 상기 보정된 신호 변화량 데이터 세트를 변환하여 변환된 데이터 세트를 제공하는 단계; 및
    (e) 상기 변환된 데이터 세트를 이용하여 샘플 내 타겟 분석물질의 존재 또는 부존재를 결정하는 단계.
  25. 데이터 세트 재구성 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 사이클들 및 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
    (c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
  26. 데이터 세트 평활 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 타겟 분석물질에 대한 데이터 세트를 수신하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용한 상기 타겟 분석물질에 대한 신호-발생 반응으로부터 수득되며; 상기 데이터 세트는 사이클들 및 상기 신호-발생 반응의 신호값들을 포함하는 복수의 데이터 지점을 포함하며; 상기 사이클은 타겟 핵산 분자의 변성, 타겟 핵산 분자와 프라이머의 어닐링 및 프라이머의 연장을 포함하는 반응 단위의 반복 횟수이며;
    (b) 상기 데이터 세트의 신호값들을 이용하여 각 사이클에서의 신호 변화량을 수득하여 신호 변화량 데이터 세트를 제공하는 단계; 상기 신호 변화량 데이터 세트는 사이클들 및 상기 사이클들에서의 신호 변화량들을 포함하는 복수의 데이터 지점을 포함하며; 및
    (c) 상기 신호 변화량 데이터 세트의 신호 변화량을 이용하여 각 사이클에서의 누적값을 수득하여 재구성된 데이터 세트를 제공하는 단계; 상기 재구성된 데이터 세트는 사이클들 및 상기 사이클들에서의 누적값들을 포함하는 복수의 데이터 지점을 포함한다.
KR1020197000113A 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법 KR102326604B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020217036681A KR102385959B1 (ko) 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20160068932 2016-06-02
KR1020160068932 2016-06-02
PCT/KR2017/005790 WO2017209563A1 (en) 2016-06-02 2017-06-02 Method for detecting a target analyte in a sample using a signal change-amount data set

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020217036681A Division KR102385959B1 (ko) 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법

Publications (2)

Publication Number Publication Date
KR20190004834A KR20190004834A (ko) 2019-01-14
KR102326604B1 true KR102326604B1 (ko) 2021-11-15

Family

ID=60478835

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020217036681A KR102385959B1 (ko) 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
KR1020197000113A KR102326604B1 (ko) 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020217036681A KR102385959B1 (ko) 2016-06-02 2017-06-02 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법

Country Status (6)

Country Link
US (1) US20190156920A1 (ko)
EP (1) EP3465504A4 (ko)
JP (1) JP6835877B2 (ko)
KR (2) KR102385959B1 (ko)
CN (1) CN109923613B (ko)
WO (1) WO2017209563A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016356474A1 (en) * 2015-11-20 2018-06-21 Seegene, Inc. Method for calibrating a data set of a target analyte
CA3095112A1 (en) * 2018-04-20 2019-10-24 Seegene, Inc. Method and apparatus for detecting a plurality of target nucleic acid sequences in sample
US20220025449A1 (en) * 2018-12-14 2022-01-27 Seegene, Inc. Method for detecting a target analyte in a sample using an s-shaped function for a slope data set
CN112669910A (zh) * 2020-12-30 2021-04-16 杭州博日科技股份有限公司 扩增曲线基线确定方法、装置以及电子设备
CN113641957B (zh) * 2021-06-29 2024-08-13 南京邮电大学 一种基于归一化流的信号检测方法
CN115641916B (zh) * 2022-09-29 2024-05-03 杭州准芯生物技术有限公司 一种分子生物学检测方法、计算机设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140127793A1 (en) * 2007-12-28 2014-05-08 Abbott Laboratories Allelic discrimination analysis using an efficiency related value (efr)
US20150232916A1 (en) * 2012-09-10 2015-08-20 Biofire Diagnostics, Llc Multiple amplification cycle detection

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115673A (en) * 1997-08-14 2000-09-05 Instrumentation Metrics, Inc. Method and apparatus for generating basis sets for use in spectroscopic analysis
US7228237B2 (en) * 2002-02-07 2007-06-05 Applera Corporation Automatic threshold setting and baseline determination for real-time PCR
ES2359322T3 (es) * 2004-10-18 2011-05-20 Brandeis University Procedimiento para la amplificación de ácidos nucleicos.
CN100368560C (zh) * 2005-09-22 2008-02-13 广州华银医药科技有限公司 一种呼吸道病原体的实时荧光聚合酶链式反应检测方法
US7587283B2 (en) * 2006-07-01 2009-09-08 Celera Corporation Growth and baseline identification determination for amplification data
US8005628B2 (en) * 2007-01-29 2011-08-23 Applied Biosystems, Llc Systems and methods for baseline correction using non-linear normalization
BR112014019168B1 (pt) * 2012-02-03 2021-10-05 California Institute Of Technology Método capaz de detectar de forma não degenerada presença ou ausência de analitos em um único volume de amostra e método de detecção da presença ou ausência de cada analito dentre uma pluralidade de analitos
JP6386031B2 (ja) * 2013-05-15 2018-09-05 ソーン ダイアグノスティックス インコーポレイテッド 核酸増幅信号収集及び信号分析
US9607128B2 (en) 2013-12-30 2017-03-28 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time PCR signals
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples
KR20160039529A (ko) 2014-10-01 2016-04-11 주식회사 씨젠 증폭곡선을 보정하는 방법 및 시료 분석을 위한 정보를 획득하는 방법, 그 기록매체, 그 컴퓨터 프로그램, 컴퓨터 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140127793A1 (en) * 2007-12-28 2014-05-08 Abbott Laboratories Allelic discrimination analysis using an efficiency related value (efr)
US20150232916A1 (en) * 2012-09-10 2015-08-20 Biofire Diagnostics, Llc Multiple amplification cycle detection

Also Published As

Publication number Publication date
US20190156920A1 (en) 2019-05-23
CN109923613A (zh) 2019-06-21
EP3465504A4 (en) 2020-02-12
JP6835877B2 (ja) 2021-02-24
WO2017209563A1 (en) 2017-12-07
KR20190004834A (ko) 2019-01-14
KR102385959B1 (ko) 2022-04-12
EP3465504A1 (en) 2019-04-10
CN109923613B (zh) 2023-07-04
WO2017209563A9 (en) 2018-12-27
KR20210138152A (ko) 2021-11-18
JP2019525289A (ja) 2019-09-05

Similar Documents

Publication Publication Date Title
KR102326604B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
JP6685396B2 (ja) 標的分析物質に対するデータセットの補正方法
US20210238652A1 (en) Methods for analyzing samples
KR102300738B1 (ko) 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법
JP7379548B2 (ja) 試料内ターゲット分析物を分析する方法及び装置
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
KR102165933B1 (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
KR102699175B1 (ko) 기울기 데이터 세트에 대한 s자 형태의 함수를 사용하여 샘플 내 타겟 분석물질을 검출하는 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant