KR102165933B1 - 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출 - Google Patents

둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출 Download PDF

Info

Publication number
KR102165933B1
KR102165933B1 KR1020187031711A KR20187031711A KR102165933B1 KR 102165933 B1 KR102165933 B1 KR 102165933B1 KR 1020187031711 A KR1020187031711 A KR 1020187031711A KR 20187031711 A KR20187031711 A KR 20187031711A KR 102165933 B1 KR102165933 B1 KR 102165933B1
Authority
KR
South Korea
Prior art keywords
cycle number
score
data set
cycle
signal
Prior art date
Application number
KR1020187031711A
Other languages
English (en)
Other versions
KR20180122481A (ko
Inventor
천종윤
장미현
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20180122481A publication Critical patent/KR20180122481A/ko
Application granted granted Critical
Publication of KR102165933B1 publication Critical patent/KR102165933B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio

Abstract

본 발명은 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법에 관한 것이다. 본 발명은 둘 이상의 데이터 세트에서 공통적으로 발생하는 비정상적인 시그널의 특징에 기초하여 비정상적인 시그널을 검출할 수 있게 하는바, 본 발명은 멀티플렉스 PCR 방법에 의해 수득된 데이터 세트에 효과적으로 적용된다.

Description

둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
본 발명은 둘 이상의 데이터 세트, 특히 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법에 관한 것이다.
핵산 증폭을 통하여 타겟 핵산 서열을 검출하기 위한 방법으로서, 타겟 핵산 서열의 증폭을 실시간(real-time)으로 측정하는 실시간 PCR 기술이 널리 이용되고 있다. 실시간 PCR 기술은 특정 타겟 핵산 서열을 검출하기 위하여 PCR 반응에서 타겟 핵산 서열의 양에 비례하여 검출가능한 형광 시그널을 방출하는 시그널 발생 수단을 이용한다. 검출가능한 형광 시그널의 방출은, 예를 들어 이중 나선 DNA에 결합시 형광 시그널을 방출하는 인터컬레이터를 사용하거나, 리포터 분자 및 이의 형광 방출을 억제하는 퀀처 분자를 모두 포함하는 올리고뉴클레오타이드를 사용하여 달성될 수 있다.
실시간 PCR 방법은 타겟 핵산의 양에 비례하는 형광 시그널을 각 사이클마다 측정하여, 사이클 번호와 상기 사이클 번호에서의 형광 시그널의 세기(시그널 값)의 좌표값을 갖는 복수의 데이터 지점을 포함하는 데이터 세트(dataset)를 생성한다. 상기 데이터 세트는 데이터 분석의 편의를 위해 형광 세기 값을 사이클 번호에 대해 플로팅한 증폭 곡선(증폭 프로파일 또는 성장 곡선으로도 불림)으로 표시될 수 있다. 이후, 증폭 곡선을 나타내는 데이터 세트를 분석하여 샘플 내의 타겟 핵산 서열의 존재 또는 부존재를 결정할 수 있다. 예를 들어, 증폭 곡선을 나타내는 데이터 세트에 적용된 역치를 초과하는 형광 시그널을 갖는 사이클이 존재하면 샘플 내에 타겟 핵산 서열이 존재한다고 결정할 수 있다.
타겟 핵산 서열의 검출을 위해서는, 정확하고 신뢰성 있는 데이터 세트를 얻는 것이 필수적이다. 하지만, 정교한 실험에도 불구하고, 생성된 데이터 세트는 어닐링 온도의 변화, 반응 튜브 내에 기포(air bubble)의 형성 또는 샘플 내에 이물질의 존재로 인해 비정상적인 시그널(오류(error) 또는 노이즈(noise))를 포함할 수 있다. 이러한 비정상적인 시그널의 예로는 형광 시그널의 급격한 증가(점프(jump), 스파이크(spike), 스텝(step) 등으로도 불림) 또는 급격한 감소(딥(dip)으로도 불림)를 들 수 있다. 이러한 비정상적인 시그널의 발생은 데이터 세트의 정성 및 정량 분석시 잘못된 해석(misinterpretation)을 초래하여, 분석의 정확성 및 신뢰성을 저하시킬 수 있다.
비정상적인 시그널의 발생을 방지하기 위한 많은 시도가 있었지만, 그 정확한 원인은 아직까지 밝혀지지 않았다. 정확한 원인을 알아낸다고 해도 이를 미리 예방하는 것은 더 어렵다. 따라서, 데이터 세트로부터 타겟 핵산 서열의 존재 또는 부존재를 결정하기 전에, 데이터 세트를 분석하여 비정상적인 시그널이 발생하였는지 결정하고, 필요한 경우 이를 보정하거나 무효화하는 것이 보다 실용적일 것이다.
이와 관련하여, 비정상적인 시그널을 확인하기 위한 몇 가지 데이터 분석 방법들이 보고되었다.
미국 특허 제8,560,247호는 비-증폭 데이터, 즉 노이즈 및 점프와 같은 오류를 판별하는 기술을 개시하고 있으며, 상기 기술은 데이터 지점의 집합(set)을 받고, 상기 데이터 지점의 집합을 근사화하는 일차 함수를 계산하고, 상기 일차 함수를 분석하여 일차 함수의 기울기(slope)가 최대 증폭 기울기를 초과하는지 결정하고, 상기 최대 증폭 기울기를 초과하면 상기 초과하는 기울기 구간(segment)을 곡선의 비-증폭 구간으로서 확인하는 단계를 포함한다. 하지만, 정상적인 시그널도 종종 반응 조건에 따라 최대 증폭 기울기를 초과하는 증폭 데이터를 나타낸다는 점을 고려할 때, 상기 방법은 상당수의 정상적인 시그널을 오류로 결정할 가능성이 높다.
또한, 미국 출원공개 제2015/0186598호는 데이터 세트의 2차 도함수로부터 상이한 부호를 갖는 2개의 연속 사이클의 결정에 기초하여 점프 오류(jump error)를 검출하는 방법을 개시하고 있다. 하지만, 상기 방법은 점프 오류를 결정하기 위해 그다지 엄격하지 않은 역치를 사용하며, 역치의 적용이 복잡하다.
우리가 아는 한, 전술한 방법들을 포함하는 종래의 접근법은 비정상적인 시그널을 확인하기 위해 하나의 데이터 세트를 이용하므로, 결과의 정확성 면에서 한계가 있다.
따라서, 다수의 데이터 세트로부터 보다 일관성 있고 정확한 방식으로 비정상적인 시그널을 결정하는데 사용될 수 있는, 멀티플렉스 PCR 방법에 적합한 새로운 분석 방법의 개발이 요구된다.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 증폭 반응에 의해 수득된 데이터 세트에서 발견될 수 있는 비정상적인 시그널을 검출하는 종래의 방법을 개선하고자 노력하였다. 그 결과, 본 발명자들은 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 개발하였다. 특히, 본 발명자들은 데이터 세트에 대하여 사이클 번호에서의 2차 변화값(second-order change value) 사이의 부호 변화 및 크기를 나타내는 "정상 스코어(normality score)"라는 새로운 파라미터를 확립하고 이 정상 스코어를 사용하여 비정상적인 시그널을 검출하는 신규한 방법을 개발하였다.
따라서, 본 발명의 목적은 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 제공하는 데 있다.
본 발명의 다른 목적은 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 데 있다.
본 발명의 또 다른 목적은 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하기 위한 장치를 제공하는 데 있다.
본 발명의 다른 목적은 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 실시예, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 종래 방법들은 하나의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는데 반해, 본 발명은 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 복수의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 새로운 접근법을 제공한다.
(b) 본 발명은 둘 이상의 데이터 세트에서 공통적으로 발생하는 비정상적인 시그널의 특징에 기초하여 비정상적인 시그널을 검출할 수 있게 하므로, 본 발명은 멀티플렉스 검출 방법(예컨대, 멀티플렉스 PCR 방법)에 유용하다.
(c) 본 발명은 하나의 데이터 세트에서 확인된 비정상적인 시그널을 나타내는 사이클 번호에 관한 정보를 사용하여 또 다른 데이터 세트의 비정상적인 시그널을 보정하고 제거하는 기회를 제공한다.
(d) 본 발명의 방법은 컴퓨터 프로그램으로 구현되어 일관되고 재현성이 있는 결과를 제공할 수 있다.
(e) 본 발명의 방법은 본 발명에 의해 결정된 비정상적인 시그널을 보정하거나 무효화함으로써 타겟 분석물질(특히, 타겟 핵산 서열)에 대한 보다 정확한 증폭 곡선 및 정성 및 정량 정보를 제공할 수 있다.
(f) 본 발명의 방법은 위양성(false positive) 또는 위음성(false negative) 결과를 현저히 줄일 수 있다.
도 1은 본 발명의 대표적인 구현예에 따라 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 나타내는 사이클을 결정하는 과정을 나타낸 흐름도이다.
도 2는 개별 정상 스코어 접근법에 따라 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 나타내는 사이클을 결정하는 과정을 나타낸 흐름도이다.
도 3은 통합 정상 스코어 접근법에 따라 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 나타내는 사이클을 결정하는 과정을 나타낸 흐름도이다.
도 4는 4개의 검출 채널((a): FAM; (b): CAL Fluor Orange 560; (c) CAL Fluor Red 610; (d) Quasar 670)을 사용한 검출에 의해 수득된, 실시예 1의 분석에 사용된 데이터 세트를 나타낸 것이다.
도 5는 도 4의 데이터 세트 (a)-(d)에 대하여, 각 사이클 번호에서 계산된 정상 스코어(NS)를 도식적으로 나타낸 것이다.
도 6은 4개의 검출 채널((a): FAM; (b): CAL Fluor Orange 560; (c) CAL Fluor Red 610; (d) Quasar 670)을 사용한 검출에 의해 수득된, 실시예 2의 분석에 사용된 데이터 세트를 나타낸 것이다.
도 7은 도 6의 데이터 세트 (a)-(d)에 대하여, 각 사이클 번호에서 계산된 정상 스코어(NS)를 도식적으로 나타낸 것이다.
도 8은 총 순위 스코어(TRS)의 크기에 따라 도 6의 데이터 세트 (a)-(d)의 TRS를 1차원적으로 배열한 것을 나타낸 것이다. 상기 배열에서, 최소 TRS 0이 추가적으로 삽입되고, 최대 갭이 표시되어 있다.
도 9는 4개의 검출 채널((a): FAM; (b): CAL Fluor Orange 560; (c) CAL Fluor Red 610; (d) Quasar 670)을 사용한 검출에 의해 수득된, 실시예 3의 분석에 사용된 데이터 세트를 나타낸 것이다.
도 10은 도 9의 데이터 세트 (a)-(d)에 대하여, 각 사이클 번호에서 계산된 정상 스코어(NS)를 도식적으로 나타낸 것이다.
도 11은 총 순위 스코어(TRS)의 크기에 따라 도 9의 데이터 세트 (a)-(d)의 TRS를 1차원적으로 배열한 것을 나타낸 것이다. 상기 배열에서, 최소 TRS 0이 추가적으로 삽입되고, 최대 갭이 표시되어 있다.
I. 둘 이상의 데이터 세트를 사용한 비정상적인 시그널의 검출
본 발명의 일 양태에서, 본 발명은 하기 단계를 포함하는, 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 제공한다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
(c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(normality score)를 계산하는 단계로서, 상기 정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
(d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
본 발명자들은 증폭 반응에 의해 수득된 데이터 세트에서 발견될 수 있는 비정상적인 시그널을 검출하는 종래의 방법을 개선하고자 노력하였다. 그 결과, 본 발명자들은 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 개발하였다. 특히, 본 발명자들은 데이터 세트에 대하여 사이클 번호에서의 2차 변화값(second-order change value) 사이의 부호 변화 및 크기를 나타내는 "정상 스코어(normality score)"라는 새로운 파라미터를 확립하고 이 정상 스코어를 사용하여 비정상적인 시그널을 검출하는 신규한 방법을 개발하였다.
본원에서 사용된 바와 같이, 용어 "비정상적인 시그널(abnormal signal)"은 분석물질(예컨대, 타겟 핵산 서열)과 관련되지 않은 시그널, 즉 증폭 반응 동안 분석물질 이외의 다른 요인에 의해 급격하게 증가하거나 감소하는 시그널을 의미한다. 용어 "비정상적인 시그널"은 "오류 시그널(error signal; erroneous signal)", "이상 시그널(aberrant signal; outlier signal)" 또는 "노이즈 시그널(noise signal)"과 상호교환적으로 사용된다. 본원에서 비정상적인 시그널은 시그널 증폭 반응으로부터 얻은 증폭 곡선에서 시그널 값의 급격한 증가(예컨대, 점프, 스파이크 또는 스텝) 또는 급격한 감소(예컨대, 딥)를 나타내는 시그널을 포함한다. 비정상적인 시그널의 원인은 어닐링 온도의 변화, 튜브 내에 기포(air bubble)의 형성 또는 샘플 내에 이물질의 존재를 들 수 있으나, 이에 제한되지 않는다.
데이터 세트들이 단일 용기에서의 반응에 의해 수득되는 경우, 비정상적인 시그널은 존재시 모든 데이터 세트에서 공통적으로, 특히 공통된 사이클 번호에서 또는 인접 사이클 번호에서 발생할 가능성이 높다. 따라서, 본 발명은 둘 이상의 데이터 세트를 분석하여 상기 데이터 세트에서 공통적으로 발생하는 비정상적인 시그널을 확인하는 방법을 제공한다.
또한, 특정 사이클 번호가 하나의 데이터 세트에서 비정상적인 시그널을 나타내면, 상기 사이클 번호는 또 다른 데이터 세트에서 비정상적인 시그널을 나타낼 가능성이 높다. 따라서, 본 발명은 하나의 데이터 세트를 분석하여 비정상적인 시그널을 나타내는 사이클 번호를 확인하고, 상기 사이클 번호를 또 다른 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 간주하는 방법을 제공한다.
본 발명은 둘 이상의 데이터 세트를 사용하여 유연한 방식으로 비정상적인 시그널을 결정할 수 있다.
둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 본 발명의 예시적인 구현예가 도 1에 도시되어 있다.
본 발명의 방법이 하기와 같이 도 1을 참조하여 더 상세히 설명될 것이다:
단계 (a): 둘 이상의 데이터 세트의 수득(110)
단계 (a)에서, 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득한다. 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 갖는다.
구체적으로, 둘 이상의 데이터 세트는 단일 반응 용기에서 샘플 내의 타겟 분석물질(들)을 적어도 하나의 시그널 발생 수단과 함께 인큐베이션하고, 적어도 하나의 검출기에 의해 시그널을 검출함으로써 수득된다.
본원에서 사용된 용어 "타겟 분석물질(analyte)"은 다양한 물질(예컨대, 생물학적 물질 및 비생물학적 물질)을 포함하며, 구체적으로 생물학적 물질, 보다 구체적으로 핵산 분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원, 대사물질 및 세포를 포함한다. 가장 구체적으로, 타겟 분석물질은 타겟 핵산 분자이다. 타겟 분석물질은 샘플에 존재한다.
본원에서 사용된 용어 "샘플"은 본 발명의 방법을 겪는 임의의 물질을 지칭한다. 구체적으로, 용어 "샘플"은 관심 핵산을 함유하거나 함유할 것으로 추정되는 임의의 물질을 지칭하거나 관심 타겟 핵산 서열을 함유하거나 함유할 것으로 추정되는 핵산 자체를 지칭한다. 보다 구체적으로, 본원에서 사용된 용어 "샘플"은 생물학적 샘플(예컨대, 생물학적 공급원으로부터의 세포, 조직 및 체액) 및 비생물학적 샘플(예컨대, 음식물, 물 및 토양)를 포함한다. 생물학적 샘플은, 비제한적으로, 바이러스, 세균, 조직, 세포, 혈액, 혈청, 혈장, 림프, 객담, 스왑(swab), 흡인액, 기관지 세척액, 우유, 소변, 분변, 안구액, 타액, 정액, 뇌 추출물, 척수액(SCF), 흉선, 비장 및 편도 조직 추출물, 복수 및 양막액을 포함한다. 또한, 샘플은 생물학적 공급원으로부터 단리된 자연 발생 핵산 분자 및 합성 핵산 분자를 포함할 수 있다.
본원에서 사용된 용어 "타겟 핵산", "타겟 핵산 서열", 또는 "타겟 서열"은 분석, 검출 또는 정량을 위한 관심 핵산 서열을 의미한다. 타겟 핵산 서열은 단일 가닥뿐만 아니라 이중 가닥 서열을 포함한다. 타겟 핵산 서열은 샘플 내 초기에 존재하는 서열뿐만 아니라 반응 과정에서 새롭게 생성된 서열을 포함한다.
타겟 핵산 서열은 DNA(gDNA 및 cDNA), RNA 분자 및 이들의 혼성체(키메라 핵산)를 포함한다. 서열은 이중 가닥 또는 단일 가닥 형태일 수 있다. 출발 물질로서 핵산이 이중 가닥인 경우, 상기 이중 가닥을 단일 가닥 또는 부분적 단일 가닥 형태로 만드는 것이 바람직하다. 가닥을 분리시키는 공지된 방법은 비제한적으로, 가열, 알카리, 포름아미드, 우레아 및 글리콕살 처리, 효소적 방법(예, 헬리카아제 작용) 및 결합 단백질을 포함한다. 예를 들어, 가닥 분리는 80-105℃의 온도에서 가열함으로써 달성될 수 있다. 이러한 처리의 일반적인 방법은 문헌[Joseph Sambrook, 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)]에 개시되어 있다.
타겟 핵산 서열은 어떠한 자연 발생 원핵세포 핵산, 진핵세포(예컨대, 원생동물과 기생동물, 균류, 효모, 고등 식물, 하등 동물 및 포유동물과 인간을 포함하는 고등 동물) 핵산, 바이러스(예컨대, 헤르페스 바이러스, HIV, 인플루엔자 바이러스, 엡스타인-바 바이러스, 간염 바이러스, 폴리오바이러스 등) 핵산 또는 비로이드 핵산을 포함한다. 핵산 분자는 또한 재조합으로 생산된 또는 생산될 수 있는 또는 화학적으로 합성된 또는 합성될 수 있는 임의의 핵산 분자일 수 있다. 따라서, 타겟 핵산 서열은 자연계에서 발견될 수 있거나 발견되지 않을 수 있다.
타겟 핵산 서열은 주어진 시점에 알려진 서열 또는 주어진 시점부터 이용가능한 서열로 한정하는 것으로 해석되지 않아야 하며, 대신에 현재 또는 미래의 어느 시점에 이용가능하거나 알려질 수 있는 서열을 포함하는 것으로 해석되어야 한다. 즉, 타겟 핵산 서열은 본 발명의 방법을 실시하는 시점에 알려지거나 알려지지 않을 수 있다. 알려지지 않은 타겟 핵산 서열의 경우, 그의 서열은 본 발명을 실시하기 전에 종래의 시퀀싱 방법 중 하나에 의해 결정될 수 있다.
타겟 분석물질이 타겟 핵산 분자인 경우, 샘플은 본 기술분야에서 공지된 핵산 추출 과정을 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)). 핵산 추출 과정은 샘플의 종류에 따라 달라질 수 있다. 또한, 추출된 핵산이 RNA인 경우, cDNA를 합성하기 위한 역전사(reverse transcription) 과정을 추가로 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)).
본 발명의 일 구현예에 따르면, 타겟 핵산 서열은 뉴클레오타이드 변이를 포함한다.
본원에서 사용된 용어 "뉴클레오타이드 변이(nucleotide variation)"는 연속의 DNA 세그먼트 중 특정 위치의 DNA 서열에서의 어떤 단일 또는 복수의 뉴클레오타이드의 치환, 결실 또는 삽입을 의미한다. 이러한 연속적 DNA 세그먼트들은 하나의 유전자 또는 하나의 염색체의 어떤 다른 부위를 포함한다. 이러한 뉴클레오타이드 변이는 돌연변이(mutant) 또는 다형성 대립유전자 변이(polymorphic allele variations)일 수 있다. 예를 들어, 본 발명에서 검출되는 뉴클레오타이드 변이는 단일 뉴클레오타이드 다형성(single nucleotide polymorphism; SNP), 돌연변이(mutation), 결실, 삽입, 치환 및 전좌를 포함한다. 뉴클레오타이드 변이의 예는, 인간 지놈 내의 다양한 변이(예컨대, 메틸렌사수소 엽산 환원효소(methylenetetrahydrofolate reductase; MTHFR) 유전자의 변이), 병원체의 약제 내성과 관련된 변이 및 종양 형성-유발 변이를 포함한다. 본원에서 사용된 용어 "뉴클레오타이드 변이"는 핵산 서열의 특정 위치에서의 모든 변이를 포함한다. 즉, 용어 "뉴클레오타이드 변이"는 핵산 서열의 특정 위치에서의 야생형 및 그의 모든 돌연변이형을 포함한다.
본 발명에 따르면, 샘플(또는 샘플 내의 타겟 분석물질)은 타겟 핵산 서열에 대한 시그널을 얻기 위해 적어도 하나의 시그널 발생 수단과 함께 인큐베이션된다.
본원에서 사용된 용어 "인큐베이션하는 것", "인큐베이션하다", 또는 "인큐베이션"은 상호작용 또는 반응을 위해 성분들을 합치는 것을 지칭한다. 특히, 상기 용어는 본원의 성분들을 시그널 발생 과정에 적용하는 것을 지칭한다.
본원에서 사용된 용어 "시그널 발생 반응"은 샘플 내 타겟 분석물질의 특성(properties), 예컨대 활성, 양 또는 존재(또는 부존재), 특히 존재(또는 부존재)에 의존적으로 시그널을 발생시킬 수 있는 임의의 반응을 의미한다. 본원에서 시그널 발생 반응은 생물학적 반응 및 화학적 반응을 포함한다. 이러한 생물학적 반응은 PCR, 실시간 PCR 및 마이크로어레이 분석과 같은 유전적 분석, 면역학적 분석 및 박테리아 성장 분석을 포함한다. 일 구현예에 따르면, 시그널 발생 반응은 화학물질의 생성, 변화 또는 파괴를 분석하는 것을 포함한다.
시그널 발생 반응은 시그널 변화를 동반한다. 시그널 변화는 타겟 핵산 서열의 존재 또는 부존재를 정성적으로 또는 정량적으로 나타내는 지시자 역할을 할 수 있다.
"시그널 발생 과정"의 세부내용은 본 발명자들에 의해 출원된 WO 2015/147412에 개시되어 있으며, 이의 교시는 그 전체가 참조로 본원에 포함되어 있다.
일 구현예에 따르면, 시그널 발생 과정은 시그널 증폭 과정이다.
본 발명의 일 구현예에 따르면, 시그널 발생 과정은 타겟 핵산 분자의 증폭을 동반하거나 동반하지 않는 과정이다.
구체적으로, 시그널 발생 과정은 타겟 핵산 분자의 증폭을 동반하는 과정이다. 보다 구체적으로, 시그널 발생 과정은 타겟 핵산 분자의 증폭을 동반하고 타겟 핵산 분자의 증폭시 시그널을 증가시키거나 감소시킬 수 있는(구체적으로, 시그널을 증가시킬 수 있는) 과정이다.
본원에서 사용된 용어 "시그널 발생"은 시그널의 출현 또는 소멸 그리고 시그널의 증가 또는 감소를 포함한다. 구체적으로, 용어 "시그널 발생"은 시그널의 증가를 의미한다.
시그널 발생 과정은 당업자에게 공지된 다양한 방법에 따라 실시될 수 있다. 상기 방법의 예로는 TaqManTM 프로브 방법(미국 특허 제5,210,015호), 분자 비콘 방법(Tyagi 등, Nature Biotechnology v.14 MARCH 1996), 스콜피온(Scorpion) 방법(Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise 또는 Amplifluor) 방법(Nazarenko 등, 2516-2521 Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국 특허 제6,117,635호), 럭스(Lux) 방법(미국 특허 제7,537,886호), CPT(Duck P, 등. Biotechniques, 9:142-148(1990)), LNA 방법(미국 특허 제6,977,295호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), HybeaconsTM(D. J. French, et al., Molecular and Cellular Probes (2001) 13, 363-374 및 미국 특허 제7,348,141호), 이중표지된 자가-퀀칭된 프로브(Dual-labeled, self-quenched probe; 미국 특허 제5,876,930호), 혼성화 프로브(Bernard PS, et al., Clin Chem 2000, 46, 147-148), PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO 2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(WO 2014/104818) 및 CER 방법(WO 2011/037306)을 들 수 있다.
시그널 발생 과정을 TaqManTM 프로브 방법에 따라 실시하는 경우, 시그널 발생 수단은 프라이머 쌍, 상호작용 이중 표지가 결합된 프로브 및 5'→3' 뉴클레아제 활성을 갖는 DNA 중합효소를 포함할 수 있다. 시그널 발생 반응을 PTOCE 방법에 따라 실시하는 경우, 시그널 발생 수단은 프라이머 쌍, PTO(Probing and Tagging Oligonucleotide), CTO(Capturing and Templating Oligonucleotide) 및 5'→3' 뉴클레아제 활성을 갖는 DNA 중합효소를 포함할 수 있다. PTO 또는 CTO는 적합한 표지로 표지될 수 있다.
일 구현예에 따르면, 시그널 발생 과정은 타겟 증폭과 함께 시그널 증폭을 포함하는 과정으로 실시될 수 있다.
일 구현예에 따르면, 시그널 발생 과정으로서 시그널 증폭 반응은 타겟 핵산 서열의 증폭과 동시에 시그널이 증폭되는 방식으로 실시된다(예컨대, 실시간 PCR). 택일적으로, 증폭 반응은 타겟 핵산 분자의 증폭 없이 시그널이 증폭되는 방식으로 실시된다(예를 들어, CPT 방법(Duck P, et al., Biotechniques, 9:142-148 (1990)), Invader assay(미국 특허 제6,358,691호 및 제6,194,149호)).
타겟 핵산 분자를 증폭하는 다양한 방법들이 알려져 있으며, 이는 비제한적으로 PCR(중합효소 연쇄반응), LCR(리가아제 연쇄반응, Wiedmann M, et al., "Ligase chain reaction (LCR)- overview and applications." PCR Methods and Applications, 3(4):S51-64(1994) 참고), GLCR(갭 필링 LCR, WO 90/01069, EP 0439182 및 WO 93/00447 참고), Q-beta(Q-beta replicase amplification, Cahill P, et al., Clin Chem., 37(9):1482-5(1991), 미국 특허 5,556,751 참고), SDA(strand displacement amplification, G T Walker et al., Nucleic Acids Res. 20(7):16911696(1992), EP 0497272 참고), NASBA(nucleic acid sequence-based amplification, Compton, J. Nature 350(6313):912(1991) 참고), TMA(Transcription-Mediated Amplification, Hofmann WP et al., J Clin Virol. 32(4):289-93(2005); 미국 특허 5,888,779 참고) 또는 RCA(Rolling Circle Amplification, Hutchison C.A. et al., Proc. Natl Acad. Sci. USA. 102:1733217336(2005) 참고)를 포함한다.
본원에서 사용된 용어 "시그널"은 측정가능한 아웃풋을 의미한다. 본원에서 사용된 "시그널 값"은 시그널을 정량적으로 나타내는 표현이다.
시그널의 크기, 변화 등은 타겟 분석물질(타겟 핵산 서열)의 특성, 특히 존재 또는 부존재를 정성적으로 또는 정량적으로 나타내는 지시자 역할을 할 수 있다.
유용한 지시자의 예는 형광 세기, 발광세기, 화학발광 세기, 생발광 세기, 인광세기, 전하 이동, 전압, 전류, 전력, 에너지, 온도, 점성도, 광 스캐터, 방사능 세기, 반사도, 투광도 및 흡광도를 포함한다. 가장 널리 사용되는 지시자는 형광 세기(fluorescence intensity)이다. 시그널 변화는 시그널의 발생 또는 소멸뿐만 아니라 시그널의 증가 또는 감소를 포함한다.
시그널은 시그널 검출로부터 얻어지는 다양한 시그널 특성, 예컨대 시그널 세기[예컨대, RFU(relative fluorescence unit) 값 또는 증폭반응을 실시하는 경우, 특정 사이클, 선택된 사이클 또는 엔드-포인트에서의 RFU 값], 시그널 변화 모양(또는 패턴) 또는 Ct 값 또는 상기 특성을 수학적으로 가공하여 얻은 값을 포함한다.
일 구현예에 따르면, 용어 "시그널"은 검출 온도에서 검출된 시그널 자체뿐만 아니라 상기 시그널을 수학적으로 가공한 변형된 시그널을 포함한다.
본 발명의 일 구현예에 따르면, 실시간 PCR에 의해 증폭곡선을 얻는 경우, 증폭곡선으로부터 다양한 시그널 값(또는 특성)을 선택하고 타겟 핵산 서열의 존재를 결정하는데 사용할 수 있다(예컨대, 시그널 세기, Ct 값 또는 증폭 곡선 데이터).
시그널(특히, 시그널 세기)은 그의 검출 온도뿐만 아니라 사용된 시그널 발생 수단에 따라 달라질 수 있다.
본원에서 사용된 용어 "시그널 발생 수단"은 분석하고자 하는 타겟 분석물질의 특성, 구체적으로 존재 또는 부존재를 나타내는 시그널을 제공하는 수단을 의미한다.
본원에서 사용된 용어 "시그널 발생 수단"은 타겟 핵산 서열의 존재를 나타내는 시그널을 발생하는데 사용되는 임의의 물질을 의미하며, 예컨대 올리고뉴클레오타이드, 표지 및 효소를 포함한다. 택일적으로, 본원에서 사용된 용어 "시그널 발생 수단"은 시그널 발생을 위한 물질을 사용하는 임의의 방법을 의미하기 위해 사용될 수 있다.
다양한 시그널 발생 수단이 당업계에 알려져 있다. 시그널 발생 수단은 표지 자체 및 표지가 연결된 올리고뉴클레오타이드를 포함한다. 상기 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다. 상기 표지 자체, 예컨대 인터컬레이팅 염료(intercalating dye)가 시그널 발생 수단으로서의 역할을 할 수 있다. 택일적으로, 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지가 하나 이상의 올리고뉴클레오타이드에 결합된 형태로 시그널 발생 수단으로서 사용될 수 있다.
시그널 발생 수단은 핵산절단 효소(5'-뉴클레아제 및 3'-뉴클레아제)와 같이 시그널을 발생시키는 추가의 성분을 포함할 수 있다.
시그널 발생 수단은 이합체의 형성에 의존적인 방식으로 시그널을 발생시키는 것; 타겟 분석물질에 특이적으로 혼성화된 매개 올리고뉴클레오타이드(mediation oligonucleotide)의 절단에 의존적인 방식으로 이합체가 형성되는 것을 이용하여 시그널을 발생시키는 것; 및 검출 올리고뉴클레오타이드(detectoin oligonucleotide)의 절단에 의하여 시그널을 발생시키는 것을 포함한다.
본원에서 사용된 용어 "시그널 증폭 반응"은 시그널 발생 수단에 의하여 발생되는 시그널을 증가 또는 감소시키는 반응을 의미한다.
일 구현예에 따르면, 시그널 증폭 반응은 타겟 분석물질의 존재에 의존적으로 시그널 발생 수단에 의하여 발생하는 시그널을 증가시키는(증폭시키는) 반응을 의미한다. 이러한 시그널 증폭 반응은 타겟 분석물질(예컨대, 타겟 핵산 분자)의 증폭을 동반하거나 동반하지 않을 수 있다. 구체적으로, 시그널 증폭 반응은 타겟 분석물질의 증폭을 동반하는 시그널의 증폭을 의미한다.
시그널 증폭 반응에 의해 수득되는 데이터 세트는 사이클 번호를 포함한다.
본원에서 사용된 용어 "사이클 번호" 또는 "사이클"은 조건의 변화를 수반한 복수의 측정에서 상기 조건의 변화 단위를 말한다. 예를 들어, 조건의 변화는 온도, 반응시간, 반응횟수, 농도, pH 및/또는 타겟 핵산 분자 서열의 복제 횟수의 변화를 포함한다. 따라서, 사이클은 온도, 시간 또는 반응 사이클, 단위 작동 사이클 또는 재현 사이클을 포함할 수 있다.
일예로, 기질의 농도에 따른 효소에 의한 기질 분해 능력을 분석하는 경우, 기질 농도를 달리하여 효소의 기질 분해 정도를 수차례 측정한다. 기질 농도의 증가가 조건의 변화에 해당할 수 있고, 증가 단위가 사이클에 해당할 수 있다.
다른 일예로, 등온 증폭(isothermal amplification)은 등온 조건하의 반응 시간 동안 수차례 샘플을 측정하게 하며, 반응 시간이 조건의 변화에 해당할 수 있고, 반응 시간의 단위가 사이클에 해당할 수 있다.
또 다른 일예로, 멜팅 분석 또는 혼성화 분석의 경우, 일정 범위의 온도 내에서 온도를 변화시키면서 시그널의 변화를 측정할 수 있으며, 온도가 조건의 변화에 해당할 수 있고, 온도 단위(예를 들어, 측정 온도)가 사이클에 해당할 수 있다.
구체적으로, 일련의 반응을 반복하거나 일정한 시간 간격으로 반응을 반복하는 경우, 용어 "사이클"은 상기 반복의 하나의 단위를 의미한다.
예를 들어, 중합효소 연쇄반응(PCR)에서, 하나의 사이클은 타겟 분자의 변성(denaturation), 타겟 분자와 프라이머 간의 어닐링(혼성화) 및 프라이머 연장을 포함하는 반응 단위를 의미한다. 상기 반응의 반복의 증가가 조건의 변화에 해당할 수 있고, 상기 반복의 단위가 사이클에 해당할 수 있다.
시그널 증폭 반응에 의해 수득된 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호 및 상기 사이클 번호에서의 시그널 값을 갖는다.
본원에서 사용된 용어 "시그널 값"은 시그널 발생 과정의 각 사이클에서 실제적으로 측정된 시그널 값(예컨대, 시그널 증폭 반응에 의해 가공된 형광 세기의 실제값) 또는 이들의 변형값을 의미한다. 상기 변형은 측정된 시그널 값(예컨대, 세기)의 수학적으로 가공된 값을 포함할 수 있다. 실제 측정된 시그널 값(즉, 원시 데이터 세트의 시그널 값)의 수학적으로 가공된 값의 예는 측정된 시그널 값에 선택된 상수를 더하거나, 측정된 시그널 값으로부터 선택된 상수를 빼거나, 측정된 시그널 값에 선택된 상수를 곱하거나, 또는 측정된 시그널 값을 선택된 상수로 나누어 수득된 값; 측정된 시그널 값의 로그값; 또는 측정된 시그널 값의 미분값을 포함할 수 있으나, 이에 제한되지 않는다. 본원에서 사용된 용어 "시그널"은 용어 "시그널 값"을 포괄하는 것으로 의도되며 따라서 상기 두 용어는 상호교환적으로 사용될 수 있다.
본원에서 사용된 시그널 값은 검출기에서 사이클 번호에서 초기에 검출된 시그널의 크기를 절대적 또는 상대적으로 정량화하여 수득된 값을 의미한다. 상기 시그널 값은 1차 변화값 또는 2차 변화값과 구별하기 위해 "0차 시그널 값", "원시(raw) 시그널 값" 또는 "원래의(original) 시그널 값"으로도 불린다. 상기 시그널 값의 단위는 이용된 시그널 발생 반응의 유형에 따라 달라질 수 있다. 예를 들어, 실시간 PCR 증폭 반응에 의해 각 사이클에서 시그널 값을 수득하는 경우, 상기 시그널 값은 RFU(Relative Fluorescence Unit)로 표시될 수 있다.
본원에서 사용된 용어 "데이터 지점(data point)"은 사이클 번호 및 상기 사이클 번호에서의 시그널 값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 용어 "데이터"는 데이터 세트를 구성하는 모든 정보를 의미한다. 예컨대, 사이클 번호 및 시그널 값 각각은 데이터이다.
시그널 발생 반응, 특히 시그널 증폭 반응에 의해 얻어진 데이터 지점은 2차원 직교 좌표계에서 좌표값으로 표시될 수 있다. 상기 좌표값에서 X-축은 사이클 번호를 나타내며, Y-축은 사이클 번호에서 측정되거나 가공된 시그널 값을 나타낸다.
본원에서 사용된 용어 "데이터 세트"는 데이터 지점들의 집합을 의미한다. 예를 들어, 데이터 세트는 시그널 발생 수단의 존재 하에서 실시된 시그널 증폭 반응에 의해 직접 수득된 데이터 지점의 집합이거나 원래의 데이터 세트로부터 변형된 데이터 지점의 집합일 수 있다. 상기 데이터 세트는 시그널 증폭 반응에 의해 수득된 복수의 데이터 지점들 또는 이의 변형된 데이터 지점들의 전부 또는 일부일 수 있다.
데이터 세트는 플롯팅되어 증폭 곡선을 생성할 수 있다.
본원에서 사용된 용어 "증폭 곡선"은 시그널 증폭 반응에 의해 얻은 곡선을 의미한다. 증폭 곡선은 샘플 내에 분석물질이 존재하는 경우에 수득되는 곡선, 또는 샘플 내에 분석물질이 존재하지 않은 경우에 수득되는 곡선(또는 선)을 포함한다.
일 구현예에 따르면, 본 발명에서 이용되는 데이터 세트는 수학적 가공을 거치지 않은 원시 데이터 세트(raw dataset)이다. 또 다른 구현예에 따르면, 본 발명에서 이용되는 데이터 세트는 수학적으로 가공된 데이터 세트, 예를 들어 원시 데이터 세트에서 백그라운드 시그널을 제거하기 위하여 베이스라인이 차감된(baseline subtracted) 데이터 세트이다. 베이스라인 차감된 데이터 세트는 당업계에 공지된 다양한 방법(예컨대, 미국 특허 제8,560,247호)에 의해 얻을 수 있다.
일 구현예에 따르면, 본 발명의 방법은 단계 (a) 이전에 시그널 발생 반응(예컨대, 증폭 반응)을 실시하여 데이터 세트를 수득하는 단계를 추가적으로 포함한다.
본 발명의 한 가지 특징은 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트를 사용하는 것이다. 하나의 데이터 세트에서 비정상적인 시그널을 검출하는 종래의 기술들과 달리, 본 발명의 방법은 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하며, 이는 본 발명의 독특한 측면이다.
구체적으로, 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 둘 이상의 데이터 세트는 상이한 검출 온도에서의 검출에 의해 수득된 둘 이상의 데이터 세트, 상이한 시그널 검출 수단을 사용한 검출에 의해 수득된 둘 이상의 데이터 세트, 및 이의 조합으로부터 선택될 수 있다.
둘 이상의 데이터 세트는 실질적으로 동시에 발생한 데이터 세트, 예를 들어 단일 반응 용기에서 동시에 시작하고 끝나는 반응 동안 발생한 데이터 세트를 지칭한다.
상이한 검출 온도에서의 검출에 의해 수득된 데이터 세트는, 예를 들어, 단일 반응 용기에서 단일 시그널 발생 수단을 사용한 시그널 증폭 반응 동안 상이한 검출 온도에서(예컨대, 각 사이클 번호에서 최소 2개의 검출 온도에서) 시그널 값의 변화를 검출함으로써 수득된 데이터 세트를 의미한다. 예를 들어, 둘 이상의 데이터 세트는 본 발명자에 의해 개발된 MuDT1 기술(WO 2015/147412) 또는 MuDT2 기술(WO 2016/093619)에 따라 상이한 검출 온도에서의 검출에 의해 시그널 증폭 반응으로부터 수득될 수 있다.
상이한 시그널 검출 수단을 사용하여 수득된 데이터 세트는, 예를 들어, 시그널 증폭 반응에서의 상이한 검출 수단(예컨대, 광학 모듈)을 사용하여 시그널 값의 변화를 검출함으로써 수득된 데이터 세트를 의미한다. 예를 들어, 둘 이상의 타겟 핵산 서열의 검출을 위해 둘 이상의 시그널 발생 수단(예컨대, 형광 표지)을 사용한 멀티플렉스 실시간 PCR에서, 데이터 세트는 상이한 광학 모듈을 함유하는 적절한 채널을 사용하여 상이한 시그널 발생 수단으로부터의 시그널들을 검출함으로써 수득될 수 있다. 또한, 본 발명에서 사용되는 둘 이상의 데이터 세트는 전술한 데이터 세트의 조합일 수 있다. 예를 들어, 제1 데이터 세트는 시그널 발생 수단 "A"를 사용하여 상대적 고온 검출 온도에서 수득된 데이터 세트일 수 있고; 제2 데이터 세트는 시그널 발생 수단 "A"를 사용하여 상대적 저온 검출 온도에서 수득된 데이터 세트이며; 제3 데이터 세트는 시그널 발생 수단 "B"를 사용하여 상대적 고온 검출 온도에서 수득된 데이터 세트이고; 제4 데이터 세트는 시그널 발생 수단 "B"를 사용하여 상대적 저온 검출 온도에서 수득된 데이터 세트일 수 있다.
단계 (b): 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값의 계산(120)
이후, 각 사이클 번호에서의 시그널 값을 사용하여 각각의 데이터 세트에 대해 각 사이클 번호에서 2차 변화값을 계산한다. 상기 단계 (b)에서 2차 변화값의 계산은 2개의 연속 사이클 번호에서의 2개의 시그널 값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 1차 변화값을 계산한 후, 2개의 연속 사이클 번호에서의 2개의 1차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값을 계산함으로써 실시된다.
본 단계에서, "1차 변화값 데이터 세트"(사이클 번호 및 상기 사이클 번호에서의 1차 변화값을 갖는 다수의 데이터 지점을 포함함) 및 "2차 변화값 데이터 세트"(사이클 번호 및 상기 사이클 번호에서의 2차 변화값을 갖는 다수의 데이터 지점을 포함함)는 원시 데이터 세트(사이클 번호 및 상기 사이클 번호에서의 시그널 값을 갖는 다수의 데이터 지점을 포함함) 또는 이의 변형된 데이터 세트로부터 수득된다.
본원에서 사용된 용어 "시그널 값"은 1차 변화값 또는 2차 변화값과 구별하기 위해 "0차 시그널 값", "원시(raw) 시그널 값" 또는 "원래의(original) 시그널 값"으로도 불린다.
본원에서 각 사이클 번호에서의 시그널 값과 관련하여 사용된 용어 "변화", "변화값", 또는 "변화의 값"은 특정 사이클 번호에서의 시그널 값의 변화의 양(정도)을 의미한다. 본원에서 사용된 "n차 변화값"은 특정 사이클 번호에서의 n-1차 변화값의 변화의 양(정도)를 의미한다. 특히, 0차 변화는 원시 시그널 값을 의미한다. 용어 "변화값"은 용어 "변화율"과 상호교환적으로 사용될 수 있다.
본 단계에서, 각 사이클 번호에서의 2차 변화값은 각 사이클 번호에서의 시그널 값을 사용하여 수득된다. 상기 2차 변화값은 2개의 연속(바로 인접한) 사이클 번호에서의 2개의 시그널 값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서의 1차 변화값을 계산한 후, 2개의 연속(바로 인접한) 사이클 번호에서의 2개의 1차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서의 2차 변화값을 계산함으로써 수득된다.
상기 변화값은 차분(difference), 계차(difference quotient) 및 미분(derivative)으로 이루어진 군으로부터 선택된 어느 하나일 수 있고, 따라서 n차 변화값(예를 들어, 1차 변화값 및 2차 변화값)은 n차 차분, n차 계차 또는 n차 미분일 수 있다.
변화값, 특히 차분(차분값), 계차(계차값) 및 미분(미분값)은 당업계에 알려진 많은 방법에 의해 계산되거나 수득될 수 있다.
예를 들어, 본원에 사용된 차분은 2개의 바로 인접한 사이클 번호에서의 시그널 값의 차이(difference)를 계산함으로써 수득될 수 있다. 본원에 사용된 계차는 상기 차분을 2개의 바로 인접한 사이클 번호 간의 간격으로 나눔으로써 수득될 있다. 본원에 사용된 미분은 2, 3, 4, 또는 그 이상의 데이터 지점에서의 시그널 값에 최소 자승법을 적용하거나, 증폭 곡선 내의 각 사이클 번호에서 접선(기울기)을 결정함으로써 수득될 수 있다.
본원에서 어느 특정 사이클 번호에 대해 사용된 용어 "바로 인접한 사이클"은 상기 특정 사이클에 연속하는 사이클 번호, 즉 상기 특정 사이클의 바로 이전(앞) 또는 바로 이후(뒤)의 사이클 번호를 의미한다. 예를 들어, 사이클 번호가 1씩 증가하는 전형적인 데이터 세트에서, 4번째 사이클 번호에 바로 인접한 사이클 번호는 3번째 사이클 또는 5번째 사이클이다.
또한, 본원에서 사용된 용어 "2개의 바로 인접한 사이클 번호", "바로 인접한 2개의 사이클 번호", 또는 "연속 사이클 번호"는 서로 바로 인접한 2개의 사이클 번호, 즉 2개의 연속 사이클 번호를 의미한다. 예를 들어, 사이클 번호가 1씩 증가하는 전형적인 데이터 세트에서, 2개의 바로 인접한 사이클 번호는 사이클 x 및 x+1 또는 사이클 x-1 및 x를 의미한다.
2차 변화값을 계산하는데 사용되는 기호 yi(x), Di(x), D'i(x) 및 D"i(x)는 하기 의미를 갖는다:
기호 yi(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 시그널 값을 의미하며; D'i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 1차 변화값을 의미하고; D"i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 2차 변화값을 의미한다. 상기 정의에서 i 및 x는 각각 1 이상의 정수이다. 특히, 정수 i는 복수의 데이터 세트 중 특정 데이터 세트를 가리키기 위해 본원에서 사용된다. 예를 들어, 단계 (a)에서 3개의 데이터 세트가 수득된 경우, 각각의 데이터 세트는 1번째 데이터 세트, 2번째 데이터 세트 및 3번째 데이터 세트와 같은 표시를 사용하여 구별될 수 있다. 마찬가지로, 정수 x는 데이터 세트에서 특정 사이클 번호를 가리키기 위해 본원에서 사용된다. 예를 들어, 수득된 데이터 세트가 45 사이클 번호로 구성된 경우, 각 사이클 번호는 1번째 사이클 번호(사이클 번호 1), 2번째 사이클 번호(사이클 번호 2)... 45번째 사이클 번호(사이클 번호 45)와 같은 표시에 의해 구별될 수 있다.
본원에서 사용된 2차 변화값은 2차 차분, 2차 계차 또는 2차 미분일 수 있다.
상기 2차 차분은 2개의 바로 인접한 사이클 번호에서의 2개의 시그널 값을 사용하여 각 사이클 번호에서의 1차 차분(사이클 번호 및 상기 사이클 번호에서의 1차 차분을 갖는 다수의 데이터 지점을 포함함)을 계산한 후, 2개의 바로 인접한 사이클 번호에서의 2개의 1차 차분을 사용하여 각 사이클 번호에서의 2차 차분(사이클 번호 및 상기 사이클 번호에서의 2차 차분을 갖는 다수의 데이터 지점을 포함함)을 계산함으로써 수득될 수 있다.
본원에서 사용된 2차 차분은 당업계에 공지된 다양한 방식으로 계산될 수 있다.
일 구현예에서, 2차 차분(또는 2차 계차)는 전향 차분법(forward difference method) 또는 후향 차분법(backward difference method)에 의해 계산될 수 있다.
전향 차분법에 따르면, 2차 차분은 하기 수학식 III를 순차적으로 사용하거나, 또는 하기 수학식 III을 단독으로 사용하여 계산될 수 있다.
수학식 I
D'i(x) = yi(x+1) - yi(x)
수학식 II
D"i(x) = D'i(x+1) - D'i(x)
수학식 III
D"i(x) = yi(x+2) - 2 * yi(x+1) + yi(x)
후향 차분법에 따르면, 2차 차분은 하기 수학식 IV V를 순차적으로 사용하거나, 또는 하기 수학식 VI을 단독으로 이용하여 계산될 수 있다.
수학식 IV
D'i(x) = yi(x) - yi(x-1)
수학식 V
D"i(x) = D'i(x) - D'i(x-1)
수학식 VI
D"i(x) = yi(x) - 2 * yi(x-1) + yi(x-2)
예를 들어, 전향 차분법의 경우, y1(1), y1(2), y1(3), y1(4) 및 y1(5)가 각각 1, 8, 30, 100 및 500이면, D'1(1), D'1(2), D'1(3) 및 D'1(4)는 각각 7(=8-1), 22(=30-8), 70(=100-30) 및 400(-500-100)이고, D"1(1), D"1(2) 및 D"1(3)은 각각 15(=22-7), 48(=70-22) 및 330(=400-70)인 반면; 후향 차분법의 경우, y1(1), y1(2), y1(3), y1(4) 및 y1(5)가 각각 1, 8, 30, 100 및 500이면, D'1(2), D'1(3), D'1(4) 및 D'1(5)는 각각 7(=8-1), 22(=30-8), 70(=100-30) 및 400(-500-100)이고, D"1(3), D"1(4) 및 D"1(5)은 각각 15(=22-7), 48(=70-22) 및 330(=400-70)일 것이다.
D'i(x)는 다른 수학식, 예컨대 D'i(x) = yi(x) - yi(x+1) 또는 D'i(x) = yi(x-1) - yi(x)에 의해 계산될 수 있고; D"i(x)는 다른 수학식 D"i(x) = D'i(x) - D'i(x+1), D"i(X) = yi(x) - 2 * yi(x+1) + yi(x+2), D"i(x) = D'i(x-1) - D'i(x), 또는 D"i(x) = yi(x-2) - 2 * yi(x-1) + yi(x)에 의해 계산될 수 있다.
전향 차분법에서, 최종 사이클 번호 및 최종 사이클 번호 바로 이전 사이클 번호는 계산된 D"i(x)를 갖지 않는다. 예를 들어, 시그널 증폭 반응을 45 사이클 번호까지 실시하는 경우, D"i(45) 및 D"i(44)는 46번째 사이클 번호 또는 47번째 사이클 번호에서의 시그널 값이 존재하지 않기 때문에 계산될 수 없다.
마찬가지로, 후향 차분법에서, 최초 사이클 번호 및 최초 사이클 번호 바로 이후 사이클 번호는 계산된 D"i(x)를 갖지 않는다. 예를 들어, 시그널 증폭 반응을 45 사이클 번호까지 실시하는 경우, D"i(1) 및 D"i(2)는 -1번?? 사이클 번호 또는 0번째 사이클 번호에서의 시그널 값이 존재하지 않기 때문에 계산될 수 없다.
이와 같이, yi(x), Di(x), D'i(x) 및 D"i(x)는 존재하지 않거나 정의될 수 없는 사이클 번호에 대해 계산되지 않는다.
전향 차분법 및 후향 차분법에 의해 수득된 결과는 사이클 번호에 대하여 상호변환가능하다는 점에 유의한다.
구체적으로, 전향 차분법에 의해 수득된 D"i(x)는 후향 차분법에 의해 수득된 D"i(x+2)와 동일하다. 예를 들어, 전향 차분법에 의해 수득된 1번째 사이클에서의 2차 차분은 후향 차분법에 의해 수득된 3번째 사이클에서의 2차 차분과 동일하다.
따라서, 이러한 상호변환가능성에 비추어, 당업자라면 전향 차분법에 의해 수득된 결과를 후향 차분법에 의해 수득된 결과로 쉽게 변환할 수 있고, 그 반대도 마찬가지이다.
후향 차분법에 의한 2차 차분의 계산이 본 출원의 실시예에 예시되어 있다. 하지만, 당업자는 후향 차분법 대신에 전향 차분법을 사용하고 후향 차분법과 동일한 결과를 얻기 위해 사이클 번호만을 변경할 수 있다. 대안적으로, 당업자라면 전향 차분법에 의해 2차 차분을 계산하고, 비정상적인 시그널을 나타내는 사이클을 확인한 다음, 상기 확인된 사이클 번호를 변경하여 비정상적인 시그널을 나타내는 사이클 번호를 확정할 수 있다.
단계 (c): 각 사이클에서의 정상 스코어의 계산(130)
이어, 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호(들)을 확인하기 위해, 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어를 계산한다.
본 단계에서는, 사이클 번호 및 상기 사이클 번호에서의 정상 스코어를 갖는 다수의 데이터 지점을 포함하는 "정상 스코어 데이터 세트"가 수득된다.
정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시된다.
본 방법에 따르면, 정상 스코어에 기초하여 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호(들)가 선택된다. 본 발명에 따르면, 작은 정상 스코어는 상기 정상 스코어를 갖는 사이클 번호가 비정상적인 시그널을 나타낼 가능성이 높다는 것을 가리킨다.
본원에서 사용된 바와 같이, 용어 "정상 스코어"(NS로 약칭됨)는 2개의 바로 인접한 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 2개의 인접한 사이클 번호에서의 2차 변화값의 크기 모두를 반영하는 수치 값을 의미한다. 정상 스코어는 시그널 증폭 반응에 의해 수득된 시그널의 정상의 정도(the extent of normality of signals)를 나타내는 수치 값일 수 있다. 예를 들어, 정상 스코어 1000을 갖는 특정 사이클 번호는 정상 시그널을 나타낼 가능성이 높은 반면, -2000의 정상 스코어를 갖는 또 다른 사이클 번호는 비정상적인 시그널을 나타낼 가능성이 높다.
x번째 사이클 번호에서의 정상 스코어를 계산하기 위하여 사용되는 바로 인접한 사이클은 x번째 사이클 번호의 바로 이전 또는 바로 이후의 사이클을 포함한다. 예를 들어, 사이클 번호가 1씩 증가하는 전형적인 데이터 세트에서, x번째 사이클 번호의 바로 인접한 사이클은 사이클 x+1 또는 사이클 x-1이다.
정상 스코어는 2개의 바로 인접한 사이클 번호에서의 2차 변화값 사이의 부호 변화를 나타내는 수학적 연산에 의해 수득된다. 전술한 바와 같이, 상기 2차 변화값은, 예를 들어 2차 차분, 2차 계차 또는 2차 미분일 수 있다.
본 발명의 일 구현예에 따르면, x번째 사이클 번호에서의 정상 스코어는 x번째 사이클 번호 및 x+1번째 사이클 번호에서의 2차 변화값 사이의 부호 변화를 나타내는 수학적 연산에 의해 계산된다.
본 발명의 또 다른 구현예에 따르면, x번째 사이클 번호에서의 정상 스코어는 x번째 사이클 번호에서의 2차 변화값 및 x-1번째 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 계산된다.
본원에서 사용된 부호 변화는 x번째 사이클 번호에서의 2차 변화값이 양의 부호(양의 값, +)를 갖고 x+1번째 또는 x-1번째 사이클 번호에서의 2차 변화값이 음의 부호(음의 값, -)를 갖는 경우를 가리킨다. 2차 변화값 사이의 부호 변화를 나타내는 수학적 연산은, x번째 사이클 번호에서의 2차 변화값이 양의 부호를 갖고 x+1번째 또는 x-1번째 사이클 번호에서의 2차 변화값이 음의 부호를 가질 때 음의 정상 스코어를 제공하고, x번째 사이클 번호에서의 2차 변화값 및 x+1번째 또는 x-1번째 사이클 번호에서의 2차 변화값 모두가 동일한 부호(예컨대, 모두 양의 값 또는 모두 음의 값)를 가질 때 양의 정상 스코어를 제공하는 임의의 연산이다.
본원에서 사용된 2차 변화값의 크기는 x번째 사이클 번호에서의 2차 변화값의 크기 및 x+1번째 또는 x-1번째 사이클 번호에서의 2차 변화값의 크기 모두의 조합을 가리킨다.
2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산의 예는 2차 변화값의 수학적 확대(예컨대, 곱셈) 및 2차 변화값의 수학적 비율(예컨대, 나눗셈) 등을 포함한다.
일 구현예에 따르면, 정상 스코어는 2개의 인접한 사이클 번호에서의 2차 변화값을 곱함으로써 계산된다. 2차 변화값의 곱셈은 2차 변화값 사이의 부호 변화 및 크기를 효과적으로 나타낼 수 있다.
보다 구체적으로, 정상 스코어는 하기 수학식 VII 또는 수학식 VIII에 의해 계산될 수 있다:
수학식 VII
NSi(x) = D"i(x) * D"i(x+1)
상기 식에서, NSi(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 정상 스코어를 나타내고; D"i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 2차 변화값을 나타내며; D"i(x+1)은 i번째 데이터 세트의 x+1번째 사이클 번호에서의 2차 변화값을 나타내고; i 및 x는 각각 1 이상의 정수이다.
수학식 VIII
NSi(x) = D"i(x) * D"i(x-1)
상기 식에서, NSi(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 정상 스코어를 나타내고; D"i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 2차 변화값을 나타내며; D"i(x-1)은 i번째 데이터 세트의 x-1번째 사이클 번호에서의 2차 변화값을 나타내고; i는 1 이상의 정수이고, x는 2 이상의 정수이다.
상기 수학식 VIIVIII에서, D"i(x-1), D"i(x) 및 D"i(x+1)은 각각 사이클 번호 x-1, x 및 x+1에서의 2차 차분을 가리킨다.
예를 들어, D"1(1), D"1(2), D"1(3) 및 D"1(4)가 각각 -100, 50, 350, -400인 경우, NS1(1), NS1(2) 및 NS1(3)은 수학식 VII의 경우 -5000(=-100*50), 17500(=50*350) 및 -14000(=350*-400)인 반면; NS1(2), NS1(3) 및 NS1(4)는 수학식 VIII의 경우 5000(=-100*50), 17500(=50*350) 및 -14000(=350*-400)일 것이다.
최종 사이클 번호에서의 정상 스코어는 수학식 VII을 사용하는 경우 계산될 수 없는 반면, 최초 사이클 번호에서의 정상 스코어는 수학식 VIII을 사용하는 경우 계산될 수 없음에 유의한다.
또한, 수학식 VII에 의해 수득된 정상 스코어 및 수학식 VIII에 의해 수득된 정상 스코어는 사이클 번호에 대해 일정한 상호변환가능성을 갖는다는 점에 유의한다.
구체적으로, 수학식 VII에 의해 수득된 NSi(x)는 수학식 VIII에 의해 수득된 NSi(x+1)과 동일하다. 예를 들어, 수학식 VII에 의해 수득된 4번째 사이클 번호에서의 정상 스코어는 수학식 VIII에 의해 수득된 5번째 사이클에서의 정상 스코어와 동일하다.
따라서, 이러한 상호변환가능성에 비추어, 당업자라면 수학식 VII에 의해 수득된 정상 스코어를 수학식 VIII에 의해 수득된 정상 스코어로 쉽게 변환할 수 있고, 그 반대도 마찬가지이다.
수학식 VII에 의한 정상 스코어의 계산이 본 출원의 실시예에 예시되어 있다. 하지만, 당업자는 수학식 VII 대신에 수학식 VIII을 사용하여 각 사이클 번호에서의 정상 스코어를 계산한 다음, 사이클 번호를 조정하여, 즉 상기 계산된 사이클 번호에서 1을 빼내, 수학식 VII과 동일한 결과를 얻을 수 있을 것이다
한편, 상기 수학식 VII 또는 수학식 VIII을 사용한 정상 스코어의 계산은 단계 (b)에서 언급된 전향 차분법 또는 후향 차분법을 사용한 2차 변화값의 계산과 다양하게 조합될 수 있다.
예를 들어, 전향 차분법을 사용한 2차 차분의 계산은 수학식 VII을 사용한 정상 스코어의 계산과 조합될 수 있거나; 전향 차분법을 사용한 2차 차분의 계산은 수학식 VIII을 사용한 정상 스코어의 계산과 조합될 수 있거나; 후향 차분법을 사용한 2차 차분의 계산은 수학식 VII을 사용한 정상 스코어의 계산과 조합될 수 있거나; 후향 차분법을 사용한 2차 차분의 계산은 수학식 VIII을 사용한 정상 스코어의 계산과 조합될 수 있다.
그러나, 전향 차분법 또는 후향 차분법 중 어느 하나와 수학식 VII 또는 수학식 VIII 중 어느 하나의 다양한 조합에서, 동일한 정상 스코어를 갖는 사이클 번호는 일정한 규칙성을 가지고 달라지질 것이며, 이에 따라 비정상적인 시그널을 나타내는 사이클 번호 역시 일정한 규칙성을 가지고 달라질 것임에 유의해야 한다.
예를 들어, 전향 차분법과 수학식 VII의 조합이 2번째 사이클에서 -63의 정상 스코어를 생성하는 경우, 전향 차분법과 수학식 VIII의 조합은 3번째 사이클에서 동일한 정상 스코어를 생성할 것이며, 후향 차분법과 수학식 VII의 조합은 4번째 사이클에서 동일한 정상 스코어를 생성할 것이고, 후향 차분법과 수학식 VIII의 조합은 5번째 사이클에서 동일한 정상 스코어를 생성할 것이다. 따라서, 비정상적인 시그널을 나타내는 사이클 번호는 정상 스코어의 계산 방법에 따라 달라질 수 있다.
일 구현예에 따르면, 정상 스코어의 계산은 모든 데이터 세트에 대해 동일한 방식으로 실시되며, 예를 들어 모든 데이터 세트는 2차 변화값 및 정상 스코어의 동일한 계산 방법에 적용된다.
본 발명자들은 후향 차분법과 수학식 VII의 조합에 의해 비정상적인 시그널을 나타내는 것으로 이론적으로 결정된 사이클 번호가 실제 데이터 세트의 육안 검사에서 비정상적인 시그널을 나타낸다는 것을 확인하였다. 이는 후향 차분법과 수학식 VII의 조합을 사용한 본 발명의 방법이 비정상적인 시그널을 나타내는 사이클 번호를 결정하는데 있어 매우 정확하고 효과적임을 입증한다. 하지만, 전술한 사이클 변경의 규칙을 고려할 때, 당업자라면 다른 조합을 사용할 수 있을 것이다. 예를 들어, 전향 차분법과 수학식 VII의 조합이 사용되는 경우, 결과에 사이클 번호 2를 더함으로써 비정상적인 시그널을 나타내는 사이클 번호를 조정할 수 있다. 따라서, 이러한 다양한 조합이 본 발명의 범위에 속한다는 것이 당업자에게 이해될 것이다.
후향 차분법과 수학식 VII의 조합에 의한 정상 스코어의 계산은 또한 본원 실시예에서 확인될 수 있다.
단계 (d): 비정상적인 시그널을 나타내는 사이클 번호의 결정(140)
최종적으로, 단계 (c)에서 각각의 데이터 세트에 대해 계산된 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정한다.
전술한 바와 같이, 사이클 번호에서의 정상 스코어는 사이클 번호에서의 시그널 값의 정상/비정상과 관련성이 높으며, 이는 특정 데이터 세트에서 비정상적인 시그널을 나타내는 사이클 번호(들)를 결정하는데 유용할 수 있다. 특히, 본 발명의 방법에 따르면, 둘 이상의 데이터 세트가 단계 (a)에서 수득되고, 각 사이클 번호는 둘 이상의 정상 스코어를 가질 것이고, 이러한 정상 스코어는 각 사이클 번호에서의 정상/비정상을 결정하는데 사용될 수 있다.
일 구현예에서, 계산된 정상 스코어 자체는 추가적인 처리 없이 비정상적인 시그널을 나타내는 사이클 번호를 결정하는데 직접 사용될 수 있다. 예를 들어, 음의 부호를 갖는 계산된 정상 스코어 중에서 최소 정상 스코어를 갖는 사이클 번호를 비정상적인 시그널을 나타내는 사이클 번호로 결정할 수 있다.
또 다른 구현에에서, 계산된 정상 스코어는 추가로 처리된 다음 비정상적인 시그널을 나타내는 사이클 번호를 결정하는데 사용될 수 있다.
상기 두 가지 구현예는 본원에서 각각 "개별 정상 스코어 접근법(직접 접근법)"과 "통합 정상 스코어 접근법(간접 접근법)"으로 지칭된다.
상기 두 가지 구현예가 하기에 더 상세히 설명될 것이다:
(i) 개별 정상 스코어 접근법(도 2; 200)
개별 정상 스코어 접근법에 따르면, 각각의 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호(들)는 정상 스코어 자체에 기초하여 결정될 수 있다.
개별 정상 스코어 접근법(200)은 도 2에 예시되어 있다(이 도면에서, 210, 220230은 각각 도 1에서의 110, 120130에 상응함). 도 2를 참조하면, 단계 (d)는 각 사이클 번호에서 계산된 정상 스코어에 기초하여 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 후보(들)로서 사이클 번호(들)를 선택하고(240), 모든 데이터 세트에서 선택된 사이클 번호(들)의 전부 또는 일부를 모든 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로서 결정함으로써 실시된다(250).
개별 정상 스코어 접근법은, 선택된 사이클(들)의 전부가 각각의 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 결정되는지 또는 선택된 사이클(들)의 일부가 각각의 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클로 결정되는지에 따라, "합집합(union) 방식" 또는 "교집합(intersection) 방식"으로 세분화될 수 있다.
이하, "합집합 방식" 또는 "교집합 방식"이 상세히 설명될 것이다.
(i-1) 합집합 방식
단계 (d)에서 비정상적인 시그널을 나타내는 사이클 번호의 결정은 일명 "합집합 방식"에 의해 실시될 수 있다.
상기 합집합 방식에 따르면, 각각의 데이터 세트에 대하여 특정 조건을 만족하는 사이클 번호(들)를 선택하고, 상기 선택된 사이클의 전부를 각각의 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 결정한다.
특정 조건을 만족하는 사이클 번호의 선택은 역치를 사용하여 또는 역치를 사용하지 않고 달성될 수 있다.
각각의 데이터 세트에 대해 선택된 사이클 번호는 (i) 역치(예컨대, 0 미만의 역치)보다 작은 정상 스코어를 갖는 사이클 번호; (ii) 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호; 또는 (iii) 음의 부호 및 최소 정상 스코어를 갖는 사이클 번호일 수 있다.
역치를 사용하는 본 발명의 제1 구현예에서, 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작은 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 전부를 모든 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
상기 제1 구현예에서, 제1 데이터 세트에 대해 역치보다 작은 정상 스코어를 갖는 사이클 번호로서 3번째 사이클 번호와 20번째 사이클 번호가 선택되고, 제2 데이터 세트에 대해 5번째 사이클 번호와 35번째 사이클 번호가 선택되는 경우, 3, 5, 20 및 35번째 사이클 번호가 모든 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다. 택일적으로, 제1 데이터 세트에 대하여 3번째 사이클 번호와 20번째 사이클 번호가 선택되고, 제2 데이터 세트에 대하여 3번째 사이클 번호와 40번째 사이클 번호가 선택되는 경우, 3, 20 및 40번째 사이클 번호가 모든 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다. 특정 데이터 세트의 경우, 역치보다 작은 정상 스코어를 갖는 사이클 번호가 존재하지 않을 수 있음에 유의한다.
역치를 사용하는 본 발명의 제2 구현예에서, 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 전부를 모든 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
상기 제2 구현예에서, 제1 데이터 세트에 대해 5번째 사이클 번호가 선택되고 제2 데이터 세트에 대해 20번째 사이클 번호가 선택되는 경우, 5 및 20번째 사이클이 모든 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다. 택일적으로, 제1 데이터 세트에 대하여 5번째 사이클 번호가 선택되고, 제2 데이터 세트에 대하여 선택된 사이클 번호가 없는 경우, 5번째 사이클 번호가 모든 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다. 특정 데이터 세트의 경우, 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호가 존재하지 않을 수 있음에 유의한다.
전술한 바와 같이, 실질적으로 작은 정상 스코어는 높은 비정상적인 시그널 가능성과 관련이 있다. 따라서, 비정상적인 시그널을 나타낼 가능성이 높은 사이클 번호(들), 즉 실질적으로 작은 정상 스코어를 갖는 사이클 번호(들)를 선택하기 위해, 본 단계에서는 역치가 사용된다.
정상 스코어에 적용될 역치는 0 미만의 값으로부터 선택될 수 있다. 역치는 경험적으로 또는 실험적으로 결정될 수 있다. 역치는 -100, -200, -300, -400, -500, -600, -700, -800, -900, -1000, -2000, -3000, 및 -4000(이들 숫자 사이의 모든 값 포함)의 RFU(상대적 형광 단위)일 수 있다.
역치를 사용하지 않는 본 발명의 제3 구현예에서, 단계 (d)는 각각의 데이터 세트에 대하여 음의 부호 및 최소 정상 스코어를 갖는 사이클 번호를 선택하고, 상기 선택된 사이클 번호의 전부를 각 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
상기 제3 구현예에서, 제1 데이터 세트에 대하여 최소 정상 스코어를 갖는 사이클 번호로서 8번째 사이클 번호가 선택되고, 제2 데이터 세트에 대하여 최소 정상 스코어를 갖는 사이클 번호로서 15번째 사이클 번호가 선택되는 경우, 8 및 15번째 사이클 번호가 모든 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다.
상기 3가지 구현예 중 어느 것에서, 정해진 기준을 만족하는 사이클 번호가 없는 경우 특정 데이터 세트에 대하여 사이클 번호가 선택되지 않을 수 있다. 예를 들어, 제1 데이터 세트에서 역치보다 작은 정상 스코어를 갖는 사이클 번호가 존재하지 않는 경우, 제1 데이터 세트에 대하여 사이클 번호가 선택되지 않는다.
상기 구현예 중 하나에 따라 임의의 데이터 세트에서 비정상적인 시그널이 검출되는 경우, 비정상적인 시그널을 나타내는 사이클 번호(들)는 보정되거나 무시될 수 있다. 택일적으로, 이러한 비정상적인 사이클 번호를 포함하는 데이터 세트, 또는 모든 데이터 세트는 재실험하도록 무효화될 수 있다.
(i-2) 교집합(intersection) 방식
단계 (d)에서의 비정상적인 시그널을 나타내는 사이클 번호의 결정은 일명 "교집합 방식"에 의해 실시될 수 있다.
상기 교집합 방식에 따르면, 각각의 데이터 세트에 대하여 특정 기준을 만족하는 사이클 번호(들)를 선택하고, 상기 선택된 사이클 번호의 일부를 각각의 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 결정한다.
각각의 데이터 세트에 대하여 선택되는 사이클 번호는, (i) 역치(예컨대, 0 미만의 역치)보다 작은 정상 스코어를 갖는 사이클 번호, (ii) 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호, 또는 (iii) 음의 부호 및 최소 정상 스코어를 갖는 사이클 번호일 수 있다.
역치를 사용하는 본 발명의 제1 구현예에서, 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작은 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 일부를 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
역치를 사용하는 본 발명의 제2 구현예에서, 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 일부를 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
역치를 사용하지 않는 본 발명의 제3 구현예에서, 단계 (d)는 각각의 데이터 세트에 대해 음의 부호 및 최소 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 일부를 각각의 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시된다.
전술한 바와 같은 모든 구현예에서, 각 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로 결정되는 선택된 사이클 번호의 일부는 모든 데이터 세트의 50% 이상에서 공통적으로 선택된 사이클 번호(들)일 수 있다.
교집합 방식에서, 사이클 번호의 공통성(commonality) 정도는 데이터 세트의 개수, 비정상적인 시그널의 선택의 엄격성 등과 같은 많은 인자에 따라 달라질 수 있다. 사이클 번호의 공통성은 예를 들어 데이터 세트의 총 수를 기준으로 50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과 또는 100%일 수 있다.
상기 구현예 중 어느 것에 따르면, 단계 (d)는 각각의 데이터 세트에 대하여 역치보다 작은 정상 스코어를 갖는 사이클 번호, 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호, 또는 음의 부호 및 최소 정상 스코어를 갖는 사이클 번호를 갖는 사이클 번호를 선택하고, 모든 데이터 세트에서 상기 선택된 사이클 번호의 공통성을 확인하고, 모든 데이터 세트의 50% 이상에서 공통적으로 선택된 사이클 번호(들)를 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정함으로써 실시된다.
예를 들어, 제1 데이터 세트에 대해 25번째 사이클 번호가 선택되고 제2 데이터 세트에 대해 25번째 사이클 번호가 선택되는 경우, 25번째 사이클 번호가 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정된다. 반면, 제1 데이터 세트에 대해 25번째 사이클 번호가 선택되고 제2 데이터 세트에 대해 42번째 사이클 번호가 선택되는 경우, 비정상적인 시그널을 나타내는 사이클 번호로 결정되는 사이클 번호는 존재하지 않는다.
본원에서 사용된 "모든 데이터 세트의 50% 이상에서 공통적으로 선택된 사이클 번호(들)"의 의미는 하기 설명으로부터 명확해질 것이다.
예를 들어, 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 2개의 데이터 세트의 경우, 상기 사이클 번호는 두 데이터 세트에서 공통적으로 선택된 사이클 번호(100%)이다. 단일 반응 용기에서의 시그널 증폭 반응에 의해 수득된 3개의 데이터 세트의 경우, 상기 사이클 번호는 2개의 데이터 세트에서 공통적으로 선택된 사이클 번호(66.7%) 또는 3개의 데이터 세트에서 공통적으로 선택된 사이클 번호(100%)이다. 단일 반응 용기에서 시그널 증폭 반응에 의해 수득된 4개의 데이터 세트의 경우, 상기 사이클 번호는 3개의 데이터 세트에서 공통적으로 선택된 사이클 번호(75%) 또는 4개의 데이터 세트에서 공통적으로 선택된 사이클 번호(100%)이다.
교집합 방식에서, 공통적으로 선택된 사이클 번호(들)를 결정할 때 허용 오차(허용가능한 오차)가 사용될 수 있다.
용어 "허용 오차"는 2개의 사이클 번호가 데이터 세트 간에 정확히 일치하지 않는 경우에도, 서로 공통되는 것으로 간주될 사이클 번호의 허용가능한 범위를 지칭한다.
본 발명자들은 상이한 검출 온도에서의 검출에 의해 수득된 2개의 데이터 세트의 경우, 상기 2개의 데이터 세트에서 비정상적인 시그널을 나타내는 사이클 번호가 1 또는 2 사이클 번호의 약간의 변화를 나타낼 수 있음을 발견하였다. 예를 들어, 본 발명자에 의해 개발된 MuDT1 기술(WO 2015/147412)에 의해 수행되는 경우, 상대적 저온 검출 온도(예를 들어, 60℃)에서의 검출에 의해 수득된 데이터 세트는 사이클 번호 10에서 비정상적인 시그널을 나타낼 수 있는 반면; 상대적 고온 검출 온도(예를 들어, 72℃)에서의 검출에 의해 수득된 또 다른 데이터 세트는 사이클 번호 9 또는 8에서 비정상적인 시그널을 나타낼 수 있다.
이러한 사이클 번호의 변화를 고려하여, 사이클 번호에 대한 허용 오차가 사용된다. 허용 오차를 사용할 때, 2개의 데이터 세트(예컨대, 상이한 검출 온도에서의 검출에 의해 수득된 2개의 데이터 세트)에 대해 선택된 2개의 사이클 번호는, 이들이 허용 오차 이내인 한, 2개의 데이터 세트 사이에 공통적인 것으로 간주될 수 있다. 오차 범위는 ±2 사이클 번호 이내 또는 ±1 사이클 이내일 수 있다. 예를 들어, 상대적 저온 검출 온도에서의 검출에 의해 수득된 데이터 세트에 대해 10번째 사이클 번호(예컨대, 최소 정상 스코어를 갖는 사이클 번호)가 선택되고, 상대적 고온 검출 온도에서의 검출에 의해 수득된 또 다른 데이터 세트에 대해 9번째 사이클 번호(예컨대, 최소 정상 스코어를 갖는 사이클 번호)가 선택되는 경우, 상기 10번째 사이클 번호 또는 9번째 사이클 번호는 2개의 데이터 세트에서 공통적으로 선택된 것으로 간주될 수 있다.
비정상적인 시그널을 나타내는 사이클이 교집합 방식에 의해 결정되는 경우, 비정상적인 시그널을 함유하는 데이터 세트만이 보정될 수 있거나, 비정상적인 시그널을 함유하는 데이터 세트뿐만 아니라 비정상적인 시그널을 함유하지 않는 데이터 세트가 보정될 수 있다. 택일적으로, 비정상적인 시그널을 함유하는 데이터 세트만, 또는 사용된 모든 데이터 세트를 무효화하거나 재실험할 수 있다. 데이터 세트의 보정, 무효화 또는 재실험은 당업계에 알려진 다양한 방법에 의해 수행될 수 있다.
(ii) 통합 정상 스코어 접근법(도 3, 300)
단계 (d)에서의 비정상적인 시그널을 나타내는 사이클 번호의 결정은 전술한 정상 스코어로부터 유래된 새로운 파라미터인 총 순위 스코어(TRS)를 사용하여 실시할 수 있다.
통합 정상 스코어 접근법은 "이상치(outlier) 검출 접근법"으로도 불린다.
통합 정상 스코어 접근법(300)은 도 3에 예시되어 있다(이 도면에서, 310, 320330은 각각 도 1의 110, 120130에 상응함).
도 3을 참조하면, 단계 (d)는 하기와 같이 실시된다:
(d-1) 정상 스코어의 크기에 따라 각 데이터 세트의 각 사이클 번호에 순위 스코어(ranking score; RS)를 부여하는 단계(340);
(d-2) 각 데이터 세트의 동일한 사이클 번호에 부여된 순위 스코어를 합하거나 곱하여 각 사이클 번호에서의 총 순위 스코어(total ranking score; TRS)를 수득하는 단계(350);
(d-3) 총 순위 스코어 중에서 이상치(들)를 확인하는 단계(360); 및
(d-4) 상기 이상치(들)의 사이클 번호(들)를 비정상적인 시그널을 나타내는 사이클로 결정하는 단계(370).
통합 정상 스코어 접근법의 하위단계가 하기에 상세히 설명된다:
(d-1) 순위 스코어(RS)의 부여(340)
본 하위단계에서, 정상 스코어의 크기에 따라 각 데이터 세트의 각 사이클 번호에 순위 스코어(RS)를 부여한다(340).
하위단계 (d-1)에서, 순위 스코어는 다양한 방식으로 각 데이터 세트의 각 사이클 번호에 부여될 수 있다.
순위 스코어를 부여하는 제1 구현예에서, 하위단계 (d-1)은 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여함으로써 실시된다.
제1 구현예에 따르면, 단계 (c)에서의 모든 사이클 번호에서 계산된 모든 정상 스코어를 오름차순으로 배열하고, 상대적으로 작은 정상 스코어를 갖는 사이클 번호에 상대적으로 작은 순위 스코어를 부여하고 상대적으로 큰 정상 스코어를 갖는 사이클 번호에 상대적으로 큰 순위 스코어를 부여할 수 있다. 구체적으로, 데이터 세트가 총 45 사이클 번호로 구성되고 순위 스코어가 "1"부터 시작하여 "1"의 간격으로 부여되는 경우, 가장 작은 순위 스코어 "1"은 가장 작은 정상 스코어를 갖는 사이클 번호에 부여될 수 있고, 다른 순위 스코어, 예컨대, 2, 3, 4, 5...는 그 크기에 따라 다른 사이클 번호에 순차적으로 부여될 수 있다. 예를 들어, 사이클 번호 1, 2, 3, 및 4에서 각각 정상 스코어 -500, 200, 2000 및 -3500이 계산된 경우, 상기 정상 스코어를 오름차순으로, 예컨대 -3500(4번째 사이클 번호), -500(1번째 사이클 번호), 200(2번째 사이클 번호) 및 2000(3번째 사이클 번호)의 순서로 배열한 다음, 사이클 번호 4, 1, 2 및 3에 그 크기를 기준으로 각각 순위 스코어 1, 2, 3, 및 4가 주어질 것이다. 특히 총 45 사이클 번호로 구성된 데이터 세트에 대하여, 수학식 VII를 사용하여 정상 스코어를 계산할 때, 1 내지 43의 순위 스코어만이 부여될 수 있는 반면(즉, 순위 스코어 44 및 45는 존재하지 않음); 수학식 VIII을 사용하여 정상 스코어를 계산할 때, 1 내지 42만이 부여되는(즉, 순위 스코어 43, 44 및 45는 존재하지 않음) 것에 유의한다.
순위 스코어를 부여하는 제2 구현예에서, 하위단계 (d-1)은 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여함으로써 실시된다.
제2 구현예에 따르면, 단계 (c)에서의 모든 사이클 번호에서 계산된 모든 정상 스코어를 그 크기에 따라 내림차순으로 배열하고, 상대적으로 작은 정상 스코어를 갖는 사이클 번호에 상대적으로 큰 순위 스코어를 부여하고 상대적으로 큰 정상 스코어를 갖는 사이클 번호에 상대적으로 작은 순위 스코어를 부여할 수 있다. 구체적으로, 데이터 세트가 총 45 사이클 번호로 구성되고 순위 스코어가 "1"부터 시작하여 "1"의 간격으로 부여되는 경우, 가장 작은 순위 스코어 "1"은 가장 큰 정상 스코어를 갖는 사이클 번호에 부여될 수 있고, 다른 순위 스코어, 예컨대, 2, 3, 4, 5...는 그 크기에 따라 다른 사이클 번호에 순차적으로 부여될 수 있다. 예를 들어, 사이클 번호 1, 2, 3, 및 4에서 각각 정상 스코어 -500, 200, 2000 및 -3500이 계산된 경우, 상기 정상 스코어를 내림차순으로, 예컨대 2000(3번째 사이클 번호), 200(2번째 사이클 번호), -500(1번째 사이클 번호) 및 -3500(4번째 사이클 번호)의 순서로 배열한 다음, 사이클 번호 3, 2, 1 및 4에 그 크기를 기준으로 각각 순위 스코어 1, 2, 3, 및 4가 주어질 것이다. 특히 총 45 사이클 번호로 구성된 데이터 세트에 대하여, 수학식 VII를 사용하여 정상 스코어를 계산할 때, 1 내지 43의 순위 스코어만이 부여될 수 있는 반면(즉, 순위 스코어 44 및 45는 존재하지 않음); 수학식 VIII을 사용하여 정상 스코어를 계산할 때, 1 내지 42만이 부여되는(즉, 순위 스코어 43, 44 및 45는 존재하지 않음) 것에 유의한다.
통합 정상 스코어 접근법에 따르면, 순위 스코어는 규칙적인 방식으로 부여될 수 있다. 구체적으로, 순위 스코어는 규칙적인 간격으로 부여될 수 있다.
예를 들어, 가장 작은 정상 스코어(최소 정상 스코어)를 갖는 사이클 번호에 "1"의 순위 스코어가 먼저 부여된 다음, 그 정상 스코어를 기준으로 다른 사이클 번호에 공차(common difference)를 갖는 순위 스코어(예컨대, 2, 3, 4...)가 부여된다. 상기 공차는 다양한 값이다. 또한, 가장 작은 스코어를 갖는 사이클 번호에 "300"의 순위 스코어가 먼저 부여된 다음, 다른 사이클 번호에 공차(예컨대, 500, 700, 900)을 갖는 순위 스코어가 연속적으로 부여된다. 스코어링 시스템은 사용자에 따라 달라질 수 있다.
(d-2) 총 순위 스코어(TRS)의 수득(350)
본 하위단계에서, 각 데이터 세트의 동일한 사이클 번호에 부여된 순위 스코어를 합하거나 곱하여 각 사이클 번호에서의 총 순위 스코어(total ranking score; TRS)를 수득한다(350).
각 사이클 번호에서의 총 순위 스코어(TRS)는 하위단계 (d-2)에서 각 데이터 세트에 대해 동일한 사이클 번호에 부여된 순위 스코어의 덧셈 또는 곱셈을 포함하는 수학적 연산에 의해 계산될 수 있다. 상기 수학적 연산은 순위 스코어의 덧셈 또는 뺄셈을 포함하는 임의의 수학식에 의해 달성될 수 있다.
본 발명의 일 구현예에 따르면, 하위단계 (d-2)에서 총 순위 스코어는 각 데이터 세트의 동일한 사이클 번호에 부여된 순위 스코어를 합하여 수득된다.
구체적으로, 단계 (a)에서 4개의 데이터 세트가 수득되는 경우, 1번째 사이클 번호의 총 순위 스코어는 4개의 데이터 세트의 1번째 사이클 번호에서의 4개의 순위 스코어 모두를 합함으로써 수득될 수 있다. 예를 들어, 1번째 데이터 세트가 1, 2, 3 및 4의 사이클 번호에서 19, 27, 3 및 10의 순위 스코어를 갖고, 2번째 데이터 세트가 1, 2, 3 및 4의 사이클 번호에서 40, 16, 1 및 30의 순위 스코어를 가지며, 3번째 데이터 세트가 1, 2, 3 및 4의 사이클 번호에서 21, 10, 2 및 8의 순위 스코어를 가지는 경우, 1, 2, 3 및 4의 사이클 번호에서의 총 순위 스코어는 각각 80(=19+40+21), 53(=7+16+10), 6(=3+1+2) 및 19(=10+1+8)일 것이다.
"순위 스코어"는 하나의 데이터 세트에 대해 각 사이클 번호의 정상/비정상에 관한 단편적인 정보를 제공하는 반면, "총 순위 스코어"는 전체 데이터 세트에 대해 각 사이클 번호의 정상/비정상에 관한 종합적인 정보를 제공한다. 따라서, 후자는 비정상적인 시그널을 분석하는데 더 유용할 수 있다.
(d-3) 이상치(들)의 확인(360)
본 하위단계에서, 총 순위 스코어 중에서 이상치(들)를 확인한다(360).
본원에서 사용된 용어 "이상치(outlier)"는 총 순위 스코어의 나머지로부터 수치적으로 떨어진(상당히 많이 벗어난) 총 순위 스코어를 의미한다. 용어 "이상치"는 또한 총 순위 스코어의 집합에서 다른 모든 총 순위 스코어와 유의하게 다른 총 순위 스코어를 의미한다.
이상치는 당업계에 공지된 많은 이상치 검출 방법에 의해 확인될 수 있다.
예시적인 이상치 검출 방법은 하기와 같다.
이상치 검출 방법은 이 분야에서 초기 연구에서 제안된 단변량(univariate) 방법, 및 일반적으로 현재의 연구 대부분을 이루는 다변량(multivariate) 방법으로 구분될 수 있다. 이상치 검출 방법의 또 다른 근본적인 분류학은 파라메트릭(통계학적) 방법 및 모델이 없는 비파라메트릭 방법이다(예컨대, Williams et al., "A Comparative Study of RNN for Outlier Detection in Data Mining," IEEE International Conference on Data-mining (ICDM'02), Maebashi City, Japan, CSIRO Technical Report CMIS-02/102, 2002 참고).
이상치 검출 방법의 다른 예는 표준 편차(SD) 방법, Z-스코어, 변형된 Z-스코어, 투키 방법(Tukey's method, boxplot), 조절된 박스플롯, MADe(median and Median Absolute Deviation) 방법 및 중앙값 규칙(median rule)을 포함한다.
일 구현예에 따르면, 이상치(들)는 단변량 방법 및 비파라메트릭 방법에 의해 확인될 수 있다. 본 발명자들은 단변량 방법 및 비파라메트릭 방법의 특정 구현예인 "갭 방식" 또는 "역치 방식"을 고려하였다. 상기 두 가지 방식은 하기에 상세히 설명될 것이다.
갭 방식(Gap mode)
갭 방식은 총 순위 스코어를 배열하고, '이상치 갭'을 확인한 다음, 상기 이상치 갭을 통해 비정상적인 시그널을 나타내는 사이클 번호를 찾는 접근법이다.
갭 방식의 일 구현예에서, 하위단계 (d-3)은 (i) 각 사이클 번호에서의 총 순위 스코어를 크기 순서로 배열하는 단계; (ii) 상기 배열에서 2개의 인접하는 총 순위 스코어 사이의 갭을 계산하는 단계; (iii) 상기 배열에서 이상치 갭을 확인하는 단계; 및 (iv) 상기 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 작은 총 순위 스코어보다 작거나 동일한 총 순위 스코어를 이상치(들)로서 결정하거나, 상기 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 큰 총 순위 스코어보다 크거나 동일한 총 순위 스코어를 이상치(들)로서 결정하는 단계에 의해 실시된다.
첫째, 모든 사이클 번호에서의 총 순위 스코어를 크기 순으로 배열한다. 총 순위 스코어는 크기에 따라 오름차순 또는 내림차순으로 배열될 수 있다. 총 순위 스코어는 1차원적으로 배열될 수 있다. 이상치 갭은 상기 배열에서 2개의 인접하는 총 순위 스코어 사이의 거리에 의해 확인된다.
둘째, 상기 배열에서 2개의 인접하는 총 순위 스코어 사이의 갭을 계산한다. 본원에서 사용된 용어 "갭"은 배열에서 2개의 바로 인접한 총 순위 스코어 간의 구간, 또는 이의 크기를 의미한다. 특히, 갭은 본 발명의 갭 방식에 따른 배열에서 인접한 총 순위 스코어 사이의 간격 또는 거리 또는 크기를 의미한다. 갭은 2개의 인접하는 총 순위 스코어, 즉 상대적으로 큰 총 순위 스코어 및 상대적으로 작은 순위 스코어로 구성되며, 갭의 계산은 상대적으로 큰 총 순위 스코어에서 상대적으로 작은 순위 스코어를 뺌으로써 수행될 수 있다. 예를 들어, 배열에서 2개의 연속 총 순위 스코어 중 상대적으로 큰 순위 스코어 및 상대적으로 작은 순위 스코어가 각각 50 및 45인 경우, 계산된 갭은 5이다.
셋째, 상기 배열에서 이상치 갭을 확인한다. 본원에서 사용된 용어 "이상치 갭"은 나머지 갭보다 크기가 유의하게 큰 갭을 의미한다. 이상치 갭은 다양한 방식으로 확인될 수 있다.
이상치 갭은 (i) 가장 큰 크기를 갖는 갭; (ii) 가장 큰 크기를 갖는 갭 및 두 번째로 큰 크기를 갖는 갭 중 하나; 또는 (iii) 평균 갭 크기를 벗어나는 갭(들) 중 하나일 수 있다.
이상치 갭을 확인하기 위한 제1 구현예에서, 가장 큰 크기를 갖는 갭을 이상치 갭으로 확인한다. 예를 들어, 오름차순으로 총 순위 스코어 4, 46, 50, 58 및 72로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "46"까지의 구간(가장 큰 갭)이 이상치로서 확인될 수 있다.
이상치 갭을 확인하기 위한 제2 구현예에서, 가장 큰 크기를 갖는 갭 및 두 번째로 큰 크기를 갖는 갭 중 하나를 이상치 갭으로 확인한다. 예를 들어, 오름차순으로 총 순위 스코어 4, 46, 50, 58 및 72로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "46"까지의 구간(가장 큰 갭; 갭 크기 40) 또는 총 순위 스코어 "58"부터 총 순위 스코어 "72"까지의 구간(두 번째로 큰 갭; 갭 크기 14)이 이상치로서 확인될 수 있다.
상기 제2 구현예에서, 가장 큰 갭 또는 두 번째로 큰 갭은 하기와 같이 하위단계 (d-1)에서의 순위 스코어의 스코어링 시스템에 따라 이상치 갭으로서 확인된다:
(i) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하는 경우, 가장 큰 갭과 두 번째로 큰 갭 중에서, 배열에서 가장 작은 총 순위 스코어에 가까운 갭이 이상치로서 확인될 수 있다. 예를 들어, 총 순위 스코어 4, 46, 50, 58 및 72로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "46"까지의 구간(가장 큰 갭: 갭 크기 42)이 이상치로서 확인될 수 있는데, 가장 큰 갭이 두 번째로 큰 갭과 비교하여 가장 작은 총 순위 스코어 "4"에 가깝기 때문이다. 또 다른 예로서, 총 순위 스코어 4, 18, 23, 33 및 53으로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "18"까지의 구간(두 번째로 큰 갭: 갭 크기 14)이 이상치로서 확인될 수 있는데, 두 번째로 큰 갭이 가장 큰 갭과 비교하여 가장 작은 총 순위 스코어 "4"에 가깝기 때문이다.
(ii) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하는 경우, 가장 큰 갭과 두 번째로 큰 갭 중에서, 배열에서 가장 큰 총 순위 스코어에 가까운 갭이 이상치로서 확인될 수 있다. 예를 들어, 총 순위 스코어 6, 24, 29, 37 및 72로 구성된 배열에서, 총 순위 스코어 "37"부터 총 순위 스코어 "72"까지의 구간(가장 큰 갭)이 이상치로서 확인될 수 있는데, 가장 큰 갭이 두 번째로 큰 갭과 비교하여 가장 큰 총 순위 스코어 "72"에 가깝기 때문이다. 또 다른 예로서, 총 순위 스코어 6, 41, 48, 52 및 72으로 구성된 배열에서, 총 순위 스코어 "52"부터 총 순위 스코어 "72"까지의 구간(두 번째로 큰 갭)이 이상치로서 확인될 수 있는데, 두 번째로 큰 갭이 가장 큰 갭과 비교하여 가장 큰 총 순위 스코어 "72"에 가깝기 때문이다.
제3 구현예에서, 평균 갭 크기를 벗어나는 갭(들) 중 하나를 이상치 갭으로서 확인한다. 평균 갭 크기를 벗어나는 단일 갭이 존재하는 경우, 상기 단일 갭이 이상치 갭으로서 확인될 수 있다. 그러나, 평균 갭 크기를 벗어나는 다수의 갭이 존재하는 경우, 하기와 같이 하위단계 (d-1)에서 순위 스코어의 스코어링 시스템에 따라, 상기 다수의 갭 중에서 하나의 갭만이 이상치 갭으로서 확인될 수 있다:
(i) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하는 경우, 평균 갭 크기를 벗어나는 다수의 갭 중에서, 배열에서 가장 작은 총 순위 스코어에 가까운 갭이 이상치로서 확인될 수 있다. 예를 들어, 총 순위 스코어 4, 46, 50, 58 및 72로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "46"까지의 구간이 이상치로서 확인될 수 있는데, 갭 크기 (42)만이 평균 갭 크기(17; =(42+4+8+14)/4)를 벗어나기 때문이다. 또 다른 예로서, 오름차순으로 총 순위 스코어 4, 18, 23, 33 및 53으로 구성된 배열에서, 총 순위 스코어 "4"부터 총 순위 스코어 "18"까지의 구간이 이상치로서 확인될 수 있는데, 평균 갭 크기(12.25; =(14+5+10+20)/4)을 벗어나는 다수의 갭(즉, 총 순위 스코어 "4"부터 총 순위 스코어 "18"까지의 하나의 구간 및 총 순위 스코어 "33"부터 총 순위 스코어 "53"까지의 또 다른 구간) 중에서, 총 순위 스코어 "4"부터 총 순위 스코어 "18"까지의 구간이 가장 작은 총 순위 스코어 "4"에 가깝기 때문이며;
(ii) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하는 경우, 평균 갭 크기를 벗어나는 다수의 갭 중에서, 배열에서 가장 큰 총 순위 스코어에 가까운 갭이 이상치로서 확인될 수 있다. 예를 들어, 오름차순으로 총 순위 스코어 10, 24, 29, 37 및 72로 구성된 배열에서, 총 순위 스코어 "37"부터 총 순위 스코어 "72"까지의 구간이 이상치로서 확인될 수 있는데, 갭 크기 (35)만이 평균 갭 크기(15.5; =(14+5+8+35)/4)를 벗어나기 때문이다. 또 다른 예로서, 총 순위 스코어 6, 41, 48, 52 및 72로 구성된 배열에서, 총 순위 스코어 "52"부터 총 순위 스코어 "72"까지의 구간이 이상치로서 확인될 수 있는데, 평균 갭 크기(16.5; =(35+7+4+20)/4)을 벗어나는 다수의 갭(즉, 총 순위 스코어 "6"부터 총 순위 스코어 "41"까지의 하나의 구간 및 총 순위 스코어 "52"부터 총 순위 스코어 "72"까지의 또 다른 구간) 중에서, 총 순위 스코어 "52"부터 총 순위 스코어 "72"까지의 구간이 가장 큰 총 순위 스코어 "72"에 가깝기 때문이다.
상기 구현예에서 평균 갭 크기만이 언급되었지만, 당업자는 평균 갭 크기 대신에 다양한 다른 기준이 사용될 수 있음을 이해할 것이다. 예를 들어, 평균 갭 크기 대신에 평균의 1, 2, 3, 4, 5, 또는 6 표준 편차가 사용될 수 있다. 특히, 평ㅅ균 갭 크기의 3 표준 편차(평균+3*S.D)를 벗어나는 갭(들) 중 하나가 이상치 갭으로서 확인될 수 있다.
일 구현예에서, 미리 결정된 크기보다 작은 크기를 갖는 갭이 이상치 갭에서 배제될 수 있다. 예를 들어, 가장 큰 갭을 이상치 갭으로 확인하는 방법에서, 가장 큰 갭이 미리 결정된 크기보다 작으면, 상기 갭은 이상치 갭이 아닌 것으로 간주될 수 있다.
한편, 배열에서 동일한 크기를 갖는 복수의 갭이 존재하는 경우, 둘 이상의 후보 갭 중 하나는 선택하는 방법이 이상치를 확인하는데 적용될 수 있다.
이상치 갭을 확인하는 또 다른 방법으로서, 갭의 크기를 갭의 상대적으로 작은 총 순위 스코어와 비교하고, 만약 상기 갭 크기가 상대적으로 작은 총 순위 스코어보다 크면, 상기 갭을 이상치 갭으로서 확인한다. 만약 다수의 갭이 존재하고, 이의 크기가 갭의 상대적으로 작은 총 순위 스코어보다 크면, 이들 중 하나가 이상치로서 확인될 수 있다.
전술한 구현예의 대안으로서, 전술한 구현예 중 어느 하나에 의해 확인된 이상치 갭은 갭의 위치에 따라 무시될 수 있다. 배열에서 특정 수의 총 순위 스코어 이내에서 확인된 갭은 비-이상치 갭으로서 간주될 수 있다. 구체적으로, 배열에서 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20의 총 순위 스코어 이내에서 확인된 갭은 비-이상치 갭으로서 간주될 수 있다. 예를 들어, 가장 큰 크기를 갖는 갭이 13번째 총 순위 스코어 내지 14번째 총 순위 스코어에 위치하는 경우에도, 상기 갭은 비-이상치 갭으로 간주될 수 있다. 상기 기준은 달라질 수 있다.
이상치 갭을 확인하기 위한 3개의 구현예에서, 참조 총 순위 스코어가 추가로 사용될 수 있다.
정상 시그널을 나타내는 사이클 번호만으로 구성된 데이터 세트의 경우에도, 배열에서 확인된 이상치 갭이 존재하며, 정상적인 시그널을 나타내는 사이클 번호는 비정상적인 시그널을 나타내는 사이클 번호로 잘못 결정될 수 있다. 따라서, 이러한 문제를 피하기 위해 참조 총 순위 스코어가 추가로 사용될 수 있다. 참조 총 순위 스코어의 사용은 배열에서 어느 한쪽 말단에 새로운 갭을 형성시키고 상기 새롭게 형성된 갭이 이상치 갭으로 확인되게 하여 정상적인 시그널을 나타내는 사이클 번호를 비정상적인 시그널을 나타내는 사이클 번호로 잘못 판단할 가능성을 감소시킨다.
참조 총 순위 스코어는 가상의 또는 상상의 값이다. 일 구현예에서, 참조 순위 스코어는 배열 내의 총 순위 스코어 전부보다 작은 추가의 총 순위 스코어이다. 일 구현예에서, 참조 총 순위 스코어는 배열 내의 총 순위 스코어 전부보다 큰 추가의 총 순위 스코어이다.
일 구현예에 따르면, 참조 총 순위 스코어는 하위단계 (d-1)에서의 순위 스코어의 스코어링 시스템에 따라, 배열 내의 총 순위 스코어 전부보다 작거나 크다.
일 구현예에 따르면, 참조 총 순위 스코어는 참조 총 순위 스코어를 사용하여 배열의 어느 한 쪽 말단에서 새롭게 형성될 갭이 정상 시그널을 나타내는 사이클 번호만으로 구성된 데이터 세트에서의 모든 갭 중에서 가장 크도록 선택된다.
일 구현예에 따르면, 참조 총 순위 스코어는 배열의 어느 한 쪽 말단에서 원하는 갭 크기를 얻도록 선택된다. 예를 들어, 최대 갭을 이상치(들)로 확인하는 일 구현예에서, 원하는 갭 크기는 모든 갭 중에서 가장 크거나 최대 갭보다 작도록 조정될 수 있다.
참조 총 순위 스코어는 상응하는 사이클 번호를 갖지 않는다. 따라서, 참조 총 순위 스코어가 이상치로서 결정되는 경우에도, 비정상 시그널을 나타내는 것으로 결정되는 사이클 번호는 존재하지 않는다. 참조 총 순위 스코어의 사용은 비정상 시그널을 나타내는 사이클 번호를 더 추가하는 것으로 의도되지 않는다.
참조 총 순위 스코어는 (i) 각 데이터 세트에 참조 순위 스코어를 추가로 부여하는 단계로서, 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어가 부여되는 경우, 상기 참조 순위 스코어는 하위단계 (d-1)에서 모든 사이클 번호에 부여된 모든 순위 스코어보다 작거나, 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어가 부여되는 경우, 상기 참조 순위 스코어는 하위단계 (d-1)에서 모든 사이클 번호에 부여된 모든 순위 스코어보다 크고; (ii) 모든 데이터 세트에 부여된 참조 순위 스코어를 합하는 단계에 의해 수득된다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하는 경우, 부여될 참조 순위 스코어는 모든 사이클 번호에 부여된 모든 순위 스코어보다 작을 수 있다. 특히, 참조 순위 스코어는 모든 사이클 번호에 부여된 모든 순위 스코어를 고려하여 규칙적인 간격으로 부여될 수 있다. 예를 들어, 순위 스코어가 스코어 1의 규칙적인 간격으로, 예컨대 1, 2, 3...으로 모든 사이클에 부여되는 경우, 참조 순위 스코어는 "0"일 수 있다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하는 경우, 부여될 참조 순위 스코어는 모든 사이클 번호에 부여된 모든 순위 스코어보다 클 수 있다. 특히, 참조 순위 스코어는 모든 사이클 번호에 부여된 모든 순위 스코어를 고려하여 규칙적인 간격으로 부여될 수 있다. 예를 들어, 순위 스코어가 스코어 1의 규칙적인 간격으로, 예컨대 1, 2, 3..., 41, 42 및 43으로 모든 사이클에 부여되는 경우, 참조 순위 스코어는 "44"일 수 있다.
모든 데이터 세트에 부여된 참조 순위 스코어를 합하여 참조 총 순위 스코어를 얻는다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하고 3개의 데이터 세트 각각에 참조 순위 스코어 "0"이 부여되는 경우, 참조 총 순위 스코어는 "0"(0+0+0)일 수 있다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하고 3개의 데이터 세트 각각에 참조 순위 스코어 "44"가 부여되는 경우, 참조 총 순위 스코어는 "132"(44+44+44)일 수 있다.
참조 총 순위 스코어는 총 순위 스코어의 배열에 삽입되거나 도입될 수 있고, 참조 총 순위 스코어를 포함하는 총 순위 스코어의 집합이 이상치 갭을 확인하는데 사용된다.
넷째, 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 작은 총 순위 스코어보다 작거나 동일한 총 순위 스코어를 이상치(들)로 결정하거나, 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 큰 총 순위 스코어보다 크거나 동일한 총 순위 스코어를 이상치(들)로 결정한다.
이상치로서 결정될 총 순위 스코어는 하기와 같이 하위단계 (d-1)에서의 순위 스코어의 스코어링 시스템에 따라 달라질 수 있다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하는 경우, 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 작은 총 순위 스코어보다 작거나 동일한 총 순위 스코어가 이상치(들)로서 결정된다. 예를 들어, 오름차순으로 배열된 4개의 총 순위 스코어 "a", "b", "c" 및 "d"(여기서, a<b<c<d)가 존재하고 이상치 갭이 "c"와 "d" 사이의 구간인 것으로 가정하면, 이상치 갭의 상대적으로 작은 총 순위 스코어 "c"보다 작거나 동일한 총 순위 스코어 "a", "b", 및 "c"가 이상치(들)로서 결정된다.
하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하는 경우, 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 큰 총 순위 스코어보다 크거나 동일한 총 순위 스코어가 이상치(들)로서 결정된다. 예를 들어, 오름차순으로 배열된 4개의 총 순위 스코어 "a", "b", "c" 및 "d"(여기서, a<b<c<d)가 존재하고 이상치 갭이 "c"와 "d" 사이의 구간인 것으로 가정하면, 이상치 갭의 상대적으로 큰 총 순위 스코어 "d"보다 크거나 동일한 총 순위 스코어 "d"가 이상치(들)로서 결정된다.
택일적으로, 이상치(들)는 "역치 방식"에 의해 확인될 수 있다.
역치 방식(Threshold mode)
이상치를 확인하기 위한 단계 (d-3)은 정해진 역치를 사용하여 실시될 수 있다.
역치 방식에 따르면, 하위단계 (d-3)은 총 순위 스코어에 역치를 적용하고, 상기 역치보다 작은 총 순위 스코어를 이상치(들)로서 결정하거나 상기 역치보다 큰 총 순위 스코어를 이상치(들)로서 결정함으로써 실시될 수 있다.
이상치의 확인은 하기와 같이 하위단계 (d-1)에서의 순위 스코어의 스코어링 시스템에 따라 달라질 수 있다.
(i) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여하는 경우, 하위단계 (d-3)은 역치보다 작은 총 순위 스코어를 이상치(들)로서 결정함으로써 실시된다.
(ii) 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하는 경우, 하위단계 (d-3)은 역치보다 큰 총 순위 스코어를 이상치(들)로서 결정함으로써 실시된다.
총 순위 스코어에 적용될 역치는 적합하게 선택될 수 있다. 역치는 검출기에 의해 자동으로 결정되거나 작업자에 의해 직접 결정될 수 있다.
일 구현예에 따르면, 갭 방식과 역치 방식의 조합이 이상치(들)를 결정하는데 사용될 수 있다.
(d-4) 비정상적인 시그널을 나타내는 사이클의 결정
본 하위단계에서, 단계 (d-3)에서 확인된 이상치의 사이클 번호(들)를 비정상적인 시그널을 나타내는 사이클 번호로 결정한다.
참조 총 순위 스코어를 제외한 모든 총 순위 스코어는 상응하는 사이클 번호를 가지므로, 하위단계 (d-3)에서 확인된 이상치는 비정상적인 시그널을 나타내는 사이클 번호로 쉽게 변환될 수 있다.
예를 들어, 4개의 총 순위 스코어 5, 30, 36 및 41(각각 사이클 번호 3, 15, 40 및 33에 상응함)이 존재하고 하위단계 (d-3)에서 총 순위 스코어 "5"가 이상치로서 확인된다고 가정하면, 총 순위 스코어 "5"에 상응하는 사이클 번호 "3"이 비정상적인 시그널을 나타내는 사이클 번호로 결정될 수 있다.
한편, 단계 (d)에서 비정상적인 시그널을 나타내는 사이클 번호의 결정은 전술한 방법의 임의의 조합에 의해 실시된다.
일 구현예에서, 비정상적인 시그널을 나타내는 사이클 번호의 결정은 임의의 합집합 방식, 임의의 교집합 방식, 임의의 갭 방식, 및 임의의 역치 방식의 조합에 의해 실시될 수 있다.
예를 들어, 단계 (d)에서 비정상적인 시그널을 나타내는 사이클 번호의 결정은 임의의 교집합 방식 및 임의의 갭 방식의 조합(실시예 3 참고), 또는 임의의 교집합 방식, 임의의 갭 방식 및 임의의 역치 방식의 조합에 의해 실시될 수 있다. 이러한 조합은 비정상적인 시그널을 보다 정확하게 결정할 수 있게 해 준다.
이러한 조합의 결과로서, 공통된 사이클 번호(들)가 비정상적인 시그널을 나타내는 사이클 번호로 최종 결정될 수 있다.
본 발명의 또 다른 양태에 따르면, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법이 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 상기 둘 이상의 데이터 세트에서 비정상적인 시그널 사이의 공유하는 특징에 기초하여 각 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계로서, 상기 공유하는 특징은 (i) 비정상적인 시그널의 발생을 둘러싼 반응 환경 특징 또는 (ii) 비정상적인 시그널의 시그널-특정(specifying) 특징이다.
상기 방법에 따르면, 비정상적인 시그널을 나타내는 사이클 번호는 비정상적인 시그널의 발생을 둘러싼 반응 환경 특징에 의해 결정될 수 있다. 비정상적인 시그널의 발생을 둘러싼 반응 환경 특징은, 모든 데이터 세트에 영향을 미치며 비정상적인 시그널을 확인하는데 사용될 수 있는, 단일 반응 용기와 같은 동일한 반응 환경을 가리킨다. 또한, 상기 방법에 따르면, 비정상적인 시그널을 나타내는 사이클 번호는 비정상적인 시그널의 시그널-특정 특징에 의해 결정될 수 있다. 비정상적인 시그널의 시그널-특정 특징은 비정상적인 시그널을 확인하는데 사용될 수 있는 특징, 예컨대 사이클 번호의 공통성, 정상 스코어, 비정상적인 시그널의 모양 등을 포함한다.
제1 구현예에 따르면, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법이 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 각 데이터 세트를 개별적으로 분석하여 각 데이터 세트로부터 비정상적인 시그널을 나타내는 사이클 번호를 선택하는 단계; 및
(c) 상기 선택된 사이클 번호의 전부 또는 일부를 각 데이터 세트에 대하여 비정상적인 시그널을 나타내는 사이클 번호로서 결정하는 단계.
제2 구현예에 따르면, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법이 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 모든 데이터 세트를 통합 방식으로 분석하여 모든 데이터 세트에서 비정상적인 시그널을 나타내는 사이클 번호(들)를 제공하는 단계;
(c) 상기 제공된 사이클 번호(들)를 각 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로서 결정하는 단계.
제2 구현예에 따르면, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법이 추가로 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 모든 데이터 세트를 통합 방식으로 분석하여 이상치(들)에 상응하는 사이클 번호(들)를 확인하는 단계;
(c) 상기 이상치(들)의 사이클 번호(들)를 각 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로서 결정하는 단계.
제1 구현예의 예는 전술한 "교집합 방식" 또는 "합집합 방식"이고, 제2 구현예의 예는 "갭 방식" 또는 "역치 방식"이다.
본 발명의 일 구현예에 따르면, 본 발명은 비정상적인 시그널을 나타내는 사이클 번호의 시그널 값을 보정하는 단계를 추가적으로 포함한다.
상기 보정은 당업계에 공지된 다양한 방법에 따라 실시할 수 있다. 일예로서, 비정상적인 시그널을 나타내는 사이클 번호의 바로 이전 또는 이후의 사이클 번호의 시그널 값을 보정값으로 채택할 수 있다. 택일적으로, 비정상적인 시그널을 나타내는 사이클 번호의 이전 및 이후 사이클 번호들의 시그널 값의 평균을 보정값으로 채택할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명은 비정상적인 시그널을 나타내는 사이클 번호의 시그널 값을 무효화하는 단계를 추가적으로 포함한다. 택일적으로, 본 발명은 비정상적인 시그널을 나타내는 사이클 번호를 무효화하거나 또는 비정상적인 시그널을 나타내는 사이클 번호를 포함하는 데이터 세트를 무효화하는 단계를 추가적으로 포함할 수 있다.
상기 보정 및 무효화는 컴퓨터 프로그램에 의해 자동적으로 수행되거나, 실시자가 직접 실시할 수 있다. 예를 들어, 컴퓨터 프로그램에 의해 수행되는 경우, 보정되거나 무효화될 사이클 번호 또는 무효화될 데이터 세트를 디스플레이 상에 표시할 수 있다. 무효화할 경우, 재실험될 대상을 가리키는 표시를 디스플레이 상에 표시할 수 있다.
II. 기록매체, 장치 및 프로그램
하기 기재된 본 발명의 기록 매체, 장치 및 컴퓨터 프로그램은 본 발명의 방법을 컴퓨터에서 실시하기 위한 것이므로, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
본 발명의 또 다른 양태에서, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체가 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수신하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
(c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(normality score)를 계산하는 단계로서, 상기 정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
(d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
본 발명의 또 다른 양태에서, 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램이 제공된다:
(a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수신하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
(b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
(c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(normality score)를 계산하는 단계로서, 상기 정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
(d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 본 발명의 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 각각의 데이터 세트에 대해 각 사이클 번호에서 2차 변화값을 계산하도록 하는 지시; (ii) 2차 변화값을 사용하여 각 사이클 번호에서 정상 스코어를 계산하도록 하는 지시; 및 (iii) 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하도록 하는 지시.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체의 유형은 CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하는 다양한 기록 매체를 포함한다.
시그널 발생 과정으로부터의 시그널 값은 몇 가지 기전을 통해 수신될 수 있다. 예를 들어, 시그널 값은 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 시그널 값은 시그널 값이 수집됨에 따라 실시간으로 프로세서에 제공될 수 있거나, 시그널 값은 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게, 시그널 값은 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있거나, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 시그널 값은 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 포터블 HDD, USB, 플로피 디스크, CD 및 DVD와 같은 임의의 소프트웨어 기록 매체로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 시그널과 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 추가의 양태에서, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하기 위한 장치를 제공한다.
일 구현예에 따르면, 장치는 샘플 및 시그널 발생 수단을 수용할 수 있는 반응 용기, 상기 반응 용기의 온도를 조절하는 온도 조절 수단 및/또는 사이클 번호에서 시그널을 검출하는 검출기를 추가적으로 포함한다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다.
일 구현예에 따르면, 프로세서는 타겟 핵산 서열의 검출을 위한 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨하여 구현시킬 수 있다.
시그널 값은 다양한 방식으로 증폭 곡선으로 수신될 수 있다. 예를 들어, 시그널 값은 실시간 PCR 장치의 데이터 수집기 내에 프로세서에 의해 수신되고 수집될 수 있다. 시그널 값의 수집시, 이들은 실시간 방식으로 프로세서에 제공되거나, 메모리 단위 또는 버퍼에 저장된 다음, 실험 후에 프로세서에 제공될 수 있다.
유사하게, 시그널 값은 네트워크 연결(예컨대, LAN, VPN, 인트라넷 및 인터넷) 또는 직접 연결(예컨대, USB 및 유선 또는 무선 직접 연결)을 통해, 또는 CD, DVD, 플로피 디스크 및 휴대용 HDD와 같은 휴대용 매체를 통해, 실시간 PCR 장치로부터 데스크탑 컴퓨터 시스템과 같은 컴퓨터 시스템에 제공될 수 있다. 택일적으로, 시그널 값은 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 연결된 네트워크 연결(예컨대, LAN, VPN, 인트라넷, 인터넷 및 무선 통신 네트워크)을 통해 서버 시스템에 제공될 수 있다.
상기 기재된 바와 같이, 본 발명의 방법은 상기 컴퓨터 시스템 내로 공급자에 의해 설치되거나 사용자에 의해 직접 설치된 애플리케이션(즉, 프로그램)에 의해 구현되고, 컴퓨터 해독가능한 기록매체에 기록될 수 있다.
본 발명의 방법을 구현하는 컴퓨터 프로그램은 비정상적인 시그널의 검출을 위한 모든 기능을 구현할 수 있다. 컴퓨터 프로그램은 본 발명의 방법을 실행하기 위한 프로세서를 구현하는 컴퓨터 해독가능한 기록매체에 저장된 프로그램 지시를 포함하는 프로그램일 수 있다.
컴퓨터 프로그램은 C, C++, JAVA, Visual basic, VBScript, JavaScript, Perl, XML 및 기계 언어와 같은 적합한 컴퓨터 언어를 사용하여 코딩될 수 있다. 상기 프로그램은 상기 기재된 수학적 기능을 위한 기능 코드 및 컴퓨터 시스템의 프로세서에 의해 순서대로 프로세서를 구현하기 위한 제어 코드를 포함할 수 있다.
상기 코드는 프로세서에 의해 상기 기재된 기능을 구현하는데 필요한 부가적인 정보 또는 매체가 컴퓨터 시스템의 내부 또는 외부 메모리의 위치(어드레스)에서 참조되는 메모리 참조 코드를 더 포함할 수 있다.
컴퓨터 시스템이 프로세서의 기능을 구현하기 위해 원격의 또 다른 컴퓨터 또는 서버와의 통신을 필요로 하는 경우, 상기 코드는 프로세서가 통신 모듈(예컨대, 유선 및/또는 무선 통신 모듈)을 사용하여 원격의 또 다른 컴퓨터 또는 서버와 어떻게 통신하는지 또는 어떤 정보 또는 매체가 전송되는지를 코딩하는 통신 관련 코드를 더 포함할 수 있다.
본 발명을 구현하기 위한 기능적 프로그램 및 코드(코드 세그먼트)는 기록매체를 판독하고 프로그램을 실행하는 컴퓨터의 시스템 환경을 고려하여 당업계의 프로그래머에 의해 쉽게 추론되거나 변형될 수 있다.
컴퓨터 시스템에 네트워크 연결된 기록매체는 분산될 수 있고, 컴퓨터 해독가능한 코드는 분산 방식으로 저장되고 실행될 수 있다. 이 경우, 복수의 분산된 컴퓨터 중 적어도 하나의 컴퓨터는 기능들의 일부를 구현할 수 있고, 기능의 일부를 구현하고 구현 결과를 적어도 하나의 컴퓨터에 전송할 수 있는 적어도 하나의 컴퓨터에 전송할 수 있다.
본 발명을 실행하기 위해 애플리케이션(즉, 프로그램)이 기록된 기록매체는 애플리케이션 스토어 또는 애플리케이션 제공자 서버에 포함된 기록매체(예컨대, 하드 디스크), 애플리케이션 제공자 서버 자체, 상기 프로그램 및 그의 기록매체를 갖는 또 다른 컴퓨터를 포함한다.
기록매체를 판독할 수 있는 컴퓨터 시스템은 데스크탑 또는 노트북 컴퓨터와 같은 일반 PC, 스마트폰, 태블릿 PC, PDA(개인 디지털 보조장치) 및 모바일 통신 단말기와 같은 모바일 단말기뿐만 아니라 모든 컴퓨팅 실행가능 장치를 포함할 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 개별 정상 스코어 접근법을 사용한 비정상적인 시그널의 검출
본 발명의 개별 정상 스코어 접근법 중 하나인 "교집합 방식"을 사용하여, 실시간 PCR로부터 수득된 둘 이상의 데이터 세트에서 비정상적인 시그널을 검출할 수 있는지 확인하였다.
<1-1> 실시간 PCR 반응에 의한 데이터 세트의 수득
샘플을 실시간 PCR 반응을 위해 상이한 용기에 넣었다. 각 용기에 대해, 4개의 상이한 검출 채널을 사용한 실시간 PCR 반응에 의해 4개의 타겟 핵산 서열에 대한 4개의 데이터 세트를 수득하였다.
실시간 PCR은 시그널 발생 수단으로서 TaqMan 프로브를 사용하여 45 증폭 사이클로 CFX96™ Real-Time PCR Detection System(Bio-Rad Laboratories) 상에서 실시하였다.
4개의 타겟 핵산 서열을 검출하기 위해, 형광 리포터 분자인 FAM 및 퀀처 분자인 BHQ-1(Black Hole Quencher)로 표지된 프로브, CAL Fluor Orange 560 및 BHQ-1로 표지된 프로브, CAL Fluor Red 610 및 BHQ-2로 표지된 프로브, 및 Quasar 670 및 BHQ-2로 표지된 프로브를 각각 사용하였다.
실험에 의해 수득된 데이터 세트 중에서, 비정상적인 시그널(들)을 포함한 적어도 하나의 데이터 세트를 갖는 4개의 데이터 세트를 개별 정상 스코어 접근법을 위해 선택하였다.
실시간 PCR 반응 동안 4개의 상이한 검출 채널에 의해 수득된, 타겟 핵산 서열에 대한 4개의 데이터 세트를 나타내는 증폭 곡선 (a)-(d)가 도 4에 나타나 있다.
<1-2> 각 사이클 번호에서 2차 차분의 계산
각 데이터 세트에 대하여, 2개의 바로 인접한 사이클 번호에서의 시그널 값을 차감하여 각 사이클에서의 1차 차분(first order difference)을 계산하였다. 그리고 나서, 2개의 바로 인접한 사이클 번호에서의 1차 차분을 차감하여 각 사이클 번호에서의 2차 차분(second order difference)을 계산하였다. 상기 1차 차분 및 2차 차분의 계산은 후향 차분법(backward difference method)에 의해 실시하였다.
구체적으로, 각 사이클 번호에서의 2차 차분은 하기 수학식 IVV를 순차적으로 사용하거나, 또는 하기 수학식 VI을 단독으로 사용하여 계산하였다.
수학식 IV
D'i(x) = yi(x) - yi(x-1)
수학식 V
D"i(x) = D'i(x) - D'i(x-1)
수학식 VI
D"i(x) = yi(x) - 2 * yi(x-1) + yi(x-2)
상기 식에서, D'i(x)는 i번째 데이터 세트에서 x번째 사이클 번호에서의 1차 차분을 나타내고, D"i(x)는 i번째 데이터 세트에서 x번째 사이클 번호에서의 2차 차분을 나타내며, yi(x)는 i번째 데이터 세트에서 x번째 사이클 번호에서의 시그널 값이고, yi(x-1)은 i번째 데이터 세트에서 x-1번째 사이클 번호에서의 시그널 값이며, yi(x-2)는 i번째 데이터 세트에서 x-2번째 사이클 번호에서의 시그널 값을 나타낸다.
<1-3> 각 사이클 번호에서 정상 스코어(NS)의 계산
이후, 하기 수학식 VII에 따라, 2개의 바로 인접한 사이클 번호에서의 2차 차분을 곱하여 각 사이클 번호에서의 정상 스코어(normality score; NS)를 계산하였다.
수학식 VII
NSi(x) = D"i(x) * D"i(x+1)
상기 식에서, NSi(x)는 i번째 데이터 세트에서 x번째 사이클 번호에서의 정상 스코어를 나타내고, D"i(x)는 i번째 데이터 세트에서 x번째 사이클 번호에서의 2차 차분을 나타내며, D"i(x+1)은 i번째 데이터 세트에서 x+1번째 사이클 번호에서의 2차 차분을 나타낸다.
상기 계산된 각 사이클에서의 NS가 도 5에 도시되어 있다. 플롯 (a)-(d)는 각각의 검출 채널을 사용한 검출에 의해 수득된 데이터 세트에 대하여 각 사이클 번호에서 계산된 NS를 나타낸다.
4개의 데이터 세트에 대해 각 사이클 번호에서의 NS가 하기 표 1에 나타나 있다.
x 1 2 3 4 5 6 7 8 9 10
NS1(x) 0 0 295.83 140.68 -132.69 -82.05 -79.68 -131.23 -4.00 -23.88
NS2(x) 0 0 10.70 1.94 0.07 0.46 -5.45 -0.98 -1.77 -79.43
NS3(x) 0 0 197.53 10.50 -3.15 -0.69 0.14 8.71 -257.43 -1578.75
NS4(x) 0 0 104.83 -18.10 5.46 -11.10 23.83 -53.52 -102.58 85.74
x 11 12 13 14 15 16 17 18 19 20
NS1(x) -8554.52 -941.51 -92.59 -93.05 -20.49 -2.11 2.17 -10.46 -11.40 3.08
NS2(x) -496.01 17.60 0.91 2.34 -9.79 2.33 -0.60 -1.36 -6.25 -21.90
NS3(x) -8002.29 248.35 -5.57 -8.60 -45.92 -87.64 -54.53 9.41 -13.38 -77.80
NS4(x) -34.00 56.26 -231.06 -157.55 -46.82 0.09 -0.21 -152.94 25.10 -11.29
x 21 22 23 24 25 26 27 28 29 30
NS1(x) 1.79 -8.74 -55.06 11.98 6.58 15.52 26.09 171.18 226.62 215.72
NS2(x) 7.78 -4.02 -4.99 34.28 -55.63 -68.12 263.62 207.41 206.18 153.84
NS3(x) -15.29 4.79 -2.16 1.83 8.43 -35.67 -98.35 44.41 -24.98 -9.36
NS4(x) -2.81 1.63 -61.54 -429.52 -697.83 -708.90 -222.56 -0.64 -0.53 -51.39
x 31 32 33 34 35 36 37 38 39 40
NS1(x) 406.55 148.35 104.36 -90.40 94.85 270.37 158.56 152.48 276.10 7.72
NS2(x) 31.22 4.84 -14.98 116.26 173.74 12.35 18.71 110.72 36.98 11.96
NS3(x) 4.10 -3.72 -6.04 -36.18 -17.16 13.69 -28.60 8.17 -1.95 -4.37
NS4(x) -42.52 -63.52 -71.88 21.47 -11.32 -23.64 -56.20 -46.85 -27.38 -22.22
x 41 42 43 44 45 - - - - -
NS1(x) 9.95 -178.42 -73.14 -28.74 0 - - - - -
NS2(x) 17.14 -27.52 -12.95 -2.24 0 - - - - -
NS3(x) -45.55 -105.64 -53.26 -20.11 0 - - - - -
NS4(x) -35.81 -69.03 -50.34 -58.11 0 - - - - -
<1-4> 최소 NS를 갖는 사이클 번호의 선택 및 교집합 방식에 따른 비정상적인 시그널을 나타내는 사이클 번호의 결정
상기 NS에 기초하여, 각 데이터 세트에 대해 최소 NS를 갖는 사이클 번호를 선택하였다.
각 데이터 세트에 대하여 선택된 사이클 번호 및 상기 선택된 사이클 번호에서의 NS가 하기 표 2에 나타나 있다.
1번째 데이터 세트 2번째 데이터 세트 3번째 데이터 세트 4번째 데이터 세트
선택된
사이클 번호
11 11 11 26
NS -8554.52 -496.01 -8002.29 -708.90
본 발명의 교집합 방식에 따라, 모든 데이터 세트의 50% 이상에서 공통적으로 선택된 사이클 번호를 비정상적인 시그널을 나타내는 사이클 번호로 결정하였다.
상기 표 2에 나타낸 바와 같이, 사이클 번호 11이 총 4개의 데이터 세트 중 3개(75%)의 데이터 세트에서 공통적으로 선택되었으므로, 사이클 번호 11을 비정상적인 시그널을 갖는 사이클 번호로 최종 결정하였다.
실시예 2: 통합 정상 스코어 접근법을 사용한 비정상적인 시그널의 검출
본 발명의 통합 정상 스코어 접근법의 하나인 "갭 방식"을 사용하여, 실시간 PCR 반응으로부터 수득된 둘 이상의 데이터 세트에서 비정상적인 시그널을 검출할 수 있는지 확인하였다.
<2-1> 실시간 PCR 반응에 의한 데이터 세트의 수득
본 실시예에서는, 실시예 1과 상이한 4개의 데이터 세트를 통합 정상 스코어 접근법에 사용하였다.
실시간 PCR 반응 동안 4개의 상이한 검출 채널에 의해 수득된, 타겟 핵산 서열에 대한 데이터 세트를 나타내는 증폭 곡선 (a)-(d)이 도 6에 나타나 있다.
<2-2> 각 사이클 번호에서 2차 차분의 계산
각 데이터 세트에 대하여, 각 사이클 번호에서의 2차 차분을 실시예 <1-2>에 기재된 바와 같이 계산하였다.
<2-3> 각 사이클 번호에서 정상 스코어(NS)의 계산
각 데이터 세트에 대하여, 각 사이클 번호에서의 정상 스코어(NS)를 실시예 <1-3>에 기재된 바와 같이 계산하였다.
상기 계산된 각 사이클 번호에서의 NS가 도 7에 도시되어 있다. 플롯 (a)-(d)는 각 검출 채널을 사용한 검출에 의해 수득된 데이터 세트에 대하여 각 사이클 번호에서 계산된 NS를 나타낸다.
4개의 데이터 세트에 대한 각 사이클 번호에서의 NS가 표 3에 나타나 있다.
x 1 2 3 4 5 6 7 8 9 10
NS1(x) 0 0 -244.9 -52.5 2.6 -7.3 -17.8 12.2 -13.9 2.0
NS2(x) 0 0 3.3 -40.0 -107.6 -127.3 -13.7 2.0 3.3 -10.4
NS3(x) 0 0 -3.8 -0.8 5.5 -24.3 18.7 -40.8 7.9 4.8
NS4(x) 0 0 -21.6 -2.6 -4.9 -16.1 -77.4 -116.6 -72.9 -29.3
x 11 12 13 14 15 16 17 18 19 20
NS1(x) -7.2 -2.4 -1.0 25.0 56.4 177.0 1410.6 3159.2 5383.0 10090.1
NS2(x) -6.7 -0.1 0.0 -0.2 2.1 -6.0 4.7 -7.8 -1.3 1.6
NS3(x) -17.6 10.8 -16.4 -98.0 -119.6 22.2 -11.4 -13.0 12.8 -45.1
NS4(x) -29.6 -26.8 -5.4 1.5 -13.4 -86.5 23.3 2.2 2.1 2.0
x 21 22 23 24 25 26 27 28 29 30
NS1(x) 8110.6 3756.5 -333.9 268.1 2071.9 3413.2 5654.1 3053.7 1452.1 1169.1
NS2(x) -45.3 -85.8 -18.2 -9.1 -8.8 -3.8 -1.5 2.6 -1.4 0.9
NS3(x) -63.0 -54.0 -19.0 12.8 -39.1 -16.7 8.1 -39.5 -133.3 -220.8
NS4(x) 1.6 4.9 16.7 108.0 199.5 627.2 1136.0 1594.7 1798.6 593.4
x 31 32 33 34 35 36 37 38 39 40
NS1(x) 24.2 16.4 -303.0 9294.0 -616570.9 -549033.5 14112.2 -344.2 -6773.6 -313687.8
NS2(x) 2.2 -6.8 -20.5 320.3 -14789.7 -13842.3 -141.7 -13.7 680.5 -7968.2
NS3(x) -65.3 -22.6 57.1 1883.1 -62601.6 -62323.7 10500.2 2091.0 9329.3 -44045.2
NS4(x) -140.5 214.0 964.5 -4078.4 -36992.8 -33397.6 -309.9 33.9 -2048.4 -31352.8
x 41 42 43 44 45 - - - - -
NS1(x) 19965.0 106.3 1976.5 -417636.9 0 - - - - -
NS2(x) -326.8 1.6 -41.6 -8637.2 0 - - - - -
NS3(x) 2041.9 212.8 5668.8 -68608.1 0 - - - - -
NS4(x) 2656.4 -94.5 -1043.7 -25553.5 0 - - - - -
<2-4> 순위 스코어(ranking score; RS ) 의 부여
각 데이터 세트에 대해, NS의 크기에 따라 각 사이클 번호에 순위 스코어(ranking score; RS)를 부여하였다. RS의 부여는 RS "1"부터 시작하여 작은 NS를 갖는 사이클 번호에 작은 RS를 부여하는 방식으로 실시하였다.
<2-5> 총 순위 스코어(total ranking score; TRS)의 계산
이후, 동일한 사이클 번호에 부여된 RS를 모든 데이터 세트에 대하여 합하여 각 사이클 번호에서의 총 순위 스코어(TRS)를 계산하였다.
각 사이클 번호에서 수득된 TRS를 하기 표 4에 나타내었다.
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
RS1(x) - - 9 10 18 13 11 19 12 17 14 15 16 22 23
RS2(x) - - 38 12 8 7 16 34 39 17 22 29 30 28 35
RS3(x) - - 24 25 27 16 33 13 28 26 19 30 21 8 7
RS4(x) - - 18 23 22 19 13 10 14 16 15 17 21 24 20
TRS(x) - - 89 70 75 55 73 76 93 76 70 91 88 82 85
x 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
RS1(x) 25 28 33 36 40 38 35 7 26 31 34 37 32 29 27
RS2(x) 23 40 20 27 33 10 9 14 18 19 24 25 37 26 31
RS3(x) 34 23 22 32 12 10 11 18 31 15 20 29 14 6 5
RS4(x) 12 31 28 27 26 25 29 30 33 34 37 39 40 41 36
TRS(x) 94 122 103 122 111 83 84 69 108 99 115 130 123 102 99
x 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
RS1(x) 21 20 8 39 1 2 41 6 5 4 42 24 30 3 -
RS2(x) 36 21 13 41 1 2 6 15 42 4 5 32 11 3 -
RS3(x) 9 17 35 37 2 3 42 39 41 4 38 36 40 1 -
RS4(x) 9 35 38 5 1 2 8 32 6 3 42 11 7 4 -
TRS(x) 75 93 94 122 5 9 97 92 94 15 127 103 88 11 -
상기 표에서, RS1(x) 내지 RS4(x)는 각각 1번째 내지 4번째 데이터 세트에서 x번째 사이클 번호에서의 RS를 나타내고, TRS(x)는 x번째 사이클 번호에서의 RS를 합하여 수득한 TRS를 나타낸다.
본 발명의 방법에 따르면, 2차 차분을 후향 차분법에 의해 계산하므로, 1번째 및 2번째 사이클 번호에서의 NS, RS 및 TRS는 계산될 수 없다. 또한, NS를 수학식 VII에 의해 계산하므로, 45번째 사이클에서의 NS, RS 및 TRS는 계산될 수 없다.
<2-5> 가장 큰 갭의 확인에 의한 비정상적인 시그널을 나타내는 사이클 번호의 결정
모든 사이클 번호에서의 총 순위 스코어(TRS)를 오름차순으로 배열하였다. 그 결과가 하기 표 5에 나타나 있다.
x 35 36 44 40 6 23 4 11 7 5 31 8 10 14 21
TRS(x) 5 9 11 15 55 69 70 70 73 75 75 76 76 82 83
x 22 15 13 43 3 12 38 9 32 16 33 39 37 25 30
TRS(x) 84 85 88 88 89 91 92 93 93 94 94 94 97 99 99
x 29 18 42 24 20 26 17 19 34 28 41 27 - - -
TRS(x) 102 103 103 108 111 115 122 122 122 123 127 130 - - -
분석을 용이하게 하기 위하여, TRS를 1차원적으로 배열하였다. 상기 배열에서, TRS를 그 크기에 해당하는 1차원 좌표 상에 위치시켰다. 가장 큰 갭(이상치 갭)의 정확한 결정을 위해, 참조 순위 스코어 "0"을 배열에 추가적으로 도입하였다. 최소 총 순위 스코어로서 상기 참조 총 순위 스코어 "0"은 순위 스코어의 스코어링 시스템에 따라 각 데이터 세트에 대해 참조 순위 스코어 "0"을 추가로 도입하고 모든 데이터 세트의 참조 순위 스코어를 합하여 수득하였다.
TRS를 그 크기에 따라 1차원적으로 배열한 결과가 도 8에 나타나 있다.
이 배열에서, 2개의 인접하는 TRS 간의 갭(gap)을 계산한 다음, 가장 큰 갭(이상치 갭)을 확인하였다. 상기 도 8 및 표 5에서 보는 바와 같이, 사이클 번호 40에서의 TRS 15와 사이클 번호 6에서의 TRS 55 사이의 갭이 가장 큰 갭으로서 확인되었다.
본 실시예에서 구현된 갭 방식에 따라, 가장 큰 갭의 2개의 인접하는 TRS 중에서 상대적으로 작은 TRS보다 작거나 동일한 TRS를 이상치로서 확인하였고, 상기 이상치의 사이클 번호를 비정상적인 시그널을 나타내는 사이클 번호로 결정하였다. 본 실시예에서, TRS 5, 9, 11 및 15에 해당하는 사이클 번호 35, 36, 44 및 40을 비정상적인 시그널을 나타내는 사이클 번호로 결정하였다.
실시예 3: 갭 방식 및 교집합 방식의 조합을 사용한 비정상적인 시그널의 검출
본 발명의 "갭 방식"과 "교집합 방식"의 조합을 사용하여, 실시간 PCR 반응으로부터 수득된 둘 이상의 데이터 세트에서 비정상적인 시그널을 검출할 수 있는지 확인하였다.
<3-1> 실시간 PCR 반응에 의한 데이터 세트의 수득
본 실시예에서는, 실시예 1 및 2와 상이한 4개의 데이터 세트를 데이터 분석에 사용하였다.
실시간 PCR 반응 동안 4개의 상이한 검출 채널에 의해 수득된, 타겟 핵산 서열에 대한 데이터 세트를 나타내는 증폭 곡선 (a)-(d)가 도 9에 나타나 있다.
<3-2> 각 사이클 번호에서 2차 차분의 계산
각 사이클 번호에서의 2차 차분을 실시예 <1-2>에 기재된 바와 같이 계산하였다.
<3-3> 각 사이클 번호에서 정상 스코어(NS)의 계산
각 사이클 번호에서의 정상 스코어(NS)를 실시예 <1-3>에 기재된 바와 같이 계산하였다. 각 사이클 번호에서 계산된 NS를 도 10에 나타내었다. 4개의 데이터 세트에 대한 각 사이클 번호에서의 NS가 표 6에 나타나 있다.
x 1 2 3 4 5 6 7 8 9 10
NS1(x) 0 0 82.70 -906.84 -15063.61 -266.80 4.35 -5.76 18.38 -53.89
NS2(x) 0 0 -0.47 4.62 -851.85 -140.75 27.50 -79.79 -105.40 25.30
NS3(x) 0 0 -9.24 50.19 -6382.69 272.39 -0.77 0.92 -17.02 -18.88
NS4(x) 0 0 -1.57 4.26 -302.86 67.54 13.95 8.52 -49.31 -229.63
x 11 12 13 14 15 16 17 18 19 20
NS1(x) -52.39 -45.79 -47.63 1.02 -1.25 -28.38 6.79 -1.47 -1.26 -12.65
NS2(x) -6.86 8.18 -6.14 4.25 -8.68 -12.49 -9.32 -7.49 -7.88 1.83
NS3(x) -15.80 -15.37 -25.60 -26.97 4.51 -3.01 -9.45 14.20 -28.43 -16.81
NS4(x) -5.19 5.11 -213.02 53.14 -66.16 -59.06 24.30 -8.77 10.42 -73.16
x 21 22 23 24 25 26 27 28 29 30
NS1(x) 24.60 -12.86 -70.08 88.03 85.46 147.60 68.68 93.96 65.75 39.68
NS2(x) -2.48 9.88 -11.93 -74.69 192.87 168.99 309.72 738.00 493.12 189.67
NS3(x) 27.76 -71.20 4.31 -10.83 -54.21 -16.74 68.32 -13.86 -9.63 97.95
NS4(x) -45.49 -41.94 -59.80 -52.93 -115.16 -142.81 156.07 -499.94 -321.95 9.92
x 31 32 33 34 35 36 37 38 39 40
NS1(x) -49.88 -58.22 26.20 -29.80 -17.11 -20.87 -70.74 -110.07 -79.87 -52.04
NS2(x) -18.60 -8.48 -86.19 284.52 344.42 238.36 310.55 182.22 73.97 23.41
NS3(x) 223.87 82.97 76.01 73.78 -35.56 -142.03 -537.57 224.08 9.80 23.31
NS4(x) -0.45 -0.33 0.11 0.29 -13.89 -38.68 1.98 -0.25 0.32 2.46
x 41 42 43 44 45
NS1(x) -33.29 -18.53 3.95 2.04 0
NS2(x) 28.19 -28.97 1.21 -3.06 0
NS3(x) 29.60 15.47 29.57 -22.45 0
NS4(x) -13.24 0.95 -4.03 -250.02 0
<3-4> 순위 스코어( RS ) 의 부여
실시예 <1-4>에 기재된 바와 같이 각 사이클 번호에 순위 스코어(RS)를 부여하였다. 각 사이클 번호에 부여된 RS가 표 7에 나타나 있다.
<3-5> 총 순위 스코어(TRS)의 계산
실시예 <2-5>에 기재된 바와 같이 각 사이클 번호에서의 총 순위 스코어(TRS)를 계산하였다. 각 사이클 번호에서 수득된 TRS가 표 7에 나타나 있다.
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
RS1(x) - - 38 2 1 3 30 23 32 9 10 14 13 27 26
RS2(x) - - 20 24 1 2 29 5 3 28 16 25 17 23 12
RS3(x) - - 21 34 1 42 23 24 12 11 15 16 9 8 26
RS4(x) - - 23 33 3 41 38 35 14 5 21 34 6 40 10
TRS(x) - - 102 93 6 88 120 87 61 53 62 89 45 98 74
x 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
RS1(x) 17 31 24 25 22 33 21 7 40 39 42 37 41 36 35
RS2(x) 9 11 15 14 22 19 26 10 6 35 32 38 42 41 34
RS3(x) 22 20 28 7 13 31 4 25 18 5 14 35 17 19 39
RS4(x) 12 39 20 37 9 15 16 11 13 8 7 42 1 2 36
TRS(x) 60 101 87 83 66 98 67 53 77 87 95 152 101 98 144
x 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
RS1(x) 12 8 34 16 20 18 6 4 5 11 15 19 29 28 -
RS2(x) 8 13 4 37 40 36 39 33 31 27 30 7 21 18 -
RS3(x) 40 38 37 36 6 3 2 41 27 30 33 29 32 10 -
RS4(x) 24 25 27 28 18 17 31 26 29 32 19 30 22 4 -
TRS(x) 84 84 102 117 84 74 78 104 92 100 97 85 104 60 -
<3-6> 가장 큰 갭의 확인에 의한 비정상적인 시그널을 나타내는 사이클 번호의 결정
TRS를 오름차순으로 배열하였다. 그 결과가 하기 표 8에 나타나 있다.
x 5 13 10 23 16 44 9 11 20 22 15 36 24 37
TRS(x) 6 45 53 53 60 60 61 62 66 67 74 74 77 78
x 19 31 32 35 42 8 18 25 6 12 39 4 26 41
TRS(x) 83 84 84 84 85 87 87 87 88 89 92 93 95 97
x 14 21 29 40 17 28 3 33 38 43 34 7 30 27
TRS(x) 98 98 98 100 101 101 102 102 104 104 117 120 144 152
분석을 용이하게 하기 위하여, 상기 TRS를 1차원적으로 배열하였다. 상기 배열에서, TRS를 그 크기에 해당하는 1차원 좌표 상에 위치시켰다. 가장 큰 갭(이상치 갭)의 정확한 결정을 위해, 참조 순위 스코어 "0"을 배열에 추가적으로 도입하였다. 최소 총 순위 스코어로서 상기 참조 총 순위 스코어 "0"은 순위 스코어의 스코어링 시스템에 따라 각 데이터 세트에 대해 참조 순위 스코어 "0"을 추가로 도입하고 모든 데이터 세트의 참조 순위 스코어를 합하여 수득하였다.
TRS를 그 크기에 따라 1차원적으로 배열한 결과가 도 11에 나타나 있다.
이 배열에서, 2개의 인접하는 TRS 간의 갭을 계산한 다음, 가장 큰 갭(이상치 갭)을 확인하였다. 상기 도 11 및 표 6에서 보는 바와 같이, 사이클 번호 5에 해당하는 TRS 6과 사이클 번호 13에 해당하는 TRS 45 사이의 갭이 가장 큰 갭으로서 확인되었다.
본 실시예에서 구현된 갭 방식에 따라, TRS 6에 해당하는 사이클 번호 5를 비정상적인 시그널을 갖는 사이클 번호로 결정하였다.
<3-7> 교집합 방식에 의한 비정상적인 시그널을 나타내는 사이클 번호의 결정
갭 방식에 사용된 동일한 데이터 세트를 교집합 방식에 따른 비정상적인 시그널을 나타내는 사이클 번호를 결정하는데 다시 사용하였다.
교집합 방식은 실시예 1에 기재된 과정과 동일하게 수행하였다.
각 데이터 세트에 대하여 선택된 사이클 번호 및 상기 선택된 사이클 번호에서의 NS가 하기 표 9에 나타나 있다.
1번째 데이터 세트 2번째 데이터 세트 3번째 데이터 세트 4번째 데이터 세트
선택된
사이클 번호
5 5 5 28
NS -15063.6 -851.8 -6382.7 -499.9
상기 표 9에서 보는 바와 같이, 사이클 번호 5가 총 4개의 데이터 세트 중 3개(75%)에서 공통적으로 선택되었으므로, 사이클 5를 비정상적인 시그널을 갖는 사이클 번호로 최종 결정하였다.
상기 실시예 <3-7>에서 교집합 방식에 의해 결정된 사이클 번호는 상기 실시예 <3-6>의 갭 방식에 의해 결정된 사이클 번호와 동일하였다. 따라서, 사이클 번호 5는 비정상적인 시그널을 나타내는 사이클 번호인 것으로 확인되었다.
상기 결과는 본 발명에 따른 방식들의 조합이 비정상적인 시그널을 나타내는 사이클 번호를 보다 정확하게 결정할 수 있음을 보여준다. 또한, 상기 결과는 갭 방식과 교집합 방식을 개별적으로 또는 조합하여 사용할 수 있음을 입증한다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (30)

  1. 하기 단계를 포함하는, 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널(abnormal signal)를 검출하는 방법:
    (a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
    (b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
    (c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(normality score)를 계산하는 단계로서, 상기 정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
    (d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
  2. 제1항에 있어서, 상기 단계 (b)에서 2차 변화값의 계산은 2개의 연속 사이클 번호에서의 2개의 시그널 값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 1차 변화값을 계산한 후, 2개의 연속 사이클 번호에서의 2개의 1차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값을 계산함으로써 실시되는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 단계 (b)에서의 2차 변화값은 2차 차분(second order difference), 2차 계차(second order difference quotient) 및 2차 미분(second order derivative)으로 이루어진 군으로부터 선택되는 어느 하나인 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 상기 2차 차분 또는 2차 계차는 전향 차분법(forward difference method) 또는 후향 차분법(backward difference method)에 의해 수득되는 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 단계 (c)에서의 정상 스코어의 계산은 2개의 연속 사이클 번호에서의 2차 변화값을 곱함으로써 실시되는 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 단계 (c)에서의 정상 스코어의 계산은 하기 수학식 VII 또는 수학식 VIII에 의해 실시되는 것을 특징으로 하는 방법:
    수학식 VII
    NSi(x) = D"i(x) * D"i(x+1)
    상기 식에서, NSi(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 정상 스코어를 나타내고; D"i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 2차 변화값을 나타내며; D"i(x+1)은 i번째 데이터 세트의 x+1번째 사이클 번호에서의 2차 변화값을 나타내고; i 및 x는 각각 1 이상의 정수이다.
    수학식 VIII
    NSi(x) = D"i(x) * D"i(x-1)
    상기 식에서, NSi(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 정상 스코어를 나타내고; D"i(x)는 i번째 데이터 세트의 x번째 사이클 번호에서의 2차 변화값을 나타내며; D"i(x-1)은 i번째 데이터 세트의 x-1번째 사이클 번호에서의 2차 변화값을 나타내고; i 및 x는 각각 1 이상의 정수이다.
  7. 제1항에 있어서, 상기 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작은 정상 스코어를 갖는 사이클 번호를 선택하고; 모든 데이터 세트에 대해 상기 선택된 사이클 번호의 전부 또는 일부를 비정상적인 시그널을 나타내는 사이클 번호로 결정함으써 실시되는 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 단계 (d)는 정상 스코어를 0 미만의 값으로부터 선택된 역치와 비교하고; 각각의 데이터 세트에 대해 상기 역치보다 작고 최소인 정상 스코어를 갖는 사이클 번호를 선택하고; 상기 선택된 사이클 번호의 전부 또는 일부를 모든 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시되는 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 단계 (d)는 각각의 데이터 세트에 대해 최소인 정상 스코어를 갖는 사이클 번호를 선택하고, 상기 선택된 사이클 번호의 전부 또는 일부를 비정상적인 시그널을 나타내는 사이클 번호로 결정함으로써 실시되는 것을 특징으로 하는 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 선택된 사이클 번호의 일부는 모든 데이터 세트의 50% 이상에서 공통적으로 선택된 사이클 번호(들)인 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 상기 단계 (d)는 하기 하위단계를 포함하는 것을 특징으로 하는 방법:
    (d-1) 정상 스코어의 크기에 따라 각 데이터 세트의 각 사이클 번호에 순위 스코어(ranking score; RS)를 부여하는 단계;
    (d-2) 각 데이터 세트의 동일한 사이클 번호에 부여된 순위 스코어를 합하거나 곱하여 각 사이클 번호에서의 총 순위 스코어(total ranking score; TRS)를 수득하는 단계;
    (d-3) 총 순위 스코어 중에서 이상치(들)를 확인하는 단계; 및
    (d-4) 상기 이상치(들)의 사이클 번호(들)를 비정상적인 시그널을 나타내는 사이클로 결정하는 단계.
  12. 제11항에 있어서, 상기 하위단계 (d-1)은 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여함으로써 실시되는 것을 특징으로 하는 방법.
  13. 제11항에 있어서, 상기 하위단계 (d-1)은 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여함으로써 실시되는 것을 특징으로 하는 방법.
  14. 제11항에 있어서, 상기 순위 스코어는 규칙적인 간격으로 부여되는 것을 특징으로 하는 방법.
  15. 제11항에 있어서, 상기 하위단계 (d-2)에서의 총 순위 스코어는 각 데이터 세트의 동일한 사이클 번호에 부여된 순위 스코어를 합하거나 곱하여 수득되는 것을 특징으로 하는 방법.
  16. 제11항에 있어서, 상기 하위단계 (d-3)은 (i) 각 사이클 번호에서의 총 순위 스코어를 크기 순서로 배열하는 단계; (ii) 상기 배열에서 2개의 인접하는 총 순위 스코어 사이의 갭을 계산하는 단계; (iii) 상기 배열에서 이상치 갭을 확인하는 단계; 및 (iv) 상기 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 작은 총 순위 스코어보다 작거나 동일한 총 순위 스코어를 이상치(들)로서 결정하거나, 상기 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 큰 총 순위 스코어보다 크거나 동일한 총 순위 스코어를 이상치(들)로서 결정하는 단계에 의해 실시되는 것을 특징으로 하는 방법.
  17. 제16항에 있어서, 상기 이상치 갭은 (i) 가장 큰 크기를 갖는 갭; (ii) 가장 큰 크기를 갖는 갭 및 두 번째로 큰 크기를 갖는 갭 중 하나; 또는 (iii) 평균 갭 크기를 벗어나는 갭(들) 중 하나인 것을 특징으로 하는 방법.
  18. 제16항에 있어서, 상기 하위단계 (d-1)이 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여함으로써 실시되는 경우, 하위단계 (d-3)은 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 작은 총 순위 스코어보다 작거나 동일한 총 순위 스코어를 이상치(들)로서 결정함으로써 실시되는 것을 특징으로 하는 방법.
  19. 제16항에 있어서, 상기 하위단계 (d-1)이 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여함으로써 실시되는 경우, 하위단계 (d-3)은 이상치 갭의 2개의 인접하는 총 순위 스코어 중에서 상대적으로 큰 총 순위 스코어보다 크거나 동일한 총 순위 스코어를 이상치(들)로서 결정함으로써 실시되는 것을 특징으로 하는 방법.
  20. 제16항에 있어서, 이상치 갭을 확인하기 위해 참조 총 순위 스코어가 추가로 사용되는 것을 특징으로 하는 방법.
  21. 제20항에 있어서, 상기 참조 총 순위 스코어는 (i) 각 데이터 세트에 참조 순위 스코어를 추가로 부여하는 단계로서, 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어가 부여되는 경우, 상기 참조 순위 스코어는 하위단계 (d-1)에서 모든 사이클 번호에 부여된 모든 순위 스코어보다 작거나, 하위단계 (d-1)에서 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어가 부여되는 경우, 상기 참조 순위 스코어는 하위단계 (d-1)에서 모든 사이클 번호에 부여된 모든 순위 스코어보다 크고; (ii) 모든 데이터 세트에 부여된 참조 순위 스코어를 합하는 단계에 의해 수득되는 것을 특징으로 하는 방법.
  22. 제11항에 있어서, 상기 하위단계 (d-3)은 총 순위 스코어에 역치를 적용하고, 상기 역치보다 작은 총 순위 스코어를 이상치(들)로서 결정하거나 상기 역치보다 큰 총 순위 스코어를 이상치(들)로서 결정함으로써 실시되는 것을 특징으로 하는 방법.
  23. 제22항에 있어서, 상기 하위단계 (d-1)이 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 작은 순위 스코어를 부여함으로써 실시되는 경우, 상기 하위단계 (d-3)은 역치보다 작은 총 순위 스코어를 이상치(들)로서 결정함으로써 실시되는 것을 특징으로 하는 방법.
  24. 제22항에 있어서, 상기 하위단계 (d-1)이 각 데이터 세트에서 작은 정상 스코어를 갖는 사이클 번호에 큰 순위 스코어를 부여하여 실시하는 경우, 상기 하위단계 (d-3)은 역치보다 큰 총 순위 스코어를 이상치(들)로서 결정함으로써 실시되는 것을 특징으로 하는 방법.
  25. 제1항에 있어서, 상기 단계 (d)에서 비정상적인 시그널을 나타내는 사이클 번호의 결정은 제7항의 단계 (d), 제8항의 단계 (d), 제9항의 단계 (d), 제11항의 단계 (d) 및 제22항의 단계 (d)로 이루어진 군으로부터 선택되는 적어도 2개의 단계의 임의의 조합에 의해 실시되는 것을 특징으로 하는 방법.
  26. 제1항에 있어서, 상기 둘 이상의 데이터 세트는 시그널 증폭 반응에서 상이한 검출 온도에서의 검출에 의해 수득된 데이터 세트, 상이한 시그널 검출 수단을 사용한 검출에 의해 수득된 데이터 세트, 또는 이의 조합을 포함하는 것을 특징으로 하는 방법.
  27. 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체:
    (a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수신하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
    (b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
    (c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(Normality Score)를 계산하는 단계로서, 정상 스코어의 계산은 2개의 인접 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
    (d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
  28. (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 제27항의 컴퓨터 해독가능한 기록매체를 포함하는, 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하기 위한 장치.
  29. 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램:
    (a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수신하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
    (b) 상기 각각의 데이터 세트의 각 사이클 번호에서 2차 변화값(second-order change value)을 계산하는 단계;
    (c) 상기 2차 변화값을 사용하여 각각의 데이터 세트의 각 사이클 번호에서 정상 스코어(Normality Score)를 계산하는 단계로서, 정상 스코어의 계산은 2개의 인접 사이클 번호에서의 2차 변화값 사이의 부호 변화 및 크기를 나타내는 수학적 연산에 의해 실시되고;
    (d) 상기 정상 스코어를 사용하여 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계.
  30. 하기 단계를 포함하는 둘 이상의 데이터 세트를 사용하여 비정상적인 시그널을 검출하는 방법:
    (a) 단일 반응 용기에서의 시그널 증폭 반응에 의해 둘 이상의 데이터 세트를 수득하는 단계로서, 각각의 데이터 세트는 복수의 데이터 지점을 포함하고, 상기 각 데이터 지점은 사이클 번호(cycle number) 및 상기 사이클 번호에서의 시그널 값을 가지며;
    (b) 상기 둘 이상의 데이터 세트에서 비정상적인 시그널 사이의 공유하는 특징에 기초하여 각 데이터 세트에 대해 비정상적인 시그널을 나타내는 사이클 번호를 결정하는 단계로서, 상기 공유하는 특징은 (i) 비정상적인 시그널의 발생을 둘러싼 반응 환경 특징 또는 (ii) 비정상적인 시그널의 시그널-특정(specifying) 특징이다.

KR1020187031711A 2016-04-01 2017-03-31 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출 KR102165933B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020160040390 2016-04-01
KR20160040390 2016-04-01
PCT/KR2017/003551 WO2017171469A1 (en) 2016-04-01 2017-03-31 Detection of abnormal signal using two or more datasets

Publications (2)

Publication Number Publication Date
KR20180122481A KR20180122481A (ko) 2018-11-12
KR102165933B1 true KR102165933B1 (ko) 2020-10-14

Family

ID=59966193

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187031711A KR102165933B1 (ko) 2016-04-01 2017-03-31 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출

Country Status (3)

Country Link
US (1) US11781180B2 (ko)
KR (1) KR102165933B1 (ko)
WO (1) WO2017171469A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107942994B (zh) * 2017-11-07 2019-06-28 湖南捷能高新技术有限公司 一种基于温度曲线特征的卫星温控系统故障诊断方法
EP3895170A4 (en) * 2018-12-14 2022-10-12 Seegene, Inc. METHOD FOR DETECTING A TARGET ANALYTE IN A SAMPLE USING AN S-SHAPED FUNCTION FOR A SLOPE DATA SET
WO2024010351A1 (ko) * 2022-07-05 2024-01-11 주식회사 씨젠 복수의 표적 분석물 각각에 대한 근사 신호의 획득 방법 및 이를 수행하는 컴퓨터 장치
CN115790723B (zh) * 2023-02-06 2023-06-06 山东中都机器有限公司 一种污水净化异常检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154512A1 (en) 2006-07-01 2008-06-26 Harrison Leong Systems and methods for baselining and real-time pcr data analysis
US20110004411A1 (en) 2007-11-14 2011-01-06 Talecris Biotherapeutics, Inc. Method for adjusting results of a polymerase chain reaction (pcr) instrument
US20140095136A1 (en) 2011-12-17 2014-04-03 Ariosa Diagnostics, Inc. Mathematical normalization of sequence data sets

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2442654A1 (en) * 2001-04-10 2002-10-10 Transtech Pharma, Inc. Probes, systems, and methods for drug discovery
US9607128B2 (en) 2013-12-30 2017-03-28 Roche Molecular Systems, Inc. Detection and correction of jumps in real-time PCR signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154512A1 (en) 2006-07-01 2008-06-26 Harrison Leong Systems and methods for baselining and real-time pcr data analysis
US20110004411A1 (en) 2007-11-14 2011-01-06 Talecris Biotherapeutics, Inc. Method for adjusting results of a polymerase chain reaction (pcr) instrument
US20140095136A1 (en) 2011-12-17 2014-04-03 Ariosa Diagnostics, Inc. Mathematical normalization of sequence data sets

Also Published As

Publication number Publication date
US11781180B2 (en) 2023-10-10
WO2017171469A1 (en) 2017-10-05
KR20180122481A (ko) 2018-11-12
US20190284605A1 (en) 2019-09-19

Similar Documents

Publication Publication Date Title
KR102165933B1 (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
EP3090372B1 (en) Detection and correction of jumps in real-time pcr signals
JP6602374B2 (ja) 試料の分析方法
US10978173B2 (en) Method for reducing noise level of data set for a target analyte
KR102326604B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
JP6685396B2 (ja) 標的分析物質に対するデータセットの補正方法
KR101771402B1 (ko) 핵산 정량 방법
KR102110985B1 (ko) 타겟 핵산 서열에 대한 시그널 추출
CN111149170A (zh) 分析试样内靶分析物的方法及装置
KR102408564B1 (ko) 타겟 핵산 서열의 존재를 결정하기 위한 분석 시그널
KR102189356B1 (ko) 데이터 세트에서 비정상적인 시그널의 검출
US20220025449A1 (en) Method for detecting a target analyte in a sample using an s-shaped function for a slope data set
KR102385960B1 (ko) 분석물질-비의존적 신호값을 이용한 타겟 분석물질에 대한 데이터 세트 보정 방법
KR102110999B1 (ko) 타겟 핵산 서열에 대한 시그널을 제공하는 방법
EP3182106B1 (en) Cumulative differential chemical assay identification

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant