KR20120107717A - Method for selecting a threshold in amplification profile curve of real-time pcr - Google Patents

Method for selecting a threshold in amplification profile curve of real-time pcr Download PDF

Info

Publication number
KR20120107717A
KR20120107717A KR1020110025393A KR20110025393A KR20120107717A KR 20120107717 A KR20120107717 A KR 20120107717A KR 1020110025393 A KR1020110025393 A KR 1020110025393A KR 20110025393 A KR20110025393 A KR 20110025393A KR 20120107717 A KR20120107717 A KR 20120107717A
Authority
KR
South Korea
Prior art keywords
value
threshold
values
variance
calculated
Prior art date
Application number
KR1020110025393A
Other languages
Korean (ko)
Inventor
배순민
Original Assignee
삼성테크윈 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성테크윈 주식회사 filed Critical 삼성테크윈 주식회사
Priority to KR1020110025393A priority Critical patent/KR20120107717A/en
Publication of KR20120107717A publication Critical patent/KR20120107717A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Abstract

PURPOSE: A method for selecting a threshold from an amplification profile curve of a real time polymerase chain reaction is provided to more accurately select a threshold value for the amount of polynucleotide which does not use a reference curve. CONSTITUTION: Polynucleotide polymerase chain reaction for a plurality of samples including two or more of the same samples is performed. An amplification profile curve for signal strength values which are provided by probes is obtained by every sample. One threshold value is selected among the signal strength values. A threshold cycle value corresponding to the selected threshold value is calculated. A deviation value of threshold cycle values is calculated. [Reference numerals] (AA) Stagnant state area; (BB) Exponential area; (CC) Probe signal strength; (DD) Base line area; (EE) Amplification cycle number; (FF) Amplification profile curve in general RT PCR

Description

실시간 중합효소 연쇄 반응의 증폭 프로파일 곡선으로부터 임계값을 선택하는 방법{Method for selecting a threshold in amplification profile curve of real-time PCR}Method for selecting a threshold in amplification profile curve of real-time PCR}

본 발명은 실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭 프로파일 곡선으로부터 폴리뉴클레오티드 정량에 필요한 임계값을 선택하는 방법에 관한 것이다. The present invention relates to a method for selecting a threshold for polynucleotide quantification from an amplification profile curve obtained by performing a real time polymerase chain reaction.

실시간 중합효소 연쇄 반응(Real-time polynucleotide chain reaction: Real-time PCR)은 PCR 증폭 산물의 증가를 실시간으로 모니터링하여 폴리뉴클레오티드의 정량을 할 수 있는 기술로 유전자 발현의 측정, 자극에 대한 생물학적 반응의 모니터링, 게놈 수준(genomic-level) 유전자 정량 및 병원체 검출과 같은 생물학적 연구 및 임상학적 분석에 널리 사용되고 있다.Real-time polynucleotide chain reaction (real-time PCR) is a technology that can quantify polynucleotides by monitoring the increase of PCR amplification products in real time. It is widely used in biological research and clinical analysis such as monitoring, genomic-level gene quantification and pathogen detection.

Real-time PCR에 있어 PCR 증폭 산물의 양은 형광 신호에 의해 검출할 수 있다. 검출 방법으로 이중 나선 DNA에 결합하여 형광을 나타내는 시약(intercalator)을 사용하는 인터컬레이팅(Intercalating)법, 5' 말단은 형광물질, 3' 말단은 quencher 물질로 표지된 올리고뉴클레오티드를 사용하는 방법 등이 있다. 상기 방법들을 이용하였을 때, Real-time PCR이 진행되면서 증가하는 폴리뉴클레오티드 양에 따라 형광 신호의 세기가 증가하게 되고, 사용자는 증폭 사이클 횟수에 따른 형광 신호 세기를 나타내는 증폭 프로파일(amplification profile) 곡선을 얻게 된다.In real-time PCR, the amount of PCR amplification product can be detected by fluorescence signal. Intercalating method using a reagent that shows fluorescence by binding to double-stranded DNA as a detection method, a method of using oligonucleotides labeled with a fluorescent material at the 5 'end and a quencher material at the 3' end, etc. There is this. When the above methods are used, the intensity of the fluorescence signal increases according to the amount of polynucleotide that increases with real-time PCR, and the user generates an amplification profile curve indicating the intensity of the fluorescence signal according to the number of amplification cycles. You get

증폭 프로파일 곡선은 일반적으로 실질적인 폴리뉴클레오티드 양이 반영되지 않은 배경 형광신호 세기가 나타나는 베이스라인(baseline) 영역, 폴리뉴클레오티드 양의 증가가 반영되어 형광신호 세기의 증가가 나타나는 지수적 영역(exponential region), 및 PCR 반응이 포화 상태에 이르러 더 이상 형광신호 세기의 증가가 나타나지 않는 정체 상태 영역(plateau region)으로 나뉘어 진다(도 1). PCR 반응 초기에 베이스라인 영역이 나타나는 이유는 PCR 증폭 산물량이 아직 검출 가능한 양에 도달하지 못하였기 때문이다. The amplification profile curve is typically a baseline region where the background fluorescence signal intensity does not reflect the actual amount of polynucleotides, an exponential region where the increase in fluorescence signal intensity is reflected by the increase in the amount of polynucleotides, And the PCR reaction is saturated and divided into a plateau region where no further increase in fluorescence signal intensity appears (FIG. 1). The baseline region appears early in the PCR reaction because the amount of PCR amplification products has not yet reached a detectable amount.

통상적으로 베이스라인 영역에서 지수적 영역으로 넘어가는 지점, 즉 PCR 증폭 산물량이 형광으로 검출 가능한 양에 도달한 때의 형광신호 세기를 임계값(threshold)이라고 하고 증폭 프로파일 곡선에서 임계값에 대응하는 증폭 사이클 횟수를 임계 사이클(threshold cycle: CT)값이라고 한다. 초기 폴리뉴클레오티드 농도를 달리하여 각각 Real-time PCR을 수행하였을 때, 초기 폴리뉴클레오티드 양이 많을수록 증폭 산물량이 검출 가능한 양에 도달하는 증폭 사이클 횟수가 적어지므로 임계 사이클 값이 적어진다(도 2). 따라서 초기 폴리뉴클레오티드 양의 로그값과 임계 사이클 값은 강한 반비례 관계에 있게 되며, 통상적으로 임계 사이클 값을 이용하여 원하는 폴리뉴클레오티드 정량을 수행하게 된다. 실시간 중합효소 연쇄반응을 이용한 폴리뉴클레오티드 정량에는 크게 절대적 정량과 상대적 정량이 있다. 절대적 정량은 폴리뉴클레오티드 양을 알고 있는 샘플로 실시간 중합효소 연쇄반응을 실시하여 폴리뉴클레오티드 양에 대한 임계사이클 값의 표준 곡선(standard curve)를 생성하여 정량을 하는 방법이고 상대 정량은 샘플의 절대적인 폴리뉴클레오티드 양을 알지는 못하더라도 다른 샘플과의 상대적인 양을 비교하는 방법이다. 상대 정량을 하는 경우에는 표준 곡선을 이용할 수도 있고 이용하지 않을 수도 있다. 이 모든 경우에 있어, 정량을 하기 위해서는 우선적으로 임계값을 결정하여 임계 사이클 값을 산출해야 한다. Typically, the fluorescence signal intensity at the point of transition from the baseline region to the exponential region, that is, when the amount of PCR amplification products reaches a detectable amount by fluorescence, is called a threshold and corresponds to a threshold in the amplification profile curve. The number of amplification cycles is called a threshold cycle (CT) value. When real-time PCR was performed at different initial polynucleotide concentrations, the larger the initial polynucleotide amount, the smaller the number of amplification cycles in which the amount of amplification products reached a detectable amount. Therefore, the log value of the initial polynucleotide amount and the threshold cycle value are in inversely strong relationship, and typically, the desired polynucleotide quantification is performed using the threshold cycle value. Polynucleotide quantification using real-time polymerase chain reaction has large absolute and relative quantification. Absolute quantification is a method of quantifying by generating a standard curve of critical cycle values for a polynucleotide amount by performing a real-time polymerase chain reaction with a sample having a known polynucleotide amount. Even if you do not know the amount, it is a way to compare the relative amount with other samples. For relative quantification, standard curves may or may not be used. In all these cases, in order to quantify, the threshold value must first be determined to calculate the threshold cycle value.

임계값을 결정하기 위한 방법으로 AFL(임의 형광 값: arbitrary fluorescence value) 이라고 불리는 미리 결정된 신호 레벨에 형광 신호 세기가 도달했을 때를 임계값으로 하는 방법, 증폭 프로파일 곡선의 이차 미분 계수의 최대값을 임계값으로 하는 방법 등이 있다. AFL을 이용하는 방법의 경우 초기 PCR 사이클에서의 평균적인 베이스라인 형광 레벨의 변화에 민감하다는 단점이 있고 미분을 이용하는 방법의 경우 노이즈에 민감하고 증폭 프로파일 곡선 각각에 대하여 따로 분석을 수행한다는 단점이 있었다. 상기 방법들로 적합한 표준 곡선이 만들어지지 않거나 신뢰할 수 없는 정량 결과가 나오는 경우, 통상적으로 사용자가 직접 임계값을 눈으로 보고 결정할 수 있는데, 이러한 경우에도 사용자의 주관적인 판단이 들어가기 때문에 폴리뉴클레오티드의 정량의 정확도를 낮출 수 있다. 따라서 보다 정확한 폴리뉴클레오티드 정량을 위하여 Real-time PCR의 증폭 프로파일 곡선 데이터로부터 정확한 임계값을 선택해야 하는 필요가 존재한다. A method for determining the threshold value is a threshold value when the fluorescence signal intensity reaches a predetermined signal level called AFL (arbitrary fluorescence value), and the maximum value of the second derivative of the amplification profile curve And a threshold value. The method using AFL has the disadvantage of being sensitive to the change in the average baseline fluorescence level in the initial PCR cycle, and the method using the derivative has the disadvantage of being sensitive to noise and separately analyzing each of the amplification profile curves. If these methods do not produce a suitable standard curve or produce an unreliable quantitative result, the user can typically visually determine the threshold value, even in this case because the subjective judgment of the user is used to determine the quantification of the polynucleotide. Can lower the accuracy. Therefore, there is a need to select the correct threshold from the amplification profile curve data of real-time PCR for more accurate polynucleotide quantification.

본 발명은 보다 정확한 폴리뉴클레오티드 정량을 하기 위한 방법을 제공한다. The present invention provides a method for more accurate polynucleotide quantification.

본 발명은 실시간 중합효소 연쇄 반응의 증폭 프로파일 곡선에서 보다 정확한 임계값을 선택하는 방법을 제공한다. The present invention provides a method for selecting a more accurate threshold in the amplification profile curve of a real time polymerase chain reaction.

본 발명은 표준 곡선을 사용하지 않는 폴리뉴클레오티드 정량에 있어서 보다 정확한 임계값을 선택하는 방법을 제공한다.  The present invention provides a method for selecting a more accurate threshold for polynucleotide quantification that does not use a standard curve.

본 발명의 첫 번째 양태는 실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭 프로파일 곡선으로부터 임계값을 선택하는 방법으로서, 상기 방법은A first aspect of the present invention is a method of selecting a threshold value from an amplification profile curve obtained by performing a real-time polymerase chain reaction.

(a) 동일한 샘플을 2개 이상 포함하는 복수 개의 샘플에 대해 폴리뉴클레오티드 중합효소 연쇄 반응을 수행하는 단계로서, 상기 중합효소 연쇄 반응은 복수 회의 증폭 사이클을 포함하고, 폴리뉴클레오티드의 양에 따른 신호를 제공할 수 있는 검출 가능한 프로브의 존재 하에서 수행하는 것인 단계;(a) performing a polynucleotide polymerase chain reaction on a plurality of samples including two or more identical samples, wherein the polymerase chain reaction includes a plurality of amplification cycles and provides a signal according to the amount of polynucleotides. Performing in the presence of a detectable probe that can provide;

(b) 각 샘플마다 상기 복수 회의 증폭 사이클 횟수에 따른 상기 프로브가 제공하는 신호 세기 값에 관한 증폭 프로파일(amplication profile) 곡선을 획득하는 단계;(b) obtaining an amplification profile curve for the signal strength value provided by the probe according to the number of amplification cycles for each sample;

(c) 상기 신호 세기 값 중에서 임계값(threshold)을 하나 선택하는 단계;(c) selecting one threshold from the signal strength values;

(d) 상기 증폭 프로파일 곡선들로부터 상기 선택한 임계값에 대응하는 임계 사이클(thresold cycle) 값을 산출하는 단계; (d) calculating a threshold cycle value corresponding to the selected threshold value from the amplification profile curves;

(e) 상기 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계;(e) calculating a variance value of threshold cycle values of the same samples;

(f) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e) 단계를 복수 회 반복하는 단계; 및(f) repeating steps (c), (d), and (e) a plurality of times by varying the threshold value to be selected; And

(g) 상기 (e) 단계에서 산출된 분산 값 중에서 가장 작은 분산 값을 산출시킨 상기 (c) 단계의 임계값을 최종 임계값으로 선택하는 단계를 포함하는 것인 방법을 제공한다. (g) selecting the threshold value of step (c) of calculating the smallest variance value among the variance values calculated in step (e) as a final threshold value.

상기 방법은 실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭프로파일 곡선으로부터 임계값을 선택하는 방법이다.The method selects a threshold value from an amplification profile curve obtained by performing a real-time polymerase chain reaction.

용어 "실시간 중합효소 연쇄 반응(real-time polymerase chain reaction: RT PCR)"은 폴리뉴클레오티드를 폴리머라제를 사용하여 증폭시키는 중합효소 연쇄 반응(polymerase chain reaction: PCR)을 개량한 기술로, PCR 수행시 폴리뉴클레오티드에 결합할 수 있는 형광 물질을 같이 넣어 증폭되는 폴리뉴클레오티드의 양의 증가를 형광 물질이 발산하는 형광의 세기에 의해 실시간으로 모니터링할 수 있는 기술을 의미한다. 상기 중합효소 연쇄 반응은 폴리뉴클레오티드를 dNTP, 프라이머, 폴리머라제 등과 함께 두고 변성(denaturation), 결합(annealing), 신장(elongation)의 온도를 달리하는 세 단계를 반복적으로 수행하여 폴리뉴클레오티드를 증폭시키는 반응을 의미한다. 상기 실시간 중합효소 연쇄 반응은 사용되는 형광 물질에 따라 인터컬레이팅(Intercalating)법, 택맨 프로브(TaqMan probe)법, 사이클링 프로브(cycling probe)법을 사용할 수 있고 이에 한정되는 것은 아니다. The term "real-time polymerase chain reaction (RT PCR)" is an improvement on the polymerase chain reaction (PCR) that amplifies polynucleotides using polymerases. It refers to a technology that can monitor in real time the increase in the amount of polynucleotide amplified by adding a fluorescent material capable of binding to the polynucleotide by the intensity of the fluorescence emitted by the fluorescent material. The polymerase chain reaction amplifies the polynucleotide by repeatedly performing three steps of varying the temperature of denaturation, annealing, and elongation with the polynucleotide as dNTP, primer, and polymerase. Means. The real-time polymerase chain reaction may use an intercalating method, a TaqMan probe method, or a cycling probe method, depending on the fluorescent material used, but is not limited thereto.

상기 방법은 (a) 동일한 샘플을 2개 이상 포함하는 복수 개의 샘플에 대해 폴리뉴클레오티드 중합효소 연쇄 반응을 수행하는 단계로서, 상기 중합효소 연쇄 반응은 복수 회의 증폭 사이클을 포함하고, 폴리뉴클레오티드의 양에 따른 신호를 제공할 수 있는 검출 가능한 프로브의 존재 하에서 수행하는 것인 단계를 포함한다. The method comprises the steps of (a) performing a polynucleotide polymerase chain reaction on a plurality of samples comprising two or more identical samples, wherein the polymerase chain reaction comprises a plurality of amplification cycles, Performing in the presence of a detectable probe capable of providing a signal accordingly.

상기 복수 개의 샘플은 실시간 중합효소 연쇄 반응으로 증폭시키고자 하는 폴리뉴클레오티드를 포함하는 복수 개의 샘플을 의미한다. 상기 복수 개의 샘플은 서로 동일하거나 상이한 농도의 폴리뉴클레오티드를 포함할 수 있고, 서로 동일하거나 상이한 서열을 갖는 폴리뉴클레오티드를 포함할 수 있다. 또한, 상기 복수 개의 샘플은 동일한 조직에서 채취한 세포들의 세포질을 포함하나 발현량을 알아보고자 하는 유전자에 따라 첨가하는 프라이머의 종류가 상이할 수 있다. 예를 들면, 상기 복수 개의 샘플은 각기 다른 종류 또는 동일한 종류의 세포에서 채취한 것일 수 있고, 발현량을 알아보고자하는 유전자에 따라 첨가하는 프라이머가 상이할 수 있다. The plurality of samples refers to a plurality of samples including polynucleotides to be amplified by real time polymerase chain reaction. The plurality of samples may include polynucleotides having the same or different concentrations of each other, and may include polynucleotides having the same or different sequences from each other. In addition, the plurality of samples include the cytoplasm of cells taken from the same tissue, but may be different in the type of primer added according to the gene to determine the expression amount. For example, the plurality of samples may be taken from different kinds or cells of the same kind, and primers added may be different depending on the gene to be expressed.

상기 (a)단계에서 복수 개의 샘플은 동일한 샘플이 2개 이상 포함된다. 상기 동일한 샘플은 실시간 중합효소 연쇄 반응을 수행하기 위한 내용물이 동일한 시료들을 의미한다. 즉, 첨가되는 폴리뉴클레오티드 서열, 종류, 농도 및 실시간 중합효소 연쇄 반응을 수행하기 위해 필요한 프라이머, dNTP, 형광 표시자 등과 같은 모든 재료를 동일하게 포함하는 샘플들을 의미한다. 상기 내용물이 '동일하게' 포함된다는 것은 실질적으로 그 종류 및 양이 동일한 것 뿐만 아니라, 당 업계의 통상의 기술자에게 동일하다고 추정되는 것을 의미한다. 예를 들면, 동일한 조건하에서 배양시킨 동일한 종류의 세포들로부터 채취한 동일한 양의 세포질은 실질적으로 세포마다 폴리뉴클레오티드 양이 미세하게 차이가 날 수 있으나 동일한 양의 폴리뉴클레오티드가 포함된 것으로 본다. In step (a), the plurality of samples include two or more identical samples. The same sample refers to samples having the same contents for performing a real-time polymerase chain reaction. That is, it means samples that contain the same polynucleotide sequence, type, concentration, and all the materials such as primers, dNTPs, fluorescent indicators, and the like necessary to perform real-time polymerase chain reaction. The inclusion of the same content in the same manner means that it is presumed to be substantially the same in kind and amount, as well as equivalent to those skilled in the art. For example, the same amount of cytoplasm taken from the same kind of cells cultured under the same conditions is considered to contain the same amount of polynucleotides although the amount of polynucleotides may vary substantially substantially from cell to cell.

상기 검출 가능한 프로브는 SYBR Green I, Ethidium bromide, YO-PRO-1 BOXTO와 같은 인터컬레이팅 염색제, 3' 말단에는 도너 플루오르포어(donor fluorephore) (FITC)가 표지되고 5' 말단에는 어셉터 플루오르포어(acceptor fluorophore)가 표지된 플루오르제닉 하이브리디제이션 올리고 프로브(fluoregenic hybridization oligoprobe), 택맨 프로브(TaqMan prob), 헤어핀 올리고프로브(Hairpin oligoprobe), 자가-형광 엠프리콘(self-fluorescing amplicon(sunrise primer & scorpion primer))를 포함하나 이에 한정되지는 않는다.The detectable probe is an intercalating dye such as SYBR Green I, Ethidium bromide, YO-PRO-1 BOXTO, labeled with donor fluorephore (FITC) at the 3 'end and acceptor fluorophore at the 5' end. (acceptor fluorophore) labeled fluorogenic hybridization oligoprobe, TaqMan prob, Hairpin oligoprobe, self-fluorescing amplicon (sunrise primer & scorpion) primers)), but not limited to these.

상기 방법은 (b) 각 샘플마다 상기 복수 회의 증폭 사이클 횟수에 따른 상기 프로브가 제공하는 신호 세기 값에 관한 복수 개의 증폭 프로파일(amplication profile) 곡선을 획득하는 단계를 포함한다. The method includes (b) obtaining a plurality of amplification profile curves for signal strength values provided by the probe according to the number of amplification cycles for each sample.

RT PCR을 수행하면 증폭 사이클 횟수가 증가함에 따라 폴리뉴클레오티드의 양이 증가하고 상기 프로브가 제공하는 신호 세기 값이 증가한다. 상기 증폭 프로파일 곡선은 이러한 신호 세기 값을 검출하여, 상기 증폭 사이클 횟수에 따라 상기 프로브가 제공하는 신호 세기 값을 나타내도록 한 관계 함수를 의미한다. 바람직하게는 상기 증폭 프로파일 곡선은 검출한 신호 세기를 수동 참조 프로브(passive reference dye)으로부터의 신호 세기로 나누어 표준화된 값인 Rn 또는 Rn 값에서 반응 초기 신호 세기 값의 증가가 나타나지 않는 영역(베이스라인 영역)의 Rn 값을 차감한 ΔRn을 y축으로 하고 증폭 사이클 횟수를 x축으로 한 그래프로 나타낼 수 있다.RT PCR increases the number of amplification cycles and increases the amount of polynucleotides and the signal strength value provided by the probe. The amplification profile curve refers to a relationship function that detects such signal strength values and indicates signal strength values provided by the probe according to the number of amplification cycles. Preferably, the amplification profile curve is obtained by dividing the detected signal strength by the signal strength from the passive reference dye, where the increase in the response initial signal strength value does not appear at the normalized value of Rn or Rn (baseline region). ΔRn after subtracting the Rn value of) is represented by the y-axis and the number of amplification cycles on the x-axis.

상기 방법은 (c) 상기 신호 세기 값 중에서 임계값을 하나 선택하는 단계를 포함한다. The method includes (c) selecting one threshold from the signal strength values.

상기 임계값은 상기 증폭 프로파일 곡선에서 적용된 신호 세기 값 중 임의적으로 선택한 하나의 값이 될 수 있다. 바람직하게는, 상기 임계값은 상기 증폭 프로파일 곡선에서 베이스라인 영역 및 정체 상태 영역 사이의 신호 세기 값, 더 바람직하게는 증폭 프로파일 곡선에서 베이스라인 영역에서 지수적 영역으로 넘어가는 지점의 신호 세기 값이 될 수 있다. 상기 베이스 라인 영역은 상기 증폭 프로파일 곡선에서 Real-time PCR 반응 초기 신호 세기 값이 지속적으로 증가하지 않는 영역을, 상기 지수적 영역은 상기 증폭 프로파일 곡선에서 신호 세기 값이 증가하는 영역을, 상기 정체 상태 영역은 상기 증폭 프로파일 곡선에서 상기 지수적 영역 다음에 나타나는 신호 세기 값이 증가하지 않는 영역을 의미한다. 상기 베이스 라인 영역은 폴리뉴클레오티드의 양이 아직 검출 가능한 신호 세기 값을 갖는 폴리뉴클레오티드 양에 도달하지 못하였기 때문에 나타난다. The threshold may be a randomly selected one of the signal strength values applied in the amplification profile curve. Preferably, the threshold is a signal strength value between a baseline region and a stationary region in the amplification profile curve, more preferably a signal strength value at a point from the baseline region to an exponential region in the amplification profile curve. Can be. The baseline region is a region in which the initial signal strength value of the real-time PCR reaction does not continuously increase in the amplification profile curve, and the exponential region is a region in which the signal strength value increases in the amplification profile curve, the congestion state. An area means an area in which the signal intensity value that appears after the exponential area does not increase in the amplification profile curve. The baseline region appears because the amount of polynucleotide has not yet reached the polynucleotide amount with a detectable signal intensity value.

상기 방법은 (d) 상기 복수 개의 증폭 프로파일 곡선으로부터 상기 선택한 임계값에 대응하는 임계 사이클 값을 산출하는 단계를 포함한다. The method includes (d) calculating a threshold cycle value corresponding to the selected threshold value from the plurality of amplification profile curves.

용어 "임계 사이클(thresold cycle) 값"은 상기 증폭 프로파일 곡선에서 신호 세기 값이 임계값일 때의 증폭 사이클 횟수 값을 의미한다. 초기 폴리뉴클레오티드 양이 많을수록 적은 증폭 사이클 횟수에서 지수적 영역이 시작된다. 따라서 초기 폴리뉴클레오티드 양이 많을수록 작은 임계 사이클 값을 가진다.The term "thresold cycle value" means the value of the number of amplification cycles when the signal strength value in the amplification profile curve is a threshold. The higher the initial polynucleotide amount, the more exponential regions begin at fewer amplification cycles. Therefore, the higher the initial polynucleotide amount, the smaller the threshold cycle value.

상기 방법은 (e) 상기 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계를 포함한다. The method includes (e) calculating a variance value of threshold cycle values of the same samples.

상기 (e)단계는 상기 (c), (d) 단계를 통해 산출된, 동일한 샘플들의 증폭 프로파일 곡선들로부터 얻은 임계 사이클 값들의 분산을 산출하는 단계이다. 임계 사이클 값들을 {x1, x2,...,xn}이라 하고 이러한 임계 사이클 값들의 평균을 m이라 하면 상기 분산 σ2는 다음과 같고, 이는 당업자에게 잘 알려져 있다.Step (e) is a step of calculating the variance of the critical cycle values obtained from the amplification profile curves of the same samples calculated through steps (c) and (d). When the critical cycle values are {x 1 , x 2 , ..., x n } and the average of these critical cycle values is m, the variance σ 2 is as follows, which is well known to those skilled in the art.

Figure pat00001
Figure pat00001

동일한 시료를 포함하는 샘플로 동일한 조건 하에서 실시간 중합효소 연쇄 반응을 수행하면 이론상으로는 동일한 증폭 곡선이 생성되어야 하지만, 현실적으로는 완벽히 일치하는 증폭 곡선이 생성되기 힘들다. 따라서 상기 (d)단계에서 동일한 샘플들로부터 얻은 임계 사이클 값들도 모두 동일하지 않을 수 있고 따라서 분산이 0이 아닐 수 있다. Performing real-time polymerase chain reaction under the same conditions with a sample containing the same sample should theoretically produce the same amplification curve, but in reality it is difficult to produce a perfectly matching amplification curve. Therefore, the critical cycle values obtained from the same samples in step (d) may not all be the same, and thus the variance may not be zero.

상기 방법은 (f) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e) 단계를 복수 회 반복하는 단계를 포함한다.The method includes (f) repeating steps (c), (d), and (e) a plurality of times by varying the threshold to select.

임계값을 매번 상이하게 선택하여 (c), (d), (e) 단계를 반복하면 여러 개의 임계값이 선택되고 선택된 임계값 각각에 대한 임계 사이클 값들이 산출될 것이다. 상기 복수 회는 사용자가 정한 0 이상의 정수 회이고, 그 횟수가 크면 클수록 보다 최적의 임계값을 얻을 수 있는 가능성이 커질 것이다. 바람직하게는 증폭프로파일 곡선의 베이스 라인 영역에서 지수적 영역으로 넘어가는 부분의 신호 세기 값을 포함하는 임의의 영역에서 임계값을 상이하게 복수 회 선택할 수 있거나 상기 영역을 복수 회 균등 분할하여 각 값을 임계값으로 선택할 수 있다. Repeating steps (c), (d), and (e) by selecting different thresholds each time will select several thresholds and yield threshold cycle values for each of the selected thresholds. The plurality of times is an integer number of times greater than or equal to zero determined by the user, and the larger the number of times, the greater the possibility of obtaining an optimal threshold value. Preferably, the threshold value may be differently selected a plurality of times in any region including the signal intensity value of the portion of the baseline region of the amplification profile curve that passes from the exponential region to the exponential region, or the region may be equally divided multiple times. You can select it as a threshold.

상기 방법은 (g) 상기 (e) 단계에서 산출된 분산 값 중에서 가장 작은 분산 값을 산출시킨 상기 (c) 단계의 임계값을 최종 임계값으로 선택하는 단계를 포함하는 것인 방법을 포함한다. The method includes the step of (g) selecting the threshold value of the step (c) of calculating the smallest variance value among the variance values calculated in the step (e) as the final threshold value.

상기 (e) 단계에서 산출한 분산은 동일한 샘플들로부터 얻은 임계 사이클 값 간의 분산이고, 동일한 샘플로부터 얻은 임계 사이클 값은 이론상 동일해야 하므로 이 값이 작을수록 실제 폴리뉴클레오티드 양을 잘 나타내는 임계 사이클 값들이라 할 수 있다. 따라서 동일한 샘플들의 임계 사이클 값들의 분산이 가장 작은 값을 가지는 임계값을 최종 임계값으로 선택한다. The variances calculated in step (e) are the variances between the threshold cycle values obtained from the same samples, and the critical cycle values obtained from the same samples should be identical in theory, so the smaller these values are the threshold cycle values representing the actual amount of polynucleotides. can do. Therefore, the threshold having the smallest variance of the threshold cycle values of the same samples is selected as the final threshold.

본 발명의 두 번째 양태는 실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭 프로파일 곡선으로부터 임계값을 선택하는 방법으로서, 상기 방법은A second aspect of the present invention is a method of selecting a threshold value from an amplification profile curve obtained by performing a real-time polymerase chain reaction.

(a) 동일한 샘플을 2개 이상 포함하는 복수 개의 샘플에 대해 폴리뉴클레오티드 중합효소 연쇄 반응을 수행하는 단계로서, 상기 중합효소 연쇄 반응은 복수 회의 증폭 사이클을 포함하고, 폴리뉴클레오티드의 양에 따른 신호를 제공할 수 있는 검출 가능한 프로브의 존재 하에서 수행하는 것인 단계;(a) performing a polynucleotide polymerase chain reaction on a plurality of samples including two or more identical samples, wherein the polymerase chain reaction includes a plurality of amplification cycles and provides a signal according to the amount of polynucleotides. Performing in the presence of a detectable probe that can provide;

(b) 각 샘플마다 상기 복수 회의 증폭 사이클 횟수에 따른 상기 프로브가 제공하는 신호 세기 값에 관한 복수 개의 증폭 프로파일(amplication profile) 곡선을 획득하는 단계;(b) acquiring a plurality of amplification profile curves for signal strength values provided by the probe according to the number of amplification cycles for each sample;

(c) 상기 신호 세기 값 중에서 임계값(threshold)을 하나 선택하는 단계;(c) selecting one threshold from the signal strength values;

(d) 상기 복수 개의 증폭 프로파일 곡선들로부터 상기 선택한 임계값에 대응하는 임계 사이클(thresold cycle) 값을 산출하는 단계; (d) calculating a threshold cycle value corresponding to the selected threshold value from the plurality of amplification profile curves;

(e) 상기 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계;(e) calculating a variance value of threshold cycle values of the same samples;

(f) 상기 동일한 샘플들의 임계 사이클 값들로부터 대표값을 산출하는 단계; (f) calculating a representative value from threshold cycle values of the same samples;

(g) 상기 동일한 샘플들을 제외한 나머지 샘플들의 임계 사이클 값들 및 상기 (f) 단계에서 산출한 대표값의 분산 값을 산출하는 단계; (g) calculating the variance values of the threshold cycle values of the remaining samples except for the same samples and the representative value calculated in step (f);

(h) 상기 (e) 단계에서 산출한 분산 값을 상기 (g)단계에서 산출한 분산 값으로 나눈 값을 산출하는 단계;(h) calculating a value obtained by dividing the variance value calculated in step (e) by the variance value calculated in step (g);

(i) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e), (f), (g), (h) 단계를 복수 회 반복하는 단계; 및(i) repeating steps (c), (d), (e), (f), (g), and (h) a plurality of times with different threshold values selected; And

(j) 상기 (h) 단계에서 산출한 값 중 가장 작은 값을 산출시킨 상기 (c)단계의 임계값을 최종 임계값으로 선택하는 단계를 포함하는 것인 방법을 제공한다. (j) selecting the threshold value of the step (c) of calculating the smallest value among the values calculated in the step (h) as a final threshold value.

상기 두 번째 양태가 제공하는 본 발명의 방법은 본 발명의 첫 번째 양태가 제공하는 방법과 (a) 단계부터 (e) 단계까지는 동일하다. The method of the present invention provided by the second aspect is the same from step (a) to step (e) as the method provided by the first aspect of the present invention.

상기 방법은 (f) 상기 동일한 샘플들의 임계 사이클 값들로부터 대표값을 산출하는 단계를 포함한다. The method includes (f) calculating a representative value from threshold cycle values of the same samples.

상기 (f) 단계는 동일한 샘플들로부터 얻은 임계 사이클 값들 중 이들을 대표할 수 있는 값을 산출하는 단계로서 산출하는 방법은 사용자가 임의로 결정할 수 있다. 예를 들면 동일한 샘플로부터 얻은 임계 사이클 값들의 평균값, 중간값, 또는 이들 중 임의의 값일 수 있으나 이에 제한되지 않는다. 상기 (f) 단계에서 대표값을 산출하는 이유는 다음에 오는 (g) 단계에서 서로 상이한 샘플들의 임계 사이클 값들 간 분산을 구하는데, 동일한 샘플들의 경우 동일한 샘플들을 대표하는 하나의 임계 사이클 값이 분산 계산에 산입되도록 하기 위해서이다. Step (f) is a step of calculating a value representative of these of the critical cycle values obtained from the same samples, the method of calculating can be arbitrarily determined by the user. For example, it may be, but is not limited to, an average value, a median value, or any of these values of critical cycle values obtained from the same sample. The reason for calculating the representative value in the step (f) is to obtain the variance between the threshold cycle values of the different samples in the following step (g), where one threshold cycle value representing the same samples is distributed for the same samples. To be included in the calculation.

상기 방법은 (g) 상기 동일한 샘플들을 제외한 나머지 샘플들의 임계 사이클 값들 및 상기 (f) 단계에서 산출한 대표값의 분산 값을 산출하는 단계를 포함한다. The method includes (g) calculating the variance values of the threshold cycle values of the remaining samples except for the same samples and the representative value calculated in step (f).

상기 (g) 단계는 서로 상이한 샘플들의 임계 사이클 값들 간 분산 값을 산출하는 단계이다. 동일한 샘플들이 2개 이상 존재하는 경우 상기 (f) 단계에서 산출한 대표값을 그러한 동일한 샘플들에 대한 임계 사이클 값으로 하고, 동일한 샘플들이 2개 이상 존재하지 않는 샘플의 경우, (d) 단계에서 산출된 임계 사이클 값을 그대로 각각의 임계 사이클 값으로 하여 모든 임계 사이클 값들 간 분산을 산출한다. Step (g) is a step of calculating a variance value between threshold cycle values of different samples. If there are two or more identical samples, the representative value calculated in step (f) is the threshold cycle value for those same samples, and in the case of a sample in which two or more identical samples do not exist, in step (d) The variance between all the threshold cycle values is calculated by using the calculated threshold cycle value as each threshold cycle value as it is.

상기 방법은 (h) 상기 (e) 단계에서 산출한 분산 값을 상기 (g) 단계에서 산출한 분산 값으로 나눈 값을 산출하는 단계, (i) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e), (f), (g), (h) 단계를 복수 회 반복하는 단계; 및 (j) 상기 (h) 단계에서 산출한 값 중 가장 작은 값을 산출시킨 상기 (c)단계의 임계값을 최종 임계값으로 선택하는 단계를 포함한다. The method comprises the steps of: (h) calculating a value obtained by dividing the variance value calculated in step (e) by the variance value calculated in step (g), (i) varying a threshold value to be selected, and (c) repeating steps (d), (e), (f), (g), and (h) a plurality of times; And (j) selecting the threshold value of the step (c) of calculating the smallest value among the values calculated in the step (h) as the final threshold value.

상기 (i) 단계에서 임계값을 복수 회 선택하는 방법은 본 발명의 첫 번째 양태가 제공하는 방법의 (f) 단계에 대해 상기 기술한 바와 동일하다. 상기 (h) 단계에서 '(e) 단계에서 산출한 분산(이하 intraclass variance라고 지칭함)'은 서로 동일한 샘플의 임계 사이클 값 간 분산이고 '(g) 단계에서 산출한 분산(이하 interclass variance라고 지칭함)'은 서로 상이한 샘플의 임계 사이클 값 간 분산이다. intraclass variance는 동일한 샘플들로부터 얻은 임계 사이클 값 간의 분산이고, 동일한 샘플로부터 얻은 임계 사이클 값은 이론상 동일해야 하므로 이 값이 작을수록 실제 폴리뉴클레오티드 양을 잘 나타내는 임계 사이클 값들이라 할 수 있다. interclass variance는 서로 구성이 상이한 시료를 포함하는 상이한 샘플들의 임계 사이클 값 간의 분산이다. 서로 상이한 샘플들은 우연적으로 유사한 농도의 폴리뉴클레오티드를 포함하고 있을 수도 있지만, 일반적으로 폴리뉴클레오티드의 양이 다를 것이다. 따라서 interclass variance가 클수록 서로 다른 폴리뉴클레오티드 양을 보다 잘 분리하여 표시하는 것이므로 폴리뉴클레오티드 정량을 보다 정확하게 할 수 있다. 결론적으로 intraclass variance 값이 보다 작으면서, interclass variance 값이 보다 큰 임계값의 지점에서 동일한 폴리뉴클레오티드 양에 대한 임계 사이클 값들은 가까이에 있고, 상이한 폴리뉴클레오티드 양에 대한 임계 사이클 값들은 멀리 떨어져 있는, 실제 폴리뉴클레오티드 양을 잘 반영한 임계 사이클 값들을 얻을 수 있을 것이고 이러한 임계값을 사용하여 정량을 하였을 때 보다 정확한 폴리뉴클레오티드의 정량을 할 수 있다. 이러한 조건을 만족시키기 위해 상기 (h) 단계에서는 intraclass variance 값을 interclass variance 값으로 나눈 값을 산출하고 상기 (j) 단계에서 (h) 단계에서 산출한 값 중 가장 작은 값을 산출시킨 임계값을 최종 임계값으로 선택하게 된다. 본원 발명은 클래스 간 분산을 최대로 하고 클래스 내 분산을 최소로 하는 특정 값을 찾는다는 점에서 데이터의 분리도를 최대로 하는 벡터를 찾는 방법인 linear discriminant analysis(LDA)과 유사한 특성을 갖는다. The method of selecting the threshold value a plurality of times in step (i) is the same as described above for step (f) of the method provided by the first aspect of the present invention. In step (h), the variance calculated in step (e) (hereinafter referred to as intraclass variance) is the variance between threshold cycle values of the same sample and the variance calculated in step (g) (hereinafter referred to as interclass variance). Is the variance between the threshold cycle values of different samples. The intraclass variance is the variance between the threshold cycle values obtained from the same samples, and since the critical cycle values from the same sample should be the same in theory, the smaller this value, the better the threshold cycle values representing the actual polynucleotide amount. Interclass variance is the variance between the threshold cycle values of different samples including samples of different composition. Different samples may inadvertently contain similar concentrations of polynucleotides, but generally the amount of polynucleotides will be different. Therefore, the greater the interclass variance, the better the separation of different polynucleotide amounts and the more accurate polynucleotide quantification. In conclusion, the smaller the intraclass variance value, the closer the critical cycle values for the same polynucleotide amount are at the point of the threshold where the interclass variance value is higher, and the critical cycle values for the different polynucleotide amounts are far apart. Threshold cycle values that well reflect the amount of polynucleotides can be obtained and more accurate quantification of polynucleotides can be achieved when these thresholds are used for quantification. In order to satisfy this condition, in step (h), the value obtained by dividing the intraclass variance value by the interclass variance value is calculated, and the threshold value that calculates the smallest value among the values calculated in step (j) to (h) is final. The threshold will be selected. The present invention has similar characteristics to linear discriminant analysis (LDA), which is a method of finding a vector that maximizes the degree of separation of data in terms of finding a specific value that maximizes the variance between classes and minimizes the variance in the class.

기존의 임계값을 선택하는 방법 중 미분 계수를 사용하는 방법은 각각의 증폭 프로파일 곡선에 대해 따로 미분을 하여 임계값을 산출한 뒤, 이 중의 대표값을 임계값으로 선택하므로 이는 모든 증폭 프로파일 곡선의 특징을 통합적으로 반영한다고 보기 힘들었다. 본원 발명의 방법은 모든 증폭 프로파일 곡선 데이터를 통합적으로 고려하므로 실험 전체의 결과가 반영된 결과값을 얻을 수 있다. 또한 이렇게 전반적인 실험 결과가 통합적으로 반영되므로 전반적인 데이터의 흐름에 어긋나는 노이즈를 더 많이 배제시킬 수 있다. Among the methods of selecting the existing threshold value, the method of using the differential coefficient calculates the threshold by differentiating for each amplification profile curve and selects the representative value as the threshold value. It was hard to see the features integrated. Since the method of the present invention considers all amplification profile curve data integrally, a result value reflecting the results of the entire experiment can be obtained. In addition, the overall experimental results are integrated to eliminate more noise that is inconsistent with the overall data flow.

본 발명의 일 구체예는 상기 (e) 단계에서 2개 이상의 값이 산출되는 경우, 상기 (g) 단계 또는 상기 (h)단계에서 상기 (e) 단계에서 산출한 분산 값은 상기 (e) 단계에서 산출한 분산 값들의 대표값인 것인 방법을 제공한다. According to one embodiment of the present invention, when two or more values are calculated in step (e), the dispersion value calculated in step (e) in step (g) or step (h) is step (e). It provides a method that is representative of the variance values calculated in.

통상적으로 실험을 수행하는 경우 실험의 신뢰도와 정확도를 높이기 위해 동일한 실험을 여러 번 반복한다. 실시간 중합효소 연쇄 반응을 수행하는 경우에도 각 샘플마다 동일한 샘플을 2개 이상 만들어서 실험을 수행할 수 있다. 즉, 한 세트의 동일한 샘플들뿐만 아니라, 여러 세트의 동일한 샘플들(이 때, 각 세트 간 샘플들은 서로 포함하는 내용물의 구성이 상이하다)이 실험에 사용될 수 있다. 이러한 경우 상기 (e)단계에서 동일한 샘플에 대한 분산이 복수 개가 되므로 상기 (g) 단계 또는 상기 (h)단계에서 intraclass varience에 해당하는 "(e) 단계에서 산출한 분산 값"에 복수개의 분산 값들로부터 산출한 대표값을 대입한다. 대표값을 구하는 방법은 사용자가 임의로 정할 수 있으며 당 업계에 잘 알려진 여러 가지 방법을 사용할 수 있다. 예를 들면, 대표값은 변수들의 평균값, 중간값, 또는 변수들 중 임의의 값이 될 수 있다. In general, when the experiment is performed, the same experiment is repeated several times to increase the reliability and accuracy of the experiment. Even when real-time polymerase chain reaction is performed, the experiment may be performed by making two or more identical samples for each sample. That is, not only one set of identical samples but also several sets of identical samples (in which case, the samples between each set have different configurations of contents included in each other) may be used in the experiment. In this case, since there are a plurality of variances for the same sample in step (e), a plurality of variance values may be added to "variance values calculated in step (e)" corresponding to intraclass varience in step (g) or step (h). Substitute the representative value calculated from Representative values can be determined by the user and various methods well known in the art can be used. For example, the representative value can be the mean, median, or any of the variables.

본 발명의 일 구체예는 상기 (f), (g) 또는 (h)단계에서 산출하는 대표값은 평균값인 것인 방법을 제공한다. One embodiment of the present invention provides a method in which the representative value calculated in step (f), (g) or (h) is an average value.

본 발명의 일 구체예에 있어서, 상기 (e)단계는 동일한 샘플들의 임계 사이클 값들의 평균값과 일정 값 이상 차이가 나는 임계 사이클 값은 제외하고, 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계인 것인 방법을 제공한다. In one embodiment of the present invention, step (e) calculates a variance value of the threshold cycle values of the same samples, except for a threshold cycle value that differs from the average value of the threshold cycle values of the same samples by more than a predetermined value. It provides a method that is.

동일한 샘플로부터 얻은 임계 사이클 값들은 이론상 동일해야 하고 서로 간 오차가 작을수록 실험의 신뢰도가 높아진다. 동일한 샘플로부터 얻은 임계 사이클 값 중 다른 임계 사이클 값들과 차이가 크게 벌어지는 임계 사이클 값이 있다면 이는 폴리뉴클레오티드의 양을 정확히 반영하는 값이라기 보단 실험자의 실험 미숙, 시료의 오염, 측정 장비의 오차 등으로 생긴 노이즈일 가능성이 높다. 따라서 이러한 값은 제외하고 분산을 산출하는 것이 최종적으로 보다 정확한 임계값을 선택하는 데 있어 도움이 될 것이다. 상기 방법에서는 이러한 점을 반영하여 임계 사이클 값들의 평균값과 일정 값 이상 차이가 나는 임계 사이클 값은 제외하고 분산을 산출하도록 하였다. 상기 일정 값은 사용자가 생각하였을 때 노이즈라고 간주될 만한 오차값으로 사용자가 임의로 정할 수 있다. The critical cycle values from the same sample should be identical in theory, and the smaller the error between them, the more reliable the experiment. If any of the critical cycle values obtained from the same sample differ greatly from the other critical cycle values, this is a value that accurately reflects the amount of polynucleotides, rather than the experimenter's immaturity, contamination of the sample, or error in measuring equipment. Most likely noise. Therefore, calculating these variances, excluding these values, will help you choose a more accurate threshold. In this method, the variance is calculated by excluding the critical cycle values that differ by more than a predetermined value from the average value of the critical cycle values. The predetermined value may be arbitrarily set by the user as an error value that may be regarded as noise when the user thinks.

본 발명을 사용하였을 때 표준 곡선을 사용하지 않는 폴리뉴클레오티드 정량에 있어서도 보다 정확한 임계값을 선택하여 정확한 폴리뉴클레오티드 정량을 할 수 있다.When using the present invention, even in the quantification of polynucleotides that do not use a standard curve, more accurate threshold values can be selected for accurate polynucleotide quantification.

도 1은 실시간 중합효소 연쇄 반응을 수행하여 얻을 수 있는 일반적인 증폭 프로파일 곡선을 나타낸다.
도 2는 초기 폴리뉴클레오티드 양을 달리하여 실시간 중합효소 연쇄 반응을 수행하였을 때의 증폭 프로파일 곡선들, 임계값 및 이에 따른 임계 사이클 값들(CT)을 나타낸다.
도 3은 실시예 1에 따른 실시간 중합효소 연쇄반응을 수행하여 획득한 증폭 프로파일 곡선을 나타낸다.
도 4는 S18의 증폭 프로파일 곡선에서 0 내지 5의 ΔRn값이 임계값으로 선택되었을 때의 intraclass variance 값, interclass variance 값, 그들의 비율 (intraclass variance 값/ interclass variance 값)을 나타낸다.
도 5는 본원 발명의 방법을 사용하여 산출한 분산에서 Applied Biosystems사의 7500 Real-Time PCR 기계를 사용하여 산출한 분산을 차감한 결과를 나타낸다. 최종 임계값으로부터 산출한 동일한 4개의 샘플들의 임계사이클 값들 간 분산을 산출하여 총 24개의 분산이 생성된다.
Figure 1 shows a general amplification profile curve that can be obtained by performing a real-time polymerase chain reaction.
FIG. 2 shows amplification profile curves, thresholds, and thus threshold cycle values (CT) when real-time polymerase chain reactions were performed with different initial polynucleotide amounts.
Figure 3 shows the amplification profile curve obtained by performing a real-time polymerase chain reaction according to Example 1.
4 shows intraclass variance values, interclass variance values, and their ratios (intraclass variance values / interclass variance values) when ΔRn values of 0 to 5 are selected as threshold values in the amplification profile curve of S18.
Figure 5 shows the results obtained by subtracting the variance calculated using the Applied Biosystems 7500 Real-Time PCR machine from the variance calculated using the method of the present invention. A total of 24 variances are generated by calculating the variance between the thresholdcycle values of the same four samples calculated from the last threshold.

실시예 1: 임계값의 선택 방법Example 1 Selection of Thresholds

조직에 따른 18S, OGDH, EGR3, OSGEP, MAOB, SERPING1 유전자의 상대적 발현량을 알아보기위해 실시간 중합효소 연쇄반응을 수행하였다. 18S 유전자의 발현량이 대조군으로 사용되었다. Real-time polymerase chain reaction was performed to determine the relative expression levels of 18S, OGDH, EGR3, OSGEP, MAOB, and SERPING1 genes. The expression level of the 18S gene was used as a control.

OGDH 유전자의 발현량을 알아보기 위해 쥐의 뇌, 신장, 간, 심장에 존재하는 세포의 세포질을 각각 별개로 추출하여 OGDH 유전자의 mRNA를 증폭시킬 수 있는 프라이머 쌍을 첨가하였고, 동일한 샘플을 4개씩 만들어 OGDH 유전자 발현량에 관한 총 16개의 샘플을 만들었다. In order to determine the expression level of OGDH gene, a pair of primers were added to extract the cytoplasm of cells in the rat brain, kidney, liver, and heart, and to amplify the mRNA of OGDH gene. In total, 16 samples of OGDH gene expression were made.

18S, EGR3, OSGEP, MAOB, SERPING1 유전자에 대해서도 이와 동일한 방식으로 샘플을 만들어 총 96개의 샘플을 사용하여 Applied Biosystems사의 7500 Real-Time PCR 기계로 실시간 중합효소 연쇄 반응을 수행하였다. 증폭 사이클 수는 40회였고 사용된 형광 프로브는 TaqMan 프로브였다. 상기 조건하에서 실시간 중합효소 연쇄반응을 수행하여 획득한 증폭 프로파일 곡선을 도 3에 나타낸다 (y축의 값(신호 세기 값)은 ΔRn으로 나타냄). Samples were made in the same manner for the 18S, EGR3, OSGEP, MAOB, and SERPING1 genes, and real-time polymerase chain reaction was performed using Applied Biosystems' 7500 Real-Time PCR machine using a total of 96 samples. The number of amplification cycles was 40 and the fluorescent probe used was a TaqMan probe. The amplification profile curve obtained by performing the real-time polymerase chain reaction under the above conditions is shown in FIG. 3 (the value of the y-axis (signal intensity value) is represented by ΔRn).

OGDH 유전자 발현량에 관한 16개의 증폭 프로파일 곡선의 데이터로부터 0 내지 5의 값을 갖는 ΔRn값 각각을 임계값으로 하여 임계 사이클 값을 산출하였다. 동일한 샘플들의 임계 사이클 값들 간의 분산을 구해서 (각 조직 별로 분산이 하나씩 산출되어 총 4개의 분산 값이 산출됨) 그들의 평균값을 intraclass variance 값으로 하였다. 각각 조직별로 동일한 샘플들의 임계 사이클 값들의 평균값을 구하여 (조직마다 평균값이 하나씩 산출되어 총 4개의 평균값이 산출됨) 그 평균값들을 조직의 대표값으로하여 평균값들 간의 분산 값을 interclass variance 값으로 하였다. intraclass variance 값을 interclass variance 값으로 나누어 그 값이 가장 작을 때의 임계값을 최종 임계값으로 선택하였다. 0 내지 5의 ΔRn이 임계값으로 선택되었을 때의 intraclass variance 값, interclass variance 값, 그들의 비율 (intraclass variance 값/ interclass variance 값)이 도 4에 나타난다. 상기와 동일한 방식으로 각 유전자마다 최종 임계값을 선택하였고, 18S, OGDH, EGR3, OSGEP, MAOB, SERPING1 유전자의 최종 임계값은 0.7000, 0.4000, 0.2000, 0.2000, 0.1000, 0.2000였다.From the data of 16 amplification profile curves regarding the amount of OGDH gene expression, a threshold cycle value was calculated using each ΔRn value having a value of 0 to 5 as a threshold. The variances between the critical cycle values of the same samples were obtained (one variance was calculated for each tissue, resulting in a total of four variances) and their average was taken as the intraclass variance value. The average value of the critical cycle values of the same samples for each tissue was calculated (the average value was calculated for each tissue, and a total of four average values were calculated). The average value was used as the representative value of the tissue. The intraclass variance value was divided by the interclass variance value and the threshold when the value was the smallest was selected as the final threshold value. The intraclass variance value, interclass variance value, and their ratio (intraclass variance value / interclass variance value) when ΔRn of 0 to 5 are selected as thresholds are shown in FIG. 4. Final thresholds were selected for each gene in the same manner as above, and the final thresholds of the 18S, OGDH, EGR3, OSGEP, MAOB, and SERPING1 genes were 0.7000, 0.4000, 0.2000, 0.2000, 0.1000, and 0.2000.

본원 발명의 방법을 사용하여 산출한 상기 최종 임계 값들에서의 동일한 샘플 간 분산(4개씩 24세트)은 Applied Biosystems사의 7500 Real-Time PCR 기계를 사용하여 산출한 분산 보다 작았다(도 5). 동일한 4개의 샘플은 이론상 동일한 임계 사이클 값을 가져야 하므로 증폭 프로파일 곡선에서 동일한 샘플간 분산이 보다 작은 최적의 임계값을 선택한 본원 발명의 방법이 보다 정확한 정량을 할 수 있음을 알 수 있다. The same intersample variance (24 sets of 4) at the final thresholds calculated using the method of the present invention was smaller than the variance calculated using the 7500 Real-Time PCR machine from Applied Biosystems (FIG. 5). Since the same four samples should theoretically have the same threshold cycle value, it can be seen that the method of the present invention, which selects an optimal threshold with a smaller variance between identical samples in the amplification profile curve, allows for more accurate quantification.

[실시예 1을 수행하는데 사용된 Matlab 코드][Matlab code used to perform Example 1]

function [Threshold CtList] = comparative_Ct(deltaRn,sampleIndex,numSamples,eachIndex) function [Threshold CtList] = comparative_Ct (deltaRn, sampleIndex, numSamples, eachIndex)

numCycles = 40;numCycles = 40;

mx = max(max(deltaRn(:,sampleIndex)));mx = max (max (deltaRn (:, sampleIndex)));

ThresholdList = 0.1:0.1:mx;ThresholdList = 0.1: 0.1: mx;

thresholdLength = length(ThresholdList);thresholdLength = length (ThresholdList);

CtMatrix = zeros(thresholdLength,length(sampleIndex)); CtMatrix = zeros (thresholdLength, length (sampleIndex));

for wellIndex = 1:length(sampleIndex)for wellIndex = 1: length (sampleIndex)

CtMatrix(:,wellIndex) = compCtMatrix(deltaRn,ThresholdList,sampleIndex(wellIndex),numCycles);    CtMatrix (:, wellIndex) = compCtMatrix (deltaRn, ThresholdList, sampleIndex (wellIndex), numCycles);

end end

averageSample = zeros(thresholdLength, numSamples);averageSample = zeros (thresholdLength, numSamples);

var_List = zeros(thresholdLength, numSamples);var_List = zeros (thresholdLength, numSamples);

for sampleId = 1:numSamplesfor sampleId = 1: numSamples

index = eachIndex(sampleId,:);    index = eachIndex (sampleId, :);

averageSample(:,sampleId) = mean(CtMatrix(:,index),2);    averageSample (:, sampleId) = mean (CtMatrix (:, index), 2);

var_List(:,sampleId) = var(CtMatrix(:,index),[],2);    var_List (:, sampleId) = var (CtMatrix (:, index), [], 2);

endend

[X I] = min(sum(var_List,2)./var(averageSample,[],2));[X I] = min (sum (var_List, 2) ./ var (averageSample, [], 2));

Threshold = ThresholdList(I);Threshold = ThresholdList (I);

CtList = CtMatrix(I,:);CtList = CtMatrix (I, :);

Claims (6)

실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭 프로파일 곡선으로부터 임계값을 선택하는 방법으로서, 상기 방법은
(a) 동일한 샘플을 2개 이상 포함하는 복수 개의 샘플에 대해 폴리뉴클레오티드 중합효소 연쇄 반응을 수행하는 단계로서, 상기 중합효소 연쇄 반응은 복수 회의 증폭 사이클을 포함하고, 폴리뉴클레오티드의 양에 따른 신호를 제공할 수 있는 검출 가능한 프로브의 존재 하에서 수행하는 것인 단계;
(b) 각 샘플마다 상기 복수 회의 증폭 사이클 횟수에 따른 상기 프로브가 제공하는 신호 세기 값에 관한 증폭 프로파일(amplication profile) 곡선을 획득하는 단계;
(c) 상기 신호 세기 값 중에서 임계값(threshold)을 하나 선택하는 단계;
(d) 상기 증폭 프로파일 곡선들로부터 상기 선택한 임계값에 대응하는 임계 사이클(thresold cycle) 값을 산출하는 단계;
(e) 상기 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계;
(f) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e) 단계를 복수 회 반복하는 단계; 및
(g) 상기 (e) 단계에서 산출된 분산 값 중에서 가장 작은 분산 값을 산출시킨 상기 (c) 단계의 임계값을 최종 임계값으로 선택하는 단계를 포함하는 것인 방법.
A method of selecting a threshold value from an amplification profile curve obtained by performing a real-time polymerase chain reaction, wherein the method
(a) performing a polynucleotide polymerase chain reaction on a plurality of samples including two or more identical samples, wherein the polymerase chain reaction includes a plurality of amplification cycles and provides a signal according to the amount of polynucleotide Performing in the presence of a detectable probe that can provide;
(b) obtaining an amplification profile curve for the signal strength value provided by the probe according to the number of amplification cycles for each sample;
(c) selecting one threshold from the signal strength values;
(d) calculating a threshold cycle value corresponding to the selected threshold value from the amplification profile curves;
(e) calculating a variance value of threshold cycle values of the same samples;
(f) repeating steps (c), (d), and (e) a plurality of times by varying the threshold value to be selected; And
and (g) selecting the threshold value of step (c) of calculating the smallest variance value among the variance values calculated in step (e) as the final threshold value.
실시간 중합효소 연쇄 반응을 수행하여 얻은 증폭 프로파일 곡선으로부터 임계값을 선택하는 방법으로서, 상기 방법은
(a) 동일한 샘플을 2개 이상 포함하는 복수 개의 샘플에 대해 폴리뉴클레오티드 중합효소 연쇄 반응을 수행하는 단계로서, 상기 중합효소 연쇄 반응은 복수 회의 증폭 사이클을 포함하고, 폴리뉴클레오티드의 양에 따른 신호를 제공할 수 있는 검출 가능한 프로브의 존재 하에서 수행하는 것인 단계;
(b) 각 샘플마다 상기 복수 회의 증폭 사이클 횟수에 따른 상기 프로브가 제공하는 신호 세기 값에 관한 복수 개의 증폭 프로파일(amplication profile) 곡선을 획득하는 단계;
(c) 상기 신호 세기 값 중에서 임계값(threshold)을 하나 선택하는 단계;
(d) 상기 복수 개의 증폭 프로파일 곡선들로부터 상기 선택한 임계값에 대응하는 임계 사이클(thresold cycle) 값을 산출하는 단계;
(e) 상기 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계;
(f) 상기 동일한 샘플들의 임계 사이클 값들로부터 대표값을 산출하는 단계;
(g) 상기 동일한 샘플들을 제외한 나머지 샘플들의 임계 사이클 값들 및 상기 (f) 단계에서 산출한 대표값의 분산 값을 산출하는 단계;
(h) 상기 (e) 단계에서 산출한 분산 값을 상기 (g)단계에서 산출한 분산 값으로 나눈 값을 산출하는 단계;
(i) 선택하는 임계값을 상이하게 하여 상기 (c), (d), (e), (f), (g), (h) 단계를 복수 회 반복하는 단계; 및
(j) 상기 (h) 단계에서 산출한 값 중 가장 작은 값을 산출시킨 상기 (c)단계의 임계값을 최종 임계값으로 선택하는 단계를 포함하는 것인 방법.
A method of selecting a threshold value from an amplification profile curve obtained by performing a real-time polymerase chain reaction, wherein the method
(a) performing a polynucleotide polymerase chain reaction on a plurality of samples including two or more identical samples, wherein the polymerase chain reaction includes a plurality of amplification cycles and provides a signal according to the amount of polynucleotides. Performing in the presence of a detectable probe that can provide;
(b) acquiring a plurality of amplification profile curves for signal strength values provided by the probe according to the number of amplification cycles for each sample;
(c) selecting one threshold from the signal strength values;
(d) calculating a threshold cycle value corresponding to the selected threshold value from the plurality of amplification profile curves;
(e) calculating a variance value of threshold cycle values of the same samples;
(f) calculating a representative value from threshold cycle values of the same samples;
(g) calculating the variance values of the threshold cycle values of the remaining samples except for the same samples and the representative value calculated in step (f);
(h) calculating a value obtained by dividing the variance value calculated in step (e) by the variance value calculated in step (g);
(i) repeating steps (c), (d), (e), (f), (g), and (h) a plurality of times with different threshold values selected; And
(j) selecting the threshold value of the step (c) of calculating the smallest value among the values calculated in the step (h) as a final threshold value.
제1항에 있어서, 상기 (e) 단계에서 2개 이상의 값이 산출되는 경우, 상기 (g) 단계에서 상기 (e) 단계에서 산출한 분산 값은 상기 (e) 단계에서 산출한 분산 값들의 대표값인 것인 방법. The method of claim 1, wherein when two or more values are calculated in the step (e), the variance value calculated in the step (e) in the step (g) is representative of the variance values calculated in the step (e). The value. 제2항에 있어서, 상기 (e) 단계에서 2개 이상의 값이 산출되는 경우, 상기 (h)단계에서 상기 (e) 단계에서 산출한 분산 값은 상기 (e) 단계에서 산출한 분산 값들의 대표값인 것인 방법. The method of claim 2, wherein when two or more values are calculated in step (e), the variance value calculated in step (e) in step (h) is representative of the variance values calculated in step (e). The value. 제2항에 있어서, 상기 (f) 단계에서 산출하는 대표값은 평균값인 것인 방법.The method of claim 2, wherein the representative value calculated in step (f) is an average value. 제1항 또는 제2항에 있어서, 상기 (e)단계는 동일한 샘플들의 임계 사이클 값들의 평균값과 일정 값 이상 차이가 나는 임계 사이클 값은 제외하고, 동일한 샘플들의 임계 사이클 값들의 분산 값을 산출하는 단계인 것인 방법. The method of claim 1 or 2, wherein step (e) calculates a variance value of the threshold cycle values of the same samples, except for a threshold cycle value that differs from the average value of the threshold cycle values of the same samples by more than a predetermined value. Step.
KR1020110025393A 2011-03-22 2011-03-22 Method for selecting a threshold in amplification profile curve of real-time pcr KR20120107717A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110025393A KR20120107717A (en) 2011-03-22 2011-03-22 Method for selecting a threshold in amplification profile curve of real-time pcr

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110025393A KR20120107717A (en) 2011-03-22 2011-03-22 Method for selecting a threshold in amplification profile curve of real-time pcr

Publications (1)

Publication Number Publication Date
KR20120107717A true KR20120107717A (en) 2012-10-04

Family

ID=47279599

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110025393A KR20120107717A (en) 2011-03-22 2011-03-22 Method for selecting a threshold in amplification profile curve of real-time pcr

Country Status (1)

Country Link
KR (1) KR20120107717A (en)

Similar Documents

Publication Publication Date Title
Bustin et al. Parameters for successful PCR primer design
Klein Quantification using real-time PCR technology: applications and limitations
Arya et al. Basic principles of real-time quantitative PCR
Ramakers et al. Assumption-free analysis of quantitative real-time polymerase chain reaction (PCR) data
CN106868140B (en) Multiplex fluorescent quantitative PCR method
KR20120103496A (en) Method for acquiring a standard curve and a threshold in real-time pcr
Rocha et al. Real time PCR: the use of reference genes and essential rules required to obtain normalisation data reliable to quantitative gene expression
US20240002923A1 (en) Methods and kits for determining the efficiency of plasma separation from whole blood
Miller et al. Quantitative polymerase chain reaction
KR20120107717A (en) Method for selecting a threshold in amplification profile curve of real-time pcr
US20210292817A1 (en) Methods for quantitation of analytes in multiplexed biochemical reactions
CN106536757B (en) Quantitative method for determining initial template concentration by asymmetric amplification
Latham et al. Patient-specific minimal residual disease primers amplify with uniformly high efficiency
TW201444979A (en) Measuring method for nucleic acid samples
EP4353810A1 (en) Dna detection method and dna detection system
Pollo et al. In silico and validation approaches for optimum conditions of rattus norvegicus target gene qPCR primers
KR102220701B1 (en) Multiplex identification method of pcr product using fluorescence-based multiple melting analysis
Sowndarya et al. Basic Guide to Real Time PCR in the Current Scenario
EP3182106B1 (en) Cumulative differential chemical assay identification
EP3218516B1 (en) Method for determining a property of a starting sample
Sethi et al. Novel Dual Labeled Fluorescence Probe Based Assay to Measure the Telomere Length
WO2021211613A1 (en) Multiplexed pcr assay with point of care sample
WO2023014898A1 (en) Methods, systems and compositions for detection of multiple analytes
WO2023052622A1 (en) Method of examining a nucleic acid amplification product
US20190078152A1 (en) Methods for detecting nucleotide variants

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application