KR20210012062A - 올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법 - Google Patents

올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법 Download PDF

Info

Publication number
KR20210012062A
KR20210012062A KR1020217002499A KR20217002499A KR20210012062A KR 20210012062 A KR20210012062 A KR 20210012062A KR 1020217002499 A KR1020217002499 A KR 1020217002499A KR 20217002499 A KR20217002499 A KR 20217002499A KR 20210012062 A KR20210012062 A KR 20210012062A
Authority
KR
South Korea
Prior art keywords
oligonucleotide
parameter
equation
reference data
oligonucleotides
Prior art date
Application number
KR1020217002499A
Other languages
English (en)
Other versions
KR102612084B1 (ko
Inventor
장미현
이한빛
이영조
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20210012062A publication Critical patent/KR20210012062A/ko
Application granted granted Critical
Publication of KR102612084B1 publication Critical patent/KR102612084B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/107Temperature of melting, i.e. Tm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 올리고뉴클레오타이드, 특히 PCR 또는 혼성화 분석에서 프라이머 또는 프로브의 멜팅 온도(Tm)를 예측하는 방법에 관한 것이다. 본 발명의 방법은 올리고뉴클레오타이드가 사용되는 반응 환경에 최적화된 파라미터 값을 포함하는 Tm 계산식을 사용하여 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 정확히 예측할 수 있다.

Description

올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법
관련 출원에 대한 상호참조
본 출원은 2018년 6월 29일에 대한민국 특허청에 출원된 대한민국 특허출원 제2018-0075939호의 우선권을 주장하며, 이의 개시내용은 그 전체가 참조로 본원에 포함되어 있다.
기술분야
본 발명은 올리고뉴클레오타이드, 특히 PCR 또는 혼성화 분석에서의 프라이머 또는 프로브의 멜팅 온도를 예측하는 방법에 관한 것이다.
상보적인 핵산 간의 혼성화는 DNA 구조에 대한 왓슨-크릭(Watson-Crick) 모델에서 중요한 특징 중 하나이며, 많은 생물학 및 생의학 분야에서 이용되고 있다. 예를 들어, 핵산 분자를 복제 또는 증폭시키는 방법은 상보적인 올리고뉴클레오타이드(전형적으로, 프라이머)를 타겟 핵산 분자의 특정 부위에 혼성화시키는 단계에 의해 시작된다. 이후, 중합효소가 타겟 핵산 분자를 주형으로 사용하여 프라이머로부터 상보적 핵산을 합성한다.
중합효소 연쇄 반응(PCR)으로 알려진 방법이 생물학 및 의학 분야에서 광범위하게 사용되고 있다. PCR에서, 타겟 핵산의 상이한 부위에 혼성화하는 2개 이상의 프라이머가 사용된다. 이후, 상보적인 가닥을 반복적으로 혼성화시키고 해리시키는 가열 및 냉각의 다수의 사이클을 통해 타겟 핵산 서열 및 그의 보체가 증폭된다. 상기 증폭은 소량의 타겟 핵산을 검출, 시퀀싱 등에 사용할 수 있게 한다.
멀티플렉스 PCR은 단일 PCR 혼합물 내의 다수의 프라이머 쌍을 사용하여 샘플 내의 복수의 핵산을 증폭 및 검출하는 PCR의 변형이다. 상기 기술은 샘플 내의 다수의 상이한 타겟 핵산을 동시에 증폭 및 검출할 수 있다. 그러나, 적절한 올리고뉴클레오타이드의 선택 및 디자인의 어려움으로 인해 성공적인 멀티플렉스 PCR은 달성하기 어렵다.
생물학 및 의학 분야에서 널리 사용되는 다른 기술은 핵산 혼성화를 이용하여 샘플 내의 타겟 핵산 서열을 검출한다. 이러한 기술, 예컨대 서던 블롯팅 등은 샘플 내의 타겟 핵산 분자를 고체 표면 또는 지지체(예컨대, 막 지지체)에 고정화시킨다. 상기 고정화된 타겟 핵산 분자는 하나 이상의 상보적 핵산(프로브로 불림)과 혼성화되고 프로브 상의 검출가능한 표지로부터의 시그널을 측정함으로써 검출된다.
핵산 혼성화를 포함하는 이러한 기술의 성공은 타겟 핵산 분자에 특이적으로 혼성화하는 프라이머 및 프로브를 사용하는 것에 좌우된다. 이것은 더 많은 올리고뉴클레오타이드를 포함하는 멀티플렉스 PCR에서 특히 중요하다.
프라이머 또는 프로브와 같은 올리고뉴클레오타이드의 안정성은 종종 올리고뉴클레오타이드와 그에 상보적인 가닥 간의 이합체의 멜팅 온도(melting temperature; Tm)로 표현된다. Tm은 이합체 중 절반이 해리되어 단일 가닥이 되는 온도를 가리킨다. 바람직하게는, 핵산 혼성화는 프라이머 또는 프로브와 그의 타겟 핵산 간의 혼성화를 최적화하고 프라이머 또는 프로브와 비-타겟 핵산과의 비특이적 혼성화를 최소화하기 위해 Tm보다 약간 낮은 온도에서 실시된다. Tm은 또한 열 사이클링을 포함하는 PCR에서 중요하다.
종래에 특정 올리고뉴클레오타이드의 Tm을 예측하기 위한 다양한 방법이 제시되었다.
Marmur 및 Doty(1962)는 Tm이 시토신 및 구아닌의 상대적 함량에만 좌우되는 간단한 식을 사용하였다. 이 식은 이후에 염 농도를 담당하는 보정 인자를 추가하여 상이한 실험 조건에 대해 Tm 값을 조정함으로써 개선되었다(Wetmur, 1991). DNA 올리고뉴클레오타이드와 이들의 상응하는 실측 Tm의 심층 분석은 시토신 및 구아닌의 상대적 함량이 DNA의 열 변성을 결정할뿐만 아니라 DNA 서열 내의 상이한 뉴클레오타이드의 순서적 배열이 Tm의 실측값에 중요한 역할을 한다는 결론에 이르렀다. 이후, Breslauer 등(Proc. Natl. Acad. Sci. U.S.A. 1986, 83:3746-3750)은 "최근접 이웃(Nearest Neighbor, NN)" 모델로 알려진 Tm 예측 모델을 채택하였다(SantaLucia et al., Biochemistry 1996, 35:3555-3562; SantaLucia, Proc. Natl. Acad. Sci. U.S.A. 1998, 95:1460-1465). 상기 NN 모델은 최근접 이웃 열역학 파라미터를 이용하며, NN 파라미터의 최적화된 몇 가지 NN 표가 공개되었다(Gotoh and Tagashira, 1981; Vologodskii et al., 1984; Breslauer et al., 1986; Delcourt and Blake, 1991; Doktycz et al., 1992; SantaLucia et al., 1996; Sugimoto et al., 1996; Allawi and SantaLucia, 1997).
상기 NN 모델은 고정된 반응 환경(예컨대, 1M NaCl) 하에서 수득된 NN 파라미터 값을 사용한다. 그러나, Tm을 예측하고자 하는 올리고뉴클레오타이드가 시험되는 반응 환경은 매우 다양할 수 있다. 따라서, 고정된 반응 환경에서 최적화된 NN 파라미터 값은 다양한 반응 환경을 정확히 반영하지 못하므로, 이러한 값의 사용은 올리고뉴클레오타이드의 Tm의 부정확한 예측을 야기할 수 있다.
이러한 이슈를 해결하기 위해, 상기 NN 파라미터 외에 특정 보정 인자(예컨대, 염 농도에 관한 보정 인자 등)를 사용하는 방법이 제시되었다. 그러나, 올리고뉴클레오타이드의 Tm은 많은 다른 인자에 의해서도 영향을 받으며 이러한 모든 보정 인자를 고려하여 Tm 계산식을 확립하기 어려우므로, 보정 인자를 사용하는 접근법 역시 전체 반응 환경을 반영하는 정확한 Tm을 예측하는 데 적합하지 못하다. 또한, 상기 방법은 보정 인자의 값을 제외한 각 NN 서열(NN propagation으로도 지칭됨)에 대한 NN 파라미터 값이 모든 반응 환경에 대해 변하지 않는다고 가정한다. 그러나, 반응 환경의 변화는 각 NN 서열에 대한 열역학적 NN 파라미터의 값에도 영향을 미치므로, 상기와 같은 접근법은 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 정확히 예측하는데 한계가 있다.
따라서, 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 정확히 예측할 수 있는 새로운 방법의 개발이 여전히 요구된다.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 다양한 반응 환경에서 관심 올리고뉴클레오타이드의 멜팅 온도(Tm)를 정확히 예측하는 방법을 개발하고자 하였다. 그 결과, 본 발명자들은 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 각각 포함하는 복수의 참조 데이터 세트를 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하였고, 상기 Tm 계산식의 사용이 다양한 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 정확히 예측할 수 있음을 확인하였다.
따라서, 본 발명의 목적은 올리고뉴클레오타이드의 Tm을 예측하는 방법을 제공하는데 있다.
본 발명의 다른 목적은 올리고뉴클레오타이드의 멜팅 온도(Tm)을 예측하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는데 있다.
본 발명의 다른 목적은 올리고뉴클레오타이드의 Tm을 예측하기 위한 장치를 제공하는데 있다.
본 발명의 다른 목적 및 이점은 하기의 실시예, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 특징 및 장점은 하기와 같이 요약된다:
종래의 Tm 예측 방법은 고정된 반응 환경에 최적화된 NN 파라미터 값을 갖는 식을 사용하여 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 예측한다. 그러나, NN 파라미터 값이 도출된 환경과 예측하고자 하는 올리고뉴클레오타이드가 사용되는 환경 간의 차이는 올리고뉴클레오타이드의 Tm의 부정확한 예측을 야기할 수 있다. 이에 반해, 본 발명의 방법은 상응하는 반응 환경에 최적화된 파라미터 값을 사용함으로써 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 정확히 예측할 수 있으므로, 올리고뉴클레오타이드의 혼성화를 포함하는 분자 생물학 분야, 특히 PCR 반응에서 유용하다.
도 1은 본 발명의 일 구현예에 따른 방법을 예시하는 흐름도이다.
도 2는 (A) 실측 Tm과 종래의 공지된 NN 파라미터를 이용하여 계산된 예측 Tm과의 상관관계를 예시하는 분산형 플롯 및 (B) 실측 Tm과 본 발명의 NN 파라미터 값을 이용하여 계산된 예측 Tm과의 상관관계를 예시하는 분산형 플롯을 보여준다.
도 3a는 (A) 실측 Tm과 식 I-1을 사용하여 계산된 예측 Tm과의 상관관계를 예시하는 분산형 플롯 및 (B) 실측 Tm과 식 III-1을 사용하여 계산된 예측 Tm과의 상관관계를 나타내는 분산형 플롯을 보여준다.
도 3b는 (A) 실측 Tm과 식 IV-1을 사용하여 계산된 예측 Tm과의 상관관계를 예시하는 분산형 플롯 및 (B) 실측 Tm과 식 V-1을 사용하여 계산된 예측 Tm과의 상관관계를 예시하는 분산형 플롯을 보여준다.
I. 상이하게 지정된 반응 환경에서 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법
본 발명의 일 양태에 따르면, 본 발명은 하기를 포함하는 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법을 제공한다:
(a) 복수의 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고, 상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성되며;
(b) 상기 정보 (i)-(ii)를 포함하는 복수의 참조 데이터 세트 각각을 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(nearest neighbor, NN) 열역학 파라미터를 포함하며;
(c) 상기 상이하게 지정된 반응 환경 중 하나에 대해 확립된 식을 사용하여 상기 상이하게 지정된 반응 환경 중 하나에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계.
본 발명자들은 다양한 반응 환경에서 관심 올리고뉴클레오타이드의 멜팅 온도(Tm)를 정확히 예측하는 방법을 개발하고자 하였다. 그 결과, 본 발명자들은 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 각각 포함하는 복수의 참조 데이터 세트를 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하였고, 상기 Tm 계산식의 사용이 다양한 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 정확히 예측할 수 있음을 확인하였다.
본 발명의 Tm 예측 방법은 열역학적 최근접 이웃(Nearest Neighbor; NN) 파라미터를 사용한 최근접 이웃 모델에 기초한다. 최근접 이웃 모델 기반의 Tm 예측은 당업계에 널리 공지되어 있다(그 전체가 참조로 본원에 포함된, Breslauer et al., Proc. Natl. Acad. Sci. U.S.A. 1986, 83:3746-3750; SantaLucia et al., Biochemistry 1996, 35:3555-3562; SantaLucia, Proc. Natl. Acad. Sci. U.S.A. 1998, 95:1460-1465 참고).
도 1은 본 발명의 일 구현예에 따른 방법(100)의 각 단계를 예시하는 흐름도이다. 본 발명의 방법을 도 1을 참조하여 설명하면 다음과 같다:
단계 (a): 복수의 참조 데이터 세트의 제공( 110 )
먼저, 복수의 참조 데이터 세트를 제공한다(110). 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고, 상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성된다.
본 명세서에서 사용된 용어 "올리고뉴클레오타이드(oligonucleotide)"는 자연의 또는 변형된 모노머 또는 연쇄(linkages)의 선형 올리고머를 의미하며, 데옥시리보뉴클레오타이드, 리보뉴클레오타이드등을 포함하고 타겟 핵산 서열에 특이적으로 혼성화할 수 있으며, 자연적으로 존재하거나 또는 인위적으로 합성되는 것이다. 올리고뉴클레오타이드는 혼성화의 최대 효율을 위하여 특히 단일쇄이다. 구체적으로, 올리고뉴클레오타이드는 올리고데옥시리보뉴클레오타이드이다. 본 발명의 올리고뉴클레오타이드는 자연(naturally occurring) dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 뉴클레오타이드 유사체 또는 유도체를 포함할 수 있다. 또한, 올리고뉴클레오타이드는 리보뉴클레오타이드도 포함할 수 있다. 예컨대, 본 발명의 올리고뉴클레오타이드는 골격 변형된 뉴클레오타이드, 예컨대, 펩타이드 핵산(Peptide Nucleic Acid: PNA) (M. Egholm et al., Nature, 365:566-568 (1993)), 포스포로티오에이트 DNA, 포스포로디티오에이트 DNA, 포스포로아미데이트 DNA, 아마이드-연결된 DNA, MMI-연결된 DNA, 2'-O-메틸 RNA, 알파-DNA 및 메틸포스포네이트 DNA, 당 변형된 뉴클레오타이드, 예컨대, 2'-O-메틸 RNA, 2'-플루오로 RNA, 2'-아미노 RNA, 2'-O-알킬 DNA, 2'-O-알릴 DNA, 2'-O-알카이닐 DNA, 헥소스 DNA, 피라노실 RNA 및 안히드로헥시톨 DNA, 및 염기 변형을 갖는 뉴클레오타이드, 예컨대, C-5 치환된 피리미딘(치환기는 플루오로-, 브로모-, 클로로-, 아이오도-, 메틸-, 에틸-, 비닐-, 포르밀-, 에티틸-, 프로피닐-, 알카이닐-, 티아조릴-, 이미다조릴-, 피리딜- 포함), C-7 치환기를 갖는 7-데아자퓨린(치환기는 플루오로-, 브로모-, 클로로-, 아이오도-, 메틸-, 에틸-, 비닐-, 포르밀-, 알카이닐-, 알켄일-, 티아조릴-, 이미다조릴-, 피리딜-), 이노신 및 디아미노퓨린을 포함할 수 있다.
본원에 사용된 올리고뉴클레오타이드는 일반적으로 200개 미만의 뉴클레오타이드, 특히 150개 미만의 뉴클레오타이드, 보다 특히 100개 미만의 뉴클레오타이드, 보다 특히 50개 미만의 뉴클레오타이드 및 보다 특히 30개 미만의 뉴클레오타이드 길이이다.
본원에 사용된 올리고뉴클레오타이드는 하기와 같이 2가지 유형으로 분류될 수 있다: (i) Tm을 예측하고자 하는 올리고뉴클레오타이드; (ii) 지정된 반응 환경에서 Tm 계산식에 포함된 파라미터의 값을 결정하는데 사용되는 올리고뉴클레오타이드.
본원에서 "Tm을 예측하고자 올리고뉴클레오타이드"는 실측 Tm을 갖지 않는 올리고뉴클레오타이드, 즉 Tm을 알지 못하는 올리고뉴클레오타이드를 지칭한다. 상기 올리고뉴클레오타이드는 PCR, 혼성화 반응 등에서 최적화된 반응을 위해 Tm 정보가 필요한 올리고뉴클레오타이드이다. 상기 올리고뉴클레오타이드는 "관심 올리고뉴클레오타이드" 또는 "미지의 올리고뉴클레오타이드"로도 불린다.
반면, "Tm 계산식에 포함된 파라미터의 값의 계산에 사용되는 올리고뉴클레오타이드"는 지정된 반응 환경에서 실측(실험적으로 결정된) Tm을 갖는 올리고뉴클레오타이드를 지칭한다. 상기 올리고뉴클레오타이드는 지정된 반응 환경에서 파라미터 값을 결정하기 위해 그의 Tm에 관한 정보뿐만 아니라 그의 서열에 관한 정보를 제공하는 역할을 한다. 상기 올리고뉴클레오타이드는 본원에서 "참조 올리고뉴클레오타이드", "학습용 올리고뉴클레오타이드" 또는 "벤치마크(benchmark) 올리고뉴클레오타이드"로도 불린다.
본원에서 사용된 용어 "참조 데이터 세트"는 지정된 반응 환경에 적합한 최근접 이웃(NN) 모델, 구체적으로 Tm 계산식을 확립하는데 사용되는 정보를 포함하는 데이터 세트를 지칭한다. 참조 데이터 세트는 지정된 반응 환경에서 NN 모델을 확립하고 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하는데 사용된다.
본원에 사용된 바와 같이, 용어 "복수의 참조 데이터 세트"는 적어도 2개의 참조 데이터 세트를 의미한다. 일 구현예에서, 복수의 참조 데이터 세트는 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 참조 데이터 세트를 포함한다.
본 단계에서 제공되는 참조 데이터 세트는 지정된 반응 환경에서 생성된다. 본 단계에서 제공되는 참조 데이터 세트는 다양한 길이 및 서열의 복수의 참조 올리고뉴클레오타이드를 준비하고 이들의 실측 Tm을 결정함으로써 생성될 수 있다.
상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성된다. 예를 들어, 제1 참조 데이터 세트는 제1 지정된 반응 환경에서 생성되고, 제2 참조 데이터 세트는 제2 지정된 반응 환경에서 생성되며; 제1 지정된 반응 환경은 제2 지정된 반응 환경과 상이하다.
참조 데이터 세트는 지정된 반응 환경에 상응하며, 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경들에 상응한다.
즉, 각각의 참조 데이터 세트는 각각의 반응 환경에서 NN 모델을 확립하고 각각의 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하는데 사용되고, 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 몇 개의 NN 모델을 확립하고 상이하게 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하는데 사용된다.
참조 데이터 세트의 수는 상이하게 지정된 반응 환경의 수에 상응한다. 예를 들어, 3개의 참조 데이터 세트는 3개의 상이하게 지정된 반응 환경들에 상응한다.
본원에서 각각의 참조 데이터 세트는 식별을 위해 제1 참조 데이터 세트, 제2 참조 데이터 세트 등으로 지칭될 수 있다. 이 경우, 제1 참조 데이터 세트는 제1 지정된 반응 환경에 대해 최적화된 파라미터 값을 갖는 Tm 계산식을 확립하기 위해 제공되며, 제2 참조 데이터 세트는 제2 지정된 반응 환경에 대해 최적화된 파라미터 값을 갖는 Tm 계산식을 확립하기 위해 제공된다.
참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함한다. 상기 참조 데이터 세트는 다른 정보를 추가로 포함할 수 있고, 상기 정보는 Tm 계산식을 확립하는데 사용될 수 있다. 참조 데이터 세트에 포함된 구성요소를 상세히 설명한다.
(i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보
참조 데이터 세트는 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보를 포함한다. 용어 "복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보"는 복수의 참조 올리고뉴클레오타이드 분자의 핵산 서열로부터 유래된 정보를 의미한다.
일 구현예에서, 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드의 선형 순서를 포함한다.
일 구현예에서, 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드로부터 유래된 최근접 이웃(NN) 서열을 포함한다.
일 구현예에서, 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드로부터 유래된 최근접 이웃(NN) 서열 각각에 대한 빈도(frequency)를 포함한다.
일 구현예에서, 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드의 길이를 포함한다.
일 구현예에서, 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드에서의 A, T(U), G, C, 또는 이의 조합의 함량을 포함한다.
각 참조 데이터 세트에 포함되는 참조 올리고뉴클레오타이드의 서열의 개수는 상기 참조 올리고뉴클레오타이드의 서열을 사용하여 최근접 이웃(NN) 서열(NN propagation으로도 불림, 바람직하게는 총 10개의 NN 서열)에 대한 열역학적 파라미터 값이 모두 결정될 수 있는 한, 특별히 제한되지 않는다. 각 참조 데이터 세트에 포함되는 참조 올리고뉴클레오타이드의 서열의 개수는 NN 파라미터 값의 정확한 결정을 위해 가능한 많은 것이 바람직하지만, NN 파라미터 값의 결정에 요구되는 시간 등을 감소시키기 위해 조정될 수 있다. 예를 들어, 각 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열의 개수는 적어도 20개, 적어도 30개 또는 적어도 50개 내지 최대 100개, 최대 300개, 최대 500개, 최대 1000개, 최대 3000개 또는 5000개일 수 있다.
각 참조 데이터 세트를 구성하는 참조 올리고뉴클레오타이드의 서열은 각 참조 데이터 세트에 대해 동일하거나 상이할 수 있다.
일 구현예에서, 제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열과 완전히 동일하다(제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경과 상이함).
또 다른 구현예에서, 제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열과 부분적으로 동일하다(제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경과 상이함).
또 다른 구현예에서, 제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열과 완전히 상이하다(제1 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경은 제2 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 Tm이 측정되는 반응 환경과 상이함).
하나의 참조 데이터 세트 내의 복수의 참조 올리고뉴클레오타이드의 서열은 또 다른 참조 데이터 세트를 만드는데 사용될 수 있다.
(ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보
각각의 참조 데이터 세트는 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함한다. 각각의 참조 데이터 세트는 참조 올리고뉴클레오타이드 서열뿐만 아니라 구성요소로서 이들의 실측 Tm을 포함하므로, 2개의 참조 데이터 세트 간의 동일성은 상기 2개의 구성요소를 고려하여 결정된다.
본원에 사용된 바와 같이, 용어 "지정된 반응 환경에서 복수의 참조 데이터의 세트의 실측 멜팅 온도"는 지정된 반응 환경에서 참조 올리고뉴클레오타이드 각각의 멜팅 온도의 실험적 측정값을 지칭한다.
본원에서 사용된 용어 "반응 환경"은 Tm을 예측하고자 하는 올리고뉴클레오타이드(관심 올리고뉴클레오타이드)가 사용/배치/적용될 반응 환경을 지칭한다. 다시 말해서, 용어 "반응 환경"은 올리고뉴클레오타이드를 둘러싼 매질, 특히 화학적 특징을 지칭한다. 반응 환경은 관심 올리고뉴클레오타이드를 제외한 반응에 사용되는 성분들의 유형 및 농도에 의해 정의될 수 있다. 예를 들어, Tm을 예측하고자 하는 올리고뉴클레오타이드가 PCR 반응에 사용되는 경우, 상기 반응에 사용될 수 있는 성분의 예는, 비제한적으로, 완충제(pH 조절용), 예컨대 Tris, 트리신, 비스-트리신, HEPES, EPPS, CHES 및 CAPSO; 1가 이온, 예컨대 KCl, (NH4)2SO4, NaCl, LiCl, NH4Cl, NaN3, CoCl2, KOAc, KSO4, Mn(OAc)2 및 NaOAc; 2가 이온, 예컨대 MgCl2, MgSO4, MgSO4 및 ZnCl2; 안정화제, 예컨대 BSA 및 젤라틴; 단백질, 예컨대 T4 유전자 32 단백질 및 Et SSB; 비이온성 세제, 예컨대 NP-40, Tween20, 트리톤 X-100, 트리톤 X-114, CHAPSO, IGEPAL, CHAPS, MEGA-8, Brij 35 및 BRIJ 58; 환원제, 예컨대 DTT, b-머캅토에탄올 및 TCEP; 양립가능한 용질, 예컨대 글리세롤, 트레할로스, 수크로스, 자일리톨, 멜레지토스(melezitose), 자일렌 시아놀, 만노스, 소르비톨, 만니톨, 베타인, 엑토인 및 프롤린; 설폭사이드, 예컨대 DMSO; 아마이드, 예컨대 포름아마이드; 테트라알킬-암모늄 염, 예컨대 TMAC 및 TMAA; 폴리하이드록실 알콜, 예컨대 폴리프로필렌 글리콜 및 폴리비닐 알콜(PVA); 킬레이트화제, 예컨대 EDTA 및 EGTA; 효소, 예컨대 중합효소, dNTP 등을 포함한다.
복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성된다.
용어 "상이하게 지정된 반응 환경"은 관심 올리고뉴클레오타이드를 제외한 반응에 사용된 임의의 성분의 유형 및/또는 농도가 상이하다는 것을 의미하고, 상기 성분은 (a) 완충제; (b) 1가 양이온; (c) 2가 양이온; (d) 안정화제; (e) 단백질; (f) 비이온성 세제; (g) 환원제; (h) 양립가능한 용질; (i) 설폭사이드; (j) 아마이드; (k) 테트라알킬-암모늄 염; (l) 폴리하이드록실 알콜; (m) 킬레이트화제; (n) 효소; (o) dNTP; 및 (o) 이의 조합으로 이루어진 군으로부터 선택된다.
예를 들어, 제1 참조 데이터 세트는 제1 지정된 반응 환경에서 생성되고, 제2 참조 데이터 세트는 제2 지정된 반응 환경에서 생성되며; 제1 지정된 반응 환경 및 제2 지정된 반응 환경은 서로 상이하다. 제1 지정된 반응 환경 및 제2 지정된 반응 환경 간의 차이는 2개의 반응 환경의 조성이 상이하다는 것을 나타낸다. 예를 들어, 이것은 임의의 하나의 성분이 제1 지정된 반응 환경에는 존재하지만 제2 지정된 반응 환경에는 존재하지 않는 경우뿐만 아니라 제1 지정된 반응 환경에서의 임의의 하나의 성분의 농도가 제2 지정된 반응 환경에서의 임의의 하나의 성분의 농도와 상이한 경우를 포함할 수 있다.
다시 말해서, 본원에서 지정된 반응 환경은 각각의 참조 데이터 세트에 대해 상이하다. 본원에 사용된 바와 같이, 용어 "지정된 반응 환경이 각각의 참조 데이터 세트에 대해 상이하다"는 것은 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 멜팅 온도가 실측되는 반응 환경이 또 다른 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 멜팅 온도가 실측되는 반응 환경과 상이하다는 것을 의미한다. 일 예로서, 제1 참조 데이터 세트는 1M NaCl을 포함하는 반응 환경에서 실측된 복수의 참조 올리고뉴클레오타이드의 멜팅 온도를 포함할 수 있는 반면, 제2 참조 데이터 세트는 0.1 M NaCl을 포함하는 반응 환경에서 실측된 복수의 참조 올리고뉴클레오타이드의 멜팅 온도를 포함할 수 있다. 또 다른 예로서, 제1 참조 데이터 세트는 제1 반응 환경에서 실측된 복수의 참조 올리고뉴클레오타이드의 멜팅 온도를 포함할 수 있는 반면, 제2 참조 데이터 세트는 추가적인 성분을 포함하는 제2 반응 환경에서 실측된 복수의 참조 올리고뉴클레오타이드의 멜팅 온도를 포함할 수 있다.
상이하게 지정된 반응 환경의 개수는 참조 데이터 세트의 개수에 상응한다. 예를 들어, 3개의 상이하게 지정된 반응 환경이 있는 경우, 상응하는 참조 데이터 세트, 즉, 3개의 참조 데이터 세트가 존재한다.
상이하게 지정된 반응 환경은 적어도 2개의 상이한 반응 환경을 의미한다. 일 구현예에서, 상이하게 지정된 반응 환경은 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 반응 환경을 포함한다.
본원에 사용된 바와 같이, 용어 참조 올리고뉴클레오타이드의 "실측 멜팅 온도(Tm)"는 지정된 반응 환경에서 실험적으로 결정된 참조 올리고뉴클레오타이드의 Tm을 지칭한다. 상기 실측 Tm은 종래 공지된 멜팅 곡선 분석에 의해 결정될 수 있다. 일 예로서, 참조 올리고뉴클레오타이드의 실측 Tm은 온도의 함수로서 올리고뉴클레오타이드와 그의 보체 간의 이합체로부터의 흡광도 변화를 측정함으로써 결정될 수 있다. 또 다른 예로서, 참조 올리고뉴클레오타이드의 실측 Tm은 온도의 함수로서 올리고뉴클레오타이드와 그의 보체 간의 이합체로부터의 형광 시그널 변화(예컨대, 인터컬레이팅 염료의 사용에 의함)를 측정함으로써 결정될 수 있다.
올리고뉴클레오타이드의 Tm은 상기 올리고뉴클레오타이드가 사용/배치/적용되는 반응 환경에 따라 달라진다는 것이 당업계에 널리 알려져 있다. 원하는 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 정확히 예측하기 위해, 본 발명의 방법은 관심 올리고뉴클레오타이드와 동일한 반응 환경에 적용되었을 때의 참조 올리고뉴클레오타이드의 실측 Tm을 이용한다.
따라서, 참조 데이터 세트에 포함되는 서열 및 Tm을 제공하기 위한 참조 올리고뉴클레오타이드는 관심 올리고뉴클레오타이드가 배치되는 반응 환경과 동일한 반응 환경에서 측정된 실측 멜팅 온도를 갖는 올리고뉴클레오타이드로부터 선택되거나, 관심 올리고뉴클레오타이드가 배치되는 반응 환경과 동일한 반응 환경에서 참조 올리고뉴클레오타이드의 Tm을 실측함으로써 준비될 수 있다. 예를 들면, 제1 반응 환경에서의 관심 올리고뉴클레오타이드의 Tm을 예측하고자 하는 경우, 참조 올리고뉴클레오타이드는 제1 반응 환경에서 실측된 멜팅 온도를 갖는 올리고뉴클레오타이드로부터 선택되거나, 또는 임의의 올리고뉴클레오타이드를 선택(합성)한 후 제1 반응 환경에서 멜팅 온도를 실측함으로써 준비될 수 있다.
일 구현예에서, 복수의 참조 데이터 세트 각각은 각각의 NN 서열이 적어도 2개의 빈도(frequency)로 나타나도록 하는 복수의 참조 올리고뉴클레오타이드를 포함한다.
본원에 사용된 바와 같이, "최근접 이웃(NN) 서열"은 올리고뉴클레오타이드에서 2개의 인접한 뉴클레오타이드(디뉴클레오타이드)로 구성된 서열을 가리킨다. 상기 용어는 "최근접 이웃", "최근접 이웃 염기쌍", 또는 "최근접 이웃 쌍"과 상호교환적으로 사용될 수 있다.
예를 들어, 5‘-ATTGCTTGCTTCG-3'의 13개의 염기로 구성된 올리고뉴클레오타이드 서열의 경우, 최근접 이웃(NN) 서열의 총 개수는 7개, 즉 "AT", "TT", "TG", "GC", "CT", "TC" 및 "CG" 이다. 이 경우, "TT"는 3의 빈도로 나타나고, "TG"는 2의 빈도로 나타나며, "GC"는 2의 빈도로 나타나고, "CT"는 2의 빈도로 나타난다는 점에 유의한다.
가능한 최근접 이웃(NN) 서열은 16개 유형(4개의 염기 X 4개의 염기), 예컨대 "AA", "AT", "AG", "AC", "TA", "TT", "TG", "TC", "GA", "GT", "GG", "GC", "CA", "CT", "CG" 및 "CC"이다. 하지만, "AA", "CA", "GT", "CT", "GA" 및 "GG"는 각각 "TT", "TG", "AC", "AG", "TC" 및 "CC"와 동일한 NN 파라미터 값을 갖는다는 것이 공지되어 있다. 따라서, 파라미터 값이 결정될 최근접 이웃(NN) 서열의 총 개수는 10개이다.
참조 데이터 세트의 경우, NN 서열 각각에 대한 빈도는 참조 데이터 세트의 참조 올리고뉴클레오타이드에서 나타나는 NN 서열의 개수를 지칭한다. 즉, 각 참조 데이터 세트에서 NN 서열 각각에 대한 빈도는 전체 참조 올리고뉴클레오타이드로부터 각 NN 서열의 개수의 합을 계산함으로써 수득될 수 있다. 예를 들어, 참조 데이터 세트가 5‘-ATGT-3' 및 5’-GTTA-3'와 같은 2개의 참조 올리고뉴클레오타이드을 갖는 경우, 상기 참조 데이터 세트는 AT에 대해 1개, GT에 대해 1개, GT에 대해 2개, TT에 대해 1개, TA에 대해 1개의 빈도를 갖는다.
일 구현예에서, 복수의 참조 데이터 세트 각각은 각각의 NN 서열이 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 7개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 30개 또는 적어도 40개의 빈도로 나타나도록 하는 참조 올리고뉴클레오타이드를 포함할 수 있다.
일 구현예에서, 각 참조 데이터 세트는 참조 올리고뉴클레오타이드가 특정 온도 구간 내의 Tm을 갖도록 하는 복수의 참조 올리고뉴클레오타이드를 포함한다. 예를 들어, 각 참조 데이터 세트는 참조 올리고뉴클레오타이드가 30-100℃, 40-100℃, 50-100℃, 60-100℃, 30-90℃, 40-90℃, 50-90℃, 60-90℃, 30-80℃, 40-80℃ 또는 50-80℃ 사이의 Tm을 갖도록 하는 복수의 참조 올리고뉴클레오타이드를 포함한다.
일 구현예에서, 각 참조 데이터 세트는 참조 올리고뉴클레오타이드가 균일한 분포로 Tm을 갖도록 하는 복수의 참조 올리고뉴클레오타이드를 포함한다.
일 구현예에서, 각 참조 데이터 세트는 온도 구간 내의 각 온도 간격에 속하는 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함한다. 상기 온도 구간의 하한은 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 또는 70℃ 이상일 수 있다. 상기 온도 구간의 상한은 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100℃ 이상일 수 있다. 온도 구간 내의 각 온도 간격은 3, 5, 7, 10, 15, 20, 25, 30, 35 또는 40℃의 간격을 가질 수 있다. 일 예로서, 각 온도 구간이 5℃, 10℃, 15℃ 또는 그 사이의 간격을 가질 때, 각 참조 데이터 세트는 상기 각 온도 구간에 속하는 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함할 수 있다. 구체적으로, 온도 구간이 30-40℃, 40-50℃, 50-60℃, 60-70℃ 및 70-80℃의 온도 간격으로 구성될 때, 각 참조 데이터 세트는 30-40℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 40-50℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 50-60℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 60-70℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 및 70-80℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함할 수 있다.
단계 (b): Tm 계산식의 확립
이후, 상기 정보 (i)-(ii)를 포함하는 복수의 참조 데이터 세트 각각을 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하며, 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함한다.
본 단계에서, 각 참조 데이터 세트를 사용하여 식에 포함된 파라미터의 값을 결정함으로써, 각 참조 데이터에 대한, 즉 상이하게 지정된 반응 환경에 대한 Tm 계산식을 확립한다.
상이하게 지정된 반응 환경 각각에 대한 Tm 계산식은 하기에 더 상세히 설명될 것이다.
Tm 계산식
지정된 Tm 계산식은 열역학 파라미터를 사용하는 NN 모델에 기초한 임의의 식을 지칭한다. 상기 식은 당업계에 알려진 것이거나 이의 변형일 수 있다. 올리고뉴클레오타이드의 예측 Tm은 사용된 식에 따라 달라질 수 있다.
본 발명에서 사용되는 Tm 계산식은 최근접 이웃(NN) 열역학 파라미터를 포함하는 식, 또는 이의 변형이다.
일 구현예에서, Tm 계산식은 각각의 최근접 이웃(NN) 서열에 대한 엔탈피 변화(△H) 및 엔트로피 변화(△S)를 포함한다.
특정 구현예에서, Tm 계산식은 하기 식 I로 표시된다.
<식 I>
Figure pct00001
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; m 및 n은 상수이다.
상기 식에서, △H°는 하기 식 II에 나타낸 바와 같이 각 NN 파라미터 △H°NN의 합에 의해 계산될 수 있고, △S°는 각 NN 파라미터 △S°NN의 합에 의해 계산될 수 있다.
<식 II>
Figure pct00002
Figure pct00003
(각
Figure pct00004
),
Figure pct00005
Figure pct00006
(각
Figure pct00007
)
I에서, m은 1000이고, n은 273.15일 수 있으나, 상기 m 및 n은 사용자에 의해 조정될 수 있다. 상기 Tm 계산식은 문헌[SantaLucia, J. Jr (2007) Physical principles and visual-OMP software for optimal PCR design. Methods Mol. Biol., 402, 3-34]에서 발견될 수 있다.
일 구체적인 구현예에서, 식 I은 식 I-1로도 표현될 수 있다.
<식 I-1>
Figure pct00008
일 구현예에서, 상기 Tm 계산식은 각각의 최근접 이웃(NN) 서열에 대한 엔탈피 변화(△H) 및 엔트로피 변화(△S)의 파라미터, 및 하나 이상의 추가 파라미터를 포함한다.
일 구현예에서, 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정(또는 보충, 수정)을 위한 파라미터 및/또는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정(또는 보충, 수정)을 위한 파라미터를 포함한다.
특정 구현예에서, Tm 계산식은 하기 식 III으로 표시된다.
<식 III>
Figure pct00009
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; α는 엔트로피의 보정을 위한 제1 추가 파라미터이며; m 및 n은 상수이다.
이 식에서, 엔트로피의 보정을 위한 제1 추가 파라미터 α는 열역학 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다. 상기 제1 추가 파라미터는 "제1 보정 파라미터" 또는 "엔트로피 변화와 관련된 파라미터"로 지칭될 수 있다. 제1 추가 파라미터의 값은 반응 환경에 좌우된다.
상기 식에서, △H°와 △S°는 전술한 바와 같이 계산될 수 있다.
일 구현예에서, 상기 m은 1000이고, n은 273.15이다. 상기 m 및 n은 사용자에 의해 조정될 수 있다.
일 특정 구현예에서, 식 III은 식 III-1로도 표현될 수 있다.
<식 III-1>
Figure pct00010
또 다른 구현예에서, Tm 계산식은 하기 식 IV로 표시될 수 있다.
<식 IV>
Figure pct00011
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; β는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 제2 추가 파라미터이며; length는 올리고뉴클레오타이드의 길이이고; m 및 n은 상수이다.
이 식에서, 제2 추가 파라미터 β는 열역학적 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다. 제2 추가 파라미터는 "제2 보정 파라미터", "올리고뉴클레오타이드 서열의 길이와 관련된 파라미터" 또는 "올리고뉴클레오타이드 서열의 길이와 Tm 사이의 관련성에 대한 파라미터"로 지칭될 수 있다. 상기 제2 추가 파라미터 β는 올리고뉴클레오타이드의 길이에 미치는 반응 환경의 영향을 반영하기 위한 파라미터이다. 상기 제2 추가 파라미터의 값은 반응 환경에 좌우된다.
상기 식에서, △H°와 △S°는 전술한 바와 같이 계산될 수 있다.
일 구현예에서, 상기 m은 1000이고, n은 273.15이다. 상기 m 및 n은 사용자에 의해 조정될 수 있다.
일 특정 구현예에서, 식 IV는 식 IV-1로도 표현될 수 있다.
<식 IV-1>
Figure pct00012
또 다른 구현예에서, Tm 계산식은 하기 식 V로 표시될 수 있다.
<식 V>
Figure pct00013
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; α는 엔트로피 변화의 보정을 위한 제1 추가 파라미터이며; β는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 제2 추가 파라미터이고; length는 올리고뉴클레오타이드의 길이이며; m 및 n은 상수이다.
이 식에서, 제1 추가 파라미터 및 제2 추가 파라미터는 열역학적 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다.
상기 식에서, △H°, △S°, α 및 β는 전술한 바와 같이 계산될 수 있다.
일 구현예에서, 상기 m은 1000이고, n은 273.15이다. 상기 m 및 n은 사용자에 의해 조정될 수 있다.
일 특정 구현예에서, 식 V는 식 V-1로도 표현될 수 있다.
<식 V-1>
Figure pct00014
이 식에서, 제1 추가 파라미터 및 제2 추가 파라미터는 열역학적 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다.
Tm 계산식은 당업자에 의해 선택될 수 있으며, 전술한 식 외에도 다양한 식이 사용될 수 있는 것으로 이해되어야 한다.
식의 확립은 식 내의 파라미터 값을 결정하는 것을 포함한다. Tm 계산식의 확립, 즉 Tm 계산식에서의 파라미터 값의 결정은 정보 (i)-(ii)를 포함하는 복수의 참조 데이터 세트 각각을 사용하여 확립된다.
본 단계에서 결정되는 파라미터의 값은 단계 (b)에서 사용되는 Tm 계산식에 따라 달라질 것이다.
일 구현예에서, 단계 (b)에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값을 포함한다.
또 다른 구현예에서, 단계 (b)에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열, 예컨대 "AA", "AT", "TA", "GA", "GT", "GG", "GC", "CA", "CT", "GG" 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 하나 이상의 추가 파라미터를 포함한다. 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정을 위한 파라미터 및 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 파라미터를 포함할 수 있다.
예를 들어, 단계 (b)에서 Tm을 계산하기 위해 식 I(특히, 식 I-1)이 사용되는 경우, 본 단계에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열, 예컨대 "AA", "AT", "TA", "GA", "GT", "GG", "GC", "CA", "CT", "GG" 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값을 포함한다. 식 I은 Tm 계산을 위해 2개의 NN 파라미터 △H 및 △S가 필요하므로, 식 I 내의 2개의 파라미터의 값이 본 단계 (b)에서 결정되어야 한다. 모든 가능한 NN 서열의 개수는 총 16개(4개의 염기 x 4개의 염기)이지만, 그 중 6개의 NN은 동일한 파라미터 값을 갖는다는 것이 보고되었다. 따라서, 본 단계 (b)에서 결정될 파라미터의 값은 10개의 NN 서열에 대한 것이다.
단계 (b)에서 Tm을 계산하기 위해 식 III(특히, 식 III-1)이 사용되는 경우, 본 단계에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열, 예컨대 "AA", "AT", "TA", "GA", "GT", "GG", "GC", "CA", "CT", "GG" 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 제1 추가 파라미터(엔트로피 변화의 보정을 위한 파라미터)를 포함한다. 식 III은 Tm 계산을 위해 2개의 NN 파라미터인 △H 및 △S 외에도 1개의 추가 파라미터가 필요하므로, 식 III 내의 총 3개의 파라미터가 본 단계 (b)에서 결정되어야 한다.
단계 (b)에서 Tm을 계산하기 위해 식 IV(특히, 식 IV-1)가 사용되는 경우, 본 단계에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열, 예컨대 "AA", "AT", "TA", "GA", "GT", "GG", "GC", "CA", "CT", "GG" 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 제2 추가 파라미터(올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 파라미터)의 값을 포함한다. 식 IV는 Tm 계산을 위해 2개의 NN 파라미터 △H 및 △S 외에도 1개의 추가 파라미터가 필요하므로, 식 IV 내의 총 3개의 파라미터가 본 단계 (b)에서 결정되어야 한다.
단계 (b)에서 Tm을 계산하기 위해 식 V(특히, 식 V-1)가 사용되는 경우, 본 단계에서 결정되는 파라미터의 값은 10개의 최근접 이웃(NN) 서열, 예컨대 "AA", "AT", "TA", "GA", "GT", "GG", "GC", "CA", "CT", "GG" 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 제1 추가 파라미터(엔트로피 변화의 보정을 위한 파라미터)의 값 및 제2 추가 파라미터(올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 파라미터)의 값을 포함한다. 식 V는 Tm 계산을 위해 2개의 NN 파라미터 △H 및 △S 외에도 2개의 추가 파라미터가 필요하므로, 식 V 내의 총 4개의 파라미터가 본 단계 (b)에서 결정되어야 한다.
단계 (b)에서 파라미터의 값의 결정은 선형 회귀 또는 비선형 회귀에 의해 실시될 수 있다. 파라미터의 값의 결정은 10개의 미지의 파라미터를 구하는 것을 의미한다.
일 구현예에서, 단계 (b)에서 파라미터의 값의 결정은 최소제곱법에 의해 실시된다. 일 구현예에서, 식에 포함된 파라미터의 값은 각 NN 서열에 대해 각각 최소제곱법에 의해 오차 제곱의 합을 최소화하는 값을 찾음으로써 결정된다.
단계 (b)에서 파라미터 값의 결정의 결과는 열역학적 파라미터(식 III, IVV의 경우, 하나 이상의 보정 파라미터를 추가로 포함함)의 데이터, 즉 열역학적 파라미터의 표를 포함한다.
현재까지 다양한 NN 표가 공개되었다(Breslauer et al. (1986) Proc Natl Acad Sci USA 83: 3746-3750; Sugimoto et al. (1996), Nuc Acids Res 24: 4501-4505; Allawi and Santa Lucia Biochemistry 36: 10581-10594; SantaLucia & Hicks (2004), Annu. Rev. Biophys. Biomol. Struct 33: 415-440). 하지만, 종래의 NN 표는 고정된 반응 환경에 최적화된 NN 파라미터의 값을 제시하므로, 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 계산하는 데 사용하기에 적합하지 못하다.
이에 반해, 본 발명은 각 반응 환경에 최적화된 NN 파라미터 값을 사용하여 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 계산하는데 매우 적합하다.
전술한 바와 같이, 식 III, IV 또는 V는 NN 파라미터 외에 엔트로피 변화를 보정하기 위한 제1 추가 파라미터 및/또는 올리고뉴클레오타이드 길이를 보정하기 위한 제2 추가 파라미터 값을 추가로 포함한다.
반응 환경에서의 염 농도 또는 올리고뉴클레오타이드의 길이를 반영하는 보정 인자를 포함하는 일부 종래의 식이 개발되었다. 그러나, 올리고뉴클레오타이드의 Tm은 많은 다른 인자에 의해서도 영향을 받을 뿐만 아니라 이들 모든 보정 인자를 고려하여 Tm 계산식을 확립하는 것이 어려우므로, 보정 인자를 사용하는 접근법 역시 전체 반응 환경을 반영하는 올리고뉴클레오타이드의 정확한 Tm을 예측하는 데 적합하지 못하다. 또한, 상기 방법은 보정 인자 값을 제외하고 각 NN 서열(NN propagation이라고도 불림)에 대한 NN 파라미터 값이 모든 반응 환경에 대해 변하지 않는 것을 전제로 한다. 그러나, 이러한 반응 환경의 변화는 각 NN 서열에 대한 열역학적 NN 파라미터의 값에도 영향을 주므로, 상기와 같은 접근법은 다양한 반응 환경에서 올리고뉴클레오타이드의 Tm을 정확히 예측하는 데 한계가 있다.
이에 반해, 본 발명의 방법에 따르면, NN 파라미터의 값뿐만 아니라 식 III, IV 또는 V에 사용된 추가 파라미터의 값이 반응 환경에 따라 다르다. 즉, 본 발명의 방법은 반응 환경에 좌우되는 NN 파라미터 값 및 추가 파라미터 값의 가변성 측면에서 종래의 방법과 구별된다. 본 발명의 방법은 반응 환경의 변화에 좌우되는 다양한 파라미터를 사용함으로써 다양한 반응 환경에 좌우되는 Tm의 변화를 정확하게 예측할 수 있다.
일 구현예에서, 파라미터 값을 결정하기 위해 사용되는 Tm 계산식은 모든 반응 환경에 대해 동일하다. 예를 들어, 제1 참조 데이터 세트에 사용된 Tm 계산식은 식 V이고 제2 참조 데이터 세트에 사용된 Tm 계산식도 식 V일 수 있다.
또 다른 구현예에서, 파라미터 값을 결정하기 위해 사용되는 Tm 계산식은 일부 반응 환경에 대해 상이하다. 예를 들어, 제1 참조 데이터 세트에 사용된 Tm 계산식은 식 I인 반면, 제2 참조 데이터 세트에 사용된 Tm 계산식은 식 V일 수 있다.
일 구현예에서, 결정되는 파라미터의 값은 모든 반응 환경에 대해 상이하다. 예를 들어, 제1 참조 데이터 세트에 대해 결정된 10개의 최근접 이웃(NN) 서열 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값 및 제1 추가 파라미터 및 제2 추가 파라미터의 값은 제2 참조 데이터 세트에 대해 결정된 것과 상이하다. 이러한 상이한 반응 환경에 대한 파라미터의 값의 차이는 결국 상이한 반응 환경에서 관심 올리고뉴클레오타이드의 예측 Tm의 차이로 이어진다.
단계 (c): 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm 계산
본 단계에서는, 상기 상이하게 지정된 반응 환경 중 하나에 대해 확립된 식을 사용하여 상기 상이하게 지정된 반응 환경 중 하나에서 관심 올리고뉴클레오타이드의 Tm을 계산한다.
상이하게 지정된 반응 환경에 대한 확립된 Tm 계산식은 다양한 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 예측하는 데 사용될 수 있다.
구체적으로, 상이하게 지정된 반응 환경에 대해 결정된 파라미터 값을 갖는 식이 단계 (c)에서 제공된다.
일 구현예에서, 파라미터 값은 10개의 최근접 이웃(NN) 서열 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값을 포함한다. 또 다른 구현예에서, 파라미터 값은 각각의 최근접 이웃(NN) 서열에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 하나 이상의 추가 파라미터 값을 포함하며, 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정을 위한 파라미터 및/또는 올리고뉴클레오타이드의 길이의 보정을 위한 파라미터를 포함한다.
본 단계에서, 상이하게 지정된 반응 환경 중 하나에서의 관심 올리고뉴클레오타이드의 Tm은 상기 상이하게 지정된 반응 환경 중 하나에 대해 확립된 식을 사용하여 계산된다.
본 단계에서 계산된 관심 올리고뉴클레오타이드의 멜팅 온도는 멜팅 분석을 포함하는 임의의 실험에 의해 결정된 것이 아니라 본 발명의 방법에 의해 확립된 식에 의해 결정되기 때문에 본원에서 "예측 Tm"으로 불린다.
예를 들어, 제1 반응 환경에서의 관심 올리고뉴클레오타이드의 예측 Tm은 제1 참조 데이터 세트(복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 제1 반응 환경에서의 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함)에 대해 결정된 파라미터의 값을 갖는 Tm 계산식에 의해 계산될 수 있는 반면, 제2 반응 환경에서의 관심 올리고뉴클레오타이드의 예측 Tm은 제2 참조 데이터 세트(복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 제1 반응 환경에서의 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함)에 대해 결정된 파라미터의 값을 갖는 Tm 계산식에 의해 결정될 수 있다.
상이하게 지정된 반응 환경 각각에 대해 확립된 식은 상이하게 지정된 반응 환경 각각에서의 관심 올리고뉴클레오타이드의 멜팅 온도를 계산하는 데 사용된다.
일 구현예에서, 단계 (b)에서 특정 참조 데이터 세트에 대해 결정된 파라미터 값을 갖는 식 I이 확립된 경우, 관심 올리고뉴클레오타이드의 멜팅 온도는 다음과 같이 계산된다:
먼저, N개의 뉴클레오타이드로 구성된 관심 올리고뉴클레오타이드의 N-1개의 NN 서열이 제공된다. 이후, 단계 (b)에서 결정된 바와 같은, 관심 올리고뉴클레오타이드의 N-1개의 NN 서열에 대한 NN 파라미터의 값을 상기 확립된 식 I에 적용하여 관심 올리고뉴클레오타이드의 Tm을 계산한다.
일 구현예에서, 단계 (b)에서 특정 참조 데이터 세트에 대해 결정된 파라미터 값을 갖는 식 III, IV 또는 V가 확립된 경우, 관심 올리고뉴클레오타이드의 멜팅 온도는 다음과 같이 계산된다:
먼저, N개의 뉴클레오타이드로 구성된 관심 올리고뉴클레오타이드의 N-1개의 NN 서열 및 상기 올리고뉴클레오타이드의 길이 N(식 IVV의 경우에만)이 제공된다. 이후, 단계 (b)에서 결정된 바와 같은, 관심 올리고뉴클레오타이드의 N-1개의 NN 서열에 대한 NN 파라미터의 값, 및 제1 추가 파라미터 및/또는 제2 추가 파라미터의 값, 및 올리고뉴클레오타이드의 길이 N(식 IVV의 경우에만)을 각각의 확립된 식에 적용하여 관심 올리고뉴클레오타이드의 Tm을 계산한다.
본 발명의 방법에 따르면, 다양한 반응 환경에서 사용될 때의 올리고뉴클레오타이드의 멜팅 온도를 정확히 계산할 수 있다. 즉, 본 발명의 방법은 올리고뉴클레오타이드가 제1 반응 환경에 존재할 때의 멜팅 온도뿐만 아니라 올리고뉴클레오타이드가 제2 반응 환경에 존재할 때의 멜팅 온도를 정확히 계산할 수 있다.
본 발명의 방법에 의하면, 제1 반응 환경에서 결정되는 파라미터의 값은 제2 반응 환경에서의 파라미터의 값과 상이할 수 있고, 이에 따라 제1 반응 환경에서의 올리고뉴클레오타이드의 예측 Tm은 제2 반응 환경에서의 올리고뉴클레오타이드의 예측 Tm과 상이할 수 있다.
본 발명의 방법에 따르면, 다양한 반응 환경에 최적화된 파라미터의 값을 갖는 다양한 식을 확립하고 상응하는 확립된 식을 사용하여 특정 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 예측할 수 있다. 특정 반응 환경에 이용가능한 식이 없는 경우, 관심 올리고뉴클레오타이드의 Tm은 유사한 반응 환경에서 결정된 파라미터의 값을 갖는 식을 사용하여 예측될 수 있거나 상기 예측된 Tm을 약간 변형하여 예측될 수 있다.
II. 지정된 반응 환경에서 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법
본 발명의 제2 양태에서, 본 발명은 하기를 포함하는, 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법을 제공한다:
(a) 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고;
(b) 상기 정보 (i)-(ii)를 포함하는 참조 데이터 세트를 사용하여 지정된 반응 환경에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함하며;
(c) 상기 확립된 Tm 계산식을 사용하여 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계.
본 발명의 제2 양태는 상세히 설명될 것이다:
단계 (a): 참조 데이터 세트의 제공( 110 )
먼저, 참조 데이터 세트를 제공한다(110). 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함한다.
상기 참조 데이터 세트의 세부사항은 본 발명의 제1 양태의 섹션에서 발견될 수 있다.
본 양태에 따르면, 본 발명의 방법은 지정된 반응 환경에서의 관심 올리고뉴클레오타이드의 멜팅 온도를 예측하기 위하여, 단일 참조 데이터 세트를 사용하며, 상기 참조 데이터 세트는 지정된 반응 환경에 상응한다.
참조 데이터 세트는 지정된 반응 환경에 최적화된 NN 모델을 확립하고 상기 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하기 위해 본원에 사용된다.
참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함한다.
참조 데이터 세트를 구성하는 구성요소를 상세히 설명한다.
(i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보
참조 데이터 세트는 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보를 포함한다. 상기 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보는 복수의 참조 올리고뉴클레오타이드로부터 유래되는 최근접 이웃(NN) 서열에 관한 정보를 포함한다.
참조 데이터 세트에 포함될 수 있는 참조 올리고뉴클레오타이드의 서열의 개수는, 상기 참조 올리고뉴클레오타이드의 서열을 사용하여 최근접 이웃(NN) 서열(NN propagation으로도 지칭됨, 바람직하게는 총 10개의 NN 서열)에 대한 열역학적 파라미터 값이 모두 결정될 수 있는 한, 특별히 제한되지 않는다. 참조 데이터 세트에 포함되는 참조 올리고뉴클레오타이드의 서열의 개수는 NN 파라미터 값의 정확한 결정을 위해 가능한 한 많은 것이 바람직하지만, NN 파라미터 값의 결정에 필요한 시간 등을 감소시키기 위해 조정될 수 있다. 예를 들어, 참조 데이터 세트 내의 참조 올리고뉴클레오타이드의 서열의 개수는 적어도 20개, 적어도 30개 또는 적어도 50개, 최대 100개, 최대 300개, 최대 500개, 최대 1000개, 최대 3000개 또는 최대 5000개일 수 있다.
(ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보
참조 데이터 세트는 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함한다.
본원에 사용된 바와 같이, 용어 "지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측된 멜팅 온도"는 지정된 반응 환경에서 참조 올리고뉴클레오타이드 각각의 멜팅 온도의 실험적 측정값을 지칭한다.
본원에서 사용된 바와 같이, 용어 "반응 환경"은 Tm을 예측하고자 하는 올리고뉴클레오타이드(관심 올리고뉴클레오타이드)가 사용/배치/적용되는 반응 환경을 지칭한다. 다시 말해서, 용어 "반응 환경"은 올리고뉴클레오타이드를 둘러싼 매질, 특히 화학적 특징을 지칭한다. 반응 환경은 관심 올리고뉴클레오타이드를 제외한 반응에 사용되는 성분들의 유형 및 농도에 의해 정의될 수 있다. 예를 들어, Tm을 예측하고자 하는 올리고뉴클레오타이드가 PCR 반응에 사용되는 경우, 상기 반응에 사용될 수 있는 성분의 예는, 비제한적으로, 완충제(pH 조절용), 예컨대 Tris, 트리신, 비스-트리신, HEPES, EPPS, CHES 및 CAPSO; 1가 이온, 예컨대 KCl, (NH4)2SO4, NaCl, LiCl, NH4Cl, NaN3, CoCl2, KOAc, KSO4, Mn(OAc)2 및 NaOAc; 2가 이온, 예컨대 MgCl2, MgSO4, MgSO4 및 ZnCl2; 안정화제, 예컨대 BSA 및 젤라틴; 단백질, 예컨대 T4 유전자 32 단백질 및 Et SSB; 비이온성 세제, 예컨대 NP-40, Tween20, 트리톤 X-100, 트리톤 X-114, CHAPSO, IGEPAL, CHAPS, MEGA-8, Brij 35 및 BRIJ 58; 환원제, 예컨대 DTT, b-머캅토에탄올 및 TCEP; 양립가능한 용질, 예컨대 글리세롤, 트레할로스, 수크로스, 자일리톨, 멜레지토스(melezitose), 자일렌 시아놀, 만노스, 소르비톨, 만니톨, 베타인, 엑토인 및 프롤린; 설폭사이드, 예컨대 DMSO; 아마이드, 예컨대 포름아마이드; 테트라알킬-암모늄 염, 예컨대 TMAC 및 TMAA; 폴리하이드록실 알콜, 예컨대 폴리프로필렌 글리콜 및 폴리비닐 알콜(PVA); 킬레이트화제, 예컨대 EDTA 및 EGTA; 효소, 예컨대 중합효소, dNTP 등을 포함한다.
일 구현예에서, 반응 환경은 1M NaCl을 포함하는 반응 환경을 배제할 수 있다.
본원에서 사용된 바와 같이, 용어 참조 올리고뉴클레오타이드의 "실측 멜팅 온도(Tm)"는 지정된 반응 환경에서 실험적으로 결정된 멜팅 온도를 지칭한다. 실측 멜팅 온도는 당업계에 알려진 멜팅 곡선 분석에 의해 결정될 수 있다. 일 예로서, 참조 올리고뉴클레오타이드의 실측 Tm은 온도의 함수로서 올리고뉴클레오타이드와 그의 보체 간의 이합체로부터의 흡광도 변화를 측정함으로써 결정될 수 있다. 또 다른 예로서, 참조 올리고뉴클레오타이드의 실측 Tm은 온도의 함수로서 올리고뉴클레오타이드와 그의 보체 간의 이합체로부터의 형광 시그널 변화(예컨대, 인터컬레이팅 염료의 사용에 의함)를 측정함으로써 결정될 수 있다.
올리고뉴클레오타이드의 Tm은 상기 올리고뉴클레오타이드가 사용/배치/적용되는 반응 환경에 따라 달라진다는 것이 당업계에 널리 알려져 있다. 원하는 반응 환경에서 관심 올리고뉴클레오타이드의 멜팅 온도를 정확하게 예측하기 위해, 본 발명의 방법은 관심 올리고뉴클레오타이드와 동일한 반응 환경에 배치되었을 때의 참조 올리고뉴클레오타이드의 실측 Tm을 이용한다.
따라서, 참조 데이터 세트에 포함되는 서열 및 Tm을 제공하기 위한 참조 올리고뉴클레오타이드는 관심 올리고뉴클레오타이드가 배치되는 반응 환경과 동일한 반응 환경에서 측정된 실측 Tm을 갖는 올리고뉴클레오타이드로부터 선택되거나, 관심 올리고뉴클레오타이드가 배치되는 반응 환경과 동일한 반응 환경에서 참조 올리고뉴클레오타이드의 Tm을 실측함으로써 준비될 수 있다.
일 구현예에서, 참조 데이터 세트는 각각의 NN 서열이 적어도 2개의 빈도(frequency)로 나타나도록 하는 복수의 참조 올리고뉴클레오타이드를 포함한다.
본원에 사용된 바와 같이, "최근접 이웃(NN) 서열"은 올리고뉴클레오타이드에서 2개의 인접한 뉴클레오타이드(디뉴클레오타이드)로 구성된 서열을 가리킨다. 상기 용어는 "최근접 이웃", "최근접 이웃 염기쌍", 또는 "최근접 이웃 쌍"과 상호교환적으로 사용될 수 있다.
예를 들어, 5‘-ATTGCTTGCTTCG-3'의 13개의 염기로 구성된 올리고뉴클레오타이드 서열의 경우, 최근접 이웃(NN) 서열의 총 개수는 7개, 즉 "AT", "TT", "TG", "GC", "CT", "TC" 및 "CG" 이다. 이 경우, "TT"는 3의 빈도로 나타나고, "TG"는 2의 빈도로 나타나며, "GC"는 2의 빈도로 나타나고, "CT"는 2의 빈도로 나타난다는 점에 유의한다.
가능한 최근접 이웃(NN) 서열은 16개 유형(4개의 염기 X 4개의 염기), 예컨대 "AA", "AT", "AG", "AC", "TA", "TT", "TG", "TC", "GA", "GT", "GG", "GC", "CA", "CT", "CG" 및 "CC"이다. 하지만, "AA", "CA", "GT", "CT", "GA" 및 "GG"는 각각 "TT", "TG", "AC", "AG", "TC" 및 "CC"와 동일한 NN 파라미터 값을 갖는다는 것이 공지되어 있다. 따라서, 파라미터 값이 결정되는 최근접 이웃(NN) 서열의 총 개수는 10개이다.
참조 데이터 세트의 경우, NN 서열 각각에 대한 빈도는 참조 데이터 세트의 참조 올리고뉴클레오타이드에서 나타나는 NN 서열의 개수를 지칭한다. 즉, 각 참조 데이터 세트에서 NN 서열 각각에 대한 빈도는 전체 참조 올리고뉴클레오타이드로부터 각 NN 서열의 개수의 합을 계산함으로써 수득될 수 있다. 예를 들어, 참조 데이터 세트가 5‘-ATGT-3' 및 5’-GTTA-3'와 같은 2개의 참조 올리고뉴클레오타이드을 갖는 경우, 상기 참조 데이터 세트는 AT에 대해 1개, GT에 대해 1개, GT에 대해 2개, TT에 대해 1개, TA에 대해 1개의 빈도를 갖는다고 한다.
일 구현예에서, 참조 데이터 세트는 각각의 NN 서열이 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 7개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 30개 또는 적어도 40개의 빈도로 나타나도록 하는 참조 올리고뉴클레오타이드를 포함할 수 있다.
일 구현예에서, 참조 데이터 세트는 온도 구간 내의 각 온도 간격에 속하는 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함한다. 상기 온도 구간의 하한은 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 또는 70℃ 이상일 수 있다. 상기 온도 구간의 상한은 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100℃ 이상일 수 있다. 온도 구간의 내의 각 온도 간격은 3, 5, 7, 10, 15, 20, 25, 30, 35 또는 40℃의 간격을 가질 수 있다. 일 예로서, 각 온도 구간이 5℃, 10℃, 15℃ 또는 그 사이의 간격을 가질 때, 참조 데이터 세트는 각 온도 구간에 속하는 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함할 수 있다. 구체적으로, 온도 구간이 30-40℃, 40-50℃, 50-60℃, 60-70℃ 및 70-80℃의 온도 간격으로 구성될 때, 참조 데이터 세트는 30-40℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 40-50℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 50-60℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 60-70℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드, 및 70-80℃의 실측 Tm을 갖는 적어도 하나의 참조 올리고뉴클레오타이드를 포함할 수 있다.
단계 (b): 지정된 Tm 계산식의 확립
이후, 정보 (i)-(ii)를 포함하는 참조 데이터 세트를 사용하여 지정된 반응 환경에 대한 Tm 계산식을 확립하며, 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함한다.
본 단계에서, 참조 데이터 세트는 식에 포함된 파라미터 값을 결정함으로써, 참조 데이터에 대한, 즉 지정된 반응 환경에 대한 Tm 계산식을 확립하는 데 사용된다.
지정된 Tm 계산식은 열역학 파라미터를 사용하는 NN 모델에 기초한 임의의 식을 지칭한다. 상기 식은 당업계에 알려진 것이거나 이의 변형일 수 있다. 올리고뉴클레오타이드의 예측 Tm은 사용된 식에 따라 달라질 수 있다.
본 발명에서 사용되는 Tm 계산식은 최근접 이웃(NN) 열역학 파라미터를 포함하는 식, 또는 이의 변형이다.
일 구현예에서, Tm 계산식은 각각의 최근접 이웃(NN) 서열에 대한 엔탈피 변화(△H) 및 엔트로피 변화(△S)의 파라미터 및 하나 이상의 추가 파라미터를 포함한다.
일 구현예에서, 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정(또는 보충)을 위한 파라미터 및/또는 올리고뉴클레오타이드의 길이의 보정(또는 보충)을 위한 파라미터를 포함한다.
일 구현예에서, Tm 계산식은 하기 식 V로 표시되는 것일 수 있다.
<식 V>
Figure pct00015
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; α는 엔트로피 변화의 보정을 위한 제1 추가 파라미터이며; β는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 제2 추가 파라미터이고; length는 올리고뉴클레오타이드의 길이이며; m 및 n은 상수이다.
이 식에서, 엔트로피 변화의 보정을 위한 제1 추가 파라미터 α는 열역학적 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다. 상기 제1 추가 파라미터는 "제1 보정 파라미터" 또는 "엔트로피 변화와 관련된 파라미터"로 지칭될 수 있다. 상기 제1 추가 파라미터의 값은 반응 환경에 좌우된다.
이 식에서, 제2 추가 파라미터 β는 열역학적 파라미터(△H° 및 △S°) 외에 단계 (b)에서 추가적으로 결정되는 파라미터이다. 상기 제2 추가 파라미터는 "제2 보정 파라미터", "올리고뉴클레오타이드 서열의 길이와 관련된 파라미터" 또는 "올리고뉴클레오타이드 서열의 길이 및 Tm 사이의 관련성에 대한 파라미터"로 지칭될 수 있다. 제2 추가 파라미터 β는 올리고뉴클레오타이드의 길이에 미치는 반응 환경의 영향을 반영하는 파라미터이다. 상기 제2 추가 파라미터의 값은 반응 환경에 좌우된다.
특정 구현예에서, 상기 m은 1000이고, n은 273.15이다.
참조 올리고뉴클레오타이드 서열, 이들의 실측 Tm, 및 지정된 Tm 계산식의 세부사항은 본 발명의 제1 양태의 섹션에서 발견될 수 있다.
단계 (c): 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm 계산
본 단계에서는, 확립된 Tm 계산식을 사용하여 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산한다.
지정된 반응 환경에 대해 결정된 파라미터 값을 갖는 확립된 Tm 계산식이 단계 (c)에서 제공된다. 지정된 반응 환경에 대해 결정된 파라미터 값을 갖는 확립된 Tm 계산식은 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 예측하는 데 사용될 수 있다.
일 구현예에서, 상기 파라미터 값은 10개의 최근접 이웃(NN) 서열 각각에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값을 포함한다. 또 다른 구현예에서, 파라미터 값은 각각의 최근접 이웃(NN) 서열에 대한 엔탈피 변화(△H)의 값 및 엔트로피 변화(△S)의 값, 및 하나 이상의 추가 파라미터의 값을 포함하며, 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정을 위한 파라미터 및/또는 올리고뉴클레오타이드의 길이의 보정을 위한 파라미터를 포함한다.
멜팅 온도의 계산은 본 발명의 제1 양태의 섹션에서 발견될 수 있다.
본 발명의 제2 양태에 따른 방법에 의하면, 특정 반응 환경에서 배치될 때의 올리고뉴클레오타이드의 멜팅 온도를 정확히 계산할 수 있다.
III. 올리고뉴클레오타이드의 멜팅 온도를 예측하기 위한 기록매체 및 장치
본 발명의 일 양태에 따르면, 본 발명은 하기를 포함하는 올리고뉴클레오타이드의 멜팅 온도(Tm)을 예측하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공한다:
(a) 관심 올리고뉴클레오타이드의 서열에 관한 정보를 수신하는 단계; 및
(b) 상기 정보를 확립된 Tm 계산식 중 하나에 적용하여, 상이하게 지정된 반응 환경 중 하나에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계로서,
상기 확립된 Tm 계산식은 다음을 포함하는 방법에 의해 제공되고:
복수의 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고, 상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성되며;
상기 복수의 참조 데이터 세트 각각에 포함된 상기 정보 (i)-(ii)를 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 전술한 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하기 위한 장치를 제공한다.
상술한 본 발명의 기록매체 및 장치는 상술한 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 올리고뉴클레오타이드의 멜팅 온도를 예측하기 위한 프로그램 지시는 (i) 관심 올리고뉴클레오타이드에 관한 서열 정보를 수신하는 지시; 및 (ii) 상기 정보를 확립된 Tm 계산식에 적용하여 관심 올리고뉴클레오타이드의 Tm을 계산하는 지시를 포함할 수 있다.
상기 프로그램 지시에서, 상기 확립된 Tm 계산식은 본 발명의 제1 또는 제2 양태의 방법에 의해 제공된다.
또한, 올리고뉴클레오타이드의 Tm의 예측을 실행하는 프로그램 지시는 관심 올리고뉴클레오타이드의 예측된 멜팅 온도를 디스플레이 장치에 표시(display)하는 지시를 추가로 포함할 수 있다.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다.
본 발명은 실시예에 의해 더 상세히 설명될 것이다. 이러한 실시예는 보다 구체적으로 예시하고자 하는 것이며 첨부된 청구범위에 제시된 본 발명의 범위가 실시예에 의해 한정되는 것은 아님이 당업자에게 자명할 것이다.
실시예 1: 특정 반응 환경에 최적화된 최근접 이웃(NN) 파라미터를 사용한 올리고뉴클레오타이드의 멜팅 온도의 예측
복수의 참조 올리고뉴클레오타이드의 서열 및 특정 반응 환경에서 측정된 이들의 실측 Tm을 포함하는 참조 데이터 세트를 사용하여 Tm 예측 모델에 포함된 최근접 이웃(NN) 열역학 파라미터의 값을 결정하였다. 그 다음, 결정된 NN 파라미터의 값을 갖는 Tm 예측 모델을 사용하여 상기 반응 환경에서 관심 올리고뉴클레오타이드의 예측 Tm을 계산하였다. 상기 예측 Tm은 올리고뉴클레오타이드가 특정 반응 환경(특히, 효소를 포함하는 완충제의 조성)에서 가질 것으로 예상되는 Tm을 의미하며, 이는 Tm 예측 모델에 의해 계산된다. 상기 예측 Tm은 올리고뉴클레오타이드가 사용되는 반응 환경에 따라 달라질 수 있다.
본 실시예에서는 Tm 예측 모델로서 NN 모델에 기반한 공지된 Tm 계산식을 사용하였다. 최소제곱법(least squares method)에 의해 오차 제곱의 합을 최소화하는 값을 찾음으로써, 각각의 NN 서열에 대한 상기 식에 포함된 파라미터의 값을 결정하였다. 이후, 상기 결정된 파라미터의 값을 갖는 Tm 계산식을 사용하여 관심 올리고뉴클레오타이드의 예측 Tm을 계산하였다. 그 다음, 상기 관심 올리고뉴클레오타이드의 실측 Tm과 예측 Tm의 오차를 계산하여 상기 식의 Tm 예측 성능을 평가하였다. 상기 결정된 파라미터 값을 종래 공지된 파라미터의 값과 비교하였다.
<1-1> 올리고뉴클레오타이드 준비 및 Tm 측정
다양한 서열 및 길이의 95개의 올리고뉴클레오타이드를 준비한 후, 이들의 실측 Tm을 멜팅 곡선 분석에 의해 결정하였다.
구체적으로, 각 올리고뉴클레오타이드에 상보적인 혼성화 올리고뉴클레오타이드를 준비하고, 각 올리고뉴클레오타이드와 이에 상보적인 혼성화 올리고뉴클레오타이드 간의 이합체의 형성을 인터컬레이팅 염료(intercalating dye)를 사용하여 검출하였다. 생성된 이합체의 멜팅에 의해 각 올리고뉴클레오타이드의 실측 Tm을 결정하였다.
간략하게, Tm 측정을 위한 0.05 uM의 올리고뉴클레오타이드, 0.05 uM의 혼성화 올리고뉴클레오타이드, 및 인터컬레이팅 염료로서 1X EvaGreen(Biotium, USA), 그리고 5 ㎕의 4X 마스터 믹스(최종, 200 uM dNTPs, 2 mM MgCl2, 2 U의 Taq DNA 폴리머라아제)(Enzynomics, Korea)의 20 ㎕의 최종 부피로 반응을 수행하였다. 상기 반응 혼합물을 포함하는 튜브를 실시간 열순환기(CFX96, Bio-Rad)에 넣었다. 상기 혼합물을 50℃에서 5분, 95℃에서 15분, 50℃에서 10분, 및 50℃에서 85℃로 0.5℃씩 서서히 가열하는 것으로 이루어진 멜팅 곡선 분석을 수행하였다. 온도를 증가시키는 동안 형광을 연속적으로 측정하고, 95개의 올리고뉴클레오타이드의 실측 Tm을 결정하였다.
<1-2> 참조 데이터 세트의 제공
실측 Tm을 갖는 95개의 올리고뉴클레오타이드 중 37개의 올리고뉴클레오타이드(약 39%)를 본 실시예의 반응 환경에 최적화된 NN 파라미터의 계산을 위한 참조 올리고뉴클레오타이드로 선정하였다. 상기 참조 올리고뉴클레오타이드는 각각의 NN 서열이 적어도 20개의 빈도로 나타나도록 선택하였다. 상기 참조 올리고뉴클레오타이드의 서열 및 멜팅 온도를 모아 참조 데이터 세트를 준비하였다.
상기 참조 데이터 세트에 대하여, 각 참조 올리고뉴클레오타이드의 길이 및 실측 Tm, 및 각 NN 서열에 대한 빈도가 하기 표 1에 나타나 있다.
실측
Tm
길이 AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
올리고1 53.8 17 2 2 1 1 0 0 2 0 4 0 1 0 1 0 1 1
올리고2 54.5 23 1 3 0 1 3 7 1 1 0 1 0 0 1 1 0 2
올리고3 55.3 20 2 2 0 1 2 2 2 0 1 1 1 1 1 1 1 1
올리고4 57.0 17 2 1 0 0 0 4 0 1 1 0 2 2 0 1 2 0
올리고5 57.3 18 2 2 1 1 0 0 2 0 4 0 1 0 1 0 1 2
올리고6 57.5 21 2 2 0 1 2 2 2 0 1 1 1 1 1 1 1 2
올리고7 58.0 21 1 1 2 1 2 0 0 3 0 1 1 2 2 3 1 0
올리고8 58.5 18 0 0 0 2 1 2 1 1 0 0 0 3 1 3 2 1
올리고9 58.5 27 1 5 1 1 3 5 1 3 0 2 0 0 3 1 0 0
올리고10 59.0 19 2 1 2 0 0 1 2 1 2 0 1 2 1 2 0 1
올리고11 59.0 19 0 0 2 0 1 3 3 0 1 3 2 1 0 2 0 0
올리고12 59.0 27 0 2 2 0 2 9 2 2 1 2 0 1 1 2 0 0
올리고13 60.0 26 1 3 0 1 3 7 1 2 0 1 0 0 1 2 1 2
올리고14 60.0 21 3 2 1 1 1 0 2 1 3 1 1 1 0 0 2 1
올리고15 60.0 21 3 2 1 1 1 0 2 1 3 1 1 1 0 0 2 1
올리고16 60.0 21 4 2 2 1 0 0 1 1 4 0 2 0 0 0 1 2
올리고17 60.0 21 4 2 2 1 0 0 1 1 4 0 2 0 0 0 1 2
올리고18 60.0 20 0 2 2 1 0 3 0 3 2 0 2 0 2 1 1 0
올리고19 60.3 22 2 2 0 1 2 2 2 1 1 1 1 1 1 1 1 2
올리고20 61.0 20 0 0 1 2 0 5 1 1 2 2 1 0 1 1 2 0
올리고21 61.0 22 5 2 2 1 0 0 2 1 2 0 1 1 2 1 0 1
올리고22 61.8 22 5 2 1 2 0 0 2 0 4 0 1 0 1 0 1 2
올리고23 62.0 23 2 0 2 1 2 3 3 0 1 3 2 1 0 2 0 0
올리고24 62.5 20 0 0 0 3 2 2 1 1 0 0 0 3 1 3 2 1
올리고25 62.5 20 0 0 2 0 1 2 4 0 2 3 2 1 0 2 0 0
올리고26 63.0 25 4 3 2 1 1 1 1 2 2 2 0 0 3 0 1 1
올리고27 63.3 21 1 3 0 1 1 0 1 3 1 1 2 1 2 1 2 0
올리고28 63.5 21 0 0 2 1 1 2 4 0 1 3 2 2 0 2 0 0
올리고29 64.0 22 0 2 2 1 0 3 1 3 3 0 2 0 2 1 1 0
올리고30 65.5 29 4 2 1 1 1 4 1 2 2 1 0 0 2 1 0 4
올리고31 66.5 25 2 3 1 2 1 0 3 1 0 1 2 2 4 1 0 1
올리고32 67.0 21 3 1 1 2 0 0 1 0 2 0 3 2 2 0 2 1
올리고33 69.0 27 1 2 1 4 2 1 0 1 1 0 0 1 4 1 1 6
올리고34 69.0 25 1 1 1 2 1 1 1 2 0 1 1 3 3 3 1 2
올리고35 69.0 25 1 0 2 2 1 1 1 2 0 1 1 3 3 3 1 2
올리고36 69.5 26 3 2 2 1 0 1 3 1 2 0 0 3 3 2 1 1
올리고37 71.5 25 1 0 0 2 0 1 4 2 0 3 4 1 2 3 1 0
총 합 65 59 42 45 37 74 61 44 57 36 43 40 52 48 34 42
(* 슬래시는 서열이 역평행(antiparallel) 배향으로 주어진다는 것을 가리키고; 예를 들어 AC/TG는 5‘-AC-3’은 3‘-TG-5’와 왓슨 크릭 염기쌍을 형성한다는 것을 의미한다)
<1-3> Tm 계산식의 확립
상기 참조 데이터 세트에 대한 NN 서열 및 실측 Tm을 Tm 계산식에 적용하여, 상기 식에 포함된 파라미터의 값을 결정하였다.
열역학적 파라미터 △H°와 △S°를 사용하는 NN 모델 중 하나(SantaLucia, J. Jr (2007) Physical principles and visual-OMP software for optimal PCR design. Methods Mol. Biol., 402, 3-34)를 Tm 계산식으로 사용하였다. 상기 식이 하기 식 I-1로 나타나 있다.
<식 I-1>
Figure pct00016
상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이다.
상기 식에서, △H°는 하기 식 II에 나타낸 바와 같이 각 NN 파라미터 △H°NN의 합에 의해 계산될 수 있고, △S°는 각 NN 파라미터 △S°NN의 합에 의해 계산될 수 있다.
<식 II>
Figure pct00017
Figure pct00018
(각
Figure pct00019
),
Figure pct00020
Figure pct00021
(각
Figure pct00022
)
각각의 NN 파라미터 값은 최소 제곱법에 의해 오차의 제곱 합을 최소화하는 값을 찾음으로써 계산하였다. 16개의 NN 서열 중에서, 6개의 NN 서열은 이들의 상보적인 NN 서열과 동일한 파라미터 값을 갖는 것으로 가정하였다(AA/TT=TT/AA, CA/GT=TG/AC, GT/CA=AC/TG, CT/GA=AG/TC, GA/CT=TC/AG, GG/CC=CC/GG).
상기 37개의 참조 올리고뉴클레오타이드를 사용하여 결정된 각 NN 서열에 대한 NN 파라미터 값이 하기 표 2에 나타나 있다.
AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
Figure pct00023
-27.3 -24.6 -25.6 -24.0 -28.6 -27.3 -24.8 -23.6 -23.6 -24.0 -23.9 -23.9 -24.8 -25.6 -25.2 -23.9
Figure pct00024
-8.9 -8.7 -8.3 -9.2 -8.1 -8.9 -8.2 -7.7 -7.7 -9.2 -8.2 -9.0 -8.2 -8.3 -7.5 -8.2
(*소수점 첫째 자리까지만 반올림하여 표기)
<1-4> 특정 반응 환경에 최적화된 NN 파라미터 값을 갖는 식을 사용한 올리고뉴클레오타이드의 Tm 예측
실시예 <1-3>에서 결정된 NN 파라미터 값을 갖는 식 I-1을 사용하여 나머지 58개의 올리고뉴클레오타이드의 예측 Tm을 계산하였다. 이후, 각 올리고뉴클레오타이드의 예측 Tm을 실시예 1에서의 실측 Tm과 비교하여 식 I-1의 Tm 예측 성능을 평가하였다.
58개 올리고뉴클레오타이드(올리고 38 내지 95)의 실측 Tm, NN 파라미터, 예측 Tm, 및 예측 Tm과 실측 Tm 간의 오차가 하기 표 3에 나타나 있다.
실측 Tm
Figure pct00025
Figure pct00026
예측 Tm |예측 Tm - 실측 Tm|
올리고38 52.5 -195.2 -592.3 56.4 3.9
올리고39 53.3 -152.6 -458.3 59.7 6.4
올리고40 54.0 -162.6 -488.8 59.5 5.5
올리고41 55.3 -196.1 -597.4 55.0 0.3
올리고42 55.8 -179.3 -541.2 58.2 2.4
올리고43 56.0 -204.3 -616.3 58.4 2.4
올리고44 56.5 -230.7 -701.3 55.8 0.7
올리고45 56.9 -170.8 -512.7 60.0 3.1
올리고46 57.0 -159.2 -476.9 60.6 3.6
올리고47 57.0 -175.5 -529.0 58.6 1.6
올리고48 57.5 -205.2 -620.4 57.7 0.2
올리고49 58.0 -140.0 -420.7 59.7 1.7
올리고50 58.0 -148.5 -442.1 62.6 4.6
올리고51 58.0 -150.8 -450.9 61.4 3.4
올리고52 58.0 -187.6 -561.1 61.3 3.3
올리고53 58.0 -177.3 -531.2 60.7 2.7
올리고54 58.0 -148.5 -442.1 62.6 4.6
올리고55 58.0 -188.5 -565.2 60.4 2.4
올리고56 58.3 -149.4 -443.1 64.0 5.7
올리고57 58.5 -177.4 -529.5 61.9 3.4
올리고58 58.5 -185.6 -554.3 61.8 3.3
올리고59 59.0 -239.9 -725.3 57.6 1.4
올리고60 60.0 -150.2 -447.6 62.4 2.4
올리고61 60.0 -161.5 -479.7 63.4 3.4
올리고62 60.0 -144.1 -423.0 67.6 7.6
올리고63 60.0 -248.1 -749.1 58.0 2.0
올리고64 60.5 -153.0 -450.3 66.7 6.2
올리고65 60.5 -196.6 -585.0 62.9 2.4
올리고66 60.5 -230.2 -696.8 57.2 3.3
올리고67 60.8 -204.6 -613.1 60.5 0.3
올리고68 61.4 -204.6 -614.4 59.8 1.6
올리고69 61.5 -171.1 -505.6 65.3 3.8
올리고70 61.5 -265.0 -798.6 58.6 2.9
올리고71 61.8 -179.8 -536.6 61.9 0.1
올리고72 62.0 -161.3 -475.8 65.9 3.9
올리고73 62.0 -179.2 -534.2 62.4 0.4
올리고74 62.5 -182.7 -549.8 59.2 3.3
올리고75 62.5 -204.9 -614.6 60.2 2.3
올리고76 63.0 -169.3 -499.6 65.7 2.7
올리고77 63.0 -170.7 -499.9 68.4 5.4
올리고78 63.0 -238.3 -720.7 57.6 5.4
올리고79 63.5 -194.7 -579.0 63.1 0.4
올리고80 63.5 -179.6 -527.1 67.5 4.0
올리고81 63.8 -213.6 -639.2 61.0 2.8
올리고82 64.0 -171.2 -503.1 67.1 3.1
올리고83 64.0 -168.0 -498.4 63.9 0.1
올리고84 64.0 -178.2 -526.8 65.1 1.1
올리고85 64.0 -188.5 -554.4 66.8 2.8
올리고86 65.0 -194.0 -578.7 62.2 2.8
올리고87 65.0 -169.4 -502.0 64.2 0.8
올리고88 65.5 -187.1 -554.1 64.5 1.0
올리고89 65.5 -205.3 -607.6 64.7 0.8
올리고90 65.5 -179.4 -527.1 67.2 1.7
올리고91 66.5 -228.4 -678.2 63.7 2.8
올리고92 69.0 -221.7 -650.9 67.4 1.6
올리고93 69.0 -194.2 -574.3 65.0 4.0
올리고94 69.5 -202.6 -599.7 64.6 4.9
올리고95 70.0 -194.1 -573.6 65.2 4.8
평균 절대 오차 2.9
절대 오차의 합 165.5
오차 제곱 합 647.7
(*소수점 첫째 자리까지만 반올림하여 표기)
표 3에서 보는 바와 같이, 58개의 올리고뉴클레오타이드의 Tm은 2.9의 평균 절대 오차, 165.5의 평균 절대 오차의 합 및 647.7의 오차 제곱 합을 갖는 것으로 예측되었다.
<1-5> 공지된 NN 파라미터의 값을 갖는 식을 사용한 올리고뉴클레오타이드의 Tm 예측
실시예 <1-4>에서 결정된 NN 파라미터 값을 갖는 식의 Tm 예측 성능을 공지된 NN 파라미터 값을 갖는 식(SantaLucia & Hicks (2004), Annu. Rev. Biophys. Biomol. Struct 33: 415-440)과 비교하였다.
공지된 NN 파라미터의 값이 하기 표 4에 나타나 있다.
AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
Figure pct00027
-21.3 -20.4 -21.0 -22.4 -21.3 -21.3 -22.7 -22.2 -22.2 -22.4 -19.9 -24.4 -22.7 -21.0 -27.2 -19.9
Figure pct00028
-7.6 -7.2 -7.8 -8.4 -7.2 -7.6 -8.5 -8.2 -8.2 -8.4 -8.0 -9.8 -8.5 -7.8 -10.6 -8.0
상기 공지된 NN 파라미터를 갖는 식을 사용하는 것을 제외하고 실시예 <1-4>와 동일한 방식으로 58개의 올리고뉴클레오타이드의 예측 Tm을 계산하였다.
이후, 각 올리고뉴클레오타이드의 예측 Tm을 실측 Tm과 비교하여 상기 공지된 NN 파라미터 값의 Tm 예측 성능을 평가하였다.
58개 올리고뉴클레오타이드(올리고 38 내지 95) 각각의 실측 Tm, NN 파라미터, 예측 Tm, 및 예측 Tm과 실측 Tm 간의 오차가 하기 표 5에 나타나 있다.
실측 Tm
Figure pct00029
Figure pct00030
예측 Tm |예측 Tm - 실측 Tm|
올리고38 52.5 -178.5 -494.8 87.6 35.1
올리고39 53.3 -146.1 -395.1 96.6 43.3
올리고40 54.0 -152.4 -413.8 95.1 41.1
올리고41 55.3 -180.4 -495.9 90.6 35.3
올리고42 55.8 -163.6 -446.7 93.1 37.3
올리고43 56.0 -186.9 -517.2 88.2 32.2
올리고44 56.5 -208.9 -580.0 87.0 30.5
올리고45 56.9 -160.4 -433.7 96.7 39.8
올리고46 57.0 -152.6 -410.6 98.5 41.5
올리고47 57.0 -167.5 -457.9 92.7 35.7
올리고48 57.5 -189.3 -519.5 91.2 33.7
올리고49 58.0 -145.2 -386.0 103.0 45.0
올리고50 58.0 -150.2 -401.1 101.3 43.3
올리고51 58.0 -149.4 -400.2 100.2 42.2
올리고52 58.0 -173.0 -472.4 93.1 35.1
올리고53 58.0 -169.8 -459.9 96.1 38.1
올리고54 58.0 -150.2 -401.1 101.3 43.3
올리고55 58.0 -172.0 -469.1 93.5 35.5
올리고56 58.3 -147.1 -393.0 101.2 42.9
올리고57 58.5 -168.6 -456.8 95.9 37.4
올리고58 58.5 -176.7 -481.2 94.1 35.6
올리고59 59.0 -217.3 -602.4 87.6 28.6
올리고60 60.0 -150.3 -400.0 102.6 42.6
올리고61 60.0 -153.9 -413.3 99.2 39.2
올리고62 60.0 -141.2 -374.4 104.0 44.0
올리고63 60.0 -225.3 -622.3 88.9 28.9
올리고64 60.5 -148.8 -395.7 102.9 42.4
올리고65 60.5 -182.8 -496.8 94.8 34.3
올리고66 60.5 -212.9 -584.0 91.4 30.9
올리고67 60.8 -190.5 -518.3 94.4 33.6
올리고68 61.4 -188.0 -512.3 93.8 32.4
올리고69 61.5 -161.9 -434.6 99.4 37.9
올리고70 61.5 -241.0 -665.4 89.0 27.5
올리고71 61.8 -170.2 -458.1 98.4 36.6
올리고72 62.0 -156.6 -416.7 102.7 40.7
올리고73 62.0 -169.1 -455.9 97.8 35.8
올리고74 62.5 -181.0 -484.1 100.7 38.2
올리고75 62.5 -191.1 -518.9 95.1 32.6
올리고76 63.0 -163.4 -436.9 100.8 37.8
올리고77 63.0 -163.6 -437.1 101.1 38.1
올리고78 63.0 -220.9 -603.9 92.6 29.6
올리고79 63.5 -186.2 -502.2 97.6 34.1
올리고80 63.5 -171.2 -458.4 100.3 36.8
올리고81 63.8 -198.3 -539.3 94.5 30.7
올리고82 64.0 -167.1 -446.7 100.9 36.9
올리고83 64.0 -163.8 -436.7 101.9 37.9
올리고84 64.0 -171.0 -458.2 100.0 36.0
올리고85 64.0 -178.8 -479.7 99.6 35.6
올리고86 65.0 -187.6 -506.4 97.3 32.3
올리고87 65.0 -167.8 -448.8 100.7 35.7
올리고88 65.5 -178.6 -479.5 99.3 33.8
올리고89 65.5 -193.2 -521.4 97.4 31.9
올리고90 65.5 -172.6 -460.4 101.7 36.2
올리고91 66.5 -218.8 -589.5 98.0 31.5
올리고92 69.0 -214.4 -571.7 101.9 32.9
올리고93 69.0 -192.8 -509.2 105.5 36.5
올리고94 69.5 -200.8 -531.7 104.5 35.0
올리고95 70.0 -193.5 -510.9 105.6 35.6
평균 절대 오차 36.3
절대 오차의 합 2105.4
오차 제곱 합 77454.9
(*소수점 첫째 자리까지만 반올림하여 표기)
표 5에서 보는 바와 같이, 58개의 올리고뉴클레오타이드의 Tm을 공지된 NN 파라미터 값을 사용하여 예측하였고, 36.3의 평균 절대 오차, 2105.4의 절대 오차의 합, 및 77454.9의 오차 제곱 합을 가지고 있었다.
본 발명에 따른 특정 반응 환경에 최적화된 NN 파라미터 값을 갖는 식의 Tm 예측 성능(표 3)을 공지된 NN 파라미터 값을 갖는 식의 Tm 예측 성능(표 5)과 비교하였다. 그 결과, 본 발명에 따른 특정 반응 환경에 최적화된 NN 파라미터 값을 갖는 식의 사용(표 3)이 평균 절대 오차를 -33.4, 절대 오차의 합을 -1939.9, 및 오차 제곱 합을 -76807.2만큼 감소시키는 것으로 나타났다.
상기 결과는 특정 반응 환경에 최적화된 NN 파라미터 값을 사용하는 것이 공지된 NN 파라미터 값을 사용하는 것과 비교하여 보다 정확한 Tm의 예측을 가능하게 한다는 것을 입증한다. 공지된 NN 파라미터 값은 고정된 반응 환경(1M NaCl, pH 7)에 최적화되어, 상이한 반응 환경에 사용하기에 부적합하다.
또한, 본 발명에 따라 결정된 NN 파라미터 값과 공지된 NN 파라미터 값을 보다 정교하게 비교하기 위하여, 실측 Tm과 예측 Tm 간 상관관계를 나타내는 분산형 플롯에서 추세선의 기울기와 결정 계수 R2를 결정하였다.
상기 결과가 도 2에 나타나 있다.
도 2에서 보는 바와 같이, 공지된 NN 파라미터 값을 사용한 Tm 예측(표 5)은 0.4588의 추세선의 기울기 및 0.3107의 결정 계수 R2를 나타내었고, 이는 예측 Tm과 실측 Tm 사이의 낮은 상관관계를 보여준다. 반면, 본 발명에 따른 NN 파라미터 값을 사용하는 Tm 예측은 0.7634의 추세선의 기울기 및 0.4135의 결정 계수 R2를 나타내었고, 이는 예측 Tm과 실측 Tm 사이의 높은 상관관계를 보여준다.
더 높은 상관관계가 예측 Tm과 실측 Tm 사이의 높은 유사성과 관련된다는 것을 고려할 때, 상기 결과는 반응 환경에 최적화된 NN 파라미터 값을 사용하는 것이 올리고뉴클레오타이드의 Tm을 더 정확히 예측할 수 있게 해준다는 것을 입증한다.
실시예 2: 변형된 Tm 예측 모델을 사용한 멜팅 온도의 예측
본 실시예에서는, 식 I-1 외에 다른 계산식을 사용하여 올리고뉴클레오타이드의 Tm 예측의 정확도를 개선할 수 있는지 확인하였다.
NN 파라미터 외에, 하나 이상의 추가 파라미터를 식 I-1에 도입하여 변형된 Tm 계산식을 생성하고, 이들 식의 Tm 예측 성능을 결정하였다.
구체적으로, 하기 4개의 Tm 계산식을 사용하였다: (i) NN 파라미터만을 포함하는 식(대조군); (ii) NN 파라미터 외에 제1 추가 파라미터 α를 포함하는 식; (iii) NN 파라미터 외에 제2 추가 파라미터 β를 포함하는 식; 및 (iv) NN 파라미터 외에 제1 및 제2 추가 파라미터 α 및 β를 포함하는 식.
실시예 1에서와 같이, 37개의 참조 올리고뉴클레오타이드를 포함하는 참조 데이터 세트를 사용하여 상기 4개의 식 각각에 대해 오차 제곱 합을 최소화하는 파라미터 값을 결정하였다. 상기 파라미터 값을 갖는 4개의 식 각각을 사용하여 58개의 올리고뉴클레오타이드의 예측 Tm을 계산하였다.
<2-1> NN 파라미터만을 포함하는 식을 사용한 Tm 예측
NN 파라미터만을 포함하는 Tm 계산식으로서 식 I-1을 사용하였다. 표 2에 나타내 바와 같은 NN 파라미터 값을 갖는 식 I-1을 사용하여 58개 올리고뉴클레오타이드의 Tm을 예측하였다. 58개 올리고뉴클레오타이드의 예측된 Tm이 표 3에 나타나 있다.
<2-2> NN 파라미터 및 파라미터 α를 포함하는 식을 사용한 Tm 예측
I-1에 제1 추가 파라미터 α를 추가하여 변형된 Tm 계산식인 식 III-1을 생성하였다.
<식 III-1>
Figure pct00031
실시예 <1-2>의 37개의 참조 올리고뉴클레오타이드를 사용하여 상기 식 III-1에 대한 NN 파라미터 값 및 α 파라미터 값을 결정하였다.
결정된 NN 파라미터를 표 6에 나타내었고, α 파라미터 값은 -24.9였다.
AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
Figure pct00032
-23.5 -25.1 -23.8 -23.4 -25.2 -23.5 -23.9 -25.4 -25.4 -23.4 -21.3 -26.1 -23.9 -23.8 -24.5 -21.3
Figure pct00033
-8.0 -8.1 -8.3 -8.2 -8.0 -8.0 -8.8 -8.9 -8.9 -8.2 -7.9 -9.4 -8.8 -8.3 -9.2 -7.9
(*소수점 첫째 자리까지만 반올림하여 표기)
상기 파라미터 값을 갖는 식 III-1을 사용하여 58개의 올리고뉴클레오타이드(올리고 38 내지 95)의 예측 Tm을 계산하였다.
58개 올리고뉴클레오타이드(올리고 38 내지 95) 각각의 실측 Tm, NN 파라미터, 예측 Tm, 및 예측 Tm과 실측 Tm 간의 오차가 하기 표 7에 나타나 있다.
검증용 올리고 실측 Tm
Figure pct00034
Figure pct00035
예측 Tm |예측 Tm - 실측 Tm|
올리고38 52.5 -190.6 -559.3 53.1 0.6
올리고39 53.3 -150.5 -431.7 56.4 3.1
올리고40 54.0 -159.0 -458.1 56.0 2.0
올리고41 55.3 -188.7 -549.8 55.2 0.1
올리고42 55.8 -171.9 -496.7 56.5 0.7
올리고43 56.0 -198.8 -582.7 54.1 1.9
올리고44 56.5 -222.6 -653.3 55.1 1.4
올리고45 56.9 -166.9 -479.4 57.8 0.9
올리고46 57.0 -160.2 -456.1 59.9 2.9
올리고47 57.0 -176.3 -511.1 55.8 1.2
올리고48 57.5 -199.5 -579.1 57.2 0.3
올리고49 58.0 -145.9 -412.0 60.9 2.9
올리고50 58.0 -154.0 -438.3 59.3 1.3
올리고51 58.0 -154.0 -437.8 59.7 1.7
올리고52 58.0 -181.8 -524.7 57.7 0.3
올리고53 58.0 -178.4 -511.9 59.1 1.1
올리고54 58.0 -154.0 -438.3 59.3 1.3
올리고55 58.0 -180.1 -520.1 57.4 0.6
올리고56 58.3 -151.9 -429.7 61.1 2.8
올리고57 58.5 -176.8 -506.8 59.3 0.8
올리고58 58.5 -184.4 -531.2 58.5 0.0
올리고59 59.0 -230.9 -676.7 55.9 3.1
올리고60 60.0 -154.6 -436.5 61.9 1.9
올리고61 60.0 -158.6 -451.9 59.6 0.4
올리고62 60.0 -144.3 -406.0 61.7 1.7
올리고63 60.0 -238.8 -698.1 57.1 2.9
올리고64 60.5 -152.3 -429.5 62.1 1.6
올리고65 60.5 -191.3 -550.8 59.1 1.4
올리고66 60.5 -224.7 -651.8 59.0 1.5
올리고67 60.8 -199.4 -574.7 59.5 1.3
올리고68 61.4 -197.4 -569.3 59.0 2.4
올리고69 61.5 -166.6 -473.7 61.0 0.5
올리고70 61.5 -255.6 -747.1 58.0 3.5
올리고71 61.8 -176.3 -505.5 59.3 2.5
올리고72 62.0 -160.6 -453.3 62.7 0.7
올리고73 62.0 -174.6 -498.9 60.3 1.7
올리고74 62.5 -187.2 -533.4 62.2 0.3
올리고75 62.5 -198.8 -572.7 59.5 3.0
올리고76 63.0 -168.3 -476.0 62.8 0.2
올리고77 63.0 -167.6 -474.0 62.7 0.3
올리고78 63.0 -232.6 -673.1 60.2 2.8
올리고79 63.5 -194.5 -556.6 61.3 2.2
올리고80 63.5 -175.6 -497.5 62.9 0.6
올리고81 63.8 -206.8 -597.8 59.0 4.8
올리고82 64.0 -169.9 -479.5 63.7 0.3
올리고83 64.0 -170.1 -480.8 63.2 0.8
올리고84 64.0 -176.3 -499.5 63.0 1.0
올리고85 64.0 -183.6 -521.0 63.1 0.9
올리고86 65.0 -194.2 -554.7 61.9 3.1
올리고87 65.0 -169.6 -479.1 63.4 1.6
올리고88 65.5 -184.3 -523.0 63.2 2.3
올리고89 65.5 -199.7 -571.3 61.8 3.7
올리고90 65.5 -176.8 -500.2 63.6 1.9
올리고91 66.5 -227.7 -647.3 65.6 0.9
올리고92 69.0 -220.6 -623.0 67.3 1.7
올리고93 69.0 -195.4 -548.9 67.5 1.5
올리고94 69.5 -204.1 -574.1 67.6 1.9
올리고95 70.0 -195.9 -549.0 68.3 1.7
평균 절대 오차 1.6
절대 오차의 합 92.3
오차 제곱 합 188.7
(*소수점 첫째 자리까지만 반올림하여 표기)
표 7에서 보는 바와 같이, 식 III-1을 사용하여 58개의 올리고뉴클레오타이드의 Tm을 예측하였고, 1.6의 평균 절대 오차, 92.3의 절대 오차의 합, 및 188.7의 오차 제곱 합을 가지고 있었다.
<2-3> NN 파라미터 및 파라미터 β를 포함하는 식을 사용한 Tm 예측
I-1에 제2 추가 파라미터 β를 추가하여 변형된 Tm 계산식인 식 IV-1을 생성하였다.
[식 IV-1]
Figure pct00036
실시예 <1-2>의 37개의 참조 올리고뉴클레오타이드를 사용하여 상기 식 IV-1에 대한 NN 파라미터 값 및 β 파라미터 값을 결정하였다.
결정된 NN 파라미터 값을 표 8에 나타내었고, β 파라미터 값은 5.00이었다.
AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
Figure pct00037
-27.2 -26.2 -24.6 -23.4 -27.0 -27.2 -25.1 -25.1 -25.1 -23.4 -24.2 -25.4 -25.1 -24.6 -24.6 -24.2
Figure pct00038
-8.4 -8.6 -7.6 -8.4 -7.2 -8.4 -7.9 -7.9 -7.9 -8.4 -8.0 -9.0 -7.9 -7.6 -7.1 -8.0
(*소수점 첫째 자리까지만 반올림하여 표기)
상기 파라미터 값을 갖는 식 IV-1을 사용하여 58개의 올리고뉴클레오타이드(올리고 38 내지 95)의 예측 Tm을 계산하였다.
58개 올리고뉴클레오타이드(올리고 38 내지 95) 각각의 실측 Tm, NN 파라미터, 예측 Tm 및 예측 Tm과 실측 Tm 간의 오차가 하기 표 9에 나타나 있다.
올리고 실측 Tm
Figure pct00039
Figure pct00040
예측 Tm |예측 Tm - 실측 Tm|
올리고1 52.5 -186.6 -595.7 52.5 3.5
올리고2 53.3 -146.2 -460.7 53.3 5.5
올리고3 54.0 -155.3 -490.2 54.0 4.7
올리고4 55.3 -186.5 -596.9 55.3 0.1
올리고5 55.8 -172.1 -545.4 55.8 2.1
올리고6 56.0 -195.1 -619.1 56.0 2.0
올리고7 56.5 -220.4 -704.5 56.5 0.2
올리고8 56.9 -163.3 -514.5 56.9 2.6
올리고9 57.0 -154.3 -484.7 57.0 3.2
올리고10 57.0 -169.4 -536.4 57.0 1.2
올리고11 57.5 -195.3 -620.2 57.5 0.3
올리고12 58.0 -135.8 -426.5 58.0 1.6
올리고13 58.0 -144.4 -450.7 58.0 3.9
올리고14 58.0 -145.7 -456.5 58.0 2.8
올리고15 58.0 -180.3 -566.5 58.0 2.7
올리고16 58.0 -170.7 -536.6 58.0 2.4
올리고17 58.0 -144.4 -450.7 58.0 3.9
올리고18 58.0 -180.6 -568.8 58.0 2.0
올리고19 58.3 -145.2 -451.3 58.3 4.9
올리고20 58.5 -170.5 -534.2 58.5 3.0
올리고21 58.5 -178.9 -561.0 58.5 2.9
올리고22 59.0 -228.8 -727.9 59.0 0.9
올리고23 60.0 -145.1 -452.7 60.0 2.0
올리고24 60.0 -152.2 -474.6 60.0 2.6
올리고25 60.0 -137.4 -422.8 60.0 6.3
올리고26 60.0 -236.8 -752.1 60.0 1.3
올리고27 60.5 -145.9 -450.0 60.5 5.2
올리고28 60.5 -189.2 -591.8 60.5 2.0
올리고29 60.5 -219.3 -697.2 60.5 2.5
올리고30 60.8 -195.7 -616.1 60.8 0.3
올리고31 61.4 -196.1 -618.6 61.4 1.4
올리고32 61.5 -161.9 -502.0 61.5 3.0
올리고33 61.5 -253.4 -803.4 61.5 2.0
올리고34 61.8 -172.3 -539.8 61.8 0.4
올리고35 62.0 -153.5 -474.6 62.0 3.2
올리고36 62.0 -169.1 -529.0 62.0 0.0
올리고37 62.5 -175.1 -551.8 62.5 2.6
올리고38 62.5 -193.4 -609.4 62.5 2.1
올리고39 63.0 -160.8 -497.8 63.0 2.2
올리고40 63.0 -161.4 -496.1 63.0 4.4
올리고41 63.0 -227.2 -721.4 63.0 4.3
올리고42 63.5 -187.1 -584.2 63.5 0.5
올리고43 63.5 -169.8 -523.3 63.5 3.3
올리고44 63.8 -202.1 -635.6 63.8 2.7
올리고45 64.0 -164.4 -507.0 64.0 2.4
올리고46 64.0 -162.3 -504.6 64.0 0.3
올리고47 64.0 -169.3 -525.0 64.0 0.7
올리고48 64.0 -178.2 -550.5 64.0 2.3
올리고49 65.0 -186.0 -582.2 65.0 2.7
올리고50 65.0 -162.0 -503.2 65.0 0.9
올리고51 65.5 -177.7 -552.2 65.5 1.2
올리고52 65.5 -194.1 -603.7 65.5 1.0
올리고53 65.5 -170.3 -525.2 65.5 1.1
올리고54 66.5 -218.4 -680.2 66.5 1.9
올리고55 69.0 -213.0 -656.1 69.0 1.1
올리고56 69.0 -185.2 -573.5 69.0 3.4
올리고57 69.5 -193.9 -601.2 69.5 4.0
올리고58 70.0 -185.5 -573.9 70.0 4.1
평균 절대 오차 2.4
절대 오차의 합 137.9
오차 제곱 합 414.1
(*소수점 첫째 자리까지만 반올림하여 표기)
표 9에서 보는 바와 같이, 식 IV-1을 사용하여 58개의 올리고뉴클레오타이드의 Tm을 예측하였고, 2.4의 평균 절대 오차, 137.9의 절대 오차의 합, 및 414.1의 오차 제곱 합을 가지고 있었다.
<2-4> NN 파라미터, α 및 β 파라미터를 포함하는 식을 사용한 Tm 예측
식 I-1에 제1 및 제2 추가 파라미터 α 및 β를 추가하여 변형된 Tm 계산식인 식 V-1을 생성하였다.
<식 V-1>
Figure pct00041
실시예 <1-2>의 37개의 참조 올리고뉴클레오타이드를 사용하여 상기 식 V-1에 대한 NN 파라미터 값, α 파라미터 값 및 β 파라미터 값을 결정하였다.
결정된 NN 파라미터 값을 하기 표 10에 나타내었고, α 파라미터 값 및 β 파라미터 값은 각각 -40.4 및 2.6이었다.
AA
/TT
AT
/TA
AG
/TC
AC
/TG
TA
/AT
TT
/AA
TG
/AC
TC
/AG
GA
/CT
GT
/CA
GG
/CC
GC
/CG
CA
/GT
CT
/GA
CG
/GC
CC
/GG
Figure pct00042
-23.8 -24.7 -23.7 -23.3 -25.4 -23.8 -23.9 -25.5 -25.5 -23.3 -21.5 -25.9 -23.9 -23.7 -24.2 -21.5
Figure pct00043
-8.1 -8.3 -8.5 -8.4 -7.8 -8.1 -8.7 -8.8 -8.8 -8.4 -8.0 -9.4 -8.7 -8.5 -9.3 -8.0
(*소수점 첫째 자리까지만 반올림하여 표기)
상기 파라미터 값을 갖는 식 V-1을 사용하여 58개의 올리고뉴클레오타이드(올리고 38-95)의 예측 Tm을 계산하였다.
58개 올리고뉴클레오타이드(올리고 38-95)의 실측 Tm, NN 파라미터, 예측 Tm, 및 예측 Tm과 실측 Tm 간의 오차가 하기 표 11에 나타나 있다.
실측 Tm
Figure pct00044
Figure pct00045
예측 Tm |예측 Tm - 실측 Tm|
올리고1 52.5 -191.8 -560.0 54.5 2.0
올리고2 53.3 -151.2 -432.2 54.4 1.1
올리고3 54.0 -159.9 -458.7 55.0 1.0
올리고4 55.3 -190.3 -551.4 56.7 1.4
올리고5 55.8 -173.6 -499.1 56.7 0.9
올리고6 56.0 -200.1 -583.3 56.1 0.1
올리고7 56.5 -224.4 -655.2 58.0 1.5
올리고8 56.9 -167.9 -480.2 57.3 0.4
올리고9 57.0 -161.3 -456.6 59.1 2.1
올리고10 57.0 -177.2 -510.7 56.3 0.7
올리고11 57.5 -201.2 -580.6 59.2 1.7
올리고12 58.0 -146.5 -411.0 58.9 0.9
올리고13 58.0 -154.6 -436.9 58.4 0.4
올리고14 58.0 -154.6 -437.2 58.2 0.2
올리고15 58.0 -183.4 -525.8 58.8 0.8
올리고16 58.0 -179.3 -512.1 59.4 1.4
올리고17 58.0 -154.6 -436.9 58.4 0.4
올리고18 58.0 -182.0 -522.4 58.3 0.3
올리고19 58.3 -152.8 -429.6 59.5 1.2
올리고20 58.5 -177.8 -507.2 59.6 1.1
올리고21 58.5 -185.7 -531.5 59.7 1.2
올리고22 59.0 -232.7 -678.5 59.3 0.3
올리고23 60.0 -155.6 -436.2 60.8 0.8
올리고24 60.0 -159.7 -452.5 58.5 1.5
올리고25 60.0 -144.9 -406.1 58.9 1.1
올리고26 60.0 -240.7 -699.9 60.8 0.8
올리고27 60.5 -153.1 -429.9 60.0 0.5
올리고28 60.5 -192.8 -551.7 60.6 0.1
올리고29 60.5 -226.7 -653.7 62.0 1.5
올리고30 60.8 -200.8 -575.4 61.3 0.5
올리고31 61.4 -199.3 -571.7 60.8 0.6
올리고32 61.5 -168.1 -474.7 61.1 0.4
올리고33 61.5 -257.7 -748.5 62.5 1.0
올리고34 61.8 -177.3 -506.1 59.3 2.5
올리고35 62.0 -161.6 -453.6 61.6 0.4
올리고36 62.0 -176.0 -500.1 60.4 1.6
올리고37 62.5 -188.0 -533.3 62.7 0.2
올리고38 62.5 -200.2 -574.0 61.1 1.4
올리고39 63.0 -169.3 -476.5 62.3 0.7
올리고40 63.0 -168.9 -474.3 62.9 0.1
올리고41 63.0 -234.7 -675.1 63.5 0.5
올리고42 63.5 -195.7 -556.8 62.7 0.8
올리고43 63.5 -177.0 -498.1 63.6 0.1
올리고44 63.8 -208.5 -598.6 61.6 2.2
올리고45 64.0 -171.0 -479.8 63.5 0.5
올리고46 64.0 -171.1 -481.1 62.7 1.3
올리고47 64.0 -177.5 -500.3 63.1 0.9
올리고48 64.0 -185.2 -521.9 64.3 0.3
올리고49 65.0 -195.5 -554.7 63.6 1.4
올리고50 65.0 -171.1 -479.9 63.5 1.5
올리고51 65.5 -185.6 -524.1 63.8 1.7
올리고52 65.5 -201.3 -572.0 63.9 1.6
올리고53 65.5 -178.1 -500.7 63.9 1.6
올리고54 66.5 -229.5 -648.9 68.4 1.9
올리고55 69.0 -222.1 -623.5 69.9 0.9
올리고56 69.0 -196.8 -548.9 69.0 0.0
올리고57 69.5 -205.3 -574.5 69.0 0.5
올리고58 70.0 -197.0 -549.1 69.3 0.7
평균 절대 오차 1.0
절대 오차의 합 55.2
오차 제곱 합 74.2
(*소수점 첫째 자리까지만 반올림하여 표기)
표 11에서 보는 바와 같이, 식 V-1을 사용하여 58개 올리고뉴클레오타이드의 Tm을 예측하였고, 1.0의 평균 절대 오차, 55.2의 절대 오차의 합 및 74.2의 오차 제곱 합을 가지고 있었다.
상기 4개의 Tm 계산식의 Tm 예측 성능을 비교하였다. 그 결과, NN 파라미터 외에 파라미터 α 및 β를 모두 포함하는 식 V-1을 사용한 방법이 실측 Tm과 예측 Tm 간의 오차를 줄여 가장 정확한 예측 Tm을 제공하는 것으로 나타났다.
또한, 식 사이의 Tm 예측 성능의 보다 정교한 비교를 위해, 실측 Tm과 예측 Tm 사이의 상관관계를 나타내는 분산형 플롯에서 추세선의 기울기와 결정 계수 R2를 결정하였다.
상기 결과가 도 3a 및 3b에 나타나 있다.
도 3a 및 3b에서 보는 바와 같이, 실측 Tm과 예측 Tm 간 상관관계를 나타내는 분산형 플롯에서 추세선의 기울기는 식 I-1의 경우, 0.7634, 식 III-1의 경우, 1.0618, 식 IV-1의 경우, 0.9457, 식 V-1의 경우, 1.0883인 것으로 나타났다. 또한, 결정 계수 R2는 식 I-1의 경우, 0.4135, 식 III-1의 경우, 0.7976, 식 IV-1의 경우, 0.5649, 식 V-1의 경우, 0.9262로 확인되었다.
상기 결과는 NN 파라미터 외에 α 파라미터와 β 파라미터를 모두 포함하는 식을 사용하는 것이 실측 Tm과 가장 유사한 예측 Tm을 수득할 수 있음을 입증한다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (17)

  1. 하기를 포함하는 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법:
    (a) 복수의 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고, 상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성되며;
    (b) 상기 정보 (i)-(ii)를 포함하는 복수의 참조 데이터 세트 각각을 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(nearest neighbor, NN) 열역학 파라미터를 포함하며;
    (c) 상기 상이하게 지정된 반응 환경 중 하나에 대해 확립된 식을 사용하여 상기 상이하게 지정된 반응 환경 중 하나에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계.
  2. 제1항에 있어서, 상기 각 참조 데이터 세트는 각각의 NN 서열이 적어도 2개의 빈도로 나타나도록 하는 복수의 참조 올리고뉴클레오타이드를 포함하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 Tm 계산식은 각각의 NN 서열에 대한 엔탈피 변화(△H) 및 엔트로피 변화(△S)의 파라미터를 포함하는 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 Tm 계산식은 식 I로 표시되는 것을 특징으로 하는 방법:
    <식 I>
    Figure pct00046

    상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; m 및 n은 상수이다.
  5. 제4항에 있어서, m은 1000이고, n은 273.15인 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 상기 Tm 계산식은 각각의 NN 서열에 대한 엔탈피 변화(△H) 및 엔트로피 변화(△S)의 파라미터, 및 하나 이상의 추가 파라미터를 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 하나 이상의 추가 파라미터는 엔트로피 변화의 보정을 위한 파라미터 및/또는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 파라미터를 포함하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 Tm 계산식은 식 V로 표시되는 것을 특징으로 하는 방법:
    <식 V>
    Figure pct00047

    상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; α는 엔트로피 변화의 보정을 위한 제1 추가 파라미터이며; β는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 제2 추가 파라미터이고; length는 올리고뉴클레오타이드의 길이이며; m 및 n은 상수이다.
  9. 제8항에 있어서, m은 1000이고, n은 273.15인 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 단계 (b)에서 파라미터의 값의 결정은 선형 회귀 또는 비선형 회귀에 의해 실시되는 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 상기 단계 (b)에서 파라미터의 값의 결정은 최소제곱법에 의해 실시되는 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 결정되는 파라미터의 값은 상이하게 지정된 반응 환경에 대해 상이한 것을 특징으로 하는 방법.
  13. 하기를 포함하는, 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 멜팅 온도(Tm)를 예측하는 방법:
    (a) 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고;
    (b) 상기 정보 (i)-(ii)를 포함하는 참조 데이터 세트를 사용하여 지정된 반응 환경에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함하며;
    (c) 상기 확립된 Tm 계산식을 사용하여 지정된 반응 환경에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계.
  14. 제13항에 있어서, 상기 Tm 계산식은 식 V로 표시되는 것을 특징으로 하는 방법:
    <식 V>
    Figure pct00048

    상기 식에서, Tm은 올리고뉴클레오타이드의 멜팅 온도이고; △H°는 엔탈피 변화의 합이며; △S°는 엔트로피 변화의 합이고; α는 엔트로피 변화의 보정을 위한 제1 추가 파라미터이며; β는 올리고뉴클레오타이드의 길이에 의한 Tm 기여의 보정을 위한 제2 추가 파라미터이고; length는 올리고뉴클레오타이드의 길이이며; m 및 n은 상수이다.
  15. 제14항에 있어서, m은 1000이고, n은 273.15인 것을 특징으로 하는 방법.
  16. 하기를 포함하는 올리고뉴클레오타이드의 멜팅 온도(Tm)을 예측하기 위한 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체:
    (a) 관심 올리고뉴클레오타이드의 서열에 관한 정보를 수신하는 단계; 및
    (b) 상기 정보를 확립된 Tm 계산식 중 하나에 적용하여, 상이하게 지정된 반응 환경 중 하나에서 관심 올리고뉴클레오타이드의 Tm을 계산하는 단계로서,
    상기 확립된 Tm 계산식은 다음을 포함하는 방법에 의해 제공된다:
    복수의 참조 데이터 세트를 제공하는 단계로서, 상기 참조 데이터 세트는 (i) 복수의 참조 올리고뉴클레오타이드의 서열에 관한 정보 및 (ii) 지정된 반응 환경에서 복수의 참조 올리고뉴클레오타이드의 실측 Tm에 관한 정보를 포함하고, 상기 복수의 참조 데이터 세트는 상이하게 지정된 반응 환경에서 생성되며;
    상기 복수의 참조 데이터 세트 각각에 포함된 상기 정보 (i)-(ii)를 사용하여 상이하게 지정된 반응 환경 각각에 대한 Tm 계산식을 확립하는 단계로서; 상기 식의 확립은 식에서의 파라미터의 값을 결정하는 것을 포함하고, 상기 파라미터는 최근접 이웃(NN) 열역학 파라미터를 포함한다.
  17. (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 제16항의 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드의 멜팅 온도를 예측하기 위한 장치.
KR1020217002499A 2018-06-29 2019-06-28 올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법 KR102612084B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020180075939 2018-06-29
KR20180075939 2018-06-29
PCT/KR2019/007908 WO2020005019A1 (en) 2018-06-29 2019-06-28 Method for predicting the melting temperature of oligonucleotide

Publications (2)

Publication Number Publication Date
KR20210012062A true KR20210012062A (ko) 2021-02-02
KR102612084B1 KR102612084B1 (ko) 2023-12-08

Family

ID=68987473

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217002499A KR102612084B1 (ko) 2018-06-29 2019-06-28 올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법

Country Status (4)

Country Link
US (1) US20210074383A1 (ko)
EP (1) EP3814522A4 (ko)
KR (1) KR102612084B1 (ko)
WO (1) WO2020005019A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111218502B (zh) * 2020-04-23 2020-07-21 圣湘生物科技股份有限公司 提升qPCR检测性能的组合物、反应液、用途及方法
CN114480595A (zh) * 2022-01-30 2022-05-13 济凡生物科技(北京)有限公司 可以用于血液检测的pcr反应液及其试剂盒

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100233687A1 (en) * 2009-03-10 2010-09-16 Canon U.S. Life Sciences, Inc. Method and system for temperature correction in thermal melt analysis

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008205008A1 (en) * 2007-01-05 2008-07-17 Integrated Dna Technologies, Inc. Method for estimating melting temperature of a nucleic acid in buffers containing divalent ions
US9081737B2 (en) * 2010-08-02 2015-07-14 Integrated Dna Technologies, Inc. Methods for predicting stability and melting temperatures of nucleic acid duplexes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100233687A1 (en) * 2009-03-10 2010-09-16 Canon U.S. Life Sciences, Inc. Method and system for temperature correction in thermal melt analysis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Chen 등, BioTechniques, Vol. 22, No. 6, 페이지 1158-1160 (1997.06.)* *

Also Published As

Publication number Publication date
EP3814522A4 (en) 2022-03-23
WO2020005019A1 (en) 2020-01-02
EP3814522A1 (en) 2021-05-05
KR102612084B1 (ko) 2023-12-08
US20210074383A1 (en) 2021-03-11

Similar Documents

Publication Publication Date Title
Tang et al. Real-time investigation of nucleic acids phosphorylation process using molecular beacons
Johnson et al. A third base pair for the polymerase chain reaction: inserting isoC and isoG
Ju et al. Cassette labeling for facile construction of energy transfer fluorescent primers
Allawi et al. Nearest-Neighbor Thermodynamics of Internal A⊙ C Mismatches in DNA: Sequence Dependence and pH Effects
Hirao et al. An efficient unnatural base pair for PCR amplification
Ruijter et al. Fluorescent-increase kinetics of different fluorescent reporters used for qPCR depend on monitoring chemistry, targeted sequence, type of DNA input and PCR efficiency
Kimoto et al. A unique fluorescent base analogue for the expansion of the genetic alphabet
Held et al. Relationship between gene expression and observed intensities in DNA microarrays—a modeling study
Hessner et al. Three color cDNA microarrays: quantitative assessment through the use of fluorescein‐labeled probes
Chavali et al. Oligonucleotide properties determination and primer designing: a critical examination of predictions
KR102612084B1 (ko) 올리고뉴클레오타이드의 멜팅 온도를 예측하는 방법
Bae et al. High-throughput methods for measuring DNA thermodynamics
US20050089889A1 (en) Probes, libraries and kits for analysis of mixtures of nucleic acids and methods for constructing the same
Hwang et al. Substituent effects on the pairing and polymerase recognition of simple unnatural base pairs
US10385476B2 (en) Methods and compositions for the selection and optimization of oligonucleotide tag sequences
Knutson et al. Chemical labeling and affinity capture of inosine-containing RNAs using acrylamidofluorescein
Rykalina et al. Exome sequencing from nanogram amounts of starting DNA: comparing three approaches
Fox et al. An extra dimension in nucleic acid sequence recognition
Mahony et al. Regulatory conservation of protein coding and microRNA genes in vertebrates: lessons from the opossum genome
Milos Emergence of single-molecule sequencing and potential for molecular diagnostic applications
CN106033087A (zh) 内置性标准曲线检测物质分子数之方法系统
Kimoto et al. Unique thermal stability of unnatural hydrophobic ds bases in double-stranded DNAs
Ménová et al. Fluorescence quenching in oligonucleotides containing 7-substituted 7-deazaguanine bases prepared by the nicking enzyme amplification reaction
Zhi et al. Human MLPA Probe Design (H-MAPD): a probe design tool for both electrophoresis-based and bead-coupled human multiplex ligation-dependent probe amplification assays
Zrimec et al. Fast prediction of DNA melting bubbles using DNA thermodynamic stability

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant