KR102189358B1 - 올리고뉴클레오타이드의 특이성 평가 - Google Patents

올리고뉴클레오타이드의 특이성 평가 Download PDF

Info

Publication number
KR102189358B1
KR102189358B1 KR1020197000224A KR20197000224A KR102189358B1 KR 102189358 B1 KR102189358 B1 KR 102189358B1 KR 1020197000224 A KR1020197000224 A KR 1020197000224A KR 20197000224 A KR20197000224 A KR 20197000224A KR 102189358 B1 KR102189358 B1 KR 102189358B1
Authority
KR
South Korea
Prior art keywords
oligonucleotide
sequence
formula
region
nucleotide sequence
Prior art date
Application number
KR1020197000224A
Other languages
English (en)
Other versions
KR20190003868A (ko
Inventor
천종윤
윤기석
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20190003868A publication Critical patent/KR20190003868A/ko
Application granted granted Critical
Publication of KR102189358B1 publication Critical patent/KR102189358B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base

Abstract

본 발명은 5'-X-Y-Z-3'로 표시되는 올리고뉴클레오타이드의 특이성을 평가하는 방법에 관한 것이다. 본 발명은 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 뉴클레오타이드 서열을 추출하는 단계; 및 상기 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계를 포함한다.

Description

올리고뉴클레오타이드의 특이성 평가
본 발명은 올리고뉴클레오타이드의 특이성 평가에 관한 것이다.
핵산 증폭은 분자 생물학의 다양한 방법에서 필수적인 과정으로서, 다양한 증폭 방법이 제시되었다. 예를 들어, Miller, H. I. 등 (국제 공개공보 WO 제89/06700호)은, 프로모터/프라이머 서열을 타겟 단일가닥 DNA("ssDNA")에 혼성화시킨 다음 상기 서열의 많은 RNA 카피를 전사하는 것에 기초하여 핵산 서열을 증폭하였다. 다른 공지의 핵산 증폭 과정은 전사 기반 증폭 시스템을 포함한다(Kwoh, D. et al., Proc. Natl. Acad. Sci. U.S.A., 86:1173(1989); 및 Gingeras T.R. et al., WO 88/10315).
중합효소 연쇄반응(이하, "PCR"이라 함)으로 공지된 가장 많이 이용되는 핵산 증폭 방법은 이중가닥 DNA의 변성 후, DNA 주형에의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클에 기초한다(Mullis 등, 미국 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., (1985) Science 230, 1350-1354).
최근에는, 실시간 방식으로 타겟 핵산 서열의 증폭을 검출하는 실시간 PCR 기술이 널리 사용되고 있다. 실시간 PCR은 일반적으로 타겟 핵산 서열과 특이적으로 혼성화되는 프라이머 및/또는 프로브와 같은 올리고뉴클레오타이드를 이용한다. 표지된 프로브와 타겟 핵산 서열 간의 혼성화를 이용하는 방법의 예는 헤어핀 구조를 형성할 수 있는 이중 표지된 프로브를 이용한 Molecular beacon 방법(Tyagi et al., Nature Biotechnology v.14 MARCH 1996), HyBeacon 방법(French DJ et al., Mol. Cell Probes, 15(6):363-374(2001)), 공여체 및 수용체로 각각 표지된 2개의 프로브를 이용한 혼성화 프로브 방법(Bernad et al, 147-148 Clin Chem 2000; 46) 및 단일 표지된 올리고뉴클레오타이드를 이용한 Lux 방법(미국 특허 제7,537,886호)이 있다. 또한, DNA 폴리머라아제의 5'-뉴클레아제 활성에 의한 이중 표지된 프로브의 절단 반응 뿐만 아니라 이중 표지된 프로브의 혼성화를 이용한 TaqMan 방법(미국 특허 제5,210,015호 및 제5,538,848호)이 널리 이용되었다.
PCR 및 실시간 PCR은 일반적으로 다양한 핵산의 혼합물로부터 원하는 타겟 핵산 서열을 증폭 또는 검출하기 위해 프라이머 및/또는 프로브를 이용한다. 따라서, 정확한 증폭 또는 검출 결과를 위해서는 프라이머 및/또는 프로브가 타겟 핵산 서열에 대해 높은 특이성을 가질 것이 요구된다.
이와 관련하여, 본 발명자들은 보다 높은 특이성으로 주형-의존적 반응을 수행하는 이중 특이성 올리고뉴클레오타이드(dual specificity oligonucleotide (DSO); 이중 프라이밍 올리고뉴클레오타이드(dual priming oligonucleotide(DPO)로도 불림)를 개발한 바 있다(국제 공개공보 WO 제2006/095981호 참조). 상기 DSO는 올리고뉴클레오타이드 분자 내에 3개의 상이한 부위, 즉 5'-고 Tm 특이성 부위, 3'-저 Tm 특이성 부위 및 분할 부위를 가지며, 유니버설 염기로 구성된 분할 부위에 의해 분리된 두 부위(5'-고 Tm 특이성 부위 및 3'-저 Tm 특이성 부위)에 의해 혼성화 특이성이 이중으로 결정된다.
또한, 본 발명자들은 타겟 핵산 서열과 비타겟 핵산 서열을 구별할 수 있는 타겟 구별성 프로브(target discriminative probe; TD probe로 불림)를 개발한 바 있다(국제 공개공보 WO 제2011/028041호 참조). 상기 TD 프로브는 올리고뉴클레오타이드 분자 내에 3개의 고유한 부위, 즉 5'-제2 혼성화 부위, 3'-제1 혼성화 부위 및 분할 부위를 포함하며, 유니버설 염기로 구성된 분할 부위에 의해 분리된 5'-제2 혼성화 부위 및 3'-제1 혼성화 부위에 의해 TD 프로브의 혼성화 특이성이 이중으로 결정된다.
일반적으로, PCR 및 실시간 PCR에 사용되는 올리고뉴클레오타이드는 타겟 핵산 서열에 혼성화하거나 매치되도록 디자인되고 제조된다. 하지만, 아무리 정교하게 디자인된 올리고뉴클레오타이드도 그 디자인시 확인되지 않은 비타겟 핵산 서열과 혼성화될 수 있다. 따라서, 디자인된 올리고뉴클레오타이드가 의도한 타겟에만 혼성화되고 임의의 의도하지 않은 비타겟에는 혼성화되지 않는지 확인할 필요가 있다. 이것은 일반적으로 특이성 평가(확인) 과정으로 불린다.
특이성 평가 과정은, 상기 디자인된 올리고뉴클레오타이드를 임의의 서열 정렬 알고리즘 또는 프로그램(예컨대, BLAST)을 사용하여 공지된 뉴클레오타이드 서열 데이터베이스(예컨대, GenBank)에 대해 서치하여 상동 서열을 찾는 단계(상동성 서치), 및 상기 생성된 상동 서열을 분석하여, 디자인된 올리고뉴클레오타이드가 원하는 타겟 핵산 서열에만 혼성화되는지 확인하는 단계를 포함할 수 있다. 이러한 특이성 평가 과정은 프라이머 및 프로브의 적절성 또는 작동성을 평가하는 매우 유용한 도구가 되었다.
올리고뉴클레오타이드의 특이성을 평가하기 위해 다양한 서열 정렬 알고리즘 또는 프로그램이 이용되어 왔다. 그 중에서도, BLAST는 뉴클레오타이드 질의(query) 서열을 뉴클레오타이드 서열 데이터베이스와 비교하여 상기 데이터베이스에서 상기 질의와 유사한 서열을 찾는, 가장 널리 사용되는 서열 유사성 서치 도구 중 하나이다. 이 프로그램은 미국국립생물공학정보센터(NCBI, National Center for Biotechnology Information, http://www.ncbi.nih.gov)에 의해 무료로 제공된다.
BLAST 프로그램은 기본적으로 문자열 매칭(string-matching) 프로그램이다. 생물학적 문자열 매칭은 상동성의 증거로서 유사성을 찾는다. 질의 및 데이터베이스 내의 서열 간의 유사성은 데이터베이스로부터의 서열의 상응하는 영역에 정확히 매치하는 질의 내의 염기의 퍼센트 동일성 또는 개수에 의해 측정될 수 있다.
BLAST 서치의 출력은 원시 스코어 S, 스코어링(scoring) 알고리즘의 다양한 파라미터, 및 질의와 데이터베이스의 특성에 기초하여 발견한 매치에 대한 스코어와 통계의 세트를 보고한다. 원시 스코어 S는 유사성과 매치의 크기의 측정값이다. BLAST 출력은 E 값에 의해 순서가 매겨진 히트(hit)를 나열한다. 매치의 E(기대) 값은, 동일한 크기와 구성의 무작위로 생성된 데이터베이스에서 문자열 매칭(갭 허용)이 발생할 가능성을 개략적으로 측정한다. E 값이 0에 가까울수록 그것이 우연히 발생할 가능성은 더 낮다. 즉, E 값이 낮을수록 매치는 더 잘 이루어진다. 이는 타겟 핵산 서열에 대한 프라이머의 매치의 척도로서 사용될 수 있다.
BLAST는 전형적인 올리고뉴클레오타이드에 대해 비교적 우수한 결과를 제공하지만, 서열 내부에 몇 개의 연속적인 유니버설 염기, 비자연 염기 등을 함유하는 비전형적인 올리고뉴클레오타이드에 대해서는 적합하지 못하다.
특히, 본 발명자들에 의해 개발된 이중 특이성 올리고뉴클레오타이드와 같이 복수의 연속적인 유니버설 염기를 함유하는 올리고뉴클레오타이드의 경우, BLAST는 질의로서 전체 서열을 입력하였음에도 불구하고 유니버설 염기에 의해 부위 중 하나의 부위의 결과만을 생성한다. 또한, BLAST는 서열 내부에 복수의 연속적인 유니버설 염기를 함유하는 올리고뉴클레오타이드의 디자인시 중요한 고려사항인 5' 부위 및 3' 부위에 대한 개별적인 미스매치 결과를 제공하지 않는다.
또한, BLAST는 유니버설 염기 또는 축퇴성 염기를 그의 특정 유형에 관계없이 미스매치로 처리한다.
따라서, 종래 서열 정렬 알고리즘 또는 프로그램이 비전형적인 올리고뉴클레오타이드의 특이성을 평가하는데 적합하지 않다는 사실에 비추어 볼 때, 비전형적인 올리고뉴클레오타드의 특이성을 보다 정확하게 평가하기 위한 새로운 방법의 개발이 요구된다.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 올리고뉴클레오타이드, 특히 서열 내부에 왓슨-크릭 염기쌍에 관여하지 않는 연속적인 염기를 함유하는 비전형적인 올리고뉴클레오타이드의 특이성을 평가하는 방법을 개발하고자 노력하였다. 그 결과, 본 발명자들은 올리고뉴클레오타이드 서열을 뉴클레오타이드 서열 데이터베이스와 비교하는 단계, 상기 올리고뉴클레오타이드와 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계, 및 상기 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 왓슨-크릭 염기쌍에 관여하지 않는 연속적인 염기에 의해 분리된 2개의 부위에서 개별적인 매치 결과를 제공하는 단계를 포함하는 신규한 방법을 개발하였다.
따라서, 본 발명의 목적은 올리고뉴클레오타이드의 특이성을 평가하는 방법을 제공하는 데 있다.
본 발명의 다른 목적은 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하는 데 있다.
본 발명의 또 다른 목적은 올리고뉴클레오타이드의 특이성을 평가하기 위한 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 첨부된 청구범위 및 도면과 함께 하기의 상세한 설명으로부터 명확하게 될 것이다.
I. 올리고뉴클레오타이드의 특이성의 평가
본 발명의 일 양태에 따르면, 본 발명은 하기 단계를 포함하는, 올리고뉴클레오타이드의 특이성을 평가하는 방법을 제공한다:
(a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
5'-X-Y-Z-3' (I)
상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
(b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
(c) 상기 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
본 발명자들은 올리고뉴클레오타이드, 특히 서열 내부에 왓슨-크릭 염기쌍에 관여하지 않는 연속적인 염기를 함유하는 비전형적인 올리고뉴클레오타이드의 특이성을 평가하는 방법을 개발하고자 노력하였다. 그 결과, 본 발명자들은 올리고뉴클레오타이드 서열을 뉴클레오타이드 서열 데이터베이스와 비교하는 단계, 상기 올리고뉴클레오타이드와 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계, 및 상기 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 왓슨-크릭 염기쌍에 관여하지 않는 연속적인 염기에 의해 분리된 2개의 부위에서 개별적인 매치 결과를 제공하는 단계를 포함하는 신규한 방법을 개발하였다.
본원에서 사용된 바와 같이, 용어 "특이성(specificity)"은 "어닐링 또는 혼성화 특이성" 및 "타겟 특이성"을 포함한다.
용어 "어닐링 또는 혼성화 특이성"은 완전히 상보적인 염기 간에 이뤄지는 혼성화의 정확도(fidelity)를 의미한다. 상기 용어는 2개의 핵산 서열 간의 관계를 기술하는데 사용된다. 상기 정의에 따르면, 높은 특이성을 갖는 올리고뉴클레오타이드는 특정 조건하에 또 다른 올리고뉴클레오타이드 또는 폴리뉴클레오타이드에 혼성화할 수 있는 반면, 낮은 특이성을 갖는 올리고뉴클레오타이드는 그렇지 못하다.
용어 "타겟 특이성"은 관심 타겟 핵산 서열에 매치하거나, 혼성화되거나, 이를 증폭하거나, 또는 검출하나, 임의의 다른 핵산 서열(비타겟 핵산 서열)에 매치하거나, 혼성화하거나, 이를 증폭하거나, 또는 검출하지 않는 올리고뉴클레오타이드의 특성을 의미하며, 이는 용어 "타겟 특이성", "타겟 핵산에 대한 특이성" 또는 "타겟 핵산 서열에 특이적"과 상호교환적으로 사용될 수 있다. 상기 정의에 따르면, 높은 특이성을 갖는 올리고뉴클레오타이드는 PCR 또는 실시간 PCR 방법에 의해 다양한 핵산의 혼합물을 함유하는 샘플로부터 원하는 타겟 핵산 서열만을 증폭 또는 검출할 수 있는 반면, 낮은 타겟 특이성을 갖는 올리고뉴클레오타이드는 관심 타겟뿐만 아니라 비타겟을 증폭 또는 검출하여 타겟 증폭 효율을 감소시키고 위양성(false-positive) 결과를 야기할 수 있다.
본원에 사용된 바와 같이 용어 특이성은 어닐링 특이성 및 타겟 특이성 중 하나 또는 모두를 의미할 수 있다.
특이성은 혼성화 조건(예컨대, 온도)과 같은 몇 가지 인자에 따라 달라질 수 있으나, 특이성은 일차적으로 올리고뉴클레오타이드 서열과 참조 뉴클레오타이드 서열 간의 상동성에 의해 결정될 수 있다. 즉, 특이성은 올리고뉴클레오타이드와 참조 뉴클레오타이드 서열 간의 매치/미스매치 결과에 좌우될 수 있다. 당업자는, 디자인된 올리고뉴클레오타이드와 뉴클레오타이드 서열 간의 매치/미스매치에 기초하여, 상기 디자인된 올리고뉴클레오타이드가 특정한 조건 하에서 핵산 서열에 혼성화되어 이를 선택적으로 증폭 또는 검출할 수 있는지 확인할 수 있을 것이다.
또한, 본원에 사용된 바와 같이 용어 "특이성에 관한 정보"는 올리고뉴클레오타이드의 특이성을 평가하는데 도움이 되는 임의의 정보를 의미한다. 전술한 바와 같이, 본원에서 사용된 특이성에 관한 정보는 올리고뉴클레오타이드 서열과 참조 뉴클레오타이드 서열 간의 유사성, 즉 이들 사이의 매치/미스매치를 분석하여 수득된 정보를 가리킨다. 특이성에 관한 정보는 하기에서 상세히 설명될 것이다.
또한, 본원에 사용된 바와 같이 용어 "특이성을 평가한다" 또는 "특이성 평가"는 상기 제공된 정보, 즉 올리고뉴클레오타이드 서열과 참조 뉴클레오타이드 서열 간의 매치/미스매치에 기초하여 올리고뉴클레오타이드의 특이성을 결정하는 것을 포함한다.
당업자는 상기 매치/미스매치에 기초하여 디자인된 올리고뉴클레오타이드가 특정한 조건 하에서 특정 타겟 핵산 서열에 혼성화될 수 있는지 확인할 수 있을 것이다.
또한, 당업자는 디자인된 올리고뉴클레오타이드와 참조 뉴클레오타이드 서열 간의 매치/미스매치에 기초하여 디자인된 올리고뉴클레오타이드가 특정한 조건 하에서 타겟 핵산 서열에만 혼성화되어 이를 선택적으로 증폭 또는 검출할 수 있는지 확인할 수 있을 것이다.
본 발명은 서열 내부에 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 비전형적인 올리고뉴클레오타이드의 특이성을 평가하는 방법에 관한 것이다. 본 발명은 왓슨-크릭 염기쌍에 관여하지 않는 연속적인 염기에 의해 분리된 2개의 부위(부위 X 및 Z)에서의 개별적인 매치/미스매치 결과를 제공한다.
특히, 특이성에 대해 상이한 효과를 미치는 2개의 부위를 포함하는 올리고뉴클레오타이드의 경우, 사용자는 본 발명에 의해 제공된 각 부위에서의 미스매치 결과를 통해 올리고뉴클레오타이드의 특이성을 정확하게 평가할 수 있다. 따라서, 본 발명의 방법은 이러한 비전형적인 올리고뉴클레오타이드의 특이성을 평가하는데 특히 유용하다.

도 1은 본 발명의 예시적인 구현예에 따라 올리고뉴클레오타이드의 특이성을 평가하는 과정을 나타낸 흐름도이다. 본 발명의 방법(100)을 도 1을 참조하여 설명하면 다음과 같다:
단계 (a): 올리고뉴클레오타이드의 제공( 110 )
먼저, 본 단계에서는 특이성을 평가하고자 하는 올리고뉴클레오타이드를 제공한다(110). 상기 올리고뉴클레오타이드는 타겟 핵산 서열을 증폭 또는 검출하는데 사용되는 프라이머 또는 프로브이다.
본원에 사용된 바와 같이 용어 "타겟 핵산 서열", "타겟 서열", 또는 "타겟"은 본 발명의 올리고뉴클레오타이드를 사용하여 증폭 또는 검출하고자 하는 핵산 서열을 의미한다. 상기 타겟 핵산 서열은 이중 가닥 또는 단일 가닥일 수 있다. 상기 타겟 핵산 서열은 이중 가닥의 핵산 중 어느 한 가닥 또는 두 가닥, 즉 (+) 가닥(코딩 가닥, 센스 가닥, 비주형 가닥) 또는 (-) 가닥(비코딩 가닥, 안티센스 가닥, 주형 가닥)일 수 있다. 상기 타겟 핵산 서열은 본 발명의 올리고뉴클레오타이드와 혼성화될 수 있는 영역을 포함하는 하나의 폴리뉴클레오타이드 서열일 수 있다. 택일적으로, 상기 타겟 핵산 서열은 본 발명의 올리고뉴클레오타이드와 혼성화될 수 있는 공통 영역을 포함하는 적어도 2개의 폴리뉴클레오타이드 서열일 수 있다. 상기 타겟 핵산 서열은 유전적 다양성(genetic diversity)을 갖는 뉴클레오타이드 서열일 수 있다. 상기 타겟 핵산 서열은 유전적으로 동일한 유전자 패밀리, 즉 유전자 및 이의 변이체로 구성된 그룹일 수 있다. 상기 타겟 핵산 서열은 유전자 및 종래 공지된 분류 기준에 따라 상기 유전자에 속하는 아형(subtype)의 그룹일 수 있다. 예를 들어, 올리고뉴클레오타이드가 HPV(human papillomavirus) 유형 16을 증폭 또는 검출하기 위한 것인 경우, 타겟 핵산 서열은 HPV 유형 16에 속하는 복수의 유전자로 구성될 수 있다.
반면, 본원에 사용된 바와 같이 용어 "비타겟 핵산 서열", "비타겟 서열", 또는 "비타겟"은 본 발명의 올리고뉴클레오타이드를 사용하여 증폭 또는 검출되는 타겟 핵산 서열 이외의 핵산 서열을 의미한다. 비타겟 핵산 서열은 또한 본 발명의 올리고뉴클레오타이드를 사용하여 증폭 또는 검출하고자 하는 것은 아니지만, 우연히 증폭 또는 검출될 수 있는 핵산 서열도 포함한다.
본원에 사용된 바와 같이 용어 "올리고뉴클레오타이드"는 그의 특이성을 평가하고자 하는 짧은 폴리뉴클레오타이드를 의미한다. 상기 올리고뉴클레오타이드는 "질의(query)" 또는 "질의 서열"로 지칭될 수 있다.
상기 올리고뉴클레오타이드는 자연적으로 존재하거나 인공적으로 합성될 수 있는, 타겟 핵산 서열에 특이적으로 혼성화할 수 있는, 데옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하는, 자연의 또는 변형된 모노머 또는 연쇄(linkages)의 선형 올리고머를 의미한다. 올리고뉴클레오타이드는 혼성화에서의 최대 효율을 위해 바람직하게는 단일쇄이다. 바람직하게는, 올리고뉴클레오타이드는 올리고데옥시리보뉴클레오타이드이다. 본 발명의 올리고뉴클레오타이드는 자연(naturally occurring) dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형된 뉴클레오타이드, 또는 비자연 뉴클레오타이드를 포함할 수 있다. 올리고뉴클레오타이드는 리보뉴클레오타이드도 포함할 수 있다. 예를 들어, 본 발명의 올리고뉴클레오타이드는 골격 변형된 뉴클레오타이드, 예컨대, 펩타이드 핵산 (Peptide Nucleic Acid: PNA)(M. Egholm et al., Nature, 365:566-568(1993)), 포스포로티오에이트 DNA, 포스포로디티오에이트 DNA, 포스포로아미데이트 DNA, 아마이드-연결된 DNA, MMI-연결된 DNA, 2'-O-메틸 RNA, 알파-DNA 및 메틸포스포네이트 DNA, 당 변형된 뉴클레오타이드, 예컨대, 2'-O-메틸 RNA, 2'-플루오로 RNA, 2'-아미노 RNA, 2'-O-알킬 DNA, 2'-O-알릴 DNA, 2'-O-알카이닐 DNA, 헥소스 DNA, 피라노실 RNA 및 안히드로헥시톨 DNA, 및 염기 변형을 갖는 뉴클레오타이드, 예컨대 C-5 치환된 피리미딘(플루오로-, 브로모-, 클로로-, 아이오도-, 메틸-, 에틸-, 비닐-, 포르밀-, 에티닐-, 프로피닐-, 알카이닐-, 티아조릴-, 이미다조릴-, 피리딜- 포함 치환기), C-7 치환기를 갖는 7-데아자퓨린(플루오로-, 브로모-, 클로로-, 아이오도-, 메틸-, 에틸-, 비닐-, 포르밀-, 알카이닐-, 알켄일-, 티아조릴-, 이미다조릴-, 피리딜- 포함 치환기), 이노신 및 디아미노퓨린을 포함할 수 있다.
예를 들어, 본 발명의 올리고뉴클레오타이드는 자연 염기(A, T, C 또는 G) 이외의 염기를 포함할 수 있다.
본 발명의 방법에서 특이성을 평가하고자 하는 올리고뉴클레오타이드는 프라이머 또는 프로브이다.
본원에 사용된 바와 같이 용어 "프라이머"는 타겟 핵산 가닥(주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건 하에, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 존재하에 합성의 개시점으로 작용할 수 있는 올리고뉴클레오타이드를 가리킨다. 프라이머는 중합제의 존재하에 연장 산물의 합성을 프라이밍시킬 수 있을 정도로 충분히 길어야 한다. 프라이머의 정확한 길이는 온도, 응용분야 및 프라이머의 소스(source)를 포함하는 많은 인자에 따라 달라질 것이다.
본원에 사용된 바와 같이 용어 "프로브(probe)"는 타겟 핵산 서열에 실질적으로 상보적인 부위 또는 부위들을 포함하는 단일쇄 핵산 분자를 의미한다. 상기 프로브는 타겟 핵산 서열의 검출을 위한 시그널을 발생시킬 수 있는 표지를 함유할 수 있다. 상기 프로브의 3'-말단은 그의 연장을 방지하기 위해 "블로킹"될 수 있다. 상기 블로킹은 종래의 방법에 따라 달성될 수 있다. 예를 들어, 블로킹은 마지막 뉴클레오타이드의 3'-하이드록실기에 바이오틴, 표지, 포스페이트기, 알킬기, 비-뉴클레오타이드 링커, 포스포로티오에이트 또는 알칸-디올과 같은 화학적 모이어티를 부가함으로써 수행될 수 있다. 택일적으로, 블로킹은 마지막 뉴클레오타이드의 3'-하이드록실기를 제거하거나 디데옥시뉴클레오타이드와 같은 3'-하이드록실기가 없는 뉴클레오타이드를 사용하여 수행될 수 있다.
본원에 사용된 바와 같이 용어 "어닐링" 또는 "프라이밍"은 주형 핵산에 올리고데옥시뉴클레오타이드 또는 핵산이 병치(apposition)되는 것을 의미하며, 상기 병치는 중합효소가 뉴클레오타이드를 중합시켜 주형 핵산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다. 본원에서 사용된 용어 "혼성화(hybridization)"는 상보적인 단일쇄 핵산으로부터 이중쇄 핵산을 형성하는 것을 의미한다. 용어 "어닐링"과 "혼성화"는 차이가 없으며, 본 명세서에서 혼용된다.
본 발명에서 특이성을 평가하고자 하는 올리고뉴클레오타이드는 하기 식 (I)로 표시되는 올리고뉴클레오타이드이다:
5'-X-Y-Z-3' (I)
상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타낸다.
식 (I)의 올리고뉴클레오타이드는 구별되는 특성을 갖는 3개의 상이한 부위를 가지며, 타겟 핵산 서열에 대한 그의 어닐링 특이성은 그의 분리된 두 부위, 즉 부위 X 및 부위 Z에 의해 이중으로 결정된다.
일반적으로, 종래의(전형적인) 프라이머 또는 프로브의 어닐링 특이성은 그의 전체 서열에 의해 지배된다. 이에 반해, 식 (I)의 올리고뉴클레오타이드의 어닐링 특이성은 부위 Y에 의해 분리된 두 부위, 즉 부위 X 및 부위 Z에 의해 이중으로 결정된다.
식 (I)의 올리고뉴클레오타이드에서, 부위 Y는 2개 이상의 연속적인 염기를 포함하며, 이들 각각은 왓슨-크릭 염기쌍에 관여하지 않는다.
본원에 사용된 바와 같이, 왓슨-크릭 염기쌍은 아데닌(A)이 티민(T) 또는 우라실(U)에 결합하는 한편, 구아닌(G)이 시토신(C)에 결합하는 것을 의미한다.
따라서, 왓슨-크릭 염기쌍에 관여하지 않는 염기는 타겟 핵산 서열 내의 반대편에 있는 염기와 왓슨-크릭 염기쌍을 형성하지 않는 임의의 염기를 지칭한다. 특히, 왓슨-크릭 염기쌍에 관여하지 않는 염기는 자연 염기 사이의 염기쌍 형성의 강도보다 염기와 타겟 핵산 서열 내의 반대편에 있는 염기 사이에서 더 낮은 강도(낮은 멜팅 온도)의 염기쌍 형성을 나타내는 임의의 염기를 포함한다.
일 구현예에서, 부위 Y는 올리고뉴클레오타이드가 타겟 핵산 서열에 어닐링될 때 3개의 부위 중에서 가장 낮은 Tm 값을 갖도록 디자인된다.
왓슨-크릭 염기쌍에 관여하지 않는 이들 염기는 특히, 부위 X 및/또는 Y가 타겟 핵산 서열에 특이적으로 어닐링(혼성화)하는 조건 하에, 어닐링(혼성화) 또는 증폭 동안에 버블 구조를 생성하여 부위 X와 부위 Z를 분할시키고, 이에 의해 타겟 핵산 서열에 대한 프라이머 또는 프로브의 어닐링 특이성을 향상시킨다.
왓슨-크릭 염기쌍에 관여하지 않는 염기의 예는: (i) 비자연 염기; (ii) 유니버설 염기; 및 (iii) 미스매치된 염기를 포함한다. 일 구현예에서, 분할 부위 Y에 포함된 염기는 비자연 염기; 유니버설 염기; 미스매치된 염기 및 이의 조합으로부터 선택된다.
본원에 사용된 바와 같이 용어 "비자연 염기"는 서로 수소-결합 염기쌍을 형성할 수 있는, 아데닌(A), 구아니(G), 티민(T), 시토신(C) 및 우라실(U)과 같은 자연 염기의 유도체를 의미한다(미국 특허 제8,440,406호 참고). 본원에 사용된 용어 "비자연 염기"는, 예를 들어, 미국 특허 제5,432,272호, 제5,965,364호, 제6,001,983호, 제6,037,120호, 및 제8,440,406호에 기재된 바와 같이, 모 화합물로서 자연 염기와 상이한 염기쌍 형성 패턴을 갖는 염기를 포함한다. 비자연 염기 간의 염기쌍 형성은 자연 염기와 같이 2 또는 3개의 수소 결합을 포함한다. 비자연 염기 간의 염기쌍 형성은 또한 특정 방식으로 형성된다.
식 (I)의 올리고뉴클레오타이드에 포함된 비자연 염기는, 타겟 핵산 서열 내의 반대편 염기가 자연 염기인 경우, 왓슨-크릭 염기쌍에 관여하지 않는다. 비자연 염기와 타겟 핵산 서열 내의 반대편 염기 간의 염기쌍 형성은 자연 염기 간의 염기쌍 형성에 비해 낮은 강도(낮은 멜팅 온도)를 갖는다. 따라서, 이러한 염기쌍 형성은 버블 구조를 생성시키고 부위 X 및 Z를 분리시키는 역할을 한다.
비자연 염기의 특정한 예는 염기쌍 조합된 하기 염기를 포함한다: iso-C/iso-G, iso-dC/iso-dG, K/X, H/J, 및 M/N(미국 특허 제7,422,850호 및 제8,440,406호 참고).
본원에 사용된 바와 같이 용어 "유니버설 염기(universal base)"는 자연의 DNA/RNA 염기들 각각과 구별없이 염기쌍을 형성할 수 있는 염기를 의미하며, 상기 염기쌍은 왓슨-크릭 염기쌍에 관여하지 않는다.
식 (I)의 올리고뉴클레오타이드에 포함된 유니버설 염기와 타겟 핵산 서열에 포함된 반대편 염기 간의 염기쌍 형성은 자연 염기 간의 염기쌍 형성에 비해 낮은 강도(낮은 멜팅 온도)를 갖는다.
상기 유니버설 염기의 예는 데옥시이노신, 이노신, 7-디아자-2'-데옥시이노신, 2-아자-2'-데옥시이노신, 2'-OMe 이노신, 2'-F 이노신, 데옥시 3-니트로피롤, 3-니트로피롤, 2'-OMe 3-니트로피롤, 2'-F 3-니트로피롤, 1-(2'-데옥시-베타-D-리보푸라노실)-3-니트로피롤, 데옥시 5-니트로인돌, 5-니트로인돌, 2'-OMe 5-니트로인돌, 2'-F 5-니트로인돌, 데옥시 4-니트로벤즈이미다졸, 4-니트로벤즈이미다졸, 데옥시 4-아미노벤즈이미다졸, 4-아미노벤즈이미다졸, 데옥시 네불라린, 2'-F 네불라린, 2'-F 4-니트로벤즈이미다졸, PNA-5-인트로인돌, PNA-네불라린, PNA-이노신, PNA-4-니트로벤즈이미다졸, PNA-3-니트로피롤, 모르포리노-5-니트로인돌, 모르포리노-네불라린, 모르포리노-이노신, 모르포리노-4-니트로벤즈이미다졸, 모르포리노-3-니트로피롤, 포스포라미데이트-5-니트로인돌, 포스포라미데이트-네불라린, 포스포라미데이트-이노신, 포스포라미데이트-4-니트로벤즈이미다졸, 포스포라미데이트-3-니트로피롤, 2'-0-메톡시에틸이노신, 2'-0-메톡시에틸 네불라린, 2'-0-메톡시에틸 5-니트로인돌, 2'-0-메톡시에틸 4-니트로-벤즈이미다졸, 2'-0-메톡시에틸 3-니트로피롤 및 이의 조합을 포함한다. 특히, 상기 유니버설 염기는 데옥시이노신, 이노신, 1-(2'-데옥시-베타-D-리보푸라노실)-3-니트로피롤, 또는 5-니트로인돌이며, 보다 특히 데옥시이노신 또는 이노신이다.
본원에 사용된 바와 같이 용어 "미스매치된 염기"는 타겟 핵산 서열 내의 반대편 염기와 수소 결합 염기쌍을 형성할 수 없는 염기를 의미한다(WO 제2013/123552호 및 WO 제2014/124290호 참고). 상기 미스매치된 염기는 타겟 핵산 내의 반대편 염기의 유형에 따라 달라질 수 있다.
식 (I)의 올리고뉴클레오타이드에 함유된 미스매치된 염기는 타겟 핵산 내에 함유된 반대편 염기와 염기쌍을 형성할 수 없으므로, 미스매치된 염기를 포함하는 부위 Y는 버블 구조를 생성시키고 부위 X와 Z를 분리하는 역할을 한다.

부위 Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개의 연속적인 염기, 바람직하게는 왓슨-크릭 염기쌍에 관여하지 않는 3개, 4개, 5개, 6개, 7개, 또는 그 이상의 연속적인 염기를 가질 수 있다. 특정 구현예에 따르면, 상기 부위 Y는 왓슨-크릭 염기쌍에 관여하지 않는 2-10개, 2-9개, 2-8개, 2-7개, 2-6개 또는 2-5개, 2-4개 또는 2-3개의 연속적인 염기, 보다 특히 왓슨-크릭 염기쌍에 관여하지 않는 3-10개, 3-9개, 3-8개, 3-7개, 3-6개, 3-5개 또는 3-4개의 연속적인 염기, 가장 특히 왓슨-크릭 염기쌍에 관여하지 않는 4-10개, 4-9개, 4-8개, 4-7개, 4-6개 또는 4-5개의 연속적인 염기를 갖는다.
일 구현예에서, 부위 Y는 2개의 연속적인 비자연 염기, 바람직하게는, 3개, 4개, 5개, 6개, 7개, 8개 또는 그 이상의 연속적인 비자연 염기를 갖는다. 또 다른 구현예에서, 부위 Y는 2개의 연속적인 유니버설 염기, 바람직하게는 3개, 4개, 5개, 6개, 7개, 8개 또는 그 이상의 연속적인 유니버설 염기를 갖는다. 또 다른 구현예에서, 부위 Y는 2개의 연속적인 미스매치된 염기, 바람직하게는 3개, 4개, 5개, 6개, 7개, 8개 또는 그 이상의 연속적인 미스매치된 염기를 갖는다. 또 다른 구현예에서, 부위 Y는 2개, 바람직하게는 3개, 4개, 5개, 6개, 7개, 8개 또는 그 이상의 연속적인 염기를 가지며, 각 염기는 독립적으로 비자연 염기, 유니버설 염기 및 미스매치된 염기로부터 선택된다.
식 (I)의 올리고뉴클레오타이드에서, 부위 X 및 Z는 각각 타겟 핵산 서열에 대한 혼성화 뉴클레오타이드를 갖는 부위, 즉 각각 혼성화되는 주형 핵산 상의 위치에 상보적인 혼성화 뉴클레오타이드 서열을 갖는 부위이다.
용어 "상보적인"은 지정된 어닐링 조건 또는 엄격 조건하에서 타겟 핵산 서열에 선택적으로 혼성화하기에 충분히 상보적인 것을 의미하기 위해 본원에서 사용되며, 용어 "실질적으로 상보적인" 및 "완전히 상보적인", 바람직하게는 완전히 상보적인 것을 포함한다.
식 (I)의 올리고뉴클레오타이드 내의 부위 X 및/또는 부위 Z는 그것이 프라이머 또는 프로브로서 작용할 수 있는 범위 내에서 주형(타겟 핵산 서열)에 대해 하나 이상의 미스매치를 가질 수 있다. 예를 들어, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및/또는 부위 Z는 1-2, 1-3 또는 1-4개의 비상보적 뉴클레오타이드를 가질 수 있다.
가장 특히, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및/또는 부위 Z는 주형 상의 하나의 위치에 완전하게 상보적인, 즉 미스매치가 없는 뉴클레오타이드 서열을 갖는다.
부위 X 및 부위 Z의 길이는 각각 3 내지 50개의 뉴클레오타이드 잔기의 범위일 수 있다.
일 구현예에서, 부위 X는 부위 Z보다 길다. 구체적으로, 부위 X의 길이는 15 내지 50, 15 내지 40, 15 내지 30 또는 15 내지 25 뉴클레오타이드 잔기, 보다 특히 17 내지 50, 17 내지 40, 17 내지 30 또는 17 내지 25 뉴클레오타이드 잔기, 및 가장 특히 20 내지 50, 20 내지 40, 20 내지 30 또는 20 내지 25 뉴클레오타이드 잔기이다. Z 부위의 길이는 3 내지 15, 3 내지 12 또는 3 내지 10 뉴클레오타이드 잔기, 보다 특히 5 내지 15, 5 내지 12 또는 5 내지 10 뉴클레오타이드 잔기, 가장 특히, 6 내지 12 뉴클레오타이드 잔기이다.
또 다른 구현예에서, 부위 Z는 부위 X보다 길다. 구체적으로, 부위 Z의 길이는 15 내지 50, 15 내지 40, 15 내지 30 또는 15 내지 25 뉴클레오타이드 잔기이고, 보다 특히 17 내지 50, 17 내지 40, 17 내지 30 또는 17 내지 25 뉴클레오타이드 잔기, 가장 특히, 20 내지 50, 20 내지 40, 20 내지 30 또는 20 내지 25 뉴클레오타이드 잔기이다. 부위 X의 길이는 3 내지 15, 3 내지 12 또는 3 내지 10 뉴클레오타이드 잔기, 보다 특히 5 내지 15, 5 내지 12 또는 5 내지 10 뉴클레오타이드 잔기, 가장 특히, 6 내지 12 뉴클레오타이드 잔기이다.
일 구현예에서, 부위 X 및 Z 각각의 Tm은 6℃ 내지 80℃, 6℃ 내지 70℃, 6℃ 내지 50℃, 6℃ 내지 40℃, 10℃ 내지 80℃, 10℃ 내지 70℃, 10℃ 내지 60℃, 10℃ 내지 50℃, 10℃ 내지 40℃, 20℃ 내지 80℃, 20℃ 내지 70℃, 20℃ 내지 60℃, 20℃ 내지 50℃, 20℃ 내지 40℃, 30℃ 내지 80℃, 30℃ 내지 70℃, 30℃ 내지 60℃, 30℃ 내지 50℃, 또는 30℃ 내지 40℃의 범위이다. 일 구현예에서, 부위 Y의 Tm은 1℃ 내지 15℃, 1℃ 내지 20℃, 1℃ 내지 5℃, 2℃ 내지 15℃, 2℃ 내지 10℃, 2℃ 내지 5℃, 3℃ 내지 15℃, 3℃ 내지 10℃, 또는 3℃ 내지 5℃이다. 일 구현예에서, 부위 Y의 Tm은 부위 X 및 Z 각각의 Tm보다 낮다.
일 구현예에서, 부위 X의 Tm은 부위 Z의 Tm보다 높다. 특정 구현예에서, 부위 X의 Tm은 부위 Z의 Tm보다 5℃, 10℃, 15℃, 20℃ 또는 25℃ 더 높다. 또 다른 구현예에서, 부위 Z의 Tm은 부위 X의 Tm보다 높다. 특정 구현예에서, 부위 Z의 Tm은 부위 Z의 Tm보다 5℃, 10℃, 15℃, 20℃ 또는 25℃ 더 높다.
식 (I)의 올리고뉴클레오타이드에서, 상기 X 및 Z 부위 중 어느 하나 또는 둘 모두는 적어도 하나의 유니버설 염기(universal base) 또는 축퇴성 염기(degenerate base)를 포함할 수 있다.
일 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 부위 Z 중 어느 하나 또는 둘 모두가 2개 이상의 유니버설 염기를 포함하는 경우, 상기 유니버설 염기는 상기 올리고뉴클레오타이드 서열에 연속적으로 존재하지 않고, 분리되어 존재한다. Y 부위가 또한 2개 이상의 연속적인 유니버설 염기를 함유하는 경우, X 부위 및 Z 부위 중 어느 하나 또는 둘 모두에 함유된 상기 2개 이상의 유니버설 염기는 서열에서 분리되어 존재한다는 점에서 Y 부위에서의 2개 이상의 연속적인 유니버설 염기와 구별된다.
또 다른 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 부위 Z 중 어느 하나 또는 둘 모두가 2개 이상의 유니버설 염기를 포함하는 경우, 상기 유니버설 염기는 상기 올리고뉴클레오타이드의 서열에 연속적으로 존재한다. Y 부위가 또한 2개 이상의 연속적인 유니버설 염기를 함유하는 경우, X 부위 및 Z 부위 중 어느 하나 또는 둘 모두에 함유된 둘 이상의 유니버셜 염기는 Y 부위에서의 2개 이상의 연속적인 유니버설 염기와 구별되지 않는다. 이 경우, 이들 중 어느 하나를 Y 부위로 처리하거나 간주할 수 있다. 일 예로서, 5' 말단에 더 근접한 유니버설 염기를 Y 부위로 처리할 수 있고, 상기 Y 부위 주위의 5' 말단에 있는 부위를 X 부위로 처리하고 Y 부위 주위의 3' 말단에 있는 부위를 Z 부위로 처리한다. 또 다른 예로서, 5' 말단으로부터 이격된 영역을 Y 부위로 처리하고, 상기 Y 부위 주위의 5' 말단에 있는 부위를 X 부위로, 3' 말단에 있는 부위를 Z 부위로 처리할 수 있다. 또 다른 예로서, 더 많은 유니버설 염기를 갖는 영역을 Y 부위로 처리하고, 상기 Y 부위 주위의 5' 말단에 있는 부위를 X 부위로, 상기 Y 부위 주위의 3' 말단에 있는 부위를 Z 부위로 처리할 수 있다.
본원에 사용된 바와 같이 용어 "축퇴성 염기"는 지정된 뉴클레오타이드 위치에 4개의 염기(A, C, G 또는 T) 중 어느 것 또는 4개의 염기의 특정 하위집합(2 또는 3개의 염기)이 존재할 수 있음을 의미한다. 또한, 상기 용어는 특정 위치에 둘 이상의 염기 가능성을 의미한다. 하나의 올리고 서열은 동일한 위치에 다수의 염기를 갖도록 합성될 수 있고, 이것은 종종 "와블(wobble)" 위치 또는 "혼합된 염기"로도 불리는 축퇴성 염기로 불린다.
상기 축퇴성 염기는 상이한 축퇴성(degeneracy) 정도를 가질 수 있다. 용어 "축퇴성 정도"는 주어진 뉴클레오타이드 위치를 차지할 수 있는 염기의 개수를 가리킨다. "완전한 축퇴성(full degeneracy)"은 4개의 염기 모두(A, C, G 또는 T)가 주어진 축퇴성 위치를 차지할 수 있을 때 발생한다. 이 경우, 주어진 축퇴성 위치에 염기 A를 갖는 올리고뉴클레오타이드, 주어진 축퇴성 위치에 염기 C를 갖는 올리고뉴클레오타이드로 이루어진 4개의 올리고뉴클레오타이드, 주어진 축퇴성 위치에 염기 G를 갖는 올리고뉴클레오타이드 및 주어진 축퇴성 위치에 염기 T를 갖는 올리고뉴클레오타이드가 함께 사용될 수 있다. 한편, "부분적인 축퇴성(partial degeneracy)"은 A/G, C/T, A/C/G, A/T/G 등과 같은 4개의 염기의 특정 하위집합(2-3)이 주어진 축퇴성 위치를 차지할 수 있을 때 발생한다.
축퇴성 염기의 표시와 관련하여, 뉴클레오타이드 염기에 대한 IUB 축퇴성 코드(IUB degenerate code)가 본원에서 사용된다. 이들 코드에서, R은 퓨린 염기 A 또는 G 중 어느 하나를 의미하고; Y는 피리미딘 염기 C 또는 T 중 어느 하나를 의미하며; M은 아미노 염기 A 또는 C 중 어느 하나를 의미하고; K는 케토 염기 G 또는 T 중 어느 하나를 의미하며; S는 강한 수소 결합 파트너 C 또는 G 중 어느 하나를 의미하고; W는 약한 수소 결합 파트너 A 또는 T 중 어느 하나를 의미하며; H는 A, C 또는 T를 의미하고; B는 G, T 또는 C를 의미하며; V는 G, C 또는 A를 의미하고; D는 G, A 또는 T를 의미하며; N은 G, A, C 또는 T를 의미한다.
본 발명의 특정 구현예에 따르면, 식 (I)로 표시되는 올리고뉴클레오타이드는 WO 제2006/095981호에 개시된 바와 같은 이중 특이성 올리고뉴클레오타이드(DSO 또는 DPO로 지칭됨)이다. 상기 이중 특이성 올리고뉴클레오타이드에 관한 세부 사항은 상기 문헌을 참고한다.
본 발명의 또 다른 특정 구현예에 따르면, 식 (I)로 표시되는 올리고뉴클레오타이드는 WO 제2011/028041호에 개시된 바와 같은 타겟 구별성(TD) 프로브이다. 상기 타겟 구별성 프로브에 관한 세부 사항은 상기 문헌을 참조한다.
본 단계에서 제공되는 식 (I)의 올리고뉴클레오타이드는 이미 존재하는(pre-existing) 올리고뉴클레오타이드(프라이머 또는 프로브)일 수 있다.
택일적으로, 본 단계에서 제공되는 식 (I)의 올리고뉴클레오타이드는 증폭 또는 검출하고자 하는 타겟 핵산 서열에 기초하여 디자인된 올리고뉴클레오타이드일 수 있다.
상기 올리고뉴클레오타이드는 수작업으로 또는 당업계에 널리 알려진 디자인 프로그램에 의해 디자인된 것일 수 있다. 종래 프라이머/프로브 디자인 프로그램의 예로는 Primer3(http://frodo.wi.mit.edu/), Visual OMP™ 소프트웨어(DNA Software, Inc., Ann Arbor, Mich.), Integrated DNA Technology(IDT) OligoAnalyzer 3.0 프로그램(http://scitools.idtdna.com/Analvzer/oligocalc.asp), DINAmelt™ 프로그램(http://dinamelt.bioinfo.rpi.edu/), OLIGO 7(Wojciech Rychlik (2007). "OLIGO 7 Primer Analysis Software". Methods MoI. Biol. 402: 35-60), Primer Express 3.0 소프트웨어(Applied Biosystems U.S.A) 등을 들 수 있으나, 이에 제한되지 않는다.
식 (I)의 올리고뉴클레오타이드는 그의 X 및 Y 부위가 타겟 핵산 서열에 실질적으로 혼성화될 수 있는 서열을 갖도록 디자인된다. 이를 위해, 식 (I)의 올리고뉴클레오타이드 내의 X 및 Y 부위는 타겟 핵산 서열의 특정 영역에 매치되도록(상당한 서열 유사성을 갖도록) 디자인된다.
식 (I)의 올리고뉴클레오타이드가 복수의 타겟 핵산 서열(예를 들어, 유전적 다양성을 갖는 뉴클레오타이드 서열; 유전적으로 동일한 유전자 패밀리로 구성된 그룹, 즉 유전자 및 이의 변이체; 유전자 및 그의 아형의 그룹)을 증폭 또는 검출하고자 하는 경우, 상기 올리고뉴클레오타이드는, 상기 복수의 타겟 핵산 서열을 정렬하고, 공통적인 서열, 예컨대 보존 구역(conserved region)을 찾고, 상기 보존 구역에 매치되도록 올리고뉴클레오타이드를 디자인함으로써 제조될 수 있다. 식 (I)의 올리고뉴클레오타이드는 복수의 타겟 핵산 서열과 100% 동일성(identity)을 갖도록 디자인될 수 있다. 택일적으로, 식 (I)의 올리고뉴클레오타이드는 제어된 혼성화 조건(예컨대, 온도) 하에 타겟 핵산 서열에 혼성화될 수 있는 한, 복수의 타겟 핵산 서열에 대해 몇 개의 미스매치를 갖도록 디자인될 수 있다.
식 (I)의 올리고뉴클레오타이드는 타겟 핵산 서열(들)을 기초로 하여 디자인된 복수의 후보(candidate) 올리고뉴클레오타이드 중 하나일 수 있다. 당업자는 공지된 타겟 핵산 서열(들)을 기초로 복수의 식 (I)의 후보 올리고뉴클레오타이드를 디자인할 수 있으며, 본 발명의 방법에 사용되는 식 (I)의 올리고뉴클레오타이드는 상기 후보 올리고뉴클레오타이드 중 하나일 수 있다.
식 (I)의 올리고뉴클레오타이드는 멀티플렉스 증폭 또는 검출에서 사용되는 올리고뉴클레오타이드 중 하나일 수 있다. 식 (I)의 올리고뉴클레오타이드는 복수의 타겟 핵산 서열을 증폭 또는 검출하기 위한 복수의 올리고뉴클레오타이드(또는 후보 올리고뉴클레오타이드) 중 하나일 수 있다.
또한, 식 (I)의 올리고뉴클레오타이드는 타겟 핵산 서열을 증폭하기 위한 프라이머 쌍(즉, 정방향 프라이머 및 역방향 프라이머) 중 하나일 수 있다.
식 (I)의 올리고뉴클레오타이드는 PCR 또는 실시간 PCR에 사용될 수 있는 올리고뉴클레오타이드이다. 식 (I)의 올리고뉴클레오타이드는, 다양한 분야, 예를 들어 (i) Miller, H. I. 방법(WO 89/06700) 및 Davey, C. 등(EP 329,822), 리가아제 연쇄 반응(LCR, Wu, D.Y. et al., Genomics 4:560 (1989)), 중합효소 리가아제 연쇄 반응(Barany, PCR Methods and Applic., 1:5-16(1991)), 갭-LCR(WO 90/01069), 복구 연쇄 반응(EP 439,182), 3SR(Kwoh et al., PNAS, USA, 86:1173(1989)) 및 NASBA(U.S. Pat. No. 5,130,238), 예컨대 프라이머-관련 핵산 증폭 방법, (ⅱ) 관련된 사이클 시퀀싱(Kretz et al., (1994) Cycle sequencing. PCR Methods Appl. 3:S107-S112) 및 파이로시퀀싱(Ronaghi et al., (1996) Anal. Biochem., 242:84-89; 및 (1998) Science 281:363-365) 등, 예컨대 프라이머 연장-관련 기술들, 및 (iii) 올리고뉴클레오타이드 마이크로어레이를 사용한 타겟 뉴클레오타이드 서열의 검출, 예컨대 혼성화-관련 기술들에서 유용한 올리고뉴클레오타이드이다. 본 발명의 올리고뉴클레오타이드는 다양한 핵산 증폭, 시퀀싱 및 혼성화-관련 기술에 적용될 수 있는 올리고뉴클레오타이드이다.
단계 (b): 뉴클레오타이드 서열 데이터베이스와 비교 및 상동 영역을 포함하는 참조 뉴클레오타이드 서열의 추출( 120 )
본 단계에서는, 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출한다(120).
본원에 사용된 바와 같이 용어 "뉴클레오타이드 서열의 데이터베이스(database)", "뉴클레오타이드 서열 데이터베이스", "뉴클레오타이드 데이터베이스", 또는 "데이터베이스"는 다양한 소스(source)로부터 유래된 2개 이상의 뉴클레오타이드 서열에 관한 데이터의 세트 또는 집합을 의미한다. 상기 뉴클레오타이드 서열 데이터베이스는 뉴클레오타이드 서열과 관련된 정보, 예를 들어 이들의 구체적인 서열 및 신원(identity)을 포함할 수 있다. 상기 데이터베이스는 공중에게 이용가능하거나, 상업적으로 이용가능하거나, 또는 본 발명자에 의해 생성될 수 있다. 상기 데이터베이스는 컴퓨터에 의한 검색의 편의성 및 속도를 위해 배열된 집합이다.
당업계에 공지된 데이터베이스의 예는 GenBank 데이터베이스, EST 데이터베이스, EMBL 뉴클레오타이드 서열 데이터베이스, Entrez 뉴클레오타이드 데이터베이스 및 LIFESEQ™ 데이터베이스를 포함하나, 이에 제한되는 것은 아니다. 본원에서 뉴클레오타이드 서열 데이터베이스는 "참조(reference) 데이터베이스"로도 불릴 수 있다.
본원에서 식 (I)의 올리고뉴클레오타이드와 비교되는 데이터베이스는 상기 기재된 데이터베이스 중 어느 것 또는 이의 조합일 수 있다.
본 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 적어도 하나의 뉴클레오타이드 서열 데이터베이스와의 비교는, 서열 정렬 알고리즘 또는 프로그램을 사용하여 데이터베이스를 서치(search)하는 것을 포함한다. 또한, 본 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 적어도 하나의 뉴클레오타이드 서열 데이터베이스와의 비교는, 서열 정렬 알고리즘 또는 프로그램을 사용하여 상기 올리고뉴클레오타이드의 전체 또는 일부 서열을 상기 데이터베이스 내의 뉴클레오타이드 서열과 정렬(alignment)하는 것을 포함한다. 또한, 본 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 적어도 하나의 뉴클레오타이드 서열 데이터베이스와의 비교는, 상기 올리고뉴클레오타이드의 전체 또는 일부 서열을 상기 데이터베이스 내의 각각의 뉴클레오타이드 서열과 정렬하고, 상기 정렬을 분석하는 것을 포함한다. 또한, 본 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 적어도 하나의 뉴클레오타이드 서열 데이터베이스와의 비교는, 상기 올리고뉴클레오타이드의 전체 또는 일부 서열을 상기 데이터베이스 내의 각각의 뉴클레오타이드 서열과 정렬하고, 이들 사이의 상동성(homology) 또는 유사성(similarity)을 결정하는 것을 포함한다.
본 단계에서, 두 서열 사이의, 즉 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 데이터베이스 내의 뉴클레오타이드 서열 사이의 비교는, 서열 정렬 알고리즘 또는 프로그램을 사용하여 수행될 수 있다.
서열 정렬 알고리즘 또는 프로그램은 당업계에 공지되어 있다. 서열 정렬 알고리즘 또는 프로그램의 예는 Smith and Waterman의 국소 상동성 알고리즘(1981, Adv. Appl. Math. 2:482), Needleman and Wunsch의 상동성 정렬 알고리즘(1970, J. Mol. Biol. 48:443), Person and Lipman의 방법을 통한 유사성 서치(1988, Proc. Nat'l. Acad. Sci. USA 85:2444), 이들 알고리즘의 컴퓨터화된 구현(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.), 및 수동 정렬 및 육안 검사를 포함한다.
상동성을 결정하기 위한 알고리즘 또는 프로그램의의 다른 예는 BLAST 프로그램(Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS(Analysis of Multiply Aligned Sequences), AMPS(Protein Multiple Sequence Alignment), ASSET(Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN(Biological Sequence Comparative Analysis Node), BLIMPS(BLocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman algorithm, DARWIN, Las Vegas algorithm, FNAT(Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP(Fristensky Sequence Analysis Package), GAP(Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC(Sensitive Sequence Comparison), LALIGN(Local Sequence Alignment), LCP(Local Content Program), MACAW(Multiple Alignment Construction & Analysis Workbench), MAP(Multiple Alignment Program), MBLKP, MBLKN, PIMA(Pattern-Induced Multi-sequence Alignment), SAGA(Sequence Alignment by Genetic Algorithm) 및 WHAT-IF를 포함한다. 특히, 상기 서열 정렬 알고리즘 또는 프로그램은 Smith & Waterman, Needleman-Wunsch, BLAST 및 FASTA 알고리즘 또는 프로그램으로 이루어진 군으로부터 선택된다.
상기 서열 정렬 알고리즘 또는 프로그램은 올리고뉴클레오타이드(질의 서열)와 상동인 영역을 찾아내기 위하여 적절한 파라미터들을 사용한다. 본 발명의 방법에서 사용되는 서열 정렬 알고리즘 또는 프로그램은 기본값(default)으로 설정된 파라미터를 이용하거나, 당업자에 의해 적절하게 조정된 파라미터들을 이용할 수 있다. 예를 들어, 대표적인 서열 정렬 알고리즘 또는 프로그램인 BLAST 알고리즘은 E-value, Reward/penalty, Gap penalty, Gap creation, Word size, Scoring matrix, PSSM, Filter 등과 같은 파라미터를 사용한다. 상기 서열 정렬 알고리즘 또는 프로그램 내의 파라미터들은, 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 데이터베이스 내의 각각의 참조 뉴클레오타이드 서열 간의 상동성 정도(homology cutoff)의 조절을 통해, 추출되는 참조 뉴클레오타이드 서열의 양(개수)를 제어하기 위하여, 당업자에 의하여 적절히 조정될 수 있다. 특히, 식 (I)의 올리고뉴클레오타이드의 길이가 짧다는 점을 고려하여, 매치 확률을 높이기 위해, 이들의 기본값과 비교하여 Word size를 낮추고 E 값을 높이는 것이 바람직하다.
본 발명의 일 구현예에서, 본 발명에서 사용되는 서열 정렬 알고리즘 또는 프로그램은 본 발명자에 의해 개발된 알고리즘 또는 프로그램일 수 있다. 상기 알고리즘 또는 프로그램은 그의 서열 내부에 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하거나, 임의로 비연속적인 유니버설 염기 또는 축퇴성 염기를 포함하는 올리고뉴클레오타이드의 특이성을 평가하기 위해 개발된 알고리즘 또는 프로그램일 수 있다. 상기 알고리즘 또는 프로그램은 식 (I)의 올리고뉴클레오타이드 내의 Y 부위의 서열을 고려하지 않을 수 있다. 예를 들어, 상기 알고리즘 또는 프로그램은 식 (I)의 올리고뉴클레오타이드 내의 Y 부위의 서열과 데이터베이스 내의 상응하는 참조 뉴클레오타이드 서열 간의 상동성을 고려하지 않는다. 즉, 상기 알고리즘 또는 프로그램을 사용한 비교는 부위 Y를 제외한 부위 X 및 Z에서의 상동성의 결정을 포함할 수 있다.
상기 기재된 바와 같이 비교 후, 상기 데이터베이스로부터 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출된다.
본원에 사용된 바와 같이, 용어 "참조 뉴클레오타이드 서열"은 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는, 데이터베이스 내의 서열을 지칭한다. 추출되는 참조 뉴클레오타이드의 개수는 적어도 1개일 수 있다.
참조 뉴클레오타이드 서열 각각은 상동 영역 및 임의로 그의 플랭킹 영역(flanking region)을 포함한다.
본원에 사용된 바와 같이, 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 관련하여 용어 "상동인 영역", "상동 영역" 또는 "상동성 영역"은 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 동일하거나 유사한, 데이터베이스로부터의 참조 뉴클레오타이드 서열 내의 특정 영역을 의미한다. 다시 표현하면, 상기 상동 영역은 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열에 매치되는 참조 뉴클레오타이드 서열 내부의 특정 영역을 의미한다.
상기 추출된 참조 뉴클레오타이드 서열은 상이한 크기의 상동 서열을 가질 수 있다.
일 구현예에서, 상동 영역은 단계 (a)에서 제공된 올리고뉴클레오타이드와 동일한 길이이다. 예를 들어, 단계 (a)에서 제공된 올리고뉴클레오타이드가 왓슨-크릭 염기쌍에 관여하지 않는 상대적으로 적은 수의 연속적인 염기(예를 들면, 2개 또는 3개의 유니버설 염기)를 포함하는 경우, BLAST 알고리즘에 의해 추출된 참조 뉴클레오타이드 서열은 단계 (a)에서 제공된 올리고뉴클레오타드와 동일한 길이의 상동 영역을 포함할 수 있다. 이 경우, 상기 상동 영역은 단계 (a)에서 제공된 올리고뉴클레오타이드의 전체 서열과 동일한 길이이며 상기 서열과 상동성을 갖는다.
또 다른 구현예에서, 상기 상동 영역은 단계 (a)에서 제공된 올리고뉴클레오타이드보다 더 짧다. 예를 들어, 단계 (a)에서 제공된 올리고뉴클레오타이드가 왓슨-크릭 염기쌍에 관여하지 않는 상대적으로 많은 연속적인 염기(예를 들면, 4개, 5개, 또는 6개 이상의 유니버설 염기)를 포함하는 경우, BLAST 알고리즘에 의해 추출된 핵산 서열은 단계 (a)에서 제공된 올리고뉴클레오타이드보다 짧은 상동 영역을 포함할 수 있다. 구체적으로, 5'-X-Y-Z-3'으로 표시되는 올리고뉴클레오타이드(특히, Y 부위 내에 왓슨-크릭 염기쌍에 관여하지 않는 상대적으로 많은 연속적인 염기를 갖는)를 BLAST를 사용하여 데이터베이스와 비교하는 경우, 부위 X에만 상동인 영역(부위 X와 동일한 길이를 갖는 상동 영역)이 수득될 수 있다. 이 경우, 상기 상동 영역은 단계 (a)에 제공된 올리고뉴클레오타이드의 전체 서열보다 짧으며, 상기 올리고뉴클레오타이드의 일부 서열, 즉 X 부위와 상동성을 갖는다.
문구 "올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역"은 상기 올리고뉴클레오타이드의 전체 또는 일부 서열과 실질적인 상동성(유사성)을 갖는, 참조 뉴클레오타이드 서열 내부의 영역을 가리킨다. 상기 실질적인 상동성은 참조 뉴클레오타이드 서열 내부의 영역과 상기 올리고뉴클레오타이드의 전체 또는 일부 서열 간의 상동성이 정의되거나 선택된 상동성 정도(특정 역치)보다 높다는 것을 가리킨다. 상기 정의된 상동성 정도는 디자인된 올리고뉴클레오타이드와 높은 유사성 또는 상동성을 갖는 참조 뉴클레오타이드 서열을 데이터베이스로부터 추출하기 위한 기준 또는 역치를 의미한다. 예를 들어, 정의된 상동성 정도는 2개의 정렬된 뉴클레오타이드 서열 중 어느 하나의 뉴클레오타이드 서열에서의 총 염기 개수를 기준으로, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상일 수 있다. 본 발명의 일 구현예에서, 올리고뉴클레오타이드의 부위 X 및 Z 중 어느 하나에서의 서열과 상응하는 참조 뉴클레오타이드 서열 간의 정의된 상동성 정도는 2개의 정렬된 뉴클레오타이드 서열 중 어느 하나의 뉴클레오타이드 서열에서의 총 염기 개수를 기준으로, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상일 수 있다. 본 발명의 또 다른 구현예에서, 올리고뉴클레오타이드의 부위 X에서의 서열 및 상응하는 참조 뉴클레오타이드 서열 간의 정의된 상동성 정도는, 2개의 정렬된 뉴클레오타이드 서열 중 어느 하나의 뉴클레오타이드 서열에서의 총 염기 개수를 기준으로, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상이고, 올리고뉴클레오타이드의 부위 Z에서의 서열 및 상응하는 참조 뉴클레오타이드 서열에서의 상동 영역 간의 상동성 정도는 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상이다.
일 구현예에서, 식 (I)의 올리고뉴클레오타이드의 전체 서열이 단계 (b)의 비교에 사용된다.
특정 구현예에서, 식 (I)의 올리고뉴클레오타이드의 전체 서열이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교되는 경우, 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 전체 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다. 예를 들어, 30 뉴클레오타이드 잔기로 구성된 올리고뉴클레오타이드의 전체 서열이 GenBank 데이터베이스와 비교되고, 단계 (b)에서 각각 30 뉴클레오타이드 길이의 상동 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다.
또 다른 특정 구현예에서, 식 (I)의 올리고뉴클레오타이드의 전체 서열이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교되는 경우, 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 일부 서열(예컨대, 부위 X, 부위 Y 또는 이의 부분)에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다. 예를 들어, 30 뉴클레오타이드 길이의 올리고뉴클레오타이드의 전체 서열이 GenBank 데이터베이스와 비교되고, 단계 (b)에서 30 뉴클레오타이드 길이보다 작은 상동 영역을 포함하는 참조 서열이 데이터베이스로부터 추출될 수 있다.
또 다른 구현예에서, 식 (I)의 올리고뉴클레오타이드의 일부 서열이 단계 (b)의 비교에 사용된다.
본 발명의 단계 (b)의 비교에 사용되는 식 (I)의 올리고뉴클레오타이드의 일부 서열은 부위 X, 부위 Z, 또는 이의 부분일 수 있다.
특정 구현예에서, 식 (I)의 올리고뉴클레오타이드의 일부 서열이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교되는 경우, 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다. 예를 들어, 15 뉴클레오타이드 잔기로 구성된 부위 X만이 GenBank 데이터베이스와 비교되고, 단계 (b)에서 15 뉴클레오타이드 길이의 상동 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다
또 다른 특정 구현예에서, 식 (I)의 올리고뉴클레오타이드의 일부 서열이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교되는 경우, 단계 (b)에서 식 (I)의 올리고뉴클레오타이드의 일부 서열의 부분에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다. 예를 들어, 15 뉴클레오타이드 잔기로 구성된 부위 X만이 GenBank 데이터베이스와 비교되고, 단계 (b)에서 15 뉴클레오타이드 길이보다 작은 상동 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다
본 발명의 일 구현예에서, 상기 올리고뉴클레오타이드 내의 X 부위의 서열만이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교된 다음, 단계 (b)에서 X 부위에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다.
본 발명의 또 다른 구현예에서, 상기 올리고뉴클레오타이드 내의 Z 부위의 서열만이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교된 다음, 단계 (b)에서 Z 부위에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다.
본 발명의 또 다른 구현예에서, 올리고뉴클레오타이드 내의 X 부위의 부분의 서열만이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교된 다음, 단계 (b)에서 X 부위의 부분에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다.
본 발명의 또 다른 구현예에서, 올리고뉴클레오타이드 내의 Z 부위의 부분의 서열만이 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교된 다음, 단계 (b)에서 Z 부위의 부분에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 데이터베이스로부터 추출될 수 있다.
식 (I)의 올리고뉴클레오타이드의 일부 서열을 사용하는 구현예에 따르면, 올리고뉴클레오타이드와 뉴클레오타이드 서열 데이터베이스 간의 비교(즉, 상동성 결정)는 상기 올리고뉴클레오타이드 내의 X 또는 Z 부위, 또는 이의 부분의 서열과 데이터베이스 내의 참조 뉴클레오타이드 서열 간에서 이뤄진다. 즉, 상동성 결정은 일부 서열, 특히 Y 부위를 제외한 일부 서열을 사용하는 것을 특징으로 한다.
올리고뉴클레오타이드의 전체 서열이 아닌 일부 서열의 사용은 Y 부위가 상동성 결정에 부정적인 영향을 미치는 것을 방지하여, 보다 정확한 상동성을 갖는 참조 뉴클레오타이드 서열을 추출할 수 있다. 즉, 올리고뉴클레오타이드의 일부 서열을 사용하면 Y 부위에 포함된 왓슨-크릭 염기쌍에 관여하지 않는 염기로 인해 상동 영역이 잘못 판단되는 문제를 피할 수 있다.
상기 임의의 구현예에 따라 추출된 참조 뉴클레오타이드 서열은 X 또는 Z 부위, 또는 이들의 부분에서의 서열과 상동인 영역을 포함하는 뉴클레오타이드 서열이다.
올리고뉴클레오타이드 내의 X 부위의 서열만을 뉴클레오타이드 서열 데이터베이스와 비교한 다음, 상기 X 부위의 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 데이터베이스로부터 추출하는 예시적인 과정이 도 2에 도시되어 있다.
단계 (c): 매치/미스매치 분석( 130 )
이후, 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하고, (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공한다(130).
본 단계에서, 단계 (a)에서 제공된 식 (I)의 올리고뉴클레오타이드와 단계 (b)에서 추출된 각각의 참조 뉴클레오타이드 서열 간의 매치/미스매치는 부위별로 분석된다.
본원에 사용된 바와 같이, 용어 "부위별 매치/미스매치"는 식 (I)의 올리고뉴클레오타이드의 각 부위에서의 매치/미스매치를 의미한다. 상기 용어는 "국소적 매치/미스매치"와 상호교환적으로 사용된다.
또한, 본원에 사용된 바와 같이, 문구 "부위별 매치/미스매치를 분석한다"는 것은 식 (I)의 올리고뉴클레오타이드의 각 부위마다 매치/미스매치를 분석하는 것을 가리킨다. 따라서, "식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석한다"는 것은 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 각각의 서열과 각각의 참조 뉴클레오타이드 서열 내의 상응하는 부위의 서열 간의 매치/미스매치를 분석하는 것을 가리킨다.
상기 부위별 매치/미스매치의 분석은 식 (I)의 올리고뉴클레오타이드 내의 부위 X의 서열과 각각의 참조 뉴클레오타이드 서열 내의 상응하는 서열을 비교하여 이들 간의 매치/미스매치를 계산하는 단계 및 식 (I)의 올리고뉴클레오타이드 내의 부위 Z의 서열과 각각의 참조 뉴클레오타이드 서열 내의 상응하는 서열을 비교하여 이들 간의 매치/미스매치를 계산하는 단계를 포함한다.
그 결과, (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율이 제공된다.
부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율은 식 (I)의 올리고뉴클레오타이드의 특이성을 평가하는데 도움이 된다. 따라서, 이들은 종합적으로 본원에서 특이성에 관한 정보로 지칭된다.
이중 특이성 올리고뉴클레오타이드와 같이 서열 내에 연속적인 유니버설 염기를 포함하는 올리고뉴클레오타이드의 경우, 특이성은 연속적인 유니버설 염기에 의해 분할된 X 부위 및 Z 부위에 의해 이중으로 결정된다. 따라서, 올리고뉴클레오타이드의 특이성을 평가하기 위해, 올리고뉴클레오타이드의 X 및 Z 부위 각각에서 어닐링 특이성을 확인하는 것이 매우 중요하다.
하지만, 종래 서열 정렬 알고리즘 또는 프로그램은 상기 기재된 바와 같은 X 및 Z 부위 각각에 대한 개별적인 미스매치 정보를 제공하지 못한다. 또한, 참조 뉴클레오타이드 서열과 올리고뉴클레오타이드의 전체 서열 간의 상동성 스코어가 다소 낮은 경우, 종래 서열 정렬 알고리즘 또는 프로그램은 상기 올리고뉴클레오타이드의 전체 서열이 아닌 상기 올리고뉴클레오타이드의 일부 서열에 대한 매치/미스매치 결과만을 제공할 수 있다. 예를 들어, 20개의 뉴클레오타이드 잔기의 올리고뉴클레오타이드를 BLAST 서치하는 경우, BLAST 알고리즘은 20개 미만의 뉴클레오타이드 길이에 대한 매치/미스매치 결과를 제공할 수도 있다. 그러한 경우, 부위 X 및 Z 중 어느 하나 또는 모두에서 매치/미스매치 결과를 얻지 못할 수 있다.
이에 반해, 본 발명의 방법은 X 및 Z 부위에서 개별적인 매치/미스매치 결과를 제공한다. 따라서, 사용자는 상기 결과에 기초하여 올리고뉴클레오타이드의 특이성을 더 정확하게 평가할 수 있다.
본 발명에 따르면, X 및 Z 부위 각각에서의 매치되거나 미스매치된 염기의 개수 또는 비율은 추출된 모든 참조 뉴클레오타이드 서열에 대해 제공된다. 따라서, 상기 결과에 기초하여, 사용자는 디자인된 올리고뉴클레오타이드가 타겟 핵산 서열에만 혼성화되는지 여부를 확인할 수 있다.
특이성의 측면에서 Z 부위에서의 매치가 X 부위에서의 매치보다 더 중요한 올리고뉴클레오타이드의 경우, 올리고뉴클레오타이드의 Z 부위와 타겟 핵산 서열 간의 미스매치의 존재는 사용자가 디자인된 올리고뉴클레오타이드 대신에 다른 올리고뉴클레오타이드를 선택하게 하는 강한 근거를 제공한다. 반면, X 부위에 미스매치된 염기를 갖는 올리고뉴클레오타이드도 특정 조건하에 타겟 핵산 서열에 혼성화될 수 있으므로, X 부위에서 미스매치의 존재는 사용자가 혼성화 조건을 고려하여 올리고뉴클레오타이드를 사용할지 여부를 결정하기 위한 힌트를 제공한다. 이와 같이, X 및 Z 부위의 매치/미스매치 결과는 식 (I)의 올리고뉴클레오타이드의 특이성을 평가하는데 매우 유용하다.
본 단계에서 제공되는 매치되거나 미스매치된 염기의 개수 또는 비율은 올리고뉴클레오타이드 내의 X 부위의 서열을 각각의 참조 뉴클레오타이드 서열 내의 상응하는 서열과 비교하고, 올리고뉴클레오타이드 내의 Z 부위의 서열을 각각의 참조 뉴클레오타이드 서열 내의 상응하는 서열과 비교함으로써 계산될 수 있다.
일 구현예에서, 상기 식 (I)의 올리고뉴클레오타이드 전체 서열을 이의 상동성 영역에 기초하여 각각의 추출된 참조 뉴클레오타이드 서열과 정렬(배열)한 다음, X 및 Y 부위에서 매치되거나 미스매치된 염기의 개수 또는 비율을 분석한다. 일 구현예에서, 이러한 정렬 정보(또는 결과)는 참조 뉴클레오타이드 서열이 추출될 때 수득될 수 있다.
본 발명의 일 구현예에서, 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열과 각각의 참조 뉴클레오타이드 서열 내의 상동 영역 간의 부위별 매치/미스매치가 분석되고, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율이 제공된다.
예를 들어, 40 뉴클레오타이드 길이의 식 (I)의 올리고뉴클레오타이드의 전체 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열에 상동인 영역(40 뉴클레오타이드 길이)을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 상동 영역은 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z에 상응하는 서열을 이미 함유하고 있기 때문에, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율은 직접 계산될 수 있다.
본 발명의 또 다른 구현예에서, 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열과 각각의 참조 뉴클레오타이드 서열의 상동 영역 및 그의 플랭킹 영역 간의 부위별 매치/미스매치가 분석되고, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율이 제공된다.
예를 들어, 40 뉴클레오타이드 길이의 식 (I)의 올리고뉴클레오타이드의 전체 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역(예컨대, 10-15, 10-20, 10-30 또는 10-35 뉴클레오타이드 길이)을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 상동 영역은 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z에 상응하는 서열을 함유하고 있지 않기 때문에, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율은 직접 계산될 수 없다. 이 경우, 상기 상동 영역 외에, 그의 플랭킹 영역이 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율의 계산에 추가로 사용된다. 즉, 식 (I)의 올리고뉴클레오타이드의 전체 서열을 상기 상동 영역 및 그의 플랭킹 영역을 포함하는 각 참조 뉴클레오타이드 서열 내의 상응하는 서열과 비교하여, 부위 X 및 Z에서 매치되거나 미스매치된 염기의 개수 또는 비율을 계산한다.
플랭킹 영역은 참조 뉴클레오타이드 서열에서 상동 영역을 제외한 나머지 영역을 지칭한다. 예를 들어, 상동 영역이 식 (I)의 올리고뉴클레오타이드 내의 부위 X에 상동인 경우, 플랭킹 영역은 Y 부위에 상응하는 영역 및 Z 부위에 상응하는 영역을 포함한다. 상동 영역이 식 (I)의 올리고뉴클레오타이드 내의 부위 Z에 상동인 경우, 플랭킹 영역은 Y 부위에 상응하는 영역 및 X 부위에 상응하는 영역을 포함한다.
본 발명의 또 다른 구현예에서, 식 (I)의 올리고뉴클레오타이드의 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 식 (I)의 올리고뉴클레오타이드의 전체 서열과 각각의 참조 뉴클레오타이드 서열의 상동 영역 및 그의 플랭킹 영역 간의 부위별 매치/미스매치가 분석되고, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율이 제공된다.
예를 들어, 40 뉴클레오타이드 길이의 식 (I)의 올리고뉴클레오타이드의 일부 서열(예컨대, 10-15, 10-20, 10-30 또는 10-35 뉴클레오타이드 길이)을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교한 다음, 단계 (b)에서 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역(예컨대, 10-15, 10-20, 10-30 또는 10-35 뉴클레오타이드 길이)을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, 상기 상동 영역은 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z에 상응하는 서열을 함유하고 있지 않기 때문에, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율은 상기 상동 영역만을 사용하여 직접 계산될 수 없다. 이 경우, 상기 상동 영역 외에, 그의 플랭킹 영역이 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율의 계산에 추가로 사용된다. 즉, 식 (I)의 올리고뉴클레오타이드의 전체 서열을 상기 상동 영역 및 그의 플랭킹 영역을 포함하는 각 참조 뉴클레오타이드 서열 내의 상응하는 서열과 비교하여, 부위 X 및 Z에서 매치되거나 미스매치된 염기의 개수 또는 비율을 계산한다.
전술한 바와 같이, 각 참조 뉴클레오타이드 서열 내의 상동 영역은 단계 (a)에서 제공된 식 (I)의 올리고뉴클레오타이드와 비교하여 길이가 동일하거나 더 짧을 수 있다. 구체적으로, 식 (I)의 올리고뉴클레오타이드의 전체 서열을 뉴클레오타이드 서열 데이터베이스와 비교하고 Y 부위 내의 왓슨-크릭 염기쌍에 관여하지 않는 염기의 개수가 상대적으로 적은 경우, 식 (I)의 올리고뉴클레오타이드의 전체 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출될 수 있다. 반면, Y 부위 내의 왓슨-크릭 염기쌍에 관여하지 않는 염기의 개수가 상대적으로 많은 경우, 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출될 수 있다. 또한, 식 (I)의 올리고뉴클레오타이드의 일부 서열을 비교에 사용하는 경우, 식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출될 수 있다.
이러한 비교 또는 분석은, 단계 (b)에서의 비교가 올리고뉴클레오타이드의 일부 서열을 이용하는 반면 단계 (c)에서의 비교는 올리고뉴클레오타이드의 전체 서열을 이용한다는 점에서, "비교의 확장"으로도 불릴 수 있다.
식 (I)의 올리고뉴클레오타이드의 일부 서열에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출된 경우, 상기 상동 영역을 확장한 다음, 부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율을 계산할 수 있다. 상동 영역을 확장하여 매치되거나 미스매치된 염기의 개수 또는 비율을 계산한다는 것은, 상기 상동 영역을 올리고뉴클레오타이드의 전체 서열에 상응하는 서열까지 확장한 다음, 매치되거나 미스매치된 염기의 개수 또는 비율을 계산한다는 것을 가리킨다. 즉, 그것은 플랭킹 영역의 서열을 상기 추출된 핵산 서열 또는 데이터베이스로부터 가져와서(또는 복구하여) 부위 X 및 Z에서 매치되거나 미스매치된 염기의 개수 또는 비율을 계산한다는 것을 의미한다.
식 (I)의 올리고뉴클레오타이드의 일부 서열을 사용하여 부위 X 및 Z의 매치/미스매치 결과를 수득하는 과정이 도 2에 도시되어 있다.
도 2에 나타낸 바와 같이, 식 (I)의 올리고뉴클레오타이드의 X 부위에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출된 경우, Z 부위의 반대편에 있는 그의 플랭킹 영역을 데이터베이스 또는 추출된 참조 뉴클레오타이드 서열로부터 가져와 부위 X 및 Z에서 미스매치된 염기의 개수를 계산한다. 반대로, 식 (I)의 올리고뉴클레오타이드의 Z 부위에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출된 경우, X 부위의 반대편에 있는 그의 플랭킹 영역을 데이터베이스 또는 추출된 참조 뉴클레오타이드 서열로부터 가져와 부위 X 및 Z에서 미스매치된 염기의 개수를 계산한다.
식 (I)의 올리고뉴클레오타이드의 경우, Y 부위에 함유된 염기는 왓슨-크릭 염기쌍을 형성하는 염기와 비교하여 상대적으로 낮은 친화성으로 타겟 핵산 서열 내의 상응하는 염기에 혼성화한다. 즉, 식 (I)의 올리고뉴클레오타이드가 타겟 핵산 서열에 혼성화되는 경우, Y 부위는 루프(loop) 구조를 형성할 수 있다. Y 부위의 이러한 루프 형성은 X 부위가 혼성화하는 영역과 Z 부위가 혼성화하는 영역 간의 간격을 줄일 수 있다.
따라서, 이러한 혼성화 가변성을 고려할 때, 매치되거나 미스매치된 염기의 개수 또는 비율의 계산을 위해 관심 있는 부위 X 또는 Y의 반대편에 있는 플랭킹 영역은 관심 부위 및 그의 가능한 반대편 영역을 고려하여 결정된다.
예를 들어, Y 부위에 총 5개 염기가 함유되어 있다고 가정하면, 식 (I)의 올리고뉴클레오타이드의 X 부위에 상동인 영역을 포함하는 참조 뉴클레오타이드 서열이 추출되는 경우, Z 부위 반대편에 있는 플랭킹 영역은 일반적으로 X 부위가 혼성화되는 상동 영역으로부터 5 뉴클레오타이드 이격된 영역이지만, 그것은 Y 부위 상의 루프 형성으로 인해, X 부위가 혼성화되는 상동 영역으로부터 4 뉴클레오타이드 또는 3 뉴클레오타이드 이격된 영역일 수도 있다.
예를 들어, Y 부위에 총 5개의 염기가 함유된 경우, 매치되거나 미스매치된 염기의 개수의 계산은 Z 부위와 X 부위가 혼성화되는 영역으로부터 5 뉴클레오타이드 이격된 영역 간에서, Z 부위와 X 부위가 혼성화되는 영역으로부터 4 뉴클레오타이드 이격된 영역 간에서, 그리고 Z 부위와 X 부위가 혼성화되는 영역으로부터 3 뉴클레오타이드 이격된 영역 간에서 이뤄질 수 있다.
일 구현예에서, 부위 X 및 Z 각각에서 매치된 염기의 개수가 제공된다.
일 구현예에서, 부위 X 및 Y 각각에서 미스매치된 염기의 개수 대 매치된 염기의 개수의 비율이 제공된다.
일 구현예에서, 부위 X 및 Y 각각에서 미스매치된 염기의 개수 대 전체 뉴클레오타이드 서열의 개수의 비율이 제공된다.
일 구현예에서, 부위 X 및 Y 각각에서 매치된 염기의 개수 대 미스매치된 염기의 개수의 비율이 제공된다.
일 구현예에서, 부위 X 및 Y 각각에서 매치된 염기의 개수 대 전체 뉴클레오타이드 서열의 개수의 비율이 제공된다.
부위 X 및 Z 중 어느 하나 또는 둘 모두가 적어도 하나의 유니버설 염기 또는 축퇴성 염기를 포함하는 경우, 본 발명의 방법은 상기 유니버설 염기 또는 축퇴성 염기를 매치 또는 미스매치로 처리하는 기준을 변경한 후, 단계 (c)에서 상기 변경된 기준에 기초하여 매치되거나 미스매치된 염기의 개수를 제공할 수 있다.
본 발명의 일 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 중 어느 하나 또는 둘 모두가 적어도 하나의 유니버설 염기를 포함하는 경우, 상기 유니버설 염기는 단계 (c)에서 미스매치된 염기로 카운트되지 않을 수 있다. 즉, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 중 어느 하나 또는 둘 모두에 적어도 하나의 유니버설 염기가 존재하는 경우, 상기 유니버설 염기는 각각의 참조 뉴클레오타이드 서열에서의 상응하는 뉴클레오타이드의 유형에 관계없이 매치된 염기로 처리된다. 예를 들어, 15개의 뉴클레오타이드로 구성된 X 부위에 3개의 미스매치된 염기와 1개의 추가의 유니버설 염기가 존재하면, 본 발명의 일 구현예는 미스매치된 염기의 총 개수를 3개로 결정할 수 있다.
부위 X 및 Z에서의 매치된 염기의 개수를 제공하는 구현예에서, 유니버설 염기는 매치된 염기로 카운트되거나 카운트되지 않을 수 있다. 예를 들어, 15개의 뉴클레오타이드 길이의 X 부위에 3개의 미스매치된 염기 및 하나의 추가의 유니버설 염기가 존재하는 경우, X 부위에서의 매치된 염기의 총 개수는 12개로 결정될 수 있다. 택일적으로, X 부위에서의 매치된 염기의 총 개수는 11개로 결정될 수 있다.
본 발명의 일 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 중 어느 하나 또는 둘 모두가 적어도 하나의 축퇴성 염기를 포함하는 경우, 본 발명의 방법은 상기 축퇴성 염기와 참조 뉴클레오타이드 서열 내의 상응하는 염기 간의 매치를 고려한다. 즉, 식 (I)의 올리고뉴클레오타이드의 부위 X 및 Z 중 어느 하나 또는 둘 모두에 축퇴성 염기가 존재하는 경우, 상기 축퇴성 염기는 축퇴성 염기의 유형에 따라(축퇴성 염기가 나타내는 염기에 좌우되어) 단계 (c)에서 미스매치된 염기로서 카운트되거나 카운트되지 않을 수 있다.
특정 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 중 어느 하나 또는 둘 모두가 적어도 하나의 축퇴성 염기를 포함하는 경우, 상기 축퇴성 염기는, 상기 축퇴성 염기가 나타내는 염기 중 어느 하나가 참조 뉴클레오타이드 서열 내의 상응하는 염기에 매치되면, 단계 (c)에서 미스매치된 염기로 카운트되지 않는다. BLAST와 같은 종래의 서열 정렬 알고리즘 또는 프로그램은 상기 축퇴성 염기를 그의 유형에 관계없이 미스매치로 처리한다. 반면, 본 발명의 방법은 축퇴성 염기의 유형에 기초하여 매치/미스매치를 결정하는 것을 특징으로 한다. 예를 들어, 올리고뉴클레오타이드 내에 축퇴성 염기 "R"(퓨린 염기 A 또는 G 중 어느 하나)이 존재하고, 비교되는 참조 뉴클레오타이드 서열 내의 상응하는 염기가 아데닌(A) 또는 구아닌(G)인 경우, 본 발명의 방법은 상기 축퇴성 염기를 매치로 처리한다. 반면, 비교되는 참조 뉴클레오타이드 서열 내의 상응하는 염기가 시토신(C) 또는 티민(T)인 경우, 본 발명의 방법은 상기 축퇴성 염기를 미스매치로 처리한다. 따라서, 본 발명의 방법은 종래 서열 정렬 알고리즘에 비해 식 (I)의 올리고뉴클레오타이드 내부에 축퇴성 염기가 존재하는 경우에도 더 정확한 매치/미스매치 결과를 생성할 수 있다.
본 발명의 또 다른 구현예에서, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 중 어느 하나 또는 둘 모두가 적어도 하나의 축퇴성 염기를 포함하는 경우, 상기 축퇴성 염기를 상기 축퇴성 염기가 내포하는 각각의 염기로 변환시킨 후, 단계 (b) 및 (c)를 실시한다.
예를 들어, 식 (I)의 올리고뉴클레오타이드에 축퇴성 염기 "R"(퓨린 염기 A 또는 G 중 어느 하나)이 존재하는 경우, 축퇴성 염기 "R"이 아데닌(A)으로 변환된 제1 올리고뉴클레오타이드와 축퇴성 염기 "R"이 구아닌(G)로 변환된 제2 올리고뉴클레오타이드를 준비하여 본 발명의 방법을 각각 실시한다. 상기 방법은 축퇴성 염기가 미스매치로 판단되어 상동성 영역을 갖는 뉴클레오타이드 서열의 추출에 영향을 미치는 것을 방지할 수 있다.
일 구현예에 따르면, 식 (I)의 올리고뉴클레오타이드 내의 부위 X 및 Z 각각과 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율은 다양한 방식으로 표현될 수 있다.
예를 들어, X 부위에서의 미스매치된 염기의 개수와 Z 부위에서의 미스매치된 염기의 개수는 종합하여 Xm|Zm, (Xm, Zm), Xm-Zm, Xm & Zm 등으로 표시될 수 있고, 여기서, Xm은 X 부위에서의 미스매치된 염기의 개수를 나타내고, Zm은 Z 부위에서의 미스매치된 염기의 개수를 나타낸다.
예를 들어, 표기법 "0|0"은 X 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수가 0개이고, Z 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기 수가 0개라는 것을 가리킨다. 즉, 상기 표기법은 Y 부위를 제외한 식 (I)의 올리고뉴클레오타이드가 참조 뉴클레오타이드 서열에 완전히 매치(perfectly match)된다는 것을 의미한다. 한편, "1|0"은 X 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수가 1개이고, Z 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 수가 0개라는 것을 가리킨다. 한편, "0|1"은 X 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수가 0개이고, Z 부위와 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수가 1개라는 것을 가리킨다.
상기 표기법 외에도, 부위 X 및 Z에서의 미스매치된 염기의 개수가 다른 방식으로 표현될 수 있음이 당업자에게 이해될 것이다.
일 구현예에서, 부위 X 및 Y 각각의 전체 뉴클레오타이드의 수 또는 부위 X 및 Y 각각에서의 매치된 염기의 개수가 추가적으로 표시될 수 있다.
미스매치된 염기의 개수는 식 (I)의 올리고뉴클레오타이드의 특이성과 높은 관련이 있다.
X 및 Z 부위에서의 미스매치된 염기의 개수는 식 (I)의 올리고뉴클레오타이드의 특이성, 특히 어닐링 특이성의 평가에 다르게 영향을 미칠 수 있는 반면, Y 부위는 특이성의 평가에 영향을 미치지 않는다. 상기 논의된 바와 같이, X 부위에서의 미스매치된 염기의 개수 및 Z 부위에서의 미스매치된 염기의 개수는 올리고뉴클레오타이드의 특이성에 상이한 정도로 부정적인 영향을 미친다. 상기 영향의 차이를 고려하여, 본 발명의 방법은, 식 (I)의 올리고뉴클레오타이드의 특이성을 보다 정확하게 평가하기 위해, X 부위에서의 미스매치된 염기의 개수 또는 비율 및 Z 부위에서의 미스매치된 염기의 개수 또는 비율과 같은 2개의 값에 상이한 가중치를 부여할 수 있다.
일 구현예에 따르면, 특이성의 판단시 Z 부위에서의 매치가 X 부위에서의 매치보다 중요하다(예를 들어, WO 제2006/095981호에 개시된 이중 특이성 올리고뉴클레오타이드). 이 경우, Z 부위에 1개의 미스매치를 갖는 올리고뉴클레오타이드는 X 부위에 1개의 미스매치를 갖는 올리고뉴클레오타이드에 비해 특이성이 좋지 않은 것으로 평가될 수 있다. 또한, Z 부위에 1개의 미스매치를 갖는 올리고뉴클레오타이드는 X 부위에 2개, 3개 또는 4개의 미스매치를 갖는 올리고뉴클레오타이드에 비해 특이성이 좋지 않은 것으로 평가될 수 있다. 전술한 바와 같은 X 부위에서의 미스매치된 염기의 개수와 Z 부위에서의 미스매치된 염기의 개수가 특이성의 평가에 다르게 영향을 미치는 것을 고려하여, Z 부위에서의 미스매치된 염기의 개수에 부여되는 가중치는 X 부위에서의 미스매치된 염기의 개수에 부여되는 가중치보다 클 수 있다. 상기 가중치는 당업자에 의해 다양한 방식으로 부여될 수 있다.
또 다른 구현예에 따르면, 특이성의 결정시 X 부위에서의 매치가 Z 부위에서의 매치보다 중요하다(예를 들어, WO 제2011/028041호에 개시된 타겟 구별성(TD) 프로브 참고). 이 경우, X 부위에서의 미스매치된 염기의 개수에 부여되는 가중치는 Z 부위에서의 미스매치된 염기의 개수에 부여되는 가중치보다 클 수 있다 .
또한, 본 발명의 일 구현예는 X 및 Z 부위에서의 미스매치된 염기의 개수를 기준으로 식 (I)의 올리고뉴클레오타이드에 패널티 스코어(penalty score)를 부여할 수 있다. 상기 패널티 스코어는 식 (I)의 올리고뉴클레오타이드의 특이성의 저하를 반영하는 값이다.
상기 패널티 스코어는 미스매치된 염기마다 부여될 수 있다. X 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어와 Z 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어는 서로 상이할 수 있다.
일 구현예에서, 특이성의 결정시 Z 부위에서의 매치가 X 부위에서의 매치보다 중요한 경우, 상기 X 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어는 Z 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어보다 작다. 이러한 패널티 스코어의 차이는 가중된 패널티 스코어를 부여함으로써 달성될 수 있다. 예를 들어, X 및 Z 부위 모두에 미스매치된 염기가 존재하지 않는 식 (I)의 올리고뉴클레오타이드(즉, 타겟 핵산 서열과 완전하게 매치된 올리고뉴클레오타이드 내의 부위 X 및 Z)의 특이성을 "100"이라고 가정하면, X 부위에서의 미스매치된 염기 당 "10"의 패널티 스코어를 부여하고, Z 부위에서의 미스매치된 염기 당 "20", "30", "40", "50" 또는 "60"의 패널티 스코어를 부여할 수 있다. 이 경우, X 부위에 1개의 미스매치된 염기를 갖는 올리고뉴클레오타이드의 특이성은 "90"(=100-10)일 것이고, Z 부위에 1개의 미스매치된 염기를 갖는 올리고뉴클레오타이드의 특이성은 각각 "80", "70", "60", "50", 또는 "40"일 것이다. 이와 같이, 본 발명은 부위 X 및 Z에서의 미스매치된 염기의 개수에 따라, 부위 X 및 부위 Z에 상이한 가중된 패널티 스코어를 부여함으로써 정확한 특이성 평가가 가능하다.
또 다른 구현예에서, 특이성 결정시 X 부위에서의 매치가 Z 부위에서의 매치보다 중요한 경우, 상기 Z 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어는 X 부위에서의 미스매치된 염기 당 부여되는 패널티 스코어보다 작다.
한편, 전술한 X 및 Z 부위와 달리, Y 부위는 올리고뉴클레오타이드의 특이성의 평가에 영향을 미치지 않으므로, Y 부위는 특이성의 평가에서 고려되지 않는다.
본 발명은 올리고뉴클레오타이드의 X 및 Z 부위에서의 매치/미스매치 결과를 개별적으로 제공하므로, X 및 Z 부위 각각의 특이성은 각 부위에 대한 매치/미스매치 결과에 의해 개별적으로 평가될 수 있다.
일 구현예에서, X 및 Z 부위 각각의 특이성은 상이한 기준(예컨대, 상이한 매치/미스매치 역치)를 기준으로 각 부위에서의 매치/미스매치 결과를 평가함으로써 결정될 수 있다.
예를 들어, X 부위의 특이성과 관련하여, X 부위와 참조 뉴클레오타이드 서열 간에 2개 이하의 미스매치가 존재하는지 여부가 결정되고, Z 부위의 특이성과 관련하여, Z 부위와 참조 뉴클레오타이드 서열 간에 1개 이하의 미스매치가 존재하는지 여부가 결정된다.
올리고뉴클레오타이드의 특이성은 각 부위에서의 특이성 평가를 조합하여 올리고뉴클레오타이드가 어닐링되거나 혼성화되는 뉴클레오타이드 서열을 결정함으로써 평가될 수 있다.
일 구현예에서, 특이성을 평가하기 위해 각 부위당 매치/미스매치의 개수가 지정된 다음, 올리고뉴클레오타이드의 커버리지, 포괄성(inclusivity) 및 배타성(exclusivity)이 평가될 수 있다. 또한, 상기 올리고뉴클레오타이드의 커버리지, 포괄성 및 배타성은, 필요한 경우, 혼성화 조건 등을 조정함으로써 조절될 수 있다.
부위 X 및 Z에서의 매치되거나 미스매치된 염기의 개수 또는 비율 외에도, 본 발명의 방법은 식 (I)의 올리고뉴클레오타이드와 참조 뉴클레오타이드 서열 각각 간의 매치 방향을 추가로 제공할 수 있다. 구체적으로, 상기 매치의 방향은 참조 뉴클레오타이드 서열의 (+) 가닥(코딩 가닥, 센스 가닥, 비주형 가닥)에 매치된 식 (I)의 올리고뉴클레오타이드와 참조 뉴클레오타이드 서열의 (-) 가닥(비코딩 가닥, 안티센스 가닥, 주형 가닥)에 매치된 식 (I)의 올리고뉴클레오타이드를 구별하기 위해 제공될 수 있다. 예를 들어, 식 (I)의 올리고뉴클레오타이드가 참조 뉴클레오타이드 서열의 (+) 가닥에 매치된 경우, "F" 또는 "+"와 같은 표시를 제공할 수 있고, 그렇지 않은 경우 "R" 또는 "-"와 같은 표시를 제공할 수 있다. 매치 방향은 전술한 X 및 Z 부위에서의 미스매치된 염기의 개수와 함께 제공될 수 있다. 예를 들어, "F Xm|Zm", "+ Xm|Zm", "R Xm|Zm", "- Xm|Zm" 등과 같은 표기법이 사용될 수 있다. 상기 표기법은 도 3에 예시되어 있다. 도 3에서 나타낸 바와 같이, 표기법 "- 1|0"은 식 (I)의 올리고뉴클레오타이드가 참조 뉴클레오타이드 서열의 (-) 가닥에 매치된다는 것과, 식 (I)의 올리고뉴클레오타이드가 X 부위에 1개의 미스매치된 염기를 가지고, Z 부위에 0개의 미스매치된 염기를 가진다는 것을 간편하고 직관적으로 보여준다.
본 발명의 방법은 참조 뉴클레오타이드의 생물학적 특징을 추가로 제공할 수 있다.
참조 뉴클레오타이드 서열의 생물학적 특징은 추출된 참조 뉴클레오타이드 서열의 소스(source), 유전자 ID, 또는 설명을 포함한다. 또한, 참조 뉴클레오타이드 서열의 생물학적 특징은 상기 올리고뉴클레오타이드에 상응하는 영역의 위치(예를 들어, 5' 말단 및 3' 말단에서의 뉴클레오타이드의 위치 번호)를 포함할 수 있다. 또한, 참조 뉴클레오타이드 서열의 생물학적 특징은 원하는 올리고뉴클레오타이드와 상당한 상동성을 갖는 참조 뉴클레오타이드 서열의 목록을 포함할 수 있다. 참조 뉴클레오타이드 서열의 생물학적 특징은 통상적인 BLAST 알고리즘과 같은 서열 정렬 알고리즘 또는 프로그램에서 제공된 하나 이상의 특징을 포함할 수 있다. 참조 뉴클레오타이드 서열의 생물학적 특징은 올리고뉴클레오타이드의 특이성을 평가하는데 유용할 수 있다. 사용자는 원하는 올리고뉴클레오타이드와 상동인 영역을 포함하는 참조 뉴클레오타이드 서열의 목록 및 이들의 특정 서열 정보를 분석하여 디자인된 올리고뉴클레오타이드가 비타겟 핵산 서열이 아닌 타겟 핵산 서열만을 증폭 또는 검출(또는 혼성화)하는지 여부를 결정한다. 더욱이, 올리고뉴클레오타이드의 미스매치 정도, 구체적으로 타겟 핵산 서열과 관련하여 X 및 Z 부위에서 미스매치 정도를 제어할 수 있다. 참조 뉴클레오타이드 서열의 목록에 타겟 핵산 서열이 존재하고 비타겟 핵산 서열이 존재하지 않는 것은 상기 올리고뉴클레오타이드가 타겟 핵산 서열의 증폭 또는 검출에 적합하다는 것을 가리킨다. 반면, 참조 뉴클레오타이드 서열의 목록에 비타겟 핵산 서열이 존재하는 것은 상기 올리고뉴클레오타이드가 타겟 핵산 서열의 증폭 또는 검출에 적합하지 않다는 것을 나타내며, 이는 다른 올리고뉴클레오타이드를 선택하기 위한 강한 근거가 된다.
참조 뉴클레오타이드 서열의 생물학적 특징은 올리고뉴클레오타이드의 타겟 커버리지를 결정하는데 도움을 주는 정보를 포함한다.
본 발명의 방법은 X 부위에서의 미스매치된 염기의 개수 및 Z 부위에서의 미스매치된 염기의 개수에 따라 참조 뉴클레오타이드 서열의 분류 결과를 추가로 제공할 수 있다.
사용자는 디자인된 올리고뉴클레오타이드와 상동인 참조 뉴클레오타이드 서열을 확인할 필요가 있으며, 따라서 이러한 분류 결과의 제공은 상기 디자인된 올리고뉴클레오타이드의 특이성을 결정하는데 매우 유용하다.
상기 참조 뉴클레오타이드 서열의 분류 결과는 X 부위에서의 미스매치된 염기의 개수 및 Z 부위에서의 미스매치된 염기의 개수에 기초하여 참조 뉴클레오타이드 서열을 그룹화(분류)하여 수득된 결과로서, 이는 예를 들어 각 그룹에 속하는 참조 뉴클레오타이드의 목록 및 개수, 및 참조 뉴클레오타이드 서열 각각의 생물학적 특징을 포함한다.
프라이머 또는 프로브는 특정 혼성화 조건 하에 몇 개의 미스매치를 갖는 참조 뉴클레오타이드 서열과도 혼성화될 수 있다. 따라서, 디자인된 프라이머 또는 프로브의 적합성 또는 작동성을 평가하기 위해서는, 완전히 매치되는 참조 뉴클레오타이드 서열 뿐만 아니라 부분적으로 매치된 참조 뉴클레오타이드 서열을 확인할 필요가 있다. 이를 위해, 본 발명의 방법은 각 그룹에 속하는 참조 뉴클레오타이드 서열의 목록 및 개수, 및 참조 뉴클레오타이드 서열 각각의 생물학적 특징을 간편하고 직관적인 방식으로 제공한다.
구체적으로, 식 (I)의 올리고뉴클레오타이드와 관련하여 "0|0"의 미스매치(X 부위에서의 미스매치된 염기의 개수가 0개이고, Z 부위에서의 미스매치된 염기의 개수가 0개임)를 갖는 참조 뉴클레오타이드 서열의 개수가 제공될 수 있다. 또한, 식 (I)의 올리고뉴클레오타이드와 관련하여 "1|0"의 미스매치(X 부위에서의 미스매치된 염기의 개수가 1개이고, Z 부위에서의 미스매치된 염기의 개수가 0개임), "0|1", "1|2", "2|2", "3|0", "3|1", "3|2" 등을 갖는 참조 뉴클레오타이드 서열의 개수가 제공될 수 있다.
예를 들어, 미스매치 유형 "0|0"에 속하는 참조 뉴클레오타이드 서열의 개수가 "30"으로 제공되는 경우, 이는 식 (I)의 올리고뉴클레오타이드의 X 및 Z 부위와 100% 일치하는 참조 뉴클레오타이드 서열이 30개 존재한다는 것을 의미한다. 당업자라면 식 (I)의 올리고뉴클레오타이드의 특이성의 정확한 평가를 위해 "1|0", "0|1", "1|1", "2|0", "2|1", "0|2", "2|2", "3|0", "3|1", "3|2" 등에 해당하는 참조 뉴클레오타이드 서열에 관한 정보를 고려할 것이다.
특이성의 평가시 Z 부위에서의 매치가 X 부위보다 중요한 경우, 미스매치 유형 "1|0"에 해당되는 참조 뉴클레오타이드 서열은 식 (I)의 올리고뉴클레오타이드를 사용하여 증폭 또는 검출될 가능성이 높다. 따라서, 상기 미스매치 유형 "1|0"에 속하는 참조 뉴클레오타이드 서열 중에 비타겟 핵산 서열이 존재하는 경우, 사용자는 상기 비타겟 핵산 서열의 증폭 또는 검출을 피하기 위하여 또 다른 올리고뉴클레오타이드를 디자인하거나, 상기 비타겟 핵산 서열의 개수가 적거나 중요도가 낮다면 상기 비타겟 핵산 서열의 증폭 또는 검출을 무시할 수 있다. 미스매치 유형 "0|1" 내에 타겟 핵산 서열이 존재하는 경우, 상기 타겟 핵산 서열은 식 (I)의 올리고뉴클레오타이드를 사용하여 증폭 또는 검출되지 않을 가능성이 있다. 따라서, 사용자는 상기 미스매치 유형 "0|1"에 속하는 타겟 핵산 서열을 커버하기 위하여, 식 (I)의 올리고뉴클레오타이드의 서열을 변형(예컨대, 축퇴성 염기를 혼입시킴으로써)하거나, 또 다른 올리고뉴클레오타이드를 디자인할 수 있다. 또한, 미스매치 유형 "0|1"에 해당하는 참조 타겟 뉴클레오타이드 서열 중에 비타겟 핵산 서열이 존재하는 경우, 상기 비타겟 핵산 서열이 증폭 또는 검출되는지 확인한 다음 상기 올리고뉴클레오타이드의 사용을 결정하는 것이 바람직하다. X 부위에서의 미스매치된 염기의 개수 및 Z 부위에서의 미스매치된 염기의 개수에 기초한 참조 뉴클레오타이드 서열의 분류 결과는 디자인된 올리고뉴클레오타이드의 특이성을 간편하고 직관적인 방식으로 평가하는데 유용하다.
상기 분류 결과는 각각의 참조 뉴클레오타이드 서열에 관한 정보를 추가로 포함할 수 있다.
또한, 상기 제공되는 정보는 상기 올리고뉴클레오타이드가 초기 디자인시에 검토한 매치 결과와 동일한 매치 결과를 나타내는지 여부를 결정하는데 사용될 수 있다. 예를 들어, 식 (I)의 올리고뉴클레오타이드가 미스매치 유형 "0|0"(X 부위에서 미스매치된 염기 수가 0개이고, Z 부위에서 미스매치된 염기 수가 0개임)으로 5개의 타겟 핵산 서열과 매치하고, 미스매치 유형 "1|0"으로 3개의 타겟 핵산 서열에 매치하며, 미스매치 유형 "1|1"로 2개의 타겟 핵산 서열에 매치하도록 디자인한 경우, 상기 디자인된 올리고뉴클레오타이드를 상기 타겟 핵산 서열만을 포함하는 데이터베이스와 비교하고, 각각 미스매치 유형 "0|0", "1|0" 및 "1|1"에 속하는 타겟 핵산 서열의 개수를 확인함으로써 디자인시 고려했던 미스매치 결과와 동일한 결과가 수득되는지 여부를 결정할 수 있다.
또한, 추가의 분류 결과가 식 (I)의 올리고뉴클레오타이드의 커버리지(coverage)를 확인하는데 사용될 수 있다. 사용자는 분류 결과를 분석하고 디자인된 올리고뉴클레오타이드를 사용하여 증폭 또는 검출되는 타겟 핵산 서열을 확인할 수 있으므로, 상기 분류 결과는 식 (I)의 올리고뉴클레오타이드의 커버리지를 확인하는데 사용될 수 있다.
한편, 본 발명의 방법은 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 서열 유사성에 관한 정보를 추가로 제공할 수 있다.
상기 유사성에 관한 정보는 다양한 방식으로 표시될 수 있다. 일 구현예에서, 상기 유사성에 관한 정보는 디자인된 올리고뉴클레오타이드의 뉴클레오타이드의 총 개수 대비 매치된 뉴클레오타이드의 개수, 또는 이의 백분율-동일성 스코어(percent-identity score)로 표현될 수 있다.
특히, 상기 유사성에 관한 정보는 올리고뉴클레오타이드의 부위 Y와 참조 뉴클레오타이드 서열의 상응하는 부위와의 유사성을 배제하여 계산될 수 있다. 예를 들어, X 부위가 p개의 뉴클레오타이드 길이이고, Y 부위가 q개의 뉴클레오타이드 길이이며, Z가 r개의 뉴클레오타이드 길이인 경우, 상기 유사성(%)은 [(X 부위 및 Z 부위에서 매치된 뉴클레오타이드의 총 개수) / (p + r)]*100에 의해 계산될 수 있다.
택일적으로, 상기 유사성에 관한 정보는 올리고뉴클레오타이드의 부위 Y와 참조 뉴클레오타이드 서열의 상응하는 부위가 서로 매치하는 것으로 간주하여 계산될 수 있다. 예를 들어, X 부위가 p개의 뉴클레오타이드 길이이고, Y 부위가 q개의 뉴클레오타이드 길이이며, Z가 r개의 뉴클레오타이드 길이인 경우, 상기 유사성(%)은 [(X 부위 및 Z 부위에서 매치된 뉴클레오타이드의 총 개수 + q) / (p + q + r)]*100에 의해 계산될 수 있다.
또 다른 대안으로서, 올리고뉴클레오타이드의 X 부위와 참조 뉴클레오타이드 서열의 상응하는 부위 간의 유사성, 및 올리고뉴클레오타이드의 Z 부위와 참조 뉴클레오타이드 서열의 상응하는 부위 간의 유사성이 별도로 제공된다.
한편, 식 (I)의 올리고뉴클레오타이드의 부위 X 및 Z 중 어느 하나 또는 둘 모두에 적어도 하나의 유니버설 염기 또는 축퇴성 염기가 존재하는 경우, 상기 서열 유사성은 미스매치된 염기의 개수를 계산시 유니버설 염기 또는 축퇴성 염기의 처리와 동일한 방식으로 유니버설 염기 또는 축퇴성 염기를 처리함으로써 결정될 수 있다.
전술한 바와 같이, 본 발명의 방법은 올리고뉴클레오타이드의 특이성에 관한 정보를 다양한 방식으로 제공함으로써, 사용자가 쉽고 빠르게 그리고 직관적으로 올리고뉴클레오타이드와 타겟 및 비타겟 핵산 서열과의 상동성을 분석할 수 있게 해준다.
본 발명의 방법은 올리고뉴클레오타이드의 특이성에 관한 정보를 제공하는 것을 특징으로 하므로, 본 발명의 방법은 올리고뉴클레오타이드의 특이성에 관한 정보를 제공하는 방법으로 지칭될 수도 있다.
당업자는 본 발명의 방법에 의해 제공된 정보를 사용하여 디자인된 올리고뉴클레오타이드의 특이성을 평가할 수 있다. 따라서, 본 발명의 방법은 상기 단계 (c)에서 제공된 정보를 사용하여 식 (I)의 올리고뉴클레오타이드의 특이성을 평가하는 단계를 추가로 포함할 수 있다.
단계 (c)에서 제공된 정보를 사용하여 식 (I)의 올리고뉴클레오타이드의 특이성을 평가하는 것은 식 (I)의 올리고뉴클레오타이드의 포괄성 및 배타성을 결정함으로써 달성될 수 있다.
본 발명의 방법은 프라이머 또는 프로브로서의 올리고뉴클레오타이드, 특히 식 (I)로 표시된 올리고뉴클레오타이드의 작동성을 평가하는데 사용될 수 있다.
단계 (c)에서 제공된 부위 X 및 Z에서의 매치/미스매치 결과는 올리고뉴클레오타이드가 특정 타겟 핵산 서열에 혼성화하는지 여부를 확인하게 해준다. 따라서, 본 발명의 방법은 올리고뉴클레오타이드가 특정 타겟 핵산 서열에 대해 프라이머 또는 프로브로서 작용할지 결정하는데 사용될 수 있다.

전술한 방법은 상기 방법을 실행하기 위한 프로세스를 구현하는 지시를 포함하는 소프트웨어에 의해 컴퓨터 상에서 실시될 수 있다.
II. 기록매체, 컴퓨터 프로그램 및 장치
하기 기재된 본 발명의 기록매체, 장치 및 컴퓨터 프로그램은 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 본 명세서의 복잡성을 야기하는 과도한 중복성을 피하기 위해 생략한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
5'-X-Y-Z-3' (I)
상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
(b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하여, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
(c) 상기 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
본 발명의 또 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 다음의 단계를 포함한다:
(a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
5'-X-Y-Z-3' (I)
상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
(b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하여, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
(c) 상기 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 본 발명의 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하도록 하는 지시; (ii) 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하도록 하는 지시; (iii) 상기 식 (I)의 올리고뉴클레오타이드와 각각의 참조 뉴클레오타이드 서열 간의 부위별 매치/미스매치를 분석하여 (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하도록 하는 지시.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
타겟 핵산 서열을 증폭 또는 검출하기 위한 식 (I)의 올리고뉴클레오타이드는 다양한 방식으로 제공될 수 있다. 예를 들어, 식 (I)의 올리고뉴클레오타이드의 서열은 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 시그널과 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드의 특이성을 평가하기 위한 장치를 제공한다.
프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축될 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 종래 서열 정렬 알고리즘 또는 프로그램은, 5'-X-Y-Z-3'(여기서, Y는 왓슨-크릭 염기쌍에 관여하지 않는, 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타냄)로 표시된 것과 같은 비전형적인 올리고뉴클레오타이드에 대하여 매치/미스매치 결과를 제공하지 않는다. 이에 반해, 본 발명의 방법은 X 부위 및 Z 부위에서의 매치/미스매치 결과를 개별적으로 제공하여, 사용자가 특이성, 특히 X 부위 및 Z 부위에서의 어닐링 특이성을 상이한 가중치로 평가할 수 있게 해준다.
(b) 5'-X-Y-Z-3'(여기서, Y는 왓슨-크릭 염기쌍에 관여하지 않는, 둘 이상의 연속적인 염기를 포함하는 분할 부위를 나타냄)로 표시된 것과 같은 비전형적인 올리고뉴클레오타이드의 경우, 종래 서열 정렬 알고리즘 또는 프로그램은 X 부위 또는 Z 부위 중 어느 하나의 매치/미스매치 결과만을 제공할 수 있다. 이에 반해, 본 발명의 방법은 추출된 참조 뉴클레오타이드 서열 내의 상동성 영역 및 그의 플랭킹 영역을 사용하여 X 부위 및 Z 부위 모두의 매치/미스매치 결과를 제공한다. 따라서, 본 발명의 방법은 특이성, 특히 비전형적인 구조를 갖는 올리고뉴클레오타이드의 어닐링 특이성의 정확한 평가를 가능하게 하며, X 및 Z 부위의 중요성을 고려하여 적절한 올리고뉴클레오타이드를 선택하는데 도움을 준다.
(c) 서열 내부에 연속적인 또는 비연속적인 유니버설 염기를 함유하는 올리고뉴클레오타이드의 경우, 종래의 서열 정렬 알고리즘 또는 프로그램은 상기 유니버설 염기를 미스매치로 결정한다. 이에 반해, 본 발명의 일 구현예에 따른 방법은 상기 유니버설 염기를 매치로 결정하여, 올리고뉴클레오타이드의 특이성을 정확하게 평가할 수 있게 해준다.
(d) 서열 내부에 축퇴성 염기(들)를 포함하는 올리고뉴클레오타이드의 경우, 종래의 서열 정렬 알고리즘 또는 프로그램은 상기 축퇴성 염기(들)를 그의 상응하는 뉴클레오타이드의 유형에 관계없이 미스매치로 결정한다. 이에 반해, 본 발명의 일 구현예에 따른 방법은 상기 축퇴성 염기로 표시된 염기의 유형에 따라 매치/미스매치를 결정하여, 올리고뉴클레오타이드의 특이성을 정확하게 평가할 수 있게 해준다.
(e) 본 발명의 방법은 부위 X 및 Z에서의 미스매치된 염기의 개수에 따른 참조 뉴클레오타이드 서열의 분류 결과뿐만 아니라 이의 생물학적 특징을 제공함으로써, 사용자가 올리고뉴클레오타이드의 특이성, 특히 타겟 특이성을 간편하고 직관적으로 평가할 수 있게 해준다.
삭제
삭제
삭제
삭제
삭제
도 1은 본 발명의 일 구현예에 따라 올리고뉴클레오타이드의 특이성을 평가하는 과정을 나타낸 흐름도이다.
도 2는 본 발명의 일 구현예에 따라 올리고뉴클레오타이드(DPO 프라이머)의 특이성을 평가하는 과정을 도식적으로 나타낸 것이다. 5'-X-Y-Z-3'으로 표시되는 DPO 프라이머 내의 부위 X의 서열(질의)을 BLAST를 사용하여 데이터베이스와 비교하여, 상기 X 부위와 상동인 영역을 포함하는 복수의 참조 뉴클레오타이드 서열을 추출한다. 이후, 상기 DPO 프라이머의 전체 서열과 각각의 참조 뉴클레오타이드 서열의 상동 영역 및 그의 플랭킹(flanking) 영역 간의 부위별 매치/미스매치를 분석하고, 부위 X 및 Z에서 미스매치된 염기의 개수를 제공한다.
도 3은 5'-X-Y-Z-3'로 표시되는 예시적인 DPO 프라이머의 전체 서열(상부 열)과 본 발명의 일 구현예에 따라 추출된 참조 뉴클레오타이드 서열(하부 열) 간의 부위별 매치/미스매치 분석(서열 정렬)의 결과를 나타낸 것이다. 도 3에 도시된 바와 같이, 상기 DPO 프라이머는 상기 참조 뉴클레오타이드 서열의 (-) 가닥과 매치되고, 부위 X에서 1개의 매스매치된 염기 및 부위 Z에서 0개의 미스매치된 염기를 갖는 것으로 나타났다. 상기 정보가 도 3에 "- 1|0"으로 표시되어 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 본 발명의 일 구현예에 따른 올리고뉴클레오타이드의 특이성 평가
<1-1> 이중 특이성 올리고뉴클레오타이드(DPO)의 디자인
WO 제2006/095981호의 개시내용을 참고하여, 타겟 핵산 서열로서 Bacteroides fragilis의 16S 리보솜 RNA(Genbank ID No: HM352993.1)를 증폭하기 위한 DPO 프라이머(서열번호 1)를 디자인하였다. 상기 디자인된 DPO 프라이머의 뉴클레오타이드 서열을 하기에 나타내었다.
5'-GACTCTAGAGAGACTGCCGTCGTAAIIIIIGAGGAAGGTG-3' (서열번호: 1)
상기 나타낸 바와 같이, DPO 프라이머는 3개의 구별되는 부위를 갖는다: (i) 5' 말단에 부위 "X": GACTCTAGAGAGACTGCCGTCGTAA; (ii) 유니버설 염기로서 5개의 데옥시이노신(I)(볼드체로 표시됨)로 이루어진 분할 부위 "Y"; 및 (iii) 3' 말단에 부위 "Z": GAGGAAGGTG.
<1-2> BLAST를 사용한 특이성의 평가
상기 DPO 프라이머의 특이성을 평가하기 위하여, 상기 DPO 프라이머 내의 부위 X(즉, 5'-GACTCTAGAGAGACTGCCGTCGTAA-3')를 상동성 분석을 위해 BLAST를 사용하여 GenBank 데이터베이스와 비교하였다. 상기 BLAST 알고리즘에 사용된 파라미터는 다음과 같다:
- query : Fasta 형식의 프라이머 서열 파일명
- db : 뉴클레오타이드 데이터베이스 파일명
- out : 저장되는 파일명
- evalue : 1000
- word_size : 4
- perc_identity : 60
- num_alignments : 1000000
- num_descriptions : 1000000
상기 비교 결과, 상기 DPO 프라이머의 부위 X와 상동인 영역을 함유하는 총 2387개의 참조 뉴클레오타이드 서열이 추출되었다. 상기 추출된 참조 뉴클레오타이드 서열 각각은 상동 영역 및 임의로 Z 부위와의 비교에 사용될 수 있는 플랭킹 영역을 함유하였다.
상동 영역 및 그의 플랭킹 영역을 함유하는 추출된 참조 뉴클레오타이드 서열을 DPO 프라이머의 전체 서열과 각각 비교하여, DPO 프라이머의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수 뿐만 아니라 DPO 프라이머의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 미스매치된 염기의 개수를 수득하였다(도 2 참고).
상기 DPO 프라이머와 참조 뉴클레오타이드 서열 중 하나와의 비교 결과를 도 3에 나타내었다.
도 3으로부터 DPO 프라이머가 예시적인 참조 뉴클레오타이드 서열과 비교하여 부위 X에서 1개의 미스매치된 염기와 Z 부위에서 0개의 미스매치된 염기를 가지고 있음을 확인할 수 있다. 또한, 상기 DPO 프라이머는 참조 뉴클레오타이드 서열의 (-) 가닥에 매치하는 것으로 나타났다.
상기 정보를 표기법 "D Xm|Zm"로 표시하였다. 상기 표기법에서, "D"는 참조 뉴클레오타이드 서열 대비 관심 올리고뉴클레오타이드의 매치 방향을 의미한다. 구체적으로, "+"는 관심 올리고뉴클레오타이드가 참조 뉴클레오타이드 서열의 (+) 가닥에 매치된다는 것을 의미하며, "-"는 관심 올리고뉴클레오타이드가 참조 뉴클레오타이드 서열의 (-) 가닥에 매치된다는 것을 의미한다. 또한, "Xm"은 부위 X에서의 미스매치된 염기의 개수를 가리키고, "Zm"은 부위 Z에서의 미스매치된 염기의 개수를 가리킨다. 상기 결과를 도 3에 "- 1|0"으로 제공하였다.
이후, 상기 참조 뉴클레오타이드 서열을 부위 X에서의 미스매치된 염기의 개수 및 부위 Z에서의 미스매치된 염기의 개수에 따라 분류하였다. 결과를 하기 표 1에 나타내었다.
Figure 112019000882305-pct00005

상기 미스매치 유형 중에서, 본 발명의 DPO 프라이머와 혼성화할 가능성이 있는 미스매치 유형 "0|0"(230개 참조 뉴클레오타이드 서열), "1|0"(422개의 참조 뉴클레오타이드 서열) 및 "1|1"(10개의 참조 뉴클레오타이드 서열)에 포함되는 참조 뉴클레오타이드 서열의 소스(source)를 조사하였다. 그 결과, 상기 미스매치 유형에 포함된 모든 참조 뉴클레오타이드 서열은 Bacteroides fragilis로부터 유래된 것으로 밝혀졌다. 이것은 상기 디자인된 DPO 프라이머가 Bacteroides fragilis의 핵산 서열에 대해 특이성을 가짐을 보여준다.
상기 결과는 또한 혼성화 조건에 따라, 상기 디자인된 DPO 프라이머를 사용하여 증폭되는 타겟 핵산 서열의 커버리지(coverage)에 관한 정보를 제공한다. 구체적으로, 상기 결과로부터, 당업자는 미스매치 유형 "0|0", "1|0" 및 "1|1"에 속하는 타겟 핵산 서열이 혼성화 조건을 조절함으로써 증폭될 수 있음을 인식할 것이다.
또한, 상기 결과는 DPO 프라이머가 각각의 추출된 참조 뉴클레오타이드에 대해 어닐링 특이성을 갖는지에 관한 정보를 제공한다.
이와 같이, 디자인된 올리고뉴클레오타이드의 특이성을 보다 간단하고 직관적인 방식으로 평가할 수 있다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> SEEGENE, INC. <120> Method for evaluating target specific workability of oligonucleotides <130> PI180020KR <150> KR 10-2016-0069487 <151> 2016-06-03 <160> 1 <170> KoPatentIn 3.0 <210> 1 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleotide <400> 1 gactctagag agactgccgt cgtaannnnn gaggaaggtg 40

Claims (17)

  1. 하기 단계를 포함하는, 올리고뉴클레오타이드의 특이성을 평가하는 방법:
    (a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
    5'-X-Y-Z-3' (I)
    상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
    (b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
    (c) 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 상동 영역 간의 매치/미스매치를 분석하고, 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열을 제외한 나머지 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 플랭킹 영역 간의 매치/미스매치를 분석하여, (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 단계 (b)의 비교에 사용된 식 (I)의 올리고뉴클레오타이드의 일부 서열은 부위 X, 부위 Z, 또는 이의 부분인 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 단계 (b)에서의 비교는 서열 정렬 알고리즘 또는 프로그램을 사용하여 실시되는 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 서열 정렬 알고리즘 또는 프로그램은 Smith & Waterman, Needleman-Wunsch, BLAST 및 FASTA로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 X 부위 및 Z 부위 중 어느 하나 또는 둘 모두는 적어도 하나의 유니버설 염기(universal base) 또는 축퇴성 염기(degenerate base)를 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 유니버설 염기는 단계 (c)에서 미스매치된 염기로 카운트되지 않는 것을 특징으로 하는 방법.
  9. 제7항에 있어서, 상기 축퇴성 염기는, 상기 축퇴성 염기가 나타내는 염기 중 어느 하나가 참조 뉴클레오타이드 서열 내의 상응하는 염기에 매치되면, 단계 (c)에서 미스매치된 염기로 카운트되지 않는 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 단계 (c)에서 각각의 참조 뉴클레오타이드 서열의 생물학적 특징을 추가로 제공하는 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 부위 X에서의 미스매치된 염기의 개수 및 부위 Z에서의 미스매치된 염기의 개수에 따라 참조 뉴클레오타이드 서열의 분류 결과를 추가로 제공하는 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 식 (I)의 올리고뉴클레오타이드는 프라이머 또는 프로브인 것을 특징으로 하는 방법.
  13. 제1항에 있어서, 상기 식 (I)의 올리고뉴클레오타이드는 유전적 다양성을 갖는 뉴클레오타이드 서열을 증폭 또는 검출하는데 사용되는 것을 특징으로 하는 방법.
  14. 제1항에 있어서, 상기 분할 부위 Y에 포함된 염기는 비자연 염기; 유니버설 염기; 미스매치된 염기 및 이의 조합으로부터 선택되는 것을 특징으로 하는 방법.
  15. 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
    5'-X-Y-Z-3' (I)
    상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
    (b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
    (c) 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 상동 영역 간의 매치/미스매치를 분석하고, 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열을 제외한 나머지 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 플랭킹 영역 간의 매치/미스매치를 분석하여, (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
  16. (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 제15항의 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드의 특이성을 평가하기 위한 장치.
  17. 올리고뉴클레오타이드의 특이성을 평가하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램으로서, 상기 방법은 다음의 단계를 포함한다:
    (a) 하기 식 (I)로 표시되는 올리고뉴클레오타이드를 제공하는 단계:
    5'-X-Y-Z-3' (I)
    상기 식에서, X는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고, Y는 왓슨-크릭 염기쌍에 관여하지 않는 2개 이상의 연속적인 염기를 포함하는 분할 부위를 나타내며, Z는 타겟 핵산 서열에 혼성화되는 혼성화 뉴클레오타이드 서열을 포함하는 부위를 나타내고;
    (b) 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열을 적어도 하나의 뉴클레오타이드 서열 데이터베이스와 비교하고, 상기 데이터베이스로부터 상기 식 (I)의 올리고뉴클레오타이드의 전체 또는 일부 서열과 상동인 영역을 포함하는 참조 뉴클레오타이드 서열을 추출하는 단계; 및
    (c) 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 상동 영역 간의 매치/미스매치를 분석하고, 상기 식 (I)의 올리고뉴클레오타이드의 일부 서열을 제외한 나머지 서열과 상기 추출된 각각의 참조 뉴클레오타이드 서열의 플랭킹 영역 간의 매치/미스매치를 분석하여, (i) 상기 식 (I)의 올리고뉴클레오타이드의 부위 X와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율 및 개별적으로 (ii) 상기 식 (I)의 올리고뉴클레오타이드의 부위 Z와 각각의 참조 뉴클레오타이드 서열 간의 매치되거나 미스매치된 염기의 개수 또는 비율을 제공하는 단계.
KR1020197000224A 2016-06-03 2017-06-02 올리고뉴클레오타이드의 특이성 평가 KR102189358B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020160069487 2016-06-03
KR20160069487 2016-06-03
PCT/KR2017/005818 WO2017209575A1 (en) 2016-06-03 2017-06-02 Evaluation of specificity of oligonucleotides

Publications (2)

Publication Number Publication Date
KR20190003868A KR20190003868A (ko) 2019-01-09
KR102189358B1 true KR102189358B1 (ko) 2020-12-09

Family

ID=60477701

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197000224A KR102189358B1 (ko) 2016-06-03 2017-06-02 올리고뉴클레오타이드의 특이성 평가

Country Status (2)

Country Link
KR (1) KR102189358B1 (ko)
WO (1) WO2017209575A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230230656A1 (en) * 2020-06-24 2023-07-20 Seegene, Inc. Computer-implemented method for providing coverage of oligonucleotide set for plurality of nucleic acid sequences
WO2022232395A2 (en) * 2021-04-28 2022-11-03 Q-State Biosciences, Inc. Therapeutic compositions for treating pain via multiple targets

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097223A1 (en) * 1999-12-14 2003-05-22 Hitachi, Ltd. Primer design system
US6898531B2 (en) * 2001-09-05 2005-05-24 Perlegen Sciences, Inc. Algorithms for selection of primer pairs
BRPI0214741B1 (pt) * 2001-12-08 2015-05-12 Seegene Inc Iniciador de controle de anelamento para melhorar a especificidade de anelamento na amplificação de ácido nucléico, Kit, Métodos para amplificar seqüências de ácido nucléico de um DNA e seqüência de ácido nucléico alvo ou uma mistura de ácidos nucléicos, para detectar a complementaridade de DNA ao mRNA diferencialmente expresso em duas ou mais amostras de ácido nucléico, para amplificar rapidamente um fragmento de CDNA alvo, para amplificar uma população de CDNAs de filamento duplo de comprimento completo complementar aos mRNAS, e CDNAs de filamento duplo enriquecidos em 5’ complementares aos mRNAS, para amplificar mais do que uma seqüência de nucleotídeo alvo simultaneamente, para produzir uma impressão digital de DNA de gDNA, e de RNA de uma amostra de mRNA, para identificar segmentos de homologia conservada em uma família de multigene a partir de uma amostra de mRNA, para identificar uma variação de nucleotídeo em um ácido nucléico alvo, para a mutagênese em um ácido nucléico alvo, e, uso do iniciador
WO2006095981A1 (en) * 2005-03-05 2006-09-14 Seegene, Inc. Processes using dual specificity oligonucleotide and dual specificity oligonucleotide

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BMC Bioinformatics, 13(1): 134 (2012.06.)*

Also Published As

Publication number Publication date
WO2017209575A1 (en) 2017-12-07
KR20190003868A (ko) 2019-01-09

Similar Documents

Publication Publication Date Title
US11377695B2 (en) Breast cancer associated circulating nucleic acid biomarkers
AU2015349870B2 (en) Enzyme- and amplification-free sequencing
CA2801468C (en) Prostate cancer associated circulating nucleic acid biomarkers
US8084598B1 (en) Bioionformality detectable group of novel regulatory oligonucleotides and uses thereof
EP3144396B1 (en) Methods of use of toehold hairpin primer
US20070042381A1 (en) Bioinformatically detectable group of novel regulatory viral and viral associated oligonucleotides and uses thereof
US8192938B2 (en) Methods for quantifying microRNA precursors
US10590478B2 (en) Nucleotide sequence, universal reverse primer, and universal RT primer
KR102242192B1 (ko) 미세 조정된 초특정 핵산 하이브리다이제이션 프로브
JPWO2008018305A1 (ja) 変異の検出方法およびそれに用いるキット
KR102189358B1 (ko) 올리고뉴클레오타이드의 특이성 평가
CN105574360A (zh) 将靶标富集的序列读出分配到基因组位置的方法
JP2019504624A (ja) 核酸配列決定のための新規アダプターおよび使用法
Wang et al. High-throughput primer and probe design
JP5926189B2 (ja) Rna分析方法
JP5229895B2 (ja) 核酸標準物質
KR102412183B1 (ko) 올리고뉴클레오타이드 최적 조합의 제공방법
JP2011239708A (ja) 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
EP3261718A1 (en) Methods of detecting, diagnosing, and treating atherosclerotic plaque rupture
WO2019031916A2 (en) METHODS FOR PREPARING OLIGONUCLEOTIDES FOR DETECTING TARGET NUCLEIC ACID SEQUENCES HAVING MAXIMUM COVERAGE
KR20230022965A (ko) 복수의 핵산서열에 대한 올리고뉴클레오타이드 세트의 커버리지를 제공하는 컴퓨터-구현 방법
US7745117B2 (en) Methods for incorporating non-perfectly matched oligonucleotides into target-specific hybridization sequences
JP2023553963A (ja) 関心ヌクレオチド変異を検出するために用いられるオリゴヌクレオチドを提供するためのコンピュータ-具現方法
Sedek et al. qPCR Analysis of Quorum Sensing Genes of Pseudomonas aeruginosa: Primer design and qPCR Efficiency
JP4034740B2 (ja) Dna合成用のプライマーの選定方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant